引文上下文中的概念抽取

引文上下文中的概念抽取

ID:33402224

大小:2.70 MB

页数:59页

时间:2019-02-25

引文上下文中的概念抽取_第1页
引文上下文中的概念抽取_第2页
引文上下文中的概念抽取_第3页
引文上下文中的概念抽取_第4页
引文上下文中的概念抽取_第5页
资源描述:

《引文上下文中的概念抽取》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术信息研究所硕士学位论文。作者孙枫军导师朱礼军论文提交日期(2012年10月)中图分类号UDC学校代码80901中国科学技术信息研究所硕士学位论文。导师姓名塞扎至学位类别笪理堂学科专业值退堂职称副硒究员学位级别亟±研究方向知迟王猩中国科学技术信息研究所论文提交日期(2012年10月)独创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。尽我所知,论文中除已经加以标注和致谢的地方外,不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人

2、和集体,均已在文中明确说明并表示了谢意。。研究生签名:驯。者f沁军时间:2纱fz年fD月f7日关于论文使用授权的说明本人完全了解中国科学技术信息研究所有关保留、使用学位论文的规定,即:所里有权保留送交论文的打印稿和电子稿,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同意中国科学技术信息研究所用不同方式在不同媒体上发表、公布论文的全部或部分内容。保密的论文在解密后遵守此规定。研究生签名:捌、枫军时间:2oIZ年7伊月7-7日导师签名:甘游时间:201]-年\D月f]日致谢

3、IYIIl2IIIL2l18llHo11lllIIll9㈣5IY22801两年半的时光飞逝而去,无限感慨,无限怀念。我认为,这两年半的研究生学习生涯是我人生目前为止最为幸福、最为重要的时光。在这段时间里,我找回了自信,也找到了人生的方向,我想今后的人生道路上我也将不再彷徨。更加重要的是,我也认识了许许多多和蔼的老师和可爱的同学,我想,这也将是我的一笔最为宝贵的财富。首先,我要感谢导师朱礼军老师,朱老师是我的导师,但同时又像是一位兄长。您不仅在学习上关心我们,在生活上也处处替我们着想。毕业论文的完成不仅

4、仅只是我们的付出,更是您在两年半时间里细心耕耘的结果。我在此衷心地向您表示感谢。我要感谢技术支持中心的刘耀、徐硕、张云良、李颖、乔晓东、闰莹莹、于薇等老师。他们都在我需要的时候给予了我无私的帮助。我要感谢研究生部的王桂风老师、赵志耘所长、罗勇主任、张泽玉主任、赵琳老师、刘敏老师、郝文英老师,你们的付出才使得我们能够拥有良好的学习和生活条件。我还要衷心地感谢武夷山所长给予我的一次又一次的帮助。我要感谢身边的同学,我不会忘记大家一起生活和学习的日子,我会珍惜这宝贵的同窗之情,永远铭记在心。最后感谢我的家人

5、,在我求学生涯中一直默默地关心和支持,使我能够顺利的完成学业,感谢你们的包容和帮助,你们无私的支持是我不断进取的永恒动力。引文上下文中的概念抽取摘要科技文献区别于其它同样以自然语言形式存在的文档的重要特征在于科技文献包含参考文献,引文符号前后一个较小区域内的文本段被称为引文上下文。在较长的一段时间里,引文上下文的文本处理都没有得到足够的重视。然而,随着计算机技术的发展、科技文献可读文本化的实现以及科技文献开放获取运动的发展,对引文上下文的大规模计算机化处理已经成为了可能,引文上下文的研究工:作也因此将

6、迎来快速发展的阶段。在对引文上下文的概念抽取的研究现状加以阐述的基础上,针对引文上下文的概念抽取难以实现自动化的问题,本文提出了引文上下文中概念抽取的方法,设计了引文上下文的概念抽取的系统,系统能够在限定条件下解决引文上下文中概念抽取自动化的问题,可以覆盖全部的参考文献和施引文献。而后,选取两年共计455篇某一期刊的文章作为实验数据,进行针对系统的实验,抽取了期刊文章对应参考文献的引文上下文当中以名词性短语形式存在的概念。结果表明,该系统能够达到接近自动化抽取概念的程度,并且可以覆盖研究范围内的全部参

7、考文献和施引文献。图2幅,表17个,英文参考文献41篇。关键词:引文上下文;概念抽取;引文数据库;引文索弓分类号:TP391ConceptExtractioninCitationContextAbstractCitationindexiSwidelyusedinscientificIiteraturesystemandscientometrics.butaproblemignoredbymanyiSthatcitationindexlacksthesupportofcontenti11bothinfo

8、rmationretrievalsystemsandscientometrics,inotherwords,thecurrentcitationindexconnectsthescientificpapersbutnottheinformationinsidethepaper.Forinformationretrieval。comparedwithsubiectindex,citationindexcaninsomesenseavoidthesemant

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。