基于svm和链接的分析蛋白质关系抽取系统

基于svm和链接的分析蛋白质关系抽取系统

ID:32027639

大小:1.41 MB

页数:52页

时间:2019-01-30

基于svm和链接的分析蛋白质关系抽取系统_第1页
基于svm和链接的分析蛋白质关系抽取系统_第2页
基于svm和链接的分析蛋白质关系抽取系统_第3页
基于svm和链接的分析蛋白质关系抽取系统_第4页
基于svm和链接的分析蛋白质关系抽取系统_第5页
资源描述:

《基于svm和链接的分析蛋白质关系抽取系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连理工大学硕士学位论文基于SVM和链接分析的蛋白质关系抽取系统姓名:吴宝栋申请学位级别:硕士专业:计算机应用技术指导教师:林鸿飞20071219大连理工大学硕士学位论文摘要随着生物医学文献数量的急剧增长,各种各样的生物医学信息出现在生物医学研究者面前。这给生物医学研究者带来很沉重的负担,使他们很难迅速地从这些文献中找到需要的信息。为了提高他们的工作效率,迫切地需要一些自动化的工具帮助他们在海量生物医学文献中迅速地找到需要的信息。生物医学文献中蛋白质(基因)相互作用关系抽取的研究正是在这种背景下产生的。此外,从生物医学文献中抽取蛋白质(基

2、因)相互作用关系也具有很高的应用价值,对蛋白质知识网络的建立、蛋白质关系的预测、新药的研制等均具有重要的意义。本文构建了一个生物医学文献中的蛋白质相互作用关系抽取系统。该系统使用基于支持向量机(SVM)和链接分析(Linkparse)的方法抽取蛋白质(基因)交互作用关系。系统首先通过指代消解替换生物医学文献中的第三人称代词,然后使用条件随机域模型对生物医学文献进行实体识别,通过链接语法分析器分析文献中旬子的链接路径,最后通过四大类特征的提取,包括:词项特征、关键词特征、链接特征以及词对特征,利用SVM分类器抽取蛋白质(基因)相互作用关系。

3、本文首先介绍了蛋白质相互作用关系抽取的相关知识和研究概况,然后重点介绍了本文的实验系统所使用的核心方法一统计学习理论与支持向量机(SVM),接下来对系统使用的其他方法进行了详细描述,包括指代消解、命名实体识别、链接语法与链接语法分析器以及链接路径提取、关系抽取的特征选取。本文的最后给出了系统实现与性能评估。关键词:关系抽取;支持向量机(sVID;链接语法分析;指代消解;实体识别大连理工大学硕士学位论文Protein-ProteinInteractionExtractionSystemBasedonSVMandLinkParseAbstra

4、ctAsthequantityofbiomedicalliteraturesisincreasingrapidly,variouskindsofbiomedicalinformationappearinfrontofbiomedicalresearchers.Thisbringsbiomedicalresearchersaheavyburdenandmakesitdifficulttofindneededinformationfromtheseliteraturesrapidly.Inordertoimprovetheirworkeffi

5、ciency,allautomatedfacilityisurgentlyneededtofindneededinformationrapidlyandaccurately.Researchonprotein-proteininteractionautomaticextractionfrombiomedicalliteratureemergesunderthisbackground.Furthermore,thereishighapplicationvalueinprotein-proteininteractionautomaticext

6、ractionfrombiomedicalliterature,whichcanhelptobuildproteinrelationnetwork,predictproteinfunctionanddesignnewdrugs.Thispaperpresentsaprotein—proteininteractionextractionsystemforbiomedicalliterature.Thissystemappliestheapproachbased011SupportVectorMachinemodelandlinkparset

7、oex仃actprotein·proteininteractionsanditfirstusesanaphoraresolutiontoreplacethethifdpersonpronouns.thenappliesConditionalRandomFieldsmodeltotagproteinnamesinbiomedicaltextandaLinkGrammarParsertoparsethelinkpathinsentences.Atlast,afterusingfeatureextractionandchoiceoffourki

8、ndstoconstructfeaturevectors,usesSupportVectorMachinemodeltoex仃actcomplereprotein-proteininterac

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。