基于组合学习和自训练的生物医学事件抽取研究

基于组合学习和自训练的生物医学事件抽取研究

ID:36458446

大小:2.30 MB

页数:50页

时间:2019-05-10

基于组合学习和自训练的生物医学事件抽取研究_第1页
基于组合学习和自训练的生物医学事件抽取研究_第2页
基于组合学习和自训练的生物医学事件抽取研究_第3页
基于组合学习和自训练的生物医学事件抽取研究_第4页
基于组合学习和自训练的生物医学事件抽取研究_第5页
资源描述:

《基于组合学习和自训练的生物医学事件抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于组合学习和自训练的生物医学事件抽取研究TheResearchofBiomedicalEventExtractionBasedonCombinationalLearningandSelf-training学21109223大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献

2、均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:堑丝塑煎鳖鱼丝醛逊塑作者签名:壅遍日期:翟[生年—L月互二日大连理工大学硕士学位论文摘要生物医学文献数量的急剧增加,使得生物医学从业者在海量生物医学文献中快速地获取大量的感兴趣的信息变得困难。因此,快速有效地从海量无结构化的文本中抽取出便于管理、查询的结构化信息成为生物医学信息抽取的热点的研究课题。生物医学事件抽取属于生物医学信息抽取的范畴,旨在从分子层面在无结构化的文本信息中抽取出有蛋白质有关的结构化生物事件信息。在生物医学事件抽取的研究中,机器学习的方法得到了广泛的应用。本文在研究过程

3、中主要利用了机器学习的方法对生物医学事件进行抽取,涉及到组合学习,模型自训练以及核方法的机器学习方法。在事件的处理流程上采用了常用的文本预处理、事件触发词检测、事件元素识别以及整体后处理的步骤。本文在生物医学事件触发词检测的阶段采用了基于不同决策规则的学习器进行组合学习、使用模型自训练的方法在触发词检测阶段引入了未标注语料实现半监督学习。在触发词的检测过程中,采用了建立触发词字典来判断文档中词是否为候选触发词,对所选候选触发词进行特征提取进行分类任务,确定候选词是否为触发词并指定相应的触发词类型。在事件元素检测的阶段,构造触发词和蛋白质关系对,借鉴蛋白质交互关系抽取的方法对触发词蛋

4、白质对之间的关系进行检测。根据事件的定义类型将事件分为简单事件和复杂事件分别进行元素的检测。在简单事件中直接鉴定触发词蛋白质的关系,在复杂事件中采用了先鉴定是否存在关系再鉴定存在哪一种关系的方法。最终采用核函数的方法对触发词蛋白质对进行关系检测,来确定事件的元素。本文是在BioNLP’09和BioNLP’11共享任务提供的公开的语料集上进行训练和测试的,同时实验过程中采用的未标注语料来源于PubMed中的摘要文档。利用本文的方法在采用的语料集上进行模型建立和验证,结果表明本文采用的方法对事件抽取系统的性能有所改善,取得了不错的抽取效果。关键词:生物医学;事件抽取;组合学习;自训练;

5、核方法基于组合学习和自训练的生物医学事件抽取研究TheResearchofBiomedicalEventExtractionBasedonCombinationallearningAndSelf-trainingAbstractWithdramaticincreasinginamountofbiomedicalliterature,itbecomesdifficultforbiomedicalpractitionerstoefficientlyaccesstotheinformationwhichtheyareinterestedinforsuchamassofbiomedical

6、literature.Therefore,itturnsintoaarrestivedirectioninbiomedicalinformationextraictionfieldthatefficientlyextractedmanagableandstructuredmformationfrommassiveandunstructuredtext.BiomedicalEventExtractionbelongstothescopeofbiomedicalinformationextraction,anditsobjectiveiStoextractestructuredbiol

7、ogicaleventsinformationrelatedtoproteininunstructuredtextinformationonthemolecularlevel.Machinelearningmethodshavebeenwidelyutilizedinbiomedicaleventextractionresearch.Inthispaper,wealsomakeuseofmachinelearningapproachsinbiomedicalevent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。