欢迎来到天天文库
浏览记录
ID:28664948
大小:290.66 KB
页数:43页
时间:2018-12-12
《基于条目共享信息的本体条目语义相似性度量——毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要摘要量化基因本体中条目对的语义相似性可以帮助人们探索生物实体在功能方面的关系。目前,一种通用的解决方法是基于条目公共祖先所包含的生物信息来衡量条目间共享的信息。然而,对于条目共享信息的测量,很多研究都有各自的缺陷和限制。本文提出了一种新的测量方法——基于条目共享信息的本体条目语义相似性度量,该方法是基于一个在基因本体中多重继承关系的直观发现上提出的。该方法是从基于继承的公共祖先所包涵的生物信息上发展出来;基于继承的公共祖先节点是根据条目公共祖先的孩子节点的属性而从公共祖先集合中筛选出来的。测试结果显示,该方法计算的结果更贴近生物专家们的分析,而且该方法也有
2、效支撑了人们对“酵母菌通路数据集中基因功能分类”这一认识。另外,对于大规模数据集的实际应用,该方法是一个很有前途的基于多重继承的替代方法。关键词:语义相似性测量基因本体信息量公共祖先基于继承的公共祖先摘要ABSTRACTABSTRACTQuantifyingthesemanticsimilaritiesbetweenpairsoftermsintheGeneOntologystructurecanhelptoexplorethefunctionalrelationshipsbetweenbiologicalentities.Acommonapproachtot
3、hisproblemistomeasuretheinformationtheyhaveincommonbasedontheinformationcontentoftheircommonancestors.However,manystudieshavetheirlimitationsinmeasuringtheinformationtwoGeneOntologytermsshare.Thisstudypresentedanewmeasurement,exclusivelyinheritedsharedinformationthatcapturedtheinfor
4、mationsharedbytwotermsbasedonanintuitiveobservationonthemultipleinheritancerelationshipsamongthetermsintheGeneOntologygraph.Exclusivelyinheritedsharedinformationwasderivedfromtheinformationcontentoftheexclusivelyinheritedcommonancestors,whichwerescreenedfromthecommonancestorsaccordi
5、ngtotheattributeoftheirdirectchildren.Asthetestresultsshow,itproducedmorerelevantresultwithexperts’scoresontheartificialdataset,andsupportedthepriorknowledgeofgenefunctioninpathwaysontheSaccharomycesgenomedatabase.Itisapromisingalternativetomultipleinheritancebasedmethodsforpractica
6、lapplicationsonlarge-scaledataset.Keywords:SemanticsimilaritymeasurementGeneOntologyInformationcontentCommonancestorsExclusivelyinheritedcommonancestorsABSTRACT目录ⅰ目录第一章绪论11.1引言11.2研究现状11.3研究内容和目标31.4论文章节安排3第二章GO与相似性度量52.1GO概述52.2GO条目的相似性度量52.2.1基于边的相似性度量方法62.2.2基于节点的相似性度量方法62.3基因相似性
7、度量82.3.1成对比较82.3.2成组比较92.4本章小结9第三章EISI方法及其应用113.1EISI方法113.2语义相似性计算133.2.1条目相似性计算133.2.2算法示例143.3MICA、DCA与EICA的对比分析163.3.1EICA和MICA163.3.2EICA与DCA163.4本章小结18第四章实现与评估19目录ⅰ4.1EISI方法的实现194.2实验环境和相关数据包204.2.1R语言简介以及优缺点分析204.2.2GO.db包214.3测试数据处理与测试原理224.3.1在人工评分数据集上测试224.3.2在通路数据集上测试234.
8、4实验结果及分析264.4.1人工评分
此文档下载收益归作者所有