多示例多标签学习在基因功能注释中的应用

多示例多标签学习在基因功能注释中的应用

ID:34152395

大小:3.27 MB

页数:62页

时间:2019-03-03

多示例多标签学习在基因功能注释中的应用_第1页
多示例多标签学习在基因功能注释中的应用_第2页
多示例多标签学习在基因功能注释中的应用_第3页
多示例多标签学习在基因功能注释中的应用_第4页
多示例多标签学习在基因功能注释中的应用_第5页
资源描述:

《多示例多标签学习在基因功能注释中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号:10532学密号:Slll02022级:普通湖南大学硕士学位论文多示例多标签的应用学习在基因功能注途室握童目期;2Q!垒生5旦!垒目途室筌整旦期;2Q!垒生5旦2窆目释中Applicationofmulti—instancemulti—labelongenefunctionannotationbyLIY}unB.S.(HunanUniversityofArtsandScience)20l0AthesissubmittedinpanialsatisfactionoftheRequirementsforthe

2、degreeofMasterofEngineeringInformationandCommunicationEngineeringintheGraduateSchoolofHunanUniVersitySupervisorProfessorLIAOBoMay,2叭4湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明

3、。本人完全意识到本声明的法律后果由本人承担。作者签名:礁日期:讼缈年/月/日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“√”)作者签名:导师签名:存堙1日期:如,侈年乡月占日日期:劢l甲年

4、参月占日多示例多标签学习在基因功能注释中的应用摘要在后基因组时代,最主要的挑战是基因组注释。作为基因组注释的重要研究部分,基因功能注释有着举足轻重的地位。为人类更好的认识基因,探索生命的本源提供必要的依据。人类基因组测序工程产生了大量的全基因组数据,这些数据为基因功能注释课题的研究提供了丰富的生物学信息。然而,从大量的信息中获取有用的知识,人工的方法已经不能胜任,需借助计算的方法进行机器学习。本文采用多示例多标签的学习方法对该任务进行研究,主要的研究工作如下:首先,本文从基因表达模式的角度对基因功能进行预测,细致地

5、分析研究了基因功能注释数据库中基因功能之间的关系及其推导过程。针对基因功能注释数据库中基因与功能之间多对多映射关系的特点,本文引入多示例多标签学习框架,并对多示例多标签学习框架进行研究分析。其次,针对多示例多标签学习框架的退化策略会退去基因之间的相关性的问题,本文结合多示例学习框架与层次聚类算法,提出了多示例层次聚类算法。该算法以基因表达相关性为基础,将拥有相同基因功能的基因的时序表达数据子集视为该基因功能的示例集合进行多示例构建。使用基因时序表达数据之间的皮尔森相关系数计算多示例之间的距离,并通过最大化各基因功能

6、类中所包含的基因之间的相关性进行聚类约束,使得基因之间的相关性能在聚类过程中得到很好的保持。最后,为验证算法的有效性,本文在酿酒酵母的四个基因时序表达谱中进行实验,先使用多示例层次聚类算法将多示例多标签任务退化成单示例多标签任务,再采用多标签支持向量机或多标签K近邻算法进行求解。实验表明该算法能在多示例多标签学习框架的退化过程中很好的保持着基因之间的相关性,并拥有着良好的性能。关键词:基因时序表达;基因功能注释;机器学习;多示例多标签II硕士学位论文AbstractInthepostgenomeera,themai

7、nchallengeisgenomeannotation.Asanimportantpartofthegenomeannotation,genefunctionalannotationplaysadecisiVerole.Tounderstandthegenefbrhumanbetter,itproVidesthenecessarybasisf-orexploringtheoriginof1ifb.Thesequencingofthehumangenomeprojecttoproduceawholegenomeda

8、ta,thesedataproVideabundantbiologicalinformationforthestudyofgenefunctionannotation.However,toobtainusefulknowledgefromalargeamountofdata,machinelearningisbetterthanthearti矗cialmet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。