基于序投影距离的微阵列数据诊断基因模式发现技术研究

基于序投影距离的微阵列数据诊断基因模式发现技术研究

ID:32287375

大小:3.47 MB

页数:74页

时间:2019-02-02

基于序投影距离的微阵列数据诊断基因模式发现技术研究_第1页
基于序投影距离的微阵列数据诊断基因模式发现技术研究_第2页
基于序投影距离的微阵列数据诊断基因模式发现技术研究_第3页
基于序投影距离的微阵列数据诊断基因模式发现技术研究_第4页
基于序投影距离的微阵列数据诊断基因模式发现技术研究_第5页
资源描述:

《基于序投影距离的微阵列数据诊断基因模式发现技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据分类号UDC密级学位论文基于序投影距离的微阵列数据诊断基因模式发现技术研究作者姓名:指导教师:顾亮王国仁教授东北大学信息科学与工程学院申请学位级别:硕士学科类别:专业学位学科专业名称:计算机技术论文提交日期:2012年6月10日论文答辩日期:2012年6月20日学位授予日期:答粉△捕:高福祥教授评阅人:赵宇海副教授、李晓光教授东北大学2012年6月万方数据AThesisinComputerTechnologyStudyontheDiagnosticGenePatternDiscoveryTechnologyinMicroarrayDataBasedontheSequencePr

2、ojectDistanceByGuLiangSupervisor:ProfessorWangGuorenNortheasternUniversityJune2012万方数据独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:隈亮日期:幽∽易.J∥学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家

3、有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口学位论文作者签名:做洗签字日期:跏l立、6、僭两年∥导师签名:签字目期:0p心.6O,●I万方数据东北大学硕士学位论摘要基于序投影距离的微阵列数据诊断基因模式发现技术研究摘要DNA微阵列技术推动生物信息学跨入了多基因、全基因组研究的崭新时代,同时也产生了远远超出传统数据分析方法处理能力的海量基因表达数据,设计符合表达数据特征的高效数据分析方法已成为生物信息学研究的热点和重点。人类疾病通常

4、与基因相关,诊断基因是指与某一特定疾病表型紧密相关的基因,具有很强的区分不同样本表型的能力。DNA微阵列数据的聚类和分类分析对于研究基因功能和基因调控机制有重要的实际意义,从基因角度解释了疾病。第一,提出了基于序投影距离的无监督表型和诊断基因发现算法MSMD。本文提出了一个新的表型聚类算法,该算法的基于序投影距离的概念计算区分这些样本子序列的能力,然后根据最能区分样本的子序列对样本进行聚类,同时能找到诊断基因。该算法主要包括下面几个部分,第一,把微阵列数据转化为Ewave模型。第二,找到平凡子序列,对等价维组数据进行削减删减掉平凡子序列并且为简化后的微阵列矩阵创建位置矩阵。第三,用模版

5、进行枚举,其中通过投影距离的上限进行削减,为每个样本找到最大区分能力的子序列。第四,根据每个样本的最大区分能力子序列划分块,最后把这些块聚成K类,同时发现诊断基因模式。实验结果证实,本文提出MSMD算法在运行效率和有效性方面均大大优于与之比较的算法,而且发现的诊断基因具有很强的生物学意义。第二,提出了基于Top—K覆盖不可约对比序列规则的诊断基因模式发现算法。基于Top-K覆盖不可约对比序列规则的诊断基因模式发现算法从序列规则的视角来分析微阵列数据。本文首先给出对比序列规则、规则组、不可约对比序列规则相关的概念,并且继续使用上一章提出的分析微阵列数据的模式——-E、vave模型。接着在

6、数据模型上,找出满足阈值要求的Top.K覆盖不可约对比序列规则,每个样本都找到自己的Top.K最好的规则作为区分样本表型的诊断基因模式。最后,用这些规则来构建分类器,从而完成对未知测试样本的分类预测工作。关键词:微阵列数据、诊断基因、序投影距离、对比序列万方数据东北大学硕士学位论文AbstractStudyontheDiagnosticGenePatternDiscoveryTechnologyinMicroarrayDataBasedontheSequenceProjectDistanceAbstractDNAmicroarraytechnologypromotesbioinform

7、aticsintoaneweraofmultiplegenesandgenome—widesmdNmeanwhileproducesmassivegeneexpressiondatafarbeyondthecapabilitiesoftraditionaldataanalysismethods.Designingefficientanalysismethodsthatmeetthecharacteristicsofmicroarraydatah

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。