基于微阵列数据分析的肿瘤分类方法研究

基于微阵列数据分析的肿瘤分类方法研究

ID:33477253

大小:6.52 MB

页数:95页

时间:2019-02-26

基于微阵列数据分析的肿瘤分类方法研究_第1页
基于微阵列数据分析的肿瘤分类方法研究_第2页
基于微阵列数据分析的肿瘤分类方法研究_第3页
基于微阵列数据分析的肿瘤分类方法研究_第4页
基于微阵列数据分析的肿瘤分类方法研究_第5页
资源描述:

《基于微阵列数据分析的肿瘤分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、中国科学技术大学硕士学位论文基于微阵列数据分析的肿瘤分类方法研究姓名:徐春归申请学位级别:硕士专业:生物信息学指导教师:黄德双20090201摘要DNA微阵列技术是一种由物理学、微电子学与分子生物学几个领域综合交叉形成的高新技术,在医学与生物学上得到越来越广泛的应用,其中在癌症分析检测上的应用使得在大规模基因水平上深入研究癌症的发生、扩散等病理特征成为可能。为进行可靠的癌症类型诊断与预测,癌症关键基因的识别和癌症的分类研究已成为当前癌症研究中的两项重要内容。但由于微阵列数据具有数据维数高,样本数少的特点,因而使用常规的模式识别方法并不能总是获得理想的结果。本文首先回顾了肿

2、瘤微阵列数据分类的一些经典方法,然后介绍了攻读硕士期间所从事的多分类器集成系统的学习和研究,最后是关于遗传规划算法和多分类器集成技术在肿瘤微阵列数据上应用的探索。全文的主要工作概括如下:(1)设计了一种基于子集成系统的遗传规划算法,以同时实现特征选择和类别判定。该算法的特点在于遗传规划算法的设计中,分别使用了规模较小的集成系统(称为子集成系统)来处理各个两类问题,并使用投票法将这些集成系统融合起来,以构成一个个体。由于每个个体都包含一组子集成系统,因此具有相对较强的泛化能力,能直接处理多类判别问题。本文设计了基于特征的差异度测度,并使用局部优化算法来确保各个子集成系统的差

3、异度,从而进一步提高了系统运行的效率。(2)单个实验室产生的微阵列数据难免会有误差,也会影响到基于此数据学习训练的分类器的效果和泛化能力,而将多个实验室来源的数据整合起来训练分类器,可以从中筛选出适用于多个数据集的分类器,也更加接近肿瘤分类的本质。本文将基于子集成系统的遗传规划算法应用于来自于不同实验室的肿瘤微阵列数据,以检测这种算法对来源不同的数据的分类效果,同时产生泛化能力更好的分类器。关键词:肿瘤分类问题;多分类器集成系统;微阵列数据;差异度;遗传规划;基分类器;跨数据集ABSTRACTDNAmicroarraytechnologyisanewtechnology,

4、formedbytheinterdisciplineofphysics,electronicsandmolecularbiology.Microarraytechnologyhasbeenwidelyappliedtothestudyonbiologicalandmedicalfields.Amongitsapplications,themicroarraytechnologybasedcancerdiagnosismakesitpossibletodeeplystudythecancerpathologicalmechanism,includingtheoccurrin

5、ganddiffusenessofcancer.Inordertoachievereliablediagnosisandpredictiononthetypeofcancers,manyresearchesfocusontheidentificationofkeygenestodifferentcancersandtheclassificationofcancers.However,duetothesmallsamplesizeproblemalongwitll11i曲dimensions,thetraditionalmethodscallnotachievegoodpe

6、rformances.Sothisthesisfirstreviewssomeofclassicmethodsinmicroarraydatabasedtumorsclassification.Thenitdescribesthestudyofmultipleclassifiersystemwhichismymajorresearchworkduringmymasterperiod.AndthelastpartisabouttheapplicationofGeneticProgrammingalgorithmandmultipleclassifiersystemintum

7、ormicroarraydata.ThemainworkforthisthesisCanbeconcludedasfollows:(1)AGPwasproposedbasedontheideaofsplicingmulticlassproblemintomultipletwo-classproblems.ThecharacteristicofthisGPisthateachindividualconsistsofasetofsmall—scaleensemblesystems(namedassub—ensemblehere),

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。