基于遗传算法特征基因选择方法的研究

基于遗传算法特征基因选择方法的研究

ID:33710065

大小:2.78 MB

页数:52页

时间:2019-02-28

基于遗传算法特征基因选择方法的研究_第1页
基于遗传算法特征基因选择方法的研究_第2页
基于遗传算法特征基因选择方法的研究_第3页
基于遗传算法特征基因选择方法的研究_第4页
基于遗传算法特征基因选择方法的研究_第5页
资源描述:

《基于遗传算法特征基因选择方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ResearchonfeaturegeneselectionmethodbasedongeneticalgorithmbyLIUJinbiaoB.E.(NationalUniversityofDefenseTechn0109y)2001AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringlnSoftwareEngineeringintheGraduateSch001ofHunanUni

2、versitySupervisorProfessorWANGDongSeniorengineerLIYonghang0ctober,2012湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:驯豸飓\JEt期:加I乙年//月2乡日学位论文版权使用授权书本

3、学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于l、保密口,在年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“、/”)作者签名:导师签名:日期:加\么年日期:≥Op年石沙∥『7月2舌日11月“El基于遗传算法的特征基因选择方法研究摘要DNA微阵列技术能够高通量地一次性

4、检测成千上万个基因,这一技术高度自动化、规模化和微型化等特点,使得其可以作为研究肿瘤等复杂性疾病的重要手段。根据肿瘤表达谱数据分析,从大量的基因中挑选有意义的特征基因选择不仅能帮助我们发现与肿瘤相关的重要基因,提高分类能力,并且也降低了临床诊断肿瘤亚型的成本。一个成熟的特征基因选择方法不仅能产生具有较好分类性能的子集,并且该方法应该同时具有较好的鲁棒性。然而微阵列数据的显著特点是样本少、维度高,而据相关研究证实,这种数据更容易造成特征选择方法的鲁棒性较低。但是,现有大多的特征选择方法只关注算法的分类准确率

5、指标,而忽略算法的鲁棒性指标,而鲁棒性差则会大大降低临床诊断的可信度。为了克服现有方法在兼顾鲁棒性以及预测准确率的不足,我们提出了一种基于遗传算法的特征基因选择方法。该方法首先利用基于累积偏差的方法剔除异常数据,以避免异常数据为后续基因选择带来负面影响。紧接着,为了提高算法的鲁棒性,我们借鉴融合分类器思想,提出融合多个基本过滤准则的综合评价方法,该方法利用不同准则在样本数据分布刻画的侧重点不同的特性,设计一种加权打分的多准则融合方法对基因进行初步筛选,该方法由于不仅考虑了多个准则之间的互补性,而且同时可以

6、充分考虑多个准则之间的相对重要性,因此,它对于各个单个基因的评价更为客观、更为全面,从而避免单个准则的片面性。更重要的是,与以往方法不同之处在于,在基因初选阶段,我们只利用多准则融合进行筛选而并不进行排序,这样可以避免因为排序的偏差影响而对后续精选过程带来负面影响,最后利用遗传算法的对基因初选结果进行基因组合空间搜索,以寻找最优的特征基因组合。实验证明该方法有效保留了因为单个准则的偏袒性而被错误淘汰的有效特征基因,从而具有更好的预测准确率,并且具有更好的鲁棒性。关键词:基因芯片;基因表达谱;基因选择;鲁棒

7、性工程顺上学位论文AbstractWiththecompletionofhumangenomeproject,lifescienceshaveenteredanewera.Usingmicroarraytechnologies,biologistscanhighthroughanalysisthousandsofgeneexpressionvalues.Featuregeneselectionaimstofindacompactfeaturesubsetusedtoconstructapatterncla

8、ssifierwithreducedcomplexity,inordertoimprovetheclassificationperformance.ItisnotonlyforUStofinddisease-relatedgenesandimproveclassificationoftumors,butalsoreducesthecostoftheclinicaldiagnosisoftumortype.Consequentl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。