基于组合变量与重叠区域的SVMRFE方法研究

基于组合变量与重叠区域的SVMRFE方法研究

ID:36582560

大小:6.90 MB

页数:57页

时间:2019-05-12

基于组合变量与重叠区域的SVMRFE方法研究_第1页
基于组合变量与重叠区域的SVMRFE方法研究_第2页
基于组合变量与重叠区域的SVMRFE方法研究_第3页
基于组合变量与重叠区域的SVMRFE方法研究_第4页
基于组合变量与重叠区域的SVMRFE方法研究_第5页
资源描述:

《基于组合变量与重叠区域的SVMRFE方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于组合变量与重叠区域的SVM—RFE方法研究TheStudyofSVM—RFEBasedonCombinatorialVariablesandOverlappingArea学21109217大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表

2、示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:作者签名:大连理工大学硕士学位论文摘要科学技术不断发展进步,人类每天都要处理大量繁冗复杂的信息。数据挖掘技术就是从这些大量纷繁的数据中挖掘潜在有用的信息,使数据的分析和解释更简洁容易。特征选择是数据挖掘的一个重要分支,特征选择算法从大量的特征中去除噪音特征和冗余特征,有价值特征的提取使特征维数降低,模型简化。代谢组学中用数据挖掘技术处理数据,对生物体产生的代谢产物研究,分析代谢物质和生物体生理病变之间的变化关系,挖掘富含信息的潜在代谢标志物,辅助生物体疾病的诊断应用。代谢组学研究中,代谢产物之间的相互作用可能是表征发

3、生癌变的关键信息,而代谢产物相互作用至少有两个代谢物质共同起作用。所以,相对于单个变量,变量组合也可能为癌变提供有用的潜在标记物。可是,不同的方法构造的组合变量在特征选择和样本分类中有着各自的特点和起到不同的作用,本文利用加、减、乘和除的对数四种组合方法来构造组合变量,选择评价相对较优的构造方法组合的变量对数据来代替原始单变量表达数据,作为支持向量机的特征回归消减方法(SupportVectorMachine.RecursiveFeatureE1imination,SVM.IuE)的输入数据,进行特征选择和样本分类(SVM.RFE.C)。一组液相色谱质谱数据集的实验结果表明组合变

4、量的有效性,从而构造组合变量进行特征选择可以得到有区分能力的信息。支持向量机特征迭代消减方法(SVM.I疆E)是一种基于SVM典型的序列后向递归消除特征的方法,利用支持向量来得到每一个特征的权重大小,迭代地删除当前特征集合中最差的特征,从而使得特征空间得以优化。特征权重衡量每个特征对样本分类的重要性,特征的重叠区域(OverlappingArea,OA)却度量了特征与类标之间的联系,是样本分布的一个重要的度量准则。为了更好的筛选具有区分能力的特征,建立更为有效的分类模型,本文将OA与SVM.RFE相结合,对当前空间内每一个特征的权重进行评价,提出了一种组合的特征选择方法OA.SV

5、M.RFE。5个公共数据集和1组卵巢癌数据集的测试结果表明,OA-SVM.RFE算法所选取的特征子集的分类性能优于原始SVM.RFE算法。关键词:代谢组学;SVM-RFE;特征选择;组合变量;重叠区域基于组合变量与重叠区域的SVM—RFE方法研究TheStudyofSVM·-RFEBasedonCombinatorialVariablesandOverlappingAreaAbstractWiththedevelopmentofscienceandtechnology,humanitymustdealwithalargenumberofinformation,whichisrat

6、hercomplicated,everyday.Dataminingtechnologyisthatminingthepotentialusefulinformationfromtheseintricatematerials,makesanalysisandinterpretationofdatamoreconciseandeasier.FeatureselectionalgorithmiSanimportantbranchofdatamining,anditCanremovenoiseandredundancydatafromalargenumberoffeatures,ext

7、ractvaluablefeaturestoreducethefeaturedimensionandsimplifymodel.MetabolomicsCanprocessdatawithdataminingtechnology,researchmetabolitesinbiological,analysistherelationshipbetweenmetabolicsubstancesandbiologicalchangesinphysiologicaldiseaseande

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。