融合分类器及svm-rfe特征选择算法研究

融合分类器及svm-rfe特征选择算法研究

ID:33863387

大小:3.75 MB

页数:53页

时间:2019-03-01

融合分类器及svm-rfe特征选择算法研究_第1页
融合分类器及svm-rfe特征选择算法研究_第2页
融合分类器及svm-rfe特征选择算法研究_第3页
融合分类器及svm-rfe特征选择算法研究_第4页
融合分类器及svm-rfe特征选择算法研究_第5页
资源描述:

《融合分类器及svm-rfe特征选择算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文融合分类器及SVM—RFE特征选择算法研究TheResearchofEnsembleClassifierandSVM-RFEFeatureSelectionAlgorithm学21109226大连理工大学DalianUniversityofTechnology

2、JIIIIIIUlIIIIIIfllllIIIJY2590492。。。‘’’。’’。。——大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本

3、论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:鬲!}台欲譬郧小一IRFE错彳正递埔矗却窘作者签名:魏角大连理工大学硕士学位论文摘要随着科学技术进步和发展,使得各行各业产生了大量数据,人类进入了火数据时代。大量数据的产生对我们来说既是机遇也是挑战。因此,急需我们从大量数据中发现有用的信息来促进生产力的发展。数据挖掘技术就是在这基础上发展而来的。数据

4、挖掘是一门交叉学科,它融合了模式识别,机器学习,统计学习,人工智能等技术。通过分析数据中的有用信息,吸取精华,去其糟粕,挖掘出数据中潜在知识。目前,数据挖掘技术广泛应用到基因组学、蛋白组学、代谢组学等各个领域。分类和特征选择技术都是数据挖掘中常用的基本技术,在知识的发现和信息的提取中起到了重要作用。由于不同的分类器模型能够从数据中挖掘出不同的信息,利用多种分类模型建造融合分类器中的基分类器,充分利用各个分类器之间的互补性,增强了融合分类器中基分类器的强度和基分类器之间的多样性。因此,本文中提出了一个基于多种分类模型的

5、融合分类器。该融合分类器由多个融合基分类器构成,每个融合基分类器利用三种不同的分类器(决策树、kNN,SVM)通过加权融合而成。在公共数据集上的实验结果表明,与其它融合分类技术和单分类器相比,本文中提出的方法在一定程度上提高了分类的准确率。高维小样本数据往往导致数据挖掘过程中建造模型的时间增加,性能反而降低。特征选择技术目的就是从高维数据中选择出有用的特征,提高模型的性能。SVM-RFE是一种常用的特征选择技术,它通过迭代删除SVM模型建造过程中权重最低的特征,有效删除噪音特征和冗余特征。样本分布情况能够影响SVM模

6、型中超平面的建立,从而影响特征选择结果。在此基础之上,本文中利用类重叠技术,计算每个样本的重叠程度,在SVM.RFE中利用重叠程度低于我们预先设定阀值的样本去建造SVM模型,更好的计算特征权重。实验过程中,文中给出分类准确率比较结果和特征分析结果。实验结果表明本文提出的方法一定程度上改进了SVM.RFE特征选择性能。本文首先提出了基于多种分类器方法的融合分类器,利用不同分类器之间的互补性提高了分类准确率。其次,利用类重叠技术研究样本的分布情况,提出了一种改进的SVM.RFE特征选择方法,改善了特征选择的性能。关键词:

7、数据挖掘;融合分类器;类重叠;SVM—P,FE;融合分类器及SVM-RFE特征选择算法研究TheResearchofEnsembleClassifierandSVM.I江EFeatureSelectionAlgorithmAbstractAlong诵ththedevelopmentofthescienceandtechnology,largeamountsofdatahavebeengeneratedbymanyareas,andmankindenterstheeraofbigdata.Thegenerationof

8、largeamountsofdataisopportunitiesandchallengesforUS.ThenitisurgentforUStofoundtheusefulinformationfromthedatatofacilitatethedevelopmentofproductivity.Thedataminingisdevelopedinthiscontext.Dataminingisaninterdisciplinary,whichcombinespattemrecognition,machinelea

9、rning,statisticallearning,artificialintelligencetechnology.Byanalyzingtheusefulinformationofthedata,learningtheessence,toitsdregs,thedatamiIlingistofindthepotentialknowledge

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。