基于决策树分类算法的噪声容错性研究

基于决策树分类算法的噪声容错性研究

ID:33774314

大小:2.71 MB

页数:56页

时间:2019-03-01

基于决策树分类算法的噪声容错性研究_第1页
基于决策树分类算法的噪声容错性研究_第2页
基于决策树分类算法的噪声容错性研究_第3页
基于决策树分类算法的噪声容错性研究_第4页
基于决策树分类算法的噪声容错性研究_第5页
资源描述:

《基于决策树分类算法的噪声容错性研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京邮电大学硕士学位论文基于决策树分类算法的噪声容错性研究姓名:杜秀芝申请学位级别:硕士专业:计算机应用技术指导教师:张代远20090501南京Ililllf.!.人学顾{:研究生学位论义摘要数据分类是一种重要的数据挖掘技术,常用的数据分类方法有决策树归纳分类、贝叶斯分类、神经网络分类和K最邻近分类等,采用的理论及算法有决策树(DecisionTree)、粗糙集(Roughset)、人工神经网络(ArtificialNeuralNetwork)、遗传算法(GeneticAlgorithms)在占专宁oID3(Interact

2、iveDichotomy3,简称ID3)算法以信息熵作为属性选择的标准,是经典的决策树算法,但该算法没有考虑噪声数据的影响,使得算法的抗噪声能力比较差。针对上述的不足,本文分别结合粗糙集理论、人工神经网络对ID3算法作了改进研究,主要内容包括:首先,对决策树、可变精度粗糙集理论进行了系统的研究,分析了变精度粗糙集中分类质量与分类正确率的关系。考虑到可变精度粗糙集理论在处理噪声数据方面具有较强的抑制能力,以及实际应用中常关心的分类质量问题,提出了基于分类质量的变精度ID3算法。与此同时,结合粗糙集理论中属性约简算法可以在不影响

3、分类能力的前提下对数据集进行简化的特性,本文还提出了变精度的属性约简算法。其次,考虑到神经网络具有鲁棒性、自适应性和高度容错性等特点,并且在利用粗糙集理论知识构建决策树算法的属性选择标准启发下,提出了基于样条权函数神经网络的决策树生成算法。随后,分别对基于分类质量的变精度ID3算法及基于样条权函数神经网络的决策树算法构建了分类器,用UCI数据库中的多个数据集作为测试数据进行了实验,实验结果表明改进后的决策树生成算法在抑制噪声方面要优于改进前的1133算法,其实用性更好。最后,本文提出将决策树分类思想应用到城市道路建设中去,为

4、城市现有道路的养护及新道路的规划起到辅助参考作用。关键字:ID3算法,分类正确率,分类质量,属性约简,样条权函数神经网络南京邮l【1人学顾:i:研究生学位论文AbstractClassificationisoneofthemostimportanttechnologiesinDataMiningwhichincludesDecisionTreeMethods,BayesianMethods,NeuralNetworkMethods,K—nearestalgorithm.Themostpopulartheoriesandalg

5、orithmsareDecisionTree,Roughset,ArtificialNeuralNetwork,GeneticAlgorithmsandSOon.ID3algorithmisaclassifyingalgorithmindecisiontreemethods,whichtakesinformationentropyasstandardforchoosingsplittingattributes.Becauseofnotconsideringtheinfluenceofnoise,thealgorithm’Sa

6、bilitytoanti-interferenceisweak.Thestudiesisgivenbyintegrateingitwithroughsetandneuralnetwork,themaincontentsofpaperarelistedasfollow:Inthefirst,aresearchwasmadebasedondecisiontree,roughsetstheoryandtherelationshipanalyzedbetweenqualityofclassificationandthecorrect

7、classificationrate.Becausevariableprecisionroughsetcouldrestrainnoiseverywellandthequalityofclassificationisthemostconcernedfactorinpracticalapplications,anewalgorithmnamedvariableprecisionID3algorithmbasedonqualityofclassificationisputforwardinthispaper.Alsobecaus

8、eattributereductionnotonlyreducesredundantcontributionsbutalsohasthesameprecisionofclassifying,thealgorithmofattributereductionbasedonvariablepre

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。