探究决策树分类算法优化研究

探究决策树分类算法优化研究

ID:35149259

大小:1.97 MB

页数:72页

时间:2019-03-20

探究决策树分类算法优化研究_第1页
探究决策树分类算法优化研究_第2页
探究决策树分类算法优化研究_第3页
探究决策树分类算法优化研究_第4页
探究决策树分类算法优化研究_第5页
资源描述:

《探究决策树分类算法优化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中南大学硕士学位论文决策树分类算法优化研究姓名:陈沛玲申请学位级别:硕士专业:计算机应用技术指导教师:季桂树20070510摘要数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术,己被广泛应用于金融、保险、政府、教育、运输以及国防等领域。数据分类是数据挖掘中一个重要的内容。分类存在很多方法,其中决策树算法是以实例为基础的归纳学习算法,以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和较高的分类准确率等优点而得到广泛的应用。据统计,目前决策树算法是利用最广泛的数据挖掘算法之一。然而在实际应用过程中,现存的

2、决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。因此,迸一步改进决策树,提高决策树的性能,使其更加适合数据挖掘技术的应用要求具有重要的理论和实际意义。本文针对上述数据库知识发现的不足,进行深入的研究,探索数据挖掘中决策树分类的组合优化算法,以便更好地提高分类的准确性。应用于实际工作中,主要研究工作如下:首先,从宏观上介绍了数据挖掘和分类技术的理论基础,并重点对决策树算法进行了分析和比较。然后,提出了一种新的适合于高维数据库的组合优化决策树算法。相比于传统的分类算法,该算法从降维、属性选择、可扩展性和剪枝等方面进行了改进。其中最主要是提出基

3、于加权属性协调度并结合简化预剪枝策略的决策树算法—.DTBAc算法,以及加强算法可扩展性的FAVC集。最后,着重介绍了所研发的组合优化决策树分类器系统。它以DTBAC算法为核心算法生成分类器,并应用到医学领域对病人进行分类。通过对比分析发现,DTBAC算法在总体性能上要优于目前被广泛采用的ID3算法。关键词数据挖掘,分类,决策树算法,ID3,DTBACABSTRACTDataminingmeanstheprocessofextractingcrypticandpotentialhelpfulinformationfromamassofData.Iti

4、sonekindofbrandnewDataanalysistechnologyandpopularinthefieldofbankingfinance,insurance,government,education,transportationandnationaldefenseetc.DataclassificationiSoneofimportantcontentsinDatamining.TherearemanymethodsforDataclassification.andtheDecisionTreeclassificationalgori

5、thmbasesontheinstancesamongsttheseiswidelyusedwithitsadvantagesofconvenienceforgettingapparentrules,smallercalculationworkload,showingimportantdecisioncharacteristics,higherclassificationcorrectnessetc.DecisionTreealgorithmiscurrentlyoneofthemostpopularinDataminingalgorithmsacc

6、ordingtorelatedstatistics.ThereiSsomeissuesinthemostexistentdecisiontreealgorithms,whileappliedtotherealitytasks,namelymulti-valuebias,lowerefficientlyincomputationetc.Therefore,itpossessesimportanttheoreticandfactualsignificancetomakefurtherimprovementandraisetheperformancefor

7、decisiontree,SOastomakedecisiontreemoresuitablefortherequirementofthefactualapplication.Thisarticledeeplymakesresearchesaimingattheabove-relatedDatabaseknowledgediscoveryissues,andthepurposeistoprobeintooptimizationandcombinationofDecisionTreeinDatamining,inordertobeappliedtoth

8、erealitytasks.Theinvolvedcontentsexistasfollow:Firstly

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。