基于关联规则随机森林模型

基于关联规则随机森林模型

ID:33637820

大小:2.39 MB

页数:67页

时间:2019-02-27

基于关联规则随机森林模型_第1页
基于关联规则随机森林模型_第2页
基于关联规则随机森林模型_第3页
基于关联规则随机森林模型_第4页
基于关联规则随机森林模型_第5页
资源描述:

《基于关联规则随机森林模型》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着信息技术的飞速发展和人们收集、获取数据能力的大幅提高,数据挖掘成己为一个发现隐藏知识、归纳模式、分析信息和预测未知信息的有力工具,在许多领域中所起的作用也越来越重要。分类挖掘和关联规则挖掘是数据挖掘中的两个重要的研究领域,其实际应用范围非常广泛。关联规则挖掘旨在发现数据库中数据项间的有趣联系,而分类挖掘是对分类知识进行发现描述和区分,用较小的分类规则集形成分类器去预测未知对象。把关联规则挖掘和分类技术结合起来,就产生了关联分类技术。如何快速有效地从海量数据中挖掘出蕴含其中的冗余尽可能少的分类关联规则,并将这

2、些规则合理、充分地利用,具有十分重要的理论意义和实际意义。传统的关联分类技术中最终分类器的分类规则占全部的分类关联规则的比例往往很少,未能充分利用那些不是真正意义上冗余而对分类决策起重要作用的规则。本文主要针对这些不足,开展关联分类技术的改进研究。本文用划分输入空间的观点,对经典的基于关联规则分类构建分类器的过程进行了描述和分析,该过程可以看成向右生长的一棵二叉决策树。随后提出了基于信息熵增益的关联分类技术,该方法用信息熵增益度量分类关联规则的优先级、用覆盖思想构建左右都生长的二叉决策树。接着提出了潜在分类关联规则

3、概念,即那些被关联分类分类器忽略、不是真正意义上冗余而对分类决策起重要作用的规则。最后提出基于关联规则的随机森林分类模型。随机森林的组合思想使该模型在一定程度上利用了潜在分类关联规则。27个基准数据集的对比实验显示:我们的模型具有比传统关联分类技术CBA更高的测试准确率和更好的稳定性,是一种能利用潜在分类关联规则的可行关联分类技术。关键词:关联分类;随机森林;信息熵增益;分类关联规则AbstractDatamininghasbecomeapowerfultooltodiscoverhiddenknowledge,s

4、ummarizedthepattern,analyzeinformationandpredictunknowninformationwiththerapiddevelopmentofITapplicationsandthesubstantialincreaseofdatacollectionforpeople.Anditplaysnowanincreasinglyimportantroleinmanydifferentareas.Classificationminingandassociationruleminin

5、garetwoimportantresearchareasindataminingandtheyhaveextensivepracticalapplications.Associationroleminingaimsatdiscoveringinterestingconnectionsbetweentheitemsinthedatabase.Whileclassificationminingfinds,describesanddistinguishestheclassificationknowledge,andus

6、uallyformsaclassifierusingasmallsetofrulestopredicttheunknownobject.Associationclassificationisanewtechniquewhichintegratesclassificationandassociationrulesdiscovery.Ithasimportanttheoreticalandpracticalsignificancehowtoquicklyandefficientlymineaslittleaspossi

7、bleredundantruleswhicharereasonableandtakenfulladvantageof.Theclassificationassociationrulesintheclassifierarealittlepartofallclassificationassociationrulesfortraditionalassociativeclassificationtechniques.Thoserules,whichalenottrulyredundantandplayimportantro

8、leinclassificationanddecision-making,arenotmadefulluseof.Ourpapermainlystudiestheassociativeclassificationtechniquesfocusingontheseshortcomings.Wedescribeandanalysistheprocessofbui

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。