apriori关联规则挖掘算法研究

apriori关联规则挖掘算法研究

ID:21537326

大小:58.50 KB

页数:10页

时间:2018-10-22

apriori关联规则挖掘算法研究_第1页
apriori关联规则挖掘算法研究_第2页
apriori关联规则挖掘算法研究_第3页
apriori关联规则挖掘算法研究_第4页
apriori关联规则挖掘算法研究_第5页
资源描述:

《apriori关联规则挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Apriori关联规则挖掘算法研宄摘要:如何在海量的数据中,挖掘其中隐藏的、人们感兴趣的知识,已经成为了一个研究的热点。Apriori算法是目前使用最为广泛的关联规则挖掘算法本文就其算法实现的流程以及具体的实现进行研究。关键词:数据挖掘;关联规则挖掘;Apriori算法中图分类号:TP309文献标识码:A文章编号:1007-9599(2011)23-0000-02AprioriAssociationRuleMiningAlgorithmNanZhihai'SunYong(SchoolofComputerScience&Technology,SoochowUniversit

2、y,Suzhou215006,China)Abstract:Howtovastamountsofdata,miningthehidden,peopleareinterestedinknowledge,hasbecomearesearchhotspot.Apriorialgorithmisthemostwidelyusedassociationruleminingalgorithm,thisalgorithmontheimplementationprocessandthespecificstudy.Keywords:Datamining;Associationrulemin

3、ing;ApriorialgorithmApriori关联规则挖掘算法研宄摘要:如何在海量的数据中,挖掘其中隐藏的、人们感兴趣的知识,已经成为了一个研究的热点。Apriori算法是目前使用最为广泛的关联规则挖掘算法本文就其算法实现的流程以及具体的实现进行研究。关键词:数据挖掘;关联规则挖掘;Apriori算法中图分类号:TP309文献标识码:A文章编号:1007-9599(2011)23-0000-02AprioriAssociationRuleMiningAlgorithmNanZhihai'SunYong(SchoolofComputerScience&Technol

4、ogy,SoochowUniversity,Suzhou215006,China)Abstract:Howtovastamountsofdata,miningthehidden,peopleareinterestedinknowledge,hasbecomearesearchhotspot.Apriorialgorithmisthemostwidelyusedassociationruleminingalgorithm,thisalgorithmontheimplementationprocessandthespecificstudy.Keywords:Dataminin

5、g;Associationrulemining;Apriorialgorithm一、数据挖掘技术概述随着信息技术的发展,信息量呈爆炸式增长。在大量的数据面前,“无用”的信息量远远超过了“有用”信息量,使用手工的方式在海量的数据里面寻找所需要的信息已经不再现实。在这种“数据爆炸,知识贫乏”的背景下,数据量的不断增长,大大降低了数据检索的效率。因此,数据挖掘作为在海量的数据中发现有价值知识的工具,得到了广泛的关注和应用。例如“尿布与啤酒”的例子就是数据挖掘应用的经典案例。目前,数据挖掘以其优越性,已经在各行各业中得到了广泛的应用,同时也进一步促进了数据挖掘技术的发展。数据挖掘

6、的目的就是从大量数据中发现有用的模式。模式表示数据之间的关联关系,是预测数据变化、进行数据分类的标准。各种模式为用户提供了各种各样的数据挖掘途径,用户可以根据不同的具体情况来使用不同的模式挖掘数据中有用的知识。在现实应用中,模式常被划分成如下几种类型:(一)关联模式关联模式通过对数据出现的频率进行统计,从而分析数据中各元素的关联程度,即关联模式表示了数据之间潜在的联系,从而挖掘其中隐含的关系。(二)分类模式分类模式是将海量的数据进行分类,将数据库中的数据映射到一个分类中,从而对这个数据进行标记。例如判定树、神经网络以及数学公式等都是比较常见的分类模型。(三)聚类模式聚类模

7、式即识别数据的内资规则,将具有同类关联内在规则的数据划分到同一个簇中。使得聚类中粗之间的区别尽可能大,而簇内元素的差别尽可能小。聚类模式与分类模式相似,其区别在于:聚类模式在划分过程中,来确定簇的数量和半径;而在分类模式中,在数据映射之间就确定了分类的定义。(四)时序模式时序模式指将原有的数据在时间轴上进行排序,并且根据这些数据基于时间的变化,来预测未来的发展趋势。二、Apriori算法流程分析Agrawal等在1994年提出使用Apriori算法对顾客交易的数据库项之间的关联规则进行挖掘的方法。基于这种方法分成以下两部分来完

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。