基于apriori算法的兴趣集加权关联规则挖掘

基于apriori算法的兴趣集加权关联规则挖掘

ID:5287916

大小:260.65 KB

页数:4页

时间:2017-12-07

基于apriori算法的兴趣集加权关联规则挖掘_第1页
基于apriori算法的兴趣集加权关联规则挖掘_第2页
基于apriori算法的兴趣集加权关联规则挖掘_第3页
基于apriori算法的兴趣集加权关联规则挖掘_第4页
资源描述:

《基于apriori算法的兴趣集加权关联规则挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2008年l2月北京联合大学学报(臼然科学版)Dec.2oo8第22卷第4期总74期JournalofBeijingUnionUniversity(NaturalSciences)Vo122No.4SumNo.74基于Apriori算法的兴趣集加权关联规则挖掘安颖(1.北京工业大学计算机学院,北京100022;2.北京联合大学旅游学院,北京100101)[摘要]关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算

2、法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此本文提出一种基于兴趣集和权的算法,由用户提出他们感兴趣的项目并在数据库中找出与之相关的项目,通过给每个项目赋以不同权值来标识项目不同的重要性,从而可以挖掘出Apriori算法挖不出但却极具价值的规则。[关键词]数据发掘;关联规则;Apfiori算法;算法改进;加权[中图分类号]TP301.6[文献标识码]DB[文章编号]1005—0310(2008)04—0044—04MiningInter

3、estSetWeightedAssociationRules—BasedonAlgorithmAprioriAN~ing'(1.CollegeofComputerSciencesofBeijingUniversityofTechnology,Beijing100022,China2.InstituteofTourismofBeijingUnionUniversity1(30101,China)Abstract:Miningassociationrules,someinterestingassocia

4、tionsorcorrelationsbetweenitemsamonglargequantityofdatacanbefoundoutandtheyhavemanywideapplicationsinsomefields.Now,lotsofalgorithmshavebeenproposedforfindingtheassociationrules.Mostofthesealgorithmstreateachitemasuniformity.However,inrealapplications,

5、usersaremoreinclinedtoitemstheyaremostinterestedinorfeelmostimportantabout.So,inthispaperweproposedanewalgorithmbasedontheInterest—setandtheweightofitem.TheInteresteditemisproposedbyuserwhoconcernshimselfwithitandthentherelativeitemistobefoundfromdatab

6、ase.WeoffereachitemadifferentweightvalueSOthatitcanrepresenttheimportanceofeachindividualitemfromdatabase.Inthisway,wecangetveryvaluablerulesthatalgorithmApriorican’t.Keywords:datamining;associationrule;apriorialgorithm;algorithmimprovement;weight步是识别所

7、有的频繁项集,记为L,即支持度不小l引言于用户指定的最小支持度的项集,第二步从频繁项关联规则是美国IBMAlmadenResearchCenter集中构造其置信度不低于用户给定置信度的规则。的RakeshAgrawal等人于1993年提出的KDD算法的执行时间主要在第一步,总体性能由第一步(KnowLedgeDiscoverinDatabase)研究中的一个重要决定。为找L,Apfiori使用一种称为逐层搜索的迭课题。最经典的是Agrawal&Srikant1994年提出代方法,首先通过Lk_】与自

8、己连接产生候选K.项集,的一种布尔型数据的关联规则挖掘算法——Apriori记为c,然后通过剪枝,剔除c中非频繁项集,得算法,该算法将关联规则的发现分为两步:第一到L。Apriori算法已证明是在大型数据库中挖掘[收稿日期]2008~05—31[作者简介]安颖(1968一),女,北京市人,北京联合大学旅游学院讲师,在职硕士生,研究方向为数据挖掘。第22卷第4期安颖:基于Apfiofi算法的兴趣集加权关联规则挖掘45关联规则的有效工具,但在实际应用中,还存在不项的集合。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。