一种关联规则更新算法

一种关联规则更新算法

ID:34442457

大小:245.92 KB

页数:4页

时间:2019-03-06

一种关联规则更新算法_第1页
一种关联规则更新算法_第2页
一种关联规则更新算法_第3页
一种关联规则更新算法_第4页
资源描述:

《一种关联规则更新算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第18卷第1期电脑与信息技术V0I.18No.12010年2月ComputerandInformationTechnologyFeb.2010文章编号:1005—1228(2010)O1—00O4—04一种关联规则更新算法张泳涛,张刚华(中南大学数学科学与计算技术学院,长沙410075)摘要:针对数据库数据同时删减和增加,文章分阶段解决了关联规则的维护更新问题,其中通过改进PFuP算法,解决了频繁新项集的问题。关键词:关联规则;频繁项目集;频繁新项集中图分类号:TP301.6文献标识码:AImprovedUpdatingAlgorithmforAssc

2、iationRulesZHANGYong—tao,ZHANGGang—hua(SchoolofMathematicalandComputingThechnology,CentralSouthUniversity,Changsha410075,China)Abstract:Forthecaseofdatasubtractionandadditionsimultaneousindatabase,thispaperdealswiththemaintenanceupdateproblemofassociationrulesbysteps.anditsolves

3、theproblemoffrequentnewitemsetsbyimprovingPFU_Palgorithm.Keywords:associationroles;frequentitemsets;frequentnewitemsetsAgrawal等人于1993年提出了挖掘顾客交易数据新挖掘一次,此法虽然简单,但有着明显的不足:所有库中项目集问的关联规则问题【”,之后研究人员对该问的频繁项目集要重新通过计算获取,之前的工作成果题作了大量的研究,提出了很多挖掘算法12-3],如Apriori、都浪费了。FUP算法是解决关联规则增量更新问题的FP—Tr

4、ee等,但这些算法都是针对静态的数据,而实际经典算法,但其存在着些许不足:用来产生C5,因应用中数据库数据是在不断地更新的,这就要求寻找此产生的d的候选项目集很大,而且其中很多是非频算法来维护和更新已有的规则。不少学者对于关联规繁的,甚至有些在d中根本不可能出现,这影响了算法则更新问题进行了研究,如Cheung等提出了FUP{4],倪的效率[61。黄德才等人于文献【6冲提出了关联规则的更志伟等提出了IBUMt~,这些更新算法虽然可以对更新新算法PFUP,用d中的k—l阶强频繁项目集附来问题进行有效的处理,但没有考虑到数据库数据的删产生,大大减少了d中k

5、阶候选项目集的数量。减,也没有对新增数据中的频繁项目做分类处理。实际应用中,有时会涉及到数据库数据的删减和本文在最小支持度和最小置信度不变、数据库数增加,由FUP和PFUP算法我们得知,原数据库数据D据同时删减和增加的情况下,提出算法分两个阶段处的数据更新,会使D的频繁项目集LD中某些元素失去理关联规则的维护更新问题,其中通过改进PFUP算频繁性,同时D中某些非频繁项目集将获得频繁性,法,从新增数据中的频繁项目集提取出频繁新项集,从对原数据库D的数据删减,也会出现这两种可能性。而提高了关联规则挖掘的效率。对于新增数据集中的新增项目i。,由于不包含在D中

6、,因新增数据集d=(D—d一),即使包含i。的项目集在d1关联规则更新问题中为频繁项目集,该频繁项目集被挖掘出的可能性也给定数据库D,删减数据库d一和新增数据库d,微乎其微,但我们不可否认这些频繁项目集的重要性,显然有d—CD。本文主要考虑最小支持度和最小置信因而应该想办法将它们挖掘出来。PFUP算法只考虑到度不变时,新数据库(D—d-+d+)中关联规则的更新问数据增加的情况,同时可能漏掉新增数据库中包含i。题。对于这一问题,最直接的办法就是对(D—d一+d+)重的频繁项目集,这些减弱了其在关联规则挖掘中的适收稿日期:2009—10—29作者简介:张泳

7、涛(1985一),男,硕士研究生,山东单县人,研究方向:数据挖掘;张刚华(1983一),男,硕士研究生,湖南新宁人,研究方向:数据分析。第18卷第1期张泳涛等:一种关联规则更新算法用性和高效性。根据定理2,情况(I)中的X为D一中的非频繁项根据上述分析对(D—d一+d+)的挖掘分为两个阶段:目集;根据定理l,情况(4)中的x在D一中仍为频繁项数据删减阶段和数据增加阶段。前者根据原数据库D集;情况(2)和(3)就不确定了:对于(2)LD中某些项集和删减数据库d一,通过算法得到(D—d一)中的频繁项目可能在D一中失去频繁性,对于(3)D中某些非频繁项集合;

8、后者对算法PFuP略作改进,根据上一阶段的基集x可能获得频繁性。础上,得到最终结果。针对上述分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。