时态关联规则挖掘方法的研究

时态关联规则挖掘方法的研究

ID:46858228

大小:117.50 KB

页数:6页

时间:2019-11-28

时态关联规则挖掘方法的研究_第1页
时态关联规则挖掘方法的研究_第2页
时态关联规则挖掘方法的研究_第3页
时态关联规则挖掘方法的研究_第4页
时态关联规则挖掘方法的研究_第5页
资源描述:

《时态关联规则挖掘方法的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第27卷第6期计算机工程与设计2006年3月V01.27No.6ComputerEngineeringandDesignMar.2006时态关联规则挖掘方法的研究贾伟,郭红丽(山西财经大学信息管理学院,山西太原030006)摘要:利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加冇利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对彖,即考虑各类项口交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。关键词:时态关联规则;静态关联规则;数据挖掘;算法;项

2、目中图法分类号:TP301.6文献标识码:A文章编号:1000—7024(2006)06.0988.02ResearchondataminingalgorithmofadynamicassociationruleJIAW萌.GUOHong一1i(CollegeofInformationManagement,ShanxiUniversityofFinanceandEconomics,Taiyuan030006,China)Abstract:Aseriesofcorrelationitemseionru1es,anpproachthatjectch

3、angeoresented.Andexhibitiontakesasitftransactiitsexpresandsproconseasionp1es1eandoringasingobsarepa1gorithmarediscussed.Keywordstisobtainedbyana1ys•1ngdynamicaCia1tionru1eS0ast0provideassisteandsupP0rtf0rmakingdec•1sion.Ba0nstudy0ftradit•10na1stat•1cass0cssoancsediatsociatio

4、nrule;staticassociationru1e;datamining;algorithm;item0弓

5、言关联规则是数据挖掘的一个重要研究内容,近年来对关联规则挖掘的探讨也成为热门的研究领域,但大都没有考虑数据库中所包含的时态语义“1,因而可称之为传统的或静态的关联规则。与此同吋,考虑吋态数据特性的有关吋态关联规则的研究口前仍停留在表述阶段,对具具体实现还没有展开讨论。本文在叶瑾等人2002年统计关联规则挖掘方法SMAR的基础上,提出了一•种新的时态关联规则,并对其表述形式及相应的挖掘算法进行了探讨,从而将对时态关联规则的研究从表述到实

6、现推进了一步。1问题描述传统的关联规则所表述的关联性类似于“如果A发生,那么B也将以P%的概率发生匕而对于两类事件变化的联动性如“如果月的规模发生变化,那么匕1的规模将以P%的概率发生相应的变化,呗J没有涉及。但是在实际的应用小,大型数据仓库小往往包含有时态信息,例如企业的销售数据库,由于其小的业务种类较多,并且在各时段的变动状况也很显著,因此可以对业务之间的动态关联性进行分析,即判断一种业务销售的增长或减少是否会对别的业务造成影响,以及造成什么样的影响。这一类分析结果可以为营销决策等提供支持,例如通过时态关联规则挖掘,若发现两类业务的销售量变

7、动具有正相关性,为了促进这两类业务的销量增长,就可以选择其小促销成本较低的一类业务,对其加大促销力度,从而实现两者共同增长的口的。上述问题可以借助于时态关联规则来实现。时态关联规则涉及的类型较多,本文探讨的只是其中的一种。2时态关联规则的表述形式与传统的关联规则的形式和似,但时态关联规则主要体现了一种变动性。在这里,设卢{f。,i2,…,9是总的项口集,/9=—{兀,乃,…,瓦)是总的交易集(称之为交易数据库)。D中的每项交易乃庐1,2,功包括交易时间、项口利啖和交易量等信息。DR=豫。,R:,…,凡)称为变动数据库,其中马(『一1,2,M表示

8、每个交易时段所有项目交易增长率的集合。进而有Dr=(SI,&,.・.,爵)可称为关联变动数据库,其中S(『一1,2,“,IV)表示每个交易吋段由交易量增长情况相近的两两项口(项口对)组成的集合。时态关联规则的挖掘正是基于DR与Dr进行的。定义1对于一个项目对j={f。,f2),如果seS,称交易时段S支持项口对s;如果D,屮有p%的交易时段支持项目对s,称项目对S具有大小为p的支持度。由项目对概念可以延伸出包含3个元素的项目集J={“i2,i,)乃至更多个元素的项目集。定义2如果项目集s的任意项目对subsGS,称交易时段S支持项目集J。同样,

9、如果D,中有p%的交易时段支持项目集J,称项目集S具有大小为P的支持度。与传统的“支持”概念相比,这里强调项口集的任意子项收稿H期:2005一01—0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。