最小冗余的无损关联规则集表述

最小冗余的无损关联规则集表述

ID:5296357

大小:840.51 KB

页数:7页

时间:2017-12-07

最小冗余的无损关联规则集表述_第1页
最小冗余的无损关联规则集表述_第2页
最小冗余的无损关联规则集表述_第3页
最小冗余的无损关联规则集表述_第4页
最小冗余的无损关联规则集表述_第5页
资源描述:

《最小冗余的无损关联规则集表述》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第34卷第12期自动化学报Vol.34,No.122008年12月ACTAAUTOMATICASINICADecember,2008最小冗余的无损关联规则集表述陈茵1闪四清1刘鲁1李岩1摘要传统关联规则挖掘得到的原始规则集包含大量的、杂乱的规则,其中很多是冗余的,这样的规则集难以被用户理解和应用.针对这一问题,探讨了原始规则集与规则集表述之间的关系,提出了一个新的规则集表述模型.该模型包含一个利用概率统计原理构建的推演系统,能够从原始规则集中去除冗余规则,得到无损的规则集表述.这种规则集表述比原始规则集更简洁、更易于

2、理解以及更便于用户管理和应用.更重要的是,该模型得到的规则集表述是无损的,能够实现原始规则集和规则集表述之间的相互推演,保证了信息的完整性.在四个著名数据集上进行的实验表明,规则集表述中的规则数量显著减少.关键词关联规则,冗余规则,规则集表述,无损性中图分类号TP311.13Minimum-redundantandLosslessAssociationRule-setRepresentation1111CHENYinSHANSi-QingLIULuLIYanAbstractThereareexcessiveandun

3、orderlyrulesproducedbytraditionalassociationrulemining,manyofwhichareredundant.Itisdi±cultforuserstounderstandanduse.Tosolvethisproblem,therelationshipbetweentheoriginalrule-setandtherule-setrepresentationwasdiscussedandanewmodelwasrepresented.Thenewmodelcontai

4、nedaninferencesystemestablishedwithstatisticstogetminimum-redundantandlosslessrule-setrepresentationbygettingridofredundantrules.Thisminimum-redundantandlosslessrules-setrepresentationismoreconcise,moreintelligible,andeasiertomanageanduse.Especially,therule-set

5、islosslesssothatitisabletoswitchtotheoriginalrule-set.Itissoimportantbecausetheswitchingkeepsthecompletenessofrule-setrepresentation.Experimentswithfourdatasetsshowthatthenumberofrulesintherule-setrepresentationisreducedgreatly.KeywordsAssociationrules,redundan

6、trules,rules-setrepresentation,lossless关联规则是数据挖掘的主要技术之一,在零规则r表示为X!Y,X称作规则的前件(前提),售、保险、银行等行业中得到了广泛的运用.它最Y称作规则的后件(结果).support(X!Y)称早由Agrawal于1993年提出,目的是在交易数据为关联规则X!Y的支持度,support(X!Y)库中发现各项目之间的关系[1].设D是来自于交=support(X[Y).confidence(X!Y)称为易数据库的事务集,D=ft1;t2;¢¢¢;tng,事

7、务tk关联规则X!Y的置信度,confidence(X!=fi1,i2,¢¢¢;ipg(p=1;2;¢¢¢;n),tk中的元素Y)=support(X!Y)=support(X)£100%.ij(j=1;2;¢¢¢;p)称为项目(Item).设I=fi1,给定一个支持度阈值minsupport和一个置i2,¢¢¢;img是D中所有不同项目的集合,I的任信度阈值minconfidence,如果support(X!何非空子集X称为D中的项集(Itemset).如果Y)¸minsupport且confidence(X!Y)

8、¸X中包含的项目个数为k,表示为kXk=k,则minconfidence,则称X!Y为强规则.关联规称X是一个k项集.关联规则挖掘通过两个度则的任务是从交易数据库中找到用户感兴趣的强规量,即支持度和置信度来得到.如果包含X的事则.务数为s,事务总数为d,定义项集X的支持度传统的挖掘模型挖掘出来的规则往往是海量的,support(X)=s=d£1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。