基于概念格的规则提取算法研究及改进_赵凯 (1).pdf

基于概念格的规则提取算法研究及改进_赵凯 (1).pdf

ID:58314293

大小:186.50 KB

页数:3页

时间:2020-09-06

基于概念格的规则提取算法研究及改进_赵凯 (1).pdf_第1页
基于概念格的规则提取算法研究及改进_赵凯 (1).pdf_第2页
基于概念格的规则提取算法研究及改进_赵凯 (1).pdf_第3页
资源描述:

《基于概念格的规则提取算法研究及改进_赵凯 (1).pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、科技通报第28卷第2期Vol.28No.22012年2月BULLETINOFSCIENCEANDTECHNOLOGYFeb.2012基于概念格的规则提取算法研究及改进赵凯(淄博职业学院,山东淄博255314)摘要:提出了一个基于概念格的规则算法的改进算法。该算法可以大大提高数据挖掘的效率,提高查找时的速度。关键词:数据挖掘;概念格;算法中图分类号:TP399文献标识码:A文章编号:1001-7119(2012)02-0123-03ConceptLatticebasedRuleExtractionAlgo

2、rithmResearchandImprovementZHAOKai(ZiboVocationalInstitute,Zibo255314,China)Abstract:Thispaperpresentsarulesbasedonconceptlatticealgorithmtoimprovethealgorithm,thisalgorithmcangreatlyimprovetheefficiencyofdatamining,improvethesearchspeed.Keywords:datamin

3、ing;conceptlattice1关联规则挖掘算法对每个规则的支持度和信任度不能很好地支持,只支持满足本身支持度和信任度的相关规则。关联规则挖掘就是从数据库中挖掘出所有的强关2.2算法的描述联规则和数据。它可以分为以下几个问题:S是一个规则集合,F=Xi是闭合集合S中的大部分(1)在事务数据库中找出所有的相关频繁数据项规则闭合子集中的集合。目集。即找出用户指定的最小关联频繁数据项,而且要MaYjmalOenerators(Y,S);不小于指定的项目集。Omax(Y)=ф;(2)在事务数据库找出的频繁

4、数据项目集,经过J=Y-Yj;//集合X中的新项目集一系列动作,产生相关的强关联规则。Forallj∈J//每一个子集项目作为最大生成器maxmaxO(Y)=O(Y)∪{j};2算法改进O1={j

5、j∈Y-J};//剩余的项目集t=1;WhjleOT≠ф2.1算法的提出FORALLO∈OT新的算法相对以前的规则产生集来说,大大减少UJFOYjFORALLYj∈S了规模,并且大大提高了相应的数据挖掘的效率。为了maxmaxO(Y)=O(Y)∪{O};和以前的传统规则的产生集相区别,我们把这个新的Ot=Ot

6、–O;产生集称为组规则产生集。它和传统的提取规则算法//做为下一轮的候选最大生成器相比,由于产生集的规模大大减少了,由此,用户可以A很好地理解相应的规则,更容易推导出其他的新规则,Ot+1={O’=j1…jtjt+1

7、1jt+1,EOj∈Ot,Oj=j1…jj-1jj+1…jt+1}t=t+1;避免了大量的对用户来说无用的新规则的产生,对于创建一个新的概念格,从中取出相应的规则。设定大型的数据库来说,也避免了产生大量的规则产生集。支持度的最小值为A,信任度的最小值为B。但是该算法相对传统规则集来说也有不

8、足,比如新的收稿日期:2011-10-26作者简介:赵凯(1981-),硕士,助教,研究方向:网络数据库。124科技通报第28卷通过取出的规则,创建一个规则的最小集合C。因为num(A2+A1)=num(A),所以说故A2==A1与步骤一:初始化C=0。根据获取的规则数计算求出C==minterion(An)-A1的支持度是一样的,但是信任度所需要的事务节点总数D,把事务节点总数D=n+1,并是不一样的。因此由A==minterion(Bn)+C且把事务节点数存储在创建的最小集合H中。可导出C==min

9、terion(An)-A1,用A2==A1和A2==步骤二:经过计算,求出H中所有的根节点和子节minterion(An)+C就可导出num(A2+A1)=num(A)。点的上级和下级节点中的指针数,然后求出最小指针通过上面的理论证明,同理可得,(A2<=Ai<=An(2<数Fmin和最大指针数Fmax。i

10、推导出来相应的组节点规则。经过计算求出子节点D的外延指数,自定义为q。3.2实例描述根据子节点D的外延指数,直接求出相应的上级把信任度设置为40%,支持度设置为5,创建一个和下级节点的数量,然后存储在最小集合H中。根节点0#,自定义3组数据,例如:(1)4,6,8,2,4,9;(2)根据规则生成一个产生集合相应的节点K和Kn,0,5,3,6,8,4;(3)5,7,8,3,5,1。从第一组数据开始搜他们之间的支持度和信任度都设置为最小,放入集

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。