基于极团模式的关联规则挖掘算法的研究

基于极团模式的关联规则挖掘算法的研究

ID:33185824

大小:1.25 MB

页数:56页

时间:2019-02-21

基于极团模式的关联规则挖掘算法的研究_第1页
基于极团模式的关联规则挖掘算法的研究_第2页
基于极团模式的关联规则挖掘算法的研究_第3页
基于极团模式的关联规则挖掘算法的研究_第4页
基于极团模式的关联规则挖掘算法的研究_第5页
资源描述:

《基于极团模式的关联规则挖掘算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士硕士学位陈论文一心基于极团模式的关联规则基于极挖掘算法的研究团模式的关联规则挖陈一心掘算法的研究2014二○一四年六月分类号密级UDC硕士学位论文基于极团模式的关联规则挖掘算法的研究陈一心学科专业计算机应用技术指导教师杨磊研究员杨颖教授论文答辩日期2014年5月22日学位授予日期答辩委员会主席陈友初教授级高工广西大学学位论文原创性和使用授权声明本人声明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用

2、过的材料。与我一同工作的同事对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属广西大学。本人授权广西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:□保密,在年解密后适用授权。□不保密。(请在以上相应方框内打“√”)论文作者签名:日期:指导教师签名:日期作者联系电话:电子邮箱:基于极团模式的关联

3、规则挖掘算法的研究摘要关联规则是数据挖掘研究的一个重要内容,通过采用支持度和置信度去除非频繁项获得目标关联规则。对支持度分布严重倾斜的数据集挖掘时,传统的频繁项集挖掘算法不能有效适用于一些重要的挖掘任务,支持度阈值很难确定,过高则会有置信度较高的规则遗漏,过低则会得到大量可信度较低的冗余规则。挖掘关联规则效率和准确性,是数据挖掘研究的重点。极大团是无向图G最大的全连通分量,旨在将关联性强、可能产生极大频繁项的项集生成极大团,之后再针对每一个极大团求解极大频繁项集。并快速产生所有可靠关联规则,提高时间效率。本文通过对经典算法APriori算法和FP-grow

4、th算法的工作原理和机制以及极大团算法等理论进行深入研究,总结它们的优缺点。在此基础上,针对目前关联规则存在的问题展开研究,主要的研究工作如下:1.针对挖掘项目支持度不均匀分布的数据集很难设置合适的支持度阈值的问题,提出了基于极大团的加权可信关联规则算法MCWCAR(MaximumCliqueWeightedCredibleAssociationRule)。通过定义加权可信关联规则和2-项加权可信集的基本概念,并利用2-项邻接矩阵来产生2-项加权可信集,得到对应的稀疏图;对于由稀疏图求出的每个连通分量,由前k1个顶点构成所有极大团,再将第k个顶点加入(k

5、1)-极大团中,得到k-项加权可信集,完成极大团的加权可信关联规则挖掘过程。以解决不均匀I分布的数据集难设置合适的支持度阈值的问题,并避免多次扫描数据库和频繁生成模式树,减少项集支持度的计算量。最后通过实验验证所提出的算法MCWCAR比传统算法在挖掘关联规则的时间性能和准确性具有更高的效率。2.针对目前数据挖掘中存在对长模式挖掘效率低和挖掘方式不完整等问题,提出基于动态图的Top-N极团模式挖掘算法CSDGMPA(CliqueSearchWithDynamicUpdateOfGraphBasedMaximumPatternMiningAlgorithm)

6、。算法在提出2个剪枝规则的基础上,通过剪枝无效团和扩展团两个阶段精确地识别TopN极大团,最后采用深度优先分支定界的算法寻找长度为TopN的极大模式。所提出的算法能在基于K-项模式图构建的图中发现以团的形式出现的目标模式。随着图表动态地稀疏化,使得寻找团的过程更加高效,优化了搜索过程,提高剪枝准确性。最后,通过仿真实验,将CSDGMPA算法和传统算法MAXIA和LCM进行对比,验证了CSDGMPA算法在时间花销等方面的优越性。关键字:加权可信关联规则;极大团;模式图;TopN极大模式IISTUDYONASSOCIATIONRULEMININGALGO

7、RITHMBASEDONTHEPATTERNOFPOLARCLIQUEABSTRACTAssociationruleminingisoneoftheimportantresearchcontentsinthefieldofdatamining,throughtheadoptionofsupportdegreeandconfidencetoremovetheinfrequentitemsandobtaintheobjectassociationrule.Intermofthedatasetminingdistributedwithsevereinclinat

8、ion,thetraditionalfrequentitemset

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。