基于无向图的关联规则算法的研究与应用

基于无向图的关联规则算法的研究与应用

ID:33407373

大小:3.36 MB

页数:59页

时间:2019-02-25

基于无向图的关联规则算法的研究与应用_第1页
基于无向图的关联规则算法的研究与应用_第2页
基于无向图的关联规则算法的研究与应用_第3页
基于无向图的关联规则算法的研究与应用_第4页
基于无向图的关联规则算法的研究与应用_第5页
资源描述:

《基于无向图的关联规则算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:UDC:7IP30I.6密级:Y1404821学校代号:10150学号:20052184峡童交道文挚硕士学位论文基于无向图的关联规则算法的研究与应用ResearchandApplicationofAssociationRulesAlgorithmbasedonUndirectedGraph学生姓名:导师及职称:学科门类:专业名称:研究方向:申请学位级别:论文答辩日期:学位授予单位:王亚伟田宏副教授工学计算机应用技术数据仓库和数据挖掘硕士大连交通大学摘要摘要近年来,数据挖掘(DataMining,简称DM)技术的发展已经引起了信息产业界的广泛关注,这是快速增长的数据量和日益贫乏

2、的信息量之间矛盾运动的必然结果。对数据挖掘技术进行深入细致的研究是全球信息化发展的客观要求。数据挖掘是数据库中知识发现(KnowledgeDiscoveryinDatabases,简称KDD)的核心步骤,是指从大型的数据库中发现潜在的、新颖的、有价值的、可用的、能被用户理解的模式和信息的过程。关联规则挖掘是数据挖掘的一个重要研究领域,有着极其重要的应用价值。关联规则挖掘的目的是寻找在大量的数据项中隐藏着的联系或者相关性,既数据库中的知识模式。本文在广泛阅读了国内外文献的基础之上,提出了一种新的基于无向图的关联规则最大频繁项集挖掘算法以及对挖掘出的关联规则进行聚类的研究。本文的创新点主

3、要有以下两个方面:(1)为了挖掘事务数据库中局部关联性比较强的频繁项集,提出基于无向图的关联规则最大频繁项集挖掘算法。首先将事务数据库由横向转为纵向,将其保存到一个邻接矩阵中,其中边的权值表示任意二项集的支持度。然后,基于边的权值将整个无项完全图拆分成若干完全子图。最后采用自底向上和自顶向下两种策略来挖掘频繁项集,根据不同的最小支持度阀值比较两种策略的效率。实验结果表明,在支持度阀值比较低的时候,本文提出的挖掘算法效率非常高。(2)为了从大量的规则中识别出有用的信息,必须对规则进行处理,删除冗余的规则或对规则进行聚类或二者同时进行。本文提出一种改进的规则之间的距离定义方法,基于此定义

4、对关联规则进行聚类。首先确定项与项之间的距离,然后依据项与项的距离得出规则之间的距离,最后基于此距离结合DBSCAN算法的思想对关联规则进行聚类。分析了聚类结果的合理性,并准确发现了孤立规则。针对本文提出的算法编写程序,对来源于UCI数据源的数据集进行验证,实验结果表明算法是高效的和实用的。关键词:数据挖掘;关联规则;频繁项集;无向图;聚类大连交通大学工学硕十学何论文AbstractInrecentyears.thedevelopingofDataMiningtechniqueshasbeenpaidwidelyattentionbyinformationindustries.whi

5、chiSthenecessaryresultoftheconflictingmovementbetweentherapid.increasingdataandthelackingofinformationincreasingly.Deepresearchingofthedataminingtechniquesisanobjectiverequirementinthedevelopingoftheglobalinformation.Datamining,thekeystepofKnowledgeDiscoveryinDatabases,iStheprocessofdiscovering

6、implicit,nontrivial,perviousunknownandpotentiallyusefulinformationfromdatabases.AssociationrulesminingiS觚importantfieldindataminingandhasimportantapplicationsindatabase.Successfulapplicationsofassociationrulesmininghavebeendemonstratedinmarketing,business,medicalanalysis,productcontrol,engineer

7、ingdesignandscientificexploration.ThemainpurposeofminingassociationrulesiStofindtheconnectionsorcorrelationshiddeninenormousitemswhicharealSOcalledknowledgepauemsindatabase.AnewalgorithmbasedonundirectedgraphiSproposedinthispaper.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。