基于关联规则数据挖掘算法研究

基于关联规则数据挖掘算法研究

ID:34551244

大小:3.80 MB

页数:57页

时间:2019-03-07

基于关联规则数据挖掘算法研究_第1页
基于关联规则数据挖掘算法研究_第2页
基于关联规则数据挖掘算法研究_第3页
基于关联规则数据挖掘算法研究_第4页
基于关联规则数据挖掘算法研究_第5页
资源描述:

《基于关联规则数据挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要数据挖掘或知识发现是用于数据分析和理解、揭示数据内部知识的技术,在最近几年里已被广泛的研究,其中关联规则是数据挖掘的一个重要的问题。关联规则的挖掘必须经过概念提出、概念接受、广泛研究和探索、逐步应用和大量应用等阶段。目前,关联规则的基本概念和研究方法趋于清晰,它的研究正向着更深入的方向发展,大部分学者认为它的研究仍然处于广泛研究和探索阶段,迫切需要在基础理论、应用模式、以及挖掘算法等方面进行创新。同时,关联规则挖掘需要在挖掘效率、可用性、精确性等方面得到提升。因此,研究者需要探索新的关联规则挖掘理论和模型,需要对

2、一些传统的算法进行改进;也需要研究新的更有效的算法等。鉴于目前数据挖掘技术和关联规则挖掘研究现状和发展趋势选择了这一课题开展相关工作。在关联规则理论方面,对关联规则的基本概念,关联规则的典型算法,及其算法研究新进展进行了全面地分类、归纳和总结,同时也针对各类算法的实用条件,算法间的差别进行了客观地比较。在关联规则挖掘算法方面,针对大数据集挖掘过程中对内存和CPU等系统资源要求较高的情况,在关联规则挖掘前提出以二进制序列集来组织数据,提高整个关联规则挖掘中项目集的存储效率;在关联规则挖掘方面提出两种数据结构构造算法,二

3、进制序列密集树算法和频繁模式树的正负关联规则挖掘算法,前者首先是对数据进行压缩,把较大的事务数据集聚为一个相对较小的数据结构,用以计算二项集的支持度和致信度;然后在二进制频繁项集树上,利用二项集的支持度和致信度信息从树的项层直至底层构造频繁项集,进而挖掘出所有的关联规则;同时为避免单一挖掘正关联规则的局限性,提出基于频繁模式树的正负关联规则挖掘算法,.该算法将事务数据库中出现的正项目和隐含的负项目进行处理,打破了先挖掘正关联规则,其次再挖掘负关联规则这种单一的挖掘模式。这两种数据结构算法只需一次扫描整个数据库而且不产

4、生侯选集就可以从数据库中挖掘所有的正,负关联规则,大大的提高了运算的效率。试验结果表明,该算法在挖掘效率、可用性,算法扩展性方面有较好的性能。该算法对数据挖掘的作用来说,具有一定的实用价值,一方面,它可以给研究数据挖掘关联规则的科研人员提供思路,供科研人员参考;另一方面,如果将其整合到其它现有的数据挖掘工具中,可以大大提高算法的实用价值。关键词:数据挖掘;关联规则;二进制序列密集树;频繁模式树;正负关联规则AbstractDataMiningorKnowledgeDiscoveryingisatechnologyus

5、edindataanalysis,dataundcrstanding,discovery/ngknowledgecontainedinthedata.Ithasbeenresearchedwidelyinrecentyears.Associationrulesisanimportantquestionindatamining,whichmustexperienceconception’bringingforward,conception’acceptance,extensiveresearchandexplorati

6、on,gradualapplicationandsubstantiveapplication.Atpresent,thebasicconceptionandresearchmeasuresofassociationrulesalebecomingmuchcleareranddevelopingtowardsdeeperdirection.Fromcurrentsituation,themostofscholarsthinkthattheresearchofassociationrulesisstillinaphase

7、ofextensiveresearchandexploration.needsmoreinnovationinbasicaltheories,applicationmodelsandminingalgorithm.Meanwhile,associationrulesneedstobeimprovedinminingefficiency,usability,accuracy.Hence,researchersneedexplorenewminingtheoriesandmodels,improvetraditional

8、algorithm,studynewefficientalgorithm.Withregardtothecurrentsituationaswellasdevelopmentofdataminingandassociationrules,Iselectthistopictocarryoutcorrelativework.Inassociatio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。