数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料

数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料

ID:8176985

大小:9.62 MB

页数:62页

时间:2018-03-09

数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料_第1页
数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料_第2页
数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料_第3页
数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料_第4页
数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料_第5页
资源描述:

《数据挖掘中关联规则算法及应用的研究_数学_自然科学_专业资料》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、安徽理工大学硕士学位论文数据挖掘中关联规则算法及应用的研究姓名:刘芳申请学位级别:硕士专业:计算机应用技术指导教师:陆奎20100601摘要摘要如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重要的作用。本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其次,论文通过

2、指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此,本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成厶和厶,打破了Apriori算法生成厶的固有模式;然后在证明结论“厶一,生成G的连接步可用厶一,∞厶来代替厶一。ooL,.."成立的基础上,再来改进k-候选集的集合Cr(k≥3)的生成算法。所以,综合上述工作本论文提出了Apriori算法的改进算法BMSLApriori算法(BooleanMatrixSimplifiedLinked算法)。首先通过对.Apriori

3、BMSLApriori算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后,我们又通过具体的实验进一步证明了BMSLApriori算法的效率确实优于Apriori算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的部分数据,论文采用MicrosoftSQLServer2005和VB.NET作为开发平台来构建一个简单的关联规则挖掘系统,将BMSL算法应用到关联规则的生成中,.Apriori通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖掘效

4、果。图[24】表[4】参【60】关键词:数据挖掘;关联规则;Apriori;FP—growth;BMSL_Apriori分类号:520.60;摘要Abs仃actNowadays,thecapacityofpeopletograspthedataisrising.FacingSOmassdata,peoplemoreconcerntheveryimportantinformationhiddeninthedatathanthedataitself.DataMiningmeetsourrequirment,anditisausefultooltohelpusfmdtheim

5、portantknowledgefromthedata.AssociationRulesareimportantbranchofDataMimng,andexcavatingAssociationRulesofthelargeservicesDatabaseplaysallimportantpartinthesolvingofactualproblemsofdifferentdomain.ThepapermainlydiscussesAssociationRulesalgorithmanditsapplication.First,thepapersysmatically

6、describestherelatedtheoryknowledgeofDataMiningandAssociationRulesinordertolaythefoundationforresearchcontent.Second,itindicatesthedeficiencyofApriorialgorithm,thatrepeatedlySCanSDatabaseandmaygeneratehugecandidatesets,andthenwecanfmdtheentrancetonewalgorithm.So,thepapermakesthefollowingi

7、mprovementtoapriorialgorithm:first,itgets厶and厶fromtheperspectiveofDatabaseBooleanMatrix,breakingthenaturalmodeof厶generationinapriori;andthenitimprovesthegenerationalgorithmofG(k≥3)byprovingconclusion,that厶一l吗cantaketheplaceof厶一l鸣一1togetG.So,weproposetheimprovedalgorithm,B

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。