关联规则经典算法改进及其在商业智能上的应用研究

关联规则经典算法改进及其在商业智能上的应用研究

ID:36471021

大小:1.84 MB

页数:65页

时间:2019-05-11

关联规则经典算法改进及其在商业智能上的应用研究_第1页
关联规则经典算法改进及其在商业智能上的应用研究_第2页
关联规则经典算法改进及其在商业智能上的应用研究_第3页
关联规则经典算法改进及其在商业智能上的应用研究_第4页
关联规则经典算法改进及其在商业智能上的应用研究_第5页
资源描述:

《关联规则经典算法改进及其在商业智能上的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、。。l0钉¨U⑧天洋大謦T1ANJINUNIVERSITY÷目mn第一所^{硕士学位论文学科专业:计算机应用桂术作者姓名:任厚指导教师:孟昭鹏副教授天津大学研究生院中文摘要随着数据库技术的成熟和数据应用的普及,人类积累的数据量正在以指数速度增长。当数据量极度增长时,如果没有有效的方法,由计算机及信息技术来提取有用信息和知识,人们也会感到面对信息海洋像大海捞针一样束手无策。面对这一挑战,数据挖掘技术应运而生。数据挖掘(DataMining,DM)就是从大量的数据中挖掘出入们感兴趣的知识,它是一类深层次的数据分析方法,被认为是解决“数据爆炸知识贫乏”的有效方法之

2、一。最近几年里己被数据库界广泛研究。经过若干年的研究和实践,其经济价值已经显现出来,被广泛应用于科学研究、金融投资、市场营销、保险、医疗卫生、产品制造业、通信网络管理等行业。在整个数据挖掘的研究中,高效率的算法始终占有特别重要的地位。由于数据挖掘面对的是大量的数据集,因此算法的效率将对其应用起关键的作用。现有的算法总有着这样或那样难以克服的局限性。鉴于此,本文着重对关联规则挖掘算法进行了研究。在研究经典Apriori算法的基础上,给出了一个新的算法,分别从减小时间消耗和有效挖掘小概率重要规则两个方面对Apriori算法进行了改进:一方面,针对Apriori生

3、成的潜在频繁项目集规模过大,新算法尽量减小潜在2项集的规模,使之尽可能的接近频繁2项集,大大缩短了时间消耗;另一方面,针对数据库中项目分布不均匀,出现概率相差较大,所挖掘出的关联规则将可能涉及不到出现频率较低的项目的问题,通过给他们赋以不同权值,区别对待数据库中的每个项目,从而可以挖掘出Apriori挖不出但却极具价值的规则。经过改进,新算法在时间上的消耗明显少于Apriori算法,大大提高了算法的效率;同时,由于加入权值,使得算法能够挖掘出隐藏在小概率事件后的关联规则,这些规则恰恰是一般改进算法易于丢弃或挖掘不出的。基于此,算法将会在诸如旅行社发掘新的线路

4、,银行发掘新的留学贷款项目等商业智能应用中起到重要作用。关键词:数据挖掘关联规则Apriori算法加权商业智能ABSTRACTAsthedevelopmentoftheDatabasetechnologyalebecomingmorematttreandwidespread,theamountofdatawhichpeoplecollectedisgrowinginexponentialspeed.Whentheamountofdatagrowsextremely,wewillfeellostinfrontoftheinformation∞aifWedon’

5、thavealleffectivemethod.withthehelpofcomputertodistillusefulinformationsandknowledges.TocopingwimthisehaUenge.DataMiningtechnologyisgivenbirth.DataMining(DM)isdefindedasminingknowledgesthatpeoplegetinterestedfrommassdata.Itisonekindofdataanalyzingmethodindeeplevel.whielahasbeencons

6、idered勰a11.effectivewaytosolveSOcalled‘"Dataexplodesbutka’_owledgelacks'’problem.Inrecentyears,ithasbeenresearchingalloverthedatabaseworld.Afterpracticesandresearchesofseveralyears,itseconomicvaluehasshownIlpandhasbeenlargelyappliedinscientificresearches,financialinvestments,market

7、ing,insurance,medicine,productionandmanagementofcommunicationnetworks.HighlyeffectiveminingarithmetichasalwaysbeenputOnanimportantplacethroughthewholedataminingresearch.Aswefaceame鼯ofdatasets.theefficiencyofthearithmeticisthekey.ButwhatWehavenOWhavealwaysdrawbackshereandthere,andbe

8、causeofthat,thisarticleput

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。