基于动态支持度的流数据关联规则挖掘

基于动态支持度的流数据关联规则挖掘

ID:12040615

大小:1.35 MB

页数:74页

时间:2018-07-15

基于动态支持度的流数据关联规则挖掘_第1页
基于动态支持度的流数据关联规则挖掘_第2页
基于动态支持度的流数据关联规则挖掘_第3页
基于动态支持度的流数据关联规则挖掘_第4页
基于动态支持度的流数据关联规则挖掘_第5页
资源描述:

《基于动态支持度的流数据关联规则挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、硕士学位论文基于动态支持度的流数据关联规则挖掘STREAMDATAASSOCIATIONRULESMININGBASEDONTHEDYNAMICSUPPORT王中义哈尔滨工业大学2014年12月国内图书分类号:TP399.国际图书分类号:621.3学校代码:10213密级:公开工学硕士学位论文基于动态支持度的流数据关联规则挖掘硕士研究生王中义导师张春慨副教授申请学位工学硕士学科计算机科学与技术所在单位答辩日期授予学位单位深圳研究生院2014,12哈尔滨工业大学ClassifiedIndex:TP399U.D.C:621.3Dissert

2、ationfortheMaster’sDegreeinEngineeringSTREAMDATAASSOCIATIONRULESMININGBASEDONTHEDYNAMICSUPPORTCandidate:Supervisor:AcademicDegreeAppliedfor:Speciality:Affiliation:DateofDefence:ZhongYiWangAssociateProf.ChunkaiZhangMasterofEngineeringComputerScienceandTechnologyShenzhenGraduateS

3、choolDec.2014Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要流数据存在于工业生产、生活活动、商业交易等领域,与人们的生活、生产等息息相关,因此对流数据的研究是十分有意义的。流数据挖掘的主要方向之一是在其上挖掘关联规则。流数据关联规则的挖掘可以挖掘到不同数据流间的相关关系。由于流数据的自身特性:大量性、流动性、不可预知性等,随着时间的变化,数据流所蕴含的知识也在不断的更新,因此流数据对数据挖掘算法提出了很高的要求。人们大多情况下对最新的数据

4、所蕴藏的知识更感兴趣,并且我们更关心发生在不同时间段之间的关联规则,因此本文提出了搜寻最优支持度的跨事务间关联规则的挖掘方法。目前学界已经对关联规则有了很深入的研究了,研究方向也分许多方面,这些研究由于方法不同所以挖掘出的知识也不尽相同,但是大部分算法都找到了事务内关联规则,在挖掘事务间的关联规则方面做出特别深入的研究是很少,且这些算法都是基于人为主观设置最小支持度阈值的。本文首先利用滑动窗口对数据进行了限制,然后对流数据进行预处理。在预处理的过程中利用了线性化拟合的方法降低了数据量,最后在预处理的结尾本文提出了分组大事务的方法来生成跨事务间数据集。在

5、挖掘关联规则过程中本文根据关联规则的挖掘算法FP-growth提出了ITF-tree算法。随着时间的增加数据量会一直增多,但是一般情况下人们对历史数据的关注度会低于对最近生成的数据,因此本文利用了数据衰减的概念,从而降低历史数据对当前挖掘结果的影响程度。由于人为的设置最小支持度阈值可能会带来许多问题,因此本文提出了一个搜寻最小支持度阈值的方法。通过与已有算法在热电厂数据集上进行了对比试验,表明本文所提出的方法是有效的。在时间效率上可以较好的满足流数据的要求,同时可以挖掘到有效的跨事务关联规则。关键词:流数据;关联规则;跨事务;支持度阈值I哈尔滨工业大学

6、工学硕士学位论文AbstractTherearesomefieldsthatgeneratestreamdata,suchasindustrialproduction,lifeactivities,businesstransactionsandsoon.Itiscloselyrelatedtolife,production.Soitisveryimportanttostudythemultipledatastream.Associationrulesminingundermultipledatastreamisamajoraspectofstreamd

7、atamining.Streamdataassociationrulesminingcanfindtherelationshipbetweendifferentstreams.Characteristicsofthestreamdatainclude:massive,flowingandunpredictable,withthechangeoftime,thedatastreamcontainsknowledgeisconstantlyupdated,soitisdifficulttoworkonthestreamdata.Mostofthetimet

8、hepeopleismoreinterestedintheknowledgebeingcont

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。