基于可变滑动窗口的数据流闭合频繁模式挖掘研究

基于可变滑动窗口的数据流闭合频繁模式挖掘研究

ID:23458803

大小:1.38 MB

页数:75页

时间:2018-11-08

基于可变滑动窗口的数据流闭合频繁模式挖掘研究_第1页
基于可变滑动窗口的数据流闭合频繁模式挖掘研究_第2页
基于可变滑动窗口的数据流闭合频繁模式挖掘研究_第3页
基于可变滑动窗口的数据流闭合频繁模式挖掘研究_第4页
基于可变滑动窗口的数据流闭合频繁模式挖掘研究_第5页
资源描述:

《基于可变滑动窗口的数据流闭合频繁模式挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江苏科技大学硕士学位论文基于可变滑动窗口的数据流闭合频繁模式挖掘研究姓名:范玉玲申请学位级别:硕士专业:计算机软件与理论指导教师:苏勇2011-03-09摘要摘要数据流频繁闭合模式的挖掘技术应用的普遍性,使得数据流频繁闭合模式挖掘技术的研究受到越来越广泛的重视,特别是在商务决策、知识库方面发挥着很大的作用。由于数据流自身高速、海量、多变、无限等特点,使数据流挖掘遭遇了很大的挑战。一些研究学者采用数据结构存储数据量中的所有项集,滑动窗口机制来挖掘,提出基于滑动窗口的闭合频繁模式挖掘的多种算法,在数据流挖掘领域取得了很大进展。但是这些基于滑动窗口机制的数据流频繁闭合模式挖掘的

2、算法中,由于较多地考虑快速且精确的效果,而较少考虑数据流的时变特性,因此数据流挖掘算法多是在等速的理想数据流环境中的研究,而现实生活中的数据往往不是等速的,研究结果与实际应用的差距给数据流挖掘的研究带来了新的问题。为了寻求解决数据流挖掘中的这些新问题的方法,本文提出可变滑动窗口数据流频繁闭合模式挖掘算法,主要是针对不等速数据流的挖掘算法。这对数据流挖掘算法的实际应用价值方面具有重要意义。为了更好的挖掘不等速数据流,文中首先对数据流,数据流处理系统,数据流 频繁模式挖掘及数据流频繁闭合模式挖掘的相关理论性质和挖掘技术进行了深入的 理解。其次在对各种数据流频繁闭合模式挖掘的概

3、念和算法理解的基础上,重点分析了DSCFI算法。最后改进了滑动窗口机制,提出可变滑动窗口,针对可变滑动窗 口的机制,提出了DS-stream算法,并用人工合成数据集进行实验,对实验结果进 行分析。实验结果表明,DS-stream算法在挖掘数据流频繁集上有很好的时间与空间效率。关键字数据流;可变滑动窗口;频繁模式;频繁闭合模式IAbstractAbstractThetechnologyoffrequentcloseditemsetsofdatastreammininghasbeenused moreextensively,andthismakestheresearchers

4、takemorenotesonthetechnologyof frequentcloseditemsetsofdatastreammining,especiallyinbusinessdecision-making, knowledgebase,itplaysasignificantrole.However,becauseofthehigh-speeddata streams,massive,diverse,unlimitedfeatures,thedatastreamminingsuffersagreat challenge.Someresearchersusedata

5、structurestostoredataofallpatterns,andsliding windowmechanismtomining,sotheclosedfrequentpatternminingalgorithmbasedon slidingwindowisproposed,greatprogresscomesinthefieldofdatastreammining. Theseearlyalgorithmsoffrequentcloseditemsetsofdatastreammininginthesliding windowmechanismconsider

6、themorerapidandaccurateresult,everlessintoaccount time-varyingcharacteristicsofdatastreams,sothealgorithmsarealmostinthe environmentofthedataequalflowing.Butinreallife,dataisoftennotconstant,sothat thegapbetweentheresultsandthepracticalapplicationofresearchtothedatastream mininghasbrought

7、newproblems.Inordertofindasolutiontothesenewproblemsin thedatastreammining,thispaperproposesanalgorithmforminingfrequentclosed patternsinthedatastreambasedonavariableslidingwindow,mainlyfornon-constant datastreammining.Forthepracticalvalueofdatastreamminingalgorithm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。