资源描述:
《基于可变滑动窗口的数据流闭合频繁模式挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江苏科技大学硕士学位论文基于可变滑动窗口的数据流闭合频繁模式挖掘研究姓名:范玉玲申请学位级别:硕士专业:计算机软件与理论指导教师:苏勇2011-03-09摘要摘要数据流频繁闭合模式的挖掘技术应用的普遍性,使得数据流频繁闭合模式挖掘技术的研究受到越来越广泛的重视,特别是在商务决策、知识库方面发挥着很大的作用。由于数据流自身高速、海量、多变、无限等特点,使数据流挖掘遭遇了很大的挑战。一些研究学者采用数据结构存储数据量中的所有项集,滑动窗口机制来挖掘,提出基于滑动窗口的闭合频繁模式挖掘的多种算法,在数据流挖掘领域取得了很大进展。但是这些基于滑动窗口机制的数据流频繁闭合模式挖掘的
2、算法中,由于较多地考虑快速且精确的效果,而较少考虑数据流的时变特性,因此数据流挖掘算法多是在等速的理想数据流环境中的研究,而现实生活中的数据往往不是等速的,研究结果与实际应用的差距给数据流挖掘的研究带来了新的问题。为了寻求解决数据流挖掘中的这些新问题的方法,本文提出可变滑动窗口数据流频繁闭合模式挖掘算法,主要是针对不等速数据流的挖掘算法。这对数据流挖掘算法的实际应用价值方面具有重要意义。为了更好的挖掘不等速数据流,文中首先对数据流,数据流处理系统,数据流
频繁模式挖掘及数据流频繁闭合模式挖掘的相关理论性质和挖掘技术进行了深入的
理解。其次在对各种数据流频繁闭合模式挖掘的概
3、念和算法理解的基础上,重点分析了DSCFI算法。最后改进了滑动窗口机制,提出可变滑动窗口,针对可变滑动窗
口的机制,提出了DS-stream算法,并用人工合成数据集进行实验,对实验结果进
行分析。实验结果表明,DS-stream算法在挖掘数据流频繁集上有很好的时间与空间效率。关键字数据流;可变滑动窗口;频繁模式;频繁闭合模式IAbstractAbstractThetechnologyoffrequentcloseditemsetsofdatastreammininghasbeenused
moreextensively,andthismakestheresearchers
4、takemorenotesonthetechnologyof
frequentcloseditemsetsofdatastreammining,especiallyinbusinessdecision-making,
knowledgebase,itplaysasignificantrole.However,becauseofthehigh-speeddata
streams,massive,diverse,unlimitedfeatures,thedatastreamminingsuffersagreat
challenge.Someresearchersusedata
5、structurestostoredataofallpatterns,andsliding
windowmechanismtomining,sotheclosedfrequentpatternminingalgorithmbasedon
slidingwindowisproposed,greatprogresscomesinthefieldofdatastreammining.
Theseearlyalgorithmsoffrequentcloseditemsetsofdatastreammininginthesliding
windowmechanismconsider
6、themorerapidandaccurateresult,everlessintoaccount
time-varyingcharacteristicsofdatastreams,sothealgorithmsarealmostinthe
environmentofthedataequalflowing.Butinreallife,dataisoftennotconstant,sothat
thegapbetweentheresultsandthepracticalapplicationofresearchtothedatastream
mininghasbrought
7、newproblems.Inordertofindasolutiontothesenewproblemsin
thedatastreammining,thispaperproposesanalgorithmforminingfrequentclosed
patternsinthedatastreambasedonavariableslidingwindow,mainlyfornon-constant
datastreammining.Forthepracticalvalueofdatastreamminingalgorithm