数据流中基于滑动窗口的效用频繁模式挖掘算法

数据流中基于滑动窗口的效用频繁模式挖掘算法

ID:33063749

大小:4.40 MB

页数:58页

时间:2019-02-19

数据流中基于滑动窗口的效用频繁模式挖掘算法_第1页
数据流中基于滑动窗口的效用频繁模式挖掘算法_第2页
数据流中基于滑动窗口的效用频繁模式挖掘算法_第3页
数据流中基于滑动窗口的效用频繁模式挖掘算法_第4页
数据流中基于滑动窗口的效用频繁模式挖掘算法_第5页
资源描述:

《数据流中基于滑动窗口的效用频繁模式挖掘算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学硕士学位论文数据流中基于滑动窗口的效用频繁模式挖掘算法姓名:孙英家申请学位级别:硕士专业:管理科学与工程指导教师:李锋刚201203数据流中基于滑动窗口的效用频繁模式挖掘算法摘要随着硬件技术的高速发展,人们收集数据的能力也在飞速的提高。越来越多的领域已不再满足于静态数据的处理和分析,数据挖掘的热点也逐渐转移到数据流上。区别于静态数据,数据流具有快速、多变、实时、海量等特点,这对数据挖掘工作带来了新的困难和挑战。在目前数据流挖掘的研究中,数据流中的每个项(item)被看成具有同等重要性,然而在实际应用中,每个项都有着

2、不同的重要性一一效用,这种挖掘手段称为效用频繁模式挖掘。然而引用效用概念后,一些定理和方法不再适用一一如向下闭合性,这给挖掘工作带来了很大困难。本文将频繁模式挖掘与效用结合,提出一个高效的基于滑动窗口的效用频繁模式挖掘算法UFPM(utilityfrequentpatternmining)。算法将位图结构与树结构相结合,只需一遍扫描,就能够快速、完整地存储和更新模式信息。算法中设计了一种新的树结构u.tree,按照文法顺序生成,方便模式的增量更新和用户读取。同时算法采用模式增长的挖掘方式,可以避免现有算法存在的逐级搜索产生大量

3、候选项集的问题。通过多个实验与前人算法进行测试和对比,结果表明该算法具有较高的效率和较好的可扩展性,优于现有的同类算法。关键词:数据流;效用频繁;滑动窗口;位图TheUtilityFrequentPatternMiningBasedonSlideWindowinDataStreamABSTRACTWiththehighdevelopfnen专ofhard、Vare,people’sabilityincollectingdataisaswellinfastimprovement.Moreandmoreneldscannomore

4、llleetthedemandsofproeessingandanalyzingthestaticdata,hence,thesearehinghotspotflordatanliningistransf色rringintodatastreams.Dif纯rftomthestaticdata,datastrealnhasthefast,multi.changing,livingandmagnanimitycharaeteristicswhichbfingthenewdimcultyandchallengef-ordataIni

5、ningwork。Inreeentresearchofdatastfeammining,eaehitemindatastrea搬isofequalimportance。HoweVer,in1)ractice,eachite娃lhasadif蟊efentsignificance—thatisutilitywhicht量lismethodiscalledfrequentpatternmining.However,sonletheoremandmethodsarenomoreinadaption,likedownwardcloses

6、pacewhiehbringahugediff{c试tyinminingtasks.下hispapereombinesf}equentminingitemsetswithutilityandproposesanef矗cientalgorithmforutilityfrequentpatternmining(UFPM),:{tcombinesbitmapwithtreestructurethatcanstofeandupda专ethepatternofdatastreamquicklyandeompletelybyscannin

7、gonlyonee.Thealgofithmgeneratedbylexicographicorder,proposesanoveltreeU—treeandmakeseonvenieneefbrpatternupdatinganduse堇.reading.Withapatterngrowthapproachinmining,thealgorithmcaneff.ectiVelyavoidt量leproblelnofalnasscandidacygenerationby】eVel-wisesearching.Byworking

8、throughseVefalexperil弧entstoteslingandcontrastinginexistingalgorithms,wepr。Vethatouralgorithmisinhigheffieiencyandgoodscalabilityoutperfbr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。