基于数据流的频繁模式挖掘应用研究

基于数据流的频繁模式挖掘应用研究

ID:26765540

大小:1.75 MB

页数:86页

时间:2018-11-29

基于数据流的频繁模式挖掘应用研究_第1页
基于数据流的频繁模式挖掘应用研究_第2页
基于数据流的频繁模式挖掘应用研究_第3页
基于数据流的频繁模式挖掘应用研究_第4页
基于数据流的频繁模式挖掘应用研究_第5页
资源描述:

《基于数据流的频繁模式挖掘应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级UDC编号桂林电子科技大学硕士学位论文题目基于数据流的频繁模式挖掘应用研究(英文)ResearchonFrequentPatternMiningoverDataStream研究生姓名:谢玉忠指导教师姓名、职务:朱国魂副教授申请学科门类:工学硕士学科、专业:计算机应用技术提交论文日期:2010年4月论文答辩日期:2010年6月12日年月日万方数据独创性(或创新性)声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果

2、;也不包含为获得桂林电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期:关于论文使用授权的说明本人完全了解桂林电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属桂林电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为桂林电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影

3、印、缩印或其它复制手段保存论文。(保密的论文在解密后遵守此规定)本学位论文属于保密在____年解密后适用本授权书。本人签名:日期:导师签名:日期:万方数据摘要摘要数据流是一种海量并潜在无限的、连续快速的、并随着时间快速变化的有序数据序列。由于数据流本身的特性,使得传统的频繁模式算法难以适用。作为数据挖掘研究领域的热点之一,频繁模式挖掘已成为数据流挖掘中的基础任务,并得到了广泛的深入研究和应用。针对数据流特点,论文概述数据流挖掘的研究背景及主要任务,并对数据流现状、处理模型、处理技术和关键问题进行了分析研究,并对一些现存的数据流频繁模式挖掘经典算

4、法进行了介绍和总结。在此基础上,本文提出了一种基于数据流的实时近似频繁项挖掘算法ECP-Stream和基于滑动窗口的数据流闭合频繁项集挖掘算法WHCFP-Stream。ECP-Stream算法使用ECD−tree结构保存数据流中频繁项,随着数据的流入不断更新结构,同时提高删除过期数据的时间效率,并保证输出数据的精度,满足在线实时处理的分析要求。理论分析和真实数据及模拟数据实验结果表明该算法具有很好的效率。基于滑动窗口模型的WHCFP-Stream算法采用WHCFP-tree结构保存数据流中的闭合频繁模式,随着数据流的流入,采用深度优先遍历删除过

5、期数据,并简单快速的插入新的闭合项集。理论分析和真实数据实验表明了该算法的有效性。关键词:数据流,数据流挖掘,滑动窗口,频繁项,闭合频繁项集—I—万方数据基于数据流的频繁模式挖掘应用研究AbstractAdatastreamisunlimitedpotentialsequenceofdatawhicharriveatahighspeedandchangeunceasinglywiththetime.Thefeaturesofdatastreamitselfmakethetraditionaryalgorithmbehardtominingthe

6、frequentitems.Asoneofresearchinghotareaofdatamining,frequentpatternmininghasbeenabasictaskofdataminingandbeenresearchedwidelyandprofoundly.Accordingtothefeatureofdatastream,thepapersummarizestheresearchbackgroundandthemaintaskofdatastream,andresearchesandanalysesthestatusofd

7、atastream,processingmodels,technologinesandkeyissues,alsointroducesandsummarizessomeclassicfrequentpatternminingalgorithms.Onthisbasis,thepaperproposesarealtimealgorithmECP-StreamforminingapproximatefrequentitemoverdatastreamandaalgorithmWHCFP-Streamfortheclosedfrequentitems

8、basedonthedatastreamslidingwindow.ThealgorithmECP-StreamusestheECD-treestru

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。