商业数据流频繁模式挖掘算法研究与应用

商业数据流频繁模式挖掘算法研究与应用

ID:36846441

大小:3.52 MB

页数:79页

时间:2019-05-16

商业数据流频繁模式挖掘算法研究与应用_第1页
商业数据流频繁模式挖掘算法研究与应用_第2页
商业数据流频繁模式挖掘算法研究与应用_第3页
商业数据流频繁模式挖掘算法研究与应用_第4页
商业数据流频繁模式挖掘算法研究与应用_第5页
资源描述:

《商业数据流频繁模式挖掘算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江工商大学硕士学位论文摘要商业数据流频繁模式挖掘算法研究与实现摘要随着知识经济时代的来临,信息与知识已经成为国家和企业发展的重要战略资源,是提高一个组织乃至一个国家战略竞争力的核心,也是实施科学管理与决策的基础。如何获取信息与发现知识,尤其是如何快速高效地在动态变化和爆炸性增长的海量数据流中获取信息和发现知识就成了关键性问题。与传统数据不同,数据流具有大量、快速连续到达、要求快速响应、一次扫描等特点。而商业数据流除了具备数据流的基本特点外,还具备连续性、冲突性、时间性、海量性和分布性等特性。因此传统的数据挖掘技术不能直接应用到商

2、业数据流上。利用有限系统资源对商业数据流进行快速处理以获取有用信息,为数据挖掘在商业领域的应用研究带来了新的机遇和挑战。频繁模式挖掘是数据挖掘领域的一个基本问题,研究内容一般包括事务、序列、树和图。其方法被广泛应用于许多其它数据挖掘任务中,如相关性分析,序列周期分析,最大频繁模式,闭合频繁模式,查询,分类等等。由于问题本身的基础性和内在复杂性,频繁模式挖掘方法成为许多研究者关注的课题。本文对商业数据流频繁模式挖掘相关技术进行了研究。重点研究了以下几个问题:商业数据流的层次维度结构分析及其挖掘系统的研浙江工商大学硕士学位论文摘要究;

3、利用静态前窥树高效挖掘最大频繁模式和闭合频繁模式;利用增量式挖掘方式和倾斜时间窗口分别挖掘商业数据流中的最大模式和闭合模式;频繁模式算法在商业领域的实际应用问题等。本文研究内容和创新工作主要包括以下几个方面:首先,对数据流挖掘及其模型等相关理论进行研究,总结出目前该领域的最新研究成果,以期取其之长运用到商业数据流相关任务的挖掘上。接着,提炼出商业数据流的概念及特点,分析商业数据流的内容层次和类型维度结构,并以此构建出商业数据流管理系统BDSMS。然后,针对静态商业数据海量等特点,设计并实现最大频繁模式挖掘算法MFP和闭合频繁模式算

4、法CFP。其中采取前馈剪枝、合并等策略修剪频繁模式树以提高频繁模式构成速度。在此基础上,针对时间序列模型和收银机模型,改进静态的频繁模式挖掘算法MFP和CFP,分别引入增量式挖掘和倾斜时间窗口得出商业数据流挖掘的单遍扫描算法SMFP和SCFP。最后,本文将上述算法应用到商业特定领域,设计实现了零售行业折扣券生成系统,并对其进行实验分析与研究,挖掘数据表明各算法都具有较高的准确性和时间效率,对商业决策支持具有一定的指导意义。关键词:数据挖掘;数据流;频繁模式;最大频繁模式;闭合频繁模式;增量式挖掘;倾斜时间窗口浙江工商大学硕士学位论

5、文T艇ERESEARCHANDRELIZATIoNoFMlNINGFaEQUENTPATTERNS0NBUSINESSDATASTRAEMSABSTRACTWiththeadventoftheknowledgeeconomyera,informationandknowledgehasbecomeallimportantstrategicresourceandtheCOlecompetitiveness幻allorganizationandanation,andalsothefoundationintheimplementation

6、ofscientificmanagementanddecision-making.Therefore,howtogaininformationanddiscoverknowledgeespeciallyinthedynamicandexplosivegrowingdatastreamsbecomethekeyissues。Differentfromthetraditionaldata,thedatastreamisabounded,rapid,andcontinuous。Inaddition,thebusinessdatastre

7、amiscontinuous,conflict,timing,massiveanddistribmed,SOtraditionaldataminingtechniquesCannotbeapplieddirectlytothebusinessdatastream.MakinguseofthelimitedsystemTCSOUl"CCStoobtainusefulinformationfromthebusinessdatastreamshasbroughtnewopportunitiesandchallengesfortheapp

8、licationresearchofdatamininginbusinessareas.Frequentpatemminingisabasicproblemofdatamining,includingminingtransactions,seque

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。