基于web日志增量序列模式挖掘的研究

基于web日志增量序列模式挖掘的研究

ID:27129085

大小:3.14 MB

页数:66页

时间:2018-12-01

基于web日志增量序列模式挖掘的研究_第1页
基于web日志增量序列模式挖掘的研究_第2页
基于web日志增量序列模式挖掘的研究_第3页
基于web日志增量序列模式挖掘的研究_第4页
基于web日志增量序列模式挖掘的研究_第5页
资源描述:

《基于web日志增量序列模式挖掘的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、杭州电子科技大学硕士学位论文基于Web日志的增量序列模式挖掘研究研究生:李晓慧指导教师:王晓耘教授2012年12月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterAStudyonIncrementalSequentialPatternsMiningBasedontheWebLogCandidate:LiXiaohuiSupervisor:Prof.WangXiaoyunDecember2012杭州电子科技大学学位论文原创性声明和使用授权说明原创

2、性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电

3、子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日杭州电子科技大学硕士学位论文摘要数据挖掘为自动和智能地把海量的数据转化成有用的信息和知识提供了强有力的手段,尤其是在网络迅速发展和电子商务竞争不断激烈的今天,数据挖掘的作用更加的凸显。序列模式挖掘是数据挖掘重要的研究课题之一,是指从序列数据库中寻找频繁子序列作为模式的知识发现过程,在很多领域都有实际的应用价值

4、,如客户购买行为模式的分析、Web访问模式的预测、疾病诊断、自然灾害预测、DNA序列分析等。随着以人为中心的交互式应用和数据的动态更新背景的日益增多,频繁模式的动态维护需求不断增长,这些都不断地刺激人们寻找更好的解决办法来尽可能地降低挖掘的代价,因而动态数据库的增量式序列模式挖掘成为序列模式挖掘在未来的研究热点。本文基于序列模式挖掘、Web服务器日志和电子商务等相关理论知识,运用文献研究、实证分析及定性定量分析相结合的方法对电子商务网站基于服务器Web日志的增量序列模式挖掘问题进行了研究,文章主要从以下四个方面展开:第一,整理和

5、分析先前序列模式挖掘算法的相关文献资料。介绍序列模式挖掘的概念、作用和国内外研究现状,归纳现有序列模式挖掘方法中亟待解决的问题;从基本序列模式,闭合序列模式,多维序列模式,周期序列模式等不同角度对相关理论进行了梳理,为本文增量挖掘算法的提出以及特征分析提供理论基础。第二,结合理论研究,在借鉴算法优点基础之上,提出一种适于Web访问序列模式的增量挖掘算法。该算法采用扩展网格结构作为存储结构,具有占用空间小和获取信息便利的优势,同时能够根据数据库动态变化而变动结构。针对数据库更新、网站结构变化和最小支持度阈值调整三种影响挖掘结果的情

6、况提出相应算法,为模型的构建奠定了基础。第三,构建基于Web日志的增量挖掘模型。模型分为四个模块,第一块是网站结构内容分析;第二块是数据预处理;第三块是Web访问序列模式增量挖掘算法的实现;第四块是实验结果的分析与解释。第四,本文以购物网站的真实Web日志数据为研究对象进行实例分析。运用SQL-server2005实现数据的预处理过程,通过VisualC++6.0SP6软件编译算法对数据运行测试,并根据挖掘结果,从管理学的角度为购物网站设计者提出一些建议。经实验证明,基于Web日志的增量序列挖掘算法IncWTP可以适应数据库动态

7、变化特征,利用先前已发现的信息来挖掘网站用户访问序列模式,避免重新挖掘整个数据库,并当Web日志数据库更新或支持度阈值调整时,挖掘效果和效率均高于当前普遍使用的数据挖掘方法。关键词:Web日志,增量数据挖掘,动态数据库,网格结构,序列模式I杭州电子科技大学硕士学位论文ABSTRACTDataminingprovidesapowerfulmeansoftransferingthevastamountsofdataintouseful informationandknowledgeautomaticallyandintelligen

8、tly,especiallyintoday’snetworkdevelop rapidlyande-commercecompetefiercely,theeffectofDataMiningismoreprominent.Sequential PatternMi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。