web日志挖掘相关算法研究及其原型系统设计

web日志挖掘相关算法研究及其原型系统设计

ID:34641906

大小:2.13 MB

页数:74页

时间:2019-03-08

web日志挖掘相关算法研究及其原型系统设计_第1页
web日志挖掘相关算法研究及其原型系统设计_第2页
web日志挖掘相关算法研究及其原型系统设计_第3页
web日志挖掘相关算法研究及其原型系统设计_第4页
web日志挖掘相关算法研究及其原型系统设计_第5页
资源描述:

《web日志挖掘相关算法研究及其原型系统设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、西南交通大学硕士学位论文Web日志挖掘相关算法研究及其原型系统设计姓名:冯洁申请学位级别:硕士专业:计算机应用技术指导教师:陶宏才20070501西南交通大学硕士学位论文第1页摘要Web挖掘是将数据挖掘和WWW这两个领域中的多种技术和方法结合起来的热门研究课题。一般来说,它的研究领域包括Web内容挖掘、Web结构挖掘和Web使用挖掘。其中,Web使用挖掘的研究目的在于发现用户浏览网站的行为规律,改善站点的结构和页面间超链接结构,提高站点服务质量以及在电子商务中的客户关系管理方面的决策支持。本文以Web日志记录为基础对Web使用挖掘过程进行了系统的分析和研究,在前

2、人研究的基础上改进并提出了三个新的算法,并将这些算法引入到Web使用挖掘过程中,设计了一个Web日志挖掘原型系统(WLMS)。本文的工作主要有以下几个方面:1、在改进FP—growth算法的基础上,提出挖掘用户频繁访问模式序列的FAS.Mining算法,通过构建FAS.tree,在其上进行挖掘得到最大频繁访问模式序列,进一步转换生成模式分析所需的不同深度的频繁访问模式序列,并分析了相应的增量更新算法,通过实验证明了算法的有效性。2、提出一种快速挖掘Web页面间关联规则的算法,结合网站既有拓扑结构和Web页面信息,定义相应的页面距离,保证页面关联规则有较高的兴趣度

3、,以发现网站设计和用户访问兴趣关联的不一致,为网站结构优化提供有效的决策参考。3、提出一个快速有效挖掘Web日志文件中聚类模式的CLOPE.1算法,从提高用户覆盖面和减少收益值计算量的角度,改进CLOPE聚类算法,并分析了算法的时间和空间复杂度,探讨了算法在Web日志挖掘中的具体应用,并在具有典型结构的合成数据上进行了用户聚类的实验。4、把现有的一些通用的Web挖掘技术及本文提出或改进的算法集成起来,结合关系数据库的特点,完成了一个Web日志挖掘原型系统WLMS的设计工作,阐述了系统整体实现的考虑,并按照挖掘的过程简要介绍了系统的处理流程及各个主要组成模块的接口

4、和功能设计。关键词:Web日志挖掘;关联规则;用户访问模式;用户聚类:Web挖掘西南交通大学硕士学位论文第Ⅱ页AbstractWebminingisahotresearchissuewhichcombinesvarioustechnologiesandmethodsbetweendataminingandWWWIngeneral.Webminingincludesthreeresearchfields:WebContentMining,WebStmctureMiningandWebUsagemining.Webusageminingaimstodiscovert

5、hebehaviorruleswhileusersbrowseWebsite,toimprovethesitestructureandthelinkagestructureamongpages,toenhancethequalityofwebservices,andtoprovidethedecisionsupportonclientrelationshipmanagementoftheE—commerce.Havingmadeanalysisandresearchesonwebusageminingsystemicallybasedonweblogrecord

6、srthisthesisimprovesandproposesthreenewdataminingalgorithms,designsaprototypesystemofWeblogminingthroughapplyingtheimprovedorproposedalgorithmstowebusagemining.Themainresearchworkinthisthesisincludesthefollowings:(1)FAS-Miningalgorithmforminingusers’frequentaccessingpatternsisputforw

7、ardbyimprovingFP-growthalgorithmwhichisusedtominingfrequentitemsets.FAS—MiningalgorithmfirstlyconstructsFAS—treeastheobjectforminingmaximalfrequentaccessingpatterns,andthentransfersthesepatternsintofrequentaccessingpatternsofdifferentdepthesondemand.Also,theincrementupdatealgorithmof

8、FAS-Miningis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。