web使用挖掘方法的研究和实现

web使用挖掘方法的研究和实现

ID:33289681

大小:2.45 MB

页数:66页

时间:2019-02-23

web使用挖掘方法的研究和实现_第1页
web使用挖掘方法的研究和实现_第2页
web使用挖掘方法的研究和实现_第3页
web使用挖掘方法的研究和实现_第4页
web使用挖掘方法的研究和实现_第5页
资源描述:

《web使用挖掘方法的研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Web使用挖掘方法的研究和实现摘要Web挖掘是将数据挖掘和WWW这两个领域中的多种技术和方法结合起来的热门研究课题。一般来说,它的研究领域包括Web内容挖掘、Web结构挖掘和Web使用挖掘。其中,Web使用挖掘的研究目的在于发现用户浏览网站的行为规律,改善站点的结构和页面间超链接结构,提高站点服务质量以及在电子商务中的客户关系管理方面的决策支持。本文在介绍Web使用挖掘发展概况的基础上,详细论述了Web使用挖掘的整个过程和相关技术。本文所做的主要工作和新见解如下:.详细论述了Web挖掘的定义、体系

2、结构和分类,并且阐述了各个类别的主要研究内容:阐述Web使用挖掘的定义、过程,以及各个阶段的研究内容和相关技术:.在Web使用挖掘的数据预处理阶段,提出了一种新的会话构造方法一一基于时间和引用的启发式方法。该方法不仅利用了用户会话的时间特性,而且考虑了用户的浏览特性。所以,这在一定程度上方便了用户频繁访问模式的挖掘;.在第四章中,本文在修改FP-Tree算法的基础上,提出一种发现用户频繁访问模式的算法(FAP-Mining)o该算法可以用于发现不同类型的网站用户的访问模式,并且可以根据专家设定的支

3、持度闭值发现用户的频繁访问模式;.设计开发了Web使用挖掘实验系统(WebUsageMiningExperimentalSystem)。此系统包含四个主要功能模块:数据清洗模块、会话构造模块、流量分析模块和访问模式挖掘模块。会话构造模块中不仅实现了基于时间和引用的会话构造方法,并且将它与其它流行的会话构造方法进行了比较;流量分析模块从总体上分析网站的浏览情况;访问模式挖掘模块实现了本文第四章提出的FAP-Mining算法。关键词:数据库知识发现、数据挖掘、Web挖掘、Web使用挖掘、会话构造、频繁

4、访问模式TheResearchandImplementofMethodsonWebUsageMiningAbstractWebminingisthehotresearchissuewhichcombinesvarioustechnologiesandmethodsbetweendataminingandWWW.Ingeneral,Webminingincludesthreeresearchdomain:WebContentMining,WebStructureMiningandWebUsageMi

5、ning.Intheseareas,webusageminingaimsattherulediscoveryofsites'visitorsbrowsingbehaviors,theimprovementofsites'structureandthelinkagestructureamongpages,theenhancementonthequalityofwebservicesandthedecisionsupportonclientrelationshipmanagementofthee-co

6、mmerce.Onthebasisoftheintroductionofthedevelopmentsurveyofwebusagemining,thethesisdiscussestheprocedureofwebusageminingandsometechnologiesrelevanttoeachphraseinwebusagemining.Themainworkandnovelideasofthethesisareshowedasfollowing:.Thedescriptionofthe

7、definition,taxonomyandclassificationofwebmining,andmaincontentineachresearchareaofwebmining;.Thedescriptionofthedefinition,procedureofwebusageminingandtheexplorationoftheresearchcontentandrelatedtechnologiesineveryphraseofwebusagemining;.Wegiveanovels

8、ession-constructedmethod,whichistheTime-and-Referrer-basedHeuristicMethod.Itnotonlyusesthetimecharacteristicofsessionbetweenusersandwebsites,butalsoconsiderstheusers'browsingcharacteristic.Thus,itfacilitatestheminingofusers'frequentaccesspatte

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。