基于web日志的数据挖掘

基于web日志的数据挖掘

ID:33772703

大小:1.74 MB

页数:59页

时间:2019-03-01

基于web日志的数据挖掘_第1页
基于web日志的数据挖掘_第2页
基于web日志的数据挖掘_第3页
基于web日志的数据挖掘_第4页
基于web日志的数据挖掘_第5页
资源描述:

《基于web日志的数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数皿面曲⑨天毕大蓦中国近代第所大学硕士学位论文一~■R_●■●跚

2、:ilF-,!■■¨a■_学科专业:吐簋皿应丑量丕作者姓名:叠苤生指导教师:冯志勇教援天津大学研究生院2005年12月中文摘要万维网是到目前为止世界上最丰富和最密集的信息来源。如何开发和利用这些丰富的资源就成了人们普遍关注的闯题。于是,数据挖掘技术和网络应用研究的结合——-W曲数据挖掘技术(WebMining)构成了当今比较活跃的一个研究领域。Web日志挖掘是Web使用挖掘的一个分支,它作为W曲挖掘的一个重要组成部分,具有独特的理论和实践意义

3、。本文系统地阐述了从数据挖掘、W曲数据挖掘到Web日志挖掘整个过程,重点讨论Web日志挖掘。Web日志挖掘通过对日志记录的挖掘,发现用户访问页面的模式,从而进一步分析和研究日志记录中的规律,以期改进站点的性能和组织结构,提高用户查找信息的质量和效率,并通过统计和关联的分析找出特定用户与特定地域、特定时间、特定页面等要素之间的内在联系。Web日志挖掘预处理对象是原始日志文件中包含的数据,其中不完整的、冗余的、错误的数据需要进行处理。本文针对数据预处理过程中涉及到的关键问题和技术进行详细的剖析和论述。Web日志

4、挖掘中模式分析与模式表达通过发现的模式研究用户Web浏览行为,理解访问者的浏览兴趣,这些都是提高Web质量和改善站点结构设计的重要环节。本文研究了规则归纳的模式挖掘方法,探讨了关联规则和序列模式的挖掘算法,比较各算法优劣,提出使用fp和.treeprefixspan应用于关联规则和序列模式的挖掘。最后将Web日志挖掘技术应用到天津铁路工程学校网站,对其Web服务器的日志记录进行挖掘,建立一个Web日志挖掘系统。网络管理人员可以根据Web日志的分析结果改进网站的设计,实现网站的有效管理。关键词:数据挖掘Web

5、数据挖掘Web日志挖掘关联规则序列模式模式分析AbstraetABSTRACTTheWorldWideWebisadistributedglobalinformationresourcecontainingalargeamountofdatarelevanttoessentiallyalldomainsofhumanactivity.Itisbcc,omeaquestiontopayattentionhowtodevelopandusetherichresoul-ce.Therefore.itconstit

6、uteaactiveresearchfieldalpresentthatdataminingtechnologycombmewithnetworkapplicationresearchi.e.webdataminingtechnology.Weblogminingisabranchofwebusageminingandhasspecialtheoryandpl"dcldCesignificanceasanimportantpartofwebmining.Inthisthesis,theprocessofda

7、tamining,webdamminingandweblogminingwasreported.Focusingontheweblogmining.Itdiscoversthatuservisiteswebpagepatombyweblogrecordmining.Further,itanalysisandstudiestheorderofweblogrecordsothattoimprovethecharacteristicandorganizationalsmmtureofwebsits,toimpro

8、vethequalityandefficiencythatuserresearchesinformation,tofindtherelationbetweenspecialuserandspecialarea,time,pagebystatisticalandassociationanalysis.TheobjectofDataprcprocessingisdatathatiscontainedininitialWeblogfiles.Thosehalf-baked,redundant,inacourate

9、dataneedtoprocess.Inthisthesis,thekeytechnologyaboutdatapreproeessingisstudiedanddiseussed.Thepaternanalysisandpatornexpressioninweblogminingisstudiesthewebhowsebehaviorofuser,sothattounderstandtheinteresttha

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。