基于web日志的数据挖掘研究

基于web日志的数据挖掘研究

ID:32986777

大小:1.89 MB

页数:61页

时间:2019-02-18

基于web日志的数据挖掘研究_第1页
基于web日志的数据挖掘研究_第2页
基于web日志的数据挖掘研究_第3页
基于web日志的数据挖掘研究_第4页
基于web日志的数据挖掘研究_第5页
资源描述:

《基于web日志的数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文基于Web日志的数据挖掘研究姓名:付国瑜申请学位级别:硕士专业:计算机技术指导教师:郭平;黄贤英20070326重庆大学硕士学位论文中文摘要摘要随着Interne!t的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,在国际国内的学术界和信息产业界备受瞩目。如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。文章首先对数据挖掘作了概括性的阐述,诸如数据挖掘的定义、功能、分类

2、等。接着对数据挖掘的一个重要分支一w曲日志挖掘进行了系统的研究。作者围绕对Web挖掘的流程这一线索,尤其是对预处理和模式发现这两个阶段展开了详细深入的探讨。针对数据预处理阶段的几个步骤,如数据清洗、用户识别、会话识别、路径补充等进行了重点的探讨,并给出了其具体实现算法。最后,针对Web挖掘的应用领域之一,作者对自适应的Web站点展开了较为详细的讨论,并提出了自适应站点的架构策略等系列问题。提出了一种适用于Web日志挖掘的数据结构一用户/页面(URL访问信息,并且利用基于该关联矩阵的用户聚类、页面聚类和频繁访问路径等算法,从

3、而实现用户和页面的聚类及用户的频繁访问路径。关键词:数据挖掘,Web日志,预处理,聚类,自适应重庆大学硕士学位论文英文摘要ABSTRACTDevelopcontinuouslyalongwitlltheIntemet,thedatascoopsouttechnicalreseardhandapplicationtoalsobecomealittlebithotproblemmoreandmore,isfocusedattentionfullyininternationallocalacademiccirclesandinf

4、ormationindustryfield.Howapplyadataexcavation'stechniqueinthe、)l,eb.theexhumationisusefulfromthedailyrecordofw曲server,importantknowledge(includemode,rule⋯etc.),becomeallimportanceresearchandapplicationrgahllofdataexcavationandknowledgedetection,thisisaccordingtoth

5、edataoftheW曲dailyrecordtoscoopout.Articlethelogarithmsmadetoelaborategenerallyaccordingtotheexcavationfirst,suchasthedefinition,functionofdataexcavation,classificationetc..Immediatelyafterthelogaritlmascarriedontheresearchofsystemaccordingtoanimportantdailyrecorde

6、xcavationofthebranch-Webofexcavation.TheprocessthattheauthorseircumambiancescoopsouttotheWebisthisclues,particularlyistoprepareprocessingandmodetodiscoverthesetwostageslauncheddetailedthoroughofstudy.Aimatafewstepsthatthedatapreparesaprocessingstage,ifthedataclean

7、s,thecustomeridentify,theconversationidenti助path'scomplement'setc.carriedonthestudyofpoint,andgiveitconcretelycarriesoutcalculateway.End,aimatoneoftheappliedrealmsofWebexcavation,authortofromorientationoftheWebstationorderedtolaunchtodiscussmoreandindetail,andputf

8、orwardorderingfromtheorientationstationofstructurestrategyetc.seriesproblem.Putforwardakindofconnectionmatrixofthedataslxucture.customer/page(URL_UserlD

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。