web日志数据挖掘的研究

web日志数据挖掘的研究

ID:32978371

大小:1.35 MB

页数:52页

时间:2019-02-18

web日志数据挖掘的研究_第1页
web日志数据挖掘的研究_第2页
web日志数据挖掘的研究_第3页
web日志数据挖掘的研究_第4页
web日志数据挖掘的研究_第5页
资源描述:

《web日志数据挖掘的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连理工大学硕士学位论文Web日志数据挖掘的研究姓名:何芳申请学位级别:硕士专业:计算机技术指导教师:王兴元20071216大连理工大学专业学位硕士学位论文摘要数据挖掘是数据库最活跃的领域之一,在国内外的学术界和信息产业界备受关注。数据挖掘技术主要研究结构化的数据挖掘,而Web数据的挖掘是应用于Internet的技术研究,是从半结构或无结构的wcb页面中,抽取感兴趣的、潜在的模式。尽管Internet是一个半结构化的系统,很难对它进行处理。但是Web服务器日志记录具有良好的结构,非常有利于数据挖掘的进行。此外,w曲日志挖掘是web使用挖掘的一

2、个分支,它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义。本篇论文主要从以下四个方面对Web日志挖掘进行了系统的分析和研究。主要完成了以下几个方面的工作:(1)对数据挖掘、web数据挖掘和w曲日志挖掘进行了概述,阐述了本篇论文的研究背景及Web日志挖掘研究现状。(2)研究了web日志挖掘中的关键步骤——数据准备,详细地分析了预处理阶段的各项任务。(3)认真研究分析了模式发现阶段的基于聚类的数据挖掘的基本原理和一般方法,井介绍了模糊聚类理论。(4)提出了一个以用户离散化浏览时间为度量、以图论法取得模糊相似矩阵的传递闭包的web用户浏

3、览模式模糊聚类算法。本文提出了用模糊聚类算法对web事务进行聚类。在聚类的相似性度量上,不再单纯地咀访问次数或浏览时间来度量,而是采用用户浏览离散化时间为度量。并将模糊相似度和图论帽结合提出了以图论法取得模糊相似矩阵传递闭包的方法。经实验证明,该算法比传统算法准确性高,运行时问少,扩展性好。关键词:数据挖掘;Web日志挖掘;模期聚类;Web事务大连理工大学专业学位硕士学位论文TheResearchonDataMiningofWebLogAbstractOneofthemostimportantfieldsindatabaseisDatamin

4、ing.Dataminingattractedmuchmoreattentionbothinfieldsofacademicresearchandinformationindustry.Discoveringtheinterested,hiddenandnnknowndatafromlargedatasetsisthepurposeofdatamining.T1lemainworkofdataminingistodealwiththestructuraldata,whilethewebdataminingisbasedonInternetto

5、gettheinterestingandpotentialpatternfromthehalfstructuralornotstructuralwebpages.DatainIntemetisahalfstructuralsystem,anditisdifficulttodealwiththem.Fortunately,theweb8evel.

6、logfileshaveani∞atnlcUlreanditisveryconvenientfordatamining.Furthermore,weblogminingisabranchofwebus

7、ageminingandhasspecialtheoryandpracticesignificanceasanimportantpartofwebmining.TlljsthesisincludesfourpartsinwhichthetechnologiesofWebLogMiningaresystematicallyresearched.InthefirstpartwesummarizethetechniquesofWebLogMining,andpresentthesignificanceofthercsearchonWcbLogMin

8、ing,thestatusofresearchandtheproblemwhichWebLogMiningfaceswitll.InthesecondpartweresearchondatapreparationwhichisthekeyprocessofWebLogMiningandanalyzeeachtaskofdatapreparationindetail.InthethirdpartanalyzeprinciplesandgeneralmethodsofclusteringbasedDataMininginpatterndiseov

9、eryphase,andintroducethetheoryoffuzzyclustering.Inthefourthpart,presentafuzzyclust

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。