基于关联规则的web日志挖掘技术研究

基于关联规则的web日志挖掘技术研究

ID:33184689

大小:954.40 KB

页数:69页

时间:2019-02-21

基于关联规则的web日志挖掘技术研究_第1页
基于关联规则的web日志挖掘技术研究_第2页
基于关联规则的web日志挖掘技术研究_第3页
基于关联规则的web日志挖掘技术研究_第4页
基于关联规则的web日志挖掘技术研究_第5页
资源描述:

《基于关联规则的web日志挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文基于关联规则的Web日志挖掘技术研究硕士研究生:王欣如指导教师:郭平副教授学科、专业:计算机软件与理论重庆大学计算机学院二OO七年十月MasterDegreeDissertationofChongqingUniversityStudyonWebLogMiningBasedonAssociatedRuleMasterDegreeCandidate:WangXinruSupervisor:AssociateProf.GuopingMajor:ComputerSoftwareandTheoryCollege

2、ofComputerScienceChongqingUniversityOctober2007摘要数据挖掘是从大量的数据集中提取隐含的、事先未知的、并且潜在有用的知识的过程。互联网的发展与快速普及,使得人类真正体会到了数据海洋的无边无际。面对如此巨大的数据资源,人们迫切需要一种新技术和自动工具的帮助,将这巨大的数据资源转换为有用的知识与信息资源。这种技术应不仅能获得数据的表层信息,而且要能在对数据充分理解的基础上获得数据属性的内在关系和隐含信息,即能获得重要的知识。Web挖掘技术为把这种海量的数据转化成有用的信息和知识提

3、供了强有力的手段。本文主要研究如何利用Web挖掘分析日志得到用户对网站的访问模式,据此提出一种能帮助站点所有新老用户提高访问效率的推荐技术,完善站点拓扑结构,以提高站点访问效率。为此,本文主要做了以下几个方面的研究工作:1)为了从Web日志文件内容向各种挖掘算法提供准确的数据源,对Web日志挖掘数据进行预处理工作,并对其中的问题进行了讨论。2)为了提高Web日志预处理质量,讨论了提取网站拓扑结构信息的技术。3)结合Apriori算法,对侯选序列生成进行研究,采用了一种基于图结构的侯选序列生成的算法SCG。4)设计并实现了

4、一个Web日志挖掘原型系统,从而验证了SCG算法可行性和适用性。本文应用Web日志挖掘技术从访问日志中提取用户访问模式,将挖掘到的知识转变为站点的智能。用户访问模式的研究有利于提高站点信息服务质量,促进智能信息处理领域的发展,在理论和实践上都有重要的研究意义。关键词:数据挖掘,数据预处理,频繁项集,Web日志挖掘,用户访问模式IABSTRACTDataMiningreferstoaprocedurewheresomeimplicit,undiscovered,usefulknowledgeisextractedfroml

5、argeamountsofdata.ThedevelopmentoftheWorldWideWebanditsfastpopularizationmakethemankindreallyrealizethattheoceanofdataisboundless.Facingsuchenormousdataresources,peopleurgentlyneedakindofnewtechnologyandautomatictoolstohelpchangethisenormousdataresourceintouseful

6、knowledgeandinformationresources.Thiskindoftechnologyshouldnotonlymanagetogetthetoplayerinformationofthedata,butalsobeabletoobtaintheimpliedinformationandtheinherentrelationbetweentheattributesofdataonthebasisoffullyunderstandingthedata,say,toobtainimportantknowl

7、edge.Webminingtechnologyhasofferedapowerfulmeansoftransformingthevastdataintousefulinformationandknowledge.ThisthesisfocusonhowtomakeuseoftheWebmininganalysislogtogetthecustomer'saccesstothewebsitepattern,afterwardsputforwardakindofrecommendationtechniquethatcanh

8、elpallthecustomertheasiteinhavehigh-efficiencyaccessandtheperfectsite'stopologystructure.Thisthesismainlyhasdonesomeresearchworkasfollows:i)InordertomaketheWeb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。