xml及关联规则在web日志挖掘中的应用研究

xml及关联规则在web日志挖掘中的应用研究

ID:33191119

大小:2.84 MB

页数:72页

时间:2019-02-21

xml及关联规则在web日志挖掘中的应用研究_第1页
xml及关联规则在web日志挖掘中的应用研究_第2页
xml及关联规则在web日志挖掘中的应用研究_第3页
xml及关联规则在web日志挖掘中的应用研究_第4页
xml及关联规则在web日志挖掘中的应用研究_第5页
资源描述:

《xml及关联规则在web日志挖掘中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号:10255学号:2081138XML及关联规则在Web日志挖掘中的应用研究AppliedResearchonXMLandAssociationRuleinWebLogMining学科专业:作者:指导教师:答辩日期:计算机应用技术吴金桥曹奇英2011年1月14日东华大学计算机科学与技术学院CollegeofComputerScienceandTechnologyDonghuaUniversityI}£.-u叁‘少▲一蔓t心-只东华大学学位论文原创性士日月㈣幽本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果

2、。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:妒』/年/舅/\o孔砂啉彳1月基●赴j二东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于保密口,在——年解密后适用本版

3、权书。不保密彳学位论文作者躲是铂日期:矽J7年f月IoEt指导撕签名:移英日期:如JJ年7月膨EltI.●XML及关联规则在Web日志挖掘中的应用研究摘要Web挖掘是数据挖掘领域中一个新兴的研究方向,而Web日志挖掘是其中的一个重要的研究内容。Web日志挖掘是通过将数据挖掘技术应用于Web服务器日志文件,以得到Web用户的访问模式。网站设计人员可以据此来改善站点结构,改进站点性能,从而提高站点的服务质量。本文首先介绍了数据挖掘及Web数据挖掘等的基本概念,然后针对Web日志挖掘,重点研究了Web曰志数据预处理技术,关联规则算法在Web目志挖掘领域的应用及一种基于多重评价因素的

4、用户相似度计算方法。本文的工作主要有以下几个方面:1.详细研究和探讨了Web日志数据预处理的整个过程。其中包括:数据清理、站点拓扑识别、页面过滤、用户识别、会话识别、路径补充和事务识别。针对实验数据缺乏引用属性域,提出一种基于站点拓扑结构的路径补充算法;针对日志文件的半结构化特征,提出使用XML存储预处理结果,并给出其详细结构。2.提出了一种FP—growth改进算法,用于挖掘用户频繁访问序列模式。该算法首先构建FS.tree,然后在其上执行挖掘算法,得到所有的用户频繁访问序列。通过实验同现有的其他挖掘算法进行比对,XML及关联规则在Web日志挖掘中的应用研究证明了该改进算法

5、的有效性。3.针对Web用户模糊聚类,提出一种基于多重评价因素的用户相似度计算方法,该方法综合考虑了页面次数,页面次序及访问时间等因素来计算用户之间的相似程度,并通过实验计算出各个因素所占的比重,实验结果显示使用该用户相似度计算方法的聚类算法具有更好的聚类效果j关键词:数据预处理,XML,关联规则,频繁路径,用户相似度,模糊聚类XML及关联规则在Web日志挖掘中的应用研究AppliedResearchonXMLandAssociationRuleinWebLogMiningABSTRACTWebminingisanemergingresearchdirectionofdata

6、miningfield.AndWeblogminingisoneimportantresearchinwebmining.Weblogminingapplydataminingtechnologyonwebserverlogfilestogetwebusersaccesspatterns.Accordingtoweblogmining,Webdesignerscanimprovethesitestructureandperformanceinordertoenhancingthesite’Sservicequality.Firstly,thispaperintroducest

7、hebasicconceptsofdataminingandwebdatamining.ForWeblogmining,thispapermainlystudiesWeblogdatapreprocessingtechniques,applicationsofassociationrulesalgorithminthefieldofWeblogminingandausersimilaritycalculationmethod,.一basedonmultipleevaluationfactors.Them

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。