数据挖掘在web使用模式中的研究和应用

数据挖掘在web使用模式中的研究和应用

ID:33188609

大小:3.03 MB

页数:94页

时间:2019-02-21

数据挖掘在web使用模式中的研究和应用_第1页
数据挖掘在web使用模式中的研究和应用_第2页
数据挖掘在web使用模式中的研究和应用_第3页
数据挖掘在web使用模式中的研究和应用_第4页
数据挖掘在web使用模式中的研究和应用_第5页
资源描述:

《数据挖掘在web使用模式中的研究和应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广西大学硕士学位论文数据挖掘在Web使用模式中的研究和应用姓名:葛昕申请学位级别:硕士专业:控制理论与控制工程指导教师:梁京章2003.5.1广西大学硕士学位论文数据挖掘在Web使用模式中的研究和应用摘要i数据挖掘和WorldWideWeb是当前计算机科学两个重要的研究领域,将二者结合起来就形成了新的研究领域Web数据挖掘。Web数据挖掘是从W删上发现和分析有用的信息,帮助人们从w洲中提取知识,改进站点设计,提供个性化服务。;、/本文分主要从以下四个方面对Web使用挖掘进行了系统的分析和研究。第一是对数据挖掘和Web挖掘进行了概述,阐述了Web挖掘的意义、研

2、究的现状、面临的问题。第二是讨论了Web使用挖掘的三个阶段:在数据准备和预处理阶段重点讨论了数据清洗及用户和会话识别算法:在模式发现阶段定义了关联规则和序列模式的数据模型;模式分析阶段则讨论了现行的几种分析方法。第三是本文提出了一个综合性的聚类算法CPPC。由于缓存和代理的存在,数据预处理阶段一般都是采用基于一定假设的启发式算法,这就造成了数据源的不可』靠性。I本文算法避免了这个缺陷,且不需要复杂的HASH数据结构,\、通过构造一个UserID-URL关联矩阵,对列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步处

3、理得到频繁访问路径。实验结果表明了算法的有效性矗第j四是本文将传统数据挖掘过程中的各种关键技术,引入到对Web使用信息的挖掘活动中,结合关系数据库的特点设计并实现了一个具有可视化功能的Web使用挖掘系统WLGMS。它可以为使用者提供决策支持,具有很强的实用性。最后本文根据目前的发展状况,提出了一些Web挖掘技术的研究方向。关键词数据挖掘,Web挖掘,Web使用挖掘聚粪,频繁访问路径CPPC广西大学硕士学位论文RESEARCHANDAPPLICATIoNOFDATAMININGINWEBUSAGEPATTERNABSTRACTTwoimportantandac

4、tiveareasofcurrentresearcharedataminingandtheWorldWideWeb.AnaturalcombinationofthetwoareascalledWebminingisanewresearchfield.WebUsageMininigdiscoverandanalyseanyusefulinformation,extractknowledgefromWWW,improvewebsitedesigningandprovidepersonalizationserveThisthesisincludesfourpart

5、sinwhichthetechnologiesofWebUsageMininigaresystematicallyresearched.InthefirstpartwesummarizethetechniquesofdataminingandWebUsageMining,presentthesignificanceoftheresearchonWebUsageMininig,thestatusofresearchandtheproblemwhichWebUsageMininigwillfacewith.InthesecondpartwediscusstheW

6、ebUsageMininigaccordingtOtheprocessofWebmining.InthestageofDatapreparingandPreprocessing、~ediscussthealgorithmofdatacleaning,userandsessionidentificatioriindetail,andpresentadatamodelofAssociationRulesandSequentiaPatternsinthestageofPaRernDiscovel%discusstheusefulmethodofPatternAna

7、lysisinlaststage.AsynthesisclusteringalgorithmCPPCisproposedinthethirdpartofthisthesis.InthepreprocessingstagetheJIImethodofuserandsessionidentificationoRenadoptheuristicalgorithmforthebeingofcacheandagent.Thisinducetheuncertaintyofdataresource.TheCPPCalgorithmavoidthelimitationand

8、hasnouseforcomplicatedHASH

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。