基于web的用户访问信息挖掘研究

基于web的用户访问信息挖掘研究

ID:32986851

大小:2.29 MB

页数:81页

时间:2019-02-18

基于web的用户访问信息挖掘研究_第1页
基于web的用户访问信息挖掘研究_第2页
基于web的用户访问信息挖掘研究_第3页
基于web的用户访问信息挖掘研究_第4页
基于web的用户访问信息挖掘研究_第5页
资源描述:

《基于web的用户访问信息挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学科专业:生理缱垦丝作者姓名:垄塑——指导教师:拉!狴拯完成日期)一3}2基于Web的用户访问信息挖掘研究摘要数据挖掘作为一种知识发现的手段,得到了广泛的应用,是数据库最活跃的领域之一。Web挖掘就是将传统数据挖掘技术应用到Web环境中,从Web中抽取信息或知识的过程。在Web挖掘中,基于Web的用户访问信息挖掘应用最为广泛,应用领域涉及电子商务、网络广告、智能推荐系统、网络营销、智能决策领域。一个好的挖掘模型和相应的数据表示及数据库设计是Web访问信息挖掘成功的关键,为此本文进行了相关的研究。本文在对Web用户访问信息挖掘的相关理论和最新成果的研究的基

2、础上,对数据预处理阶段和模式发现阶段的几个问题和方法进行了研究,并提出了一些改进方法和算法实现,针对具体的问题建立了相应的数据表示和数据库系统设计,并且在此基础上提出了一个基于数据库的Web用户访问信息挖掘系统,并初步实现了其中的几个功能模块。数据预处理阶段是Web挖掘的数据准备阶段。本文通过SQLServer2000实现了基于数据库的数据清洗任务,并提出了一种网络蜘蛛的字符匹配模式的清除方法。用户识别提出了基于Cookie。ip和agent三个属性的识别算法,并且给出了会话识别和事务识别的具体算法,采用基于最大前向访问的事务识别。模式发现阶段是Web挖

3、掘的关键。本文首先创建了用户访问兴趣度的数据表示方法,利用概念分层的方式将页面数据进行归纳,并在此基础上导出了适合BP神经网络的数据集,将神经网络应用到用户分类中,构造了一个分类器;其次是在关联规则和序列算法研究的基础上提出并实现了一个频繁访问路径的算法;最后用Matlab实现了一个计算页面类别关联矩阵和统计分析的算法,实现较高概念层次的统计分析和关联规则挖掘,具有较好的扩展性和易用性。本文最后在前面工作的基础上提出了一个基于数据库的Web用户访问信息挖掘系统的原型,并就原型的各模块进行了分析,该原型允许所有操作基于数据库,得到的模式及规则也存储在数据库

4、中,更易于管理和应用。本文将Web用户访问信息挖掘应用到上海市农业信息网,并且从中得到了一些有用的模式,实验数据证明系统是可行的和有效的。本文采用的数据库是SQL$erver2000,通过数据库来实现数据预处理,本文中的函数使用C++和Matlab来实现。Web用户访问信息挖掘是目前应用最为广泛的Web挖掘技术,可以理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化服务,帮助改善市场营销决策,实现用户推荐和预测。本文的系统具有一定的适用性,本文的研究对于网站的用户访问信息挖掘具有一定的理论意义和实际意义。关键词:数据挖掘,Web挖掘,日志挖

5、掘,神经网络,关联规则,数据库RESEARCHONWEB.BASEDUSERACCESSINFORMATIONMININIGABSTRACTAsamethodofknowledgediscovery,datamininghasbeenwidelyused,andwasthemostactivedomainofdatabase.WebminingistoUSethetraditionaldataminingtechnologiestoextractinformationandknowledgeintheW曲environment.Thewebusagemi

6、ningisthemost研deusedmethod,whichisusedinthefieldofe-conlrncrce,intemetads,intelligentrecommendationsystem,intemetmarketing,andintelligentdecisionsupport.Agoodmodelofwebminingisthekeytothesuccessofwebusagemining,thisdissertationwilldosomeresearch.111edissertationwillimproveandimpl

7、ementseveralmethodsandarithmeticbasedontheresearchofthetheoryandachievement,whichisaboutwebuseraccessinformationmining.Thisdissertationwilldesignthedatabasetopresentcorrespondingdata.ThenconstructaWebUSeraccessinformationminingsystemmodelbadeondatabase,andrealizeseveralfunctional

8、module.Datapreprocessingisthepreparation

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。