web日志挖掘中数据预处理算法的研究及实现

web日志挖掘中数据预处理算法的研究及实现

ID:33729300

大小:2.43 MB

页数:48页

时间:2019-02-28

web日志挖掘中数据预处理算法的研究及实现_第1页
web日志挖掘中数据预处理算法的研究及实现_第2页
web日志挖掘中数据预处理算法的研究及实现_第3页
web日志挖掘中数据预处理算法的研究及实现_第4页
web日志挖掘中数据预处理算法的研究及实现_第5页
资源描述:

《web日志挖掘中数据预处理算法的研究及实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、贵州大学硕士学位论文Web日志挖掘中数据预处理算法的研究及实现姓名:汪莉栋申请学位级别:硕士专业:软件工程指导教师:王翰虎20080401摘要:Intemet的迅猛发展,尤其是Web的全球普及,使得Web上信息量无比丰富。通过对Web的挖掘,可从Web页面中提取所需的知识:对总的用户访问行为、频度、内容的分析,可得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。更重用的是,通过对这些用户特征的理解和分析,有助于开展有针对性的电子商务活动。随着数据挖掘和万维网技术的结合,使得从收集到的访问Inte

2、met网页的网站日志记录中进行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。它对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。W曲访问模式挖掘是目前数据挖掘领域的热点课题之一,也是Web日志挖掘的主要目标之一,本文的研究目的是发现更多有意义的序列模式。本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程。通过对基于Web日志的数据挖掘的讨论,说明如何进行Web日志挖掘以及在Web日志挖掘

3、中应采取的数据挖掘技术。针对多页面结构的站点会降低挖掘结果的兴趣性,本文提出了Web日志数据预处理的改进算法一Fr锄e页面过滤算法,实验结果表明,通过过滤用户会话文件中非用户点击产生的subframe页面请求,可以提高同志挖掘结果的兴趣性。关键词:数据挖掘,Web日志挖掘,预处理,Frame页面过滤2ABSTRACT:硒eswiRandviolentdevelopmentofInternet,especiallythewholeworldsofWebpopularizesandWebincomparablyab

4、undantamountofinformation.ThroughWebmining,weCarldrawnecessaryknowledgefromWebpage:toanalyzethecontentstototaluserreceiveandvisitbehaviorandfrequenmess,wecallgetthegeneralknowledgeofbehaviorandmodeofUSerS,andUSethattoimproveOUrwebsgrve.Andmoreimportance,thro

5、ughtheunderstandingandanalyzingofuser'scharacteristic,itcanhelpanddeveloptheelectroniccommercialactivities.AsaconflueIlceofdataminingandWWWtechnologies,itispossibletoperformdatamimngonweblogrecordscollectedfromtheIntemetwebpageaccesshistory.WebUsageMiningist

6、heapplicationofDataminingtechniquestodiscoverusagepatternsfromWebdatainordertounderstandandservetheneedsofWeb—basedapplications.ItisnecessarytooptimaizethestructureofWebsitandtosupplytheindividuationservice.NowWebUsageMiningishotspotofDataMining,anditisalsoo

7、neofthemajortopicsonWeblogmining.Moremeaningfulsequencepatternsbefoundisthefinalpurposeofthethesis.Inthisthesis.theprocessofdatamimng,webdataminingandWeblogminingWasreported.Focusingontheweblogmining,themethodandtechnologyofweblogminingwerediscussedinthisthe

8、sis.Becauseofmulti.frameCanreducetheinterestingnessofWeblogminingresults,thethesisputforwardarefinedWeblogpreprocessingtechnologycalledframe-filtering.Ourexperimentsshowthatbyfileratingsubframep

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。