基于个人网页数据挖掘模型的研究和构建

基于个人网页数据挖掘模型的研究和构建

ID:23532210

大小:1.76 MB

页数:61页

时间:2018-11-08

基于个人网页数据挖掘模型的研究和构建_第1页
基于个人网页数据挖掘模型的研究和构建_第2页
基于个人网页数据挖掘模型的研究和构建_第3页
基于个人网页数据挖掘模型的研究和构建_第4页
基于个人网页数据挖掘模型的研究和构建_第5页
资源描述:

《基于个人网页数据挖掘模型的研究和构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着互联网与W啊的快速发展,尤其是互联网应用的普及,出现了“信息爆炸”的问题。如何管理互联网上的大量信息,以满足用户不断增长的个性化的信息需求,是研究人员所面临的新课题,由于Web上的信息具有数量庞大、无序性强、重复性大的特点,人们现在还不能迅速、方便地从Web所包含的大量信息中获取所需要的信息。如何从WEB包含的大量信息中发现固有的模式和关联,成了人们迫切希望解决的问题。将传统的数据挖掘技术与Web结合起来,进行Web挖掘就是一个途径。Web挖掘是传统数据挖掘技术在Web环境下的应用,试图从大量的

2、Web文档集合和用户浏览Web的数据信息中发现未知的,有潜在应用价值的模式。Web挖掘分为Web内容挖掘、Web结构挖掘和Web使用纪录挖掘。Web挖掘可以在很多方面发挥作用,如对搜索引擎的结构进行挖掘,确定权威页面,Web文档分类,WebLog分类、智能查询等。本文首先对数据挖掘技术进行了阐述,阐明了什么是数据挖掘、为什么要数据挖掘、如何进行数据挖掘、数据挖掘的主要过程与分类,并介绍了有关数据挖掘发展情况。然后,本文着重论述了Web挖掘的内容、任务及其与数据挖掘的联系与区别,并介绍了使用纪录挖掘及其技

3、术。如何有效地表达用户浏览兴趣是Web使用纪录挖掘研究的方向之一。本文在分析了现有的表达用户浏览兴趣方式的基础上,提出了一种基于树形结构表达用户浏览兴趣的方式,并就此进行了实验。本文最后总结了工作尚存的不足。本人迸一步工作将致力于用户兴趣模型准确性的提高,将得到的用户兴趣模型应用于个性化系统的推荐服务中。【关键词】web挖掘;网页兴趣度;个性化用户模型;向量空间模型;聚类算法【论文类型】应用研究AbstractWiththedevelopmentoftheIntemetandinformationtec

4、hnology,theproblemof”InformationExplosion”hasarisen,thatis.。’RichDataandPoorInformation”.HowtomanagethetremendousmountofinformationoRWWWtomeetthegrowingneedsofpersonalizedinformationisanewsubjectforourresearch.Personalizationhasbeenthefocusofresearch+Per

5、sonalization,thatistogivedifferentservice--strategyanddifferentservice-·contenttodifferentuser.KnowledgeofUSerinterestsanddescribingthembyuserprofilesaretheimportance.Therefore,theeffectivenessofpersonalizeinformationserviceprovidedbythesystemisdetermine

6、dbythefactwhetherornottheUSerprofilesrefectUSerinterestsexactly.Afterthestudyingofthekeytechnologies————webminingtechnologyandmodelinguserprofile,thepapersuggeststhemodelofminingUSerinterests.Themodelisbasedonuserviewedcontentandcombiningwithanalysisofus

7、er'sbehavior.Throughanalyzingdocumentexpressivemodel,featureextractionandfeatureweilghvalue,thewebpageisbeenexpressedbyVectorSpaceModel.Finally,thepaperexperimentonexperimentationandanalyses,proveappliedinpersonalizationsystem.ThefutureworkofthisPaperisa

8、pplyingitintotherecommendation.theadvancedmethoddiscussedabove.Accordingtothethattreeformatinterestmodelisreliable,andCanbethatdevelopingthevalidityofuserinterestmodel,andapplyingitintotherecommendation.[keywords】:WebMinin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。