基于web日志挖掘的原型系统研究与实现

基于web日志挖掘的原型系统研究与实现

ID:33299734

大小:3.14 MB

页数:80页

时间:2019-02-23

基于web日志挖掘的原型系统研究与实现_第1页
基于web日志挖掘的原型系统研究与实现_第2页
基于web日志挖掘的原型系统研究与实现_第3页
基于web日志挖掘的原型系统研究与实现_第4页
基于web日志挖掘的原型系统研究与实现_第5页
资源描述:

《基于web日志挖掘的原型系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、ClassifiedIndex:UDC:TheResearchandRealizationofPrototypeSystemBasedonWebLogMiningCandidate:RenHaodongMajor:ComputerApplicationTechnologyStudentID:212008081203005Supervisor:AssociateProf.JiaNianApril,2011西华大学学位论文独创性声明f幽flllfllllllllllllflllllrllfJIfllrfrlllrflIJP

2、rll;

3、IIIIIIlrigY1884559作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学雠文作孝张P弘指删雠:獬日期:砷f/.f。f日期驯/,歹.zI西华大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,在校攻读学位期

4、间论文工作的知识产权属于西华大学,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,西华大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。(保密的论文在解密后遵守此规定)篙篙篇;彬省磊j西华大学硕士学位论文摘要在Internet信息大爆炸的年代,用户大量地借助搜索引擎获取所需信息。然而现有的信息检索系统基本对不同用户键入同一查询词返回同样的结果集,忽视了用户自身的知识领域背景和兴趣趋向,使用户陷入了信息资源迷航状态。为此,信息检索领域拓

5、展开了一个新兴的研究方向⋯个性化检索研究。提供个性化检索的前提条件是要能准确地识别用户并合理的建立其知识兴趣背景。Web日志中含有大量的用户记录信息,通过对相关信息的挖掘可以识别出单一用户,通过分析用户的浏览行为信息可以抽取用户特性信息,从而构建出用户知识兴趣背景。结合用户知识兴趣背景,对不同用户键入同一查询词进行用户识别,分析其领域知识、兴趣偏好、喜好趋势等信息,从而返回相对不同用户意图需求的结果集,实现个性化检索,提高查全率、查准率以及用户的满意度。本文重点研究通过Web日志挖掘技术建立用户知识兴趣背景,实现个性化检索原型系

6、统。主要研究内容如下:探讨了针对Web日志数据预处理阶段的数据清理技术,同时对数据预处理主要几个步骤进行了详细分析、阐述。针对基于词频的TF/IDF算法忽略了用户知识兴趣与文档相关性问题,结合对Web日志中用户浏览行为和查询日志中用户隐式反馈信息的分析,提出了页面相关性权重计算方法;针对TF计算中忽视了词条与文档结构的问题,提出了词条的重要度影响因子Eiv;最后将页面相关性权重、词条重要度影响因子与基于词频的TF/IDF算法相结合,提出了一种偏加权TF/IDF算法用于用户特征信息抽取,并在此基础上运用向量空间模型构建用户知识兴趣

7、背景,把Rocchio反馈算法进行了相应衍化以应用于对用户知识兴趣背景的实时分析和更新,最后实现了个性化检索原型系统⋯易搜。最后,对当前论文的工作进行总结,展望了个性化检索的进一步发展。关键词:Web挖掘;个性化;Web日志;TF/IDF;数据预处理;用户知识兴趣背景基于Web日志挖掘的原型系统研究与实现AbstractInalleraofIntemainformationexplosion,theusersusuallyacquireinfoITSationbyme龇lsofusingsearchengine.However,

8、ignoringtheknowledgebackgroundandinterestoftheusers,theexistinginformationretrievalsystemgivestheSal/leresultstothesamequeryinputbythedifferentusers,andmakestheUSerSintoatrekstateofinformationresource.Therefore,thisleadstoanewresearchdirectionfortheinformationretriev

9、alfield⋯.thestudyonpersonalizedinformationretrieval.ThepreconditionforprovidingthepersonalizedretrievalistoaccuratelyidentifytheUSe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。