[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现

[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现

ID:30364269

大小:79.54 KB

页数:5页

时间:2018-12-29

[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现_第1页
[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现_第2页
[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现_第3页
[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现_第4页
[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现_第5页
资源描述:

《[计算机]web挖掘论文:基于web日志挖掘的原型系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、Web挖掘论文:基于Web日志挖掘的原型系统研究与实现【中文摘要】在Internet信息大爆炸的年代,用户大量地借助搜索引擎获取所需信息。然而现有的信息检索系统基本对不同用户键入同一查询词返回同样的结果集,忽视了用户自身的知识领域背景和兴趣趋向,使用户陷入了信息资源迷航状态。为此,信息检索领域拓展开了一个新兴的研究方向----个性化检索研究。提供个性化检索的前提条件是要能准确地识别用户并合理的建立其知识兴趣背景。Web日志中含有大量的用户记录信息,通过对相关信息的挖掘可以识别出单一用户,通过分析用户的浏览行为信息可以抽取用户特性信息,从而构建出用户知识兴趣背景。结合用户知识兴趣背景,对不

2、同用户键入同一查询词进行用户识别,分析其领域知识、兴趣偏好、喜好趋势等信息,从而返回相对不同用户意图需求的结果集,实现个性化检索,提高查全率、查准率以及用户的满意度。本文重点研究通过Web日志挖掘技术建立用户知识兴趣背景,实现个性化检索原型系统。主要研究内容如下:探讨了针对Web日志数据预处理阶段的数据清理技术,同时对数据预处理主要几个步骤进行了详细分析、阐述。针对基于词频的TF/IDF算法忽略了用户知识兴趣与文档相关性问题,结合对Web日志中用户浏览行为和查询日志中...【英文摘要】InaneraofInternetinformationexplosion,theusersusuall

3、yacquireinformationbymeansofusingsearchengine.However,ignoringtheknowledgebackgroundandinterestoftheusers,theexistinginformationretrievalsystemgivesthesameresultstothesamequeryinputbythedifferentusers,andmakestheusersintoatrekstateofinformationresource.Therefore,thisleadstoanewresearchdirectionfo

4、rtheinformationretrievalfield----thestudyonpersonalizedinformationretrieval.Thepreco...【关键词】Web挖掘个性化Web日志TF/IDF数据预处理用户知识兴趣背景【英文关键词】WebMingPersonalizedWebLogTF/IDFDataPreprocessingUsers’KnowledgeandInterestBackground【目录】基于Web日志挖掘的原型系统研究与实现摘要4-5Abstract5第一章绪论9-161.1研究背景、目的9-101.2个性化研究意义及其现状10-111.3

5、Web日志挖掘研究意义及其现状11-131.3.1国外研究现状121.3.2国内研究现状12-131.4本文的主要研究内容13-141.5本文组织结构14-16第二章数据挖掘与Web挖掘16-282.1数据挖掘概述16-172.1.1数据挖掘定义16-172.1.2数据挖掘的一般过程172.2Web挖掘17-222.2.1Web挖掘基本概念17-182.2.2数据挖掘与Web挖掘182.2.3Web挖掘与信息检索182.2.4Web挖掘对象18-192.2.5Web挖掘处理过程192.2.6Web挖掘分类19-222.3Web日志挖掘22-252.3.1Web日志挖掘相关术语222.3.

6、2Web日志挖掘对象22-232.3.3Web日志挖掘一般过程232.3.4Web日志挖掘常用技术23-252.4个性化25-272.4.1个性化信息推荐262.4.2个性化信息检索26-27本章小结27-28第三章个性化检索28-313.1个性化检索28-303.1.1个性化检索涉及的相关技术28-293.1.2个性化检索评价指标29-30本章小结30-31第四章Web日志预处理研究31-364.1Web日志介绍31-324.2Web日志预处理过程32-354.2.1数据清理32-344.2.2用户识别344.2.3会话识别34-354.3用户点击日志35本章小结35-36第五章用户知

7、识兴趣背景36-405.1用户知识兴趣背景概述36-375.1.1知识兴趣背景的研究对象36-375.1.2知识兴趣背景的获取方式以及构建方法375.2用户知识兴趣背景表示方法概述37-39本章小结39-40第六章构建用户知识兴趣背景40-486.1本文用户知识兴趣背景表示方法40-416.2数据过滤41-426.3基于词频统计的TF/IDF算法426.4改进的偏加权TF/IDF算法42-456.4.1用户交互页面权重分析43-44

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。