国外数字图书馆推荐系统评述

国外数字图书馆推荐系统评述

ID:26502450

大小:62.00 KB

页数:13页

时间:2018-11-27

国外数字图书馆推荐系统评述_第1页
国外数字图书馆推荐系统评述_第2页
国外数字图书馆推荐系统评述_第3页
国外数字图书馆推荐系统评述_第4页
国外数字图书馆推荐系统评述_第5页
资源描述:

《国外数字图书馆推荐系统评述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、国外数字图书馆推荐系统评述摘 要:本文通过介绍Tapestry,Fab,Citeseer,SERF,Melvy,lAmazon等几种常见的推荐系统,概述了国外数字图书馆推荐系统的研究进展,分析其主要特点,指出对国内数字图书馆建设具有借鉴意义.关键词:数字图书馆;推荐系统;研究进展Abstract:ByintroducingseveralmonremendationsystemssuchasTapestry,Fab,Citeseer,SERF,MelvylandAmazon,thisarticlesummarizestheoverseasresearchprogressondigital

2、libraryremendationsys-tems,analyzestheirmajorcharacteristics,andpointsouttheirreferencesignificancetodigitallibraryconstructionathome·Keyendationsystem;researchprogress数字图书馆推荐系统是通过向用户提供有关的文献信息或利用的建议,帮助用户找到和选择比较相关信息的一种工具。它能够收集和统计用户查找信息,通过分析用户行为的特点来对信息内容进行推荐。近年来,国外对数字图书馆推荐系统的研究取得一定的进展,本文将对国外常见的几种数

3、字图书馆推荐系统加以介绍和评价.1 Tapestry系统1992年12月,美国施乐公司研究所开发了Tapestry系统,这是早期的推荐系统,目的是过滤海量的电子邮件,推荐电子新闻[1]。在Tapestry系统中,用户可以对阅读过的文章发表意见,标注出他们是“喜欢”或“讨厌”这篇文章。其他用户既可以根据关键词检索文章,也可以根据用户的评注来选择文章阅读。Tapestry系统以促进用户之间相互了解为前提,从而让用户清楚哪些评注具有参考价值;它不是自动根据用户兴趣进行推荐,而需通过用户构造较复杂的查询才能得到检索结果。其体系结构如图1所示。开发者Goldberg等人还首次提出“协同过滤”的概

4、念:即人们相互协作,通过记录其对阅读过的文档的反应态度(有兴趣或不感兴趣)进行筛选,这对以后的推荐系统研究与开发具有重要的启发意义.2 斯坦福大学的Fab系统Fab系统是斯坦福大学数字图书馆项目研究的一部分内容。1997年3月,M·Balabanovic详细介绍了Fab系统的结构与功能[2]。Fab旨在帮助用户从海量的互联网信息中筛选出有用信息。该系统结合了基于内容的推荐和协同推荐的优点,采用混合推荐技术向用户推荐感兴趣的信息。其推荐过程可分为两步:第一,收集信息建立可管理的数据库;第二,为特定用户从数据库中选择所需要的信息。Fab主要由3个部分组成:收集代理(即查找特定主题的网页)、

5、选择代理(即为特定用户查找网页)和中央路由器。每个代理都根据有用户评价的网页所包含的词语构成一个文档(Profile)。收集代理的文档代表目前的主题,而选择代理的文档代表单个用户的兴趣。收集代理将收集到的网页提交给中央路由器,再由中央路由器根据页面与用户文档的匹配程度向用户推荐页面;用户的选择代理还可以删除用户已经看过的页面,并在任何单批的推荐(通常为10页)确保每个站点最多推荐一个页面。用户的反馈往往投入了大量的时间和精力,应将其存储在各自的选择代理文档中,并确保不被其他用户反馈所“淹没”.用户需要对推荐的页面予以评级,据此更新其个人选择代理的文档以及调整原始收集代理的文档。同时,用

6、户评价较高的页面直接推荐给具有相近兴趣的用户,实现协同推荐。而打分特别高的网页将会直接推荐给用户的最近邻居,即和用户具有相似偏好的其他用户。Fab系统的优点是综合了各种主要的过滤方法,能够对一些数据量大、变化性强的信息进行过滤,可以进行动态反馈,实现个性化推荐服务.3 Citeseer系统CiteSeer是在自动引文标引(AutonomousCitationInde-xing,ACI)的基础上建设的一个学术论文数字图书馆(为http://citeseer·ist·psu·edu),它提供了一种通过引文链接检索文献的方式,目标是从多个方面促进学术文献信息的传播与反馈。CiteSeer可以

7、检索互联网上“Post-script”和“PDF”文件格式的学术论文。它通过网上搜索引擎,根据给定的关键词查找、下载论文,分解论文,提取摘要、引文等特征信息,然后建成数据库。用户可利用关键词或链接到与给定文章有相同引文或引用了该文章的论文在数据库中寻找相关文献。除了简单浏览和关键词搜索,系统可利用文字信息和共引分析方法找到相似文献。CiteSeer采用自动引用标引来提高科技文献分发或检索的质量,考虑了文档间的引用关系,把引证脉络凸显出来,按照文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。