基于Hadoop的图书个性化推荐服务研究

基于Hadoop的图书个性化推荐服务研究

ID:44068119

大小:188.60 KB

页数:7页

时间:2019-10-18

基于Hadoop的图书个性化推荐服务研究_第1页
基于Hadoop的图书个性化推荐服务研究_第2页
基于Hadoop的图书个性化推荐服务研究_第3页
基于Hadoop的图书个性化推荐服务研究_第4页
基于Hadoop的图书个性化推荐服务研究_第5页
资源描述:

《基于Hadoop的图书个性化推荐服务研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于Hadoop的高校图书馆个性化推送系统研究【摘要】大数据背景下,如何帮助读者从海量的信息资源屮获取到所需的信息,主动为读者提供高质量的个性化服务是现代信息环境下的图书馆亟待解决的问题。本文分析了高校图书馆个性化推荐服务流程和需求,优化了推荐算法,以Hadoop为大数据分析平台,实现了高校图书馆个性化推送系统。【关键字】大数据Hadoop个性化推荐协同过滤1引言信息技术和互联网的发展,使得高校图书馆信息量呈爆炸式增长,读者面对海量的信息感到无所适从,出现了信息过载,如何帮助读者从海量的信息资源中获収到所需的信息,将图书馆传统的被动服务模式转变为主动的、个性化的服务模式,以此來

2、提升图书馆的资源利用率,提高读者的满意度,是现代信息环境下的图书馆亟待解决的问题,基于Hadoop平台下的个性化推荐技术提出了解决方案,通过大数据挖掘与分析技术,为读者提供个性化服务。2图书馆个性化推荐服务需求2.1个性化推荐大数据下的图书馆个性化推荐服务包含推荐系统及推送系统。推荐系统寻找读者关注的焦点,精准定位读者的兴趣,最后由推送系统推送读者感兴趣的内容,通过采集、处理读者在图书馆发生的有关借阅、检索、下载阅览等行为数据,通过大数据挖掘技术分析读者借阅、浏览、下载行为服务存在的相关关联及隐含规律,发现读者的兴趣爱好、阅读习惯,根据一定的算法过滤掉多余的数据,向读者推送他们

3、可能感兴趣或有价值的信息,实现图书馆主动的、个性化服务。数据釆集读者行为数据、标签屈性数据、微博、论坛、社交网络数据等数据处理清洗、转换、筛选、抽取、=>集成、组织等数据应用主动性知识服务、自动化资源发现、个性化推荐服务等数据分析大数据挖掘、特征匹配、建模、计算、过滤、排序等图1个性化推荐服务流程2.2图书馆个性化推荐服务需求图书馆个性化推荐服务就是要投其所好,通过采集处理读者在图书馆发生的借阅、检索、下载阅览等行为数据、读者标签属性数据以及在微博、论坛、社交网络等数据,构造一些算法或规则将读者真正感兴趣、反映读者真实需求的资源推荐给用户,从而提高图书馆资源利用率、提升读者满意

4、度,但是,读者的历史行为既有显性行为如借阅图书、评价图书等,又有隐性行为如浏览网站、发表评论等,这些数据是海量的,而且图书馆提供的信息资源既包括馆藏的纸质图书,还包括TB、PB级的数字资源,这些种类繁多、形式各异的海量数据,增加了图书馆个性化推荐服务难度,同时彰显了个性化推荐服务的迫切性,也提出了更高的服务需求。1.精准性个性化推荐的内容必须精准、全面、新颖,精准是推荐的内容能真实反映读者的真实需求,帮助读者找到他们所需要的、喜欢的资源,全血是推荐的内容尽量涵盖读者需要的、喜欢的资源,全面反映读者各方面的兴趣点,新颖是推荐的内容能够给读者带來惊喜,甚至是帮助读者发现他们可能感兴

5、趣但是却不容易发现的资源,帮助读者找到他们潜在的兴趣点,提升他们的发现能力,实现个性化推荐的价值。1.综合性图书馆个性化推荐服务不仅要推荐传统的馆藏的实体资源,还要把数字资源也纳入到推荐范围,这样就需要有效整合图书管理系统和数字资源管理系统,整合推荐的入口,统一推荐的方式,加强资源的共享,增强个性化服务效应。同时,在海量的信息资源屮,数据形态不再是简单的结构化状态,更多的则是半结构化和非结构化状态,为了更好地为读者提供个性化服务,必须将结构化、半结构化和非结构化的数据都收集起来进行处理,这样才能更好地满足读者对信息资源的需求。2.时效性个性化推荐应讲究时效性,系统能够快速响应新

6、的数据和读者行为事件,并及时推荐相关内容,提高读者满意度。其实个性化推荐系统需要收集、处理、分析的数据来源各异,数据形态多样,数据量庞大,为保证吋效性和准确性,推荐系统分为离线分析处理和实吋处理两部分,离线部分预先处理海量数据运算量大、耗时长、复杂度高的问题,如计算用户相似度,实时部分进行运算量小、耗时小的计算,如更新读者相似邻居集、生成推荐列表等,为增强实时性,进行计算的数据时间跨度不能太长。3.差异性个性化推荐服务应区分一般读者和新读者。对于一般读者,个性化推荐可以通过技术手段获取数据,将读者与信息相关联,通过读者信息特征提取,将读者与读者相区分,从而达到千人千面的效果。对

7、于那些尚未在图书馆发生过借阅、下载阅览等行为的新读者,由于缺少相应的历史行为,产生了用户冷启动问题,个性化推荐系统通过收集新读者的基本属性如性别、专业、学历以及填写的兴趣爱好作为个性化推荐的依据。4.多样性推送服务是个性化消息的出口,是将个性化推荐内容展示给读者的载体,为满足读者的多样化需求,推送形式也应该是多样的,既有PC端,又有手机端,既有网页展示,又有APP,既有短信,又有邮件,既有IOS,又有Andriod,满足不同读者的不同需求,读者能对推送的内容进行订阅或忽略的选择,充分体现图书

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。