读书笔记(推荐系统实践)

读书笔记(推荐系统实践)

ID:14421548

大小:231.51 KB

页数:18页

时间:2018-07-28

读书笔记(推荐系统实践)_第1页
读书笔记(推荐系统实践)_第2页
读书笔记(推荐系统实践)_第3页
读书笔记(推荐系统实践)_第4页
读书笔记(推荐系统实践)_第5页
资源描述:

《读书笔记(推荐系统实践)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《推荐系统实践》读书笔记参考文献:项亮.推荐系统实践[M].1.人民邮电出版社,2012.1好的推荐系统随着信息技术和互联网的发展,人们开始进入一个信息过载的时代,在这个时代,不管是信息的生产者,还是信息的消费者,这都将给他们带来一种困惑:对于信息生产者来说,在这大量的信息当中,如何做到将自己的信息展现给需要此信息的用户成为一件很困难的事情;对于信息消费者来说,如何从海量的信息当中获取自己需要的信息也成为了一件不易的事情。推荐系统能够解决以下问题,可以帮助信息生产者将自己的信息展现在对此信息感兴趣的用户面前,也能为用户到找自己感兴趣或需求的信息

2、,因此,对于信息生产者和消费者来说,推荐系统能够实现双赢。1.1什么是推荐系统?推荐系统就是根据用户的历史行为,判断用户的兴趣偏好,为用户推荐用户可能感兴趣的信息。1.2推荐系统的任务是什么?推荐系统的任务就是联系用户和信息,一方面帮助用户找到对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者与信息生产者的双赢。1.3推荐系统与搜索引擎的关系、异同?从某种意义上讲,对于用户来说,两者是一个互补的关系,搜索引擎帮助用户找到有明确需求的信息,而推荐系统则是帮助用户在没有明确需求的情况下找到感兴趣的新内容。相同点,它

3、们都是帮助用户快速找到有用信息的工具。不同点是,1)推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为为用户建立模型,从而主动地给用户推荐满足他们感兴趣和需求的信息。2)使用搜索引擎时用户需要提供明确的需求。1.4个性化推荐系统的应用个性化推荐系统的成功应用需要两个条件。第一个是存在信息过载,因为如果信息不多,那么用户就可以很容易地从信息当中找到自己需要的那部分,这样的话,就不需要个性化推荐系统了。第二个是用户大部分时候没有明确的需求,因为如果用户有明确的需求,那么用户就可以通过搜索引擎找到自己需要的信息了。广泛利用推荐系统的领域包括

4、电子商务、电影和视频、音乐、社交网络、阅读、基于位置的服务、个性化邮件和广告等。电子商务:根据用户的浏览行为、点击行为、购买行为、商品评分等一系列历史行为,向用户推荐商品。如Amazon,淘宝。电影和视频:帮助用户在浩瀚的视频库中找到令用户感兴趣的视频,在该领域成功使用推荐系统的一家公司是Netflix,它和亚马逊是推荐系统领域最具代表性的两家公司。音乐:因为音乐的数量实在是太多,用海量来形容一点都不为过,而且在大多数时候,用户都没有明确想听的歌曲,所以个性化音乐推荐很有必要。国际上著名的有Pandora和Last.fm,国内有豆瓣。社交网络:

5、根据用户之间的社交网络关系和用户的偏好信息向用户提供各种信息。如Facebook和Twitter。个性化阅读:互联网上的文章非常多,用户面临信息过载的问题,并且,用户很多时候只是想关注一下自己感兴趣的领域,并没有必须想看的特定的文章,所以个性化阅读需要个性化推荐系统,如GoogleReader,Zite和Flipboard。基于位置的服务:比如你在一个陌生的地方,这个时候,你需要找一个餐馆吃饭,找一个宾馆休息,这个时候,你需要一个个性化推荐系统为你推荐餐馆,推荐宾馆。基于位置的服务推荐系统通常和社交网络结合在一起,这样可以通过获取社交网络里的个

6、人信息、社交网络关系,达到个性化推荐。如Foursquare。个性化邮件:垃圾邮件过滤,优先级收件箱功能等。个性化广告:个性化广告投放和狭义个性化推荐的区别是,个性化推荐着重于帮助用户找到可能令他们感兴趣的物品,而广告推荐着重于帮助广告找到可能对他们感兴趣的用户,即前者以用户为核心,后者以广告为核心。1.5推荐系统评测一个完整的推荐系统一般存在3个参与方:用户、物品提供商和提供推荐系统的网站。在评测一个推荐算法时,需要同时考虑三方的利益,一个好的推荐系统是能够令三方共赢的系统。为了全面评测推荐系统对三方利益的影响根据不同的角度出发,提出不同的指

7、标,这些指标包括准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。这些指标中,有些可以离线计算,有的只有在线才能计算,有些只能通过用户调查问卷获得。离线计算步骤:1)准备数据集;2)将数据集按照一定的规则分成训练集和测试集;3)在训练集上训练用户兴趣模型,在测试集上进行预测;4)使用预先定义的指标评测预测结果。表格1离线实验的优缺点优点缺点不需要有对实际系统的控制权无法计算商业上关心的指标不需要用户参与实验离线实验的指标与实际商业使用的指标存在差距速度快,可以测试大量算法用户调查:可以获取用户的主观感受的指标,但是代价大。在线实验:完成离线实验

8、和必要的用户调查后,可以上线做AB测试,AB测试是一种很常见的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组,并对不同组的用户采用不同的算

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。