推荐系统算法课件.ppt

推荐系统算法课件.ppt

ID:57125111

大小:292.50 KB

页数:26页

时间:2020-08-01

推荐系统算法课件.ppt_第1页
推荐系统算法课件.ppt_第2页
推荐系统算法课件.ppt_第3页
推荐系统算法课件.ppt_第4页
推荐系统算法课件.ppt_第5页
资源描述:

《推荐系统算法课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、推荐系统算法速读根据推荐算法的不同,推荐系统可以分为以下几类:·协同过滤(collaborativefiltering)系统;·基于内容(content-based)的推荐系统;·基于网络结构(network-based)的推荐系统;·混合(hybrid)推荐系统;协同过滤系统·核心思想:1.利用用户的历史信息计算用户之间的相似性;2.利用与目标用户相似性较高的邻居对其他产品的评价来预测目标用户对特定产品的喜好程度。系统根据这一喜好程度来对目标用户进行推荐·分类:·基于记忆(memory-based)的算法·基于模型(model-

2、based)的算法基于记忆的算法计算用户评分:设C=为用户集合,S=为所有的产品集合。设为用户c对产品s的打分(在协同过滤算法中,用户c对产品s的打分通过其他用户对s的打分计算而得到。)设为与用户c相似度比高的用户集第一种:直接计算邻居打分的平均值第二种:加权平均(用户之间越相似,则用于预测的权重越大)基于记忆的算法第三种:考虑用户评判的尺度不同k=1/,sim(i,j)表示用户之间的相似度。用户c的平均打分定义为表示该用户打过的所有分的平均值。基于记忆的算法·用户之间相似度的计算:·用户x与y之间的Pearson相关性:用户x和

3、y共同打过分的产品集合为:·夹角余弦(用户x与y都用m维向量表示)优缺点·优点1.具有推荐新信息的能力,可以发现用户潜在但自己尚未察觉的兴趣爱好。2.能够推荐艺术品、音乐、电影等难以进行内容分析的产品。·问题1.冷启动问题(新产品、新用户)2.打分稀疏性问题3.算法可扩展性基于内容的推荐系统核心思想:分别对用户和产品建立配置文件,通过分析已经购买(或浏览)过的内容,建立或更新用户的配置文件。系统可以比较用户与产品配置文件的相似度,并直接向用户推荐与其配置文件最相似的产品。基于内容的推荐算法的根本在于信息获取和信息过滤。(用户的配置

4、文件构建与更新是最为核心的部分之一)基于内容的算法信息获取(TF-IDF):与这个关键词在文件中出现数的逆定义为设Content(s)为产品s的配置文件,UserProfile(c)为用户c的配置文件,UserProfile(c)可以用向量表示,其中每个分量表示关键词对用户c的重要性在基于内容的系统中,被定义为:优缺点优点:1.可以处理冷启动问题;2.不受打分稀疏性问题的约束;3.能推荐新出现的产品和非流行的产品;·问题:1.受到信息获取技术的约束;2.难以从根本上解决冷启动问题。基于网络结构的推荐系统核心思想:不考虑用户和产品的

5、内容特性,而仅仅把他们看作抽象的节点,所有算法利用的信息都隐藏在用户和产品的选择关系之中。考虑一个由m个用户和n个产品构成的推荐系统,其中如果用户i选择过产品j,就在i和j之间连接一条边、.由此,这个系统可以用一个具有m+n个节点的二部分图表示.基于二部分图资源分配的推荐算法对于任意目标用户i,推荐算法的目的是把所有i没有选择过的产品按照i喜欢的程度进行排序,并且把排名靠前的那些产品推荐给i。对于有m个用户和n个产品的一般的推荐系统,如果用表示产品j愿意分配给i的资源配额,可得到其一般表达式:其中kj表示产品j的度(被多少用户选择

6、过),kl表示用户l的度(该用户选择过多少商品)最终的资源分配矢量为一个n维的0/1矢量,给定的目标用户选择过的产品上的初始资源设为1,其他设为0;W为n*n阶的矩阵。按照中对应元素的大小进行排序,值越大说明用户越喜欢该商品。推荐系统的评价指标准确度(被绝大多数推荐系统采用)推荐列表的流行性和多样性覆盖率新鲜性和意外性用户的满意度准确度评价指标预测准确度分类准确度排序准确度预测打分关联距离标准化指标半衰期效用指标预测准确度预测准确度的一个经典度量方法就是度量系统的预测打分和用户的实际打分的平均绝对误差MAE其中c为系统中用户i打分

7、产品的个数,为用户实际打分,为系统的预测打分预测准确度与平均绝对误差相关的其他指标有平均平方误差(MSE)和标准平均绝对误差(NMAE)。其中为系统中用户-产品对(i,a)的个数标准平均绝对误差定义为其中和分别为用户打分区间的最小值和最大值分类准确度分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例广泛使用的分类准确度指标:准确率,召回率以及相关的指标其中,和分别为被推荐产品中用户喜欢和不喜欢的产品数分类准确度相应的,和分别为未被推荐产品中用户喜欢和不喜欢的产品数。而为未被推荐的产品数。显然,准确率定义为系统的推荐列表中

8、用户喜欢的产品和所有被推荐产品的比率:召回率定义为推荐列表中用户喜欢的产品与系统中用户喜欢的所有产品的比率:分类准确度另一个度量系统分类准确度的重要指标就是ROC曲线1)确定用户对每个产品感兴趣与否。2)根据预测结果为用户提供一个推荐列表,从图的原

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。