基于个性化图书推荐的协同过滤算法

基于个性化图书推荐的协同过滤算法

ID:21586646

大小:24.50 KB

页数:5页

时间:2018-10-23

基于个性化图书推荐的协同过滤算法_第1页
基于个性化图书推荐的协同过滤算法_第2页
基于个性化图书推荐的协同过滤算法_第3页
基于个性化图书推荐的协同过滤算法_第4页
基于个性化图书推荐的协同过滤算法_第5页
资源描述:

《基于个性化图书推荐的协同过滤算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于个性化图书推荐的协同过滤算法  摘要本文对基于个性化图书推荐的协同过滤算法的设计方案进行实验,目的是为证实在真实用户的多标准评估过程中怎样产生数据集,从而找到一种科学的算法。并通过图书推荐的应用案例来说明算法,以验证其是否有效。  【关键词】个性化图书推荐协同过滤算法邻居选择  面对巨大的网络数据库,个性化推荐可以及时的追踪用户需求而针对性的优化信息服务的内容与手段,其能帮用户有效处理过载的信息。如今推荐系统已发展成能够产生个性化推荐亦或是引导用户通过个性化的形式到很大的空间中去选择自己的目标商品。本文为研究基于个性化图书推荐的协

2、同过滤算法,通过模拟实验分析多标准推荐系统若干设计方案的有效性。  1多标准协同过滤  所谓推荐系统就是帮客户找到其感兴趣或符合其需求的信息的手段,它主要是两个方面,一是预测某特定用户是不是喜欢某一特定项目,二是识别某个用户所感兴趣的项目。推荐问题可以作下述定义:c是全部用户的集合,s是所推荐的全部可能的项目,uc(s)是一功效函数uc(s):c×s→R+,用来评价将项目s推荐给用户c是否适宜。假设该函数对整个c×s空间未知,仅在其部分子集中已知,需各用户c∈C可以预测S中项目s的功效函数uc(s),在S中,uc(s)未知,也就是∨c

3、∈C,s=maxuc(s)。在大部分推荐系统内,函数uc(s)一般都只考虑项目的某一属性。  协同推荐是在某一用户被推荐以往与其有同样兴趣爱好的人感兴趣的项目,而协同过滤是基于有类似爱好的其他人的推荐去预测客户对新项目的兴趣。单属性协同过滤把问题空间定义成“用户-项目矩阵-评分矩阵”。而协同过滤的目标即为基于以往其他用户对此项目的评价,针对某一特定用户,预测其功效。  2SVD因式分解以实现协同过滤  在设计实现推荐系统,选择推荐算法时,大多考虑协同过滤的使用,但是CF中经常使用的两种方法包括:neighbor-based方法和因式分

4、解。作为一个搜索推荐系统,百度关键词系统中也使用了CF为用户推荐流量,考虑到可解释性。但因式分解会从全局考虑用户投票的影响,所以理论和实践上效果都会更好。  2.1根据优先权的相似性算法  该算法与活动用户的属性wai(i=1,…,n)相比较看有类似的优先权。即推荐基于用户的意见,当选择某一项目时,分配类似的权重给每一评估标准。相似性计算就是测量用户a和用户c之间的属性矢量距离。相似性计算有以下2种。  (1)欧氏距离计算:  (2)余弦相似性:  邻居的形成通过2种手段,即相关权重阈值以及最大邻居数。为准确预测,并结合评分有3种办法

5、。  (1)简单数学均值:  (2)加权平均值:  (3)均值离差:  2.2SVD在推荐系统中的应用与实现  其中n表示用户数目,m表示物品数目,I[i][j]是用来表示用户i有没有对物品j评过分,因为我们只需要评过分的那些越接近越好,没评过的就不需要考虑,Vij表示训练数据中给出的评分,也就是实际评分,p(Ui,Mj)表示我们对用户i对物品j的评分的预测,结果根据两向量点乘得到,两面的两项主要是?榱朔乐构?拟合,之所以都加了系数1/2是为了等会求导方便。  具体公式为:  3实验设计分析  针对此实验,考虑具有一定相似性计算的3个

6、方案,即欧氏距离、余弦相似性以及皮尔逊相关。尚未考虑部分特定的方法针对特性加权,将该因素设置成1,邻居的形成应用到2个方法,也就是相关加权阈值以及最大近邻,最终结合评分设计3个方案。文章的目的是建设数字图书馆,宗旨是帮助用户寻找其所感兴趣的图书。用户经过注册后能够登录该系统,登录后需应用有关的评价标准。模拟系统用于形成一组200用户,200项目以及750评价的集合,这当中600评价用作该算法的训练集,其余150评价用作测试集。以上评价在模拟里进行处理时,会以80%→20%的比例分配至训练集以及测试集中。对实验的分析时,应用2个性能评价

7、办法。第一是准确度,第二是覆盖率,与其他算法对比,本文的算法在MAE指标上比以前的算法提高9.8%,时间复杂度降低19.7%,有效提高了图书推荐的准确率。  4结语  文章用一组合成的数据集合,指出对个性化图书推进这个特定的应用,以及2种协同过滤算法的设计实验方案。此合成数据集合的多标准评估用某一合适的模拟产生,基于如此的数据集合的实验测试仅可用于初始评估,一旦能够得到真实用户的评估,就要重复进行实验。接下来的研究应是探索具有适应性的推荐系统,如此系统会动态的选择适宜的推荐算法抑或是按照评估数据集合的特性变化。  参考文献  [1]张

8、迎峰.面向数字图书馆的个性化推荐算法研究[D].合肥:中国科学技术大学,2011.  [2]安德智,刘光明,章恒.基于协同过滤的图书推荐模型[J].图书情报工作,2011,55(1):35-38.  [3]张海荣,朱信忠

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。