基于协同过滤的个性化推荐算法研究与实践

基于协同过滤的个性化推荐算法研究与实践

ID:34138163

大小:185.46 KB

页数:6页

时间:2019-03-03

基于协同过滤的个性化推荐算法研究与实践_第1页
基于协同过滤的个性化推荐算法研究与实践_第2页
基于协同过滤的个性化推荐算法研究与实践_第3页
基于协同过滤的个性化推荐算法研究与实践_第4页
基于协同过滤的个性化推荐算法研究与实践_第5页
资源描述:

《基于协同过滤的个性化推荐算法研究与实践》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第7卷第2期石家庄铁路职业技术学院学报VOL.7No.22008年6月JOURNALOFSHIJIAZHUANGINSTITUTEOFRAILWAYTECHNOLOGYJun.2008基于协同过滤的个性化推荐算法研究与实践刘丹褚蓓蓓郑丽娟(石家庄铁道学院河北石家庄050043)摘要:本设计是在研究协同过滤算法的基础上设计实现一个网上书店系统。该系统实现基于用户的协同过滤算法和基于项目评分预测的协同过滤算法,并且能够为用户展示个性化推荐的结果。关键字:协同过滤算法个性化推荐中图分类号:TP18文献识别码:A文章编号:1673-1816(2008)02-0043-0

2、61研究背景Internet的普及应用为电子商务的蓬勃发展创造了基础条件。电子商务为企业提供了新的商机,同时也提出了新的挑战。如何使广大客户在信息的海洋中方便、迅速、准确地获得所需的信息成为互联网企业必须解决的至关重要的问题。个性化推荐技术的开发和利用是解决这个问题的重要途径。2研究内容本设计是在研究协同过滤算法的基础上设计实现一个网上书店系统。该系统实现了基于用户的协同过滤算法和基于项目评分预测的协同过滤算法,并且能够为用户展示个性化推荐的结果。在此基础上,认真分析了这两种算法存在的不足,提出一种改进的协同过滤算法,并且采用平均绝对偏差MAE作为度量标准对三种

3、算法进行对比测试分析。2.1基于用户的协同过滤算法基于用户的协同过滤推荐根据其他用户的观点产生对目标用户的推荐列表。协同过滤推荐系统使用统计技术搜索目标用户的若干最近邻居,然后根据最近邻居对项目的评分预测目标用户对项目的评分,产生对应的推荐列表。该算法的推荐过程可分为3个阶段:数据表述;发现最近邻居;产生推荐数据集。(1)数据表述。用户评分数据可以用一个mn*阶矩阵A(m,n)表示,m行代表m个用户,n列代表n个项目,第i行第j列的元素R代表用户i对项目j的评分。用户评分数据矩阵(如表1所示)。(2)发现最近邻居。为了找到目标用户的最近邻居,必须度量用户之间的相

4、似性,然后选择相似性最高的若干用户作为目标用户的最近邻居。我们采用余弦相似性度量用户i和用户j之间的相似性。将用户评分看作n维项目空间上的向量,如果用户对项目没有进行评分,则将用户对该项目的vv评分设为0,设用户i和用户j在n维项目空间上的评分分别为向量i和j,则用户i和用户j之间收稿日期:2008-04-27作者简介:刘丹(1981-),女,河北石家庄人,研究方向计算机应用技术研究。43石家庄铁路职业技术学院学报2008年第2期的相似性sim(i,j)为:vvvvijgsimi(,j)==cos(ij,)vvijg表1用户——项目评分数据矩阵项目用户Item…

5、…Item……Item1knUserR1,1……R……R11,k1,n………………………………UserR……R……Rii,1ik,in,………………………………UserR……R……Rmm,1mk,mn,(3)产生推荐数据集。设用户u的最近邻居集合用NBSu表示,则用户u对项目i的预测评分Pui,NBS可以通过用户u对最近邻居集合u中项目的评分得到,计算方法如下:ånÎNBSsimu(,nRR)*()n,in-PR=+uu,iuå(simun(,))nÎNBSu(1)式中,simun(,)——用户u与用户n之间的相似度;Rni,——用户n对项目i的评分;Ru——用

6、户u对项目评分的平均评分;Rn——用户n对项目评分的平均评分。然后依据项目的评分,选择评分最高的N个项目组成推荐集,推荐给目标用户。2.2基于项目评分预测的协同过滤算法随着电子商务系统规模的扩大,用户数目和项目数目指数级增长,用户评分数据极端稀疏。在这种情况下,传统的相似性度量方法存在相应的弊端,使得计算得到的目标用户的最近邻居不准确,推荐系统的推荐质量急剧下降。基于项目评分预测的协同过滤算法是针对这种情况而提出的一种改进算法。该算法同基于用户的协同过滤推荐算法一样,推荐过程可分为3个阶段:数据表述;发现最近邻居;产生推荐数据集。和基于用户的协同过滤算法相比,改

7、进的是在计算用户相似度时,对于未评分的项目(称为目标项目),首先计算项目间的相似度,选择若干相似度最大的项目作为目标项目的最近邻居集,然后根据用户对相似项目的评分预测用户对目标项目的评分,调整后两个用户对项目集合上的项目均有评分,即对项目集合上的任意项目p,用户i对项目p的评分为:ìïrip,Rip,=í,其中rip,为用户i对项目p的评分,Pip,为用户i对未评分项目p的预测评分。ïîpip,该算法中计算项目间的相似性,与计算用户间相似性类似,首先需要得到项目i和项目j的所有用P户评分,然后通过相似性度量方法计算项目i和项目j之间的相似性。计算用户i对项目p的

8、评分ip,采用如下公式:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。