内容推荐中用户偏好计算方法及影响因素

内容推荐中用户偏好计算方法及影响因素

ID:10066315

大小:29.00 KB

页数:7页

时间:2018-05-23

内容推荐中用户偏好计算方法及影响因素_第1页
内容推荐中用户偏好计算方法及影响因素_第2页
内容推荐中用户偏好计算方法及影响因素_第3页
内容推荐中用户偏好计算方法及影响因素_第4页
内容推荐中用户偏好计算方法及影响因素_第5页
资源描述:

《内容推荐中用户偏好计算方法及影响因素》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、内容推荐中用户偏好计算方法及影响因素  摘要基于内容过滤的推荐系统是为了提高用户在信息过载的情况下进行信息查找与获取而采用的推荐系统。内容推荐对于项目属性明显的系统效果较好。本文提出了一种基于内容过滤的推荐系统模型,针对项目与用户分别建立项目特征空间模型与用户兴趣模型以进行用户偏好度的计算排序。并且讨论了该方法的两个重要影响因素。关键词内容推荐;内容过滤;项目特征空间模型;用户兴趣模型中图分类号TP391文献标识码A文章编号1674-6708(2014)118-0245-020引言7自互联网出现和普及以来,互联网的用户就开始学会了在网络上获取自己所需要的各种信息[

2、1]。在互联网发展的早期,用户一般只能从各个门户网站中做好的分类目录来一级一级查找到自己所需要的信息,这在初期信息量不大的时候是可行的。随着互联网信息量的逐渐增多,搜索引擎的出现使得用户在搜索信息方面得到了极大的便利,这使得用户可以根据自己的需求去主动定制筛选信息的条件,使得信息的查找和获取效率有了极大的提高。但是随着互联网的进一步发展,信息量的大幅增长,即便是搜索引擎也无法完全使得用户在面对海量信息时还能获得对自己真正有用的那部分信息,对信息的接收和处理能力又降低了,再次引发了所谓的信息超载问题。于是个性化的推荐系统开始被提出、设计并实现。个性化的推荐系统就是针

3、对不同的用户提供不同的服务来满足不同的需求。通过分析用户历史的操作记录的方式推算其兴趣点,对每个不同的用户都会有特定的兴趣模型设计,在进行推荐服务时将会结合其兴趣模型来计算推送内容,也因此对于每一位用户来说,推荐结果都系统是根据其兴趣点所特别定制的,不需要的内容便不会被推荐,这极大地节约了用户在查找筛选信息上花费的时间,并提高了用户获取信息的效率。7现有的主要推荐算法,主要有基于内容过滤的推荐,基于协同过滤的推荐,基于关联规则的推荐,以及组合推荐等等。基于内容过滤的推荐是建立在项目自身属性信息基础上的一种推荐算法,其主要依赖的是项目自身的属性信息,而不去考虑用户反

4、馈的项目评价和偏好。基于协同过滤的推荐算法则是利用最近邻技术,利用用户的历史偏好信息来计算用户之间的距离,然后利用目标用户计算出的最近邻居用户来对项目评价的综合评价值来预测目标用户对某一特定项目的偏好程度,系统从而根据这一偏好程度来决定是否对目标用户进行推荐。基于关联规则的推荐算法是以项目间的关联规则为基础,把用户已确定偏好的项目作为规则头,规则体作为推荐其对象。基于内容过滤的推荐有着很多优点,如无项目的冷启动问题和矩阵稀疏的问题,对于偏好小众的用户依然可以进行推荐,在推荐时容易例举出推荐的理由等。1项目特征空间模型为了能够明确的表明用户对于某个项目的兴趣度或者偏

5、好度,首先需要建立该项目的特征空间模型。所谓特征即是指项目自身可以与其他不同项目作为区分标准的属性,所以在选择具体的项目特征时需要根据具体的应用场景进行选择,避免选择无用的亢余属性作为过滤标准。多个特征可以组成项目的特征空间模型,每一个特征称为是该特征空间模型的一个维度。通常来说,一个项目的一个特征可以有多种选择值,例如颜色可以有红、黄、蓝等选择值。为了将某一特征进行量化表达,可以将可选的特征值按系统规范的标准排序,则可以获得一个对该特征的值表示为空的向量。此时特征向量中的元素仍未赋值。7之后需要根据该具体项目所具有的特征值给向量进行赋值。对于所有排序的特征值,项

6、目符合的值置1,不符合的值置0。例如,对于一个项目,其颜色为红色,系统规定其特征向量中分别表示红色、黄色和蓝色,则,其特征向量的具体值应当为。将项目的多个特征向量值都求出后,由这些像两只组成的多维向量即是该项目的特征空间模型。2用户兴趣模型在获取了项目的特征空间模型之后,则需要获取用户对于该类特征空间中各个特征的偏好值,即用户兴趣模型。用户兴趣模型指的是该用户对某一类项目所共享的各种特征的具体值得偏好度,而非对某个具体项目的偏好度。用户兴趣模型的基础数据来源包括用户注册时填写的问卷回答,用户历史操作数据的分析结果,或者结合协同过滤算法依据其最近邻居的偏好来对其偏好

7、进行模拟等。根据用户的基础数据资料,可以获取对某一特征向量上各个特征值的偏好,该偏好可以用向量来表示。这里与中同一特征的索引应当相同,并且两个向量中特征元素的数量应当相等。这里向量的赋值应当由用户基础数据资料计算,将用户对该特征值的每次关注可以累积加1,从而最终获得的是以绝对值表示的向量。为了便于计算,可以将绝对值表示的向量进行标准化处理,使得不同用户在对同一项目进行偏好度计算时可以进行统一标准的比较。7在获取项目的特征空间模型以及用户对于该类项目的兴趣模型之后,便可以结合这两个模型进行排序计算。将向量与中的特征值元素一一对应相乘后累加,则获得的值为该用户对于该项

8、目的偏好度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。