基于用户特征和商品特征的组合协同过滤算法-论文.pdf

基于用户特征和商品特征的组合协同过滤算法-论文.pdf

ID:57924603

大小:211.75 KB

页数:3页

时间:2020-04-14

基于用户特征和商品特征的组合协同过滤算法-论文.pdf_第1页
基于用户特征和商品特征的组合协同过滤算法-论文.pdf_第2页
基于用户特征和商品特征的组合协同过滤算法-论文.pdf_第3页
资源描述:

《基于用户特征和商品特征的组合协同过滤算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第l4卷第3期软件导刊Vo1.14NO.32015年3月SoftwareGuideMar.2Ol5基于用户特征和商品特征的组合协同过滤算法孟庆庆,张胜男,卢楚雍(武汉大学测绘遥感信.g-工程国家重点实验室,湖北武汉430079)摘要:协同过滤算法在电子商务网站推荐系统中的应用非常广泛,其通过分析大量用户的历史行为数据,挖掘用户的兴趣,向用户推荐合适的物品。然而,协同过滤算法存在数据稀疏性问题。针对该问题,提出一种基于用户特征和商品特征的组合协同过滤推荐算法。通过用户基本属性特征、物品分类属性特征以及用户的历史评分记录,计算用户的相似性和物品的相似性,获得近邻用户和

2、相似物品;依据改进的基于物品协同过滤和基于用户协同过滤组合推荐算法,为项目进行评分。实验表明,该方法能降低预测结果的平均绝对误差,提高推荐精度。关键词:协同过滤;属性特征;数据稀疏性;平均绝对误差DOI:10.11907/ridk.143881中图分类号:TP312文献标识码:A文章编号:1672—7800(2015)003—0041-03在大数据中的信息,帮助用户迅速获得所需信息,提高信0引言息查询效率,改善用户体验,同时方便为企业推销产品。目前,apachemahout推荐系统平台,可以帮助开发人员快随着互联网信息的海量增长,一方面用户很难从海量速搭建推荐系统

3、。信息中发现自己真正所需的信息;另一方面也使得大量少人问津的信息成为网络中的“暗信息”,无法被一般用户获1传统推荐算法取口]。推荐系统作为互联网信息和用户快速连接的一种工具,可以帮助用户方便获取感兴趣的信息。推荐系统1.1协同过滤算法技术的出现,使用户不再是被动的网页浏览者,而成为信协同过滤算法是目前应用最为广泛的个性化推荐技息获取的主动参与者]。推荐系统的核心思想是从海量术],其中Grundy被认为是第一个投入应用的协同过滤的用户历史行为数据中分析出与用户兴趣相关的物品信系统『8]。协同过滤算法主要有两种:基于用户的协同过滤息,并向用户进行推荐。推荐系统在电子商

4、务领域应用非和基于物品的协同过滤。基于用户协同过滤的基本思想常广泛,如淘宝、京东、亚马逊等大型网站均有应用。亚马是在大量的用户中挖掘出和目标用户具有相同兴趣的用逊的购书推荐系统,可根据用户的购买情况,向用户推荐户,作为目标用户的近邻,根据近邻与目标用户的相似度,相关书籍;360浏览器的“猜你喜欢”功能,可根据用户的预测目标用户对目标物品的喜爱程度,根据最终计算结果点击情况,向用户推荐相关信息等。排序,将评分较高的物品推荐给用户。基于物品的协同过目前,对于推荐系统还没有明确的分类体系,本文对滤的基本思想是:如大量用户对两个物品的评分非常相推荐系统作如下划分:①根据算

5、法原理,分为基于协同过近,则两个物品是相似的,先计算出物品之间的相似性,再滤算法的推荐、基于内容的推荐、基于关联规则的推荐、基找出近邻物品,结合用户对近邻物品的评分计算出对当前于知识的推荐、混合推荐;②根据应用场景,分为电子商务物品的评分。基于物品的协同过滤算法分为两步:①计算应用中的推荐、社交好友的推荐、信息内容的推荐;③根据物品之间的相似度;②根据物品的相似度和用户的历史行使用的分析数据,分为基于用户行为数据的推荐、基于标为生成推荐列表]。签的推荐、基于上下文信息的推荐、基于社交网络的推荐。1.2相似度计算方法随着互联网络的发展和大数据浪潮兴起,人们逐渐意协同

6、过滤中,由用户的历史评分记录生成用户评分矩识到推荐引擎的重要性,好的推荐系统能够充分挖掘隐含阵R⋯,根据R⋯计算用户相似度以及物品的相似度,作者简介:孟庆庆(1990一),男,河南郑州人,武汉大学测绘遥感信息工程国家重点实验室硕士研究生,研究方向为WebGIS和个性化信息推荐;张胜男(1989一),女,江苏泰州人,武汉大学测绘遥感信息工程国家重点实验室硕士研究生,研究方向为web—GIS;卢楚雍(1987一),男,湖北巴东人,武汉大学测绘遥感信息工程国家重点实验室硕士研究生,研究方向为WebGIS和数据挖掘。软件导刊2015正相似度计算在协同过滤中非常关键,可以提

7、高准确度。种新的相似度计算方法,能改善相似度的计算结果。协同过滤算法中常用的相似性度量方法有余弦相似2.1基于用户特征的相似度计算性、皮尔森相似度、修正余弦相似性等。网站注册中一般会要求用户填写基本信息,例如年余弦相似性的计算将用户评分看作n维空间中的向龄、性别、学历、职业等。本文将用户属性特征信息融人相量,计算向量之间的夹角余弦度量相似性的大小:似度计算,根据采用数据集,考虑用户的性别、年龄、职业信息。sim(一os(1)(1)性别特征。不同性别的用户对商品的需求是不同其中,U,v为两个用户的评分向量。的,性别相似度度量计算公式为:皮尔森相似性是在两个用户共同评

8、分的项目集

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。