基于协同过滤的推荐算法研究

基于协同过滤的推荐算法研究

ID:35061946

大小:4.25 MB

页数:64页

时间:2019-03-17

基于协同过滤的推荐算法研究_第1页
基于协同过滤的推荐算法研究_第2页
基于协同过滤的推荐算法研究_第3页
基于协同过滤的推荐算法研究_第4页
基于协同过滤的推荐算法研究_第5页
资源描述:

《基于协同过滤的推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于协同过滤的推荐算法研究作者姓名高文尧学科专业概率论与数理统计指导教师杨立洪教授所在学院数学学院论文提交日期2016年05月ResearchonRecommendationAlgorithmbasedonCollaborativeFilteringADissertationSubmittedfortheDegreeofMasterCandidate:GaoWenyaoSupervisor:Prof.YangLihongSouthChinaUniversityofTechnologyGuangzhou,Chi

2、na分类号!021学校代号:10561学号:201320120977华南理工大学硕±学位论文基于协同过滤的推荐算法研究作者姓名:高文尧指导教师姓名:、职称杨立洪教授申请学位级别:理学硕±学科专业名称:槪率论与数理统计研巧方向:数据巧掘与统计决策0?口/论文提交日期:2015年05月03日论文笞辩日期;7^分年月^日学位授予单位:华南理工大学学垃授予日期:年月日华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成

3、果。除了文中特别加W标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名;怎3^裏日期:年0支月0(^日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,目P:研巧生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文

4、外);学校可til公布学位论文的全部或部分内容,可允许采用影印、缩印或其它复制手段保、存汇编学位一。致。论文本人电子文档的内容和纸质论文的内容相:本学位论文属于□保密,在年。解密后适巧本授权书^(不保密意在校网上,,同园发布供校内师生和与学校有共享协议的单位浏览;同意将人学位论文提交中国学术盘本期巧光版电子杂志社()全C版编入NKI文出和《中国知资总库》,传播学位论文识源的全部或部分。内容""请在上相应方框V内打()。長。作者签名;日日期年月I。;:指导教师签名日/日期

5、年6月{成;作者联系电话电子邮箱;地址();联系含邮编摘要随着互联网和信息技术的飞速发展,在互联网上用户面临的信息呈现爆炸式的增长,海量的网络信息的满足了用户多样性的信息需求,但是它所带来的信息过载的问题也日趋严重。信息检索和信息过滤技术是解决目前信息过载问题的主要手段,推荐系统作为信息过滤技术的典型代表,近年来逐渐成为解决信息过载问题最有效方法之一。推荐系统诞生以来,许多优秀的推荐算法被学者们提出并应用在商业推荐系统中,协同过滤算法是目前推荐系统中最核心、应用最广泛的推荐算法之一。本文针对传统的基于用户的协

6、同过滤算法所面临的数据稀疏性问题、算法可拓展性问题和相似度计算不准确等问题,给出了相应的改进措施,然后在综合这些改进措施的基础上提出了改进的基于用户的协同过滤算法,具体工作如下:针对基于用户的协同过滤算法的所面临的稀疏性问题,本文从稀疏评分矩阵缺失值的特点出发,给出了综合用户和项目差异的随机填补、基于项目相似性加权的随机填补两种缺失值填补方法,它们能够在保留原始评分矩阵真实信息的基础上减小矩阵的稀疏度。实验表明运用两种填补措施能够一定程度上提高推荐准确度。针对基于用户的协同过滤在最近邻相似度评估时,当用户之间共同评分项目

7、过少的情况下传统相似度评估方法计算不准确的问题,本文根据协同推荐中相似的样本特点,在皮尔逊相似度计算公式的基础上,给出了基于变权重的相似度计算方法,并通过实验与传统的皮尔逊相似度计算公式、Herlocker等人提出的修正的皮尔逊相关性计算公式对比验证,结果表明基于变权重的相似度计算方法能够一定程度上提升算法推荐准确度。针对基于用户的协同过滤算法不区分用户兴趣偏好的差异从而影响推荐效果的问题,本文从用户对不同的风格类型的商品的兴趣偏好差异性特点出发,给出了基于项目划分的近邻搜索方法,即通过聚类的方法对项目进行划分完成用户-

8、项目评分矩阵的分割,然后分别在分割后的子评分矩阵上应用推荐算法,实验结果表明基于项目划分的措施能够提升推荐准确度。最后,本文在综合基于项目相似性加权的稀疏矩阵填补、基于变权重的相似性计算和基于项目划分的近邻搜索三种措施的基础上,提出了改进的基于用户的协同过滤算法,对比实验表明改进算法能够有效提高推荐精度。关键词:推荐

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。