基于改进的聚类和非对称相似度的协同过滤算法研究

基于改进的聚类和非对称相似度的协同过滤算法研究

ID:35180142

大小:6.78 MB

页数:72页

时间:2019-03-20

基于改进的聚类和非对称相似度的协同过滤算法研究_第1页
基于改进的聚类和非对称相似度的协同过滤算法研究_第2页
基于改进的聚类和非对称相似度的协同过滤算法研究_第3页
基于改进的聚类和非对称相似度的协同过滤算法研究_第4页
基于改进的聚类和非对称相似度的协同过滤算法研究_第5页
资源描述:

《基于改进的聚类和非对称相似度的协同过滤算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕±学位论文(工学硕±)基于改进的聚类和非对称相似度的协同过滤算法研究欧仕华二〇—六年五月:11845分类号:学校代号:2111305047UDC;学:密级号广东工业大学硕±学位论文(工学硕±)基于改进的聚类和非对称相似度的协同过滤算法研究欧仕华、职称:刘竹松副教授指导教师姓名专业或领域名称:软件工程:计算机学院学生所属学院:2016年5月论文答辩日期,ADissertationforMast;ersDegreeofGuangdonUniversitofg

2、yTechnology(eer)MasterofEngini打gScienceResearchonRecommendatlionAgo「i化mBasedoniiImprovedClusterngandAsymmetricUserSimilartyCandidate:OuShihuaSurvisor:ProfLiuZhusonpe.gMay20化SchoolofComputerScienceandTechnologyGuangdongUniversityofTechnologyGuanz

3、houGuandonP.R.China510006g,,,gg摘要摘要社交网络的快速发展导致信息网络中容纳的信息数据飞速增长,但人们要从这些海量数据中有效获取真正符合需求的部分反而变得更为困难,推荐系统应运而生。,推荐系统通过对用户的历史行为数据进行分析建模发掘用户潜在的兴趣,进而向用户推荐商品或信息。其中推荐系统中应用最广的算法是协同过滤算法,该算法通过相似用户的选择或者相似项目的评分来预测目标用户对项目的评分。传统的基于一用户相似度的协同过滤算法存在两种缺陷,:是认为用户之间的相似度是对称的这个假设在某些情况下会导致错误;二是在选

4、择用户的k近邻时,目标用户需要和其他所有用户进行项目评分进行计算比较,当用户数量不断增长时,寻找k近邻的计算成本会变得很高。本论文深入分析了现有用户相似度度量方法的存在的问题,提出了改进的用户相似度度量方法。此外研究了聚类算法来解决k近邻选取效率不高的问题,提出了一一-means聚类算法种改进的K。最后结合这两种改进算法设计了种新的协同过滤算法:。论文的主要工作如下一1、通过实例对现有的用户相似度度量方法存在的问题进行阐述,提出了种非对称的用户相似度度量方法,该方法能合理的表示用户之间相似性的关系。此外本文介绍了现阶段解决数据稀疏性的常用模

5、型;隐语义模型,该模型通过奇异值分解来对未知评分值进行预测。本文将非对称相似度模型和隐语义模型结合起来,设计一ov了种基于非对称相似度的协同过滤算法。最后在MieLens和Douban数据集上进行实验,(RMSE)和平均绝对误差(MAE)作为评价标准使用均方根误差。实验表明该相似度度量方法对能在一定程度上提升推荐质量。2K-mean,、对传统的s聚类算法进行了介绍并通过实验来说明传统算法存在一的两个问题,是聚类中必个数难1^确定,往往依赖于算法使用者对数据所在领域、的熟悉程度;二是由于初始聚类中屯选择的随机性,多次聚类的结果不稳定,而且一-容易

6、出现局部最优解种基于个体轮廓系数的改进Kmeans聚类算法,。文中提出、该算法能够自适应地确定聚类中屯,的个数并使聚类中也合理分布在数据对象中,,而且多次聚类的结果很稳定,该改进算法继承了传不仅聚类效果有所提升。此外I广巧工业大学巧去学位论文统算法效率高、容易实现的优点。最后,本文利用此算法对前面提出的协同过滤算一-,means的协同过滤算法法进行改进提出了种基于非对称相似度和改进的K。改进后的推荐算法在确定用户k近邻时用户检索范围大幅度减少,能够更快确定最近邻居集合,推荐效率有所提升。实验中对比了其他几种推荐算法,证实了本文提出的推荐

7、算法具有较好的推荐质量。-:kmeans聚类关键词;非对称加权因子;协同过滤;隐语义模型;推荐算法IIABSTRACTABSTRACTTheralmentofillidhipiddeveopsocanetworkseadstotherapgrowtofnformationdataofnetwork,butithasbecomemoredifficultforpeopletoeficie打tlymeettherealar

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。