欢迎来到天天文库
浏览记录
ID:34673731
大小:2.49 MB
页数:73页
时间:2019-03-09
《基于协同过滤技术的推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP301.610710-2015224041专业硕士学位论文基于协同过滤技术的推荐算法研究赵尉翔导师姓名职称武雅丽教授专业学位类别申请学位类别工程硕士交通运输工程及领域名称论文提交日期2018年4月2日论文答辩日期2018年5月21日学位授予单位长安大学ResearchonRecommendationAlgorithmBasedonCollaborativeFilteringTechnologyAThesisSubmittedfortheDegreeofMasterCandidate:ZhaoWeixiangSupervisor:Prof.WuYaliChang’a
2、nUniversity,Xi’an,China摘要随着信息时代的快速发展,信息过载问题日益严重,影响到人们的日常生活。因此研究人员提出了推荐技术,推荐系统向用户提供个性化推荐。如何为用户提供更加准确更加个性化的推荐是目前对推荐算法的研究方向。协同过滤推荐算法是互联网公司使用最广泛的推荐算法,尽管协同过滤推荐算法应用广泛,但是随着用户以及商品的数据量不断增加,协同过滤推荐算法暴露出来的问题也越来越多,最终导致协同过滤推荐算法的推荐质量逐渐下滑。若能有效地解决该问题,不仅可以改善用户的体验效果,还可以为公司带来更多的利润。基于以上背景,本文的研究主要针对传统算法中存在的数据稀疏性
3、问题,利用用户评分信息和用户属性信息建立用户混合相似度。并且针对传统算法中没有考虑时间对推荐结果的影响,提出了一种时间衰减因子模型,将其与用户评分相结合得到实际的用户评分,提高推荐结果的准确性。其次,传统的协同过滤推荐算法在计算用户的邻域用户时,必须遍历整个推荐系统中的用户。但是在实际应用中要遍历系统中所有的用户是十分困难的,可行性极低;并且邻域用户数量的选取也是需要解决的一个问题。通过使用聚类技术,邻域用户的搜索范围就可以缩小到与目标用户相似度较高的用户当中,从而可以提高对邻域用户查找的效率。针对传统K-means算法随机初始化聚类中心,造成聚类结果不准确的问题进行改进,提
4、出一种优化初始聚类中心的K-means聚类算法(简称OICK-means),利用混合相似度代替欧氏距离,把相似度较高的用户聚集在同一个聚类簇中,然后根据邻域用户的历史记录预测目标用户喜爱的物品并进行Top-N推荐。在MovieLens-100K数据集上的实验表明,基于混合相似度的OICK-means推荐算法在各项评价指标中均优于传统的协同过滤推荐算法,具有更好的推荐效果。关键词:协同过滤推荐算法,混合相似度,时间衰减因子,K-means,Top-N推荐IAbstractWiththerapiddevelopmentoftheinformationage,theproblemo
5、finformationoverloadhasbecomeincreasinglyseriousandhasaffectedpeople'sdailylives.Therefore,theresearchersproposedarecommendationtechnology,andtherecommendationsystemprovideduserswithpersonalizedrecommendations.Howtoprovideuserswithmoreaccurateandmorepersonalizedrecommendationsisthecurrentre
6、searchdirectionofrecommendationalgorithms.CollaborativefilteringrecommendationalgorithmisthemostwidelyusedrecommendationalgorithmforInternetcompanies.Althoughcollaborativefilteringrecommendationalgorithmiswidelyused,astheamountofdataofusersandcommoditiescontinuestoincrease,theproblemsassoci
7、atedwithcollaborativefilteringrecommendationalgorithmshavebecomemoreandmoreserious.Therecommendedqualityofcollaborativefilteringrecommendationalgorithmisgraduallydeclining.Ifthisproblemcanbesolvedeffectivelythatimprovetheuserexperience,butalsobringmorepr
此文档下载收益归作者所有