基于聚类的协同过滤推荐算法研究

基于聚类的协同过滤推荐算法研究

ID:35069665

大小:5.54 MB

页数:65页

时间:2019-03-17

基于聚类的协同过滤推荐算法研究_第1页
基于聚类的协同过滤推荐算法研究_第2页
基于聚类的协同过滤推荐算法研究_第3页
基于聚类的协同过滤推荐算法研究_第4页
基于聚类的协同过滤推荐算法研究_第5页
资源描述:

《基于聚类的协同过滤推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕±学位论文(工学硕±)基于聚类的协同过滤推荐算法研究陈传瑜二〇—六年五月分类号:学校代号:11845UDC:密级:学号:2。1305023广东工业大学硕±学位论文(王学硕±)基于聚类的协同过滤推荐算法研究陈传瑜指导教师姓名、职称:陈平华教授学科专业或领域名称:计算机科学与技术()学生所属学院:计算机学院—论文答辩日期:二〇六年五月ADissertationSubmittedtoGuandongUniversitof

2、gyTechnolofortheDereeofMast巧gyg(MasterofEnineerinScience)ggResearchofCollaborativeFilteringRecommendationAlgori化m目asedonClusteringMe1;hodsCandidate:ChenChuanuySuervisor:Prof.ChenPinhuapgMa2016ySchoolofihnoloComputerScenc

3、eandTecgyGua打gdo打gU打iversitofTechnoloygyGuanzhouGuando打P.■艮China510006g,g呂,,摘要摘要随着Internet和移动终端快速发展和迅速普及,互联网数据呈爆炸性地增长,出现""了信息过载问题。如何在海量数据里找到用户真正感兴趣的信息并将其推荐给用户成为了业界研巧的热点。推荐系统能帮助用户挖掘海量数据里深层次潜在的信息,帮助用户快速获取需要的内容,从而被广泛应用=协同过滤是当前较成功的推荐算法一,,其

4、简单的模型概念和实现过程备受大型企业青睐之。但是协同过滤也存在着冷启动、数据稀疏、计算效率tiA及系统可扩展性等方面的问题。针对协同过滤存在的冷启动和数据稀疏问题,本文引入李德毅院±提出的5模型概念。云模型属于不确定人王智能领域,主要是将多维向量映射至H维向量,使用期望、滴和超煽等数学特征进行量化,这也使得问题从局部扩展到全局,从而降低数据一稀疏和冷启动带来的负面影响,。另外本文结合云模型提出种改进的相似度计算模型,,,该计算模型可レッ更好地描述用户(项目)间的相似性。最后在计算云特征时还考

5、虑用户的偏好因素,如时间因素、评分因素等。针对协同过滤存在的系统计算效率一二叉树的、可扩展性问题,本文提出种基于聚类算法,。协同过滤计算效率低下的原因是在计算最近邻时需计算目标用户与所有,从而获得与目标用户最相似的用户集用户的相似性。因此使用聚类算法减少近邻比-‘,较次数成为研究热点。KMeans算法不仅受限于初始中。和K值的设定而且还存在一用户不能同归属于多类别等方面的问题,故本文提出种改进聚类算法。其主要是将一二叉K-Means相结合数据结构树和聚类算法,形成种新的层次聚类算法。二叉树的

6、聚一最后,本文将基于类算法和云模型相融合,形成种基于聚类的改进推荐算法,。在计算过程中由于结点之间的无关联性本文引入基于内存的分布式计算Sark,框架,并将本文算法在该平台上并行实现本文算法不仅可提升p。经由实验证明,还能够通过并行化从而提高系统可扩展性准确性。,本文在模拟现实集群环境下,对提出的基于聚类的协同过滤算法进行测试主要是用于评估推荐算法的稳定性、准确性W及响应时间,为该推荐算法进行了比较科学有效的评估。对比实验结果发现,本文提出的基于聚类的协同过滤算法在稳定性、精确性,、高效性W

7、及可扩展性等方面均表现优异满足算法要求。二叉过滤S关键词:云模型;树;协同;聚类算法;parkIABSTRACTABSTRACTWiththerapiddevelopmenta打doularizationoftheInternetandMobUeTerminals,ppInternetinformationcontentrenderexonentiallsureichwillalsowhleadtothepyg,*informatio打ove

8、rloadproblem.Howtofmdusersreallyin化ie巧edi打hugeamountsofdatainformatio打andrecommendittotheuserhasbecomeahotresearchintheindustry.民sthl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。