基于svd与层次聚类的协同过滤推荐算法实现

基于svd与层次聚类的协同过滤推荐算法实现

ID:28137873

大小:17.99 KB

页数:5页

时间:2018-12-08

基于svd与层次聚类的协同过滤推荐算法实现_第1页
基于svd与层次聚类的协同过滤推荐算法实现_第2页
基于svd与层次聚类的协同过滤推荐算法实现_第3页
基于svd与层次聚类的协同过滤推荐算法实现_第4页
基于svd与层次聚类的协同过滤推荐算法实现_第5页
资源描述:

《基于svd与层次聚类的协同过滤推荐算法实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于SVD与层次聚类的协同过滤推荐算法实现  摘要:在如今这个信息爆炸的时代,我们要面对“信息过载”这一难题;以个性化推荐技术为核心的推荐系统有效的解决这一问题,其中协同过滤算法是目前应用最广泛也是最成熟的个性化推荐技术。基于此,本文提出一种基于SVD与层次聚类中的BIRCH算法来实现协同过滤算法。该算法在MovieLens数据集上的实验数据表明该算法有效的提高了推

2、荐的质量。  关键词:个性化推荐;SVD;BIRCH算法  中图分类号:TP312文献标识码:A文章编号:1007--0130-02  最近几年,协同过滤算法[1]是比较成功并具有代表性的推荐算法,目前协同过滤算法大致分为两类:一是基于内存的协同过滤算法;二是基于模型的协同过滤算法。  本文针对数据的稀疏性、可扩展性等问题提出了基于奇异值分解与BIRCH层次聚类算法[2]的协同过滤算法。并且使用物理学上的能量守恒定律来确定SVD在降维时保存尽可能多的信息。使用BIRCH聚类算法缩小查询最近邻时的范围。实验表明,本文算法能够提高推荐质量。  

3、1传统的基于用户的协同过滤算法为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  在传统的基于用户的协同过滤算法中,我们完成推荐的过程一般分为下面几个步骤:第一:构建评分矩阵:第二:计算相似度,确定K个最近邻;第三:完成预测评分,

4、实现推荐。因此我们完成的推荐的第一步就是对数据进行初始化,构建评分矩阵。  数据初始化  将用户集及评分项目集合构造出一个评分矩阵,其中代表有m个用户,代表有n个项目,表示用户对项目的评分值。  获取最近邻集合  基于用户的协同过滤算法完成推荐功能的第二步是为目标用户找到最近邻的集合,最近邻集合的确定是通过计算相似度来确认的,皮尔森相关系数在计算相似度时更加的准确,设来表示用户u与v之间的相似度,公式如下:  2基于SVD与BIRCH层次聚类的协同过滤算法  在本节中将对本文提出的改进算法进行详细叙述,本算法的主要思想为:首先,通过奇异值分

5、解对原始的用户评分矩阵进行预处理:构造出用户相关矩阵;其次,利用BIRCH算法进行归类,形成K个用户簇;之后根据目标用户确定目标簇并确定最近邻;最后实现top-N推荐。以下将详细叙述该算法的过程:  构造用户相关矩阵为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学

6、校进行培训,熟悉系统的使用和维护。  在利用SVD进行降维时,所选择的降维维数k很重要,在本文中我们将保存原始矩阵的多少能量定义为能量阈值s。我们确定了s的值之后,就可以反向确定维度值k。此能量阈值的值为对角矩阵的前k个奇异值的能量除以全部奇异值的能量的结果。  确定k值之后,我��就可以将对角矩阵只保留前k个奇异值形成新的对角矩阵,从中取前k列变成,从中取前k行变成,其中k远远小于m和n的值,这样就达到了降维的目的。  经过上面的一系列矩阵分解降维处理之后,我们得到了用户特征矩阵,后面的分析都是基于此矩阵。  使用BIRCH算法对用户矩阵

7、进行分类  在经过上一节的SVD处理之后我们得到用户特征矩阵,为了更加高效的获取到目标用户的最近邻,使用BIRCH算法对该矩阵进行聚类。主要思想是:利用树结构帮助我们进行快速的聚类,一般把其称作聚类特征树。该树的任一节点都是由若干个聚类特征组成的。流程如下为:  在内存中构建CF树;  以CF树叶元项对应的子簇为基础,实现数据点的聚类;  改进算法的描述  综合第二节的传统协同过滤算法以及本节前面对SVD以及BIRCH算法的描述,我们可以对本文改进算法进行简要描述:为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于

8、课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。