基于最短路径的随机游走的图聚类算法

基于最短路径的随机游走的图聚类算法

ID:31360606

大小:122.00 KB

页数:12页

时间:2019-01-09

基于最短路径的随机游走的图聚类算法_第1页
基于最短路径的随机游走的图聚类算法_第2页
基于最短路径的随机游走的图聚类算法_第3页
基于最短路径的随机游走的图聚类算法_第4页
基于最短路径的随机游走的图聚类算法_第5页
资源描述:

《基于最短路径的随机游走的图聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于最短路径的随机游走的图聚类算法  摘要:现实世界中的许多系统都以网络图形式存在,并且近年来图聚类作为一种重要的分析手段已经得到越来越多的关注。在众多图聚类算法中,谱图聚类算法以其高效性、易于实现以及坚实的理论基础等特性已经得到越来越多的关注。本文提出一种基于最短路径的随机游走的谱图聚类算法。该算法利用基于最短路径的局部随机游走模型将数据点之间的距离转化为随机游走的转移概率,通过随机游走的转移概率构造相似矩阵,最后利用谱方法得到聚类结果。实验结果表明,使用本文所提出的聚类方法可以有效提高聚类效果。  关键字:随机游走;图聚类;最短距离;谱聚类

2、  中图分类号:TP311文献标识码:A文章编号:2095-2163(2015)06-  Abstract:Therearemanysystemsexitingintheformofnetworkintherealworld.Andthegraphclusteringasanimportantanalysismethodhasgainedmoreandmoreattentioninrecentyears.Thespectralgraphclusteringalgorithmismorepopularbecauseofitshighefficie

3、ncy,easytoimplementandsolidtheoryfoundation.ThispaperproposesaGraphClusteringAlgorithmbasedonRandomWalkModeloftheShortestPath.Thisalgorithmusestherandomwalkmodelbasedontheshortestpathtotransferthedistancebetweentwodatapointstothetransitionprobability,andstructuresthe12simila

4、ritymatrixbythetransitionprobability.Thenthepapergetstheresultbyusingthespectralclusteringalgorithm.Theexperimentalresultsshowthatusingthepresentedclusteringmethodcaneffectivelyimprovetheclusteringeffect.  Keywords:RandomWalk;GraphClustering;ShortestDistance;SpectralClusteri

5、ng  0引言  聚类是最常用的数据分析技术之一,已经被广泛地应用到模式识别、数据挖掘和图像处理等领域。聚类分析是一个将数据样本划分为由相似对象组成的分组的过程。每一个组称为一个簇,每个簇中的数据对象的相似度大,而不同簇中的对象相似度小。从机器学习的角度来看,搜索簇就是一个无监督学习的过程。大数据图有很多内部具有实际意义的数据对象组成,两个数据对象间的相似关系可以转化成图模型。现实世界中的许多系统都是由网络图形来进行表示的,比如Facebook上的朋友关系网、生物上的蛋白质互质网络、科学家合著网络以及网页之间的超链接都是常见的网络图模型。近年来

6、图聚类作为一种重要的分析手段已经得到越来越多的关注。图聚类[1]主要是将图上的节点划分为一些子图,使得这些节点在类内具有较强的连接而类间的连接则相对较弱。图聚类不仅有助于可视化和发现层次结构[2],还具有实际的意义,比如社区发现[3-4]、孤立点检测[5]等,此外聚类的结果也可以用来构建模块,使得在一些算法中可以降低图或模块的复杂度[6-7]。12  谱分析方法已经成功地运用在解决数据聚类和图划分的问题方面。谱聚类是一种基于图论的聚类分析方法,近几年,由于谱聚类的高效性、易于实现以及成熟的理论基础等特性已经得到越来越多的关注,并被广泛应用在图像

7、处理、计算机视觉、数据挖掘、机器学习等领域[8]。其基本思想是通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。关于谱聚类算法已经有很多人做了研究,其中经典的算法有Perona和Freeman提出的PF算法[9]、Shi和Malik提出的SM算法[10]、Ng和Jordan等人提出的NJW算法[11]以及Meila提出的MS算法[12]等。谱聚类克服了传统聚类方法仅在凸球形状数据集上效果很好和会陷入局部最优解的局限性,其在任意形状数据集的聚类效果都比较理想且可以收敛到全局最优解。  本文将提出一个新的高效的基于最短路

8、径的随机游走的图聚类算法(DWSC)。利用基于最短路径的局部随机游走模型将数据点之间的距离转化为随机游走的转移概率,通过随机游走的转移概率构造相似矩阵

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。