基于灰关联分析的谱聚类

基于灰关联分析的谱聚类

ID:32372667

大小:188.26 KB

页数:7页

时间:2019-02-03

基于灰关联分析的谱聚类_第1页
基于灰关联分析的谱聚类_第2页
基于灰关联分析的谱聚类_第3页
基于灰关联分析的谱聚类_第4页
基于灰关联分析的谱聚类_第5页
资源描述:

《基于灰关联分析的谱聚类》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、1基于灰关联分析的谱聚类郭昆1,张岐山2(1.福州大学数学与计算机科学学院,福州350108;2.福州大学管理学院,福州350108)摘要谱聚类作为一种建立在谱图理论基础上的聚类方法,具有能够处理任意空间形状数据且收敛于全局最优解的优点,但其对参数非常敏感,参数值微小的变化都会影响聚类精度。提出一种将基于差异信息理论的灰关联分析结合到谱聚类中的新方法,利用序列的均衡接近度描述数据点的相似程度,在克服参数影响的同时提高了传统谱聚类算法的性能。实验结果证明了新方法的有效性。关键词灰关联分析;聚类;谱聚类中图分类号TP301文献标识码ASpect

2、ralclusteringbasedongreyrelationalanalysisGUOKun1,ZHANGQi-shan2(1.CollegeofMathematicsandComputerScience,FuzhouUniversity,Fuzhou350108,China;2.SchoolofManagement,FuzhouUniversity,Fuzhou350108,China)AbstractAsamethodbuiltuponspectralgraphtheory,spectralclusteringhastheadvan

3、tagesofprocessingdatawithanyspatialshapesandconvergingonglobaloptimalsolutions.Butitalsosuffersfromthedefectthattheclusteringresultisquitesensitivetoitsparameter.Aminorchangeofthevalueoftheparameteraffectstheclusteringaccuracygreatly.Inthispaper,anovelapproachwhichintegrates

4、greyrelationalanalysisbasedondifferenceinformationtheorywithspectralclusteringisproposed.Thesimilaritiesbetweendatapointsaredescribedbythebalancedclosenessdegreesoftheirattributesequences,sothattheimpactoftheparameteriseliminatedandtheperformancecanbeimprovedsimultaneously.

5、Theexperimentalresultsprovedtheeffectivenessofthenewmethod.Keywordsgreyrelationalanalysis;clustering;spectralclustering1引言聚类分析是机器学习领域的一个重要研究方向,作为一种有效的数据分析方法,已经被广泛应用于机器视觉、文本检索、语音识别等领域。传统的聚类算法(如:K-Means算法、EM算法等)当样本空间接近凸球形时聚类效果较好,但当样本空间为任意形状时,容易陷入局部最优解。谱聚类算法最早主要应用于计算机视觉[3]、VLS

6、I[4]设计等领域,最近才被扩展到机器学习中。由于其具有识别非凸分布的能力,不受数据维数的影响,及能够收敛于全局最优解等优点,受到人们的广泛关注,并迅速成为机器学习领域收稿日期:2009-05-05资助项目:国家自然科学基金(70871024);国家自然科学基金(70571015);福建省自然科学基金(A0620001);福建省教育厅项目(JB09006)作者简介:郭昆(1979-),男,博士研究生,主要研究方向为灰色系统、数据挖掘、决策支持系统和计算机软件理论等,E-mail:gukn@fzu.edu.cn;张岐山(1962-),男,博士

7、,博士生导师,主要研究方向为灰色系统、商务智能、物流管理和系统仿真等。2的研究热点[5]。但是,现有谱聚类算法对其参数变化非常敏感,参数值微小的变化都会影响聚类效果,且不同数据集的最佳参数值也各不相同,影响了算法的适用性[6]。灰色理论作为一种处理现实中存在的部分信息明确、部分信息不明确的“小样本”、“贫信息”不确定性问题的有力工具,已经在油气勘探、工业控制、图像处理、网络安全、经济预测、物流管理等多个学科领域得到广泛应用[1]。本文提出利用基于差异信息理论的灰关联分析中均衡接近度的概念来测度数据点间的相似度,以改进现有谱聚类方法的性能,实

8、验证明新方法能够得到更好的聚类结果。2灰关联分析灰色系统理论是由邓聚龙教授于1982年提出的一种处理不确定性和非线性问题的系统理论,主要包括灰哲学、灰生成、灰分析、灰建模、灰预测

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。