数据的多流形及子空间的聚类模型研究

数据的多流形及子空间的聚类模型研究

ID:19143611

大小:1.02 MB

页数:25页

时间:2018-09-20

数据的多流形及子空间的聚类模型研究_第1页
数据的多流形及子空间的聚类模型研究_第2页
数据的多流形及子空间的聚类模型研究_第3页
数据的多流形及子空间的聚类模型研究_第4页
数据的多流形及子空间的聚类模型研究_第5页
资源描述:

《数据的多流形及子空间的聚类模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、参赛密码(由组委会填写)第十二届“中关村青联杯”全国研究生数学建模竞赛学校北京航空航天大学参赛队号B10006005 1.朱日东队员姓名2.黄博3.王敬凯参赛密码(由组委会填写)第十二届“中关村青联杯”全国研究生数学建模竞赛题目数据的多流形和子空间聚类模型研究摘要:本文通过对子空间聚类问题和多流形聚类问题的分析,针对相应的数据结构建立了多种聚类数学模型:K均值聚类、谱聚类(SpectralClusteerring,SC)、基于CVX的稀疏子空间聚类(SparseSubspaceClustering,SSC-CVX)

2、、基于交替方向乘子法的稀疏子空间聚类(SSC-ADMM)、谱曲率聚类(SpectralCurvatureClustering,SCC)、稀疏流形聚类(SparseManifoldClusteringandEmbedding,SMCE)和谱多流形聚类(SpectralMulti-ManifoldClustering,SMMC)模型,并综合运用这些模型完成了数据的分类,并且实现的聚类效果是非常可观的。第一问中,数据在两个独立的子空间,聚类相对容易,因此我们首先采用经典的K均值聚类与SC进行聚类,得出分类结果。为一步验证

3、分类结果,我们采用SSC-CVX、SSC-ADMM、SCC、SMCE四个模型分别对数据进行分类,实验结果表明所有算法均可得到相同的分类结果:第1个数据到第40个数据以及第141个数据到第200个数据属于第一类,第41个数据到第140个数据属第二类。第二问中,要解决四个低维空间中的子空间聚类问题和多流形聚类问题。本文采用SMMC,SCC,SMCE三个模型对四组数据分别进行分类。其中通过选取合适的参数,SMMC非常好的对四组数据进行了分类,得到了题目要求的结果;SCC对(a),(b)中的数据进行了很很好的分类,得到了题

4、目要求的结果;SMCE对(c)中的数据进行了很好的分类,得到了题目要求的结果。第三问中,(a)的数据在分布上与第二问中(a)的数据具有一定的相似性,因此对该数据采用SCC和SMMC模型进行聚类,两种方法都实现了题目要求的分类格式,将数据按照“横”和“竖”分两类。(b)中采用SSC-ADMM模型对运动的特征点轨迹进行分类。本文首先采用此算法进行分类。又已知,同一运动的特征点轨迹在同一个线性流形上。所以我们也尝试采用流形聚类方法:SMCE和SMMC模型对运动特征轨迹分类。为了验证和分析分类结果,我们还采用了K均值、SC

5、模型、SCC模型进行聚类。实验结果表明,以上方法都一致的将第1个数据和第138数据分为同一类,将其余的数据归于其它两类。在第267个数据,第275个数据,第276个数据与第297个数据的分类中存在差异。我们分析这两类运动的特征点轨迹可能较为相似,在移动中,存在相交,因而在这两类运动的相交边界处的特征点轨迹可能会出现分类上的不同。(c)中采用SSC-ADMM模型对人脸进行分类。我们仍先采用此算法对人脸数据进行分类。为验证分类结果,我们采用适宜处理高维数据分类的SCC、SMCE、SSC-CVX模型进行分类实验。通过实验

6、可以发现这几种方法均可得到与SSC-ADMM算法一致的分类结果:第1个到第5个人脸数据以及第11个到第15个人脸数据属于一个人,其余的属于另一个人。第四问中,(a)问题中圆台数据属于多流形结构,所以我们采用SMMC算法对圆台数据进行分类,调整参数的选取,可将圆台的顶、底、侧面分成三类。(b)机器工件外部边缘轮廓的图像数据用SMCE算法分成三类和四类,得到较好的聚类效果。关键词:谱多流形聚类稀疏流形聚类与嵌入稀疏子空间聚类谱曲率聚类谱聚类一、问题重述随着计算机技术和互联网的飞速发展,我们已经进入高维和海量数据的时代,

7、迫切需要对这些大数据进行有效的分析,以至数据的分析和处理方法成为了诸多问题成功解决的关键,涌现出了大量的数据分析方法。几何结构分析是进行数据处理的重要方法,已经被广泛应用在人脸识别、手写体数字识别、图像分类、等模式识别和数据分类问题,此外,如何快速有效的在大规模高维数据上求解各种数学模型,也成为目前数据分析与处理领域亟待解决的重要问题。以及图象分割、运动分割等计算机视觉问题中。更一般地,对于高维数据的相关性分析、聚类分析等基本问题,结构分析也格外重要。而本次建模就是采用数据处理及其应用领域经典的子空间聚类的求解方法

8、,并着重使用了基于谱聚类的多种方法解决了子空间聚类问问题和多流行聚类问题。在题目给定的数据和参考文献下,求解以下4个问题:1.当子空间独立时,子空间聚类问题相对容易。附件一中1.mat中有一组高维数据(.mat所存矩阵的每列为一个数据点,以下各题均如此),它采样于两个独立的子空间。请将该组数据分成两类。2.请处理附件二中四个低维空间中的子空间聚类问题和多流形

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。