数据挖掘实验报告-聚类分析

ID：39243871

大小：102.51 KB

页数：7页

时间：2019-06-28

资源描述：

《数据挖掘实验报告-聚类分析》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、数据挖掘实验报告（三）聚类分析姓名：李圣杰班级：计算机1304学号：13116106027一、实验目的1、掌握k-means聚类方法；2、通过自行编程，对三维空间内的点用k-means方法聚类。二、实验设备PC一台，dev-c++5.11三、实验内容1.问题描述：立体空间三维点的聚类.说明：数据放在数据文件中(不得放在程序中)，第一行是数据的个数，以后各行是各个点的x,y,z坐标。2.设计要求读取文本文件数据，并用K-means方法输出聚类中心3.需求分析k-means算法接受输入量k；然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足：同一聚

2、类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。k-means算法的工作过程说明如下：首先从n个数据对象任意选择k个对象作为初始聚类中心，而对于所剩下的其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类。然后，再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值），不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数，具体定义如下：(1)其中E为数据库中所有对象的均方差之和，p为代表对

3、象的空间中的一个点，mi为聚类Ci的均值(p和mi均是多维的)。公式(1)所示的聚类标准，旨在使所获得的k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。四、实验步骤Step1.读取数据组，从N个数据对象任意选择k个对象作为初始聚类中心；Step2.循环Step3到Step4直到每个聚类不再发生变化为止；Step3.根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离，并根据最小距离重新对相应对象进行划分；Step4.重新计算每个（有变化）聚类的均值（中心对象）。代码7#include#inc

4、lude#include#includeintK,Vectordim,datasize,seed=1;7float**data,**kmatrix;float*max_column,*min_column;/*创建维数可指定的二维动态数组array[m][n]*/float**array(intm,intn){float**p;inti;p=(float**)malloc(m*sizeof(float*));p[0]=(float*)malloc(m*n*sizeof(float));for(i=1;

5、i

6、,Vectordim=%d,datasize=%d",&K,&Vectordim,&datasize)!=3){printf("loaderror!");fclose(fp);exit(0);}data=array(datasize,Vectordim+1);for(i=0;i

7、[i][j]);/*printf("%f",data[i][j]);*/}}}doubleeuclid_distance(floata[],floatb[],intdim){inti;doublesum=0;for(i=0;i

8、loat)*Vectordim);for(i=0;i

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 7



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

数据挖掘实验报告-聚类分析

数据挖掘实验报告-聚类分析

相关文章

相关标签