聚类分析的方法

聚类分析的方法

ID:45615670

大小:125.14 KB

页数:16页

时间:2019-11-15

聚类分析的方法_第1页
聚类分析的方法_第2页
聚类分析的方法_第3页
聚类分析的方法_第4页
聚类分析的方法_第5页
资源描述:

《聚类分析的方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、—、系统聚类法系统聚类分析法就是利用一定的数学方法将样品或变量(所分析的项目)归并为若干不同的类别(以分类树形图表示),使得每一类别内的所有个体之问具有较密切的关系,而各类别Z间的相互关系相对地比较疏远。系统聚类分析最后得到一个反映个体间亲疏关系的自然谱系,它比较客观地描述了分类对象的各个体之间的差异和联系。根据分类目的不同,系统聚类分析可分为两类:一类是对变量分类,称为R型分析;另一类是对样品分类,称为Q型分析。系统聚类分析法基本步骤如下(许志友,1988)o(一)数据的正规化和标准化由于监测时所得到的数值各变量Z间相差较

2、大,或因各变量所取的度量单位不同,使数值差别增大,如杲不对原始数据进行变换处理,势必会突出监测数据中数值较人的一些变最的作用,而消弱数值较小的另一些变量的作用,克服这种弊病的办法是对原始数据止规化或标准化,得到的数据均与监测时所取的度量单位无关。设原始监测数据为Xij(i=1,2,…,mj=1,2,m;n为样品个数,m为变量个数),正规化或标准化处理后的数据为Zij(i=1,2,n;j=1,2,m)。1•正规化计算公式如F:1J憐岛h恕儿](7-32)(i=1,2・・・,n;j=1,2,・・・,m)2.标准化计算公式如下:(

3、7-33)(i=1,2,n;j=1,2,m)其中:(二)数据分类尺度计算为了对数据^Zij进行分类,须对该数据进一步处理,以便从中确定出分类的尺度,下列出分类尺度计算的四种方法。1•相关系数R两两变最间简单相关系数定义为:mHL1(=1R・一k=1丄“(7-34)(i,j=1,2,…,m)其中一般用于变量的分类(R型)。有一1

4、的相似系数是用两个向量之间的夹角余弦来定义,即:£z比_z宜k-1Immk-1k-1常用于样品间的分类(Q型)。有一仁窃G,口味的值愈大,愈接近I,两个样品关系愈亲近。2.欧氏距离°,欧氏距离》■含义为,对每个样品,把它的m个因索(变量)的值看做m维空问屮的一个点,贝iJ,2个样品就是7n维系空间中n个点,则第i个样品与第j个样品之间的距离Dij⑵-ZQ为:g(7-36)(i,j=1,2,…,m)一般用做样品间的分类。显然冇OsD®。,距离°■愈小,表示两个样品愈亲密,反Z则疏远。3.斜交空间距离。怕由于变量间往往存在程度不

5、同的相关关系,以欧氏距离计算距离,会使结果发生偏差,因而対样品i,j之间的距离可用更广义的斜交空间距离作为分类尺度。[HiHlD旷血⑵込)仇込"気Vk=l1^1(7-37)(i,j=1,2,n)其中nE(X厂瓦)(z阿匸1In.n.£%瓦)迟九*i=li=l(k,L=1,2,…,m)一般用于样品的分类。有0sWo,且距离片愈小农示两个样品愈亲密。(三)分类树形图的绘制绘制分类树形图的法则是使相似程度高的样本或样本所代表的类优先集中衣一起,用较短的线联结起来,而相似程度低的样本或类Z间用较长的线联结。绘制分类树形图可采用两种方

6、法。1.-•次形成分类法首先选出相关系数最人的元索对(或距离矩阵中最小的元索对),然后选岀次人的元索对(或距离矩阵中次小的元素对),依次类推。选出元素对后,将各元素对按下列准则连接成群:若两个元素在已形成的群屮没有出现过,则形成一个独立的新群;若两个元素中有一个是在已经分好的群中出现过,则另一个加入该群;若两个元素都在已分好的两群中,则把两群连一起;若两个元素都在同一群中,则这对元素就不再作处理。这样反复进行,直到所有的元索都分群完毕为止,形成一个树形图。2.逐步形成分类法假设分类是对样品进行的,且采用的分类尺度是距离。从距

7、离矩阵中选出最小的元素D.,这说明笫k个样品与笫L个样品距离最近(关系最亲密)应首先归入一组,然厉按卜面方法进行计算:首先,把第五个样品与第L个样吊的相应的各个变量取平均值,用它代替第k个样吊,并取消第j个样品,形成新的样品数据,它比归并前的样品数H减少一个(当为组合变量时应取加权平均值)。其次,根据新的样品数据,重新计算距离矩阵。再从新的距离矩阵屮选出最小的,说明新的样品数据屮第L个样品与第1个样吊距离最近(关系最密切),应将它们归为一组,然后重复进行上述(1)、(2)、(3)步工作。以上各步重复进行次则全部样品最后归并为

8、一组,最后按归组的先后顺序及和应的距离大小作出分类树形图。(四)类别的划分对于已建立的相似性矩阵,即可根据不同的R置信水平进行分类。分类时应先求出R的入截矩阵从丄ora=(7-38)其中:^e[OLl

9、显然R«=1吋,i与j应归为同一类,否则为不同类。对于不同的又,可得到不同的分类方案,看

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。