误差分析课件 聚类分析之谱系聚类法.ppt

误差分析课件 聚类分析之谱系聚类法.ppt

ID:52650692

大小:587.50 KB

页数:27页

时间:2020-04-12

误差分析课件 聚类分析之谱系聚类法.ppt_第1页
误差分析课件 聚类分析之谱系聚类法.ppt_第2页
误差分析课件 聚类分析之谱系聚类法.ppt_第3页
误差分析课件 聚类分析之谱系聚类法.ppt_第4页
误差分析课件 聚类分析之谱系聚类法.ppt_第5页
资源描述:

《误差分析课件 聚类分析之谱系聚类法.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、聚类分析之--谱系聚类法类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类引言谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚

2、结起来的谱系图,再进一步根据实际情况确定合适的分类个数。谱系聚类问题判断两个样品最相似的依据是什么?谱系聚类类间距离及其递推公式常用的类间距离有四种:最短距离最长距离类平均距离重心距离类间距离谱系聚类以分别表示样品,以简记与的距离,设分别表示两个类,它们分别含有个样品.我们用来表示类与之间的距离.最短距离即用两类中样品之间距离最短者作为两类间的距离.谱系聚类最长距离即用两类中样品之间距离最长者作为这两类间的距离.类平均距离即用两类中所有两两样品之间的距离的平均作为两类之间的距离.或者即用两类中所有两两样品之间的平方距离的平均

3、作为两类间的平方距离.谱系聚类重心距离设类中的样品为,,…,,则其均值称为类的重心.其中,,分别是的重心,即用两类的重心之间的距离作为两类间的距离.谱系聚类按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类由类合并所得,则包含个样品.为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类与其他类之间的距离.类间距离的递推公式谱系聚类常用的四种类间距离的递推公式最短距离最长距离谱系聚类类平均距离对于类平均距离的下列定义方式同理可得递推公式如下:谱系聚类重心距离由的合并集的重心是而由,有谱系聚类若采用欧氏距

4、离的距离,以上介绍的4种类间距离的递推公式可统一表示为计算样品之间谱系聚类各种类间距离的参数如下表所示谱系聚类谱系聚类法的步骤(1)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵此时,谱系聚类(2)选择中主对角线以下(或以上)的最小距离,设这个元素是,这时,首先将合并为一个新类.在中消去,所对应的行与列,并加入由新类与剩下的其他未聚合的类间的距离所组成的一行和一列,得到一个更新的距离矩阵,它是阶方阵.(3)从出发重复步骤(2)的做法得,再由出发重复上述步骤,直到个样品聚为一个大类为止.(4)在合并过程中要

5、记下合并样品的编号及两类合并时的距离(称为距离水平),并绘制聚类谱系图.谱系聚类谱系聚类法的应用分析核电企业对自身库存的优化管理仓库内存货位置摆放的合适与否会直接影响到总搬运费用、大修工作效率以及仓库人员的工作积极性。因此将备品备件正确地分类存放是非常重要的。应用谱系聚类法中的最短距离法对核电企业的备品备件进行分类,然后根据分类的结果对这些类之间的关系做总结归纳。谱系聚类谱系聚类法的应用分析将备品备件大致分为以下几类:机械类:紧固件、密封、轴承、过滤器、压缩机、管道、热交换器等;电气类:熔断器、断路器、变压器、电气元件、电机

6、、电缆等;仪表类:电子元件、电路板、电源、工业计算机及备件、各种测量仪等;五金类:金属材料等;其他类:焊接材料、润滑油、安全防护、消防器材等。谱系聚类谱系聚类法的应用分析为了便于说明,列举了部分变量指标,对这五类备品备件的各项变量打分如下表(满分10分):谱系聚类谱系聚类法的应用分析然后利用欧式距离公式,根据表内的打分计算各类之间的相互距离,得到矩阵如下:谱系聚类谱系聚类法的应用分析由上述矩阵知,G4与G5之间距离最短,所以组成一个新类G6。然后再用G6与其他类再次比较,即用G6里面的子类G4与G5分别与其他类的欧氏距离进行

7、比较,选择其中距离小的为两类之间的距离。故得到新矩阵如下:谱系聚类谱系聚类法的应用分析此时,G3与G6之间的距离最短,所以G3、G4和G5共同组成一个新类G7,同上述步骤一样,得出新的矩阵如下:谱系聚类谱系聚类法的应用分析同理,G2与G7组成一个新类G8,G8与G1的欧氏距离为:综上所述,我们在距离为11的水平上首先合并五金类和其他类,得到新类G6={G4,G5};然后,更新距离矩阵后又在距离为12的水平上合并G3与G6得到新类G7={G3,G4,G5};在距离为13的水平上合并G2与G7为新类G8;最后在距离为41的水平上

8、将G1与G8合并成一个大类。谱系聚类谱系聚类法的应用分析将上述聚类过程连同合并时的水平用图表示出来,可以画出谱系图如下:谱系聚类谱系聚类法的应用分析由此可见,这五类归纳为两类比较合适,即电气类、仪表类、五金类和其他类为一类,机械类自成一类。把聚类结果按照现实中的具体情况再加以调整,将相近的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。