多元统计分析聚类分析

多元统计分析聚类分析

ID:27417151

大小:1.32 MB

页数:107页

时间:2018-12-02

多元统计分析聚类分析_第1页
多元统计分析聚类分析_第2页
多元统计分析聚类分析_第3页
多元统计分析聚类分析_第4页
多元统计分析聚类分析_第5页
资源描述:

《多元统计分析聚类分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ClusterAnalysis第五章聚类分析第一节什么是聚类分析聚类分析也是一种分类技术。是研究“物以类聚”的一种方法。与多元分析的其他方法相比,该方法理论上还不完善,但由于它能解决许多实际问题,很受人们的重视,应用方面取得了很大成功。举例对10位应聘者做智能检验。3项指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。其得分如下,选择合适的统计方法对应聘者进行分类。应聘者得分如下应聘者12345678910X28181121262016142422Y29232223292322232927Z28181622262222242424例如,对上市公司的经营业绩进行分类;例如,

2、根据经济信息和市场行情,客观地对不同商品、不同用户及时地进行分类。例如,当我们对企业的经济效益进行评价时,建立了一个由多个指标组成的指标体系,由于信息的重叠,一些指标之间存在很强的相关性,所以需要将相似的指标聚为一类,从而达到简化指标体系的目的。聚类分析内容系统聚类动态聚类模糊聚类图论聚类第二节距离和相似系数描述亲疏程度有两个途径:1、把每个样品看成p维(变量的个数为p个)空间的一个点,在p维坐标中,定义点与点之间的距离。2、用某种相似系数来描述样品之间的亲疏程度。变量的类型变量按测量尺度的不同可以分为以下三类:1、间隔尺度变量(数值型变量)用连续的数量来度量,如长度、重量、产值、成本

3、2、有序尺度变量(有序变量)如一、二、三等品不能用明确的数量度量,用等级表示,有次序关系。3、名义尺度变量用一些类来表示。性别中的男与女,职业的分类。聚类的种类根据分类的对象可将聚类分析分为:(1)Q型(即样品的聚类clusteringforindividuals)(2)R型(即变量或指标的聚类clusteringforvariables)1、对样品分类(Q型)常用的距离与相似系数的定义样本资料矩阵样本资料矩阵(1)距离假使每个样品有p个变量,则每个样品都可以看成p维空间中的一个点,n个样品就是p维空间中的n个点,则第i样品与第j样品之间的距离记为dij定义距离的准则定义第i个和第j个

4、样品间的距离要求满足如下四个条件(距离可以自己定义,只要满足距离的条件):距离矩阵样品间距离矩阵明氏(Minkowski)距离绝对值距离绝对值距离实例欧式(Euclidian)距离二维空间欧式距离欧氏Euclidian距离实例切比雪夫距离变量标准化标准化欧式距离马氏Mahalanobis距离Mahalanobis距离实例兰氏Canberra距离距离矩阵样品间距离矩阵例题学生的身高与体重资料样品123456789身高X1160159160157169162165154160体重X2494653414950484345(2)相似系数研究样品间的关系常用距离,研究指标(变量)间的关系常用相似

5、系数。相似系数常用的有:夹角余弦与相关系数2、对指标(变量)分类(R型)相似系数的定义夹角余弦(Cosine)相似矩阵变量间相似矩阵相关系数相似矩阵第三节八种系统聚类方法(hierarchicalclusteringmethod)将n个样品各作为一类系统聚类法是诸聚类分析方法中使用最多的一种,按下列步骤进行:计算n个样品两两之间的距离,构成距离矩阵合并距离最近的两类为一新类计算新类与当前各类的距离。再合并、计算,直至只有一类为止画聚类图,解释类与类之间的距离1.最短距离法(singlelinkage)2.最长距离法(completelinkage)3.中间距离法(medianmetho

6、d)4.重心法(centroidmethod)5.类平均法(averagelinkage)6.可变类平均法(flexible-betamethod)7.可变法8.离差平方和法(Ward'sminimum-variancemethod)(一)最短距离法(singlelinkage,nearestneighbor)类类间:两类间两两样品距离最短x21•x12•x22•x11•递推公式例1设抽取五个样品,每个样品只侧一个指标,他们是1,2,3.5,7,9,试用最短距离法对五个样品进行分类。(样品间用绝对值距离)D(0)表1D(0)G1={X1}G2={X2}G3={X3}G4={X4}G5=

7、{X5}G1={X1}0G2={X2}10G3={X3}2.51.50G4={X4}653.50G5={X5}875.520D(1)表2D(1)G6G3G4G5G6={G1,G2}0G3={X3}1.50G4={X4}53.50G5={X5}75.520D(2)表3D(2)G7G4G5G7={G3,G6}0G4={X4}3.50G5={X5}5.520D(3)表4D(3)G7G8G70G8={G4,G5}3.50聚类谱系图最短距离法聚类的步骤1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。