聚类分析在福建省经济研究中的应用

聚类分析在福建省经济研究中的应用

ID:35435124

大小:134.70 KB

页数:9页

时间:2019-03-24

聚类分析在福建省经济研究中的应用_第1页
聚类分析在福建省经济研究中的应用_第2页
聚类分析在福建省经济研究中的应用_第3页
聚类分析在福建省经济研究中的应用_第4页
聚类分析在福建省经济研究中的应用_第5页
资源描述:

《聚类分析在福建省经济研究中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、聚类分析在福建省经济研究中的应用扌商要:木文论述聚类分析的基础知识,并以福建省9个市2014年的地区生产总值、金融机构人民币各项存款余额等十项综合经济指标为样木,利用SPSS软件,对他们的综合发展水平进行类型划分及差异性程度分析.关键词:聚类分析综合经济指标福建省经济区划分—、引言:聚类分析(ClusterAnalysis)又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各H的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况卜•进行的。聚类分析起源于分类学

2、,在占老的分类学中,人们主要依靠经验和专业知识來实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类分析。在屮国,区域经济发展不平衡现象由来已久,区域经济差异更是不断的扩大。木文以9个市的10个经济指标作为研究对象,來分析本省地域经济Z间的差异性以及相似性,评价各地区的经济发展现状。二、基础知识1.聚类分析的原理聚类分析是研究多要素事物分类问题的数量方法.基本原理是根据

3、样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样木进行聚类.常见的聚类分析方法有系统聚类法、K■均值法等.2•样品间的距离和相似系数(1)距离的计算描述样品间的亲疏程度最常用的是距离,设观测数据xxj(i=1,2,j=m)列成下列X矩阵的形式.设有斤个样品,每个样品测得〃个变量,原始资料阵为也兀12…勺■兀IXn2…Xnp其中©为i个样品的第丿个变量的观测数据.用给表示第,个样品的第丿个样品Z间的距离,其值越小表示两个样品接近程度越大.距离的一般要求:①no,对一切匸力当dy=0oX(/)=X(j

4、);②dij=dj「对一切i,j;③d庐%+如,对一切门北(三角不等式).常用的距离有以下儿种:1)闵氏距离•⑷=(£

5、X从-X』严其中常用的距离有绝对距离和欧氏距离.绝对距离P%i)=(£

6、心-心

7、)k=欧氏距离P,9%2)=(£

8、X诙-0「严“1■欧氏距离是常用的距离,但它也有不足Z处,一是它没有考虑到总体的变异对“距离”远近的影响,显然一个变异程度大的总体可能与更多样品近些,即使它们的欧氏距离不一定最近;另外,欧氏距离受变量的量纲影响,这对多元数据的处理是不利的•通常我们需耍先对数据近些标准化处理,然后用标准化后的数据计算距离.2)马氏距离设X,与

9、X/•是来自均值向量为“,

10、■办方差为工(>0)的总体G中的0维样品,则两个样品间的马氏距离为d软M)=(Xj_Xj)Z'(X厂XJ■马氏距离又称为广义欧几里得距离,显然马氏距离与上述各种距离的主耍不同就是考虑到了观测变量之间的相关性•如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵,对马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧几里得距离•马氏距离还考虑了观测变量之间的变异性,不再受各指标变量的影响,将原始数据作线性变换后,马氏距离不变.选择不同的距离,聚类结果会有所差异•在地理分区和分类研究中,往往采用几种距离进行计算、对比,选

11、择一种较为合适的距离进行聚类.(2)相似系数在对多元数据进行分析时,相对于数据的人小,我们更好地对变量的变化趋势或方向感兴趣.因此,变量间的相似性,我们可以从它们的方向趋同性或“相关性”进行考察,我们用相似系数用来测量变量之间的距离,常用的相似系数有以下两种:1)夹角余角变量X,与Xj是来自均值向量为“,协方差为工(x〉0)的总体G在的卩维空间的两个向量,则这两个向量间的夹角余弦可表示为cosk=l(£x;)(£x;)2)相关系数相关系数经常用来试题变量间的相似性•变量X,与X.的相关系数定义为Pk=在实际问题中,对样品分类常用距离,对变量分类常用相似系

12、数,即0型聚类分析常用距离,/?型聚类分析常用相似系数.4系统聚类分析方法开始将样品或变量各视为一类,根据类与类Z间的距离或相似程度将最近的类加以合并,再计算新类与其他类之间的相似程度,并选择最相似的加以合并,这样每合并一次就减少一类,不断继续这一过程,直至所冇样品(或变量)合并为一类.系统聚类分析方法方法包括最短距离法、最长聚类法、类平均法、重心法、ward法等八种不同的方法三、实例例表1给出了2014年能反映福建省9个市的综合经济的十项指标分别为:XI地区生产总值(亿元),X2金融机构人名币各项存款余额(亿元),X3农村居民人均可支配收入(元),X4城

13、镇居民人均可支配收入(元),X5人口(万人),X6固定资产投资(亿

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。