多元统计考试小论文陕西省气候差异的聚类分析

多元统计考试小论文陕西省气候差异的聚类分析

ID:36233368

大小:199.50 KB

页数:10页

时间:2019-05-07

多元统计考试小论文陕西省气候差异的聚类分析_第1页
多元统计考试小论文陕西省气候差异的聚类分析_第2页
多元统计考试小论文陕西省气候差异的聚类分析_第3页
多元统计考试小论文陕西省气候差异的聚类分析_第4页
多元统计考试小论文陕西省气候差异的聚类分析_第5页
资源描述:

《多元统计考试小论文陕西省气候差异的聚类分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、陕西省气候差异的聚类分析摘要:本文以陕西省10个地级城市为研究对象,选取2012年陕西省气候的相关数据,利用SPSS22.0软件,对陕西省各大城市的平均气温、日照时数、平均风速、相对湿度、无霜期、气压、降水量,共七个指标进行系统聚类分析和K均值聚类分析,并比较聚类的结果,对10个地级城市的气候进行了客观评价。最后,提出了一些相应的对策与建议,为有关部门政策的制定提供参考与依据。关键词:陕西省,气候,聚类分析,SPSS22.0引言气候在各个地区不尽相同,又与人们的生活息息相关。距离很近的两个城市,气候可能相同,也有

2、可能不同。陕西南北狭长,地形多样,气候差异很大,且明显区分为三个气候带,即温带、暖温带和北亚热带。其中,陕南属于北亚热带气候,关中及陕北大部属暖温带气候,陕北北部长城沿线属中温带气候。基于陕西省气候分类如此之多,故而对陕西省各大城市的气候差异进行聚类分析,有一定的实际意义与研究价值。聚类分析是分析样品(或变量)量化分类的问题。本文选用多元统计分析中聚类分析的系统聚类分析方法与K均值聚类分析方法,对陕西省各大城市的气候指标进行聚类分析,比较各地区间的气候差异,结合所得结果与实际情况,提出相应建议。下面简要介绍本文所

3、使用的两种聚类方法。系统聚类:其基本思想是为距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。系统聚类的过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成n-1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n-2类;……以上步骤一直进行下去,最后将所有的样品(或变量)聚成一类。在这

4、个过程中,如果某些类的最近距离相等,则可以把这几类聚成一类。为了直观地反映以上的聚类分析过程,常选择把整个分类系统地画成一张谱系图。K均值聚类方法:其基本思想是将每一个样品分配给最近中心(均值)的类中,具体算法至少包括三个步骤:(1),将所有的样品分成K个初始类;(2),通过欧几里得距离将某个样品划入离中心最近的类中,并对获得样品与失去样品的类,重新计算中心坐标;(3)重复步骤(2),直到所有的样品都不能再分配时为止。K均值聚类算法是一种最为广泛使用的聚类方法,这种算法对于大型数据有着明显的优势,具有可伸缩性和高

5、效的性能,通常样本量大于100时我们才进行考虑。本文只是展示这种聚类分析的运算过程,才选取该方法进行说明。一、指标体系的建立及数据来源地区间的气候差异受到诸多因素影响。本文借鉴研究气候所使用的方法和多元统计分析方法,结合陕西省自身的情况与特点,考虑了具有综合性、代表性、可比性、可得性和简洁性的一系列指标,从中选取一些公认的指标,构建陕西省各地区气候指标体系。根据《2012年陕西省统计年鉴》的数据,选择能够反映陕西省气候差异的平均气温(X1)、日照时数(X2)、平均风速(X3)、相对湿度(X4)、无霜期(X5)、气

6、压(X6)、降水量(X7)共7项指标构建本文研究区的气候差异指标体系。以上7项指标基本能够反映研究区的气候差异情况,具体数据如表一所示。2012年陕西省各地区气候指标指标城市平均气温(摄氏度)X1日照时数(小时)X2平均风速(米/秒)X3相对湿度(%)X4无霜期(天)X5气压(百帕)X6降水量(毫米)X7西安市14.61544.81.262223969.4426.7铜川市10.32007.12.267217904.7502.8宝鸡市13.41642.11.267224945.3715.3咸阳市13.02051.6

7、1.966199960.7402.5渭南市14.51638.71.265225974.4418.1延安市10.32463.01.458206907.0481.8汉中市15.51278.71.274238955.8869.7榆林市8.42992.22.654210884.7566.8安康市15.81523.51.473225981.3815.3商洛市12.81879.92.167204930.6528.1表一研究的数据主要来自《2012年陕西省统计年鉴》和陕西省各个城市政府网站,原始数据略。二、距离的选择与数据预处

8、理在进行聚类之前,首先要分析样品间的相似性,我们用距离来测度样品之间的相似程度。例如,如果每个样品有p个指标(变量)从不同方面描述其性质,形成一个p维向量。如果将n个样品看成p维空间中的n个点,则两个样品间相似程度就可用p维空间中的两点距离公式来度量。两点间的距离公式可以从不同角度进行定义,存在闵可夫斯基距离,马氏距离与兰氏距离等距离。一般的,同一批数据采用不同的距离公式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。