多元统计考试小论文陕西省气候差异的聚类分析

ID：36233368

大小：199.50 KB

页数：10页

时间：2019-05-07

资源描述：

《多元统计考试小论文陕西省气候差异的聚类分析》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、陕西省气候差异的聚类分析摘要：本文以陕西省10个地级城市为研究对象，选取2012年陕西省气候的相关数据，利用SPSS22.0软件，对陕西省各大城市的平均气温、日照时数、平均风速、相对湿度、无霜期、气压、降水量，共七个指标进行系统聚类分析和K均值聚类分析，并比较聚类的结果，对10个地级城市的气候进行了客观评价。最后，提出了一些相应的对策与建议，为有关部门政策的制定提供参考与依据。关键词：陕西省，气候，聚类分析，SPSS22.0引言气候在各个地区不尽相同，又与人们的生活息息相关。距离很近的两个城市，气候可能相同，也有

2、可能不同。陕西南北狭长，地形多样，气候差异很大，且明显区分为三个气候带，即温带、暖温带和北亚热带。其中，陕南属于北亚热带气候，关中及陕北大部属暖温带气候，陕北北部长城沿线属中温带气候。基于陕西省气候分类如此之多，故而对陕西省各大城市的气候差异进行聚类分析，有一定的实际意义与研究价值。聚类分析是分析样品（或变量）量化分类的问题。本文选用多元统计分析中聚类分析的系统聚类分析方法与K均值聚类分析方法，对陕西省各大城市的气候指标进行聚类分析，比较各地区间的气候差异，结合所得结果与实际情况，提出相应建议。下面简要介绍本文所

3、使用的两种聚类方法。系统聚类：其基本思想是为距离相近的样品（或变量）先聚成类，距离相远的后聚成类，过程一直进行下去，每个样品（或变量）总能聚到合适的类中。系统聚类的过程是：假设总共有n个样品（或变量），第一步将每个样品（或变量）独自聚成一类，共有n类；第二步根据所确定的样品（或变量）“距离”公式，把距离较近的两个样品（或变量）聚合为一类，其他的样品（或变量）仍各自聚为一类，共聚成n-1类；第三步将“距离”最近的两个类进一步聚成一类，共聚成n-2类；……以上步骤一直进行下去，最后将所有的样品（或变量）聚成一类。在这

4、个过程中，如果某些类的最近距离相等，则可以把这几类聚成一类。为了直观地反映以上的聚类分析过程，常选择把整个分类系统地画成一张谱系图。K均值聚类方法：其基本思想是将每一个样品分配给最近中心（均值）的类中，具体算法至少包括三个步骤：（1），将所有的样品分成K个初始类；（2），通过欧几里得距离将某个样品划入离中心最近的类中，并对获得样品与失去样品的类，重新计算中心坐标；（3）重复步骤（2），直到所有的样品都不能再分配时为止。K均值聚类算法是一种最为广泛使用的聚类方法，这种算法对于大型数据有着明显的优势，具有可伸缩性和高

5、效的性能，通常样本量大于100时我们才进行考虑。本文只是展示这种聚类分析的运算过程，才选取该方法进行说明。一、指标体系的建立及数据来源地区间的气候差异受到诸多因素影响。本文借鉴研究气候所使用的方法和多元统计分析方法，结合陕西省自身的情况与特点，考虑了具有综合性、代表性、可比性、可得性和简洁性的一系列指标，从中选取一些公认的指标，构建陕西省各地区气候指标体系。根据《2012年陕西省统计年鉴》的数据，选择能够反映陕西省气候差异的平均气温（X1）、日照时数（X2）、平均风速（X3）、相对湿度（X4）、无霜期（X5）、气

6、压（X6）、降水量（X7）共7项指标构建本文研究区的气候差异指标体系。以上7项指标基本能够反映研究区的气候差异情况，具体数据如表一所示。2012年陕西省各地区气候指标指标城市平均气温(摄氏度)X1日照时数(小时)X2平均风速(米/秒)X3相对湿度(%)X4无霜期(天)X5气压(百帕)X6降水量(毫米)X7西安市14.61544.81.262223969.4426.7铜川市10.32007.12.267217904.7502.8宝鸡市13.41642.11.267224945.3715.3咸阳市13.02051.6

7、1.966199960.7402.5渭南市14.51638.71.265225974.4418.1延安市10.32463.01.458206907.0481.8汉中市15.51278.71.274238955.8869.7榆林市8.42992.22.654210884.7566.8安康市15.81523.51.473225981.3815.3商洛市12.81879.92.167204930.6528.1表一研究的数据主要来自《2012年陕西省统计年鉴》和陕西省各个城市政府网站，原始数据略。二、距离的选择与数据预处

8、理在进行聚类之前，首先要分析样品间的相似性，我们用距离来测度样品之间的相似程度。例如，如果每个样品有p个指标（变量）从不同方面描述其性质，形成一个p维向量。如果将n个样品看成p维空间中的n个点，则两个样品间相似程度就可用p维空间中的两点距离公式来度量。两点间的距离公式可以从不同角度进行定义，存在闵可夫斯基距离，马氏距离与兰氏距离等距离。一般的，同一批数据采用不同的距离公式

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 10



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

多元统计考试小论文陕西省气候差异的聚类分析

多元统计考试小论文陕西省气候差异的聚类分析

相关文章

相关标签