实验指导三主成分分析

实验指导三主成分分析

ID:41736216

大小:50.79 KB

页数:14页

时间:2019-08-31

实验指导三主成分分析_第1页
实验指导三主成分分析_第2页
实验指导三主成分分析_第3页
实验指导三主成分分析_第4页
实验指导三主成分分析_第5页
资源描述:

《实验指导三主成分分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、上机实验指导二:主成分分析实验目的:能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别;能根据SAS输出结果选出满足耍求的几个主成分。实验每组人数及学时:组人数1人,学时数:2学时实验要求:耍求每位实验人员于课堂时间完成相关练习实验环境:装有版本8.0以上的SAS系统的个人电脑实验类型:设计型实验内容:>多元统计分析处理的是多变量(多指标)问题。>在实际问题屮,为了尽可能完整地获取有关的信息,往往需要考虑众多的变量,这虽然可以避免重要信息的遗漏,但增加了分析的复杂性。>同一问题所涉及到的众多变量Z间会存在一定的相关性,这种相关性会使各变量

2、的信息有所“重叠”。>人们口然希望通过克服相关性、重叠性,即对这些彼此相关的变量加以“改造”,用较少的变量来代替原来较多的变量,而这种代替可以反映原來多个变量的人部分信息,从而通过对为数较少的新变量的分析达到解决问题的目的。>这实际上是一种“降维”的思想。>成分分析也称主分量分析,是由Hotelling于1933年首先提岀的。>由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。>当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速捉取的过程,……,直到所捉取的信息与原指标相差不多时为止。这就是主成分分析的思想>主

3、成分分析着眼于考虑变量的“分散性”信息,主要目的是对原变量加以“改造”,在不致损失原变量太多信息的条件下尽可能地降低原变量的维数,即用较少的“新变量”代替原来的各变量,即:(1)变量的降维;(2)主成分的解释。>一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;>因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。》主成分的贡献率与累计贡献率:实用中,要求累计达到80%~90%的前m个主成份,既能降维又不损失原始变量中的太多信息>实际应用一般是求样本主成分:五、实验步骤:(一)过程格式procprincom

4、p选项;var变量表;partial变量表;freq变量;weight变量;by变量;(二)语句说明procprincomp语句选项DATA二输入数据集,可以用type=cov或type=corr指明数据类型,data=new(type=corr);表明new为一■相关系数(corr)数据集.ou匸输出数据集,存储原始数据和主分虽得分等•outstat=输出数据集,存储变量的平均数、标准差、相关系数、特征值、特征向量等。Cov指定要求从协方差阵出发计算主成份。缺省为从相关阵出发计算。N二指要计算的主成份个数。缺省时全算。STD要求在OUT二的数据集中把主成份得分标准化为单位方差。不规定时方

5、差为相应特征值。Noint不含截距;Noprint不输出分析结果•Va「语句指明分析的数值变量•Partial语句指明偏相关或协方差矩阵进行分析的数值变量.六、应用:1999年我国经济发展情况分析1999年我国的经济出现了良好的发展势头。下面我们选取全国31个省市H治区的八项指标(见表1),利用国际先进软件SAS对我国1999年经济发展情况作主成分分析表11999年全国31个省市口治区经济发展基本情况国内生产总值居民消费水平固定资产投资职工平均工资货物周转量98居民消费价格指数商品零営价格指数工业总产值省份亿元元亿元元亿吨公里%%亿元X1x2x3x4x5x6x7x8北京2174.46578

6、41171.1614054333.8100.698.91999.97天津1450.065551576.4511056365.998.997.52261.49河北4569.1923121770.4770221952.598.197.82994.58山西1506.781833477.576065762.499.696.81096.83内蒙1268.22279348.226347759.599.897.7640.68辽宁4171.6941281119.4778951229.99&696.13390.14吉林1669.563132500.027158464.89896.71366.92黑龙2897

7、.413431751.66709484496.896.11854.57上海4034.96103281855.7616641206.3101.597.35452.91江苏7697.8235942441.8891711075.19&596.98915.04浙江5364.8938771958.0511201897.99&597.75191.56安徽2908.592523703.456516887.297.596.61533.9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。