SAS软件与统计应用教程

SAS软件与统计应用教程

ID:43194905

大小:1017.50 KB

页数:91页

时间:2019-10-02

SAS软件与统计应用教程_第1页
SAS软件与统计应用教程_第2页
SAS软件与统计应用教程_第3页
SAS软件与统计应用教程_第4页
SAS软件与统计应用教程_第5页
资源描述:

《SAS软件与统计应用教程》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第六章主成分分析与因子分析6.1主成分分析6.2因子分析6.1主成分分析6.1.1主成分分析的概念与步骤6.1.2使用INSIGHT模块作主成分分析6.1.3使用“分析家”作主成分分析6.1.4使用PRINCOMP过程进行主成分分析6.1.1主成分分析的概念与步骤1.主成分分析基本思想主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标(比如p个指标),重新组合成一组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。但是这种线性组合,如果不加限制,则可以有很多

2、,应该如何去选取呢?在所有的线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取F2即选第二个线性组合。为了有效地反映原有信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0。称F2为第二主成分,依此类推可以构造出第三、第四、…、第p个主成分。2.主成分分析的数学模型设有n个样品(多元观测值),每个样品观测p项指标(变量):X1,X2,…,Xp,得到原始数据资料阵:其中Xi=(x1i,x2i,…,xni)',i=1,2,…,p。用数据矩阵X的p个

3、列向量(即p个指标向量)X1,X2,…,Xp作线性组合,得综合指标向量:简写成:Fi=a1iX1+ai2X2+…+apiXpi=1,2,…,p为了加以限制,对组合系数ai'=(a1i,a2i,…,api)作如下要求:即:ai为单位向量:ai'ai=1,且由下列原则决定:1)Fi与Fj(ij,i,j=1,…,p)互不相关,即Cov(Fi,Fj)=ai'ai=0,其中Σ是X的协方差阵。2)F1是X1,X2,…,Xp的一切线性组合(系数满足上述要求)中方差最大的,即,其中c=(c1,c2,…,cp)'F2是与F1不相关的X1,X2,…,Xp一切线性组

4、合中方差最大的,…,Fp是与F1,F2,…,Fp-1都不相关的X1,X2,…,Xp的一切线性组合中方差最大的。满足上述要求的综合指标向量F1,F2,…,Fp就是主成分,这p个主成分从原始指标所提供的信息总量中所提取的信息量依次递减,每一个主成分所提取的信息量用方差来度量,主成分方差的贡献就等于原指标相关系数矩阵相应的特征值i,每一个主成分的组合系数ai'=(a1i,a2i,…,api)就是相应特征值i所对应的单位特征向量ti。方差的贡献率为,i越大,说明相应的主成分反映综合信息的能力越强。3.主成分分析的步骤(1)计算协方差矩阵计算样品数据

5、的协方差矩阵:Σ=(sij)pp,其中i,j=1,2,…,p(2)求出Σ的特征值及相应的特征向量求出协方差矩阵Σ的特征值12…p>0及相应的正交化单位特征向量:则X的第i个主成分为Fi=ai'Xi=1,2,…,p。(3)选择主成分在已确定的全部p个主成分中合理选择m个来实现最终的评价分析。一般用方差贡献率解释主成分Fi所反映的信息量的大小,m的确定以累计贡献率达到足够大(一般在85%以上)为原则。(4)计算主成分得分计算n个样品在m个主成分上的得分:i=1,2,…,m(5)标准化实际应用时,指标的量纲往往不同,所以在主成分计算之前应先

6、消除量纲的影响。消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换:其中,,j=1,2,…,p。标准化后的数据阵记为X*,其中每个列向量(标准化变量)的均值为0,标准差为1,数据无量纲。标准化后变量的协方差矩阵(CovarianceMatrix)Σ=(sij)pp,即原变量的相关系数矩阵(CorrelationMatrix)R=(rij)pp:i,j=1,2,…,p此时n个样品在m个主成分上的得分应为:Fj=a1jX1*+a2jX2*+...+apjXp*j=1,2,…,m6.1.2使用INSIGHT模块作主成分分析【例6

7、-1】全国沿海10个省市经济指标的主成分分析表6-1全国沿海10个省市经济综合指标假设表6-1中数据已经存放在数据集Mylib.jjzb中,试对各地区的经济发展水平进行主成分分析。地区GDPx1人均GDPx2工业增加值x3第三产业增加值x4固定资产投资x5基本建设投资x6社会消费品零售总额x7海关出口总额x8地方财政收入x9辽宁5458.2130001376.22258.41315.95292258.4123.7399.7山东10550116433502.538512288.71070.73181.9211.1610.2河北6076.690471

8、406.72092.61161.6597.11968.345.9302.3天津2022.622068822.8960703.7361.9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。