第五章 主成分分析

第五章 主成分分析

ID:18212890

大小:320.50 KB

页数:9页

时间:2018-09-15

第五章 主成分分析_第1页
第五章 主成分分析_第2页
第五章 主成分分析_第3页
第五章 主成分分析_第4页
第五章 主成分分析_第5页
资源描述:

《第五章 主成分分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章 主成分分析在实际问题的研究中,一方面为了获取充分多的信息,往往选择许多指标(变量)去进行观测。另一方面,希望能把多指标综合成尽可能少的几个综合指标,使分析简化。如人口普查往往要调查每个人的姓名、年龄、性别、文化程度、职业等,对企业的统计中,往往有产量、产值、品种、消耗、费用、成本、生产率、收入、利润等。主成分分析就是把多个指标化为少数几个综合指标的一种通常适用的统计分析方法。如在“服装定型”研究中,要加工一件上衣,需要测量身高、臂长、胸围等。§1 总体主成分  一、主成分的概念设为随机向量,它的数学期望向量为,协差阵为,作标准化的线性组合,,如果Y1方差最大

2、,则称为X的第一主成分;作标准化线性组合,如果Yr方差第r大,且不相关,则称为X的第r个主成分(一般地,。二、主成分的求法设,,作标准化的线性组合,则Y的方差为,那么求第一主成分就是求在条件下,使最大,求的条件极值。令,求导后令其为零,即                       (1)故 (2)求(2)的特征根 ,得:即 故 的方差为,要使方差最大,取最大值,因此X的第一主成分为57其中为对应的标准化特征向量;若为第二大,对应的标准化特征向量为,则X的第二主成分为综上所述,从p个指标出发,求主成分步骤为:设资料矩阵为(1)计算协差阵(或相关阵)V(2)求 的特征

3、根:(3)求 的标准化特征向量(4)写出主成分:  三、主成分的性质主成分向量其中1.若,且,则Y的协差阵,且证:(*)又 就是说,Y的协差阵为对角阵又57就是说,的根对角线上元素。2.若,且,则经正交变换后,广义方差及各主成分方差之和都不变。证:于是,就是说,主成分向量Y的广义方差等于原向量X的广义方差又有 即 就是说,各主成分Y方差和等于原有变量X方差和,即把P个变量变成P个主成分,其总方差没有变化。四、例题设市场上肉类X1,鸡蛋X2,水果X3,三种商品价格的月份资料的协差阵为试求三种商品月份价格的主成分。解:对应的标准化特征向量分别为:57所求主成分分别为:其

4、方差分别为:第一主成分方差占总方差的83%,所以第一主成分综合反映了三种商品价格的绝大部分变动。§2 样本主成分及分析方法一、样本主成分设样本资料矩阵为求样本主成分的步骤为:(1)数据标准化作标准化变换:其中 (i=1,2,…,P;k=1,2,…,n)(2)计算协差阵或相关阵或(与协方差阵的特征值与特征向量是不同的,即使标准化也未必相同,一般多用相关阵)其中 (3)求R的特征根及其标准化的特征向量:(4)写出主成分:57二、方差贡献率1.称为第j个主成分的方差贡献率如第一主成分的方差最大,比值表示Y1的方差在全部方差中所占比重,显然比值越大,表明这主成分综合X1,X

5、2…,XP的能力越强,因此称比值为第一主成分的方差贡献率,等等。2.称为前m个主成分的累积方差贡献率。一般地,把的最小m称为应取主成分的个数,就是说,如果前m个主成分的累积方差超过85%,那么就用前m个主成分Y1,…,Ym来刻划原有变量X1,…,Xp的变化(m

6、3:百元产值的流动资金占用率;X4:百元产值的利润率;X5:百元资金的利润率。原始数据如表,试用主成分分析方法对每个工厂作经济效益的分析。57原始数据表序号Xk1Xk2Xk3Xk4Xk5X1243.87165216.4634.57149.85……………X6205.47812312.3318.4846.18……………X11608.40223922.9424.56223.37……………X20221.09644314.0830.2580.48386.0912403.666.3219.98105.33Si135.574195.033.067.1954.65解:(1)求样本相

7、关阵,(先把原始数据标准化)(2)求R的特征根及特征向量ai1ai2ai3ai4ai50.500.50-0.480.060.512.72-0.340.290.380.750.311.74(3)计算方差贡献率、累积贡献率主成分y1y2特征根2.721.74贡献率0.540.35累积贡献率0.540.89(4)建立主成分方程其中是标准化数据(5)主成分的意义与作用第一主成分y1的意义在中的系数0.06很小,表明在中起的作用很小,而57的系数都在0.5左右,它们在中起的作用相当,但的系数为负值(-0.48),对y1起减值作用,(百元产值的流动资金占用率)取值越大,的值

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。