主成分分析和因子分析.pdf

主成分分析和因子分析.pdf

ID:52454097

大小:652.84 KB

页数:28页

时间:2020-03-27

主成分分析和因子分析.pdf_第1页
主成分分析和因子分析.pdf_第2页
主成分分析和因子分析.pdf_第3页
主成分分析和因子分析.pdf_第4页
主成分分析和因子分析.pdf_第5页
资源描述:

《主成分分析和因子分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、主成分分析和因子分析史会峰华北电力大学(保定)2014年6月14日史会峰(华北电力大学)华北电力大学数学建模俱乐部2014年6月14日1/28主成分分析PrincipalcomponentsanalysisPCA主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。主成分分析是最简单的以特征量分析多元统计分布的方法,其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(特征向量)与它们

2、的权值(特征值)。PCA提供了一种降低数据维度的有效办法;如果分析者在原数据中除掉最小的特征值所对应的成分,那么所得的低维度数据必定是最优化的,也就是,这样降维必定是失去讯息最少的方法。史会峰(华北电力大学)华北电力大学数学建模俱乐部2014年6月14日2/28具体例子为了评价企业的经济效益,选用了8个指标作为经济效益评价的指标体系:?1固定资产利税率,?2资金利税率,?3销售收入利税率,?4资金利润率,?5固定资产产值率,?6流动资金周转天数,?7万元产值能耗,?8全员劳动生产率.其中指标?1,?

3、2,?3,?4,?5,?8是正向指标,它们的取值越大越好,而指标?6,?7是反向指标,它们的数值越大反而越不好,这时采用它们的倒数.下表是15家企业的8项指标的数据:史会峰(华北电力大学)华北电力大学数学建模俱乐部2014年6月14日3/28?1?2?3?4?5?6?7?8116.6827.7531.8418.4053.255528.831.75219.7027.5632.9419.2059.825532.922.87315.2023.4032.9816.2446.786541.691.5347.2

4、58.9721.304.7634.396239.281.63529.4556.4940.7443.6875.326926.682.14632.9342.7849.9833.8766.465032.872.60725.3937.8536.7627.5668.186335.792.43815.0519.4927.2114.2156.137635.761.75史会峰(华北电力大学)华北电力大学数学建模俱乐部2014年6月14日4/28?1?2?3?4?5?6?7?8919.8228.7833.4120.1

5、759.257139.131.831021.1335.2039.1626.5252.476235.081.731116.7528.7229.6219.2355.765830.081.521215.8328.0326.4017.4361.196132.754.601316.5329.7332.4920.6350.416937.571.311422.2454.5931.0537.0067.956332.331.571512.9220.8225.1212.5451.076639.181.83史会峰(华北电

6、力大学)华北电力大学数学建模俱乐部2014年6月14日5/28这样关于这8个指标有15个样本观察值,将指标??按照下面公式进行标准化??−?¯??˜?=√,??其中1∑︁151∑︁15?¯=?,?=(?−?¯)2???????1514?=1?=1样本?˜?,和?˜2,的相关系数定义为∑︀15(˜???−?¯?)(˜???−?¯?)?=1√︃√︃(1)∑︀15∑︀15(˜???−?¯?)2(˜???−?¯?)2?=1?=1计算指标?˜1,?˜2,...,?˜8的相关系数矩阵为史会峰(华北电力大学)华北

7、电力大学数学建模俱乐部2014年6月14日6/28⎛⎞⎜10.8490.9250.9020.8500.3250.4910.586⎟⎜⎟⎜⎟⎜⎟⎜10.6930.9880.8600.1170.6100.525⎟⎜⎟⎜⎟⎜⎟⎜10.7760.6150.3670.3490.522⎟⎜⎟⎜⎟⎜⎟⎜10.8560.1290.6070.317⎟⎜⎟⎜⎟⎜⎟⎜10.0990.6200.976⎟⎜⎟⎜⎟⎜⎟⎜10.2840.504⎟⎜⎟⎜⎟⎜⎟⎜10.194⎟⎜⎟⎝⎠1史会峰(华北电力大学)华北电力大学数学建模俱乐

8、部2014年6月14日7/28计算相关系数矩阵的特征值,并按照从大到小次序排列得,前三个特征值之和就占总和8的91.17%,因此选用三个指标就可综合8个指标的91.17%的信息,这三个特征值和对应的特征向量分别为:5.2360,1.2153,0.8420(0.4163,0.4038,0.3651,0.4014,0.4153,0.1522,0.2792,0.3092)(−0.0169,−0.2519,0.0775,−0.3279,−0.0166,0.7273,−0.17

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。