主成分分析,聚类,因子全解

主成分分析,聚类,因子全解

ID:15665019

大小:3.52 MB

页数:15页

时间:2018-08-04

主成分分析,聚类,因子全解_第1页
主成分分析,聚类,因子全解_第2页
主成分分析,聚类,因子全解_第3页
主成分分析,聚类,因子全解_第4页
主成分分析,聚类,因子全解_第5页
资源描述:

《主成分分析,聚类,因子全解》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、天津理工大学实验报告学院(系)名称:计算机与通信工程学院姓名学号专业班级实验项目聚类分析、主成分分析与因子分析课程名称数据分析及其应用软件课程代码0665106实验时间2016年4月13号3、4节,中午实验地点7号楼216批改意见成绩教师签字:一.系统聚类分析:1.实验目的掌握系统聚类分析的基本思想,并能够对分析结果进行解释。2.实验环境SPSS软件。3.实验过程记录(1)在spss中录入数据。(2)打开系统聚类对话框,选择参与系统聚类分析的变量第15页共15页(3)选择聚类方法,并按下图勾选相应项。第15页共15页(4)选定凝聚状

2、态表及冰柱图(谱系图)。(5)点击“继续”,便会得到凝聚状态表和树状图。1.实验结果及分析。凝聚状态表:第15页共15页谱系图:结果分析:实验所用数据中参与聚类分析的对象分为三类比较合适,如下表:第三类地区企业盈利属于高水平,第一类地区企业盈利属于中等水平,第二类地区企业盈利属于低水平。类别地区地区个数第15页共15页第一类北京,天津,上海,甘肃,青海,海南,贵州,山西,重庆,黑龙江,新疆,宁夏12第二类广西,云南,四川,江西,陕西,吉林,安徽,内蒙古8第三类山东,湖南,福建,湖北,江苏,广东,河北,河南,辽宁,浙江10二.K-均值

3、聚类分析:1.实验目的掌握K-均值聚类分析的基本思想,并能够对分析结果进行解释。2.实验环境SPSS软件。3.实验过程记录。第15页共15页(1)沿用上面的数据,并对变量差异较大的原始数据进行标准化。(2)打开K均值聚类分析的对话框,将所有标准化后的变量选入变量框里,地区作为个案标注依据;(3)点击迭代按钮,选择迭代次数为10,点击保存按钮并勾选聚类成员;(4)点击选项按钮并勾选初始聚类中心和anova表,最后点击OK按钮。4.实验结果及分析。初始聚类中心聚类123Zscore(企业个数).02881-1.191972.45457Z

4、score(盈利个数).04567-1.215822.39791第15页共15页Zscore(净利润)-.11133-.586711.42907Zscore(营业收入)-.34695-.447822.10744Zscore(增加值率)1.90731-1.08753-.95640Zscore(全员劳动生产率)-.543892.74311.14202聚类中心的选择原则是聚核点距离其他点尽可能远。迭代历史记录a迭代聚类中心中的变动12311.6561.4171.5842.588.000.9653.124.000.1804.000.000.

5、000随着迭代次数增加,类别聚合点的变化越来越小,实验中只用了4次迭代就已经收敛了。最终聚类中心聚类123Zscore(企业个数)-.38144-1.09240.97617Zscore(盈利个数)-.37598-1.09455.96753Zscore(净利润)-.58152-.414801.11302Zscore(营业收入)-.61849-.505211.20300Zscore(增加值率).31160-.82668-.28172Zscore(全员劳动生产率)-.605701.37105.61837此表表示各个类在各个变量上的平均值。

6、ANOVA聚类误差F显著性均方自由度均方自由度Zscore(企业个数)7.7912.4972715.679.000Zscore(盈利个数)7.6792.5052715.199.000Zscore(净利润)9.3272.3832724.337.000Zscore(营业收入)10.8702.2692740.432.000Zscore(增加值率)2.2472.908272.476.103Zscore(全员劳动生产率)7.8502.4932715.936.000由此表的显著性一栏中可以看出,各类之间的差异都是显著的(接近于0),表示将30个

7、地区分为三类是合理的。这已证明了上个实验的结论是相对可靠的。三.主成分分析:1.实验内容:用spss对2015-2016赛季NBA常规赛50位球员进行主成分分析,并从数据中得出一些相关统计结果。2.实验目的:掌握主分析的基本思想,并能够对分析结果进行解释。3.实验环境第15页共15页SPSS软件。3.实验过程:1、数据采集,选取2015-2016赛季现役50位球员常规赛的各项指标,包括出场时间、得分、篮板、助攻、抢断、盖帽、失误、犯规、投篮命中率、罚球命中率和效率值11项指标。2、对表中数据选取适当的指标做主成分分析。对以上数据进行

8、主成分分析,选择变量为得分、篮板、助攻、抢断、盖帽、失误、投篮命中率、罚球命中率和效率值9个变量。相关性矩阵得分篮板助攻抢断盖帽失误投篮命中率罚球命中率效率值相关性得分1.000-.023.171.370-.198.523-.181.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。