多元统计分析课程设计

多元统计分析课程设计

ID:12041886

大小:219.94 KB

页数:28页

时间:2018-07-15

多元统计分析课程设计_第1页
多元统计分析课程设计_第2页
多元统计分析课程设计_第3页
多元统计分析课程设计_第4页
多元统计分析课程设计_第5页
资源描述:

《多元统计分析课程设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多元统计分析课程设计题目:《因子分析在环境污染方面的应用》姓名:王厅厅专业班级:统计学2014级2班学院:数学与系统科学学院时间:2016年1月3日目录1.摘要:12.引言:12.1背景12.2问题的研究意义12.3方法介绍23.实证分析103.1指标103.2原始数据103.3数据来源133.4分析过程:134.结论及建议255.参考文献261.摘要:中国的环境问题,由于中国政府对环境问题的关注,环境法律日趋完善,执法力度加大,对环境污染治理的投人逐年有较大幅度的增加,中国环境问题已朝着好的方面发展。但是,仍存在着环境问题,主要体现在环境污染问题,其中主要为

2、水污染和大气污染。关键词:环境污染水污染大气污染因子分析2.引言:2.1背景:我国的环境保护取得了明显的成就,部分地区环境质量有所改善。但是,从整体上看,我国的环境污染仍在加剧,环境质量还在恶化。大气二氧化硫含量居高不下,境质量呈恶化趋势,固体废弃物污染量大面广,噪声扰民严重,环境污染事故时有发生。据中国社会科学院公布的一项报告表明:中国环境污染的规模居世界前列。2.2问题的研究意义:为分析比较各地环境污染特点,利用因子分析对环境污染的各个指标进行降维处理并得到影响环境的内在因素,进一步对环境污染原因及治理措施进行分析,让更多的人认识到环境的重要性,准确把握各

3、地区环境治理方法以及针对不同地区制定不同的政策改善环境问题,这对综合治理环境问题具有重要意义。2.3方法介绍因子分析的意义:变量间的信息的高度重叠和高度相关会给统计方法的应用设置许多障碍。为解决此问题,最简单和最直接的解决方案是削减变量个数,但这必然会导致信息丢失和信息不完全等问题的产生。为此人们希望探索一种更有效地解决方法,它既能大幅减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正是这样一种能够有效降低变量维数的分析方法。因子分析的步骤:·因子分析的前提条件:要求原有变量之间存在较强的相关关系。·因子提取:将原有变量综合成少数几个因子是因

4、子分析的核心内容。若存在随机向量及,使简记为,且(1)(标准化);(2)(中心化);(3)(不相关)。那么,称指标向量具有正交因子结构(所有因子相互正交,即);称此模型为正交因子模型;称为公共因子(对整个有影响的公共因素);称为特殊因子(只对的各对应分量有影响的特殊因素);称为因子载荷矩阵,为第个指标在第个公共因子上的载荷。因子载荷矩阵的建立因子分析的最基本任务之一就是建立因子载荷矩阵。对于正交因子模型,有若已标准化,则在绝大多数实际问题中,往往都是未知的,由此求出是不可能的,这时可以通过主成分分析给出一组公共因子及其因子载荷矩阵。具体方法如下:(1)求出的特

5、征根,以及相应的单位特征向量。(2)建立主成分。是正交矩阵。(3)构造公共因子,并建立因子载荷矩阵。(逆问题)令容易验证:具有如下正交因子结构:(?)完全忽略了特殊因子的影响。若只取前个主成分,且令,,则有其中。忽略了不重要的公共因子,由特殊因子解析。换句话说,用主成分法获得了的正交因子分解(近似)中的。这里的主要问题是如何确定因子数k方法一:根据特征值确定因子数。观察各个特征值,一般取特征值大于1的。方法二:根据因子的累计方差贡献率确定因子数。通常选取累计方差贡献率大于0.85时的特征值个数为因子个数k。·使因子具有命名解释性实际分析工作中人们总是希望对因子

6、的实际含义有比较清楚的认识。未解决这个问题,可通过因子旋转的方法使一个变量只在尽可能少的几个因子上有比较高的载荷。最理想状态下,使某个变量在某个因子上的载荷趋于1,在其他的因子上的载荷趋于0。这样,一个因子就能够成为某个变量的典型代表,于是因子的实际含义也就清楚了。因子正交旋转当指标向量具有正交因子结构时,其公共因子向量、因子载荷矩阵及正交因子分解均不唯一确定。对任一阶正交矩阵,有令则利用正交因子分解的这一性质,在因子分析(正交因子模型)中,常常在建立了初始因子载荷矩阵之后,再对其作适当的正交变换(几何解释:因子轴旋转),以使得因子载荷矩阵具有更简洁、更理想(

7、近乎分块对角矩阵形式)的结构,公共因子向量具有更明显、更直观的实际意义,正交因子分解更合理、更能反映客观实际。目前,已经提出了各种因子旋转的方法。比较常用的一种是方差极大因子轴正交旋转法,简称方差极大法。先考虑两个公共因子的平面正交旋转。具有更理想、更简化的结构,即使其各列的因子载荷值尽可能地两极分化,大者尽可能大,小者尽可能小。各载荷值可正可负,的依赖程度也不同,消除其影响:(规格化)正交旋转的目的就是要使新因子载荷矩阵的各列方差之和(总方差)达到最大。记则可由下式确定:tg且的符号可由的符号确定:当公共因子数时,需要对因子载荷矩阵中的列因子载荷向量配两两对

8、旋转,共旋转次。列。先确定,后旋转。仅

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。