方差分析、主成分分析、相关与回归分析课件.ppt

方差分析、主成分分析、相关与回归分析课件.ppt

ID:58436370

大小:5.98 MB

页数:47页

时间:2020-09-07

方差分析、主成分分析、相关与回归分析课件.ppt_第1页
方差分析、主成分分析、相关与回归分析课件.ppt_第2页
方差分析、主成分分析、相关与回归分析课件.ppt_第3页
方差分析、主成分分析、相关与回归分析课件.ppt_第4页
方差分析、主成分分析、相关与回归分析课件.ppt_第5页
资源描述:

《方差分析、主成分分析、相关与回归分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主成分分析方差分析相关与回归分析目录页方差分析主成分分析相关与回归分析方差分析的应用条件(1)独立,各组数据相互独立,互不相关(2)正态,即各组数据符合正态分布(3)方差齐性,即各组方差相等统计学上的因素是指研究者所关心的实验条件,而水平是指因素的具体表现形式。如,温度(30、60、90)℃、药物种类(A、B、C)和产地(山东、安徽、江苏)。温度、药物种类和产地就是因素,而每个因素里具体的不同形式就称为水平单因素方差分析例:一共有4种不同的饲料喂猪,共有19头猪分为4组,每组一种饲料,一段时间后称重。比较4种饲料对猪的体重影响是否显著不同。饲料的类型增加

2、的体重单击“两两比较”主成分分析是考察多个变量间相关性的一种多元统计方法,其主要目的是用较少的变量去解释原始数据中的大部分变异。它通常用来寻找判断某种事物或现象的综合指标,并且给综合指标所包含的信息以适当的解释,从而更好的揭示事物内在的规律。但在实际的应用当中,主成分分析只是一种达到目的的中间手段,而不是最终目的,而要结合其他的统计方法来处理问题。2021/9/616第二章主成分分析主成分分析(principalcomponentsanalysis)。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化

3、生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率。2021/9/617主成分分析的基本思想既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前

4、提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系:1.每一个主成分都是各原始变量的线性组合;2.主成分的数目大大少于原始变量的数目2021/9/618目录上页下页返回结束3.主成分保留了原始变量绝大多数信息4.各主成分之间互不相关通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。主成分分析的任务1计算主成分首先将原有的变量标准化

5、,然后计算各变量之间的相关矩阵、该矩阵的特征根和特征向量,最后将特征根由大到小排列,分别计算出对应的主成分。2确定主成分个数(1)累计贡献率:当前k个主成分的累计贡献率达到某一特定值(一般采用70%以上)时,则保留前k个主成分。(2)特征根:一般选取特征根≥1的主成分。表示主成分影响力度大小的指标,即引入该主成分后可以解释平均多少原始变量的信息,如果特征根小于1,说明该主成分的解释程度还不如直接引入一个原始变量的平均解释程度大。表示前k个主成分累计提取了原始变量多少的信息。2021/9/620注意的问题1.首先应当认识到主成分分析方法适用于变量之间存在较

6、强相关性的数据,如果原始数据相关性较弱,运用主成分分析后不能起到很好的降维作用,即所得的各个主成分浓缩原始变量信息的能力差别不大。一般认为当原始数据大部分变量的相关系数都小于0.3时,运用主成分分析不会取得很好的效果。2.主成分分析不能有效地剔除重叠信息,但它至少可以发现原始变量是否存在着重叠信息,这对我们减少分析中的失误是有帮助的。2021/9/621主成分分析步骤1.根据研究问题选取初始分析变量;2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;3.求协差阵或相关阵的特征根与相应标准特征向量;4.判断是否存在明显的多重共线性,若存在,则

7、回到第一步;5.得到主成分的表达式并确定主成分个数,选取主成分;6.结合主成分对研究问题进行分析并深入研究。例:1980年某汽车制造商从竞争对手中选择了17种车型,访问了25名顾客,要求他们根据自己的偏好对这17种车型打分,打分范围0-9.9分。如下表:点击“继续”,回到主页点击”确定“相关关系的常见类型:线性相关:正线性相关、负线性相关非线性相关相关关系不象函数关系那样直接,但却普遍存在,且有强有弱.如何测度?相关分析和回归分析的任务研究对象:相关关系相关分析旨在测度变量间线性关系的强弱程度.回归分析侧重考察变量之间的数量变化规律,并通过一定的数学表达

8、式来描述这种关系,进而确定一个或几个变量的变化对另一个变量的影响程度.回归分析基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。