多元统计分析.doc

多元统计分析.doc

ID:56747667

大小:962.00 KB

页数:26页

时间:2020-07-07

多元统计分析.doc_第1页
多元统计分析.doc_第2页
多元统计分析.doc_第3页
多元统计分析.doc_第4页
多元统计分析.doc_第5页
资源描述:

《多元统计分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多元统计分析目录第十章多元统计分析2第一节主成分分析3一、基本思想3二、数学模型4三、模型的求解4四、主成分的性质5五、基本步骤与应用实例5第二节因子分析9一、基本思想9二、数学模型10三、因子载荷的统计含义10四、因子的求解11五、因子得分11六、基本步骤与应用实例11第三节聚类分析13一、基本思想13二、统计量13三、分类方法(系统聚类法)14四、基本步骤与应用实例15第四节判别分析19一、基本思想19二、基本方法19三、判别效果的评价20四、基本步骤与应用实例20英文摘要与关键词23习题23第十章多元统计分析通过本章的学习,我们应该知道:1.如何做主成分分析2

2、.如何做因子分析3.如何做聚类分析4.如何做判别分析多元统计分析(multivariatestatisticalanalysis)是研究多个随机变量之间的相互依赖关系以及内在统计规律性的一门统计学科,是现代统计学应用十分活跃的一个分支。常用多元统计方法主要有:多元数据图表示法、主成分分析、因子分析、聚类分析、判别分析、对应分析、多元回归分析、典型相关分析、路径分析等。从某种意义上讲,多元分析是一些方法的“混合体”,我们难于给出其确切的概念和难于对其所有方法进行归类,但是它可以同时展示和处理异度量的多个变量间的各种关系,且不损失原有的信息量,所以多元统计分析方法成为进

3、行深层次经济分析的一种有效工具。每一种方法都有丰富的内容,也涉及较多的数理统计知识。本章主要的目的是简要介绍一些常用多元统计方法的基本思路和方法,对于数理推导部分,有兴趣的读者可参考相关专著。第一节主成分分析在许多实际问题中,我们经常用多个变量来刻画某一事物,但由于这些变量之间往往具有相关性,很多变量带有重复信息,这样就给分析问题带来了很多不便,同时也使分析结论不具有真实性和可靠性,因此,人们希望寻找到少量几个综合变量来代替原来较多的变量,使这几个综合变量能较全面地反映原来多项变量的信息,同时相互之间不相关。主成分分析正是满足上述要求的一种处理多变量问题的方法。一、

4、基本思想主成分分析就是设法将原来的p个指标重新组合成一组相互无关的新指标的过程。通常数学上的处理就是将原来的p个指标做线性组合。为了能更清晰的解释主成分的基本思想,我们从用两个指标来衡量n个样本点的二维空间入手。在二维空间,n个样本点的变量信息若用离差平方和来表示,则变量的信息总量为总方差。对于每个变量的离差平方和,它们的取值可能出现各种情况:(1)如果离差平方和和之间相差悬殊,如取值之比为10:1,说明变量x1在方差总信息量中占较重要的地位,可剔除变量x2达到降维的目的;(2)如果和数值相差不大,说明两个指标在方差总信息量中的比重相当,统计分析时,两个指标都不可放

5、弃,此时可对x1、x2作适当的变量替换,通过某方法寻找到两个新的变量y1、y2(必须是原变量x1、x2的线性组合),使新变量满足:,(其中),上式说明新变量y继承了原变量x的全部信息,并且要求和数值比例相差较大,这时仅用y1来分析原问题就可以了,变量的个数从2变为了1。此时的y1方差最大,包含的信息最多。y1称之为第一主成分,y2称为第二主成分。推而广之,第一主成分y1的方差达到最大,其方差越大,表示其所包含的信息越多。如果第一主成分还不能反映原指标的全部信息,再考虑选取第二主成分y2,y2在剩余的线性组合中方差最大,并且与y1不相关,如若第一、第二主成分仍然不能反

6、映原变量的全部信息,再考虑选取第三主成分y3,y3在剩余的线性组合中方差最大,并且与y1、y2不相关,依此可求出全部p个主成分,它们的方差是依次递减的。在实际工作中,在不损失较多信息的情况下,通常选取前几个主成分来进行分析,达到简化数据结构的目的。二、数学模型主成分分析可以针对总体,也可以针对样本,但在许多问题中所涉及的总体都是未知的,所以我们主要讨论样本的主成分。仍从二维空间入手,设有两个变量的信息如图10.1所示,大部分的样本点集中在椭圆范围内:图10.1两个变量的信息分布如果我们取椭圆的长轴y1、短轴y2作为样本点新的坐标轴,容易看出y1坐标变化程度大,即y1

7、的方差最大,而y2的变化程度相对较小,即y2的方差较小。于是可以说变量(x1,x2)的信息大部分集中在新变量y1上,而小部分集中在新变量y2上。上图中的新坐标y1,y2是x1,x2经过坐标旋转而得到的,其旋转公式为:系数满足的要求是:我们可以称y1为它们的第一主成分,y2为它们的第二主成分,坐标的正交变换为主成分变换。推广开来,设有n个样本点,每个样本点都有p项变量x1,x2,…,xp,其原始数据矩阵表示为:其中xij是第i个样本点第j个指标的观测值。如前所述,通过主成分变换得到的线性组合可以表示为x1,x2,…,xp的线性组合:(10.1)如果系数uij满足;

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。