多元统计分析方法

多元统计分析方法

ID:18384664

大小:93.81 KB

页数:10页

时间:2018-09-17

多元统计分析方法_第1页
多元统计分析方法_第2页
多元统计分析方法_第3页
多元统计分析方法_第4页
多元统计分析方法_第5页
资源描述:

《多元统计分析方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、<多元统计分析方法>Ch1基本概念1.多元总体:该总体有多个属性,可表示为X=x1…xp,考察一个P元总体即是考察这个总体中每个对象的P个属性。2.多元样本数据:X=x1,x2…xn=x11,x12,…,x1n…xp1,xp2,…,xpn3.多元总体的样本统计参数:3.1单总体3.1.1分属性行样本统计参数样本平均值向量:中心化数据:原始数据-平均数标准化数据=中心化数据/该行样本标准差样本离差矩阵Q:Q=XX’,即两两中心化属性行乘积和,qαβ=1nxαi-xαxβi-xβ(1≤α,β≤p)样本协方差矩阵S:S=Q/n=XX’/n(n为样本数)样本相关矩阵R:用X中的两行计算两属性间

2、的相关,rαβ=sαβsααsββ=qαβqααqββ3.1.2样本间统计参数各种距离:欧氏距离,马氏距离,B模距离,绝对距离,切比雪夫距离相似系数:定量:用X中的两列算出的相关系数;夹角余弦cαβ=xi'xjxixj1pxαixαj1pxαi21nxαj2定性:首先转化为0,1型定性数据;对于p元总体的变量α,两样本单元i,j配对情况有四种(1,1),(1,0),(0,1),(0,0),分别用a,b,c,d表示所有变量中这四种情况出现的次数。显然a,d出现的次数越多,两样本越接近。由此定义匹配系数:fij=a+dp=1-绝对距离p;修正的夹角余弦fij=ada+ba+cb+d(c+d

3、)3.2两总体(样本数均为n)两组样本的协方差矩阵:Yp×n,Xq×n,Y与X的协方差矩阵covy,x=c11,c12,…,c1q…cp1,cp2,…,cpq=YX'(Y,X分别表示Y,X中心化数据),其中cαβ=1n1nyαi-yαxβi-xβ(α≤p,β≤q),注意两个样本的协方差一般不对称,即cαβ≠cβα。小结多元总体该总体有多个属性,可表示为X=x1…xp,考察一个P元总体即是考察这个总体中每个对象的P个属性多元样本矩阵X=x1,x2…xn=x11,x12,…,x1n…xp1,xp2,…,xpn多元总体的统计参数单总体分属性行样本统计参数样本平均值向量中心化数据原始数据-平均

4、数标准化数据中心化数据/该行样本标准差样本离差矩阵Qqαβ=1nxαi-xαxβi-xβ(1≤α,β≤p)样本协方差矩阵SS=Q/n=XX’/n(n为样本数)样本相关矩阵R用X中的两行计算两属性间的相关,rαβ=sαβsααsββ=qαβqααqββ各种距离欧氏距离,样本间统计参数马氏距离,B模距离,绝对距离,切比雪夫距离相似系数定量用X中的两列算出的相关系数夹角余弦cαβ=xi'xjxixj1pxαixαj1pxαi21nxαj2定性首先转化为0,1型定性数据;对于p元总体的变量α,两样本单元i,j配对情况有四种(1,1),(1,0),(0,1),(0,0),分别用a,b,c,d表示

5、所有变量中这四种情况出现的次数。显然a,d出现的次数越多,两样本越接近匹配系数:fij=a+dp=1-绝对距离p修正的夹角余弦fij=ada+ba+cb+d(c+d)两总体(样本数均为n)Yp×n,Xq×n,Y与X的协方差矩阵covy,x=c11,c12,…,c1q…cp1,cp2,…,cpq=YX'(Y,X分别表示Y,X中心化数据),其中cαβ=1n1nyαi-yαxβi-xβ(α≤p,β≤q),两组样本的协方差矩阵注意两个样本的协方差一般不对称,即cαβ≠cβα。Ch2主分量分析2.1主分量分析2.1.1原理:从变量着手分析,将原来多个指标化为少数几个相互独立的综合指标的一种统计方

6、法。2.1.2数学表示:原变量X经正交变换U得到Y,Y=UX,使y1,yi,…,yn独立,且yi在所有与y1,y2,…,yi-1独立的随机变量中,yi具有最大方差。至于如何求U,事实上,所谓的最大方差即Dx=1n1nxαi-xαxβi-xβ的特征根,U’的第j列向量即为λj的特征向量。2.1.3求解正交变换:实际中无法得到D(x),而是利用样本方差Sx来求正交变换。2.1.4贡献率:代表样本点在这个主分量方向上的分散程度,若其值很小,表示样本在该方向上的分散很小,这个主分量在分析样本数据时所起作用不大。ηj=λjλ1+λ2+。。。+λp=λjS11+S22+。。。+Sppj=1,2,…

7、,p(Sii为Sx主对角线上元素)2.1.5因子负荷量:主分量yk与原分量xj相关系数称为第j因子在第k个主分量上的负荷量。几何解释为原坐标上单位长度在某个主坐标轴上的投影长度。其样本估计值为r(λk∙xj)=λkUkjSij2.2R分析:从标准化数据出发的主分量分析。2.3q分析:从样本着手分析,2.3.1原理:压缩样本,找出典型的综合样本2.3.2数学表示:仍然先求样本间的相似系数,Qnni,j=X'X=1p1pxαi-xixαj-xj再找

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。