交叉列联表分析

交叉列联表分析

ID:43393519

大小:133.11 KB

页数:5页

时间:2019-10-01

交叉列联表分析_第1页
交叉列联表分析_第2页
交叉列联表分析_第3页
交叉列联表分析_第4页
交叉列联表分析_第5页
资源描述:

《交叉列联表分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、交叉列联表分析用于分析属性数据1・属性变量与属性数据分析从变暈的测虽水平來看分为州类:连续变呈和属性(Categorical)变暈,属性变虽又可分为有序的(Ordinal)和无序的变量。对属性数据进行分析,将达到以下几方面的H的:1)产生汇总分类数据——列联农;2)检验属性变量间的独立性(无关联性);3)计算屈性变量间的关联性统计量;4)对高维数拥进行分层分析和建模。在实际屮,我们经常遇到判断两个或多个属性变量Z间是否独立的问题,如:吸烟与患肺癌是否有关?色盲与性别是否有关?上网时间与学习成绩是否有关等等.解决这类问题常用到建立列联表,利用力

2、2统计量作显著性检验來完成.2.列联表(ContingencyTable)列联表是山两个以上的属性变量进行交叉分类的频数分布表。设二维随机变量(X,Y),X可能取得值为越,疋,…,心,丫可能取得值为刃,丁2,…,儿•现从总体中抽取容量为n的样本,其中事件(X=Xisr发生的频率为mj(i=h2,…,r,j=l,2,…,s,)记H,.=XniJf=j,7=1Z=1则有n=门二£仏.二xn・j,将这些数据排列成如下的表:这是一张rxs列联表.3.属性变量的关联性分析对丁•不同的属性变量,从列联农中可以得到它们联合分布的信息。但有时还想知道形成列联

3、表的行和列变量间是否有某种关联性,即一个变屋取不同数值时,另一个变量的分布是否冇显著的不同,这就是属性变量关联性分析的内容。属性变量关联性检验的假设为H0:变量之间无关联性;H1:变量之间有关联性由丁•变量之间无关联件说明变量互相独立,所以原假设和备择假设可以写H0:变量Z间独立;H1:变量之间不独立X检骑Ho:X与Y独立.记n=J7;•)=P)j»/=1»2,…,r>j=1»2,…,s,P(X=齐)=Pj,/=1»2,…,r,P(Y=yj)=P.),J=1»2,…,s.由离散性随机变量相互独立的定义,则原假设等价于H():P—p.p.j,/

4、—1»2,***,r,—1»2,**•»s.若匕j已知,我们可以建立皮尔逊力2统计量由皮尔逊定理知,力2的极限分布为z2(r5-l).但这里卩口未知,因此用它的极人似然估计0"代替,这时检验统汁量为在Ho成立的条件下,P..=p.pj,即等价于JIJ和0“的极大似然估计AAPJP.j的积去代替.可以求得Pi.=i=L2,•/=1,2,•J=1,2,•从而得到统计量AA,=iij='nA"Pi.P.j(2、广1v=irii•n.ji在H()成立的条件下,当nT8时,力2的极限分布为力2(冷_(厂+$_2)—1)=/((_[)($_]))对给定的

5、显著性水平(】,当旷>力二((厂一1)(S—1)),则拒绝H(),否则接受H°.特别,当r=s=2时,得到2X2列联衣,常被称为四格表.是应用最广的一种列联表.这时检验统计量为“2(Hll/122-/112/12I)X=nn.i.n.n.2它的极限分布为力$(1).对于二维随机变量(X,Y)是连续取值的情况,我们可采用如下方法将其离散化.①将X的取值范(-co,+oo)分成「个互不相交的区间,将Y的取值范围(_8,+8)分成S个互不相交的区间,于是整个平面分成了rs个互不相交的小矩形;②求出样本落入小矩形中的频数mJi=1»2,•••,

6、r,,j=1,2,…,s:③建立统计暈(.2、X2=n££—一1,/=ly=l/?/•/?•/丿在H()成立时且n充分大时,力「的极限分布为/((r-l)(5-l)),拒绝域的确定同离散型的情况.3.属性变杲的关联度计算力2检验的结果只能说明变量Z间是否独立,如果不独立,并不能由龙2的值说明它们Z间关系的强弱,这可以由(P系数來说明0系数hMl11122~Hi2/121,r=s=2其它莫中当r=s=2即2X2列联表时JV0V1,其它Ov0vl.

7、0

8、越接近1,它们Z间关联性越强,反Z越弱。主要用于2X2列联表例1(教材pll6例4.4)为了了

9、解吸烟与患慢性气管炎的关系,对339名50岁以上的人作了调查,貝体数拥如下表:患病if^X.患病未患病合计吸烟43162205不吸烟13121134合计56283339利川交义列连表分析,研究吸烟习惯与患慢性气管炎的关系。解检验Ho:吸烟与患慢性气管炎无关.已给数据构成一个四格表,n=339,ni]=43,M12="2,〃21=口,巾22=121,ni>=205,nel=13,n2>=134‘几.2=121,则心2Gun22—/1I2H21)339x(43x121-162X13f无=fl=u7.469.n.i.n.n.i13x134x2

10、05x1217若给定a=0.05,查表得/~95(1)=3.841<7.469,所以拒绝H。,即认为吸烟习惯与患慢性气管炎有关.但0系数=0.148较小,表示相关性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。