分类变量资料的统计分析-统计推断

分类变量资料的统计分析-统计推断

ID:41589113

大小:616.01 KB

页数:35页

时间:2019-08-28

分类变量资料的统计分析-统计推断_第1页
分类变量资料的统计分析-统计推断_第2页
分类变量资料的统计分析-统计推断_第3页
分类变量资料的统计分析-统计推断_第4页
分类变量资料的统计分析-统计推断_第5页
资源描述:

《分类变量资料的统计分析-统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三节分类变量资料的统计分析——统计推断信阳职业技术学院赵玉霞一率的抽样误差与可信区间二率的统计学推断1.样本率与总体率比较的u检验2.两个样本率比较的u检验三卡方检验1.四格表2检验(两个率比较)2.配对四格表2检验(两个率比较)3.行×列(R×C)2检验(多个率或构成比比较)主要内容能够计算率的标准误并能进行两个率差别的u检验描述总体率的估计方法能够进行两个率或多个率(或构成比)差别的2检验学习目标一率的抽样误差与可信区间1.率的抽样误差与标准误2.总体率的可信区间1.率的抽样误差与标准误如果总体均数μ未知,用样

2、本均数估计样本均数()和总体均数(μ)的差异称为均数的抽样误差(samplingerrorofrate),用均数的标准误(standarderrorofrate)度量。复习1.率的抽样误差与标准误样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计率的标准误的计算2.总体率的可信区间(confidenceintervalofrate)根据样本率推算总体率可能所在的范围二率的统计学推断1.样本率与

3、总体率比较u检验2.两个样本率的比较u检验1.样本率与总体率比较的u检验u检验的条件:np和n(1-p)均大于5时2.两个独立样本率比较的u检验两种疗法的心血管病病死率比较疗法死亡生存合计病死率(%)盐酸苯乙双胍26(X1)178204(n1)12.75(p1)安慰剂2(X2)6264(n2)3.13(p2)合计2824026810.45(pc)u检验的条件:n1p1和n1(1-p1)与n2p2和n2(1-p2)均>5小结1.样本率也有抽样误差,率的抽样误差的大小用σp或Sp来衡量。2.率的分布服从二项分布。当n足够大,π和

4、1-π均不太小,有nπ≥5和n(1-π)≥5时,近似正态分布。3.总体率的可信区间是用样本率估计总体率的可能范围。当p分布近似正态分布时,可用正态近似法估计率的可信区间。4.根据正态近似原理,可进行样本率与总体率以及两样本率比较的u检验。率的u检验能解决以下问题吗?率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗A、治疗B);反应为多分类,如何进行假设检验?率的u检验要求:n足够大,且nπ≥5和n(1-π)≥5。如果条件不满足,如何进行假设检验?三卡方检验2检验(Chi-squar

5、etest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的2检验。三卡方检验1.四格表2检验(两个率比较)2.配对四格表2检验(两个率比较)3.行×列(R×C)2检验(多个率或构成比比较)卡方检验的基本思想疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂2(c)62(d)64(c+d)3

6、.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)1.四格表(fourfoldtable)2检验两种疗法的心血管病病死率的比较如果确实p1=p2,那么两种疗法的病死率理论上都应该等于pc,故可算出实际频数A(a、b、c、d)所对应的理论频数T(T11,T12,T21,T22)(H0:π1=π2=π)卡方检验的基本思想1.四格表(fourfoldtable)2检验疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂2(c)62

7、(d)64(c+d)3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)两种疗法的心血管病病死率的比较T11=(a+b)×pc=(a+b)×[(a+c.)/n]=R1C1/n=21.3T12=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=R1C2/n=182.7T21=(c+d)×pc=(c+d)×[(a+c)/n]=R2C1/n=6.7T22=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=R2C2/n=57.3如果,H0:π1=π2=π成立,实际数

8、值与理论数值之间差异是抽样误差造成的;若H0:π1≠π2,实际数值与理论数值的差异也有统计学意义。两种疗法病死率的比较,就转变成了格子内的实际数值与理论数值的比较。计算检验统计量:各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。卡方

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。