《抽样误差》PPT课件

《抽样误差》PPT课件

ID:36773379

大小:458.10 KB

页数:31页

时间:2019-05-10

《抽样误差》PPT课件_第1页
《抽样误差》PPT课件_第2页
《抽样误差》PPT课件_第3页
《抽样误差》PPT课件_第4页
《抽样误差》PPT课件_第5页
资源描述:

《《抽样误差》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、参数估计基础杨双波 流行病与卫生统计学教研室1、均数的抽样误差在医学研究中,绝大多数情况是由样本信息研究总体。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数往往不等于总体均数,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究,抽样误差不可避免。一、均数的抽样误差与标准误2.均数的抽样误差与标准误的概念从N(,2)的总体中做随机抽样,每次抽样样本含量为n,样本均数为x,标准差为s。如下:1nx1s1sx1t12nx2s2sx2t23nx3s3sx3t34nx4s4sx4t4………………1

2、00nx100s100sx100t100标准误用x表示,它是说明均数抽样误差的大小可知:每一个样本均数与不一定相等,它们之差别是由抽样所造成的;另外,这100个样本均数大小也不尽相同,它们之间的变异程度可以用样本均数的标准差来表示,即标准误(为了与反映个体变异的标准差相区别)◆3.抽样误差的分布理论上可以证明:若从正态总体中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。抽样分布抽样分布示意图中心极限定理:当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近

3、似正态。抽样分布抽样分布示意图3.标准误样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小:实际中总体标准差往往未知,故只能求得样本均数标准误的估计值:标准误的计算例:某地成年男子红细胞的抽样调查,n=144,X=5.38×1012/L,S=0.44×1012/L,求其标准误。Sx=s/=0.44/=0.037(×1012/L)n144上述抽了100次样,可以求得100个Sx,均是x的估计值。实际工作中,只能根据一个样本计数出一个标准误说明抽样误差的大小,作为X估计的可靠程度。4.标准误应

4、用①标准误反映抽样误差的大小,Sx越大,抽样误差越大,用X估计的的可靠程度越差。②参数的估计③均数的假设检验二、t分布1.t分布的概念对于X~N(µ,)有u=(X-)/对于X~N(µ,x)有u=(X-)/xx是未知,常用Sx来代替。对于X~N(µ,x)有t=(X-)/sxu值的分布称为u分布(标准正态分布)t值的分布称t分布100次抽样,可以求得100个t值,100个t值编成频数表,可以绘制成频数分布图。由于sx受n的影响,严格讲,受(n-1)的影响,(n-1)称为自由度。=n-1如下图。◆t分布的图形2.分布的特

5、征(与正态分布比较)①单峰分布,以t=0为中点,两侧对称(高峰位置)②样本(自由度)越小,t分布曲线峰值越低,t值越分散(形状指标)③随着自由度的增大,t分布逐渐接近标准正态分布,当=∞时,t分布的极限分布是标准正态分布(与标准正态分布相比,t分布曲线高峰低,尾部较高)3.t界值表(P683)当一定时,t分布曲线下单侧或双侧的尾部面积为指定值时,横轴上相对应的t值记为t,有单、双侧t,之区分。如图。-t,0+t,/2/2-t,0图中阴影部分表示t,以外尾部面积占总面积的百分数P意思是从正态整体中做随机抽样,

6、得到样本t值落在该区间的概率.t界值表中:①同一时,t与P呈反向关系.t,>u②当相同时,单侧P与双侧2P对应相同的t界值,即单侧t,=双侧t2,③当=∞时,t=u三、总体均数的估计点估计(pointestimation):估计总体均数的具体数值大小,一般就用X代替的大小。该估计方法没有考虑抽样误差的大小,较少用。例:某抽样得X=165.0cm,=165.0cm.区间估计(intervalestimation):指用X和Sx按一定的概率估计总体均数在哪一个范围,该区间包含总体均数的概率为1-,称为总体均数的1-

7、可信区间。1-一般取0.95或0.99。总体均数可信区间(confidenceinterval,CI)估计①未知:按t分布②未知,n较大时总体均数的可信区间③已知①未知:按t分布t≤-t,和t≥t,的概率为P(-t,≤t≤t,)=1-P(-t,≤X-≤t,)=1-X-t,Sx≤≤X+t,Sx或X±t,SxSx例:已知某样本的X=5.04,s=0.44,n=10.试求该总体的正常成年男子平均红细胞计数的95%可信区间。解:=9,=0.05(双侧),查t界值表t0.05,9=2.2

8、62X±t,Sx=5.04±2.2620.44/10=(4.73,5.35)例随机抽取某地健康男子20名,测得该样本的收缩压

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。