数值变量资料的统计推断(两组资料)

数值变量资料的统计推断(两组资料)

ID:42064536

大小:1.10 MB

页数:31页

时间:2019-09-07

数值变量资料的统计推断(两组资料)_第1页
数值变量资料的统计推断(两组资料)_第2页
数值变量资料的统计推断(两组资料)_第3页
数值变量资料的统计推断(两组资料)_第4页
数值变量资料的统计推断(两组资料)_第5页
资源描述:

《数值变量资料的统计推断(两组资料)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数值变量资料的统计推断——两组资料均数的比较计量资料本科班《医学统计学》Dr.朱彩华制作两组资料均数的比较第一节均数的抽样误差第二节t分布与可信区间第三节t检验第四节假设检验的步骤及其有关概念预防医学教研室朱彩华总体样本抽取部分观察单位统计量参数统计推断统计推断statisticalinference如:样本均数样本标准差S样本率p如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)包括:点估计与区间估计2.假设检验(testofhypothesis)随机预防医学教研室朱彩华总体样本抽取部分观察单位统计量参数统计推断第一节均数的抽样误差如:样本均数样本

2、标准差S样本率P如:总体均数总体标准差总体率抽样误差(samplingerror):由于个体差异导致的样本统计量与总体参数以及各样本统计量间的差别。预防医学教研室朱彩华一、抽样试验从正态分布总体N(5.00,0.50)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。预防医学教研室朱彩华抽样试验(n=5)预防医学教研室朱彩华抽样试验(n=10)预防医学教研室朱彩华抽样试验(n=30)预防医学教研室朱彩华10

3、00份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913X≈标准误(即抽样误差)的大小:与S成正比与n成反比;S一定时,增大n可减小抽样误差预防医学教研室朱彩华3个抽样实验结果图示预防医学教研室朱彩华抽样实验小结均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差一个常数的倍数,即样本均数的标准误(StandardError)=样本标准差/从正态总体N(m,s)中抽取样本,获得均数的分布仍近似呈正态分

4、布N(m,s/n)。预防医学教研室朱彩华二、中心极限定理centrallimittheorem①即使从非正态总体中抽取样本含量足够大时(如n>30),所得均数分布仍近似呈正态。②随着样本量的增大,样本均数的变异范围也逐渐变窄。预防医学教研室朱彩华X1S1X2S2XISiXnSnxσμσ标准误示意图预防医学教研室朱彩华标准误的应用(1)表示抽样误差的大小;(2)表示样本均数(x)代表总体均数()的可靠程度:xSx;(3)估计总体均数的可信区间;(4)假设检验。预防医学教研室朱彩华第二节t分布与可信区间一、t分布(tdistribution)二、总体均数的估计1.总体均数的点估计(poi

5、ntestimation)与区间估计2.总体均数的可信区间(confidenceinterval,CI)3.总体均数差的可信区间4.大样本总体均数的可信区间三、可信区间的解释预防医学教研室朱彩华一、t分布随机变量N(m,s)标准正态分布N(0,1)u变换均数N(,)标准正态分布N(0,1)t分布自由度:n-1预防医学教研室朱彩华t分布的概率密度函数式中为伽玛函数;圆周率(Excel函数为PI())为自由度(degreeoffreedom),是t分布的唯一参数;t为随机变量。以t为横轴,f(t)为纵轴,可绘制t分布曲线。预防医学教研室朱彩华t分布曲线t分布有如下性质:①单峰分布,曲线在t

6、=0处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高(如V=5或1)③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。=∞(tu)=5=1预防医学教研室朱彩华t分布曲线下面积(附表9-1)双侧t0.05/2,9=2.262=单侧t0.025,9单侧t0.05,9=1.833双侧t0.01/2,9=3.250=单侧t0.005,9单侧t0.01,9=2.821双侧t0.05/2,∞=1.96=单侧t0.025,∞单侧t0.05,∞=1.64预防医学教研室朱彩华根据t分布的变化特征,归纳以下两点:①在相同的P条件下,υ越小,t值越大、υ越大,

7、t值越小。②在相同的υ条件下,P越小,t值越大。即:t值越大、P越小t值越小、P越大③在相同的t值、υ条件下,双侧概率P为单侧概率P的两倍、或单侧概率P为双侧概率P的一半。即t值表规律:自由度(υ)一定时,P与t成反比;概率(P)一定时,υ与t成反比;预防医学教研室朱彩华二、总体均数的估计总体均数的点估计(pointestimation)与区间估计:参数的估计点估计:由样本统计量直接估计总体参数区间估计:考虑抽样误差的影

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。