t分布及t检验

t分布及t检验

ID:19863368

大小:232.50 KB

页数:13页

时间:2018-10-07

t分布及t检验_第1页
t分布及t检验_第2页
t分布及t检验_第3页
t分布及t检验_第4页
t分布及t检验_第5页
资源描述:

《t分布及t检验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、t分布  从数理统计的理论上讲,并且上节的实例也已说明,在总体均数为μ,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布。而当样本含量n不太小时,即使总体不呈正态分布,样本均数的分布也接近正态。在下式中,  由于μ与(样本均数的标准差)都是常量,又  X呈正态分布,所以u  也呈正态分布。但实际上总体标准差往往是不知道的,上式分母中的σ要由S替代,成为,那么由于样本标  准差有抽样波动,SX也有抽样波动,于是,在用S代替σ  后上式等号右边的变量便不呈正态分布而呈t分布,其定义公式是(6.5)

2、  t分布也是左右对称,但在总体均数附近的面积较正态分布的少些,两端尾部的面积则比正态分布的多些。t分布曲线随自由度而不同(如图6.1)。随着自由度的增大,t分布逐渐接近正态分布,当自由度为无限大时,t分布成为正态分布。图6.1 t分布(实线)与正态分布(虚线)  与正态分布相似,我们把t分布左右两端尾部面积之和α=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,,这里ν是自由度。把左右两端尾部面积之和α为0.01相应的t值称为1%界,符号为t0.01,,。t的5%界与1%界可查附表3,t值表。例如当自由

3、度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。可信区间的估计  一、参数估计的意义  一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。由于样本特征值是通过统计求得的,所以又称为统计量以区别于总体特征值。总体特征值一般称为参数(总体量)。我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。  本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为1

4、0%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。但由于存在抽样误差,不同样本(如再检查110人)可能得到不同的估计值。因此我们常用“区间估计”总体率(或总体均数)大概在那一个范围内,这个范围就叫可信区间。区间小的一端叫下限,大的一端叫上限。常用的有95%可信区间与99%可信区间。根据同一资料所作95%可信区间比99%可信区间窄些(上、下限较靠近),但估计错误的概率后者为1%,前者为5%,进行总体参数的区间估计时可根据研究目的与标准误的大小选用95%、或99%。  二、总体均数的估计  为了说

5、明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。  由求t的基本公式  我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5%  界即t0.05,,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求  出区间来估计总体均数μ所在范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。下面用实例说明其求法。  95%可信区间 X-t0.05,νSX<μ  99%可信区间 X-t0.05,νSX<μ

6、7)

  例6.2 上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,试求95%与99%可信区间。  1.求标准误   95%可信区间 488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内  99%可信区间 488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估计μ是在425.22~551.98区间内  这里两个可信区间都包含μ=500在内,所以这次估计是估

7、计对了。  抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,它们是:样本号X95%可信区间6546.7515.78~577.627524.5500.45~548.5528476.1454.91~497.2972465.3447.02~483.5875526.6503.10~550.10  平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很

8、难说了。如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本,以至总体均数并不在我们提出的区间内。不过,我们具体所

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。