数值变量资料的统计分析-统计推断

数值变量资料的统计分析-统计推断

ID:42064499

大小:1.08 MB

页数:44页

时间:2019-09-07

数值变量资料的统计分析-统计推断_第1页
数值变量资料的统计分析-统计推断_第2页
数值变量资料的统计分析-统计推断_第3页
数值变量资料的统计分析-统计推断_第4页
数值变量资料的统计分析-统计推断_第5页
资源描述:

《数值变量资料的统计分析-统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二节数值变量资料的统计分析——统计推断Statisticalinference信阳职业技术学院赵玉霞主要内容一均数的抽样误差与标准误二t分布三总体均数的估计四均数的假设检验学习目标1.说出抽样误差的概念2.记住标准误计算公式并能说出公式的含义3.描述t分布的特征及应用4.说出参数估计的含义及方法5.描述均数检验t检验和u检验的方法总体样本抽取部分观察单位统计量参数统计推断如:总体均数μ总体标准差σ总体率π如:样本均数样本标准差S样本率P内容:参数估计(estimationofparameters)包括:点估计与

2、区间估计2.假设检验(testofhypothesis)统计推断statisticalinference一均数的抽样误差抽样误差(samplingerror):由于个体差异导致的样本统计量之间或与总体参数间的差别。从某正态分布总体中,随机抽取样本含量n=100的样本,每次抽样获得其均数分别为,,,,他们之间及与总体均数μ总是不相等。这种差异就是抽样误差。1.抽样试验从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样

3、本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。抽样试验(n=5)抽样试验(n=10)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133个抽样实验结果图示抽样实验小结均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差

4、一个常数的倍数,即样本均数的标准误(StandardError)=样本标准差/从正态总体N(μ,σ2)中抽取样本,获得均数的分布仍近似呈正态分布N(μ,σ2/n)。2.中心极限定理(centrallimittheorem)①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。②随着样本量的增大,样本均数的变异范围也逐渐变窄。随机变量XN(m,s2)标准正态分布N(0,12)u变换均数标准正态分布N(0,12)Studentt分布自由度:n-1二t分布t分布曲线t分布有如下特征:①是以0为中心随自由度而变化的一簇

5、左右对称的曲线②单峰分布,曲线在t=0处最高,并以t=0为中心左右对称③与正态分布相比,曲线最高处较矮,自由度越小,两尾部翘得越高(见绿线)④随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。t分布曲线t分布有如下特征:①自由度相同时,t越大,p值越小②p值相同时,自由度越大,t值越小③t值相同时,自由度越大p值越小t1t2(t1>t2,p1n2,t1n2,p1

6、025,9单侧t0.01,9=2.821双侧t0.01/2,9=3.250=单侧t0.005,9双侧t0.05/2,∞=1.96=单侧t0.025,∞单侧t0.05,∞=1.640.013.2502.8210.005三总体均数的估计1.总体均数的估计(1).总体均数的点估计(pointestimation)与区间估计(2).总体均数的可信区间(confidenceinterval,CI)(3).大样本总体均数的可信区间2.可信区间的解释1.总体均数的估计(1).总体均数的点估计与区间估计参数的估计点估计:由样本统

7、计量直接估计总体参数区间估计:在一定可信度(1-α)下,同时考虑抽样误差区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本(如n=5)区间包含总体参数(μ)的百分数。常用(1-α)表示,α值一般取0.05或0.01。)或(;或写成),可信区间为(XXXXXStXStXStXStXStXnananananama,2/,2/,2/,2/,2/)1(+<<-±+--(2).总体均数的可信区间(CI)(2).总体均数的可信区间(3).大样本总体均数的可信区间2.可信区间的解释95%可信区间:从总体中作随机

8、抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。95%可信区间99%可信区间公式区间范围窄宽估计错误的概率大(0.05)小(0.01)XXStXStXnn,2/05.0,2/05.0,+-可信区间与参考值范围的比较四均数的假设检验1.样本均数与总体均数的比较2.配对资料的比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。