第十一节单变量推论统计.ppt

第十一节单变量推论统计.ppt

ID:62045346

大小:197.50 KB

页数:24页

时间:2021-04-13

第十一节单变量推论统计.ppt_第1页
第十一节单变量推论统计.ppt_第2页
第十一节单变量推论统计.ppt_第3页
第十一节单变量推论统计.ppt_第4页
第十一节单变量推论统计.ppt_第5页
资源描述:

《第十一节单变量推论统计.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第十一章单变量的推论统计本章主要内容:概率分布与抽样分布、参数的区间估计方法、假设检验的原理与方法第一节推论统计的基础知识一、概率与概率分布二、正态分布三、均值抽样分布一、概率与概率分布1.概率是随机事件发生可能性大小的数量表示2.概率的性质(1)对于任何事件A,有0≤P(A)≤1;(2)必然事件的概率为1,即P(Ω)=1;(3)不可能事件的概率为0,即P(ф)=0。概率是一个介于0到1之间的数,用以描述一个事件发生的经常性。3.概率的统计定义在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐

2、增大时,随机事件A的频率越来越稳定地接近某一常数值p,那么就把p称为随机事件A的概率。记为P(A)。此为统计概率(statisticsprobability),或者称后验概率(posteriorprobability)。4.概率分布是指随机变量的所有取值以及每一种取值对应的概率分布。随机变量有如下特点:(1)取值的随机性,即事先不能确定取哪个值;(2)取值的统计规律性,即可确定某一可能取值的概率。要了解随机变量X的统计规律,就必须知道它的一切可能取值Xi及每种可能值的概率Pi。频率分布与概率分布的比较①频率分布是实验值,是可以变化的;而概率分布是理论值

3、,是唯一的。②频率分布又称为随机变量的统计分布或经验分布;概率分布则称为随机变量的理论分布。二、正态分布分布密度函数φ(x),实际上就是频率直方图的极限分布或理论分布。φ(x)—概率分布密度曲线纵轴为频率密度π=3.14e=2.72φ(x)正态分布的特征1.正态分布密度曲线是单峰钟型曲线,它关于直线x=μ对称,曲线在x=μ(均值)最高.2.其曲线为一条渐近线,即曲线的左右延伸只是趋近于横轴,而不会与横轴相交。3.服从该分布的变量的众值、中位值、均值三者重叠。4.曲线在μ±σ处有拐点。正态分布由参数μ和σ确定,当μ与σ取值不同时,就有不同分布,因此,正态

4、分布是一个分布族。μ反映正态分布的中心位置和相应随机变量取值的集中位置;σ反映分布的分散程度,σ越小,密度曲线就越尖耸,反之越扁平。标准正态分布(standardnormaldistribution)也称为Z分布。其均值μ=0,标准差σ=1。Z的单位与标准差σ的长度相同,即可以把随机变量Z的值看成是偏离均值的标准差的倍数。要计算Z值在某一范围的概率,也就是计算相应范围内概率分布曲线下的面积。标准正态分布记为N(0,1)一般正态分布标准化对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换,将其变换为服从标准正态分布的随机变量Z。公式

5、:Z=(X-μ)/σ三、均值抽样分布根据总体分布和样本大小的不同,可分以下三种情况来讨论样本均值的分布。总体为正态分布N(μ,σ2),且方差σ2为已知;总体为正态分布N(μ,σ2),但方差σ2未知;任意总体,大样本情况在此只学习大样本情况任意总体,大样本情况在社会研究中,总体情况往往是未知的但由中心极限定理可得出:若总体平均数μ和方差σ2有限,当样本容量n充分大时,无论总体分布形式如何,样本均值近似服从正态分布N(μ,σ2/n)在统计学中,大样本为n>30,而在社会研究中一般要求n>50.当样本量n→∞,以及的极限分布均为N(0,1)第二节参数估计一、

6、参数的点估计点估计就是以样本统计值来估计总体参数值,而不考虑抽样误差的一种方法;点估计常用的方法有两种:矩估计法和最大似然估计法。在此不做介绍点估计主要为许多定性研究提供一定的参考数据,或在对总体参数要求不精确时使用二、参数的区间估计区间估计的实质就是在一定的可信度下,用样本统计值的某个范围来估计总体的参数值。当用一个数值区间去估计总体参数时,一要由样本计算出点值;二要给出估计的区间;三要说明所给区间包含未知参数的概率(可靠程度)是多少。区间估计的表述:设是待估的参数,为概率值。如果由样本确定的两个统计量L和U满足下式P(L<<U)=1–

7、就称随机区间(L,U)是的置信区间;L和U则为置信上限和置信下限;1–为置信度;称为显著水平。区间估计的概念置信区间用样本值估计参数值时,所确定的取值范围。置信度也称作置信概率或置信系数,它表示用置信区间估计未知参数的可靠性。用1-表示。显著性水平(significancelevel)它表示用置信区间估计未知参数时不可靠(或出错)的概率。用表示。总体均值估计当样本容量为大样本时,根据中心极限定理可知,抽样分布以正态分布为极限,此时可以不用考虑总体的分布形式。总体均值区间估计公式:例:调查某厂职工的工资状况,随机抽取900名工人作样本

8、,调查得到他们的月平均工资为186元,标准差为42元。求95%的置信度下,全厂职工月均工资的置

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。