计量资料的统计推断(I)

(35页)

'计量资料的统计推断(I)'
l 几个概念:l 计量资料:测定每个观察单位某项指标量的大 小得到的数据(资料)。l 总体:研究对象(某项变量值)的全体。l 样本:总体中随机抽取的一部分研究对象的某 项变量值。l 统计量:从样本计算出来的统计指标。l 参数:总体的统计指标叫总体参数。 2统计推断:用样本信息推论总体特征的过程。包括:参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。方法:均数的参数估计、均数u 检验 、均数t 检验 3第一节 标准误第二节 t 分布第三节 总体均数的估计第四节 假设检验第五节 均数的 u 检验一、概念抽样误差:由于抽样引起的样本统计量与总 体参数之间的差异(举例,抽样误差的产 生及含义)。标准误 :符号,表示抽样误差大小的指标; 样本均数的标准差; 5二、(均数)标准误的计算三、 (均数)标准误意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:S 一定,n↑,标准误↓ 6大样本、小样本概念:30 、 50 、 100。量变引起质变:当样本容量较大时,其统计量的抽样分布近似为正态分布。随着N的增大,越来越接近于正态分布(样本均数的分布)。但当样本量小于100时,抽样分布不能再用正态分布来近似,随着N的减小,与正态分布的差别越来越大,需要用小样本理论来解释(样本均数的分布) 。l 复习两个概念:▲ 正态分布▲ 标准正态分布 (u 分布) 78t 分布(与u 分布 比较的特点) 9t 值表(附表2 P118 ) 横坐标:自由度, υ 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。 10t 值表规律:(1) 自由度(υ)一定时,p 与 t 成反比;(2) 概率(p) 一定时, υ 与 t 成反比; 11统计推断的任务就是用样本信息推论总 体特征。参数估计,用样本均数估计总体均数。 ?1、 点(值)估计(近似值)2、 区间估计(近似范围) 121、点(值)估计:用样本均数直接作为总体均数的估计值, 未考虑抽样误差。 13▲ 概念:根据样本均数,按一定的可信度计算 出总体均数很可能在的一个数值范围,这个 范围称为总体均数的可信区间。▲ 方法:(1) u 分布 法(2) t 分布法 14 (1)u 分布 法公式应用条件: 例题 意义:与正常值范围进行比较 15 意义: 虽然不能知道某市全体成人脉搏均数的确切 数值,但有95%的把握说该市全体成人脉搏均数 在73.9次/分 -- 75.1次/分之间,有99%的把握说该 市全体成人脉搏均数在 73.7次/分 -- 75.3次/分之间。 换句话说,做出该市成人脉搏均数为73.9次/分 -- 75.1次/分的结论,说对的概率是95%,说错的概率是5%;做出该市成人脉搏均数为73.7次/分 -- 75.3次/分的结论,说对的概率是99%,说错的概率是1%。 16 (2)t 分布 法公式应用条件例题意义 17区间估计的准确度:说对的可能性大小, 用 (1-?) 来衡量。99%的可信区间好于95%的可信区间(n, S 一定时) 。区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S 一定时) 。 准确度与精确度的关系:(例如预测孩子的身高) 18 正常值范围估计与可信区间估计 正常值范围 可信区间概念:绝大多数正常人的某指标 概念:总体均数所在的数值范围。(95%,99%, 指绝大多数 范围( 95%,99% 指可信度)正常人)计算公式: 计算公式:用途:判断观察对象的某项 用途:估计总体均数指标是否正常. 19▲显著性检验;▲科研数据处理的重要工具;▲某事发生了: 是由于碰巧?还是由于必 然的原因?统计学家运用 显著性检验来处理这类问 题。 20假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果 由于个体差异的存在,即使从同一总体中 严格的随机抽样,X1、X2、X3、X4、、、,不同。 因此,X1、X2 不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造 成了样本均数的差别。差别无显著性 。(2)分别所代表的总体均数不同。差别有显著性。 22l判断是由于何种原因造成的不同,以做出决策。 反证法:当一件事情的发生只有两种可能A和B, 为了肯定其中的一种情况A,但又不能直接证实 A,这时否定另一种可能B,则间接的肯定了A。 概率论:事件的发生不是绝对的,只是可能性 大小而已。▲ 建立假设:检验假设(无效假设,H0 ):两个总体均数相等; 备择假设 (H1):与 H0 相反;▲ 确定显著性水平( ? ):区分大小概率事件的标准▲ 计算统计量:选择不同的统计方法:u, t▲ 确定概率值:▲ 做出推论 24l 接受检验假设l 拒绝检验假设正确理解结论的概率性(都隐含着犯错误的 可能性)。 251. 大样本均数与已知总体均数比较的u 检验2. 两个(大)样本均数比较的u 检验 26▲目的:比较样本均数所代表的未知总体均数 与已知的总体均数有无差别▲计算公式:u 统计量 27▲ 适用条件:(1) 已知一个总体均数;(2) 可得到一个样本均数;(3) 可得到该样本标准误;(4) 样本量不小于100。 28例题: p. 29, 例4已知:(1) 一个总体均数:114.0 mmHg ;(2) 一个样本均数:119.8 mmHg ;(3) 可计算出样本标准误:(4) n = 100;▲ 建立假设:检验假设:高原地区20-29岁健康女子收缩压均数与一般20-29岁健康女子收缩压均数相同; 备择假设 :高原地区20-29岁健康女子收缩压均数与一般20-29岁健康女子收缩压均数不同;▲ 确定显著性水平( ? ):0.05 30 ▲ 计算统计量:u 统计量: u = 5.47 ▲ 确定概率值: |u| > 1.96 , p < 0.05; ▲ 做出推论: U= 5.47 > 1.96, p < 0.05 < ?, 小概率事件发生了,原假设不成立;拒绝H0 , 接受H1, 可认为: 高原地区20-29岁健康女子收缩压均数与一般20-29岁健康女子收缩压均数不同;高原地区20-29岁健康女子收缩压均数与一般20-29岁健康女子收缩压均数差别有显著性。 31▲目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。 ▲计算公式及意义: u 统计量▲ 适用条件:(1) 已知/可计算两个样本均数及它们的标准差 ;(2) 两个样本例数都不少于100。 32例题: p. 30, 例5已知:(1)一个样本: 均数37.6, 标准差22.5; 另一个样本:均数38.8, 标准差25.8;(2) n1=375; n2=367 33▲ 建立假设:检验假设:正常男/女新生儿血中甘油三脂均数相同; 备择假设 :正常男/女新生儿血中甘油三脂均数不同;▲ 确定显著性水平( ? ):0.05 34▲ 计算统计量:u 统计量: u = 0.67;▲ 确定概率值: u < 1.96 , p > 0.05; ▲ 做出推论: 因为 p > 0.05 > ?, 不能拒绝H0:不能认为正常男/女新生儿血中甘油三脂均数不同。 小 结
关 键 词:
计量资料的统计推断(I) ppt、pptx格式 免费阅读 下载 天天文库
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:计量资料的统计推断(I)
链接地址: https://www.wenku365.com/p-42277474.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开