数值变量资料的统计分析ppt课件.ppt

数值变量资料的统计分析ppt课件.ppt

ID:58781804

大小:1.17 MB

页数:47页

时间:2020-10-03

数值变量资料的统计分析ppt课件.ppt_第1页
数值变量资料的统计分析ppt课件.ppt_第2页
数值变量资料的统计分析ppt课件.ppt_第3页
数值变量资料的统计分析ppt课件.ppt_第4页
数值变量资料的统计分析ppt课件.ppt_第5页
资源描述:

《数值变量资料的统计分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、卫生学第十章数值变量资料的统计分析哈尔滨医科大学公共卫生学院隋虹主要内容数值变量资料的统计描述正态分布及其应用数值变量资料的统计推断t检验和z检验方差分析3第一节数值变量资料的统计描述数值变量资料的频数分布集中趋势的描述离散趋势的描述数值变量资料的频数分布(一)编制频数分布表和绘制频数分布图收集到数据后,欲了解其分布的范围、分布的形态以及数据最集中的区间,可通过编制频数分布表和绘制频数分布图来实现。数值变量资料的频数分布编制频数表的步骤如下:1.计算极差;2.确定组段数、组距与组段;3.列表;6尿素氮浓度频数累计频数频率(%)累计频率(%)2.00~221.

2、431.432.40~795.006.432.80~13229.2915.713.20~143610.0025.713.60~155110.7136.434.00~197013.5750.004.40~188812.8662.864.80~1610411.4374.295.20~1411810.0084.295.60~131319.2993.576.00~61374.2897.866.40~6.8031402.14100.00合计140—100.00—表10-2140名健康成年男性血清尿素氮浓度(mmol/L)数值变量资料的频数分布(二)频数分布表和频数分布

3、图的用途1.将原始数据以相对直观、有序的表格或图的形式表达,以便于揭示数值变量资料的分布类型,进一步做统计分析;2.用于描述频数分布的特征,包括集中趋势和离散趋势;3.便于发现资料中某些特大或特小的可疑值。集中趋势的描述(一)算术均数(arithmeticmean)简称均数(mean),可用于反映一组呈对称分布的变量值在数量上的平均水平。其计算方法有直接法和加权法(二)几何均数(geometricmean)用表示,可用于反映一组经对数转换后呈对称分布或数据之间呈倍数关系或近似倍数关系资料的平均水平。其计算方法有直接法和加权法。集中趋势的描述(三)中位数与百分

4、位数中位数(median)用M表示,是将一组观察值按从小到大的顺序排列后,位次居于中间的那个数值。百分位数(percentile)是一种位置指标。将n个观察值从小到大排列,分成100等份,各等份含1%的观察值,则第x百分位次对应的数值称为第x百分位数,用表示。离散趋势的描述(一)全距(range)用R表示,亦称极差,为一组同质观察值中最大值与最小值之差。(二)四分位数间距(quartilerange)上四分位数与下四分位数之差,即。(三)方差(variance)是描述所有观察值与均数的平均离散程度的指标,表示一组数据的平均离散程度。离散趋势的描述(四)标准差

5、(standarddeviation)是方差的算术平方根。总体标准差用表示,样本标准差用S表示,其计算公式为(五)变异系数用CV表示,即标准差与算术均数之比,描述了观察值的变异相对于其平均水平的大小。第二节正态分布及其应用正态分布正态分布的特征和曲线下面积分布规律正态分布的应用正态分布正态分布是一种连续型随机变量常见而重要的分布。正态分布是数理统计中发展得最为完善的一种分布,很多统计推断都是在正态分布条件下进行的。许多非正态分布的资料,当观察例数足够多时,也可以用正态分布作为它的极限分布形式。正态分布的特征和曲线下面积分布规律正态分布有以下四个方面特征:①正

6、态曲线在横轴上方,呈钟形曲线,两端与横轴永不相交;②正态分布以均数为中心,均数所在处最高,左右对称;③正态分布有两个参数,即均数与标准差;④正态分布曲线下的面积分布有一定的规律性。正态分布的应用(一)估计变量值的频数分布(二)制定参考值范围(三)质量控制(四)正态分布是很多统计方法的基础第三节数值变量资料的统计推断均数的抽样误差与标准误t分布总体均数的置信区间估计假设检验的基本思想和步骤均数的抽样误差与标准误均数的抽样误差:指抽样引起的样本均数与总体均数之间的差异或样本均数之间的差异均数的标准误:为了与反映观察值离散程度的标准差相区别,统计学中把样本均数的标

7、准差称为标准误均数的抽样误差与标准误均数标准误(理论值)的计算公式是:式中表示总体标准差,为样本例数,为均数标准误的理论值均数的抽样误差与标准误由于在实际的抽样研究中,常属未知,而通常仅用一个样本的标准差作为的估计值,因此计算样本均数标准误的估计值为当标准差一定时,标准误与样本含量的平方根成反比。当样本例数一定时,标准误与标准差成正比。t分布分布是一簇对称于0的单峰分布曲线。自由度(实际上是样本含量n)越小,曲线越扁平,随着自由度的增大,t分布曲线逐渐逼近标准正态曲线。当自由度为无穷大时,则t分布曲线与标准正态曲线完全吻合。t分布主要用于总体均数的区间估计及

8、t检验等。总体均数的置信区间估计统计推断包括两个重要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。