数值变量资料的统计描述ppt课件.ppt

数值变量资料的统计描述ppt课件.ppt

ID:58781802

大小:244.50 KB

页数:43页

时间:2020-10-03

数值变量资料的统计描述ppt课件.ppt_第1页
数值变量资料的统计描述ppt课件.ppt_第2页
数值变量资料的统计描述ppt课件.ppt_第3页
数值变量资料的统计描述ppt课件.ppt_第4页
数值变量资料的统计描述ppt课件.ppt_第5页
资源描述:

《数值变量资料的统计描述ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章数值变量资料的统计描述数值变量资料的分类离散型资料(discretedata)连续型资料(continuitydata)离散型资料连续型资料第一节频数分布表和频数分布图频数分布表:常用于样本量较大资料的统计描述。频数分布图:用图示的方法描述频数分布的特点,比频数表更直观、形象。一、离散型定量资料的频数分布图3-1某年某市120名1岁男童乳牙数的频数分布二、连续型定量资料的频数分布求全距(range,R),R=129.5—101.2=28.30(cm)划分组段确定组数确定组距确定各组段的上下限列出频数表图3-2某市120名6岁女孩的身高分布身高频数010203099102

2、105108111114身高(cm)117120123126129身高频数频数分布两个重要特征集中趋势离散趋势频数分布类型对称分布:集中位置在中间,左右两则的频数基本对称。偏态分布:集中位置偏向一侧,左右频数不对称。正偏态:集中位置偏向数值小的一侧(左侧)负偏态:集中位置偏向数值大的一侧(右侧)正偏态(左偏态)负偏态(右偏态)第二节集中趋势的描述描述定量资料集中趋势常用的统计指标为平均数(average)。算术均数几何均数中位数/百分位数一、算术均数(mean)适于描述正态分布或近似正态分布资料的集中趋势(μ,)方法直接法加权法直接法(directmethod)例3-3现有1

3、0名6岁女孩的身高值(cm)为110.9,120.4,108.2,121.2,112.3,121.8,117.0,111.4,117.2,108.3,试求其算术均数。加权法(weightmethod)cm直接法:115.76cm二、几何均数(geometricmean,G)观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。方法直接法加权法例3-4有5人接种某种疫苗后,测定抗体滴度分别为1:8,1:16,1:32,1:64,1:128,求几何均数。加权法三、中位数(median,M)和

4、百分位数(percentile,Px)中位数:将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。资料为对称分布,M=方法直接法频数表法直接法频数表法百分位数将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。一个百分位数Px将全部数据分为两个部分,有x%的数据比Px小,有(100~X)%的数据比Px大,故百分位数是一个位置指标。计算例3-9计算例3

5、-8中表3-5的百分位数P25、P75、P90的值。(mmol/L)(mmol/L)(mmol/L)第三节离散趋势的描述例3-10三组同性别、同年龄儿童的体重(kg)资料如下:甲组1618202224乙组1417202326丙组1619202124描述离散趋势的常用指标有极差四分位数间距方差标准差变异系数一、极差(range,R)极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点只涉及最大值和最小值,不能反映组内其他数据的变异程度样本较大时,抽样误差大,因此抽到最大值和最小值的可

6、能性也越大,故样本例数相差较大时,不宜比较其极差二、四分位数间距(quartilerange,Q/Qu-Ql)P25-P75四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。三、方差(variance)方差是描述对称分布,特别是正态分布或近似正态分布资料离散程度的常用指标。自由度(degreeoffreedom,)的意义是随机变量在一定条件下能“自由”取值的变量

7、值个数,若变量取值受k个条件的限制,其自由度为n—k。四、标准差(standarddeviation,S/SD)标准差是在统计中应用最多的变异指标。标准差是方差的算术平方根,与变量值的单位相同。标准差适于描述对称分布定量资料的离散程度。计算方法直接法加权法直接法加权法五、变异系数(coefficientofvariation,CV)变异系数(亦称离散系数)为相对数,没有单位,便于资料间的比较。它常用于比较测量单位不同,或均数相差悬殊的几组资料的离散程度不同单位几组资料离散程度的大小比较均数相差悬殊的几组

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。