第十章 单变量描述统计.doc

第十章 单变量描述统计.doc

ID:33500023

大小:212.50 KB

页数:12页

时间:2019-02-26

第十章 单变量描述统计.doc_第1页
第十章 单变量描述统计.doc_第2页
第十章 单变量描述统计.doc_第3页
第十章 单变量描述统计.doc_第4页
第十章 单变量描述统计.doc_第5页
资源描述:

《第十章 单变量描述统计.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十章单变量的描述统计调查所得的原始资料经过审核、整理与汇总后,还需要进行系统的统计分析,才能揭示出调查资料所包含的众多信息,才能得出调查的结论。根据变量数量的差别统计分析划分为单变量分析、双变量分析和多变量分析。在这一讲中我们先介绍单变量的统计分析。单变量统计分析可以分为两个大的方面,即描述统计和推论统计。描述统计是用最简单的概括形式反映出大量数据资料所容纳的基本信息。推论统计是用样本调查中所得到的数据资料来推断总体的情况。这一讲我们讲解单变量的描述统计方法。一、变量的分布(Distributions)变量的

2、分布分为两类,一类是频数分布,一类是频率分布。频数分布就是变量的每一取值出现的次数;频率分布是用变量每一取值的频数除以总个案数,它是一个相对指标,可以用来比较不同样本。频数分布与频率分布一般以统计表与统计图的形式表达。1、统计表(1)统计表就是以表格的形式来表示变量的分布。如下表所示:表9-1甲校学生的父亲职业职业fp%工人农民干部1522881100.2760.5240.20027.652.420.0总数5501.000100.0数值中的小数的取舍:通俗的做法是“四舍五入”。“四舍”没有问题,但无原则的“五入

3、”就会产生一定的误差。例如数值6.25、4.45、3.75、和7.15的总合是21.60。如果对原数的最后一位小数作简单的四舍五入,原数就变成6.3、4.5、3.8、7.2,其总合是21.8,把原来的总合变大了。近代统计学有一项新原则,就是“前单五入”,即“五”前面是单数就进位,若是双数就舍掉(0也算双数)。12(2)对于定序及以上层次的变量我们更多的是使用累加频数和累加频率。如下所示:表9-2甲校学生之父亲教育水平教育fcfcf¯%c%c%¯一级二级三级四级五级685506890482158106392264

4、193286457939355012.4100.012.416.387.628.719.371.348.035.152.083.116.916.9100.0总数550100.01、统计图统计图是以图形表示变量的分布情况。与统计表相比,统计图更直观、生动、醒目,但不够精确。统计图有圆瓣图、条形图、直方图和折线图。(1)圆瓣图:多用于描述定类变量的分布,主要目的为显示各部分在整体中所占的比重,以及各部分之间的比较。如表9-1的资料可用下图(图1)所示:农民部分=360°×52.4%=188.64°工人部分=360°

5、×27.6%=99.36°干部部分=360°×20.2%=72°(图一)甲校学生的父亲职业分布12(2)条形图:多用于描述定类与定序变量的分布,它是以长条的高度表示变量不同取值的频数(率)分布的,其中长条的宽度没有意义,一般均画成等宽长条。为求清楚,长条之间可以分开。如表9-2的资料可用下图(图2)所示:(图二)甲校学生的父亲教育水平(3)直方图:直方图是由紧挨着的长条构成的,但与长条图不同,它的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频数(率)的大小,长条的纵轴高度表示频数(频率)密度

6、{密度=频数(率)/组距},长条的宽度表示组距。直方图仅适用于定距变量。如表9-3的资料可用下图(图3)所示:表9-3甲校学生的家庭每月总收入收入fcf↑cf↓1500~18991300~14991100~1299900~1099700~899500~699405504014151018115836933913621147565755401010550总数550组限(classlimits),就是每组的范围,包括上限(upperlimit)和下限(lowerlimit)。例如表9-3中的“700~899”组,上

7、限是899,下限是700。但要注意,统计表上所标示的组限(statedlimits)是让读者容易领会,但不是真实的组限(reallimits)。上表的真实组限是499.5~699.5、699.5~899.5、899.5~1099.5、1099.5~1299.5等等。如果某家庭的收入与真实组限之值相同,一般是采用四舍五入的原则,如把699.5元归“700~899”组。真实组限与标示组限的关系,可以下式表示:真实下限=标示下限-0.512真实上限=标示上限+0.5组距(classwidth),就是组的真实上限与真实

8、下限之差,如上表的“700~899”组的组距是:899.5-699.5=200。组中点(classmidpoint),就是真实上限与真实下限的平均数,如“700~899”组的中点是:(699.5+899.5)÷2=799.5。(4)折线图:折线图是用直线连接直方图中条形顶端的中点而成的。二、集中趋势分析集中趋势是从一组数据中抽象出一个代表值,代表现象的共性和一般水平。这种方法有一个特殊

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。