《统计数据的整理》PPT课件

《统计数据的整理》PPT课件

ID:39670025

大小:1.06 MB

页数:36页

时间:2019-07-08

《统计数据的整理》PPT课件_第1页
《统计数据的整理》PPT课件_第2页
《统计数据的整理》PPT课件_第3页
《统计数据的整理》PPT课件_第4页
《统计数据的整理》PPT课件_第5页
资源描述:

《《统计数据的整理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章统计数据的整理和显示1第一节数据的预处理第二节统计分组第三节统计图表第一节数据的预处理数据的审核一手数据:完整性审核、准确性审核二手数据:适用性审核、时效性审核数据的筛选数据的排序第二节统计分组3统计分组的一般问题统计分组的方法定性数据的分组方法定量数据的分组方法一、统计分组的一般问题4概念:统计分组是根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组的统计方法。原则:穷尽原则、互斥原则种类:按分组标志的多少:简单分组、复合分组按分组标志的性质:品质分组、数量分组二、统计分

2、组的方法5定性数据的分组定量数据的分组(一)定性数据的分组:一个取值一个组——单项式分组例性别人数男女3020合计506(二)定量数据的分组1、按离散变量分组(1)变量值取值不多时:一个取值一个组——单项式分组年龄学生人数18192051520合计407(二)定量数据的分组1、按离散变量分组(1)变量值取值不多——单项式分组(2)变量值取值较多时,一个区间一个组——组距式分组班级人数(人)班级数20以下20-2930-4950及50以上16194合计308(二)定量数据的分组1、按离散变量分组:单项式分组或组距式分组2、按连续变量

3、分组:一个区间一个组——组距式分组身高(米)学生人数1.50-1.601.60-1.701.70-1.8010119合计309统计分组的方法(总结)定性数据的分组方法——单项式分组定量数据的分组方法1、按离散变量分组(1)变量值取值不多——单项式分组(2)变量值取值较多——组距式分组2、按连续变量分组——组距式分组10三、组距式分组中的几个概念1、组限区间两端的数值下限:区间最小值上限:区间最大值开口组和闭口组开口组:统计分组中缺上限或缺下限的组闭口组:统计分组中上、下限均齐全的组组限的写法:间断式写法连续式写法:“上限不在内”按

4、班级人数分组(人)班级数20以下20-2930-3940及40以上16194合计30按身高分组(米)学生人数1.50-1.601.60-1.701.70-1.8010119合计30112、组距:区间的距离(连续式写法)组距=上限—下限(间断式写法)组距=本组上限-前组上限或=本组下限-前组下限或=本组上限-本组下限+1(分组标志为离散变量)等距分组和异距分组按身高分组(米)组距1.50-1.601.60-1.701.70-1.800.10.10.1合计按班级人数分组(人)组距20以下20-2930-4950及50以上-1020-合

5、计12等距分组:在组距式分组中,每个组的组距均相等。一般在现象性质差异的变动比较均衡条件下使用。优点:易于掌握次数分布的特征;各组次数可以直接比较。按身高分组(米)学生人数1.50-1.601.60-1.701.70-1.8010119合计3013异距分组:在组距式分组中,各组组距不尽相等。一般在现象性质差异的变动非均衡的条件下使用。优点:能够准确地描述偏态分布;能将性质相同的总体单位归为一组。缺点:由于各组的组距不同,各组次数直接比较是没有意义的。按班级人数分组(人)班级数20以下20-2930-4950及50以上16194合计

6、3014153、组数原则:要尽量能反映总体单位的分布情况及总体单位的集中趋势。要尽可能区分出组与组性质上的差异。经验公式:m=1+3.3LgN四、例:某单位30名职工工资资料如下:1610608401100910109091011101070990940119087010509501060118097010301060850106010101050960105010701210128011101010整理以上资料,并对该单位职工工资分布情况作初步分析。数据整理的基本步骤:17排序:840850……12101280组数:组距:假设采

7、用等距闭口组,则最大值比真实值大一些;最小值比真实值小一些;职工工资分布表月工资(元)800-900900-10001000-11001100-12001200-1300合计18五、几个常用指标月工资(元)职工人数(频数)频率(%)800-900900-10001000-11001100-12001200-130037135210.023.343.316.76.7合计30100.019频数/单位数/次数:数据落在区间的个数频率:各组频数占总频数的比重组中值(闭口组)组中值=(上限+下限)/2  (连续式写法)(开口组)缺下限的开口

8、组组中值=相邻组下限-邻组组距/2缺上限的开口组组中值=本组下限+邻组组距/2月工资(元)职工人数比重(%)组中值800-900900-10001000-11001100-12001200-130037135210.023.343.316.76.7

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。