第十节单变量描述统计.ppt

第十节单变量描述统计.ppt

ID:62045292

大小:177.50 KB

页数:26页

时间:2021-04-13

第十节单变量描述统计.ppt_第1页
第十节单变量描述统计.ppt_第2页
第十节单变量描述统计.ppt_第3页
第十节单变量描述统计.ppt_第4页
第十节单变量描述统计.ppt_第5页
资源描述:

《第十节单变量描述统计.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第十章单变量的描述统计本章主要内容:描述统计的基本方法、集中趋势与离散趋势分析。第一节描述统计的基本技术描述性分析是对已经初步整理的数据资料进行分析,并用统计量对这些资料进行描述的一种方法;描述统计只是描述样本属性或变量关系,是对样本观察的结果。一、频数与频数分布二、统计表三、统计图一、频数与频数分布统计学中的分布:是指一个变量的各个取值出现的次数或频率。频数分布(Frequencydistribution):就是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。频率分布(percentagesdistribution)是一组数据中不同取值的频数

2、相对于总数的比率分布情况.常以百分比的形式来表达.X年统计学历分布学历人数(频数)频率小学及以下10.3初中7224高中4415中专134.3大专5217.3大学5819.3硕士41.3博士72.4Missing4916.3Total300100分布表的作用:一是简化资料;二是描述;三是为深入分析有关现象打下基础.二、统计表(Statisticaltables)统计表是用表格形式表示变量的分布。统计表结构统计表类型统计表格(结构)从外表形式上看,统计表由序号、总标题(表的名称)、标目(横行标题、纵栏标题)、表身(指标数值)、表注四部分组成。表注。写于表的下面。对标题补

3、充说明;或说明数据来源、附记等内容。年份财政总收入财政总支出200013395.2315886.5200116386.0418902.58……我国历年财政总收支表单位:亿元表2-5资料来源:《中国统计年鉴(2002)》五年财政收支情况2.简单分组表(总体仅按一个标志进行分组)年人均收入村(频数)百分比(%)60—8080—120120—1605911203842合计20100某村各户年人均收入统计表1.简单表(总体未做任何分组)某村历年人均收入年份1977197819791980收入200280400450统计表格(类型)3.复合分组表是总体按两个以上标志进行层叠分组

4、的统计表,它又称为交互分类表,它能表现两个分组标志之间的关系。某村家庭规模和经济情况统计表经济水平家庭规模大小合计高低30501201015060合计80130210三、统计图(Statisticalgraphs)即用图形的形式来表示变量的分布。1.圆瓣图(piegraphs)2.条形图(Bargraphs)3.直方图(Histograms)4.折线图(Polygon)圆瓣图(piegraphs)圆瓣图是用一个圆代表现象总体,每一瓣代表现象中的一类,其大小代表它在总体中所占的百分比频率。圆瓣图多用于描述定类变量的分布。条形图(Bargraphs)用于描述定类与定序变量

5、的分布,它是以长条的高度表示变量不同取值的频率(次)分布的,其中长条的宽度没有意义,一般均画成等宽长条。长条的排列可以是离散的,也可以是紧挨着的。直方图(Histograms)直方图直方图也是由紧挨着的长条构成的,但与条形图不同的是,它的条形的宽度是有意义的,表示组距。它是用长条的面积表示频率(次)的大小。长条的纵轴高度表示频率(次)密度:频率(次)密度=频率(次)/组距直方图仅适用与定距变量。折线图(Polygon)折线图是用直线连接直方图中条形顶端的中点而成的。显然,当组距逐渐减少时,折线的形状也将逐渐变为平滑,其趋势是一条连续的曲线。第二节集中趋势测量集中趋势是

6、指反映变量分布的特征值。该特征值又称作集中量数它是代表一组数据典型水平或集中趋势的量,反映频数分布中大量数据向某一点集中的情况。一、定类变量:众数二、定序变量:中位数三、定距变量:平均值四、众数、中位数、平均数的比较一、定类变量:众数众数(简写Mo)是一组数据中出现次数最多(即频数最高)的那个数值众数与平均数一样也可用来概括反映总体的一般水平或典型情况.其计算方法分两类:(1)单值分组资料(观察法)最大的频数—对应的标志值=众数(2)组距分组资料(组中值法)最大的频数—对应的组—组中值=众数.众数示例表3.某年级学生的年龄分布年龄人数(频数)累计频数↓累计频数↑171

7、0101501825351401950851152040125652120145252251505合计150最大频数组为19岁组众数值为19.5因为这是年龄组。二、定序变量:中位数中位数(Md)把一组数据按值的大小顺序排列起来,处于中央位置的那个数值就叫中位数.计算中位数有下面两种情况:(1)用原始资料当样本为偶数时,以中间两个数值的平均数作为中位数.(2)用分组资料L=中位数之真实下限f=各组之次数i=中位数之组距Cf=下限之累加次数fm=中位数所在组次数三、定距变量:平均值平均数是总体各单位数值之和除以总体单位数之商。应用于定距、定比变量计算公式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。