统计学 ---数据的收集与整理

(53页)

'统计学 ---数据的收集与整理'
第2章 数据的搜集与整理 统计学第2章 数据的搜集与整理 2.1 统计数据的收集 2.2 统计数据的整理两个渠道:v 调查或观察 - 取得社会经济数据的重要手段v 实验 - 取得自然科学数据的主要手段(一)统计调查方式 统计调查方式 1、抽样调查(Sample survey) ? ? ? ? ?(4)特点 - 按随机原则抽选调查单位 - 用样本推断总体 - 在调查前可计算和控制抽样误差 2、普查 (census)1.专门组织进行的一次性全面调查2.相对于常规性调查3.相对于经常性调查 4.相对于非全面调查5.我国已建立了周期性普查制度 3.统计表报 (Statistical report forms)1.按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据2.是我国重要的数据收集方式3.以原始数据为基础,按统一的表式、指标、报送时间、程序填报 4.重点调查和典型调查§ 从调查对象的全部单位中选择少数重点单位 进行调查§ 调查结果不能用于推断总体典型调查(Model survey)? 从调查对象的全部单位中选择若干 有代表性的单位进行调查? 目的是描述和揭示事物的本质特征 和规律 ? ? ? ?? 调查结果不能用于推断总体 ? ? ??? ? ? ?(二)数据的搜集方法 v 数据的搜集方法 v 询问调查 v 观察实验 访问调查 (Personal interview) 1.调查者与被调查者通过面对面地交谈而获得资料 2.有标准式访问和非标准式访问?标准式访问通常按事 先设计好的问卷进行?非标准式访问事先一 般不制作问卷 邮寄调查 (Mail survey)v 是一种标准化调查v 调查者与被调查者没有直接的语 言交流,信息的传递依赖于问卷v 通过某种方式将调查表或问卷送 至某被调查者手中,由被调查者 填写,然后将问卷寄回指定收集点v 问卷或表格的发放方式有邮寄、 宣传媒介传送、专门场所分发三种 电话调查 (Telephone survey)v 调查者利用电话与被调查者进行 语言交流以获得信息v 时效快、成本低v 问题的数量不宜过多 座谈会 (Colloquia)v 将一组被调查者集中在调查现场,让他们 对调查的主题发表意见以获得资料v 人数不宜过多,一般为6~10人v 侧重于定性研究 个别深度访问 (Personal Interviewing)v 一次只有一名受访者参加、 针对特殊问题的调查v 适合于较隐秘的问题v 侧重于定性研究 观察法(Observational method) v 调查人员边观察边记录 以收集所需信息 v 能够在被调查者不察觉 的情况下获得资料 实验法 (Experimental method)v 在设定的特殊实验场所、特 殊状态下,对调查对象进行 实验以获得所需资料v 有室内实验法和市场实验法(三)调查方案设计 v 调查方案的内容 确定调查目的(Objective of survey) v 调查要达到的具体目标 v 回答“为什么调查?” v 调查之前必须明确 确定调查对象和调查单位v 调查对象(Respondent):调查研究的总体 或调查范围v 调查单位(Survey unit):需要对之进行调 查的单位。可以是调查对象的全部单位 (全面调查),也可以是调查对象中的一 部分单位(非全面调查)v 回答“向谁调查?” ? ? ? ? ? ? ? 设计调查项目和调查表v 调查项目(Survey items):调查的具体内容v 调查表(Questionnaire):表现调查项目的 表格或问卷v 回答“调查什么?” 二、统计数据的间接来源 1. 公开出版物:《 中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》、《中国工业经济统计年鉴》、《中国农村统计年鉴》、《中国人口统计年鉴》、《中国市场统计年鉴》、《世界经济年鉴》、《国外经济统计资料》、《世界发展报告》…… 中 国统 计出 版社2.2 统计数据的整理 一、数据的预处理 二、数据分组与频数分布 三、频数分布的图示和类型一、数据的预处理 1. 数据审核 2. 数据筛选 3. 数据排序 数据的预处理v 数据的审核 ? 检查数据中的错误v 数据的筛选 ? 找出符合条件的数据v 数据排序 ? 升序和降序 ? 寻找数据的基本特征 1、数据审核—原始数据 (raw data)? 审核的内容1. 完整性审核 ? 检查应调查的单位或个体是否有遗漏 ? 所有的调查项目或指标是否填写齐全2. 准确性审核 ? 检查数据是否有错误,计算是否正确等 ? 检查是否存在异常值 1、数据的审核—二手数据 (second hand data)1. 适用性审核 ? 弄清楚数据的来源、数据的口径以及有关的背 景材料 ? 确定数据是否符合自己分析研究的需要2. 时效性审核 ? 尽可能使用最新的数据3. 确认有否必要做进一步的加工整理 2、数据筛选 (data filter)1. 当数据中的错误不能予以纠正,或者有些数 据不符合调查的要求而又无法弥补时,需要 对数据进行筛选2. 数据筛选的内容包括 § 将某些不符合要求的数据或有明显错误的数据 予以剔除 § 将符合某种特定条件的数据筛选出来,而不符 合特定条件的数据予以剔除 数据筛选 (data filter)§ ?用Excel进行数据筛选 § 3、数据排序 (data rank)? 按一定顺序将数据排列,以发现一些明 显的特征或趋势,找到解决问题的线索? 排序有助于对数据检查纠错,以及为重 新归类或分组等提供依据? 在某些场合,排序本身就是分析的目的 之一? 排序可借助于计算机完成 数据排序 (方法)(1)分类数据的排序 § 字母型数据,排序有升序降序之分,但习 惯上用升序 § 汉字型数据,可按汉字的首位拼音字母排 列,也可按笔画排序,其中也有笔画多少 的升序降序之分(2)数值型数据的排序 ? 递增排序:设一组数据为x1,x2,…,xn, 递增排序后可表示为:x(1)<x(2)<…<x(n) ? 递减排序:可表示为:x(1)>x(2)>…>x(n)二、数据分组与频数分布 数据分组与频数分布 分组方法 v 分组方法单变量值分组 组距分组 等距分组 异距分组 单变量值分组 (要点)? 适合于离散变量? 适合于变量值较少的情况 组距分组 (要点)v 将变量值的一个区间作为一组v 适合于连续变量v 适合于变量值较多的情况v 需要遵循“不重不漏”的原则v 可采用等距分组,也可采用不 等距分组 组距分组 (步骤)1. 确定组数:组数的确定应以能够显示数据的分 布特征和规律为目的。在实际分组时,可以 按 Sturges 提出的经验公式来确定组数K 组距分组 (几个概念)1. 下限(low limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之 间的中点值频数分布表的编制 (例题分析) 频数分布表的编制 (步骤)1. 确定组数:根据 Sturges 提出的经验公式 得组数K为: 等距分组表(上下组限重叠) 等距分组表(上下组限间断)等距分组表(使用开口组) 等距分组与不等距分组 (在表现频数分布上的差异)1. 等距分组 ? 各组频数的分布不受组距大小的影响 ? 可直接根据绝对频数来观察频数分布的 特征2. 不等距分组 ? 各组频数的分布受组距大小不同的影响 ? 各组绝对频数的多少不能反映频数分布 的实际状况 ? 需要用频数密度(频数密度=频数/组距) 反映频数分布的实际状况三、频数分布的图示 分组数据—直方图 (histogram)1. 用矩形的宽度和高度来表示频数分布的 图形,实际上是用矩形的面积来表示各 组的频数分布2. 在直角坐标中,用横轴表示数据分组, 纵轴表示频率/组距,各组与相应的频 率/组距就形成了一个矩形,即直方图3. 直方图下的总面积等于1分组数据的图示 (直方图的绘制)
关 键 词:
统计学---数据的收集与整理
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:统计学 ---数据的收集与整理
链接地址: https://www.wenku365.com/p-42269015.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开