抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt

抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt

ID:58784692

大小:450.00 KB

页数:53页

时间:2020-10-03

抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt_第1页
抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt_第2页
抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt_第3页
抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt_第4页
抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt_第5页
资源描述:

《抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第4章等概率整群抽样和多阶段抽样由若干有联系的基本单元所组成的集合称为群。抽样时抽取群,并对入选群的所有基本单元进行调查,这种方法就是整群抽样。当群规模比较大时,由于群内单元通常具有相似性,对群内单元进行再抽样,这就是两阶段抽样,其中的群也称为初级抽样单元,群内再抽样的单元称为二级抽样单元。4.1.1定义整群抽样(clustersampling)是将总体划分为若干群,然后以群(cluster)为抽样单元,从总体中随机抽取一部分群,对被选群内的所有单元进行调查的一种抽样技术。9/18/20213例欲估计某高校大学生拥有手机数

2、量,大学共有40000名学生,10000个宿舍(每个宿舍4名学生)。方案1(简单随机抽样):采用简单随机抽样方法抽取400个学生;方案2(整群抽样):根据学生宿舍名录抽取100个宿舍,并调查被抽宿舍的每一个学生;方案3(两阶段抽样):先随机抽取400个宿舍,再在每个被抽中的宿舍中随机抽取1个学生。9/18/202144.1.2整群抽样的特点(1)抽样框编制得以简化(2)实施调查便利,节省费用(3)对某些特殊结构的总体却有好的估计效果(4)抽样误差较大(可通过增大样本量的方法弥补抽样精度的损失)。大致可分为两类根据行政或地域

3、形成的群体调查人员人为确定的分群的原则可用方差分析原理说明:群内差异尽可能大,群间差异尽可能小4.1.3群的划分群的规模大,估计的精度差但费用省;群的规模小,估计的精度可以提高但费用增大;群规模不宜过大对于规模很大的群,通常需要采用多阶段抽样。有群规模相等与不相等两种情况4.1.4群的规模4.1.5符号说明表4.14.2等概率整群抽样4.2.1群规模相等时的估计群规模相同,均为M,则的估计量为:定理4.1:是的无偏估计,即定理4.2:的方差为:定理4.3:的样本估计为:总体总值的估计量及其方差【例4.1】在一次对某中学在校

4、零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍都有M=6名学生。用简单随机抽样在全部N=315间宿舍中抽取n=8个宿舍。全部48个学生上周每人的零花钱及相关计算数据如表4-2所示。试估计该学校学生平均每周的零花钱,并给出其95%的置信区间。整群抽样的效率分析群内相关系数表达式为:上式中的分子为:上式中的分母为:故又可写为:用简单随机抽样方法抽取n个群,每个群内的M个单元全部进入样本,则等群抽样均值估计量的方差可用群内相关系数近似表示简单随机抽样的方差公式为由此可计算出等群抽样的设计效应为整群抽样的估计效率,与群内相关系

5、数的关系密切。当时,deff=M当时,deff=1当为负时,deff<1的取值范围是群内方差为0群内方差与总体方差相等群间方差为0群内相关系数也可由样本统计量估计【例4.2】4.2.2群规模不等时的估计当群规模Mi不等时,有不同的抽取方法和估计方法。(1)等概抽样,无偏估计思路:以群规模Mi为权数,乘以各群均值,得到群观察值总值yi,再将样本中n个群的群总和平均,求得群总和均值,再除以群平均规模估计公式为:若未知,可用样本群平均规模代替总体总值Y的估计为总量估计的另一公式为估计量的方差为它的无偏估计为均值估计的方差为(2)

6、等概抽样,比率估计总体均值估计为这里辅助变量不是Xi而是群规模Mi总体总量估计为估计量的方差分别是与的样本估计分别是若未知,可用样本群平均规模代替【例4.3】某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。调查资料如下:样本乡编号村庄数Mi作物总产量(乡)yi(万公斤)种植面积(乡)xi(亩)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007

7、801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合计209257.18940——分别采用几种方法估计(1)等概抽样,无偏估计评价:虽是无偏估计量,但方差估计与之间的差异有关,适合于之间差异不大的整群抽样。(2)等概抽样,比率估计评价:比率估计量将作为辅助变量引入估计,其估计方差取决于群均值的差异。的差异比的差异要稳定,所以比率估计比前一种方法获得更好的估计效果。但比率估计量是有偏的,适合n比较大的情形。

8、(3)以种植面积为辅助变量的比率估计已知:种植面积X=30525(亩)用种植面积为辅助变量评价:和相比,更小,因而有更好的估计效果。4.3等概率两阶段抽样什么是多阶段抽样?分多个阶段抽到最终接受调查的样本。初级单元(PSU)----PrimarySamplingUnit二级单元(SSU)----Seco

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。