其他抽样、复杂样本及方差估计和非抽样误差

其他抽样、复杂样本及方差估计和非抽样误差

ID:39302385

大小:643.00 KB

页数:52页

时间:2019-06-30

其他抽样、复杂样本及方差估计和非抽样误差_第1页
其他抽样、复杂样本及方差估计和非抽样误差_第2页
其他抽样、复杂样本及方差估计和非抽样误差_第3页
其他抽样、复杂样本及方差估计和非抽样误差_第4页
其他抽样、复杂样本及方差估计和非抽样误差_第5页
资源描述:

《其他抽样、复杂样本及方差估计和非抽样误差》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、非概率抽样非抽样误差五种经典概率抽样方法其他抽样方法,复杂抽样等其他抽样方法估计湖中之鱼的数量N捕获和再捕获估计例假如我们想估计湖中之鱼的数量N。一个方法是,从湖中捕获200条鱼做上标记后放回湖中,让它们与湖中未作标记的鱼混合。然后,从湖中再捕获100条鱼,这次与第一次捕获是相互独立的。假设第二次捕获的鱼中有20条是已经做了标记的。假定两次捕获中间湖中鱼的总体没有发生变化,且每次从湖中捕鱼都是简单随机抽样,那么就可以得到这样的估计:湖中的鱼有20%做了标记,这样就相当于那200条作了标记的鱼近似代表了湖中鱼总体的20%。因此N的估计值就近似等于1000。假定:总体是封闭的-两次抽样间

2、没有鱼进入或离开该湖。即对每次抽样而言,N是相同的。每个样本都是来自总体的简单随机抽样。即,湖中每条鱼都有同样的机会被捕获-有时并不是这样,比如那些小鱼或健康状况稍差的鱼比较容易被捕获。并且,湖中没有不会被捕获的“隐藏的鱼”。两个样本是独立的。鱼不会丢失其标记,从而有标记的鱼可以被识别。n1=200,n2=100,m=20,v美国统计学家的数量从美国统计协会(ASA)和数理统计学会(IMS)得到了他们的会员名册。每位统计学家都可能是ASA的会员也可能不是,同样也可能是IMS的会员也可能不是。则n1为ASA会员数,n2为IMS会员数,m是同时出现在两个组织会员名册上人的数量,估计统计学

3、家的数量:二重抽样先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是二重抽样。作用:有助于筛选主调查对象。节约调查费用提高抽样效率于研究样本轮换中的某些问题降低无回答偏差未分层的二重抽样二重抽样对估计量的调整若子样本中每个人都作出回答,则二重抽样不仅消除了无回答偏差,而且还在方差估计中对原有无回答部分进行了解释。应该尝试多获取一些无回答者的信息,以用于调整单位无回答,多包括进一些相关项目,以用于调整项目无回答。从无回答者中随机抽选100v%的子样本,假设访问到了所有的目标无回答者如果有限总体修正系数可忽略:二重分层抽样样本量

4、的最优分配复杂调查设计的简化在抽样设计时,必须确保你所使用的复杂设计被先验或以前研究者证明是更有效、操作性更强的。一个复杂设计要在估计所有的变量时都有效。在单位成本上获得同样多的信息的情况下,应该优先选择简单设计,而非复杂的设计抽样权重对于一个观测单元,抽样权重往往是被抽中概率的倒数。每个样本单元都“代表”了总体中一定数目的单元,所以样本“代表”了整个总体。抽样权重包含了构造点估计所需的全部信息方差的估计需要除抽样权重以外更多抽样设计的信息。抽样权重对于分层抽样等概率整群抽样中不等概整群抽样中三阶段整群抽样中自加权样本自加权调查中,各样本单元的抽样权重相等。在不考虑非抽样误差的情况下

5、,自加权样本可以看成完全反映了总体,因为每个样本单元都反映了总体中相同数目的单元。自加权样本往往方差较小,估计更精确。在自加权的复杂调查中,标准的统计软件——在假定观测单元是独立同分布的条件下编写数据分析程序的软件,可以给出均值、分位数及其他统计量的正确估计,而标准误差、假设检验以及置信区间却往往是错误的。对于非自加权的样本用抽样权重来构造empiricalprobabilitymassfunction及其分布函数:在分层样本中,每名女性的抽样权重为6.25;每名男性的抽样权重为25。权重修正了图中较高人群对总体的代表性被降低的部分。总体f(y)样本f(y)ST样本,均值及中位数偏低

6、,样本中的男性代表性被降低200的SRS,自加权,样本单元的直方图与总体的相似总体F(y)样本F(y)EPMF利用EPMF变量总体SRS分层不考虑权重考虑权重均值166.25165.61162.75166.03中位数165164.50161.50163第25百分位数156156.75154156第90百分位数185182183186方差207161168208设计效应对于抽样设计的效率,Cornfield(1951)建议采用SRS获得的k个观测单元的估计方差与复杂抽样获得的相同数目观测单元的估计方差的比值来衡量。Kish(1965)将该比值的倒数命名为设计效应(designeffec

7、t,简记为deff):若设计效应已知,可以计算复杂样本的方差,估算样本量设计效应比例分配下分层抽样的设计效应近似为:群大小相等时整群抽样的设计效应设计效应与置信区间p的95%置信区间为(假定有限总体修正系数近似为1):在估计均值时,若样本足够大,由中心极限定理可得,均值估计的95%置信区间为:Kish及其他作者有时采用设计效应与样本量例:在海关某业务出错率的调查中,抽样样本单元为报关单,允许的最大估计误差为真值的20%。假定出错率的真值为0.01,那么SR

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。