第十一章非抽样误差及其控制.doc

第十一章非抽样误差及其控制.doc

ID:28843958

大小:454.00 KB

页数:11页

时间:2018-12-14

第十一章非抽样误差及其控制.doc_第1页
第十一章非抽样误差及其控制.doc_第2页
第十一章非抽样误差及其控制.doc_第3页
第十一章非抽样误差及其控制.doc_第4页
第十一章非抽样误差及其控制.doc_第5页
资源描述:

《第十一章非抽样误差及其控制.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第十一章非抽样误差及其控制数据的准确性与可靠性是抽样调查的生命力之所在。如前所述,在抽样调查中,除存在抽样误差外,还经常出现一些非抽样误差,主要的非抽样误差产生原因有抽样框不完善、无回答的出现、调查过程的差错以及数据整理登记过程中的差错等。因此,抽样调查中,不仅要控制抽样误差,而且还要控制非抽样误差。如何有效地控制非抽样误差,取得准确可靠的数据资料,以及如何对已经取得的数据进行质量评价,一直是抽样调查理论和实践中所经常关注和着力研究解决的重要问题。第一节抽样框误差及其控制一、抽样框误差的产生抽样框是有关总体全部单元的名录或地图等

2、的框架,是抽取样本单元的依据。理想的抽样框(也称抽样总体)应该同所研究现象的总体(也即目标总体)一致,但在实践中,抽样总体与目标总体常常不一致,由此产生的误差就是抽样框误差。考察抽样框误差的成因,大致有以下几个方面:(1)丢失目标总体单元。在此情形下,抽样框没有能够覆盖全部目标总体单元,也就是使部分目标总体单元没有包括在抽样框中,因而也就没有机会被选入样本。由于存在丢失单元,使得总体总和的估计偏低,总体均值的估计也可能会出现偏差。丢失单元是一种威胁性较大的抽样框误差,具有较强的隐蔽性,不易被发现。(2)包含非目标总体单元。有时,

3、抽样框中也可能包含了一些不属于研究对象总体即非目标总体的单元,由此容易导致总体总和的估计偏高。但这种类型的抽样框误差一般要比丢失单元的威胁性小。因为在调查中,非目标总体单元往往更容易被发现,并予以剔除。(3)复合联接。实践中常可能会遇到这种情况:抽样框中的单元与目标总体单元不完全为一一对应,而是一对多或多对一,即存在复合联接。在这种情形下,目标总体中各个单元的入样概率可能会受到相应的影响,从而导致非抽样误差的扩大。但是,有时候采用经过精心设计的有复合联接的抽样框可以提高稀有元素被抽中的概率。(4)不正确的辅助信息。一般将不包含辅

4、助信息的抽样框称之为简单抽样框,而将包含辅助信息的抽样框称为复杂抽样框。复杂抽样框中的辅助信息可以用于分层抽样、不等概率抽样,以及使用比估计和回归估计等。如果辅助资料不完全或不正确,则不但不能提高抽样估计的效率,反而会降低估计的准确性。(5)抽样框陈旧。有时由于构成抽样框的抽样单元资料“老化”,抽样框所提供的信息与现实情况差距较大,也会导致抽样框误差。并且这类误差也可能进一步引起前面四类抽样框误差中的一种或几种同时发生。二、抽样框误差的确定(一)丢失目标总体单元时的影响前已指出,丢失目标总体单元是抽样框误差中威胁最为严重的一种。

5、现设目标总体是由NA个抽样总体单元及另外N0个没有包含在抽样框中的单元(即丢失单元)组成,即N=NA+N0,则总体总和应为其中为抽样总体总和,为丢失单元总和,为第i单元的观测值。现从抽样框的NA个单元中随机抽取nA个单元组成样本,则的无偏估计。当用NAYA来估计Y时,结果就会出现大小为的偏差,即 这表明Y被低估了。如果以r表示丢失单元与抽样框中单元的均值之比,即又以W0表示丢失单元占全部目标总体单元的比重,即,则总和估计量的相对偏差可表示为当估计总体均值时,用估计的偏差为;此时的相对偏差为表10.1与表10.2分别给出了不同的丢

6、失单元比重W0对总体总和与均值估计的相对偏差。其中关于Y0与N0的值可依有关资料进行估计,对此,后面将专门讨论。表10.1丢失单元比重对总体总和估计的相对偏差丢失单元比重W00.50.91.01.12.00.010.050.100.250.50-0.0050-0.0256-0.0526-0.1429-0.3333-0.0090-0.0452-0.0909-0.2308-0.4737-0.010-0.050-0.100-0.250-0.500-0.0109-0.0547-0.1089-0.2683-0.5238-0.0198-0.

7、0952-0.1818-0.4000-0.6667表10.2丢失单元比重对总体均值估计的相对偏差丢失单元比重W00.50.91.01.12.00.010.050.100.250.50-0.0050-0.0256-0.0526-0.1429-0.3333-0.0010-0.0050-0.0101-0.0256-0.052600000-0.0009-0.0049-0.0099-0.0244-0.0476-0.0099-0.0476-0.0909-0.2000-0.3333(二)包含非目标总单元时的影响如果以M0表示抽样框中所含非目标

8、总体单元数,MT表示抽样框中所含目标总体单元数,则抽样框所含全部单元数,在抽样框中不存在丢失单元,也没有复合联接时,则抽样总体总和可表示为其中,是非目标总体单元观测值之和,是目标总体总量,为第i单元的观测值。现从抽样框的M个单元中随机抽取m个单元组成样本,则为的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。