讲稿5-比率及回归估计[1]

讲稿5-比率及回归估计[1]

ID:37675139

大小:391.57 KB

页数:40页

时间:2019-05-28

讲稿5-比率及回归估计[1]_第1页
讲稿5-比率及回归估计[1]_第2页
讲稿5-比率及回归估计[1]_第3页
讲稿5-比率及回归估计[1]_第4页
讲稿5-比率及回归估计[1]_第5页
资源描述:

《讲稿5-比率及回归估计[1]》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五讲比率估计及回归估计教材中第3.3-3.4及4.3-4.4节•1802年,拉普拉斯想要估计法国的人口数目。他获得了一个遍布全国范围的30commune的样本,截至1802年9月23日总共有2,037615居民。在包括1802年9月23日以前的三年中,215599个新生儿在30个commune。•拉普拉斯认为30个commune的每年注册的新生儿数为215599/3=71866.33.把2037615按照71866.33来分,拉普拉斯估计每年每28.35人里有一个注册新生儿。•具有众多人口的乡镇也就可能有同样众多的注册新生儿,通过用28.

2、35乘以全法国年度新生儿总数来估计得出法国人口总数。•调查中都有辅助信息,抽样框也通常有每个单元额外的信息,这些信息能被用来提高我们的估计精度。为什么要使用比率估计/回归估计•利用总体的辅助信息提高估计的精度。–辅助指标的选择:辅助指标应该与调查指标有较好的正的相关关系。–辅助指标的总体总量或总体均值已知。•比率估计、回归估计需要有足够的样本量才能保证估计的有效。–有偏估计:当样本量足够大时,估计的偏倚趋于0。•简单地想要估计一个比率:假定总体由面积不同农业用地构成,yi=i地谷物的产量,xi:i地的面积,B=每亩谷物的平均产量•要估计渔网

3、中长度小于12cm的鱼的总数,抽取一个鱼的随机样本,估计长度长于12cm的鱼所占的比例,用鱼的总数N乘以这个比例即可得到,但如果N未知不能使用。•能称量渔网中鱼的总重量。鱼的长度与其重量相关。•调整来自样本的估计量以便它们反映人口统计学的总量。•在一所具有4000名学生的大学提取一个400个学生的简单随机样本,此样本可能包含240个女性,160个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。4000×=1241240400•比率估计量被用来对无回答进行调整•设抽取一个行业的样本:令yi为i行业花费在健y康保险上的金额,

4、xi为i行业的雇员数。假定对x总体中的每个行业xi均已知。我们希望一个行业花费在健康保险上的金额与雇员数相关。某些行业在调查中可能涉及不到。估计保险费用的总花销时调整无回答的方法之一是用总体数X乘以比率yx一,比率估计RatioEstimationy∑y在SRS下y=X=XRx∑xy∑yYˆ=X=X=NyRRx∑xyRˆ=x21−f∑(Yi−RXi)V(Rˆ)=2nXN−1辅助指标x,其总体均值(总量)已知【例】对以下假设总体(N=6),用简单随机抽样抽取2个样本,比较简单随机抽样比率估计及简单估计的性质。123456平均值X0135810

5、4.5iY131118294618i2C=15样本简单估计比估计611,221821,361831,49.517.141,51516.87551,623.521.1562,3715.7572,410.515.7582,5161692,624.520103,414.516.3113,52016.36123,628.519.73134,523.516.27144,63219.2155,637.518.75y∑yiy==XXRx∑xi151511E(yR)=∑yRi≈17.686E(y)=∑yi=1815i=115i=11512115V(y)=[

6、]y−E(y)≈.282[]2R∑RiRV(y)=∑yi−E(y)=97.8715i=115i=1B(y)=E(y)−Y≈−.031356RR2MSE(y)=V(y)+B(y)≈.292RRR•简单估计是无偏的,而比估计是有偏的。•简单估计量的方差远远大于比估计量的方差,比估计的偏差不大,其均方误差也比简单估计的小得多。•因此对这个总体,比估计比简单估计的效率高。xu二、比率估计的性质1−f2E(r−R)≈(ρSS−RS)2xyxnX偏倚量会小,如果:•样本量n很大•抽样比n/N很大•X很大•Sx很小•相关系数R接近于1比率估计的近似方差2

7、V(y)=V(XRˆ)=XV(Rˆ)R22V(Yˆ)=NXV(Rˆ)R当R>0.5时,比估计比srs有更高的精度。121−f1n22V(Rˆ)=E(Rˆ−R)≈Ev(1(Rˆy)≈−2R∑X(yi−)Rˆxi)2nXn−1i=1分层抽样下,比估计有两种方法:X1.SeparateRatioestimatorN$∑≈11y−1f∑y2YRX−=∑2y1−fSRSR22+−22SVR()∑()L()r1=,2r2=,iirL=2yxyx∑nXNx1−∑1xi=21…….∑xLnX(h=1,2,…..L)n1−f12v1(Rˆ)≈2∑(yi−Rˆ

8、xi)nXn−1i=11−f222v(Rˆ)≈(s−2Rˆs+Rˆs)22yxyxxn三、比率估计的效率•1.与简单估计的比较简单估计量无偏,而比率估计量渐近无偏。因此这里只比较

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。