《抽样技术》第二章-简单随机抽样ppt.ppt

《抽样技术》第二章-简单随机抽样ppt.ppt

ID:58705372

大小:1.01 MB

页数:61页

时间:2020-10-24

《抽样技术》第二章-简单随机抽样ppt.ppt_第1页
《抽样技术》第二章-简单随机抽样ppt.ppt_第2页
《抽样技术》第二章-简单随机抽样ppt.ppt_第3页
《抽样技术》第二章-简单随机抽样ppt.ppt_第4页
《抽样技术》第二章-简单随机抽样ppt.ppt_第5页
资源描述:

《《抽样技术》第二章-简单随机抽样ppt.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《抽样技术》第二章王学民编第二章简单随机抽样§2.1简单随机抽样的概念§2.2总体均值(或总值)的估计§2.3总体比例的估计§2.4样本容量的确定§2.5逆抽样§2.1简单随机抽样的概念一、简单随机抽样的定义二、简单随机抽样的抽选三、符号和定义一、简单随机抽样的定义简单随机抽样——从容量为N的有限总体中抽取n个单元,使得所有不同的样本每一个被抽中的概率相等。所得的样本称为简单随机样本。共有个不同的样本,每一个样本被抽中的概率为。任一个单元被选入样本的概率均为n/N。但不能将“每一个单元被选入样本的概率皆相等”作为简单随机抽样的定义。实践中,简单随机抽样一般是通过

2、不放回地逐个从总体中等概率抽取单元来实现的,故通常将其称为不放回的简单随机抽样。若抽样是有放回地逐个等概率抽取的,则称为放回的简单随机抽样。当n/N很小时,放回与不放回的抽样几乎给出相同的结果。在实际应用中,一般都采用不放回抽样。例2.1设总体有5个单元(1,2,3,4,5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5例2.2设总体有5个单元(1,2,3,4,5),按不放

3、回简单随机抽样的方式抽取2个单元,则所有可能的样本为10个:1,22,33,44,51,32,43,51,42,51,5二、简单随机抽样的抽选首先将容量为N的有限总体中的所有单元从1到N编好号码,然后从这N个编号中抽取n个。具体的抽取方式一般有:(1)抽签法;(2)随机数表法;(3)计算机产生伪随机数法。随机数表法随机数表是由0,1,2,⋯,9这十个数字组成的,书中表3.2给出了由2500个一位数字组成的随机数表。这个随机数表是这样产生的:在这2500个位置上分别独立地做一次等可能地产生0,1,2,⋯,9的随机试验。因此,在任意一个位置上0~9这十个数字出现的可

4、能性都相同,在任意两个位置上00~99这一百个数字出现的可能性也都是相同的,在任意三个位置上000~999这一千个数字出现的可能性也都是相同的,依次类推。例1设总体中的所有个体编号从1到N,试在以下三种情况下分别抽取一个容量为n的简单随机样本。(1)N=63,n=10,不放回抽样;(2)在(1)中放回抽样;(3)N=247,n=7,不放回抽样。三、符号和定义组成总体的N个单元的标志值:Y1,Y2,⋯,YN;样本中n个单元的标志值:y1,y2,⋯,yn。总体总值:;总体均值:样本总值:;样本均值:方差的定义对有限总体,总体方差通常定义为习惯上我们使用形式抽样的兴趣

5、通常,抽样的兴趣都集中于总体的四项标志:⑴均值;⑵总值Y;⑶具有某一特征的单元所占的比例P(或所占的总数A=NP);⑷两个总值的比率或两个均值的比:比率的例子(1)调查某地区居民家庭食品消费支出占家庭收入的比重。令Xi——第i个家庭的家庭收入Yi——第i个家庭的食品消费支出i=1,2,⋯,N家庭食品消费支出占家庭收入的比重为比率的例子(2)在住户调查中,要估计每个成年女子化妆品的平均费用。令Xi——第i个家庭的成年女子数Yi——第i个家庭成年女子化妆品的总费用i=1,2,⋯,N每个成年女子化妆品的平均费用为比率的例子(3)在某住宅小区的房价调查中,要估计该小区的

6、平均房屋单价。令Xi——第i套住宅的建筑面积Yi——第i套住宅的市场价格i=1,2,⋯,N该小区的平均房屋单价为§2.2总体均值(或总值)的估计定理1样本均值是总体均值的无偏估计。证明方法一:方法二:令则推论1是总体总值Y的无偏估计。定理2。其中f=n/N称为抽样比;1−f对方差,对标准误都称为有限总体的校正系数。证明令公式的说明推论2的标准误推论3作为总体总值Y的估计量,的方差是推论4的标准误定理3对简单随机样本,样本方差是总体方差的无偏估计。证明令例1考虑从一个N=6的总体中抽取n=3的样本,设这6个单元的值分别为Y1=21,Y2=12,Y3=15,Y4=2

7、4,Y5=6,Y6=18则。可用s来估计S,但它是有偏的,n较大时这个偏差一般可以忽略。推论5和的方差的无偏估计是我们取作为的估计量,它们是有偏的。样本均值分布的正态近似对有限总体的不放回抽样,哈杰克(Hajek)在1960年给出了样本均值 的分布趋于正态的充分条件。一般地,当n≥30时可认为。置信区间现假定,给定置信度1−α,可得均值和总值Y的置信区间:当n>50时,tα/2(n−1)可由uα/2代替。例2为估计某中学300名新生的平均身高,从中抽取了10名进行测量,得数据(单位:厘米)为158,149,156,153,160,151,157,145,152,

8、159。试问是否求得出平

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。