贝叶斯统计 ch2贝叶斯推断

贝叶斯统计 ch2贝叶斯推断

ID:22039341

大小:1.46 MB

页数:71页

时间:2018-10-19

贝叶斯统计 ch2贝叶斯推断_第1页
贝叶斯统计 ch2贝叶斯推断_第2页
贝叶斯统计 ch2贝叶斯推断_第3页
贝叶斯统计 ch2贝叶斯推断_第4页
贝叶斯统计 ch2贝叶斯推断_第5页
资源描述:

《贝叶斯统计 ch2贝叶斯推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、12第二章贝叶斯推断§2.1条件方法§2.2估计§2.3区间估计(可信区间)§2.4假设检验§2.5预测§2.6似然原理3§2.1条件方法1.后验分布的特点:未知参数的后验分布是集三种信息(总体、样本和后验)于一身,它包含了所有可供利用的信息。故有关的参数估计和假设检验等统计推断都按一定方式从后验分布提取信息,其提取方法与经典统计推断相比要简单明确得多。2.条件方法的基本思想:基于后验分布的统计推断实际上只考虑已出现的数据(样本观察值)而认为未出现的数据与推断无关,这一重要的观点被称为“条件观点

2、”,基于这种观点提出的统计方法被称为条件方法。43.条件方法与频率方法的区别:(以对估计的无偏性认识为例)例如经典统计学认为参数的无偏估计应满足:其中平均是对样本空间中所有可能出现的样本而求的,可实际中样本空间中绝大多数样本尚为出现过,而多数从未出现的样本也要参与平均是实际工作者难以理解的。故在贝叶斯推断中不用无偏性,而条件方法是容易被实际工作者理解和接受的。例2.1(教材P36)5§2.2估计1.贝叶斯估计定义2.1使后验密度达到最大的值称为最大后验估计;后验分布的中位数称为后验中位数估计;后

3、验分布的期望值称为的后验期望值估计,这三个估计都称为贝叶斯估计,记为。6解题的基本步骤:2.分析后验分布的特征:对称分布78例2.3为估计不合格率,今从一批产品中随机抽取n件,其中不合格品数X服从,一般选取为的先验分布,设已知,求的Bayes估计。解:由共轭先验分布可知,的后验分布为:则得:特例:选用贝叶斯假设作为先验分布,即则:9第一、在二项分布时,的最大后验估计就是经典统计中的极大似然估计,即的极大似然估计就是取特定的先验分布下的贝叶斯估计。第二、的后验期望值估计要比最大后验估计更合适一些。

4、注意:10试验号样本量n不合格数x13000.200210000.08333310.8004101010.917表2.1不合格率的二种贝叶斯估计的比较11例2.4设x是来自如下指数分布的一个观察值。又取柯西分布作为θ的先验分布,即:求θ的最大后验估计。解:由前面方法可求出θ的后验密度:为了寻找θ的最大后验估计,对后验密度求导数,得:由于π(θ

5、x)的非减性,考虑到θ的取值不能超过x,故θ的最大后验估计应为=x122.贝叶斯估计的误差设是的一个贝叶斯估计,在样本给定后,是一个数,在综合各种信息后,

6、是按取值,所以评价一个贝叶斯估计的误差的最好而又简单的方式是用θ对的后验均方差或平方根来度量,定义如下:定义2.2设参数θ的后验分布为,贝叶斯估计为,则的后验期望称为的后验均方差,而其平方根称为后验标准误。13注意:(1)表示用条件分布求期望;(2)当时,则称为后验方差,其平方根称为后验标准差;(3)后验均方差与后验方差的关系:这表明,当时,可使后验均方差达到最小,实际中常取后验均值作为的贝叶斯估计值;(4)与经典统计的两点比较:①后验方差应用的方便程度不一样;②计算的复杂程度不一样。(阅读教材

7、p40最后一段)14例2.5设一批产品的不合格率为,检查是一个一个进行,直到发现第一个不合格品为止,若X为发现第一个不合格品时已检查的产品数,则X服从几何分布,其分布列为:设的先验分布为,如今只获得一个样本观察值x=3,求的最大后验估计,后验期望估计,并计算它的误差。解:(1)先求联合分布。因为已知θ的先验分布和在θ给定下,X=3的条件概率,则联合分布为:X=3的无条件概率为(利用全概率公式)15再求θ的后验分布列为:或最后得的最大后验估计:的后验均方差为(2)(3)因为,所以:16例2.6在例

8、2.3中,在选用共轭分布下,不合格品率θ的后验分布为贝塔分布,它的后验方差为:其中n为样本量,x为样本中不合格品数,α与β为先验分布中的两个超参数。若取α=β=1,则其后验方差为:这时θ的后验期望估计和最大后验估计分别为:17显然,的后验均方差就是上述Var(θ/x),的后验均方差为:对若干对(n,x)的值算得的后验方差和后验均方差列入表2.2中。表2.2和的后验均方差nxVarMSE301/50.026670.1600.066670.261001/120.005880.0800.012820.

9、111012/120.010680.101/100.015120.122012/220.003590.061/200.005270.0718§2.3区间估计(可信区间)一、可信区间19这里的可信水平和可信区间与经典统计中的置信水平与置信区间虽是同类的概念,但两者还是有本质的差别,主要表现在下面二点:1.在条件方法下,对给定的样本x和可信水平1-α,通过后验分布可求得具体的可信区间,譬如,θ的可信水平为0.9的可信区间是[1.5,2.6],这时我们可以写出2.在经典统计中寻求置信区间有时是困难的,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。