《独立性检验》课件

《独立性检验》课件

ID:38955321

大小:206.50 KB

页数:25页

时间:2019-06-22

《独立性检验》课件_第1页
《独立性检验》课件_第2页
《独立性检验》课件_第3页
《独立性检验》课件_第4页
《独立性检验》课件_第5页
资源描述:

《《独立性检验》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、3.1独立性检验问题:数学家庞加莱每天都从一家面包店买一块1000g的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包份量足”,则一年购买面包的质量数据的平均值应该不少于1000g;“这个平均值不大于950g”是一个与假设“面包份量足”矛盾的小概率事件;这个小概率事件的发生使庞加莱得出推断结果。一:假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。例如,在前面

2、的例子中,原假设为:H0:面包份量足,备择假设为:H1:面包份量不足。这个假设检验问题可以表达为:H0:面包份量足←→H1:面包份量不足二:求解假设检验问题考虑假设检验问题:H0:面包分量足←→H1:面包分量不足在H0成立的条件下,构造与H0矛盾的小概率事件;如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。求解思路分析:本节研究的是两个分类变量的独立性检验问题。独立性检验在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是

3、否对于喜欢数学课程有影响?等等。1.某医疗机构为了了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查,共调查了339名50岁以上的人,其中吸烟者205人,不吸烟者134人.调查结果是:吸烟的205人中有43人患呼吸道疾病(简称患病),162人未患呼吸道疾病(简称未患病);不吸烟的134人中有13人患病,121人未患病.问题:根据这些数据能否断定“患慢性支气管炎与吸烟有关”?(1)为了研究这个问题,将上述数据用下表来表示:患病未患病合计吸烟43162205不吸烟13121134合计56283339(2)估计吸烟者

4、与不吸烟者患病的可能性差异:在吸烟的人中,有的人患病,在不吸烟的人中,有的人患病.问题:由上述结论能否得出患病与吸烟有关?把握有多大?(1)假设:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下列2×2列联表:不吸烟(患病(B)未患病()合计吸烟An11n12n1+不吸烟n21n22n2+合计n+1n+2n即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,

5、n11n22-n21n12

6、越小,患病与吸烟之间的关系越弱,否则,关系越强.近似的判断方法:设n=n11+n

7、21+n12+n22,如果H0成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得,上面的话的意思是指事件A与B独立,这时应该有P(AB)=P(A)P(B)成立,我们用H0表示上式,即H0:P(AB)=P(A)P(B).并称之为统计假设,当H0成立时,下面的三个式子也成立:根据概率的统计定义,上面提到的众多事件的概率都可以用相应的频率来估计。例如P(AB)的估计为P(A)的估计为,P(B)的估计为,……于是与应该很接近,……。或者说应该比较小.从而也应该比较小。(2)卡方统计量:为了消除样本对

8、上式的影响,通常用卡方统计量(χ2)来进行估计.卡方χ2统计量公式:用它的大小可以决定是否拒绝原来的统计假设H0,如果算出的χ2值较大,就拒绝H0,也就是拒绝“事件A与事件B无关”,从而就认为它们是有关的了(3)两个临界值:3.841与6.635.经过对χ2统计量分布的研究,已经得到了两个临界值:3.841与6.635。当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A与事件B有关;当χ2>6.635时,有99%的把握说事件A与事件B有关;当χ2<3.841时,认为事件A与事件B无关;象以上这种用χ

9、2统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.对于例1,最理想的解决办法是向所有的50岁以上的人作调查,然后对所得的数据进行统计处理,但这花费的代价太大,实际上也是行不通的。339个人相对于全体50岁以上的人,只是一小部分回忆一下数学必修3中学过的总体与样本的关系,当用样本平均数,样本标准差去估计总体的相应的数字特征时,由于抽样的随机性,结果并不惟一。现在的情况类似,我们用部分对全体作推断,推断可能正确,也可能错误,例如我们知道,不少的中老年烟民的身体很好,没有患慢性支气管炎;而又有很多的从不

10、吸烟的中老年人体质很差,患有慢性支气管炎。如果抽取的339个调查对象中很多人来自上述两个群体,试想会得出什么结论吧。我们说有95%(或99%)的把握说事件A与事件B有关,是指推断犯错误的可能性为5%(或1%),这也是常常说成是“有95%(或99%)的概率”,其含义是一样的。解:由公式因为7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性支气管炎与吸烟有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。