成才之路数学选修2—3、3-2

成才之路数学选修2—3、3-2

ID:39416076

大小:648.00 KB

页数:46页

时间:2019-07-02

成才之路数学选修2—3、3-2_第1页
成才之路数学选修2—3、3-2_第2页
成才之路数学选修2—3、3-2_第3页
成才之路数学选修2—3、3-2_第4页
成才之路数学选修2—3、3-2_第5页
资源描述:

《成才之路数学选修2—3、3-2》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、3.2独立性检验的基本思想及其初步应用1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用2.通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力.本节重点、难点:独立性检验的思想方法与初步应用.1.两分类变量之间关联关系的定性分析(1)分类变量:取不同的“值”表示个体所属不同类别的变量称为分类变量.说明:①对分类变量的正确理解:这里的“变量”和“值”都应作为广义的变量和值进行理解.如:对于性别变量,其取值为男、女两种,所以这里的“变量”指的是“性别”,这里的“值”指的是“男”和“

2、女”.故这里所说的“变量”和“值”不一定是具体的数值.②分类变量是大量存在的,如吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.(2)频率分析:通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联.(3)图形分析:利用三维柱形图及二维条形图来分析分类变量之间是否具有关联分析,图形的形象直观更能说明相关数据的总体状况.一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频率列联表(即2×2列联表)如下表:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+

3、d在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,说明X与Y有关的可能性越大,当ad与bc的差趋近于零时,X与Y几乎没有关系,可以说X与Y是相互独立的.2.独立性检验(1)定义:利用随机变量K2=(其中n=a+b+c+d)来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下随机变量K2应该很小.如果由观测数据计算得到的

4、K2的观测值k很大,则在一定可信程度上说明假设不合理.根据随机变量K2的含义,可以通过概率P(K2≥k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大.(2)如何用K2的值判断X与Y之间是否有关?首先列2×2列联表,当得到的观测数据a,b,c,d都不小于5时,由2×2列联表求出K2的观测值k.若k≥10.828,则我们有99.9%的把握认为X与Y有关,这种判断结果出错的可能性约为0.1%;若k≥6.635,则我们有99%的把握认为X与Y有关,这种判断结果出错的可能性约为1%;若k≥2.706,则我们

5、有90%的把握认为X与Y有关,这种判断结果出错的可能性约为10%;若k<2.706,则没有充分的证据显示X与Y有关,但也不能认为X与Y无关.3.独立性检验的基本方法一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:若要推断的结论为:H1:“X与Y有关系”,可以按如下步骤判断结论H1成立的可能性:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程

6、度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;③如果k≥6.635,就有99%的把握认为“X与Y有关系”;④如果k≥5.024,就有97.5%的把握认为“X与Y有关系”;⑤如果k≥3.841,就有95%的把握认为“X与Y有关系”;⑥如果k≥2.706,就有90%的把握认为“X与Y有关系”;⑦如果k<2.706,就认为没有充分的证据认为“X与Y有关

7、系”.1.分类变量:变量的不同“值”表示个体所属的不同类别,这类变量称为.2.在独立性检验中,常用和直观地反映相关数据的总体情况.分类变量二维条形图三维柱形图3.样本频数列联表:一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(即2×2列联表)为:K2=(其中n=为样本容量).y1y2合计x1aba+bx2cdc+d总计a+cb+da+b+c+da+b+c+d4.利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的.独立性检验[例1]某电视台联合相关报社对“男女

8、同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:根据表中数据,能否在犯错误的概率不超过0.001

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。