统计学-思想方法与应用(袁卫等)第七章方差分析.ppt

统计学-思想方法与应用(袁卫等)第七章方差分析.ppt

ID:52389821

大小:908.56 KB

页数:40页

时间:2020-04-05

统计学-思想方法与应用(袁卫等)第七章方差分析.ppt_第1页
统计学-思想方法与应用(袁卫等)第七章方差分析.ppt_第2页
统计学-思想方法与应用(袁卫等)第七章方差分析.ppt_第3页
统计学-思想方法与应用(袁卫等)第七章方差分析.ppt_第4页
统计学-思想方法与应用(袁卫等)第七章方差分析.ppt_第5页
资源描述:

《统计学-思想方法与应用(袁卫等)第七章方差分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计学:思想、方法与应用袁卫刘超第7章方差分析7.1单因素方差分析7.2方差分析回顾7.3双因素方差分析学习目标了解方差分析的一般思想;明白单因素方差分析能解决什么问题;了解为什么要介绍双因素方差分析;相关理论在统计学软件中的应用。相应统计分析结果的解读。方差分析(AnalysisofVariance,ANOVA)是英国统计学家罗纳德·费歇尔(RonaldFisher)20世纪年代发展起来的一种在实践中被广泛运用的统计方法。从形式上看,方差分析是比较多个总体的均值是否相等,但本质上,它所研究的是分类型自变量对数量型因变量的影响,这使得它同后面一章介绍的回归分析关

2、系密切,但是又不完全相同。如果有一个人们感兴趣的指标(因变量),其变化可能受到众多离散型因素(如性别、种族、职业等)而不是连续型因素(如年龄、收入、价格等)的影响,我们可以考虑使用方差分析。这些影响因变量的离散型因素称为因素或因子(factor),因素的取值称为水平(level)或处理(treatment)。这里,因素就是变量,水平就是该变量的取值,这些名词是分类或属性变量所特有的。为了了解哪些因素对感兴趣的指标(因变量)有影响,我们必须在众多因素中确定哪些因素影响大些,哪些影响小些,以便于进一步研究对因变量的预测和控制。为什么我们要学习方差分析为什么不能用前几

3、章讨论的检验来比较总体的均值差异呢?可以每次比较两组均值,但是会累加了第一类错误。假设我们采用中不同的方法(A,B,C,D)训练新射击手。在训练结束后,我们用普通的检验方法比较不同射击技巧的成绩。研究问题:4组射击成绩的均值是否存在差异?回答这个问题我们需要比较4种训练方法。为什么我们要学习方差分析用t分布比较4组总体均值,需要进行6次不同的t检验。也就是说,我们需要分别比较4种方法的平均成绩:A和B,A和C,A和D,B和C,B和C,以及C和D。如果显著性水平设为0.05,那么正确判断的概率为0.95。因为我们分别进行6次独立的检验,任何一次检验都不做错误判断的

4、概率为:P(都正确)=0.956=0.735因此,至少一次错误的概率为1-0.735=0.265。总之,如果我们用t分布分别做6次独立的检验,至少有一样本错误发生的概率从0.05上升到了0.265。显然我们需要用更好的办法来而非6次t检验,方差分析允许我们同时比较多个处理的均值并且避免了第一类错误概率的增加。7.1单因素方差分析例7.1研究员想挑选出能使小麦亩产量最大的化肥,选了三个品牌的化肥:A,B和C。开始,他将土地分成大小相同的24块。小麦在同时以相同的方式播种,唯一差别就是所施的肥料不同,8块地用A,8块地用B,其余8块地用C。在收割的季节,记下每块地的

5、小麦产量。这里三种不同的肥料就是三种不同的处理。产量用公斤表示。数据见表7.1。ABC5706605405607605806106705305807105505906305205807305606306405106006805307.1.1小麦产量与化肥品牌之间的关系为了显示平均产量是否随化肥品牌不同而不同,我们首先看散点图7.1。这里的散点图与前面介绍的散点图有一些不一样,其横轴是分类变量。7.1.1小麦产量与化肥品牌之间的关系从散点图可以发现,不同品牌的化肥所导致的小麦平均产量的确是有明显差别的。而且即使是同一品牌,小麦的产量也明显不同。这些区别至少说明,小

6、麦的产量与化肥的品牌之间是有关系的。如果这三块地的小麦产量差不多,则可以认为小麦的产量与化肥的品牌之间是没有关系的。7.1.1小麦产量与化肥品牌之间的关系为了更容易的找出各化肥品牌的小麦平均产量的不同,我们对每个化肥品牌做一个箱线图。7.1.1小麦产量与化肥品牌之间的关系比较基于数据的箱线图可以揭示小麦产量的哪些信息呢?首先应该来对比不同化肥品牌的中位数,因为它们代表中心值。当我们仔细看盒子中间代表中位数的横线时,就会注意到品牌B的中位数最高。因此可以断定这个品牌的化肥的小麦产量最高。类似的,品牌C的中位数最低,则品牌C的化肥的小麦产量最低。品牌B的化肥的小麦产

7、量居中。箱线图的另一个特征是盒子的高度不同。例如品牌A和品牌C的盒子高度接近,都比品牌B盒子要矮,这就意味着品牌A和品牌C这两种化肥下的小麦产量波动性都小比品牌B的化肥下的小麦产量。7.1.2关系强度有多大?箱线图比散点图更能显示各地区之间小麦产量的不同和两个变量间存在关系。但我们还想知道这两个变量之间关系的强度,以及这个关系是否可能出于偶然。要回答这些问题我们还需要做进一步的工作,即利用方差分析。我们的兴趣在均值上,但在判断均值之间是否有差异时要借助于方差。7.1.2关系强度有多大?原理为:把因变量的值随着自变量的不同取值而得到的变化进行分解,使得每一个自变量

8、都有一份贡献,最后剩下无

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。