流行病与卫生统计学--方差分析

流行病与卫生统计学--方差分析

ID:39807116

大小:1.92 MB

页数:176页

时间:2019-07-11

流行病与卫生统计学--方差分析_第1页
流行病与卫生统计学--方差分析_第2页
流行病与卫生统计学--方差分析_第3页
流行病与卫生统计学--方差分析_第4页
流行病与卫生统计学--方差分析_第5页
资源描述:

《流行病与卫生统计学--方差分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、方差分析(一) 单向方差分析(one-wayANOVA)方差分析(analysisofvariance,ANOVA)又称变异数分析或F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。实验三要素:统计模型:效应值=总平均效应+处理效应+随机误差效应效应值-总平均效应=处理效应+随机误差效应第一节方差分析的基本思想方差分析的基本思想是将出现在所有测量值上的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。单向方差分析(onewayanalysisofvariance)是

2、指处理因素只有一个。这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。例8-1有3种解毒药:A、B及C,同时设一个空白对照D,共有4个组。即解毒药这个处理因素包含有4个水平,或4个处理组,用i表示处理组号,i=1,2,3,4分别代表A、B、C、D4个组。受试大白鼠共24只,故动物总数或样本含量N=24。按完全随机化方法将它们分成等数的4个组,每组有6只动物。用ni表示第i组受试动物数(当每组受试动物数相等时用n代替ni)。用j(j=1,2,…,6)表示每组受试动物号。应变量用Yij表示第i组第j号大白鼠的血中胆碱酯酶

3、含量(μ/ml)。实验结果见表8-l。表8-1应用不同解毒药的大白鼠血中胆碱酯酶含量(Yij)(μ/ml)组号胆碱酯酶含量(Yij)ni1231218162814611118.52233.02283123242834616828.04790.03142417191622611218.72162.048122119141568914.81431.0合计7379797886852448020.010616.0各组平均值为。各组测定值的总和为=111+…+89=480。样本总平均值为 =480/24=20.0。在单向方差分析中,变异来源于两个方面,一方面是受

4、试对象个体间的变异(称组内变异),另一方面是实验因素各水平间的变异(称组间变异)。因此,总变异可按其变异来源进行分解。总变异=处理间变异(组间)+误差(组内)观察值效应=总平均效应+处理效应+随机误差效应总平均单因素方差分析的基本思想(图示)一、离均差平方和的分解个体测定值与总平均值之差可写为上式等号右边第一项    称为组内离均差,第二项   是组平均值与总平均值之差,称为组间离均差。将等式两边平方后求和得到上式第二行中间的一项又可以写成下列等式:这是因为有        之故。最后得到公式(8-1)就是单向方差分析的总离均差平方和分解公式。用文字表

5、达为:总离均差平方和=组间离均差平方和十组内离均差平方和SS总=SS组间+SS组内二、F值与F分布t检验是用t值进行假设检验的,方差分析则用F值进行假设检验。每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(meansquare,MS)。各种均方表示为:组间均方:MS组间=SS组间/v组间=SS组间/(a-l)组内均方:MS组内=SS组内/v组内=SS组内/(N-a)组内均方表示各组内均方的平均值,它是随机误差项的方差 的综合估计值。其代表性优于每个组的组内均方。它的分子和分母分别是各组内离均差平方和之和及各组内自由度之和。

6、关系式为:由于组间均方包含由随机误差及处理因素引起的误差,故其值比组内均方大。理论上的组间均方的期望值可表示为:式中 为组内均方的期望值E(MS组内),µi及µ为分别对应于 及 的期望值。F值的计算公式为F值的实际意义表现为如下的比值:H0:T=0H1:T0F统计量不可能是负值,因为分子及分母都是平方项。分子中的SS组间是各组平均值与总平均值之差的加权平方和。如果各处理组所代表的总体平均值彼此相等,则各组样本平均值也就彼此接近。其结果是各组样本平均值很接近总平均值。反之,如果各处理组所代表的总体平均值差别很大,则相应的各组样本平均值也就彼此差别很大;

7、某些组平均值就明显不同于总平均值。因此一个大的组间均方MS组间可使F值变大,它提供足够的把握来拒绝无效假设。若MS组间很小,则缺乏证据来拒绝无效假设。由于分析数据都是来自样本,故必须考虑资料的变异性。组内均方MS组内是随机误差方差 的估计值,它是衡量样本资料随机变异性大小的指标。如果资料的随机变异性很大,则MS组内也大。若资料的随机变异性很小,则MS组内也小。当MS组间大,而MS组内小时,F值就大。当MS组间大,MS组内也大时,则F值就不一定大。那么F值要多大才能有把握拒绝无效假设呢?这就要由F统计量的分布来决定了。当F统计量达到一个小的P值水平时,就

8、可以拒绝无效假设。t分布只有一个自由度。因为两组比较时,组间自由度恒为l。F分布有两个自由度,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。