12.13 方差分析

方差分析(analysis of variance,ANOVA)用于检验变量的不同分组均数间的差异是否具有统计学意义,即多个分组样本总体均数的比较问题。其由英国统计学家Ronald A. Fisher于1918年提出,为纪念Fisher,也称其为F检验(F-test)。方差分析是对一系列类似统计模型的统称,也是线性回归模型的一种一般化形式。其用途广泛,是多因素、多水平实验设计的重要分析方法,在复杂体系分析中也可用于自变量分析,考察其对于样本分类是否具有统计意义。本节只介绍其中的单变量完全随机样本的方差分析,其它重要的方法还包括协方差分析(ANCOVA)和多元方差分析(12.16)等。

数学部分

方差分析的核心思想是将样本观测值总变异分解为随机误差和因素影响作用两部分,并借助F分布做出统计推断。

一般而言,实验数据体现为3种不同的变异:

\begin{gathered} S{S_{Total}} = \sum\limits_{i = 1}^g {\sum\limits_{j = 1}^{{n_i}} {{{({X_{ij}} - \bar X)}^2}} } \hfill \\ S{S_{Across}} = \sum\limits_{i = 1}^g {{n_i}{{({{\bar X}_i} - \bar X)}^2}} \hfill \\ S{S_{Within}} = \sum\limits_{i = 1}^g {\sum\limits_{j = 1}^{{n_i}} {{{({X_{ij}} - {{\bar X}_i})}^2}} } \hfill \\ \end{gathered}

相应的,各离均差平方和的自由度为:

{v_{Total}} = N - 1,{v_{Across}} = g - 1,{v_{Within}} = N - g

其中,N为样本数,g为分类数。接下来,计算均方差(mean square, MS),简称均方,并做各组样本的总体均数相等({H_0}:{\mu _1} = {\mu _2} \cdots = {\mu _g})的假设检验。组间均方与组内均方的比值称为F统计量。

\begin{gathered} M{S_{Across}} = S{S_{Across}}/{v_{Across}} \hfill \\ M{S_{Within}} = S{S_{Within}}/{v_{Within}} \hfill \\ F = M{S_{Across}}/M{S_{Within}},{v_1} = {v_{Across}},{v_2} = {v_{Within}} \hfill \\ \end{gathered}

方差分析是单侧F检验,若计算获得的F分布值{F_{({v_1},{v_2})}} < \alpha (α水平一般取0.05),则拒绝H0,接受H1,即认为各样本的总体均数不全相等。

应用条件

多个样品均数比较的方差分析其应用条件为: