ChemPattern百科 - 化学计量学白皮书

12.13 方差分析

方差分析（analysis of variance，ANOVA）用于检验变量的不同分组均数间的差异是否具有统计学意义，即多个分组样本总体均数的比较问题。其由英国统计学家Ronald A. Fisher于1918年提出，为纪念Fisher，也称其为F检验（F-test）。方差分析是对一系列类似统计模型的统称，也是线性回归模型的一种一般化形式。其用途广泛，是多因素、多水平实验设计的重要分析方法，在复杂体系分析中也可用于自变量分析，考察其对于样本分类是否具有统计意义。本节只介绍其中的单变量完全随机样本的方差分析，其它重要的方法还包括协方差分析（ANCOVA）和多元方差分析（12.16）等。

数学部分

方差分析的核心思想是将样本观测值总变异分解为随机误差和因素影响作用两部分，并借助F分布做出统计推断。

一般而言，实验数据体现为3种不同的变异：

总变异：全部观测值大小的不同称为总变异，可用离均差平方和（sum of squares of deviations from mean, SS）表示，记为SS_Total。
组间变异：各组由于内在性质的不同，各组样本均数通常也大小不等，称为组间变异，记为SS_Across。存在组间变异的原因包括不同样本的内在差异（如不同品种来源、不同实验处理方法等等），以及随机误差（个体变异和测量误差）。
组内变异：在同一分组内的实验对象所体现的观测值的差异属于随机误差，记为SS_Within。

\begin{gathered} S{S_{Total}} = \sum\limits_{i = 1}^g {\sum\limits_{j = 1}^{{n_i}} {{{({X_{ij}} - \bar X)}^2}} } \hfill \\ S{S_{Across}} = \sum\limits_{i = 1}^g {{n_i}{{({{\bar X}_i} - \bar X)}^2}} \hfill \\ S{S_{Within}} = \sum\limits_{i = 1}^g {\sum\limits_{j = 1}^{{n_i}} {{{({X_{ij}} - {{\bar X}_i})}^2}} } \hfill \\ \end{gathered}

相应的，各离均差平方和的自由度为：

{v_{Total}} = N - 1,{v_{Across}} = g - 1,{v_{Within}} = N - g

其中，N为样本数，g为分类数。接下来，计算均方差（mean square, MS），简称均方，并做各组样本的总体均数相等（{H_0}:{\mu _1} = {\mu _2} \cdots = {\mu _g}）的假设检验。组间均方与组内均方的比值称为F统计量。

\begin{gathered} M{S_{Across}} = S{S_{Across}}/{v_{Across}} \hfill \\ M{S_{Within}} = S{S_{Within}}/{v_{Within}} \hfill \\ F = M{S_{Across}}/M{S_{Within}},{v_1} = {v_{Across}},{v_2} = {v_{Within}} \hfill \\ \end{gathered}

方差分析是单侧F检验，若计算获得的F分布值{F_{({v_1},{v_2})}} < \alpha （α水平一般取0.05），则拒绝H₀，接受H₁，即认为各样本的总体均数不全相等。

应用条件

多个样品均数比较的方差分析其应用条件为：

各样本是来自正态分布总体的响度独立的随机样本；
相互比较的各样本总体方差相等，即具有方差齐性。