12.16 典型相关分析和多元方差分析

典型相关分析

典型相关分析(canonical correlation analysis,CCA)是线性回归用于多个因变量分析时的推广形式,由美国统计学家Harold Hotelling于1936年提出。该方法寻找一组自变量的线性组合和一组因变量的线性组合,称为第1对典型相关变量或简称典型变量(canonical variate),并使其之间的相关性最大化,接下来与第1组正交且相关性次大化的变量线性组合称为第2对典型变量,依次类推。

在实际应用中,典型相关分析具有以下特点:

图12-20 典型相关分析与MANOVA示意图
上图显示3个样本分组的MANOVA分析通过2个自变量的线性组合从而获得更好的组间分离,从而在该问题上优于PCA的自变量降维效果

数学部分

多元方差分析

正如典型相关分析是线性回归的多变量拓展一样,与之有着密切联系的多元方差分析则是方差分析的多变量推广形式。多元方差分析的步骤通常如下: