12.7 马氏距离相似度

马氏距离(Mahalanobis distance)由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出,用于表示数据的协方差距离,是一种广泛应用的相似度计算方法。

{d_i} = {\left( {{x_i} - \mu } \right)^T}{S^{ - 1}}\left( {{x_i} - \mu } \right)

式中xi为样本向量,μ为总体样本的向量均值,S为协方差。

马氏距离具有以下特点:

马氏距离与欧氏距离的主要区别点在于:

马氏距离在计算和使用中有以下需要注意的原则:

图12-7 马氏距离和欧氏距离的比较
注:左图中点A、B到中点的欧氏距离相同;右图中点A、B到中点的马氏距离相同,且与点A欧氏距离相同的点C在马氏距离中为离群值。