12.8 其他常用相似度

最大最小系数

最大最小系数(Min-Max coefficient)计算两组变量X、Y中每对变量的最小值和最大值绝对值的和的比值,体现了两组变量在数值上差异的总和:

{r_{xy}} = \frac{{\sum\limits_{k = 1}^n {\min (\left| {{x_k}} \right|,\left| {{y_k}} \right|)} }}{{\sum\limits_{k = 1}^n {\max (\left| {{x_k}} \right|,\left| {{y_k}} \right|)} }}

相似度范围为1~0,相似到不相似。该方法中的每个变量的变化都对结果有着相同程度的影响,因此通常该相似度值较前述的方法要低。

重叠率系数(Overlap ratio)

重叠率系数(Overlap ratio coefficient)计算两组变量X、Y中每对变量各自占其总和比例中的最小值的和,体现了两组变量在数值的相比比例上的差值的总和:

{r_{xy}} = \sum\limits_{k = 1}^n {\min (\frac{{\left| {{x_k}} \right|}}{{\sum {\left| X \right|} }},\frac{{\left| {{y_k}} \right|}}{{\sum {\left| Y \right|} }})}

相似度范围为1~0,相似到不相似。该算法对于异常峰或峰缺失情况的检测相对较为灵敏。