11.2 相似度分析

相似度算法是对用于评价两个样本的向量或矩阵之间相似程度的一大类算法的统称,其在信息学相关领域有着广泛的应用。简洁直观是其突出的特点。ChemPattern对其中广泛应用的以及体现化学指纹图谱相似度评价特点的多种算法提供支持,其中包括:

相似度计算通常采用样品与共有模式的成对比较方式,数据包括二者间的共有峰以及非共有峰,而马氏距离的计算只涉及指纹图谱共有峰。

计算结果可以用散点图或柱状图等两种方法进行显示,如图11-3所示。

图11-3 相似度计算结果统计图表示意图