12.10 数据预处理

进行恰当的数据预处理(亦称数据校正)对于化学计量学分析而言具有重要的意义,通过标准化、变换、提取及保留有效数据,同时清除冗余及无关信息,从而可获得理想的分析结果。相反如果使用不当也可能导致错误的解析结果。

需要进行数据预处理通常包括以下情况:

针对不同应用领域的各自特点,数据预处理技术发展出了众多算法,标度化(Scaling)和中心化(Centering)是其中的代表(图12-11)。

图12-11 自变量的标度化和中心化
图中每列代表不同自变量及其测度范围,横线代表对应均值

关于各类数据预处理方法在ChemPattern完整的化学计量学数据处理流程中的应用,可参考11.11分析数据准备