12.27 质谱解卷积
由于色谱柱分离效能和峰容量的限制,样品在分离分析过程中分配系数或保留行为相近的一些化合物得到共洗脱的情况时有发生,体现为未达到基线分离、肩峰乃至完全包被的色谱峰组。这一现象在复杂和极端复杂体系样品的分析中十分普遍,严重影响定性、定量结果的精度与可靠性,并极大制约了对色谱联用技术所获得的如PDA和TIC等数据中所携带的海量化合物信息的提取和充分利用。
如何对共洗脱组分形成的重叠色谱峰进行合理的全自动化解析等信号分辨技术一直是化学计量学的研究热点之一,其中包括以紫外和LC-DAD数据分辨为主的多元分辨技术,以及用于色质联用数据的模型峰技术。前者可从一个未分解的混合物数据矩阵中提取重建单一组分的响应值特征谱,同时不需要预先了解混合物中的组分信息。以下着重对后者的原理和特点做一介绍。
A)模型峰方法
峰模型方法最早由R.G. Dromey等于1976年提出,并由NIST的S.E. Stein等人进一步完善。峰模型方法的核心思想是比较每一个碎片离子的提取离子流色谱图与已建立的具体保留时间位置上的化合物峰模型之间的相似程度,并将相关的碎片离子进行合并。整个解析过程与人工识别的思路较为相似。算法中涉及大量的经验公式和预设值,用于本底噪音估算、最小二乘拟合、光谱相似度计算、模型峰与杂质峰生成以及质谱库检索等步骤。ChemPattern所采用的质谱解卷积方法为峰模型方法的改进版本。
解卷积计算结果以解卷积色谱峰的形式给出,并包含以下信息:
- 化合物解卷积质谱图和解卷积色谱峰。前者是单一化合物通过解卷积所提取的“纯”质谱图,并可对同位素峰和加合离子峰进行合并,以提供准分子离子峰信息。后者是根据解卷积质谱数据生成的局部提取离子流色谱图(EIC),表征了该化合物在色谱图中的校正后的真实保留时间、峰型和峰面积等信息。
- 解卷积总离子流色谱图,以及解卷积残差(背景)离子流色谱图。后者即原始总离子流色谱图与解卷积总离子流色谱图的差谱,体现了不能被解卷积色谱峰所解释和归属的部分碎片离子。
- 解卷积峰置信度。对于每个解卷积峰的结果可信度,以置信度统计值P进行衡量,其公式如下:
{P_C}^\prime = {P_C} \times \frac{{{I_C}}}{{{I_C} + {I_T}}} + {P_T} \times \frac{{{I_T}}}{{{I_C} + {I_T}}} - (1 - S) \times \frac{{\min ({I_C},{I_T})}}{{\max ({I_C},{I_T})}}
其中,PT为待合并的碎片离子置信度,PC为与之合并的碎片离子置信度,IT和IC分别为二者的峰强度,S为二者间离子流色谱图的相似度系数。可以看出,每次碎片离子间的合并都会导致结果置信度下降,且降低程度与二者间的相似度和相对强度比例有关。若参与合并的碎片离子置信度和相似度都较高,则P趋近于1。
质谱解卷积所涉及的参数较多,但可根据用途大致分为3类:
- 解析参数。包括峰匹配阈值、基线过滤阈值、共有碎片离子检测等。这些参数对结果的影响较大。较高的阈值下所获得结果的置信度必然较高,误识率较低。但由于将一些相对不确定的碎片离子排除在外,因此也会造成拒识率的上升。
- 精度参数。包括解卷积范围、解卷积信噪比、离子峰容差、二项式平滑窗口等。所设参数体现的性能指标越高,则结果的精细程度和解卷积残差越理想,但计算耗时和内存占用可呈指数倍增长。
- 过滤参数。包括最小相对峰高、离子峰合并等。这些参数不会对解卷积过程本身产生影响,但经过其筛选和处理的结果会极大地影响后继的数据分析工作。
模型峰方法最早用于低分辨GC-MS数据的解卷积并取得了成功,目前也应用于LC-HRMS的重叠峰解析中。LC-HRMS解卷积所要处理的实际情况比GC-MS复杂的多,同时信息也丰富的多,主要体现在:
- LC-MS中本底碎片离子的噪音干扰的强度和范围都较大,达到整个质量扫描范围;
- LC-MS中对色谱峰型造成影响的因素较多,如ESI/MS的离子化抑制效应等。这使得不规则的峰型较常见,给解析带来困难;
- LC-MS的分辨率通常较高,质量扫描范围也更宽,因此解卷积的计算量可能增加多达两个数量级;
- LC-MS分析结果的重现性相对较差,并且ESI等软电离技术缺乏化合物结构信息,无法也无必要建立商品化的标准谱库,使得解卷积结果目前无法进行类似GC-MS的谱库搜索。但另一方面可计算解卷积结果的置信度,并可根据准分子离子峰及相关同位素峰推导化合物的精确分子量和可能的结构式。
B)解卷积
卷积(convolution)是分析数学中一种重要的无穷积分运算,是通过表征函数f与经过翻转和平移的函数g生成第三个函数的一种线性数学算子。卷积与傅里叶变换有着密切的关系,也是信号和图像处理中的常用滤波方法。卷积也是一种常见的物理现象,任何一个线性系统都存在卷积。以光谱分析为例,仪器测得的结果为真实光谱f与一个线形狭缝函数g卷积分的结果,卷积的展宽和平滑效应增大了谱宽从而降低了光谱的有效分辨率。而去除线性函数g影响的过程即称为光谱的解卷积(deconvolution)或去卷积。
$f(x) = (f \times g)(x)$
在ESI/MS等生物大分子质谱数据的解析中,根据多电荷离子碎片的质荷比推算单电荷多肽的分子量这一方法也被称为电荷解卷积。它和对ESI/MS总离子流色谱图进行的化合物色谱峰解卷积一样,并不是严格数学意义上的卷积逆运算,而是解卷积“去复杂化”这一数学概念的特殊实现,成为各自领域中约定俗成的名词。
质谱解卷积技术在较大程度上弥补了色谱法的分离性能以及柱容量的限制,从而可完整表征和利用质谱数据所携带的全部化合物定性及定量信息。这为分析工作者开展基于灰色复杂体系样本的化学指纹图谱、代谢组学,以及各类非目标分析提供了有力保障。