多元统计分析(Multivariate statistical analysis,亦称多变量分析、多维统计等)是化学计量学的核心组成部分之一。多元统计分析技术其能够同时综合处理分析样本的多个自变量以及与之相关的因变量,进而获得变量间的联系和数据结构等信息。因此与以单变量或双变量为主要研究对象的经典统计学方法相比有着本质的区别。
多元统计分析方法涵盖的内容较广,主要包括多元正态分布假设检验、多元方差分析、直线回归与相关、多元线性回归与相关、主成分分析与因子分析、判别分析与聚类分析等等。根据是否涉及因变量的考察,又可分为自变量分析与因变量分析两大类。
在ChemPattern中,主要依据分析任务的类型和性质将上述方法分为以下两类:
上述各算法的原理详见技术白皮书介绍,具体使用说明参见以下各小节介绍。
在多元统计分析视图中,下列属性列表栏内容属于各分析方法的公共选项:
项目名称 | 说明 | 选项 |
---|---|---|
多元统计分析 | 采用多元统计分析算法对样品集进行综合指纹图谱分析、特征剖析及数据挖掘。 | |
分析方法 | 选择不同种类的算法对样品图谱进行综合的多变量统计分析和数据挖掘。 | 聚类分析:系统聚类、二维系统聚类;特征提取:主成分分析、偏最小二乘判别;方差分析:单向多元方差分析;人工神经网络:自组织映射聚类 |
数据预处理 | 选择分析前对数据进行预处理的方法,从而规范化数据并提高分析结果质量。 | 无:针对观测:标准化、均一化、标度化、中心化;针对变量:标准化、均一化、标度化、中心化;全局:二进制化、自然对数变换、平方根变换 |
图表选项 | 设置绘制数据分析图表时的相关参数 | |
方形坐标系 | 图表尺寸随窗口变化还是始终显示正方形比例的坐标系 | 是、否 |
数据标记文本内容 | 设置数据标记的文本标签内容 | 样品序号、样品名称、样品分组名称、批号 |
在属性列表栏的图表选项中,投影图、显示分组边界和离群值判别等3处设置主要针对主成分分析、偏最小二乘判别,以及多元方差分析的2D和3D统计图表,其具体使用方法将在对应章节中予以说明。