11.3.1 系统聚类分析

系统聚类分析视图提供一维(或称单向)凝聚方式的系统聚类分析(图11-5上),以及更复杂的二维(双向)系统聚类分析(图11-5下)。有关系统聚类分析的方法原理详见12.18系统聚类分析

图11-5 系统聚类分析视图

在属性栏中有关系统聚类分析的选项及其说明见下表:

项目名称 说明 选项
聚类分析参数 设置于聚类分析有关的生成参数
距离计算 选择聚类分析中的各个样本距离的计算方法。 街区距离、欧氏距离、马氏距离、夹角余弦、相关系数
连接方法 聚类分析中的各样本间的连接计算方法。 近邻法、远邻法、加权平均距离法、未加权平均距离法、加权重心法、未加权重心法、误差平方和法
聚类顺序 选择二维聚类图呈现方式 样品优先、自变量优先

一维聚类分析

聚类分析的结果可受到不同的距离计算、连接方法以及数据预处理方法的影响(图11-6),因此在获得最理想的聚类结果之前有必要对参数进行优化调整。

谱系聚类图的可视化内容可进行以下设置:

图11-6 聚类分析结果树状图示例
中药材白芍、赤芍及川赤芍(Paeonia lactiflora, Paeonia veitchii)的色谱指纹图谱聚类分析结果。左上图:连接方法:近邻法;右上图:连接方法:远邻法;左下图:连接方法:未加权重心法;右下图:连接方法:离差平方和法。

二维聚类分析

二维系统聚类分析(亦称双向聚类)是在一维聚类分析的基础上增加了对自变量进行同时聚类的功能,并同步显示二者聚类结果的色彩图。通过色彩图和两侧的谱系聚类图,可直观地观察每个样品中的共有峰在样本和自变量两个维度中所形成的聚类模式,以及其对聚类结果的影响。

图11-7 二维聚类分析结果树状图示例
上图:数据预处理:标准化(观测);距离计算:欧氏距离;连接方法:近邻法;树高度:20%;文本高度:20%;
中图:数据预处理:平方根变换;距离计算:街区距离;连接方法:加权重心法;树高度:40%;文本高度:5%;
下图:数据预处理:平方根变换;距离计算:街区距离;连接方法:未加权重心法;树高度:30%;文本高度:20%;聚类顺序:自变量优先;
以图10-5下的中药材黄芪色谱指纹图谱数据二维聚类为例,可观察到5个含量较高的化合物组分分别在4个不同黄芪药材品种所形成的截然不同的水平分布条带,提示由这些化合物所构成的模式是区分这4类不同种属来源样品的重要特征。

调整树形结构

在一维或二维系统聚类图的任意树形节点(水平分支的中点)上单击鼠标右键,该节点将以高亮显示。此时在弹出的快捷菜单中选择“交换左右树”,即可对指定节点的左右两侧树形结构进行翻转对调,如图11-8所示。

图11-8 树形结构调整示例
该功能用于对聚类结果的可视化效果进行局部微调,而并不会对聚类结果造成影响。因为聚类结果中样本的远近亲疏程度是以纵坐标轴的距离或相似度单位来衡量,而非其水平坐标的间隔。