11.3.5 自组织映射人工神经网络

自组织映射分析视图提供各类自组织映射人工神经网络分析的多元统计视图,以及结果的详细汇总表格,如图11-16所示。关于自组织映射神经网络的方法原理详见12.22

图11-16 自组织映射分析视图

和其它人工神经网络一样,自组织映射人工神经网络的建模和训练涉及的参数较多。但除了网格尺寸外,其余参数特别是递归训练参数的默认值适用于大多数的应用场合,除另有需要外,一般采用默认值即可。SOM的相关参数与说明详见下表:

项目名称 说明 选项
自组织映射神经网络 设置自组织映射神经网络聚类的相关参数
开始训练 SOM网络需要手动开始模型的更新。SOM较为耗时,因此在参数设置调整或内容失效后,必须手动确认更新。 开、关
网络拓扑结构 设置SOM网络的拓扑结构。其中六边形网格中每个神经元都与相邻神经元保持一致的单位距离。见图11‑17。 正六边形网格、 正方形网格
网络网格高度 设置SOM网络的纵向网格数目。 取值范围:4~96
网络网格宽度 设置SOM网络的横向网格数目。 取值范围:4~96
初始近邻半径 设置SOM网络的初始近邻作用的半径。通常应为网格高度和宽度中的最大值。 取值范围:0~96
近邻半径系数 设置SOM网络中每次递归后的近邻半径的衰减率。取值0-1之间。默认值为0.96。 取值范围:0~1
初始学习速度 设置SOM网络的初始学习速度。取值0-1之间。默认值为1。 取值范围:0~1
学习速度系数 设置SOM网络中每次递归后的学习速度的衰减率。取值0-1之间。默认值为0.99。 取值范围:0~1
最大递归次数 设置SOM网络的最大递归次数。递归次数和预期残差设定值其中一个先达到时训练结束。默认值为100。 取值范围:10~1000
训练预期残差(%) 设置SOM网络结束时的观测值残差。递归次数和预期残差设定值其中一个达到时训练结束。默认值为10%。 取值范围:0~100

对于网络神经元(网格)数目的选择及优化,请详见12.22

图11-17 自组织映射拓扑结构
左列:六边形拓扑结构的结果系列矩阵(8×16);右列:正方形拓扑结构的结果系列矩阵(8×16)
图11-18 自组织映射视图样式
图形外观中选项对SOM图的显示样式的影响:中图:样本标记文字:启用;右图:样本标记文字:启用;网格线:启用。

对于SOM网格图,具有以下操作方式:

自组织映射人工神经网络输出栏分别提供以下分析结果统计列表及对应的多元统计图形:

表1)自组织映射图(SOM)模型参数设置。该列表对当前SOM的模型参数进行汇总,其示例如下表所示:

属性 设定值
数据预处理 标准化(观测)
距离计算 欧氏距离
SOM拓扑结构 正方形网格
SOM网络宽度 48
SOM网络高度 64
神经元数量 3072
初始近邻半径 48.00
近邻半径系数 0.96
初始学习速度 1.00
学习速度系数 0.96

表2)自组织映射图(SOM)模型质量评价。

表头名称 说明
递归次数 显示训练所执行的实际递归次数
训练耗时(秒) 显示训练耗时
模型残差(%) 显示训练结束时的模型残差。详见12.22 自组织映射人工神经网络
拓扑拟合质量(%) 拓扑拟合质量。详见12.22 自组织映射人工神经网络
BMU重叠率(%) BMU重叠率。详见12.22 自组织映射人工神经网络
BMU错误分类率(%) BMU错误分类率。详见12.22 自组织映射人工神经网络
递归残差 SOM训练过程中每个循环的训练集总残差变化趋势图
观测值矩阵 显示BMU在SOM图中的位置,即样本的投影位置(图11‑20-1)
聚类矩阵 按分组颜色渲染的样本聚类结果的直观呈现(图11‑20-2)
距离矩阵(U矩阵) 显示各神经元之间距离的SOM图(图11‑20-3)
权值矩阵强度 显示各神经元权值矩阵的总强度。可近似将U矩阵看作是对其进行求导的结果(图11‑20-4)。
图11-19 自组织映射训练残差示意图
上图显示了SOM模型训练的一般过程。模型残差在训练开始阶段有时会遇到短暂震荡,这说明神经元有大范围更新
图11-20 自组织映射神经元节点图
从左至右,从上至下:SOM作为非线性拓扑映射,神经元间所代表的原始样本之间的真实距离(相似性)主要通过U矩阵(图3)得到体现。U矩阵类似等高线图,热图中数值较高的区域两侧的神经元距离较远,而BMU与SMU则通常位于数值最低的盆地中央区域。

表3)自组织映射图(SOM)U矩阵。U矩阵的数据量较大,需要单击显示按钮切换到原始数据视图中进行查看。

表4)自组织映射图(SOM)神经元权值矩阵。神经元权值矩阵的数据量较大,需要单击显示按钮切换到原始数据视图中进行查看。

表5)自组织映射图(SOM)权重矩阵统计值。该表格显示每个输入自变量所对应的神经元权值的统计信息。

表头名称 说明
自变量 输入向量中的各个自变量名称
权重百分比(%)
权重均值
该自变量权重占总权重的百分比,以及平均值。值越大则说明该自变量在各样本中的绝对值越大。
权重RSD值(%) 该自变量权重的变化幅度,值越大说明该自变量对于样本分类的意义越重要。 自变量权值矩阵图(图11‑20-5,6)。

表6)自组织映射图(SOM)样本投影拓扑位置。该列表显示了训练集中每个样品的属性及其对应的BMU神经元在二维网格中的拓扑位置。