11.5.5 支持向量机

该视图提供支持向量机(SVM)模式识别的参数配置、详细结果输出和相关多元统计图表。方法原理详见12.24 支持向量机

图11-31 支持向量机模式识别界面

相关的属性栏项目及说明如下:

项目名称 说明 选项
支持向量机属性 设置支持向量机相关参数
核函数类型 设置用于数据空间高维映射的核函数类型,所有分类器都使用相同的设置。注意:多项式核函数在计算时存在发生浮点数溢出的可能。 高斯核、线性核、多项式核

A)模式识别结果列表

模式识别结果列表中表3.模式识别样品预测结果的定义如下。

表头名称 说明
样品ID及名称 显示测试集的样品编号及名称
每个二值分类器的预测值 显示支持向量机模型中的每个分类所对应的二值分类器对于当前测试集样本的分类预测情况,预测值分为以下几种情况:
  • <0:分类器判定该样本不属于当前分类
  • >0:分类器判定该样本属于当前分类
  • ≈1:数值越大则说明样本归属于当前分类的可能性越高
  • ≈-1:数值越小则说明样本归不属于当前分类的可能性越高
预测分类 综合支持向量机中各分类对应的分类器预测值,如全部<0,则该测试集样本不属于任何一个分类,显示为N/A,否则最大值所在的分类将被视为样本的最可能归属。

B)支持向量机输出栏

支持向量机输出栏分别提供以下分析结果统计列表及对应的多元统计图形:

表B1.多类分类支持向量机(SVM)子分类器

该表格汇总了模型中各个分类器的名称、参数、识别率等信息,并可进一步访问指定的分类器,详见下表:

表头名称 说明
ID、分类器名称 显示支持向量机中的二值分类器名称和编号,以当前分类命名
样品数 当前分类所包含的有效样本数
核函数 显示分类器的核函数
惩罚参数C 显示分类器由网格搜索获得的惩罚参数C。如果尚未进行搜索,则为默认值0
核函数γ 显示分类器由网格搜索获得的核函数γ。如果尚未进行搜索,则为默认值0
偏移值bias
支持向量 分类器中使用的支持向量个数
识别率(%) 分类器的识别率
分类器 单击则切换至对应的支持向量机分类器结果输出界面,并显示支持向量分布散点图(图11‑32-1)
网格搜索 显示对应分类器的网格搜索结果的模型识别率等高线图(图11‑32-2),如尚未进行网格搜索则显示“未执行”

B1.表格内容的一个实例可详见下表:

ID 分类器名称 样品数 核函数 惩罚参数
C
核参数
γ
支持向量 识别率
(%)
1 Astragalus membranaceus 10 高斯核 2.37 -3.95 10 100.00
2 Astragalus mongholicus 11 高斯核 0.79 -3.95 15 90.91
3 Astragalus floridus 5 高斯核 0.79 -3.95 13 100.00
4 Astragalus ernestii 5 高斯核 0.79 -5.53 11 100.00

支持向量机的网格搜索可通过汇总表格下方的对话框进行,该对话框提供对所有分类器进行同步的参数搜索和更新的功能。

项目名称 说明 选项
网格搜索及交叉验证 对分类器进行网格搜索及交叉验证的功能
惩罚系数C 以2次方的形式设置要检索的惩罚系数C范围 取值范围:-15~15
核参数γ 以2次方的形式设置要检索的核参数γ范围 取值范围:-15~15
网格尺寸 设定搜索时的网格密度,尺寸越大则所获得的最佳参数值的精确度越高,但搜索速度较慢 10,20,50,100
搜索 开始搜索,并根据搜索结果更新所有子模型的惩罚系数C和核参数γ,并重新生成结果
图11-32 支持向量机分类器统计图形

C)支持向量机分类器输出栏

支持向量机分类器输出栏显示当前所查看的分类器子模型的相关信息。如果未指定具体的分类器,则默认显示第一个。其分别提供以下结果统计列表及对应的统计图表:

表C1.支持向量机(SVM)网格搜索表格内容请参见B1。

表C2.支持向量机(SVM)网格搜索优化结果。该表格内容可通过原始数据界面进行浏览,其内容为图11-32-2所示的识别率网格数据。

表C3.支持向量机(SVM)子分类器的支持向量。

表头名称 说明
ID、训练集样本 当前训练集样本的编号和名称
分类 该训练集样本所属分类
预测值 训练集样本在当前分类器中的分类预测值,通常应≥1或≤-1,如果该值介于-1和1之间,乃至在图中越过纵坐标为0的判定边界,则说明该训练集样本在当前模型中不能获得较好的区分
支持向量 该训练集样本是否为支持向量
权重系数 如果为支持向量,则显示其对应的权重系数,绝对值越大说明对分类的贡献越大