11.1.3 导入样品支持数据

数据导入功能所使用的对话框界面(图11-2)由电子表格、操作命令工具条和导入状态提示栏组成。有关电子表格的操作请详见2.6 数据汇总电子表格。访问该功能的方式为文件导入样品支持数据,或文件导入样品数据(仅限XLS解决方案)。

图11-2 导入支持数据对话框

在开展许多含量测定及化学计量学分析时,除了从各类分析仪器工作站导入的样品图谱数据之外,有时还需要额外提供支持数据以便分析能够正确进行。在进行如下表所列的分析任务时将涉及导入样品支持数据:

分析任务 所提供数据 数据格式要求
色谱含量测定 每个样品的含量信息。详见3.8.5 设定样品量 需要含量值和对应的样品名称
光谱定量分析 为回归建模(多元线性回归和偏最小二乘回归)提供以因变量形式表示的成分含量值。 需要样品名称、含量,以及因变量。因变量名称可选。
回归分析 为回归建模提供因变量。详见11.4.4多元线性回归 需要样品名称和因变量。因变量名称可选。
XLS解决方案 导入XLS解决方案所需的全部数据 需要样品名称、分类名称(可选)、自变量、因变量(可选)、变量名称(可选)

对话框中工具条中各按钮的对应功能和说明如下:

说明 功能
1 导入Excel数据 从Excel文件中导入数据集
2 剪贴板数据 从系统剪贴板中获取ASCII数据
3 解析 显示数据集的原始内容或解析后的形式
4 变量名称行 数据表格中是否包含变量名称行
5 样品名称列 数据表格中是否包含样品名称列
6 分类名称列 数据表格中是否包含分类名称列
7 样品含量列 数据表格中是否包含样品含量列
8 待测样品列 数据表格中是否包含因变量未知的待测样品定义列
9 自变量数据列 设置数据表格中所包含的得分数据列数
10 列分隔符 设置所导入的剪贴板数据的列分隔符类型
11 忽略行数 设置需要忽略不计的数据开头行数
12 数据显示格式 设置数据的小数点位数和格式化方式
所有支持数据都需要以电子表格的形式导入,从而克服了逐一输入方式存在的缺点。对于当前解决方案所需的不同数据列内容,可将其编制在一张电子表格上以方便一次性导入及日后更新。

可导入的支持数据类型包括MS Excel文件,以及保存于当前系统剪贴板中的任何类型数据表格或CSV文件的复制内容,如下表所示:

类型 扩展名 说明
Microsoft Excel文档 *.xls Excel文档格式是最常用的电子表格文件类型。该类型文件被众多的电子表格软件和科学统计类软件所支持,具有较好的兼容性。ChemPattern暂不支持Office2010的文件格式xlsx。
ASCII文本格式 *.csv, *.txt Comma separated value。一类统称为“逗号分隔值“的以行为单位的多列数据格式文本文件。很多软件支持该文件格式,如MS Excel。

以通用数据解决方案为例,一个包含全部可导入内容的Excel数据表格如下所示:

A B C D E F G H I J
1 样品名称 分类名称 样品量 待测样本 因变量1 因变量p 变量1 变量m
2 样品1 分类1 1.5 0 1 2.2 0.12 22
3 样品2 分类1 1.9 0 1 2.3 1.29 23
4 样品3 分类2 0.8 0 0 2.4 1.31 24
5 样品4 分类3 1.1 1 4.72 25
6
7 样品n 分类q 1.2 0 1 3.1 9.28 38

其数据格式设置有以下注意事项:

如果导入的数据内容或导入格式设定有误,则会提示错误信息,如下表所示:

类型 提示信息 说明
提示 请选择Excel文件或CSV文本数据方式导入数据并解析内容
提示 请开始解析数据,并依据数据组成正确选择各行、列的归属组合 可通过单击“解析”按钮在原始数据和解析后数据之间进行切换显示。
错误 没有导入有效的数据,数据为空或格式不正确
错误 数据不足,无法按指定数据类型的组合完成解析 通常见于所设定的列数超过当前数据的实际列数
错误 单一因变量的所代表的列值不能全部相等 全部相等的因变量无分析意义
错误 单一变量的所代表的列值不能全部为0 全部为零的自变量无分析意义
错误 样品含量列的值不能为0,默认值为1
错误 应至少指定下列数据列的一种:样品含量或因变量 非XLS解决方案可能出现的提示信息
错误 必须提供样品名称列,并且只有与当前解决方案中样品名称一致的数据行才会被导入 新导入的值会覆盖对应样品的原有值
错误 待导入数据的变量数目和解决方案现有样本变量数目不一致 XLS解决方案可能出现的提示信息
错误 待导入数据的因变量数目和解决方案现有因变量数目不一致 如果需要调整因变量个数,请先执行 工具高级清除全部因变量
提示 数据解析完成,共有n个转换提示信息 可能存在问题的数据单元格统计信息

为了便于导入时的除错检查,对话框中的电子表格还提供以下辅助显示内容: