数据导入功能所使用的对话框界面(图11-2)由电子表格、操作命令工具条和导入状态提示栏组成。有关电子表格的操作请详见2.6 数据汇总电子表格。访问该功能的方式为文件导入样品支持数据,或文件导入样品数据(仅限XLS解决方案)。
在开展许多含量测定及化学计量学分析时,除了从各类分析仪器工作站导入的样品图谱数据之外,有时还需要额外提供支持数据以便分析能够正确进行。在进行如下表所列的分析任务时将涉及导入样品支持数据:
分析任务 | 所提供数据 | 数据格式要求 |
---|---|---|
色谱含量测定 | 每个样品的含量信息。详见3.8.5 设定样品量。 | 需要含量值和对应的样品名称 |
光谱定量分析 | 为回归建模(多元线性回归和偏最小二乘回归)提供以因变量形式表示的成分含量值。 | 需要样品名称、含量,以及因变量。因变量名称可选。 |
回归分析 | 为回归建模提供因变量。详见11.4.4多元线性回归。 | 需要样品名称和因变量。因变量名称可选。 |
XLS解决方案 | 导入XLS解决方案所需的全部数据 | 需要样品名称、分类名称(可选)、自变量、因变量(可选)、变量名称(可选) |
对话框中工具条中各按钮的对应功能和说明如下:
说明 | 功能 | |
---|---|---|
1 | 导入Excel数据 | 从Excel文件中导入数据集 |
2 | 剪贴板数据 | 从系统剪贴板中获取ASCII数据 |
3 | 解析 | 显示数据集的原始内容或解析后的形式 |
4 | 变量名称行 | 数据表格中是否包含变量名称行 |
5 | 样品名称列 | 数据表格中是否包含样品名称列 |
6 | 分类名称列 | 数据表格中是否包含分类名称列 |
7 | 样品含量列 | 数据表格中是否包含样品含量列 |
8 | 待测样品列 | 数据表格中是否包含因变量未知的待测样品定义列 |
9 | 自变量数据列 | 设置数据表格中所包含的得分数据列数 |
10 | 列分隔符 | 设置所导入的剪贴板数据的列分隔符类型 |
11 | 忽略行数 | 设置需要忽略不计的数据开头行数 |
12 | 数据显示格式 | 设置数据的小数点位数和格式化方式 |
可导入的支持数据类型包括MS Excel文件,以及保存于当前系统剪贴板中的任何类型数据表格或CSV文件的复制内容,如下表所示:
类型 | 扩展名 | 说明 |
---|---|---|
Microsoft Excel文档 | *.xls | Excel文档格式是最常用的电子表格文件类型。该类型文件被众多的电子表格软件和科学统计类软件所支持,具有较好的兼容性。ChemPattern暂不支持Office2010的文件格式xlsx。 |
ASCII文本格式 | *.csv, *.txt | Comma separated value。一类统称为“逗号分隔值“的以行为单位的多列数据格式文本文件。很多软件支持该文件格式,如MS Excel。 |
以通用数据解决方案为例,一个包含全部可导入内容的Excel数据表格如下所示:
A | B | C | D | E | F | G | H | I | J | |
---|---|---|---|---|---|---|---|---|---|---|
1 | 样品名称 | 分类名称 | 样品量 | 待测样本 | 因变量1 | … | 因变量p | 变量1 | … | 变量m |
2 | 样品1 | 分类1 | 1.5 | 0 | 1 | … | 2.2 | 0.12 | … | 22 |
3 | 样品2 | 分类1 | 1.9 | 0 | 1 | … | 2.3 | 1.29 | … | 23 |
4 | 样品3 | 分类2 | 0.8 | 0 | 0 | … | 2.4 | 1.31 | … | 24 |
5 | 样品4 | 分类3 | 1.1 | 1 | … | 4.72 | … | 25 | ||
6 | … | … | … | … | … | … | … | … | … | … |
7 | 样品n | 分类q | 1.2 | 0 | 1 | … | 3.1 | 9.28 | … | 38 |
其数据格式设置有以下注意事项:
如果导入的数据内容或导入格式设定有误,则会提示错误信息,如下表所示:
类型 | 提示信息 | 说明 |
---|---|---|
提示 | 请选择Excel文件或CSV文本数据方式导入数据并解析内容 | |
提示 | 请开始解析数据,并依据数据组成正确选择各行、列的归属组合 | 可通过单击“解析”按钮在原始数据和解析后数据之间进行切换显示。 |
错误 | 没有导入有效的数据,数据为空或格式不正确 | |
错误 | 数据不足,无法按指定数据类型的组合完成解析 | 通常见于所设定的列数超过当前数据的实际列数 |
错误 | 单一因变量的所代表的列值不能全部相等 | 全部相等的因变量无分析意义 |
错误 | 单一变量的所代表的列值不能全部为0 | 全部为零的自变量无分析意义 |
错误 | 样品含量列的值不能为0,默认值为1 | |
错误 | 应至少指定下列数据列的一种:样品含量或因变量 | 非XLS解决方案可能出现的提示信息 |
错误 | 必须提供样品名称列,并且只有与当前解决方案中样品名称一致的数据行才会被导入 | 新导入的值会覆盖对应样品的原有值 |
错误 | 待导入数据的变量数目和解决方案现有样本变量数目不一致 | XLS解决方案可能出现的提示信息 |
错误 | 待导入数据的因变量数目和解决方案现有因变量数目不一致 | 如果需要调整因变量个数,请先执行 工具高级清除全部因变量 |
提示 | 数据解析完成,共有n个转换提示信息 | 可能存在问题的数据单元格统计信息 |
为了便于导入时的除错检查,对话框中的电子表格还提供以下辅助显示内容: