玉米营养品质的快速鉴定
摘要:光谱检测法作为玉米营养品质含量的快速分析方法,首先需要根据常规 生化检测数据结合光谱响应数据完成合理的定标与矫正,建立合适的数据分析模 型。在进行光谱检测时,由于光谱波长区间大、波长取值点较多,对快速分析带 检测方案模型。最后本文利用 上述检测模型,对其余 26 种样品的蛋白质、纤维素、脂肪三种营养成分含量进 行了预测。
模型假设与符号说明
模型假设
在整个光谱检测过程中,不存在人为和外部环境因素的干扰;
假设10000-4000 cm-i为测定玉米中蛋白质、脂肪、纤维素含量的有 效波段;
假设蛋白质、脂肪、纤维素含量的检测之间没有相互影响 。
符号说明
x第I个玉米样品的第J个波长指标变量的响应数据; ij
Xij中心化变换后的响应数据;
Rk两变量Xj与XK的样本相关系数;
卩j变量3的回归系数;
Yi第1个样品的蛋白质含量实测数据;
Yi第1个样品的蛋白质含量估计数据;
Q 误差平方和;
U 回归平方和;
R 称为复相关系数;
WiJ表示隐含层第1个节点到输入层第J个节点之间的权值;
° i表示隐含层第1个节点的阈值;
e(x)表示隐含层的激励函数;
WKi表示输出层第k个节点到隐含层第1个节点之间的权值;
AK表示输出层第K个节点的阈值;
屮(x)表示输出层的激励函数;
ok表示输出层第k个节点的输出;
个样本 p 的二次型误差准则函数为。
基于聚类分析和多元回归的光谱分析模型
聚类分析模型 聚类分析,亦称群分析或点群分析,它是研究多要素事物分类问题的数量方 法。其基本原理是,根据样本自身的属性,用数学方法按照某些相似性或差异性 指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。 常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。对样本进行分 类称为 Q 型聚类分析,对指标进行分类称为 R 型聚类分析。本文采用 R 型聚类分 析对波长变量进行聚类[1]。
通过对样品的光谱响应数据进行分析,发现样品对于不同波长的相应数据有 390 个,波长变量维数太多,且波长变量间的相关度较高,给系统分析与建模带 来了很大的不便。若要对样品的光谱响应数据与蛋白质含量进行多元线性回归, 就要求样品数量应大于变量个数,而已知蛋白质含量的样品只有 100 个,远小于 波长变量的维数,因此需要对波长变量进行筛选,选出具有代表意义的波长来进 行回归分析。本文采用 R 型聚类分析,通过研究变量的相似系数,按照变量的相 似关系把它们聚合成若干类,进而找出影响系统的主要因素,选取每一类中具有 代表意义的波长。
数据的标准化处理
已知共有 100 个玉米样品,每个样品测得了390 个波长变量的响应数据,原 始数据矩阵为:
X
X
… X
11
12
1,390
x
X
… X
X =
21
■
■
■
22
■
■
■
2,390
■
■
■
X
X
… X
100,1
100,2
100,390」
1)
其中」(i = 12・..'l00, j = 12心0 )为第i个玉米样品的第j个波长指标 变量的响应数据。
由于样本数据矩阵由多个指标组成,样品对于不同指标的响应数据可能存在 量纲和数量级不同的问题,为了消除两者的影响,需要先进行数据变换处理。
本文采用标准化变换对数据进行处理,其处理方法如下。 首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化,即有:
x —卩 / 、
X = j, i = 1,2,・・・,100, j = 1,2,・・・,390 (2)
j s
j
100
乙x 其中,卩=I , s = 畀(x -卩)。
j 100 j V100 — 1 ij j
1 i=1
指标变量相似程度的测量计算 研究变量的亲疏程度或相似程度的数量指标通常有两种:一种是相似系数, 性质越接近的变量或样品,其取值越接近于 1 或-1,而彼此无关的变量或样品的 相似系数则越接近于0,相似的归为一类,不相似的归为不同类。另一种是距离, 它将每个样品看成p维空间的一个点,100个样品组成p维空间的100个点。用 各点之间的距离来衡量各指标变量之间的相似程度(或靠近程度)。距离近的点 归为一类,距离远的点属于不同的类。对于变量之间的聚类(R型)常用相似系 数来测度变量之间的亲疏程度,而对于样品之间的聚类分析(Q型),则常用距
离来测度样品之间的亲疏程度。 本文对指标变量进行 R 型聚类分析,采用相关系数研究变量的相似程度。
jk
jk
对于变量x和x,可以用两变量x与x的样本相关系数r作为它们的相似
j
性度量。
玉米品质鉴定 来自淘豆网m.daumloan.com转载请标明出处.