APP下载

基于高光谱融合神经网络的玉米黄曲霉毒素B1和赤霉烯酮含量预测

2019-01-03王光辉

食品与机械 2018年11期
关键词:赤霉烯酮黄曲霉

王光辉 殷 勇

(河南科技大学食品与生物工程学院,河南 洛阳 471023)

玉米作为中国重要的粮食,其安全问题关系国计民生,是国家稳定和发展的前提[1-2]。新鲜玉米由于含水量高、所带的菌量较多,极易在高温高湿条件下霉变[3]。黄曲霉毒素B1和玉米赤霉烯酮是玉米霉变过程中产生的2种代表性毒素[4],如果被误食则会造成严重后果。因此,霉变玉米的快速检测十分必要。目前,玉米霉变检测的方法主要是DNA探针[5]、气相色谱法(GC)[6]、酶联免疫法(ELISA)[7]等生物化学分析方法,但这些方法在检测过程中操作不便,且玉米被破坏,难以达到快速、无损检测的目的[8]。

高光谱技术是近年来发展迅速的一门无损检测新技术,在农产品检测方面被广泛利用[9-11],它将图像技术和光谱技术有机融合,图像信息用于检测物体的外部特征,光谱信息则可反映物体的内部品质[12-14],近年来,已有部分学者开展了基于高光谱成像技术的霉变玉米检测研究,并取得了一定成果[15-16]。但是由于高光谱信息的高维度特点使得构建模型复杂、精度不高[17]。

本研究拟采用高光谱技术融合神经网络分别对霉变玉米中的黄曲霉毒素B1、赤霉烯酮2种毒素进行预测,以期提出一种霉变玉米快速、准确的无损检测方法。

1 材料与方法

1.1 试验材料

新鲜玉米:中单909,购于洛阳中原农贸城,不同霉变等级的玉米样品由实验室自行培育。新鲜玉米含水量较高,当湿度>85%、温度高于25 ℃时,其自身携带的霉菌会迅速生长并产生有毒代谢产物。因此,可创造温、湿度条件用培养箱制备出霉变玉米。参考文献[18]制备霉变玉米样本的方法,设定培养箱温度为30 ℃、相对湿度为85%作为制备霉变玉米样本的培养条件,并选取经过0,2,4,6,8,10 d的培养样本作为6个霉变等级样本,分别标记为:A1、A2、A3、A4、A5和A6。每个霉变等级玉米制备50个样本(35个训练集,15个测试集),共制备50×6=300个试验样本,每个样本含量(50±0.5) g。

1.2 仪器与设备

高光谱图像采集系统包括高光谱成像仪(IST50-3810型,德国Inno-Spec公司)、4个500 W的光纤卤素灯(RK90000420108型,德国Esylux公司)、驱动传送装置和计算机。高光谱图像采集系统如图1所示。高光谱成像仪通过USB 2.0连接计算机。

1.3 数据采集方法

1.3.1 玉米样品黄曲霉毒素B1和赤霉烯酮含量的测定 为了验证霉变玉米等级划分的合理性,分别按照GB 5009.22—2016和GB 5009.209—2016提供的方法检测新鲜玉米和霉变玉米样本中黄曲霉毒素B1和赤霉烯酮含量,检测结果如表1 所示(每个等级的样品做3次平行试验取平均值)。由表1 可看出,随着培养时间的延长,黄曲霉毒素B1和赤霉烯酮的含量也随之增多,说明用培养时间来表征玉米霉变等级是合适的。霉变玉米毒素含量的测定与高光谱图像的采集同步。

1. 光谱仪 2. 光纤卤素灯 3. 样品 4. 传输装置 5. 计算机

表1 黄曲霉毒素B1和赤霉烯酮理化指标

1.3.2 高光谱图像的采集 高光谱图像采集过程中,由于图像质量会受到采样背景以及相机暗电流的影响,因此需要对高光谱图像进行黑白标定[19]。首先采集全黑全白图像,然后将称好的样品[(50±0.5) g]平铺在Ф 10 cm×1 cm的培养皿中放置在传送装置上进行采样,最后使用全黑全白图像对原始高光谱图像数据进行黑白标定。光谱仪光谱范围为371.05~1 023.82 nm,光谱分辨率为2.8 nm,采样间隔为0.51 nm,采样图片大小为720×1 032。6个等级玉米样品在720 nm波长下的高光谱图像如图2所示,前3个等级的样品霉变程度变化不明显,后3个等级霉变程度变化明显。

2 结果与分析

2.1 光谱预处理

黑白标定后的光谱采用多元散射校正进行预处理,图3、4分别为预处理前后的光谱数据变化曲线。通过两者对比,经多元散射校正后的光谱数据,明显地消除了基线偏移,提高了信噪比。

2.2 光谱数据降维

高光谱数据具有维度高信息量大等特点,光谱波段之间会存在大量冗余信息,如果将全段光谱作为预测模型的输入,则会提高模型的复杂性,使建模时间增长[20-22],因此,选择有效的波段来降低高光谱数据的维度是必要的。

图2 720 nm波长下6个等级玉米高光谱图像

2.2.1 相关系数法 利用相关系数法确定有效波段,该方法是把校正集光谱矩阵中的每个波长对应的光谱反射值与待测指标含量进行相关性计算,得到每个波长的相关系数图。在高光谱技术中,相关系数大小代表了光谱信息量多少,相关系数大的波长含有的信息量更多[23],可选择相关系数大的波段区域进行下一步的特征选择。相关系数的计算:

(1)

图3 原始光谱数据

图4 经多元散射校正处理后的光谱数据

式中:

rxy——一个波长下6个等级样品光谱反射值与毒素含量的相关系数;

xi、yi——分别是光谱反射值和样品毒素含量在第i个波长(共1 288个)下的检测值,

n——样本总数(6个等级共300个)。

相关系数范围为[-1,1],r>0表示正相关,r<0表示负相关,|r|表示了变量之间相关程度的高低。经查阅资料并结合已知的化学知识,将相关系数>0.3的波段定义为光谱信息含量高的波段,即为有效波段。

图5为玉米样品中黄曲霉毒素B1、赤霉烯酮含量与光谱反射值相关性大小随波长变化曲线。由图5可以看出,黄曲霉毒素的有效波段区间为511.3~539.9,692.4~999.15 nm,赤霉烯酮的有效波段为736.2~999.15 nm。

2.2.2 特征波长选择 将有效波段下的光谱数据运用SPA算法选择特征波长,当选择出的特征变量为8个时交互验证的均方根误差最小且逐渐趋于稳定,此时所选出的8个特征波长即为选择结果。

为了使模型在保证精度的同时使数据维度降到最低,对选择出的8个特征波长进一步筛选,引入信息熵的概念。样本在某一波长下的自信息熵越大,说明该波长越能刻画样本。而某两个波长下的互信息熵越小,说明它们之间的关联性小,越有利于区分它们所表征的样本[24-25]。将自信息熵和互信息熵概念引入到不同等级霉变玉米高光谱的判别中。可按式(2)计算出样本图像中每级灰度的概率分布密度。

图5 玉米样品中黄曲霉毒素B1、赤霉烯酮含量与光谱反射值相关性随波长变化曲线

Figure 5 Curve of correlation between aflatoxin B1and gibberenone content and spectral reflectance in corn samples with wavelength

Pi=hi/n,

(2)

式中:

Pi——一个图像中灰度值为i的像素点的概率分布密度;

hi——一个图像中灰度值为i的像素点的总数;

n——一个图像中的像素总和。

在式(2)基础上,图像M的信息熵可用式(3)表示。

(3)

式中:

H(M)——图像M的自信息熵,灰度等级从0~255共256个等级。

对于任意2幅图像M和N,其联合熵H(M,N)可表示为:

(4)

式中:

PMN(i,j)——图像M和N灰度的联合概率分布。

图像M和图像N的互信息熵I(M,N)为:

I(M,N)=H(M)+H(N)-H(M,N)。

(5)

进而可提出任意2个霉变等级下玉米样本间的可分性判据,其计算公式为:

(6)

当2个等级霉变玉米样本高光谱图像之间的互信息熵越小、自信息熵越大时,则A值越小,越有利于样本的分级;反之则不利于分级。通过式(3)计算初选特征波长下每个霉变等级玉米样本(50个样本)高光谱图像的平均自信息熵,以及任选2个霉变等级组合(6个等级共15个组合),根据式(4)、(5)分别计算每个组合在初选波长下对应2个等级样本之间的互信息熵,并计算其平均值,根据式(6)计算所有初选波长下所有组合(15个组合)霉变玉米高光谱图像的A值及其均值。根据A值大小确定最优特征波长,结果如表2所示。

表2 特征波长选择结果†

† 按照A值从小到大排列。

2.3 BP神经网络模型构建

2.3.1 构建有效波段下光谱信息的BP神经网络模型 有效波段下光谱信息建立的黄曲霉毒素B1和赤霉烯酮含量的预测模型,输入层神经元个数为有效波段下的所有波长,代表有效波段下所有波长的光谱反射值,输出层神经元个数都为1,分别代表黄曲霉毒素B1和赤霉烯酮,隐含层函数为tansig,输出层函数为logsig,训练函数为trainlm,训练集数据来训练神经网络,隐层神经元个数为7,此时的网络训练误差为0.000 54,训练步数为100,学习速率为0.1。验证集结果如图6所示。图6(a)结果显示,霉变玉米黄曲霉毒素B1含量预测正确率为91.6%,预测值与实际值相关系数为0.998 7,均方根误差为0.024 4;图6(b)结果显示,赤霉烯酮含量预测正确率为93.2%,预测值与实际值相关系数为0.988 7,均方根误差为0.604。

2.3.2 构建8个特征波长下光谱信息的BP神经网络模型

8个特征波长下的光谱信息所建立的黄曲霉毒素B1和赤霉烯酮含量预测模型,输入层神经元个数为8,代表8个特征波长下的光谱反射值,输出层神经元个数都为1,分别代表黄曲霉毒素B1和赤霉烯酮含量,黄曲霉毒素B1含量预测模型的隐含层传递函数为logsig,输出层传递函数为logsig,训练函数为traincgf;赤霉烯酮含量预测模型的隐含层传递函数为tansig,输出层传递函数为logsig,训练函数为traincgf,隐层神经元个数为6。验证集结果如图7所示。由图7(a)结果显示,黄曲霉毒素B1含量预测正确率为98.74%,预测值与实际值之间的相关系数为0.976 9,均方根误差为0.045 8;由图7(b)结果显示,赤霉烯酮含量预测正确率为100%,预测值与实际值之间的相关系数为0.984 1,均方根误差为0.160 5。

2.3.3 构建前4个特征波长下光谱信息的BP神经网络模型

为了尽可能地减少模型的输入,提高模型的运算速度及精度,选择前4个特征波长构建模型。前4个特征波长下光谱信息建立的霉变玉米黄曲霉毒素B1和赤霉烯酮含量的预测模型,输入层神经元个数为4,代表前4个特征波长下的光谱反射值,输出层神经元个数都为1,分别代表黄曲霉毒素B1和赤霉烯酮,黄曲霉毒素B1含量预测模型的隐含层传递函数为tansig,输出层传递函数为tansig,训练函数为traincgf;赤霉烯酮含量预测模型的隐含层传递函数为logsig,输出层传递函数为logsig,训练函数为trainlm,隐层神经元个数为8。验证集结果如图8所示。由图8(a)结果显示,黄曲霉毒素B1含量预测正确率为92.42%,预测值与实际值之间的相关系数为0.984 4,均方根误差为0.322 6;由图8(b)结果显示,赤霉烯酮含量预测正确率为98.5%,预测值与实际值相关系数为0.965 2,均方根误差为0.407 4。

2.3.4 最优模型的确定与稳健性分析 对比不同波长下构建的霉变玉米毒素预测模型,结果显示:8个特征波长下所构建的模型预测结果最好,黄曲霉毒素B1和赤霉烯酮含量预测正确率均达到98%以上,而当特征波长数减少到4个时所构建的模型预测正确率明显降低,且稳定性较差。为了进一步验证8个特征波长下所构建模型的稳健性,在同一批样品中随机选择6组训练集和测试集,在模型不变的前提下,对样品进行预测,结果对比如表3所示。

图6 有效波段下构建黄曲霉毒素B1和赤霉烯酮含量预测模型验证结

图7 基于8个特征波长下构建黄曲霉毒素B1和赤霉烯酮含量预测模型验证结果

图8 前4个特征波长下构建的黄曲酶毒素B1含量和赤霉烯酮含量预测模型验证结果

表3 6组测试集预测结果

由表3可知,黄曲霉毒素B1含量预测正确率平均值为97.51%,赤霉烯酮含量预测正确率平均值为100%。随机测试结果与原始结果基本一致,说明8个特征波长下光谱信息所建立的BP神经网络预测模型能够准确预测黄曲霉毒素B1和赤霉烯酮含量,并且模型具有较高的稳定性。

3 结论

针对霉变玉米中黄曲霉毒素B1和赤霉烯酮的快速评定,本试验在选择有效波段的基础上提取霉变玉米高光谱特征波长,建立了有效波段、8个特征波长以及前4个特征波长下构建BP神经网络毒素预测模型。结果显示,8个特征波长下的BP神经网络预测模型,具有较高的稳定性与可靠性。证明了高光谱数据降维的必要性,减少计算量、提高检测精度,同时也验证了高光谱无损检测霉变玉米黄曲霉毒素B1及赤霉烯酮含量具有可行性。

猜你喜欢

赤霉烯酮黄曲霉
复合免疫亲和柱净化-UPLC-MS/MS测定饲料中黄曲霉毒素B1、玉米赤霉烯酮和T-2毒素
食品中玉米赤霉烯酮检测结果测量不确定度的评定
赤霉酸处理对核桃种子萌发和幼苗生长的影响
鸡黄曲霉毒素中毒的临床表现、实验室诊断与防治
孜然精油对产毒黄曲霉的抑制活性研究
玉米赤霉烯酮降解菌的分离及降解特性研究
铀酰-Salophen与环己烯酮的作用模式
多指标测定黄曲霉毒素B1和伏马菌素B1联合毒性
家兔黄曲霉毒素中毒的治疗与预防
喹烯酮的食品安全性研究进展