APP下载

基于BP神经网络的虾蛄捕捞海域溯源方法

2017-11-16李沂光李风铃宁劲松卢立娜段元慧谷文艳

渔业现代化 2017年5期
关键词:海域神经元准确率

李沂光, 李风铃, 宁劲松, 卢立娜, 段元慧, 谷文艳

(中国水产科学研究院黄海水产研究所,山东 青岛 266071)

基于BP神经网络的虾蛄捕捞海域溯源方法

李沂光, 李风铃, 宁劲松, 卢立娜, 段元慧, 谷文艳

(中国水产科学研究院黄海水产研究所,山东 青岛 266071)

虾蛄是重要的经济水产品,对环境中重金属元素具有富集作用。不同海域捕捞的虾蛄体内重金属含量差异较大,因此,可根据虾蛄体内重金属含量推断捕捞海域的污染状况,即基于虾蛄体内重金属状况对其来源进行溯源。以渤海、东海和南海三大海域虾蛄中的3种重金属含量数据作为输入,建立BP神经网络判别分析模型,并对模型进行优化,通过模型判断虾蛄样本的来源海域。结果显示:经过网络训练后,总计90个样本中,86个分类正确,模型的判别准确率为95.6%,其中训练集判别准确率为98.1%,验证集准确率为94.4%,测试集准确率为88.9%。研究表明:基于BP神经网络建立的判别分析模型能够解析非线性复杂体系中各元素的内在关联,以区分样品的来源,并可据此进行有效的追溯。

水产品;虾蛄;重金属;BP神经网络;判别分析;共轭梯度

虾蛄(Oratosquillaoratoria)是重要的海产甲壳类经济产品[1],因其肉质鲜美,营养价值高,深受消费者青睐。2015年中国虾蛄年总产量达到30万t,均为海水捕捞产品[2]。虾蛄广泛分布于四大海域,辽宁、山东、江苏、浙江、福建等沿海省份是虾蛄的主产区。近年来,海洋污染日益严重,食品安全事件频发。由于虾蛄为捕捞产品,主要安全风险因子为海水中的重金属、多环芳烃、石油烃等污染物,且由于底栖特性,虾蛄尤易富集重金属,其产品质量与捕捞海域的水体质量密切相关,而目前对其质量监督的手段以监控和追溯为主。

在农产品安全监管工作中,产品溯源是一个重要环节,可应用于产品的真伪鉴别、品质分类等,以防止以假乱真、以次充好等行为。其中,通过金属元素的含量对农产品产地进行溯源的方法目前已有部分报道[3]。虾蛄中的重金属不仅是其潜在安全隐患,还能有效反映其所所处海域重金属污染程度。因此,基于虾蛄体内重金属状况,可通过构建判别模型,对其来源海域进行溯源。在机器学习建模领域,神经网络具有出色的模式识别、关联记忆与泛化能力,本研究通过收集不同海域虾蛄中的重金属含量数据,作为信息输入,采用监督学习、模式识别的方法,建立BP神经网络模型,并对其进行优化,以此判别虾蛄的捕捞海域。

1 材料与方法

1.1数据采集

本建模数据来自2015年水产品质量安全专项监测(风险监测)统计数据。

表1 部分样本的铅、镉、无机砷含量原始数据Tab.1 Contents of Pb, Cd and As for part of the samples

监测工作对多批次来自渤海、东海、南海等海域的虾蛄样本进行了多项指标的检测分析,其中包括铅、镉和无机砷3项重金属。检测分别采用相对应的国标GB 5009.12—2010、GB/T 5009.15—2003和GB/T 5009.11—2003进行。共采集90组虾蛄的重金属含量数据及来源海域信息,每个海域样本数量为30个,样本采集地区基本覆盖我国主要海区,并包含雌、雄和各年龄段样本,具有典型性和代表性。

1.2BP神经网络的建立

本研究建立了前馈型BP神经网络模型。网络模型的建立、优化、训练及仿真,采用MATLAB 2015a附属的神经网络工具箱。将90组数据矩阵导入MATLAB工作空间,作为模型训练的输入。表示来源海域的目标矩阵作为模型训练的目标输出。全部建模数据按照54∶18∶18的比例分为训练集、验证集和测试集。训练集用于训练网络;验证集作为交互验证,对网络权值再次微调;测试集用于测试网络的真实判别能力。然后对网络的拓扑结构、各层激活函数以及训练算法进行设置。通过网络的权值迭代训练,建立输入矩阵与输出矩阵的关联模型,最后通过模型的仿真测试,获得判别分析的结果。

1.3BP神经网络的参数设置

建立神经网络模型的过程中,需要对各项参数进行设置。在前馈型神经网络的参数设置中,主要包括:隐藏层的层数设置、隐藏层神经元的数量设置、隐藏层和输出层激活函数的选择以及梯度下降训练的训练算法。

1.3.1 隐藏层的层数

由于本研究数据量与处理难度相对不大,属于深度较浅的机器学习算法,设置过多的层数并无太大意义。且并非深度越深的模型效果越好,大部分时候,过深的网络将导致学习效率的降低和明显过拟合[4]。因此选择传统的3层网络结构,即只有1层隐含层。当需要加强模型的学习能力时,优先考虑增加隐含层神经元的个数而非隐含层的层数。

1.3.2 隐藏层神经元数量的选择

在建立BP神经网络模型的过程中,隐含层神经元数量的选择是关键。神经元太少,模型的复杂度不足,导致网络学习能力不足,往往得到准确率较低的欠拟合模型。神经元过多,将导致模型的过度复杂化和学习效率的降低,最终的预测准确率反而下降。前馈型网络的隐藏层神经元数量的选择可以采用以下方法。

①根据经验公式:

n2=2n1+1

(1)

式中:n2—隐藏神经元的个数,n1为输入神经元的个数。计算出隐藏层神经元的个数,此方法简单易行。据此方法,本研究中隐藏层神经元的个数为7。

②根据ρ值的判定方法:

ρ=N/M

(2)

式中:N—样本数量,M—网络总权重和。

M的数值:

M=(I+1)H+(H+1)Q

(3)

式中:I、H、Q—分别为输入、隐藏、输出三层神经元数,ρ值的合理区间为1.4<ρ<2.2,通过计算得到表2,此方法下算得网络适宜的神经元数量为6、7或8[5]。

以上均为经验方法,实际建立网络时,采用上述方法计算大体区间,在此区间内选取不同神经元数分别建立模型,根据模型的判断准确率选定最终的隐藏层神经元数量。

表2 隐含层神经元数量与对应结果Tab.2 Numbers of neurons in the hidden layer and the corresponding results

1.3.3 激活函数的选择与训练算法的优化

激活函数也称传递函数,是网络层与层之间的重要枢纽。本研究设置的BP神经网络隐藏层激活函数为Sigmoid函数,而输出层激活函数为Softmax函数。Sigmoid函数对应logistic回归算法,而Softmax函数对应Softmax回归算法。Softmax算法是从logistic回归算法扩展的一种多分类算法,这点不同于一般的BP神经网络的设置,特别适用于多类判别模型的建立。

通过误差反向传播改变学习梯度是BP神经网络的核心,常用的训练方法包括δ学习规则、LM算法、贝叶斯正则化、量化共轭梯度法等[6-8]。本研究中采用量化共轭梯度的算法进行训练,更新权值和偏置。量化共轭梯度为自适应学习速率方法的一种,是介于最速下降法与牛顿法之间的一种方法,仅需利用一阶导数信息,克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算哈希矩阵逆阵的缺点,所需存储空间小,具有步收敛性,稳定性高,而且不需要任何外来参数。

2 结果

2.1模型结果与评价

为最终确定网络模型的结构,依次尝试了隐藏层神经元数量为6、7、8、9、10条件下网络的判别效果,每种模型结构均进行3次重复训练,取效果最好的训练结果(表2)。根据判别准确率,选取神经元数量为7,最终确定的网络拓扑图如图1所示。

图1 神经网络结构图Fig.1 Structure diagram of the neural network

模型的交互验证方式为早期停止算法,校正集误差连续6次迭代不再减小时,训练即停止,经过20次迭代的训练,网络的权值变动趋于稳定,梯度结果与迭代步数如图2所示。

2.1.1 混淆矩阵与判别正确率

模型对于训练集、验证集和测试集以及样本总体的判别准确率结果用混淆矩阵表示,展示了判别正确与错误的样本数量、比例。在人工智能中,混淆矩阵是可视化工具,常用于监督学习。

混淆矩阵的结果显示,54个训练集样本中,53个分类正确,1个样本分类错误,准确率为98.1%;18个验证集样本,17个分类正确,1个样本分类错误,准确率为94.4%;18个测试集样本中,16个分类正确,2个样本分类错误,准确率为88.9%。总计90个样本中,86个分类正确,4个样本分类错误,样本总体准确率为95.6%。

图2 梯度结果与迭代步数Fig.2 Gradient results and iterations

2.1.2 ROC曲线

ROC曲线,即接受者操作特征曲线,是用于评价分类器的常用指标。横纵坐标分别为模型判别结果的假阳性率和真阳性率,以代价对收益来表示模型的判别能力。曲线距离左上角越近,证明分类效果越好。AUC则表示ROC曲线的覆盖区域面积,AUC越大,分类效果越好。

图4为三类样本以及总体的ROC曲线图。本研究设置神经网络模型对于第三类(南海海域)样本全部判断正确,对于第一类(渤海海域)和第二类(东海海域)则相互有部分样本被错误判定到另一类别中。曲线总体接近方形的左上角,表示网络模型总体判别效果优异。各图曲线的AUC值则接近于1,训练集的AUC大于验证集和测试集,证明其判断准确率最高。

2.1.3 误差图

模型最终的输出矩阵与目标矩阵的差值即为误差矩阵。将误差矩阵中全部数值按大小依次排列,并分为20个区间,即为误差图。图5为网络模型误差柱状图,由图可见,实验误差具有随机性,最终270个误差值的分布基本符合一个均值为0、标准差较小及陡峭的正态分布。表明实验误差总体较小,通过核对误差矩阵,实验误差超过0.5的误差值为12个,对应4个错误判别的样本,错误率为4.4%。

图3 训练集、验证集、测试集和全集混淆矩阵Fig.3 Confusion matrixes of training set,validation set, test set and complete set

图4 训练集、验证集、测试集和全集ROC曲线图Fig.4 ROC curve graph of training set,validation set,test set and complete set

3 讨论

3.1BP神经网络的应用

BP神经网络将给定的目标输出作为线性方程的代数和来建立线性方程组,通过信息的正向传播和误差的反向传播,来调整权值,解得待求权并完善模型[6]。神经网络的广泛应用中,80%网络为BP网络或其衍生、优化形态的前馈型神经网络。

3.2结果与参数的选择

以基于BP神经网络的模式识别方法,建立了通过重金属含量来判别虾蛄来源海域的判别分析模型。三层神经网络模型的拓扑结构为3-7-3,即模型输入层为3个变量,隐含层神经元节点数为7个,输出层输出节点为3个。仿真结果表明,网络在本研究中的类别判定效果较好,能有效对虾蛄的来源海域进行溯源。最终的总体判别准确率为95.6%,测试集判别准确率为88.9%。网络分析无法做到完全正确的原因:一是铅、镉、无机砷3项特征未必能够包含各类别的全部信息;二是一定程度上存在离群的样本数据值,使得各个海域重金属含量存在交叉部分,而实验设计的算法中不包含剔除离群值的语句。

图5 误差柱形图Fig.5 Error Histogram

所选择的3项特征均为重金属含量,数值量纲相同,数值大小基本在同一数量级中。在实际建模过程中,尝试加入标准化处理的步骤。通过比较,数据是否进行标准化处理,对分类效果影响较小。故在建模过程中,跳过数据标准化处理步骤。如选择的各个指标数量单位不一致,或化学性质差异较大,则应考虑进行标准化数据处理。

本研究除了铅、镉、无机砷3项重金属数据,还包括样本总汞含量以及多环芳烃类含量。在实验特征指标的选择中,因绝大多数样本中总汞含量为0(或低于检出限),故放弃选取总汞作为特征指标。多环芳烃类物质因种类众多,含量高低不均,数值量纲不同等因素,未将其纳入作为建模指标。在后续工作中,若建立层次更深、模型复杂的网络模型,将更多因素、指标纳入建模数据集中,可以更好地对各个海域、各类产品进行溯源。

本研究着重分析了网络的优化参数。网络结构方面,网络隐藏层数的选择及隐藏层神经元数量的选择是关键点,除了以上提出的人工选择方法外,较高级的神经网络还可利用结构自适应算法。该算法拥有自我调节网络结构的能力,可提升网络的容错能力,减少人为的主观错误。

4 结论

不同区域海水及水产品中的各污染物含量之间存在着各种线性的、非线性的相关关系,且更多的是非线性的复杂相关。本研究展示了BP神经网络判别分析模型能够解析复杂体系中各元素的内在关联,以区分样品的来源,并据此进行有效追溯。在高度非线性系统中,神经网络模型将体现出较传统方法更优越的性能,而无需知道目标结果与各变量之间的具体相关关系。

[1] 孙珊,刘霞,谷伟丽,等.虾蛄对石油烃的生物富集动力学及安全限量[J].海洋环境科学,2014,33(3):361-365.

[2] 农业部渔业渔政管理局.2016中国渔业统计年鉴[M].北京:中国农业出版社,2016:44.

[3] 颜静,唐成,梁亚雄,等.柚子原产地溯源鉴定技术[J].食品科学,2014,35(4):248-252.

[4] 吴岸成.神经网络与深度学习[M].北京:电子工业出版社,2016:66.

[5] 许禄,邵学广.化学计量学方法[M].北京:科学出版社,2004:290.

[6] 刘冰,郭海霞.MATLAB神经网络超级学习手册[M].北京:人民邮电出版社,2014:159.

[7] 袁红春,胡倩倩,沈晓倩,等.基于神经网络的规则提取及其渔业应用研究[J].海洋科学,2014,38(9):79-84.

[8] 邵磊,肖志忠等.LM神经网络在鱼类胚胎保存抗冻剂毒性试验设计中的应用[J].实验与技术,2007.31(7):1-3,24.

[9] 汪翔,何吉祥,佘磊,等.基于NAR神经网络对养殖水体亚硝酸盐预测模型的研究[J].渔业现代化,2015.42(4):30-34.

[10] 堵锡华,朱锦锦,周荣婷,等.神经网络法应用于黄烷酮衍生物抗菌活性的理论研究[J].徐州工程学院学报(自然科学版),2016,31(3):17-21.

[11] 李燕军,朱建华,王万历,等.MATLAB在测绘数据处理中的优越性及应用[J].甘肃科技,2016,32(4):18-20.

[12] 王新安,马爱军,赵艳飞,等.基于径向基函数(RBF)神经网络的红鳍东方鲀体质量预测[J].水产学报,2015,39(2):1799-1805.

[13] 徐大明,周超,孙传恒,等.基于粒子群优化BP神经网络的水产养殖水温及pH预测模型[J].渔业现代化,2016,43(1):24-29.

[14] 宋协法,马真,万荣,等.人工神经网络在凡纳滨对虾养殖水质预测中的应用研究[J].中国海洋大学学报,2014,44(6):028-033.

[15] 郑建安.主成分和BP神经网络在粮食产量预测中的组合应用[J].计算机系统应用,2016,25(11):274-278.

[16] 张玉荣,付玲,周显青.基于BP神经网络小麦含水量的近红外检测方法[J].河南工业大学学报(自然科学版),2013,34(1):17-20.

[17] 王海英,曹晶,谢骏,等.基于L-M神经网络优化算法的池塘水色判别系统的初步建立[J].渔业现代化,2010,37(5):19-21,37.

[18] 楼文高.人工神经网络在水产科学中的应用[J].上海水产大学学报,2001,10(4):347-352.

[19] 王俊,刘明哲,庹先国,等.遗传算法优化的BP神经网络在EDXRF中对钛铁元素含量的预测[J].原子能科学技术,2015,49(6):1143-1148.

[20] 安生梅,吴启勋,吉守祥,等.基于近红外光谱概率神经网络的诃子产地鉴别[J].湖北农业科学,2014,53(20):4977-4979.

[21] ZOU CHUN FANG,HUANG LI JUAN.A new BP algorithm for network marketing performance evaluation of agricultural products[J].Journal of Applied sciences,2013,13(20):4332-4335.

[22] MO LIAN GUANG,XIE ZHENG.An improved BP neural network based on IPSO and its application[J].Journal of computers,2013,8(5):1267-1272.

[23] XIE LING.The heat load prediction model based on BP neutral network-Markov model[J].Procedia computer science,2017,107:296-300.

[24] ZHU QUAN YIN,PAN LU,YIN YONG HUA,et al.Influence on normalization and magnitude normalization for price forecasting of agricultural products[J].information technology journal,2013,12(15):3046-3057.

AmethodfortracingtheoriginalfishingseaareasforthecorrespondingmantisshrimpsbasedonBPneuralnetwork

LIYiguang,LIFengling,NINGJinsong,LULina,DUANYuanhui,GUWenyan

(YellowSeaFisheriesResearchInstitute,ChineseAcademyofFisherySciences, 266071China)

Mantis shrimp is one of the important economic aquatic products in China, which enriches the heavy metal elements in the environment. There is a significant difference in contents of heavy metal elements among mantis shrimps in different sea areas. And thus that the pollution status of fishing sea areas could be inferred according to the contents of heavy metal elements in the corresponding mantis shrimps. That is to say, the origin sea area of shrimp mantis can be traced by the contents of heavy metal elements in it. The data of the contents of the three kinds of heavy metals in mantis shrimps from the corresponding three sea areas were used as the input to create a BP neural network discriminant analysis model, which can discriminate the origin sea area of the corresponding mantis shrimp samples after the well optimization of the models. The result showed, using the trained neural network, 86 samples among a total of 90 can be discriminated correctly, the accuracy rate is 95.6%, of which, the accuracy rate by using the training sets is 98.1%, the accuracy rate by using the validation set is 94.4%, and the accuracy rate by using the test set is 88.9%. The results showed that the discriminatory analysis model based on BP neural network model can be used to analyses the relationship among the different elements with the nonlinear complex systems, so as to discriminate the samples and trace them effectively.

aquatic product; mantis shrimp; heavy metals; BP neural network; discriminant analysis; conjugate gradient

10.3969/j.issn.1007-9580.2017.05.008

2017-06-22

国家自然科学基金项目(41406122) ;黄海所基本科研业务费 (20603022015006)

李沂光(1987—)年,男,工程师,硕士,研究方向:水产品质量安全。E-mail: liyg@ysfri.ac.cn

李风铃(1980—)年,女,助理研究员,博士,研究方向:海洋生物。E-mail: lifl@ysfri.ac.cn

S934

A

1007-9580(2017)05-039-06

猜你喜欢

海域神经元准确率
遗落海域
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
埕岛海域海上独立桩拆除方案探讨
高速公路车牌识别标识站准确率验证法
跃动的神经元——波兰Brain Embassy联合办公
海军舰艇前往演戏海域
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制