基于SVM分类算法的纸基比色Hg2+浓度判别*
2021-11-24杨守志徐嘉阳刘宇宁杨婷婷谢文凯李剑君
杨守志, 徐嘉阳, 刘宇宁, 杨婷婷, 谢文凯, 李剑君
(生物医学信息工程教育部重点实验室 西安交通大学 生命科学与技术学院,陕西 西安 710049)
0 引 言
汞(Hg)是对人类最具危害的重金属之一,长期生活在Hg2+含量超标的环境中会引起脑组织损害、神经衰弱综合征以及严重的肝肾损伤等症状[1]。目前Hg2+检测已有很多方法,常用的检测方法主要有原子光谱法、电感耦合等离子体—质谱法、直接测汞仪等[2],但是这些方法由于仪器和检测费用昂贵、分析周期长等问题,难以用于食品环境安全的快速监测。近年来,纳米金颗粒(gold nanoparticles)因其性质稳定以及良好的光学性质常常应用于食品污染物的检测中[3]。将纳米金修饰到纸基上进行快速便捷的比色传感检测就是目前较热门的研究方向[4],如杜鹃等人基于基因(DNA)修饰的纳米金探针研制了一种可检测水溶液中Hg2+浓度的层析试纸条[5]。纳米金除了具有良好的光学特性,还具有过氧化物酶的性质,在H2O2存在的情况下,可催化3,3′,5,5′—四甲基联苯胺(3,3′,5,5′-tetramethylbenzidine,TMB)生成蓝色产物,在652 nm处产生特定吸收峰[6]。据目前文献报道,利用纸基比色反应检测Hg2+虽然快速,但只是“有”、“无”的定性分析,而无法利用颜色梯度变化等信息进行定量检测。
如何很好地解决这个问题,机器学习中的支持向量机(support vector machine,SVM)可对图片进行模式识别、分类以及回归分析[7]。洪茜等人利用SVM分类算法对于猪肉中四环素量进行分类分级[8],Wang H Q等人利用手机对比色结果进行观测[9]。
本文研究以上述纳米金催化H2O2和TMB的比色反应为原理,在修饰后的硫酸纸反应基底上滴加Hg2+和H2O2溶液,对产生了比色反应的试纸进行图像数据采集及预处理,利用SVM算法中的线性核函数对图像数据进行分类,从而对比色结果实现Hg2+低、中、高浓度等级评估。对相关参数进行优化后准确率可达93.3 %。在此基础上,开发了手机App,对比色结果进行实时拍照分析,其总体判别率也可达到91.1 %。为实现Hg2+浓度的等级评估提供了一种新型快速检测的方法。
1 材料与方法
1.1 实验材料
柠檬酸钠(Na3C6H5O7·2H2O,Aladin试剂有限公司);氯金酸 (HAuCl4·4H2O,国药集团化学试剂有限公司);氯化汞(HgCl2);3,3′,5,5′—四甲基联苯胺 (TMB);双氧水(H2O2,ω=30 %);氢氧化钠(NaOH,国药集团化学试剂有限公司);MILLI-Q超纯水(电阻值为18.2 MΩ·cm);硫酸纸若干张(爱卡乐,120 mg/m2)
1.2 实验仪器与设备
紫外可见分光光度计UV3600(岛津,日本);HH—1型数显恒温水浴锅(常州朗越仪器制造有限公司);梅特勒—托利多B-S天平(梅特勒—托利多仪器上海有限公司);漩涡式混合器(海门市其林贝尔仪器制造有限公司);透射电子显微镜(日本电子光学公司)
1.3 纸基Hg2+比色检测
1.3.1 纳米金球的制备
利用改进的柠檬酸盐还原法[10],制得吸收峰约为520 nm的纳米金球溶液。
1.3.2 纸基比色
按文献所示方式[6],取TMB粉末溶于乙醇中稀释,得到5×10-4mol/L的TMB溶液;将4 mL的5×10-4mol/L的TMB溶液、2.5 mL纳米金球溶液、2 mL配置好的Britton-Robison(BR)缓冲溶液、0.5 mL超纯水充分混合得到浸泡液。将1 cm×1 cm的硫酸纸置于浸泡液中浸泡10 min后,于60 ℃烘箱中烘烤10 min得到检测试纸。将50 μL不同浓度的Hg2+待测液和50 μL H2O2检测液滴加到检测试纸上,观测颜色变化。
1.4 图像采集和样品集划分
选取浓度范围分别为(0~1)×10-6mol/L,1×10-6~1×10-5mol/L 和1×10-5~1×10-4mol/L的Hg2+溶液进行比色检测,90 s后用手机进行图像采集,采集过程如图1所示。每个范围各重复15次操作并采集数据。
图1 智能手机采集图像过程
如表 1所示,实验共获得45张图片,对应高、中、低三类不同浓度范围的Hg2+浓度检测物的样本各15个。将采集数据的2/3作为训练样本,1/3作为预测样本进行验证。具体选择方式为从第三个数据开始,每间隔2个数据抽取一个数据作为预测集,余下的数据作为训练集,其中Hg2+浓度为(0~1)×10-6mol/L是低浓度;1×10-6~1×10-5mol/L是中浓度;1×10-5~1×10-4mol/L是高浓度,每种浓度各含有15个样本,其中训练样本10个,预测样本5个。
表1 样本中Hg2+含量统计结果
1.5 图像数据处理和分类器建模
在采集到比色图像之后,提取不同颜色特征组合作为分类特征并作为输入变量,建立SVM分类模型,预测其正确率。
本文研究构建了一个SVM分类器,用于判别Hg2+的浓度类别,将采用SVM中的C_SVC模型,选择不同的核函数类型,并选取合适的惩罚系数C和核函数参数g的值,以分类结果的准确率作为训练目标,得出最佳核函数类型及合适的参数,用6折交叉法进行验证[11]。
上述图像预处理的操作利用MATLAB R2019b实现,提取特征值和建立模型的操作利用OpenCV 3.4.1实现[12]。
2 结果与分析
2.1 Hg2+比色传感的评估
在最优反应条件下,取(400~2 000)nmol/L的系列浓度汞离子标准溶液与之反应,记录反应过程中652 nm处的紫外吸收光谱值。随着Hg2+浓度的增加,颜色由无色变为蓝绿色,吸光度与Hg2+浓度呈正相关(如图2所示),相关系数为0.993 1。
图2 浓度为(400~2 000)nmol/L的Hg2+在652 nm处的吸光度
图3 干扰性离子检测结果
2.2 基于SVM算法的变量优选和结果预测
三个不同浓度等级Hg2+的纸基比色检测的结果如图4所示。
图4 纸基比色检测结果
将图像RGB值矩阵数据作为所提取的特征信息,为实现对Hg2+的浓度等级判别,选取高、中、低浓度的Hg2+实验数据各15组。将图片裁剪为40像素×40像素的大小,每组数据经过预处理后RGB平均值如表 2所示。
表2 不同浓度等级Hg2+ 检测样本实验数据
选用各个浓度等级中序号为3,6,9,12,15号作为测试集,其余为训练集,即共有30组训练数据和15组测试数据。训练模型的过程中,采用6折交叉验证,在选取SVM的模型为C_SVM,且给定松弛系数ε=1×10-6的前提下,分别选用线性核函数、径向基函数(radial basis function,RBF)核函数、Sigmoid核函数和多项式核函数,惩罚系数C的取值范围为2-10~210,核函数参数g的取值范围为2-10~20,通过C和g的不同取值,找出准确率最高时对应的参数,确定不同核函数对应的最高准确率及相应的最优参数,如表3所示。
表3 不同核函数对应的最高准确率及相应的最优参数
可见,线性核函数和多项式核函数的模型的预测准确率均为93.3 %,明显优于其他核函数。由于取得最高准确率时,多项式核函数的阶数degree为1,退化为线性核,故在本测试中,线性核和多项式核函数可以达到的准确率相同。因此,最终确定选用SVM的模型及最优参数为:用线性核函数,且C=0.1,g=1。以最优参数完成模型训练,对测试集进行预测,结果如表4所示。预测结果正确率总体较高,表明此模型取得了较好的训练结果。
表4 SVM 分类实验统计结果
2.3 Hg2+比色检测应用软件开发
基于上述研究结果,利用Android Studio平台开发手机应用(App)[13],软件设计流程及界面如图5和图6所示。本应用软件提供历史检测记录功能以方便用户评估近期的Hg2+检测情况,间接反映用户近期Hg2+污染现状。
图5 手机App具体操作流程设计
图6 手机App操作与结果显示界面
使用该软件对高、中、低三种浓度各15组进行浓度判别,如图7所示,判别准确率分别为86.7 %,93.3 %和93.3 %,总体判别准确率为91.1 %。
图7 手机App判别Hg2+浓度的结果
3 结 论
本文将SVM算法应用于Hg2+比色分析检测的研究中,并开发了相应的手机App,对水体中的Hg2+的含量进行低、中、高浓度等级评估。
本研究验证了Hg2+浓度和TMB氧化反应的比色结果在650 nm处的紫外吸收光谱的吸收峰值呈良好的线性关系,相关系数(R2)为0.993 1。确定了SVM分类器的核函数为线性核及最优参数C=0.1,g=1,基于上述SVM分类器,开发了新型检测手机App,用户通过拍照上传比色结果图,就可以快速分析Hg2+的浓度等级,识别准确率可达91.1 %。本文研究结合产品便携化的发展趋势和机器学习研究热点,在Hg2+浓度判别研究领域实现了较高的选择特异性和判别准确率,为实现快速简便地检测食品内含残留物提供技术支持和思路,具备良好的社会意义和经济价值。