APP下载

基于ABC—LSSVM的芹菜总黄酮提取量预测

2015-04-17曾燕王晓成新文

江苏农业科学 2015年1期
关键词:总黄酮芹菜预测

曾燕 王晓 成新文 等

摘要:针对传统的芹菜总黄酮含量测定过程复杂、时间长的问题,提出一种基于人工蜂群算法(ABC)优化最小二乘支持向量机(LSSVM)的芹菜总黄酮提取量预测方法。首先对标准人工蜂群算法进行改进,然后利用改进的人工蜂群算法对最小二乘支持向量机的核宽度和正规化参数进行寻优,最后对芹菜总黄酮的提取量进行预测。结果表明,该方法具有预测精度高、性能稳定的特点,有利于实现芹菜总黄酮提取量的网络在线预估和优化控制。

关键词:人工蜂群算法;最小二乘支持向量机;总黄酮;预测;芹菜

中图分类号: S126文献标志码: A文章编号:1002-1302(2015)01-0298-03

收稿日期:2014-09-25

基金项目:四川理工学院科研项目(编号:2013KY04);酿酒生物技术及应用四川省重点实验室开放基金(编号:NJ2011-09)。

作者简介:曾燕(1979—),女,四川自贡人,硕士,讲师,研究方向为人工智能。E-mail:zy261365@suse.edu.cn。芹菜是1年生或2年生的伞型花科植物,在15世纪被作为药食两用栽培植物引入中国。现代医学研究发现,芹菜茎、叶中含有丰富的黄酮类物质,具有清除自由基、抗氧化、抑菌、抗病毒、抗癌、抗肿瘤作用,对心血管疾病和肝病也有一定疗效[1-2]。从芹菜中提取黄酮类物质,生产具有抗氧化作用的天然保健产品,已成为农产品资源高效利用的研究热点[3-4]。

目前测定芹菜总黄酮提取量大多采用分光光度法、光谱法等方法,测定过程复杂、时间长、成本较高[5]。采用软件方法实现芹菜总黄酮提取量预测,是解决此类生物量参数难以实时在线测量和控制的有效方法[6]。近年来神经网络、支持向量机等预测技术越来越受到重视[7-8],其中神经网络技术对样本数据量要求高,应用受限;支持向量机预测技术虽然适用于非线性小样本数据,但其泛化能力有限,对异常样本敏感,在实际应用中容易出现大的预测偏差。最小二乘支持向量机技术提高了泛化能力,具有精度高、性能稳定的优点,可用于农业现代化应用中[9]。影响最小二乘支持向量机预测精度的重要参数指标是正规化参数和核宽度系数,传统的交叉验证确定法可保证较高的预测精度,但预测速度慢,限制了其实际应用。本研究采用改进的人工蜂群算法对最小二乘支持向量机的参数指标进行优化选择[10-11],避免了标准人工蜂群算法过早收敛问题,实现了芹菜总黄酮提取量的快速预测,以期对蔬菜黄酮类物质提取量的在线测量提供参考。

1算法基础

1.1最小二乘支持向量机

最小二乘支持向量机(LSSVM )对支持向量机(SVM)进行了改进,很好地解决了小样本、非线性、高维数的问题,提高了问题的求解速度和泛化能力。最小二乘支持向量机通过构建如下回归函数,将非线性问题转化为高维特征空间的线性估计问题。

f(x)=ωTφ(x)+b。(1)

式中:φ(x)是核空间映射函数;ω为权值向量;b为偏置量。

最小二乘支持向量回归算法就是求解如下约束优化问题。

minJ(ωξ)=12ωTω+12γ∑ni=1ξ2i;(2)

s.t. yi=ωTφ(xi)+b+ξi,i=1,2,…,n。(3)

式中:ξi为第i个样本真实值与预测值的误差;γ为可以动态调整的正规化参数。

可采用拉格朗日函数求解这个优化问题。

L(ω,β,ξ,α)=12ωTω+12γ∑ni=1ξ2i-∑ni=1αi[ωφ(xi)+b+ξi-yi]。(4)

式中:αi∈R(i=1,2,…,N)为Lagrange乘子。a和b的求解与核函数的选择有关,常选择如下形式的径向基核函数(RBF)。

K(xi,xj)=exp-|xi-xj|22σ2。(5)

式中:σ为核宽度。

由此可见,对于最小二乘支持向量机,核宽度σ和正规化参数γ是2个重要参数,它们的选取直接影响着算法的学习能力和泛化性能。

1.2人工蜂群算法的改进

人工蜂群算法(ABC) 模拟蜜蜂群智能搜索行为,具有控制参数少、算法简单等优点,受到国内外学者广泛关注。但是标准ABC算法局部搜索能力较差,容易产生早熟和停滞现象[11]。

改进标准ABC算法的随机初始化种群生成方式,采用反向学习[12]的初始化策略,确保初始种群的多样性,可以提高求解效率和改善解的质量。

首先,随机生成初始解集{xij|xij∈[minj,maxj]}、(i,j分别为解的个数和维度,minj,maxj分别为第j维的下界、上界)。然后,对每个初始解求出对应的反向解,计算方法如下。

xij=minj+maxj-xij。(6)

最后,对随机种群和反向种群的合集进行排序,选择适应度较优的解作为初始种群。

在标准ABC算法中,跟随蜂根据雇佣蜂种群适应度大小,按照轮盘赌策略选择1个雇佣蜂跟随,易导致群体多样性下降,算法过早收敛。采用“信息素-灵敏度”模型代替轮盘赌选择策略[11]。

信息素反映了解的质量,信息素的大小与目标函数值呈正比,每完成1次搜索过程,信息素进行动态更新。灵敏度确定搜索的区域方向。信息素和灵敏度相结合的方法如下。

p(i)=f(i)-fminfmax-fminfnax≠fmin

0p(k)≤s(i)。(7)

式中: f(i)为个体的适应度值;fmax,fmin为最大适应度值和最小适应度值;p(k)为不等于i的第k个食物源的信息素;s(i)为第i个跟随蜂的灵敏度:s(i)~U(0,1)。

“信息素-灵敏度”模型在一定程度上避免了算法陷入局部最优,保证了算法快速进化的方向。endprint

2预测建模

2.1芹菜总黄酮成分提取和测量方法

对于芹菜总黄酮的提取,首先将芹菜原料进行低温烘干,以降低机械粉碎的强度。将其粉碎后,称取芹菜干粉1 g于50 mL锥形瓶中,加入一定量乙醇浸泡,从而使有效成分充分溶解。然后将浸泡好的溶液投入超声波提取器提取,之后抽滤、定容,作为测定总黄酮含量的待测液,最后测定总黄酮含量。芹菜总黄酮的提取工艺流程如图1所示。

采用Al(NO3)3-NaNO2分光光度方法[4] 测定总黄酮含量。取上述样品液2 mL,用30%乙醇溶液定容至5 mL,加入15% NaNO2溶液0.3 mL,摇匀静置6 min,再加入10%Al(NO3)3 溶液0.3 mL,摇匀静置6 min后加入1 mol/L NaOH 溶液4 mL,再用蒸馏水定容,摇匀静置15 min后测定吸光度,根据吸光度计算样品液中总黄酮含量。由此可见,芹菜总黄酮提取测定过程复杂、时间长。

2.2基于ABC-LSSVM的芹菜总黄酮提取量预测模型

采用吸光度方法测定芹菜总黄酮提取量,由于测定过程复杂、时间长,制约了其生产应用。因此,构建芹菜总黄酮提取含量的预测模型,减少试验测量次数,实现在线实时预测尤为必要。基于ABC-LSSVM的芹菜总黄酮预测步骤如下:(1)对芹菜总黄酮提取试验中的相关数据进行归一化处理;(2)参数初始化,设置最大迭代次数,按反向学习策略生成初始解,计算适应度函数值;按适应度函数值优劣进行排序,排在前50%的为雇佣蜂,排在后50%的为跟随蜂;(3)对于第n步的雇佣蜂,记录最优值并展开邻域搜索,产生1个新位置;(4)雇佣蜂按贪婪选择方法,当搜索解优于记忆中的最优解时,替换记忆解,反之保持不变;(5)全部雇佣蜂完成邻域搜索后,跳摆尾舞与跟随蜂共享食物源信息;跟随蜂按公式(7)的选择机制选择雇佣蜂;(6)同(3)(4),跟随蜂记下种群最终更新后达到的最优适应度值以及相应的参数; (7)当跟随蜂的邻域搜索次数到达阀值而仍未找到更优位置时,侦察蜂重新初始化食物源位置;(8)如果满足停止准则,则停止计算,输出最优适应度值及相应参数,否则转向(3);(9)根据最优解得到的LSSVM参数对测试数据集进行仿真,用建立的芹菜总黄酮预测模型对总黄酮提取量进行预测。

3结果与分析

根据芹菜总黄酮提取试验,发现总黄酮提取量主要与提取时间、乙醇浓度、料液比等3个非线性因素的关系最为密切,三者之间的交互作用较小,且容易测量。因此,在5种料液比(1 ∶10、1 ∶20、1 ∶30、1 ∶40、1 ∶50, g ∶mL)、5种乙醇浓度水平(50%、60%、70%、80%、90%)、5种提取时间(10、20、30、40、50 min)条件下进行芹菜总黄酮提取的单因素试验。

在单因素试验基础上,选用L9(33)正交试验表,考察料液比、提取时间、乙醇浓度对芹菜总黄酮提取的影响。因素水平见表1。

表1芹菜总黄酮提取条件正交试验因素与水平

水平因素提取时间(min)乙醇浓度(%)料液比(g ∶mL)130701 ∶20240801 ∶30350901 ∶40

将试验所得的24例数据作为样本数据,在数据归一化之后,选取前16例试验样本数据作为训练样本数据,构建基于ABC-LSSVM的预测模型,再用后11例样本数据作为测试数据,对该模型进行验证。作为训练样本的16例原始数据如表2所示。

表2芹菜总黄酮预测模型训练样本数据

样品编号提取时间

(min)乙醇浓度

(%)料液比

(g ∶mL)总黄酮含量

(mg/g)140701 ∶106.472240701 ∶206.938340701 ∶307.296440701 ∶406.902540701 ∶506.830610701 ∶306.186720701 ∶306.400830701 ∶306.651940701 ∶306.9731050701 ∶306.9381140501 ∶304.2871240601 ∶305.2901340701 ∶306.5441440801 ∶307.4751540901 ∶307.1531640701 ∶206.207

在预测仿真试验中,计算机配置为联想双核E5800@3.2 GHz、2 G内存、Windows XP 操作系统,测试软件采用Matlab 7.0。

采用改进的人工蜂群算法优化最小二乘支持向量机得到的最优化参数值为:核宽度σ=262.22,正规化参数 γ=1 969.6。将基于ABC-LSSVM预测模型仿真得到的数据与实际测量数据进行比较,结果见表3。

表3基于ABC-LSSVM的芹菜总黄酮预测结果

样品

编号提取时间

(min)乙醇浓度

(%)料液比

(g ∶mL)实测含量

(mg/g)预测含量

(mg/g)相对误差

(%)140801 ∶307.486.95-7.08240901 ∶307.157.180.36330701 ∶206.286.564.50440801 ∶206.496.825.09550901 ∶206.607.087.23630801 ∶306.966.92-0.55740901 ∶307.217.18-0.43850701 ∶306.466.744.28930901 ∶407.077.212.031040701 ∶406.676.771.521150801 ∶407.357.03-4.37

由表3可知,采用ABC-LSSVM的芹菜总黄酮预测模型得到的仿真数据与实测数据的最大相对误差为7.23%,最小相对误差为0.36%,平均相对误差为1.14%,精度较高。实测数据与仿真数据的对比如图2所示。endprint

图3更直观地描述了模型估计值与实测值的相对误差情况。基于ABC-LSSVM的芹菜总黄酮提取量预测模型的进化曲线如图4所示,由图4可见,该预测模型收敛速度快、精度高、性能稳定。

4结论

芹菜总黄酮提取受提取时间、乙醇浓度、料液比等3种非线性因素的影响,可利用改进的人工蜂群算法优化最小二乘支持向量机建立芹菜总黄酮预测模型。在标准人工蜂群算法的种群初始化阶段,引入反向学习策略,确保了个体分布的均匀性,并用“信息素-灵敏度”模型作为选择策略,提高了预

测的精度和收敛速度,性能稳定,对于芹菜总黄酮提取的网络在线估计、降低测定成本具有重要意义。

参考文献:

[1]赵进,尤婷婷,林丹英,等. 超声波提取芹菜总黄酮及鉴别[J]. 时珍国医国药,2007,18(6):1454-1455.

[2]文开新,王成章,严学兵,等. 黄酮类化合物生物学活性研究进展[J]. 草业科学,2010,27(6):115-122.

[3]包丽芹,韩德权. 芹菜及芹菜黄酮的药用价值[J]. 黑龙江医药,2007,20(4):317-320.

[4]陈欲云,刘春丽,边名鸿. 芹菜黄酮抗氧化作用的研究[J]. 时珍国医国药,2012,23(7):1718-1719.

[5]何书美,乔兰侠,刘敬兰. 红外光谱法测定芹菜叶提取物中总黄酮的含量[J]. 分析科学学报,2008,24(2):201-204.

[6]俞金寿. 软测量技术及其应用[J]. 自动化仪表,2008,29(1):1-7.

[7]王红君,张梦,赵辉,等. 基于 BP 神经网络的温室黄瓜灌溉预测模型[J]. 江苏农业科学,2013,41(11):407-409.

[8]赵辰阳,徐明. 基于 FIG -SVM 的农产品价格趋势预测[J]. 江苏农业科学,2014,42(5):385-388.

[9]杨玮,孙红,郑立华,等. 基于土壤参数的冬小麦产量预测模型[J]. 农业工程学报,2013,29(23):118-123.

[10]朱林,陆春伟.基于改进蚁群支持向量机的氢含量软测量建模[J]. 计算机仿真,2014,31(3):384-388.

[11]王慧颖,刘建军,王全洲. 改进的人工蜂群算法在函数优化问题中的应用[J]. 计算机工程与应用,2012,48(19):36-39.

[12]汪慎文,丁立新,谢大同, 等. 应用反向学习策略的群搜索优化算法[J]. 计算机科学,2012,39(9):183-187. 谢雨杉,李多伟,李银芳,等. 碘试液比色法测定α-淀粉酶抑制剂活性[J]. 江苏农业科学,2015,43(1):301-303.endprint

猜你喜欢

总黄酮芹菜预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
芹菜也会“变脸”
亦食亦药话 芹菜
芹菜百合
不同提取方法对骨碎补中总黄酮含量的影响比较
食用芹菜六注意