APP下载

基于高光谱成像的茶叶中EGCG分布可视化

2018-04-11李晓丽魏玉震赵章风

农业工程学报 2018年7期
关键词:波段茶树光谱

李晓丽,魏玉震,徐 劼,赵章风,钟 江,何 勇※



基于高光谱成像的茶叶中EGCG分布可视化

李晓丽1,魏玉震1,徐 劼2,赵章风3,钟 江3,何 勇1※

(1. 浙江大学生物系统工程与食品科学学院,杭州 310058; 2. 嘉兴学院生物与化学工程学院,嘉兴 314001; 3. 浙江工业大学机械工程学院,杭州 310014)

针对目前关于表没食子儿茶素没食子酸酯(epigallocatechin gallate,EGCG)在茶叶中的分布缺乏可视化表达问题,该文采用高光谱成像技术以实现EGCG在茶叶中的分布可视化。通过高光谱成像仪采集茶叶的光谱信息,按照标准方法HPLC(high performance liquid chromatography)法测量茶叶的EGCG浓度。运用化学计量学方法建立光谱与EGCG浓度之间的回归模型。为寻求相对较优的模型效果,对光谱进行不同的预处理,以确定最优的预处理方法;采用4种建模方法建立回归模型,以确定最优的建模方法;对光谱进行特征波段选择,以降低数据冗余提高模型的稳定性和运算速度。最后,将高光谱图像中像素点对应的光谱变量导入模型,从而生成EGCG浓度分布图。结果表明:可见-近红外光谱与EGCG浓度之间具有很强的相关性,其回归模型的决定系数达到0.905,利用高光谱成像技术对茶叶中EGCG分布进行可视化可行。通过对不同品种、叶位的茶叶中EGCG浓度分布进行可视化,能够为高EGCG浓度茶树品种的培育、EGCG代谢规律的分析以及茶树采摘部位的识别提供有效手段。

作物;光谱分析;图像处理;模型;茶叶;高光谱成像;EGCG;分布可视化

0 引 言

茶多酚是茶叶中最主要的功能性物质,属于多元酚类化合物[1],约占茶叶干质量的18%~40%。其主要成分是儿茶素类化合物,约占茶多酚总质量的70%~80%。在各儿茶素类化合物中,一般又以EGCG(epigallocatechin gallate)含量最高,约占儿茶素总量的50%~60%[2]。研究表明EGCG具有较强的抗氧化活性,能够提高免疫力[3],对糖尿病、前列腺疾病、帕金森病、阿兹海默症和中风等有一定的防治功效[4],此外,EGCG还能够抑制癌细胞的产生[5]。由于EGCG对人体有诸多益处,并且EGCG不能人工合成,主要依靠茶叶代谢产生[6],因此,EGCG含量是衡量茶叶品质的一个重要指标。

目前测定EGCG浓度的常用方法是高效液相色谱法(high performance liquid chromatography,HPLC)[7],该方法存在操作复杂和耗时长的缺点。而光谱信息能够反映物体的内部特征,为实现非接触快速检测提供理论基础[8],基于光谱的茶叶品质快速无损检测技术也因此得到发展[9],Bian等[10]利用反射光谱预测茶粉、茶叶和冠层中的茶多酚、游离氨基酸和可溶性糖等重要内含物的含量,李晓丽等[11]运用漫反射光谱对绿茶中含水率进行检测,余涛等[12]利用可见近红外光谱分析茶叶中叶绿素、茶氨酸、茶多酚的含量,Zhao等[13]运用红外光谱技术测量茶叶中的EGCG含量,但针对的是成品茶,且没能实现可视化。因为,仅利用光谱信息只能反映出内含物的类别及浓度高低,无法体现内含物在空间分布上的特征。

高光谱成像技术同时获取光谱信息和图像信息,能够实现内含物分布的可视化表达,在农作物[14]和农产品质量[15]检测方面有着广泛的应用。Yu等[16]利用高光谱成像技术实现了氮素在尖椒根、茎和叶中浓度分布的可视化,为直观分析尖椒植株的生理状态提供了依据;孙俊等[17]以生菜叶片作为研究对象,利用高光谱成像技术实现了氮素在其叶片中的可视化,为生菜的精准施肥提供有效的参考信息;丁希斌等[18]利用高光谱成像技术对油菜叶片SPAD值的可视化进行研究,为评估油菜的光合作用提供了有效手段;赵艳茹等[19]为研究南瓜叶片在霜霉病胁迫下的叶绿素变化机制,利用高光谱成像技术实现了不同病害期的叶绿素分布可视化,为判别霜霉病疫情提供了理论基础。关于高光谱成像技术应在茶叶品质检测方面的研究,Chen等[20]利用高光谱成像技术对茶叶品质进行分级,方案首先对高光谱图像进行主成分分析,然后提取主成分图像的纹理特征作为输入变量建立模型,取得了良好的分级效果;Sohara等[21]采集茶叶嫩梢的高光谱图像,提取嫩梢的平均光谱,建立了光谱与主要儿茶素单体浓度之间的回归模型,没有充分利用图像信息。尽管高光谱成像技术在可视化检测方面已有诸多应用,但关于EGCG浓度分布可视化的研究还未见报道。

茶树的代谢主要分为碳代谢和氮代谢,EGCG属于次级碳代谢产物[1]。研究EGCG在茶树不同部位的分布规律,尤其是在不同叶位中的分布规律,对指导茶叶的生产具有重要意义。文献[22]以龙井43茶树作为研究对象,系统地研究了叶位对碳、氮代谢的影响,并计算了主要代谢产物之间的相关性。结果显示,茶多酚含量在第1至6叶位中呈现递减趋势,总氨基酸含量呈先上升后下降的趋势。且EGCG与总氮含量的相关系数为0.966,呈强相关性,但文中并未解释相关机理。近红外光谱进行有机物定性定量分析基础是有机物的C-H、N-H和O-H有强烈的光谱响应特性[23],而EGCG并不含有氮元素,EGCG的定量检测主要基于C-H和O-H基团的光谱响应特性,因此茶叶中EGCG的高光谱图像检测不应直接取决于EGCG与总氮之间的相关性,尽管基于高光谱成像技术的氮素可视化已经在一些作物上成功实现[16-17]。文献[22]只针对一个品种的茶树,缺乏品种之间的比较;对于EGCG的分布状况只有统计上的数字描述,不够直观形象。

因此,本文选取3个茶树品种作为研究对象,利用高光谱成像技术实现EGCG在不同叶位中的分布可视化,为分析茶树的代谢情况,培育高EGCG浓度的茶树提供直观有效的方法。另外,鉴于茶树嫩梢和老叶在EGCG含量上存在显著差异[24],EGCG在茶树中的分布成像还可以为茶树嫩梢的自动识别和名优茶采摘标准的制定提供思路。

1 材料与方法

1.1 样本制备

试验研究的3个茶树品种分别为菊花春(Juhuachun)、迎霜(Yingshuang)和浙农25(Zhenong 25),茶树种植于浙江大学华家池校区试验茶园内(120.206 E,30.274 N),叶片采摘于2016年9月27日。采摘时,依次摘取嫩梢顶芽至鱼叶之间前6个叶位的叶片,如图1所示。每个品种的每个叶位各设置9个重复,共得到162个样本(3个品种×6个叶位×9个重复)。

图1 茶叶嫩梢叶位示意图

1.2 高光谱图像获取系统

本研究采用的高光谱成像仪结构示意图如图2所示,系统主要由暗箱、高光谱相机、镜头、线光源、步进电机和计算机等部件组成。系统的图像分辨率为672×512像素,光谱分辨率为2.8 nm,光谱范围为380~1 030 nm,包含512个波段。在采集高光谱图像时,移动平台的速度设置为3 mm/s,相机的曝光时间设置为75 ms。

图2 高光谱成像系统示意图

1.3 高光谱图像的校正

在获取高光谱图像之前,需要采集白板和暗电流的校正信息,首先将白色校正板(聚四氟乙烯材料制成)放置在镜头正下方以获得白色标定图像(反射率接近100%),然后关闭光源并盖住镜头得到暗电流图像(反射率接近0%)。按如下公式进行校正。

式中0为原始高光谱图像,I为校正后高光谱图像。通过校正,可以有效减少光照不均匀和暗电流对高光谱图像的影响。

1.4 EGCG浓度值的测定

叶片采摘后,随即被放入含有冰袋的保温箱中,然后在2 h内采集光谱。采集完光谱后,叶片被放入-80 ℃冰箱中,以尽量减少其离体后EGCG的变化。由于单个叶片质量较小,因此将每个品种每个叶位的3片叶子作为1个样本进行测量。样本的处理过程为:将样本放入冷冻干燥机(冻干温度:-40 ℃,真空度:0.12 mbar;FreeZone®Triad™2.5L 型,LABCONCO公司,美国),冷冻干燥24 h;用研磨仪(振动频率:75 Hz,研磨时间:30 s;FW100型,泰斯特仪器有限公司,天津)将干燥后的茶叶研磨成粉末状,粉末过40目筛(筛孔尺寸:0.425 mm),每组样本称取0.1 g的过筛粉末放入具塞试管;向具塞试管中加入25 mL纯水,85 ℃水浴加热20 min,使用10m水系滤膜过滤后获取EGCG水溶液;采用高效液相色谱仪(HPLC仪型号为日本岛津LC-20AD,混合浓度准确度:<0.5%,流量准确度:1%或2L/min其中较大值以内)测定EGCG浓度。

HPLC试验的相关参数如下:流动相A为醋酸:乙腈:高纯水(0.5∶3∶96.5),流动相B为醋酸:乙腈:高纯水(0.5∶30∶69.5),通过将流动相A和B的溶剂组成设置成不同的比例,以调节流动相极性,使样品中具有不同极性的组分依次溶解出来;洗脱梯度:0~35 min,流动相B由20%线性增加至65%,35~45 min流动相B维持65%;流动速度:1 mL/min;检测波长:280 nm;进样量:10L;柱温:35 ℃。

根据保留时间和峰面积大小计算EGCG浓度。EGCG标准品(用于确定出峰时间和标准曲线)购买于成都植标化纯生物技术有限公司,纯度≥98%。

1.5 数据处理

1.5.1 光谱提取与预处理

使用HSI Analyzer(ISUZU optics,中国台湾)软件对高光谱图像进行白板与暗电流校正。然后,利用ENVI 5.1(Exelis VIS,USA)软件分析叶片和背景的光谱特征,确定分割阈值,将背景置0。为与化学值对应,以每个样本的3片叶子作为1个ROI(感兴趣区域,region of interest),计算ROI中所有像素点的平均光谱作为建立模型的光谱数据。

随机噪声污染和基线漂移是光谱采集时常遇到的问题[25],针对这2个问题,本文分别使用SG(Savitzky- Golay)平滑[26]、基线校正(baseline correction,BC)[27]以及这2种方法的混合预处理。通过对比不同预处理方法的建模效果,确定最佳的预处理方法。

1.5.2 样本划分

为了构建稳定的回归模型,需要对样本进行建模集和预测集的划分。合理的样本划分方法应满足2个基本条件:1)建模集的浓度范围应大于预测集的浓度范围;2)建模集和预测集的浓度值应均匀分布。因此,本研究对各品种及叶位的9个样本按照EGCG浓度进行降序排列,然后选取第2、5和8序号的3个样本作为预测集,其余6个样本作为建模集,共得到建模集样本108个,预测集样本划分样本54个;分别计算建模集、预测集和总体样本的均值、最大值、最小值和标准偏差,评估样本划分是否合理。

1.5.3 建模方法与模型评价

样本划分后,本研究使用主成分回归(principal component regression,PCR)、偏最小二乘回归(partial least-squares regression,PLSR)、径向基函数神经网络(radial basis function neural network,RBFNN)和最小二乘-支持向量回归(least squares support vector regression,LS-SVR)4种常用建模方法。

PCR和PLSR均广泛运用于化学计量学领域[28],所不同的是,在提取光谱变量的主成分(principal components,PCs)时,PCR只对光谱矩阵进行分析,而PLSR则同时综合考虑光谱矩阵和浓度矩阵。RBFNN和LS-SVR都是将低维模式的输入数据转换到高维空间内,RBFNN由输入层、隐含层和输出层组成,能够逼近任意非线性函数,克服了BP神经网络的局部极小值问题[29]。LS-SVR采用最小二乘线性系统作为损失函数,用等式约束代替SVM中的不等式约束,具有计算复杂度低,求解速度快的优点[30]。

建立样本平均反射光谱(按照1.5.1节所述方法获取)与EGCG浓度的回归模型之后,以预测集决定系数R2(determination coefficient of prediction set)和预测集均方根误差RMSEP(root mean square error of prediction)作为模型性能的主要评价指标,以建模集决定系数R2(determination coefficient of calibration set)和建模集均方根误差RMSEC(root mean square error of calibration)作为辅助评价指标。以验证集实测值的标准偏差与预测均方根误差的比值RPD(residual prediction deviation)作为模型预测性能的评判指标,且RPD值越大越好。

1.5.4 特征波段提取

原始的高光谱数据信息维度高,输入变量较多,容易出现共线性和数据冗余问题,为简化模型和提高模型稳定性,需要对全波段进行特征波段的选取,本研究采用连续投影算法SPA(successive projection algorithm)[31]进行特征波段选取。

SPA是一种前向循环选择方法,它从一个波长开始,每次循环都计算它在未选入波长上的投影,将投影向量最大的波长引入到波长组合。每一个新选入的波长,都与前一个线性关系最小,从而降低信息冗余,提取特征波长。最后,对每一次循环所提取的变量,分别建立多元线性回归模型,得到建模集交互验证均方根误差(RMSECV),最小的RMSECV值所对应的特征集即为最优特征波长集。

1.5.5 EGCG可视化分析

在建立合适的光谱-EGCG浓度的预测模型后,将每个像素点对应的光谱导入预测模型,可计算出各像素点的EGCG浓度值,从而生成EGCG在茶叶中的浓度分布。

2 结果与分析

2.1 叶片EGCG浓度统计分析

利用HPLC法测得的茶叶EGCG浓度值如图3所示,对于3个品种茶树而言,其第一叶位的EGCG浓度均明显高于其他叶位。对于不同品种的茶树,其EGCG在含量和分布规律上明显不相同。菊花春的第1至3叶位,叶片的EGCG浓度呈逐渐降低的趋势,而第4至6叶位则是先上升后下降;浙农25的第1至6叶位,叶片的EGCG浓度呈现逐渐降低的规律;迎霜茶的第1至4叶位,叶片的EGCG浓度呈递减的趋势,第5至6叶位浓度基本相同。

对品种和叶位进行双因素方差分析,品种因素对应的值为3.979×10-32,叶位因素对应的值为2.842×10-40,品种与叶位交互对应的值为1.518e×10-29,所得到的值均远小于0.01。因此,品种和叶位对EGCG的浓度都有显著的影响,这为后文分析EGCG成像效果提供参考。

注:不同小写字母表示同一品种间各叶位之间差异显著。

2.2 光谱分析

图4为所有样本的光谱,380~420 nm区间光谱比较杂乱。提取380、400和420 nm单波段图像如图5所示,可以发现这些单波段图像不显示有效的信息,因此判定该区间为噪声区间。在后续的分析中,以420~1030 nm作为有效波段。光谱曲线550 nm附近的波峰为叶片中叶绿素的强反射区,650~700 nm处的波谷因为叶绿素强吸收导致,700~750 nm范围急剧上升,是因为叶片对近红外波段吸收较少。每条光谱的形状相似,但在反射强度上存在差异,这也从侧面说明茶叶的内部成分大致相同,但在含量上有所不同,为建立EGCG浓度预测模型提供了客观基础。

2.3 样本划分与光谱预处理

按照1.5所述划分方法进行样本划分后,对建模集和预测集的化学值进行统计分析,结果如表1所示,表中列出了建模集、预测集和全部样本的EGCG浓度值的最大值、最小值、平均值和标准偏差。由表1可以发现建模集的EGCG浓度范围覆盖预测集的浓度范围;不同样本集的EGCG浓度平均值较为相近,标准偏差也较为相近。因此,样本划分合理。

图4 全部样本光谱示意图

图5 部分高光谱图像的RGB图和单波段灰度图

表1 建模集和预测集的EGCG浓度值的统计分析

为验证不同预处理方法的效果,分别建立不同预处理方法处理后的光谱与EGCG浓度值的PLSR模型,结果如表2所示。由表可见未经预处理的光谱所建立的PLSR模型效果最好,说明原始光谱的随机噪声和基线漂移问题不明显,预处理反而会造成有效信息的损失。因此,后续的分析都基于未经处理的光谱进行。

表2 基于不同预处理方法的PLSR模型结果

4注:‘RMSEC’表示校正集均方根误差,‘2’表示校正集决定系数,‘RMSEP’表示预测集均方根误差,‘2’表示预测集决定系数,‘RPD’表示预测集实测值的标准偏差与预测均方根误差的比值,下同,

Note: ‘RMSEC’ means root mean square error of calibration set, ‘2’ means determination coefficient of calibration set, ‘RMSEP’ means root mean square error of prediction set, ‘2’ means determination coefficient of prediction set, ‘RPD’ means residual prediction deviation, the same below.

2.4 全波段建模分析

首先,选取建模集的反射光谱数据(420~1 030 nm范围,478个波段)作为自变量,对应的EGCG浓度值作为因变量,分别建立PCR、PLSR、RBFNN和LS-SVR模型,在建立PCR模型过程中,最优主成分数量为18,在建立PLSR模型过程中,最佳潜在变量数为12,在训练RBFNN过程中,径向基函数的扩展系数spread值为423,在建立LS-SVR模型的时,核函数选用径向基函数。全波段的建模效果如表3所示。

表3 基于全波段不同建模方法的建模结果

由表3可见,总体来说非线性建模效果优于线性建模,这说明光谱和EGCG浓度可能并不完全是呈现线性关系。LS-SVR模型优于RBFNN,这可能是因为LS-SVR方法的非线性映射能力更强[32]。鉴于LS-SVR方法的建模效果比其他3种方法好,为了简洁起见,在后续的分析中仅采用LS-SVR方法。

2.5 特征波段提取与建模分析

在建立全波段模型时,共有478个光谱变量,这些变量在提供丰富信息的同时,也导致信息冗余。为降低信息冗余和提高运算速度,采用SPA选取特征波长,共选取493,526,554,562,570,641和785 nm处的7个特征波长,特征波段的分布情况如图6所示,这些波段主要集中于可见光区,这是因为不同色泽的茶叶其化学成分的含量和组成是有差异的,这也反映在黄烷醇类化合物的含量和组成上,而茶叶中的儿茶素属于黄烷醇类化合物[2]。

图6 基于SPA选取特征波段在光谱曲线上的分布图

利用7个特征波段建立LS-SVR模型,模型采用径向基函数作为核函数,模型的预测集预测值与实测值的散点图如图7所示,模型的2值为0.905、RPD值为3.248,优于基于全波段的LS-SVR模型。且通过特征波段选择以后,建模的输入变量显著减少,由478个减少为7个,从而降低了模型复杂度。

图7 EGCG试验值与SPA-LS-SVR模型预测值的散点图

2.6 茶叶中EGCG浓度分布可视化

选取菊花春、浙农25和迎霜嫩梢叶片的高光谱图像进行成像分析,将每个像素点的特征波段输入SPA-LS-SVR模型,计算EGCG含量,生成叶片的EGCG浓度分布图如图8所示。

菊花春第1叶的EGCG浓度分布图最亮,第2叶比第3至6叶明亮,但明显比第1叶暗,第3至6叶的EGCG分布图差别不明显。浙农25第1至6叶的EGCG分布图的亮度呈现明显的递减规律。迎霜第1叶的EGCG分布图最亮,第2和第3叶次之,第4至6叶之间差别不明显。根据色谱柱的特点,颜色越亮对应的浓度值越高,图8与图3所示的规律基本一致。

总体来看,选取3个品种茶树嫩梢上的叶片都是第1叶EGCG分布图对应的浓度值最高,这一定程度上佐证了茶树体内的多酚类物质主要集中在茶树嫩梢生长旺盛的部位[33]。就单片鲜叶来看,主脉部位EGCG含量相对较低,这也印证了文献[34]的结论,即在茶叶中,除了主脉薄壁细胞外,大多数组织都有积累,其中以维管束和栅栏组织积累较多。

注:数字代表叶位数,每一列的叶片采自同一嫩梢。

3 结 论

本研究采用高光谱成像技术对茶叶中EGCG浓度进行定量检测,并基于该定量检测模型对不同叶位叶片中EGCG分布进行了可视化分析,从而为直观分析EGCG分布特征提供依据。主要结论如下:

1)文中研究了不同的光谱与处理方法、建模方法,对光谱进行特征波段提取,成功建立了光谱与EGCG浓度值的回归模型;

2)利用高光谱图像技术实现茶叶不同叶位的EGCG浓度分布可视化,为分析EGCG的代谢规律提供手段;

3)通过对不同品种茶树的EGCG浓度分布图进行比较,可以为茶叶品质的鉴定和高EGCG浓度茶树品种的培育提供直接依据;

4)所研究的3个品种茶树嫩梢的第1叶EGCG浓度显著高于其他叶位,鉴于不同叶位茶叶颜色相近,难以通过普通RGB图像识别,对EGCG浓度分布成像能够为茶叶采摘部位的识别提供思路。

[1] Nagle D G, Ferreira D, Zhou Y D. Epigallocatechin-3-gallate (EGCG): chemical and biomedical perspectives [J]. Phytochemistry, 2006, 67(17): 1849-1855.

[2] 宛晓春. 茶叶生物化学(第三版) [M]. 北京:中国农业出版社,2003.

[3] Higdon J V, Frei B. Tea catechins and polyphenols: Health effects, metabolism, and antioxidant functions [J]. Critical Reviews in Food Science & Nutrition, 2003, 43(1): 89-143.

[4] Khan N, Afaq F, Saleem M, et al. Targeting multiple signaling pathways by green tea polyphenol (-)-epigallocatechin- 3-gallate [J]. Cancer Research, 2006, 66(5): 2500-2505.

[5] Shankar S, Ganapathy S, Hingorani S R, et al. EGCG inhibits growth, invasion, angiogenesis and metastasis of pancreatic cancer [J]. Frontiers in Bioscience A Journal & Virtual Library, 2008, 13(2): 440-452.

[6] 王小萍,刘晓军,唐小波,等. 高EGCG含量茶的研究现状及发展趋势 [J]. 茶业通报,2009,31(3):108-110. Wang Xiaoping, Liu Xiaojun, Tang Xiaobo, et al. Research status and development trend of high EGCG content tea [J]. Journal of Tea Business, 2009, 31(3): 108-110. (in Chinese with English abstract)

[7] Liu J W, Li H Y, Shi R J, et al. Determination of content of EGCG and ECG in tea polypheenols by HPLC [J]. Science & Technology of Food Industry, 2010, 31(11): 372-374(in Chinese with English abstract)

[8] Gredilla A, Vallejuelo F O D, Elejoste N, et al. Non-destructive spectroscopy combined with chemometrics as a tool for green chemical analysis of environmental samples: A review [J]. Trends in Analytical Chemistry, 2016, 76: 30-39.

[9] 彭继宇,宋星霖,刘飞,等. 基于波谱技术的茶树生长与茶叶品质信息快速检测研究进展[J]. 光谱学与光谱分析,2016,36(3):775-782. Peng Jiyu, Song Xinglin, Liu Fei, et al. Fast detection of camellia sinensis growth process and tea quality Informations with spectral technology: A review [J]. Spectroscopy & Spectral Analysis, 2016, 36(3): 775-782. (in Chinese with English abstract)

[10] Bian M, Skidmore A K, Schlerf M, et al. Predicting foliar biochemistry of tea (Camellia sinensis) using reflectance spectra measured at powder, leaf and canopy levels [J]. Isprs Journal of Photogrammetry & Remote Sensing, 2013, 78(4): 148-156.

[11] 李晓丽,程术希,何勇. 基于漫反射光谱的初制绿茶含水率无损检测方法[J]. 农业工程学报,2010,26(5):195-201. Li Xiaoli, Cheng Shuxi, He Yong. Nondestructive measurement of moisture content of green tea in primary processing based on diffuse reflectance spectroscopy [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(5): 195-201. (in Chinese with English abstract)

[12] 余涛,胡波,孙睿,等. 茶叶光谱与叶绿素、茶氨酸、茶多酚含量关系分析[J]. 遥感技术与应用,2016,31(5):872-878. Yu Tao, Hu Bo, Sun Rui, et al. Analysis of the relationship between the tea spectrum and the content of chlorophyll, theanine and tea polyphenols [J]. Remote Sensing Technology and Application, 2016, 31(5): 872-878. (in Chinese with English abstract)

[13] Zhao J W, Guo Z M, Chen Q S. Near infrared spectroscopy determination of EGCG content in tea based on OSC and PLS [J]. Journal of Food Science & Biotechnology, 2008, 39(9): 3278-3297.

[14] Ahmed M R, Yasmin J, Mo C, et al. Outdoor applications of hyperspectral imaging technology for monitoring agricultural crops: A Review [J]. 2016, 41(4): 396-407.

[15] Liu D, Zeng X A, Sun D W. Recent developments and applications of hyperspectral imaging for quality evaluation of agricultural products: A review [J]. Critical Reviews in Food Science & Nutrition, 2015, 55(12): 1744-1757.

[16] Yu K Q, Zhao Y R, Li X L, et al. Hyperspectral imaging for mapping of total nitrogen spatial distribution in pepper plant [J]. Plos One, 2014, 9(12): e116205.

[17] 孙俊,金夏明,毛罕平,等. 基于高光谱图像光谱与纹理信息的生菜氮素含量检测[J]. 农业工程学报,2014,30(10):167-173. Sun Jun, Jin Xiaming, Mao Hanping, et al. Detection of nitrogen content in lettuce leaves based on spectroscopy and texture using hyperspectral imaging technology [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(10): 167-173. (in Chinese with English abstract)

[18] 丁希斌,刘飞,张初,等. 基于高光谱成像技术的油菜叶片SPAD值检测[J]. 光谱学与光谱分析,2015, 35(2):486-491. Ding Xibin, Liu Fei, Zhang Chu, et al. Prediction of SPAD value in oilseed rape leaves using hyperspectral imaging technique [J]. Spectroscopy & Spectral Analysis, 2015, 35(2): 486-491. (in Chinese with English abstract)

[19] 赵艳茹,余克强,李晓丽,等. 基于高光谱成像的南瓜叶片叶绿素分布可视化研究[J]. 光谱学与光谱分析,2014, 34(5):1378-1382. Zhao Yanru, Yu Keqiang, Li Xiaoli, et al. Study on SPAD visualization of pumpkin leaves based on hyperspectral imaging technology.[J]. Spectroscopy & Spectral Analysis, 2014, 34(5): 1378-1382. (in Chinese with English abstract)

[20] Chen Q. Estimation of tea quality level using hyperspectral imaging technology [J]. Acta Optica Sinica, 2008, 28(4): 669-674.

[21] Sohara Y, Ryu C, Suguri M, et al. Estimation of catechins concentration of green tea using hyperspectral remote sensing [J]. IFAC Proceedings Volumes, 2010, 43(26): 172-177.

[22] Li Z X, Yang W J, Ahammed G J, et al. Developmental changes in carbon and nitrogen metabolism affect tea quality in different leaf position [J]. Plant Physiology & Biochemistry, 2016, 106: 327-335.

[23] Cen H, He Y. Theory and application of near infrared reflectance spectroscopy in determination of food quality[J]. Trends in Food Science & Technology, 2007, 18(2):72-83.

[24] Lee J E, Lee B J, Hwang J A, et al. Metabolic dependence of green tea on plucking positions revisited: A metabolomic study [J]. Journal of Agricultural & Food Chemistry, 2011, 59(19): 10579-10585.

[25] Guo Y, Zhao X H, Zhang R, et al. The noise filtering and baseline correction for harmonic spectrum based on wavelet transform [J]. Spectroscopy & Spectral Analysis, 2013, 33(8): 2172-2176.

[26] Chen H, Tao P, Chen J, et al. Waveband selection for NIR spectroscopy analysis of soil organic matter based on SG smoothing and MWPLS methods [J]. Chemometrics & Intelligent Laboratory Systems, 2011, 107(1): 139-146.

[27] Liland K H, Alm Y T, Mevik B H. Optimal choice of baseline correction for multivariate calibration of spectra [J]. Applied Spectroscopy, 2010, 64(9): 1007.

[28] Ergon R. Reduced PCR/PLSR models by subspace projections [J]. Chemometrics & Intelligent Laboratory Systems, 2006, 81(1): 68-73.

[29] Huang G B. Extreme learning machine: RBF network case [C]// Siew C K. Control, Automation, Robotics and Vision Conference, 2004. Icarcv 2004. IEEE, 2012: 1029-1036.

[30] Li Y, Shao X, Cai W. A consensus least squares support vector regression (LS-SVR) for analysis of near-infrared spectra of plant samples [J]. Talanta, 2007, 72(1): 217-222.

[31] Araújo M C U, Saldanha T C B, Galvão R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics & Intelligent Laboratory Systems, 2001, 57(2):65-73.

[32] Reboreda M. Time estimation in injection molding production for automotive industry based on SVR and RBF [C]// Fernández-Delgado M. International Work-Conference on the Interplay Between Natural and Artificial Computation. Springer-Verlag, 2009: 509-518.

[33] Forrest G I, Bendall D S. The distribution of polyphenols in the tea plant (Camellia sinensis L.) [J]. Biochemical Journal, 1969, 113(5): 741-755.

[34] 刘亚军. 茶树酯型儿茶素合成途径及酚类物质积累特异性研究[D]. 合肥:安徽农业大学,2011.

Liu Yajun. Study on the Synthesis of Catechin and Accumulation Characteristics of Phenolics [D]. Hefei: Anhui Agricultural University, 2011. (in Chinese with English abstract)

EGCG distribution visualization in tea leaves based on hyperspectral imaging technology

Li Xiaoli1, Wei Yuzhen1, Xu Jie2, Zhao Zhangfeng3, Zhong Jiang3, He Yong1※

(1.310058,;2.314001,3.310014,)

EGCG (epigallocatechin gallate) is an important functional material in tea, and it is regarded as an indispensable index for evaluating the quality of tea as it’s of great benefit to health. With the difference of tea varieties and physiological parts of tea plant, the distribution of EGCG is different. Visualization of EGCG distribution contributes to analyze the distribution and metabolism of EGCG directly. However, no research on the visualization of EGCG distribution in tea leaves has been reported till now. This study took advantage of hyperspectral imaging technology and chemometrics method to realize visualization of EGCG distribution in fresh tea leaves. On the basis of visualization, distribution characteristics of EGCG between different tea varieties and different leaf positions were studied. The operation procedure of visualization was mainly divided into 5 steps: 1) Acquisition of physical and chemical information. To obtain the physical information, 486 fresh leaves from the 1stto the 6thleaf positions at the tender shoots of tea plants with 3 varieties were gathered first, hyperspectral images of these fresh leaves were collected by a hyperspectral imager, and then average spectral information used to build models was extracted from the hyperspectral images. To acquire the chemical information, the fresh leaves were freeze-dried, ground into powder, sieved and heated by water-bath to obtain the EGCG solution, and the EGCG concentration was determined through HPLC (high performance liquid chromatography) at last. 2) Samples division and spectral preprocessing. In order to divide the samples reasonably, an interval-extraction method was adopted to ensure the distribution uniformity of chemical values. All the samples were divided into calibration set and prediction set in a ratio of 2:1. Due to the limited performance of hyperspectral imager, obvious noise region of the spectra was eliminated first in order to avoid the interference to subsequent analysis. For 2 common issues during spectral acquisition, i.e. random noise and baseline drift, the SG (Savitzky-Golay) smoothing and baseline correction were performed. Through comparing different preprocessing methods, it was found that the unprocessed spectra showed the best performance. 3) Model establishment and analysis based on full efficient spectra. To determine the best modeling method, PCR (principal component regression), PLSR (partial least squares regression), RBFNN (radial basis function neural network) and LS-SVR (least squares support vector regression) models between full efficient spectra and EGCG concentration values were established respectively. The results showed that the nonlinear models had better performance, and by comparing the evaluation parameters of different models, LS-SVR was chosen as the best modeling method. 4) Model establishment and analysis based on feature bands. The full efficient spectra contain 478 variables, which carry rich information, and cause a collinear problem between variables at the same time. To reduce the data redundancy and the complexity of the model based on full efficient spectra, SPA (successive projection algorithm) was employed to select feature bands, and the LS-SVR model based on feature bands showed better performance compared with the LS-SVR model based on full efficient spectra, with theR2(determination coefficient of prediction set) and RPD (residual prediction deviation) that is the ratio of standard deviation of measured values to root mean square error of prediction set reaching 0.905 and 3.248 respectively. 5) Generation of EGCG distribution map. Inputting the feature bands of each pixel selected by SPA in the testing hyperspectral images into the SPA-LS-SVR model, the EGCG concentration of each pixel could be calculated, so the distribution maps of EGCG in fresh tea leaves were generated finally. This study proved that EGCG distribution visualization in fresh tea leaves can be realized by hyperspectral imaging technology and chemometrics method. Through the analysis of EGCG distribution between different tea varieties and different leaf positions, the distribution showed significant differences. This study provides an effective method for cultivation of tea plant variety with high EGCG concentration, analysis on the metabolism rule of EGCG and recognition of tea shoots.

crops; spetrum analysis; image processing; models; tea; hyperspectral imaging; EGCG; distribution visualization

李晓丽,魏玉震,徐 劼,赵章风,钟 江,何 勇. 基于高光谱成像的茶叶中EGCG分布可视化[J]. 农业工程学报,2018,34(7):180-186. doi:10.11975/j.issn.1002-6819.2018.07.023 http://www.tcsae.org

Li Xiaoli, Wei Yuzhen, Xu Jie, Zhao Zhangfeng, Zhong Jiang, He Yong. EGCG distribution visualization in tea leaves based on hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(7): 180-186. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.07.023 http://www.tcsae.org

2017-10-22

2018-03-08

国家自然科学基金(31771676);浙江省科技计划项目(2015C02008,2017C02027);浙江省公益技术应用研究计划项目(2014C32091);高校基本科研业务费专项资金项目(2015QNA6005)

李晓丽,四川广安人,副教授,博士,博士生导师,研究方向为茶叶品质快速无损检测。Email:xiaolili@zju.edu.cn

何 勇,浙江宁波人,教授,博士,主要从事数字农业与精细农业研究。Email:yhe@zju.edu.cn

10.11975/j.issn.1002-6819.2018.07.023

S571.1

A

1002-6819(2018)-07-0180-07

猜你喜欢

波段茶树光谱
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
茶树吸收营养物质的特性
高光谱遥感成像技术的发展与展望
平和白芽奇兰的修剪技术要点
茶树工厂化育苗的关键影响因子探析
幼年茶树如何定型修剪
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术