APP下载

基于多光谱成像技术快速无损检测紫花苜蓿人工老化种子

2022-08-05王雪萌何欣张涵宋瑞毛培胜贾善刚

草业学报 2022年7期
关键词:准确度区分光谱

王雪萌,何欣,张涵,宋瑞,毛培胜,贾善刚

(中国农业大学草业科学与技术学院,草业科学北京市重点实验室,北京 100193)

种子老化(seed aging)是指种子活力的自然衰退,即种子生活力逐渐减弱以至完全丧失的过程[1]。种子收获后随着贮藏时间的延长不可避免地发生老化,这是一个由量变到质变不可逆的生物学过程,不仅影响种子发芽和幼苗生长,而且对种质资源的保存、开发和利用都造成严重影响,甚至影响草地补播和建植水平[2-4]。种子老化一直是种子科学研究领域的热点,区分老化种子对保证种子质量及减少经济损失也具有重大意义。然而,不同老化程度的种子在外部形态上几乎没有差异。传统的老化种子检测方法是依据气味、颜色和饱满度等指标进行分选,具有一定主观性;常规的检测方法如发芽试验、四唑染色等[5],这些试验非常耗时,而且种子经过试验检测后无法保持原状,进而无法实现高通量和快速无损检测。

多光谱成像(multispectral imaging,MSI)技术是一种新型的分析检测技术,该技术结合了光谱技术和成像技术,可同时获取被测物的光谱信息和空间信息,具有简便、实用、检测成本低和无破坏性等优点[6]。由于多光谱成像技术具有实用性和探索生物材料内在特性的能力,目前已经广泛应用于不同种类的鉴定以及众多品质检测中[7]。比如,在种子检测和鉴定方面,多光谱成像技术已开始应用于种和品种测定[8-9]、种子活力和生活力检测[10-11]、种子健康检测[12-13]等领域。不同老化程度种子的内部信息及光谱信息间存在差异,所以多光谱成像技术在老化种子检测方面具有很大潜力。

紫花苜蓿(Medicago sativa)种子是我国最重要的牧草种子之一,其种子产量远高于其他多年生牧草[14]。除此之外,每年还需从国外进口大量的紫花苜蓿种子。紫花苜蓿种子的生产和交易给种子安全贮藏带来了压力,由于各种环境因素的影响导致种子在贮藏过程中不可避免地发生老化[15]。因此,本研究通过对不同人工老化程度的紫花苜蓿种子进行多光谱信息采集,根据其形态特征及光谱特征进行分类,提出了快速、无损鉴定老化种子的新方法,为老化种子的高效分选奠定了基础,提供了分析思路和方法。

1 材料与方法

1.1 试验材料和样品制备

试验材料“中苜2 号”紫花苜蓿种子由农业农村部牧草与草坪草种子质量监督检验测试中心(北京)提供,2017 年从内蒙古鄂托克旗赛乌素紫花苜蓿种子田收获。2019 年11 月,将种子含水量调至10%,分别置于铝箔袋内密封,于45 ℃、湿度100%条件的电热恒温水箱中进行3,6 和14 d 的人工加速老化处理后,放置于-20 ℃环境保存(图1)。2020 年,对未老化种子(CK)、老化3 d(A3)、老化6 d(A6)及老化14 d(A14)的4 组种子,各取100 粒进行多光谱数据采集。在区分老化和未老化种子的同时,将4 个处理组中的种子,分为发芽种子(G)和不发芽种子(NG)两个组别,进一步研究多光谱数据预测种子发芽的表现。

图1 4 组种子材料的多光谱RGB 成像Fig.1 RGB image of seeds in four groups by MSI

1.2 老化程度测定

发芽率、发芽势是常用且较为客观的反映种子生活力的指标,一般来说种子发芽率越高,种子活力就越高,其下降程度一般用来表示种子生活力的高低[16-17]。将多光谱采集后的种子按照编号,50 粒为一组置于培养皿中,设置8 个重复,进行纸上发芽试验,并每天监测各培养皿中的发芽情况。

1.3 多光谱成像系统数据采集

多光谱成像系统的主要仪器为VideometerLab(Videometer A/S,Herlev,丹麦),该仪器内部安装有19 个非均匀分布波长的单色发光二极管(light-emitting diodes,LED),波长分别为365,405,430,450,470,490,515,540,570,590,630,645,660,690,780,850,880,940 和970 nm,采集图像时经过大约5 s 的连续频闪,就可以得到一个立方体图像,同时产生19 个不同波长下的单色图像[7,18]。

采集光谱信息时,将4 个处理组的种子分别编号为1~100,25 粒为一组置于培养皿中放置在一个空心积分球下。在图像采集过程中,球体在采样台上闭合,创造光学闭合条件,从而完成图像信息的采集。在获取光谱图像时,主要的目标是种子,所以需要通过背景分割的方法去除背景。之后对图像进行分析处理,提取种子的形态特征和光谱特征等属性。形态信息主要包括面积、长度、宽度、长宽比、紧实度(compactness circle,compactness ellipse)、Beta shape a、Beta shape b、垂直偏度(vertical skewness)、颜色(CIELab)、饱和度、色调等指标。提取的光谱信息代表了从种子图像像素中计算的每个波长反射光平均强度。

1.4 多光谱数据分析

本研究利用种子的形态信息进行了老化种子和未老化种子以及不同老化程度种子间的形态分析;利用种子的光谱特征进行了平均光谱反射率、像素直方图等指标的区分;利用种子的形态和光谱的综合信息进行了主成分分析(principal component analysis,PCA)、线性判别分析(linear discrimination analysis,LDA)、支持向量机(support vector machines,SVM)和归一化标准判别分析(normalized canonical discriminant analysis,nCDA),并采用了Hold-Out Method 进行交叉验证。

PCA 作为一种探索性的多元分析技术,常用于高维数据的降维分析[19],是识别种子形态特征和光谱特征的模型,并具有将相似形态和光谱特征的种子进行区分的可能性,可用于提取数据的主要特征量。

SVM 主要用于解决模式识别领域中的数据分类问题,属于有监督学习算法的一种。SVM 的学习策略就是最小化类内观测距离,最大化类间观测距离[20]。种子随机抽样作为校准集和验证集,分别占总样本的70%和30%。模型的分类性能通过准确度、敏感性及特异性进行评估。一般来说,模型的性能主要是依靠准确度来判断的,使用准确度作为评价标准是因为很多时候敏感性和特异性并不能清晰地说明哪个分类器的效果更好[18]。

式中:TN 表示样本为未老化,预测为未老化;TO 表示样本为老化,预测为老化;FN 表示样本为老化,预测为未老化;FO表示样本为未老化,预测为老化。

LDA 算法是模型识别中的经典算法,LDA 的原理与SVM 是相同的。将数据在低维度上进行投影,投影后使每一种类别数据的投影点尽可能地接近,而不同类别数据的类别中心间距尽可能地大,即降维后保证最小化类内观测距离,最大化类间观测距离,使得样本在空间内具有最佳的可分离性。LDA 的分类性能也是通过上述的准确度、敏感性和特异性来评价的。

nCDA 法作为一种监督变换构建方法,可以将图像划分为具有不同光谱特征的感兴趣区域[7]。当不同老化种子具有不同的光谱特征时,将其采用不同的视觉标志来标记感兴趣的区域,用不同的层(老化和未老化种子相比时,老化种子为绿色层,未老化种子为红色层)来识别nCDA 变换的组,它们将作为两个不同的感兴趣区域出现在nCDA 变换的图像中,将数据结果转化为可视化分析图像[13]。

PCA、SVM 和LDA 分 别使用R 语 言中的FactoMineR、e1071和MASS包进 行分析 预测,nCDA 分析使用VideometerLab 4 软件中 的MSI-Transformation Builder。

2 结果与分析

2.1 老化种子发芽结果

纸上发芽试验结果表明,3 个不同老化程度(A3、A6 和A14)的种子发芽率均低于未老化种子,而且随着人工老化时间的增加,种子的发芽率和发芽势均呈现下降趋势(图2)。CK 的发芽率可以达到98%;A14的发芽率仅为45%。

图2 人工处理老化种子的发芽指标统计Fig.2 Germination index in artificially aged seeds

2.2 老化种子的多光谱形态特征分析

从不同老化程度种子的多光谱数据中,提取了14个与形态特征相关的指标信息。对3 个老化种子处理组(A3、A6 和A14)与未老化种子(CK)进行比较后,发现有10 个形态特征指标在组间呈现出显著或极显著差异(表1)。比如,面积、长度、宽度、紧实度椭圆、颜色指标(CIELab L*,CIELab A*,CIELab B*)和色调等均与CK 组差异显著。其中,有7 个指标是3 个老化处理组中共同的差异指标。

表1 老化种子和未老化种子的形态特征比较分析Table 1 Morphological features of aged seeds and non-aged seeds

利用多光谱技术采集的形态信息可以对老化种子和未老化种子进行简单的区分,但是不同老化程度种子间的形态指标差异并不大。对3 个老化处理组进行两两比较,发现A3 和A6 的种子只在CIELab A*指标上存在显著差异;而从A3 和A14 的种子对比来看,差异比较明显,在颜色参数L*、A*,饱和度和色调指标上均可看出差异(表2)。

表2 不同老化程度种子的形态特征比较分析Table 2 Morphological features of aged seeds for different days

2.3 老化种子光谱特征分析

本研究分析了不同老化程度紫花苜蓿种子在19 个波段下的光谱信息,发现各处理组间种子的平均光谱反射率具有相似的变化趋势(图3),在470~660 nm 处出现了明显的区别,此时CK 的平均光谱反射率最高,其次是A6、A14 和A3;在660 nm 之后的波段,可以观察到平均光谱反射率发生了变化,反射率最高的是A14,其次是A6、A3 和CK。

图3 19 个波长下不同老化程度种子的平均光谱反射率Fig. 3 Reflectance of 19 wavelengths in aged seeds for different days

根据种子的平均光谱反射率分布情况,选取了两个中间区段的波长(515 和590 nm),以及两个两端的波长(365 和970 nm),进行像素直方图分析(图4)。515 和590 nm 这两个波长刚好位于可见光波段(400~760 nm),结果表明不同老化程度种子在这两个波长条件下Y 轴像素值差异较大(图4A,B)。365 和970 nm 的像素直方图中,老化种子与未老化种子之间存在差异;而且不同老化程度种子(A3、A6 和A14)间仍然存在差异,但是信号峰的顺序正好相反,比如在图4C 的A3 vs A6 中,蓝色A3 峰出现在黄色A6 峰的右边,但是在图4D 中顺序相反(图4C,D)。

图4 老化种子的像素直方图Fig.4 Pixel histogram of aged seeds

2.4 老化种子的多元分析

基于上述多光谱数据表现出来的差异,对4 个处理组开展了多元分析,进一步对样品的多光谱数据进行分类和预测。首先,将CK 与其他3 个老化组进行比较,之后在3 个老化组间进行了相互比较,共得到6 组对比数据。基于形态和光谱综合数据,开展PCA 分析提取出前两个主成分(图5),它们分别解释了6 个对比组原始方差的59.1%(CK vs A3),60.7%(CK vs A6),60.4%(CK vs A14),58.3%(A3 vs A6),58.0%(A3 vs A14)和59.1%(A6 vs A14)。然而,PC1/PC2 二维图均未能很好地区分开不同老化程度种子,所以PCA 无法准确区分老化和未老化种子。SVM 在区分老化和未老化种子时,平均准确度分别为94.9%(CK vs A3)、92.4%(CK vs A6)和92.4%(CK vs A14),同时能够得到较高的敏感性(95.2%~97.0%)和特异性(88.7%~92.8%);然而,对于不同老化程度种子的区分效果相对较差,准确率在68.7%~78.8%(表3)。LDA 模型区分老化种子和未老化种子的准确度高达97.7%(CK vs A3)、93.0%(CK vs A6)和97.3%(CK vs A14);而且具有很高的敏感性(95.6%~99.3%)和特异性(90.5%~96.8%)(表3)。

图5 不同老化程度种子基于形态和光谱数据的PCA 分析结果Fig.5 PCA plot based on morphological and multispectral data in aged seeds for different days

相对SVM 来说,LDA 在区分不同老化程度种子时,得到了更好的分类效果(表3),准确度分别为91.7%(A3 vs A6)、82.8%(A3 vs A14)和75.3%(A6 vs A14),同时也能够获得较高的敏感性(73.0%~94.4%)和特异性(78.2%~88.3%)。nCDA 以CK 为基准,区分A3、A6 和A14 的准确度分别为94%、88%和90%(表4)。

表3 种子老化及发芽情况的多元分析Table 3 Discrimination of aged and germinated seeds based on multivariate analysis(%)

表4 老化种子nCDA 预测结果对应实际发芽情况统计Table 4 The prediction of aged and germinated seeds in aged seeds based on nCDA

综合比对PCA、SVM、LDA 和nCDA 模型,发现LDA 模型在老化种子区分中的效果最佳。

2.5 种子发芽情况的多元分析

在进行区分老化和未老化种子分析之后,进一步研究了多光谱数据预测种子发芽的表现。将4 个处理组中的种子,分成发芽种子(G)和不发芽种子(NG)两个组别,利用多光谱仪器得到的形态数据和光谱数据重新建立判别模型。经PCA 提取前两个主成分后,解释了原始方差的62.7%(图6),但是PCA整体区分效果仍不适合应用于种子发芽鉴定。SVM在区分G 和NG 中的平均准确度为92.1%;相比之下,LDA 是区分种子发芽的最佳模型,准确度达到了98.7%,敏感性(98.0%)和特异性(99.3%)也非常高(表3)。利用部分已知的发芽种子和不发芽种子分别作为红色和蓝色标准样品进行分层,种子的多光谱经nCDA 算法转换后,可以利用种子转换后的颜色,来甄别种子是否可以发芽(图7)。随老化时间的增加,nCDA 图像中红色种子的数量越来越少,蓝色种子的数量增加,即随老化处理时间的增加,能够发芽的种子数量越来越少,比如,A14 中蓝色种子的数量明显多于A6(图7)。将nCDA 转换图像和实际发芽情况进行比对,发现nCDA 对种子发芽预测准确度达到了90%~99%(表4)。

图6 种子发芽情况基于形态和光谱数据的PCA 分析结果Fig. 6 PCA plot based on morphological and multispectral data in germinated and non-germinated seeds

图7 老化种子的nCDA 图像与实际发芽情况比对图Fig.7 nCDA image of aged seeds vs actual germination

综合比对PCA、SVM、LDA 和nCDA 模型,发现LDA 模型在种子发芽情况的区分中效果最佳。

3 讨论

通过目测的方法区分紫花苜蓿老化和未老化种子是非常困难的,所以可以采用一种快速、直观的方法对老化种子进行区分。一个物种存在固有的形态和光谱特征,可以利用这些特征数据来区别物种内或物种间的类别。这是多光谱成像技术可以作为种子分类工具的基础[9,18]。大多数研究表明,种皮在老化过程中颜色变深[21-22],所以传统方法常依据色泽等指标对老化种子进行评判[23],但是这种方法的主观性较强。多光谱颜色指标(CIELab L*,CIELab A*和CIELab B*)能够区分人眼不可察觉的颜色变化,消除视觉区分的主观性[5]。通过多光谱对形态数据的采集,可以发现老化种子和未老化种子间CIELab 指标存在显著差异。李振华等[24]发现CIELab 颜色指标可以实时定量监测蒴果(capsule)的发育过程,辅助预测种子活力变化。但是CIELab 仅仅反映种子的颜色属性,因此在下结论时需要多指标综合考量。除此之外,在本研究中还发现了老化种子的面积、长度和宽度这3 个形态指标显著高于未老化种子[25]。

老化过程会改变种子的形态特征和化学成分[26]。研究表明,种子老化过程表现出丙二醛(MDA)、脂肪酸和可溶性糖含量增加以及有毒有害物质积累等特点[27],Shrestha 等[28]指出,这些变化都可以在可见光和近红外光谱中追踪,可见光范围内的差异可归因于种子样品颜色的变化;近红外范围内的差异可归因于种子样品化学成分的变化。对豇豆(Vigna unguiculata)种子的研究发现,与未老化种子相比,老化种子在部分可见光波段的反射率低,在近红外波段反射率高[29],本研究结果与此一致。结果表明,老化种子的种皮质地及化学成分的改变,导致了种子反射率的变化。总的来说,从多光谱图像中提取的光谱数据包含了快速鉴别未老化种子和老化种子所需的化学信息。Salimi 等[30]研究机械加工过程对甜菜(Beta vulgaris)种子造成损伤的程度,发现平均光谱反射率在可见光区域(低于709 nm)显示出非常小的差异,而在近红外区域的差异程度较大;本研究中紫花苜蓿种子在近红外区域是可区分的,但是在可见光区域(470~660 nm)表现为更好的可区分性。这种差异可能是由于种子样品和检测目标不同产生的[12,31-33]。

PCA 作为一种无监督的判别方法,常用于显示样本分布模式。本试验在紫花苜蓿上利用PCA 的方法并不能准确区分老化和未老化种子,与Hu 等[18]和丛晓翔[25]的研究一致,PCA 区分性能的好坏可能是由于种类不同导致的[34-35]。其次,可能是由于PCA 中所用的信息是使用方差来定义的,方差越大其所含的信息量越大,所以在降维时,PCA 的首要目的是使变量的方差最大化,而不是使种子间的可分辨性最大化。同时,进行主成分分析之后,前两个主成分仅占总方差的58.0%~60.7%,这表明可能发生了信息甚至是重要信息的丢失,进一步导致了PCA 区分能力差而无法分组。相比之下,利用SVM 和LDA 区分老化和未老化种子均可以达到很高的准确度;SVM 和LDA 的原理相同且都属于有监督的模型,具有良好的组间区分能力。但是,LDA 的区分效果优于SVM,产生这种差异的原因可能是因为两个模型的工作方式不同。已知的研究表明,SVM 侧重于近红外区域(780~970 nm)的数据,LDA 更善于应用综合数据[9,18,26,36]。为了充分发挥多光谱成像技术的应用,将多光谱图像经nCDA 算法转化后形成可视化图像,进而对老化种子进行判别可以获得很好的效果。nCDA 算法集成于VideometerLab 4 多光谱成像系统[10,13,37],可以快速的呈现分类图进而直观的对老化种子和未老化种子进行区分,对于高通量种子检测具有重要意义。

同一批次的种子质量应该是一致的,但是在不同的贮藏条件的影响下,种子批次内的单个种子状态会产生一定的差异。对种子行业和市场而言,检测种子批次间以及种子批次内单个种子的特殊状态并从整个种子批中分离出来是非常重要的[38]。但是,人工区分种子是非常繁琐且耗时的过程,并且采用肉眼区分种子的方法更是难以令人满意[39]。因此发展一种高通量、快速、无损、准确率高的多光谱检测技术对种子行业来说是非常必要的。已知的研究显示,包括多光谱在内的多个无损检测技术都具有很好的应用前景。近红外光谱技术具有速度快、效率高的特点,且已经应用在老化种子研究中[40-41];但是这种方法没有应用种子图像分析技术,也未考虑空间信息,且灵敏度低,只能对种子的光谱特征进行单独测量,远没有多光谱提供的信息多。此外,X-射线成像能够探测种子内部结构,但设备成本高且具有辐射[42];高光谱成像技术也可以实现形态信息和光谱信息的分析,但是存在一定的数据冗余和数据处理负担[43-44]。因此,多光谱技术应用于种子行业是非常有前景的,特别是与其他的无损检测技术结合起来,检测的准确度和速率会大大提高。

4 结论

本研究通过多光谱成像分析,发现不同老化程度的苜蓿种子在形态特征和光谱特征中均存在人眼难以识别的差异,进而成功预测了不同老化程度的种子,也成功预测出种子是否发芽。特别是,SVM 和LDA 具有较高的老化种子分类和发芽预测准确度。此外,nCDA 可以将光谱图像进行转化,呈现种子转化后的颜色,根据种子颜色和空间信息,可以识别老化和未老化的苜蓿种子。总而言之,本试验结果证明,多光谱成像结合多元分析是一种高效的紫花苜蓿种子分选和无损检测技术。

猜你喜欢

准确度区分光谱
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
影响重力式自动装料衡器准确度的因素分析
基于3D-CNN的高光谱遥感图像分类算法
区分“我”和“找”
区分
论提高装备故障预测准确度的方法途径
Word中“邮件合并”功能及应用
对GB 17167实施过程中衡器准确度要求问题的探讨