APP下载

近红外光谱技术在林业领域的应用

2023-05-29李彦杰陈益存赵耘霄吴立文黄世清张永志朱康烁汪阳东

关键词:木材光谱建模

王 珏,李彦杰,陈益存,高 暝,赵耘霄,吴立文,黄世清,张永志,朱康烁,汪阳东,*

(1.浙江农林大学林业与生物技术学院,浙江 杭州 311300;2. 中国林业科学研究院亚热带林业研究所,浙江 杭州 311400;3. 安吉县龙山林场,浙江 安吉 313306)

林木表型通常指林木基因型与环境互作的外在与内在性状的总和。表型性状评估在林木种质资源评价、品质区分、遗传选择和树种鉴别等方面是不可或缺的重要步骤[1]。然而,受林木多年生特性、林地环境等客观因素的影响,林木表型分析方法通常步骤繁琐、价格相对高昂,且可能对样品造成不可逆的破坏。对于大量样本或某些直接、间接性状的检测,许多经典测试方法不够实用。林业生产上常见需要对大量样品进行无损检测的场合,而许多样品具有唯一性。因此,高通量的快速无损检测技术逐渐被关注。采用近红外光谱可以通过小巧灵活的光纤探针传感器进行远程操作、仪器更简易且价格低廉,有足够化学敏感度,可以对样品进行大批量快速无损检测,受到林业工作者的青睐。

据美国试验和材料协会(ASTM)的定义,近红外光(near-infrared,NIR)的波长范围为780~2 526 nm,是介于可见光波段和中红外波段的电磁波[3]。近红外光谱的早期应用集中在农业以及遥感等领域[4],近几十年来,近红外光谱已成为发展最快的光谱技术之一[5],广泛应用于化工业[6]、轻工业、医学[7]、食品工业[8]、物理学等领域。20世纪90年代起出现近红外光谱在林业上的使用[9]。

近红外光谱技术能够对样品进行快速无损检测的优点大大提高了林业样品的检测效率。随着仪器的不断发展,近红外光谱技术在林业领域的应用逐渐向林间实时实地检测的方向发展,它可以迅速反馈林产品品质状态及林木生理生化指标等,实现了技术和效率的革命,对促进林业的发展有重大意义。

1 近红外光谱检测技术概述

1.1 近红外光谱技术的原理

近红外光谱记录的分子化学键基频振动的倍频和合频信息,主要是含氢原子团伸缩振动的倍频吸收,如C—H、O—H、N—H等,可涵盖绝大多数有机分子的组成和结构信息,乃至无机离子通过影响与其相关的物质引起的光谱变化[10]。同时,近红外光谱记录的是出现在中红外吸收带的泛音和合频,比基频弱1~3个数量级[2],因此,近红外光的穿透能力强于其他红外波段,成为辐射的高透过窗口,且与其他红外光波段光谱有明显区别[11]。这种高透明度为近红外光谱提供了极大的采样优势,也因此导致吸收带重叠。近红外光谱并非直接对检测内容进行阐释,需要借助数学及化学计量学方法对光谱数据进行更深入的分析,是一种二次分析方法[6]。

1.2 近红外光谱应用的优缺点

目前被应用于高通量快速无损检测的技术主要有近红外光谱、高光谱成像、红外光谱、衰减全反射(attenuated total reflection, ATR)红外光谱、拉曼(Raman)光谱等(表1)。高光谱成像技术结合了光谱检测技术和成像技术,既可以反映样品的外观特征,又可以反映其分子组成。与近红外光谱技术相比,高光谱成像技术数据更丰富,数据量更大,图像的获取、处理和分析是颇具挑战性的课题,因而高光谱成像技术在数据处理方面不如近红外光谱技术快速[12]。虽然近红外光谱技术有局限性,但在林业领域来看,其特性和应用潜力在一应光谱技术中仍占据特殊的地位,难以被替代(表1)。

表1 近红外光谱技术与几种相关技术的对比

近红外光谱是一种强大的原位分析方法,检测过程中无需对样品进行破坏,或进行前处理,因而也无需使用会造成污染的化学试剂,支持对鲜叶、鲜果等样品进行检测分析。衰减全反射红外光谱虽然也可用于红外光谱无损分析,但对于完整样品的测量,近红外光谱还是更胜一筹[11]。Li等[13]的研究指出,衰减全反射红外光谱与NIR光谱在心材内含物的测量上建模精度不同,如在硬木的心材内含物检测中,无论采用何种预处理方法,基于NIR光谱的偏最小二乘回归模型(PLSR)表现更好。

由于近红外光波段覆盖了光纤通信的波长范围(850~1 550 nm),因此检测数据可通过光纤通信实现远距离测量,且数秒即可完成1次光谱采集,得到包含样品多项指标信息的近红外光谱[11]。若配合便携式设备,在林地环境也能快速采集传输并分析数据。可见近红外光谱技术有对不同环境的高度适应性以及进行在线分析和遥测的优势,十分适用于林地现场测量或实现高通量快速测量。

近红外光谱虽然在许多方面显示出卓越的通用性,应用领域广泛及适用环境多样,对材料的要求低,对未经处理的生长锥、木圆盘、叶片、果实、种子等样品都有良好的检测适应性,在水溶液和生物样本的检测中更是展现出优越的性能[14]。但近红外光谱的准确性受限。虽然近红外光谱检测能够覆盖大多数物质的信息,但其灵敏度并不是很好,对物质含量有一定要求,如在固体中各成分的检出限为0.1%(质量分数),在乙腈溶液中水的检出限为0.005%~0.010%[15]。随着仪器和光谱技术的发展,此检出限极有被突破的可能。近红外光谱的建模精度很大程度上决定了预测的准确性,而建模数据来自近红外光谱数据以及化学分析数据。预测准确性还受限于样本数量及广度,以及化学计量学手段,因此化学分析法的准确性成为了近红外光谱预测准确性的上限,近红外光谱预测的准确性尚无法优于化学分析法[6]。

1.3 近红外光谱技术的应用流程

采集样品后,依次进行近红外光谱采集和目标数据测量,使两种数据根据样本一一对应。选择性地对数据进行特征波长选择和预处理,不同预处理效果需要结合建模方式进行分析。将经过预处理的数据划分成不同数据集后进行建模,并比较分析不同预处理组合的效果,选择合适的预处理与建模组合,得到最终模型,用于之后的预测(图1)。

图1 近红外光谱技术的应用流程Fig.1 Application processes of near-infrared spectroscopy technology

2 近红外光谱技术在林业科研和生产上的应用

2.1 在木材质量评估研究中的应用

1990年,近红外光谱技术就已被应用于预测木材化学成分以及纸浆产量,随后被应用于木材物理力学性能的检测[16-18]。木材主要化学成分有纤维素、半纤维素、木质素等,其中木质素主要影响木材制浆性能和纸浆质量,是制浆材质量的重要判断依据[19-21]。丁丽等[19]利用近红外光谱技术结合BP神经网络定量预测日本柳杉(Cryptomeriajaponica)中总纤维素和木质素的含量,得到的预测模型相关系数分别为0.91和0.90,预测值和实测值之间有良好的相关性。除此之外,一些木材的耐用性特征也被广泛关注,木材耐用性主要取决于心材内含物的含量。Li等[22]开发了用于心材内含物测定的跨树种近红外光谱校准,以区分混合林中的桉树树种并预测其心材内含物含量。预测模型的偏最小二乘回归模型回归系数为0.95,预测均方根误差为0.90,能够区分混合样本并有望用于快速耐久性预测。

近红外光谱也被用于评估木材物理性质。Zhang等[23]利用近红外光谱结合支持向量机建立了落叶松(Larixgmelinii)木材密度预测模型,结果表明使用支持向量机模型可显著提高模型预测木材密度的性能。谭念等[24]提出了结合灰狼算法支持向量机(GWO-SVM)的木材密度近红外光谱预测模型,决定系数为0.92,均方误差为0.000 18,预测精度较多元线性回归和支持向量机回归更优。木材近红外光谱模型的超参数中隐含了木材特征与其力学性能之间的相互关系,木材抗弯强度(MOR)与抗弯弹性模量(MOE)等力学性能受到木材成分组成、微观结构、物理性质及环境的共同影响,并非木材的直接特征,而是与木材特性属于非线性关系。基于偏最小二乘(PLS)回归模型预测机械性能的精确度仍低于其他物理和化学性能。基于此,Yu等[25]使用径向和切向表面平均光谱建立基于相关局部嵌入(CLE)的偏最小二乘(PLS)模型以适应NIR光谱与MOE及MOR之间的非线性关系。Yu等[1]测量了来自杉木、桉树和杨树的438个无疵木材样品的近红外光谱和MOE、MOR,使用偏最小二乘法建立模型,得出除杨树样品的MOR外,近红外光谱与力学性能的相关性非常强,训练和预测模型相关系数均在0.80以上。微纤丝角也是评估木材各项性质的重要因子之一,与木材化学性质、物理性质及力学性质密切相关,可以用于木材性质的早期预测。Ma 等[26]通过近红外高光谱成像技术获得日本柳杉木材光谱数据,以X射线衍射法获得微纤丝角数据,并通过偏最小二乘法建立模型,其校准模型的相关系数为0.77,能够有效预测和评估日本柳杉微纤丝角及其分布规律。

近红外光谱技术不但能评估木材的化学性质,且能对其物理力学性质进行评估,并实时反馈,有望应用于用材树种的遗传育种和基因工程,提高优质木材定向培育的效率,提高人工林木材质量。同时,其在木材质量检测领域也有较大潜力,能够快速无损地预测大量木材样品的性质,对木材产品进行初步筛选分级,节约了人力和检测成本。

2.2 在经济林产物品质研究中的应用

各类经济林产品如坚果、油料种子、工业原料及药材等在我国林业产业总产值中占比较大,2018年,我国各类经济林产品产量达1.57亿t,林产品进出口贸易额达1 600亿美元[27]。由于近红外光谱可进行快速无损检测的特性,能够快速了解经济林产品的化学成分含量及种子活性等性状,以及重要商品特征如口感,成熟度等[28]。在产物品质方面,Araújo 等[29]结合偏最小二乘法对咖啡豆(Coffeaarabica)的pH和酸度进行预测,模型的相关系数为0.78和0.92,剩余预测误差为2.061和2.966,预测值和实验值之间的平均误差低于7%,可以对样品进行快速在线评估。王丹等[30]建立了可见和近红外漫反射(VIS/NIR)光谱与甜柿(Diospyroskaki)硬度的修正偏最小二乘模型,展现了较好的预测性能,给确定甜柿最佳采收时期提供了一种高通量且无损的解法。

除间接特征外,近红外光谱在经济林产品品质方面的应用更多在于检测产物化学成分含量[31]。Rébufa 等[32]对辣木(Moringaoleifera)叶片进行了近红外光谱检测,建立了辣木叶片矿物质、蛋白质的预测模型,对氮和蛋白质含量建立的模型性能最佳,校准模型相关系数达0.96。李水芳等[33]分别采用偏最小二乘法及径向基神经网络法(RBFNN)建立油桐(Verniciafordii)、油茶(Camelliaoleifera)、核桃(Juglansregia)的各类混合样本集含油率的近红外光谱通用模型。模型的相关系数基本可达0.9,该通用性检测模型具有可行性。León等[34]利用近红外光谱技术(NIRS)研究了亲本和收获年份对完整橄榄(Oleaeuropaea)果实中油、水分、油酸和亚油酸含量测定的影响,在橄榄育种计划中发挥了效用。Tigabu等[35]构建了区分展松(Pinuspatula)活种子和空种子的透射和反射近红外光谱模型,经波长选择后,区分率皆达到100%,为开发自动化快速分选设备做好了技术准备。

近红外光谱对含氢离子团倍频吸收的敏感性使得其能够检测到大多数有机物质及无机离子,这为经济林产物品质检测提供了绝佳的条件,也由此为林木遗传育种提供了崭新的思路和方案。可见近红外光谱技术在经济林产品品质乃至林木遗传育种的研究中有着巨大的潜力。

2.3 在林木分类鉴别方面的应用

近红外光谱数据的全面性使得其不仅能够被应用于直接特征的检测,还能将各种特征进行综合分析,在定性测量方面发挥作用。基于近红外光谱的方法可以识别树木的杂交群体[36]或地理起源[37],也能进行树种鉴别[38]。从实木样品中获得的近红外光谱可用于物种识别。汪紫阳等[39]建立了东北地区常见的14个树种可见/近红外光谱模型,以识别这些树种,识别准确率达98.21%。杨金勇等[40]利用主成分分析与Fisher判别模型建立了大叶桉(Eucalyptusrobusta)和马尾松(P.massoniana)、落叶松(L.gmelinii)、樟子松(P.sylvestrisvar.mongolica)的木材近红外光谱模型,在3类松树间的识别率可达98.02%,加入大叶桉的数据后,识别率为100%。针对同一物种,用近红外光谱也能够通过检测化学成分等特征的细微差异将它们根据种源进行区别。Nisgoski 等[37]对不同种源的日本柳杉进行了近红外光谱建模,对4 000~6 000 cm-1的光谱波段进行分析,成功将6个种源的日本柳杉区别开来。

常用的红木鉴别技术受限于检测人员的专业素养,以及对样品的代表性有一定要求,为简化流程、提升精度,在红木鉴别领域引入了近红外光谱技术。杨忠等[41]根据8类红木标准样本的近红外光谱数据和红木色度学参数建立了鉴别模型,发现二者有极高的相关性,使得近红外光谱技术在红木乃至珍贵木材树种鉴别领域有很高的商业应用价值。结合成像技术后,近红外光谱还能够反映树龄等隐藏在木材表观特征中的信息,如Ruano 等[42]通过近红外高光谱成像技术成功确定了欧洲赤松幼龄木和成熟木的界限,并区分早晚材。

2.4 在林木病虫害研究方面的应用

利用近红外光谱鉴别林业样品是否受病虫为害,主要是根据病原微生物或昆虫侵染后对样品是否造成物质含量或种类的改变。Lucas等[43]通过可见和近红外反射光谱有效区分了橡胶(Heveabrasiliensis)的病叶和正常叶。Xu等[44]利用激光诱导击穿光谱(LIBS)和近红外光谱对甜橙(Citrussinensis)黄龙病进行诊断,发现激光诱导击穿光谱联合近红外光谱对柑橘黄龙病的诊断准确率最高,训练集和测试集准确率分别为89.5%和95.7%。在林木虫害研究方面,Tigabu等[35]根据近红外光谱反映的种子含水量的变化鉴别饱满种子和受病虫害侵染的种子,区分率达100%。国内外松林受松材线虫为害已久,王震等[45]、黄明祥等[46]、马跃等[47]的研究共同说明,是否感染松材线虫的松树在近红外区域的光谱反射率存在极显著差异,近红外波段对于松材线虫病乃至林木病害的光谱研究有很大意义。这个结果有望被应用于快速生物安全检测,降低外来林木病原进入的风险。

2.5 在林下土壤研究方面的应用

为研究森林生态系统中的矿物循环,了解凋落物的分解速率至关重要,有关森林凋落物的研究开展较早。Gillon等[48]用共10种不同物种的落叶,通过近红外光谱测试分解速率,证明近红外光谱可以预测凋落物的分解速度。此外,近红外光谱法对落叶层组分也有较强的预测能力。Chodak等[49]记录了406份云杉、山毛榉和云杉-山毛榉混交林落叶层的可见-近红外光谱数据,很好地预测了C、N、P及一些金属元素的含量。

落叶层元素含量间接影响了森林植物的生产力,同时林下土壤的质量也值得研究。Conforti等[50]用可见-近红外光谱评估了意大利南部一些代表性林区不同质地土壤的有机碳、总氮、pH,其中有机碳和总氮的模型预测结果较好,pH的预测模型有中等预测能力。Vendrame等[51]建立了高岭石、三水铝石及赤铁矿等土壤矿物的预测模型以分析土壤特性,预测结果均较为理想。确定林下土壤的元素含量和矿物组成对土壤学表征很重要,能够在一定程度上预测林木未来生长状态。配合近红外光谱技术,可以建立一定区域的土壤光谱库,有助于森林土壤资源的可持续监测和管理。

不同的物种、检测内容和建模条件下的近红外光谱数据对各种预处理方法和建模方法有不同的适应性,部分近红外光谱建模的优良方案见表2。

表2 近红外光谱技术在林业领域的具体应用

3 近红外光谱林业应用性能的影响因素

3.1 内在因素

1)样品含水量影响近红外光谱分析。近红外光谱主要记录含氢原子团的倍频吸收信息,对样品中的水分尤为敏感,具有O—H键的水在NIR光谱中有1 414和1 916~1 980 nm两个重要的吸收区域,可能会与近红外光谱中的其他特征信息重叠而导致预测模型精度下降[52]。因此在进行无损检测时,最好需要对样本进行脱水干燥处理,在木材的近红外光谱检测中,木材样本通常要达到一定干燥度;在某些干燥后会影响所测成分含量的样品,如用于提取挥发性成分的部分时,至少也需要所检测样品表面干燥[53]。

2)样品的状态如颗粒大小[54]、表面光滑程度[55]等都与近红外光谱分析结果密切相关。将木材样品研磨成木粉能够使近红外光谱模型具有更高的精度,木粉颗粒的大小对近红外光谱建模的精度也有影响。然而木粉研磨和颗粒大小控制是较为耗时的,在实际测量中,应用实木进行光谱测量更为经济。实木木材的近红外光谱往往从实木样品的木材三切面获得,但从3个切面获得的近红外光谱又有所不同。赵荣军等[56]认为对粗皮桉(E.pellita)木材力学性质模型预测效果最好的是径切面和弦切面的平均光谱值;余雁等[57]在研究毛竹(Phyllostachysedulis)气密性的实验中探究了不同采谱方式对建模精度的影响,发现平均竹材内外表面光谱后得到的模型预测精度显著提高。虽然近红外波段的穿透能力强于其他红外波段,但穿透能力有限,至多深入样品3~5 mm[58]。若果皮过厚而需测量种子内成分,则仍需去除部分果皮。另外,样品本身材质及形状对光线的敏感度也是影响建模精度的要素之一。

3)样本量和样本间差异影响近红外光谱分析。建立模型的过程中需要检测大量样品以得到一个稳定准确的校准模型。模型建立后也并非一劳永逸,还需要时时进行维护,使模型保持良好稳定的状态,以适应更多样本。在所有样本中,样本差异越大,则模型的泛化效果越好,预测的准确度就更高。Shi 等[59]对14种硬木横截面进行近红外光谱扫描后通过人工神经网络完成模型的建立,结果表明使用多物种近红外光谱数据集预测硬木的机械强度将提高模型的泛化能力并提高准确性。而为了保证得到模型的精确度,需要一定量的近红外光谱数据,以确保在不同建模方式中都为模型的构建、训练、验证留有余裕,样本量通常需大于100。

4)采谱状态影响近红外光谱分析。样品发育过程影响着其不同部分的化学成分及含量,因此,样品(尤其是果实)的摆放方向,一定程度上影响着最终模型的精度[60]。测量时的环境条件如温度、湿度对样品的影响也会影响近红外光谱的采集和分析。

3.2 外在因素

近红外光谱涵盖了样品较为完备的信息,但同时也囊括了许多泛音和合频,光谱模式复杂,信噪比较低,且不同于红外光谱可以明确指出某种基团的吸收峰,近红外光谱很难进行精确的波段分配,需要借助计算机技术以及化学计量学手段对光谱数据进行分析,获得低背景干扰和高信噪比的高质量光谱数据。

1)预处理和波长选择方式影响近红外光谱分析。对于不同的样品,不同的预处理方式和组合可能产生不同的结果。常见的预处理方式有Savitzky-Golay卷积平滑算法、导数变换、标准正态变换(standard normal variate stransformation, SNV)、多元散射校正(multiplicative scatter correction, MSC)等。Savitzky-Golay卷积平滑算法可对数据进行多项式最小二乘拟合,以消除噪声、提高信噪比,较移动平均平滑损失的信息少。导数光谱消除的是基线和背景干扰,区分重叠条带,但可能会引入噪声[61],其中二阶导数要求较高信噪比和较低水汽峰。SNV用于消除样品颗粒大小、表面散射及光程变化带来的影响[62]。MSC与SNV的处理有相似之处,但对于组间异质性大的样品效果较差。

2)波长选择的方式有竞争性自适应重加权(competitive adaptive reweighteds ampling, CARS)、迭代保留信息变量(iteratively reserved information variables, IRIV)、连续投影(successive projections algorithm, SPA)等。Li 等[63]用实木样品建立NIR-PLS回归模型预测香椿(Toonasinensis)心材内含物的研究表明,通过sMC筛选特征波长的方法选择特征波数减少了木纹角度对香椿心材内含物近红外光谱的影响。但并非所有情况下数据预处理与波长选择都能产生正面影响。不同的样本集与预处理方式、波长选择方式及建模方式的适应性不同。预处理及波长选择只是提高模型预测精度的手段,有时过分追求建模精度会导致过拟合,使得模型泛化效果不佳。如Kelley 等[64]在火炬松(P.taeda)木材化学、力学性质的近红外光谱预测的研究中,没有对光谱采用任何预处理,认为经这些算法处理后,光谱数据的化学解析会变得更加复杂,或是改变一些重要信息。

3)建模方式影响近红外光谱分析。随着计算机技术与生物技术的深入交流,机器学习在生物科学领域得到了广泛应用,除常见的偏最小二乘法,人工神经网络和支持向量机也越来越多地被用于近红外光谱分析,近红外光谱分析技术得到了长足的进步。

4)硬件系统影响近红外光谱分析。光谱仪、检测器、光纤等硬件技术的发展一定程度上影响了近红外光谱技术的发展,使得到的光谱数据更加精确。

4 展 望

国内外大量实践研究表明近红外光谱具有许多独特的优势,在木材物理化学性质检测、林木遗传育种、产物品质检测、种质资源鉴定、病虫害检测等方面有着较高的应用价值。近红外光谱技术与气象色谱质谱联用(GC-MS)结合,能够在一次检测中同时得到多种内含物含量建模预测所需的数据,大大节约了成本。在林业上使用近红外光谱时,还有一些值得关注的问题。

1)建模精度的提高不应完全依赖于数据处理。建模精度与预测准确性固然是值得深入探讨的内容,但多元数据分析依赖于样本的化学分析结果。因此,在光谱数据处理之外,也应关注更准确的化学分析结果,同时注意控制环境条件,及时剔除异常样品与异常光谱,以获得质量良好的近红外光谱数据。

2)尽管近红外光的探测深度在竞争技术中名列前茅,但对于形态多样的林业样品来说仍显不足。譬如,欲对树皮较厚的活立木或果皮及种皮较厚的果实、种子进行无损检测,可能获取的光谱信息不足以建立稳定精确的模型,仍需取用生长锥或进行前处理。未来需要配合硬件技术的发展,如微创探针等,以拓展近红外光谱的泛用性。

3)建立林业领域近红外光谱法相关标准,对技术进行熟化推广。林业领域中,近红外光谱法的引入稍晚但在林业上的应用迅速,因此缺乏一定的标准与规范,相关规定滞后,标准化程度不如在化工业、食品行业成熟[65]。为使近红外光谱技术在林业上有更大的应用前景,亟须进一步将其规范化,制定相关标准与指南。其次要加大预测模型在生产实践中的应用力度,如开发快速预测软件降低技术运(应)用门槛或在手持式光谱仪系统中搭载预测模型在获取样品光谱的同时快速获得预测结果,以促进成果转化,达到对现有技术进一步熟化推广的目的,在实践中进行检验。

在对活立木进行的研究中,大多以取生长锥的方式进行近红外光谱检测,这可能与近红外光的透射深度有关,有待结合硬件设施的更新发展及更泛用的检测模式,以增强近红外光谱技术在林地现场测量中的实用性与易用性。近红外光谱技术结合遥感或成像技术检测林木病虫害的方法已经趋于成熟,从生物安全方面看,也有很大的的应用前景,可将其应用于林木进出口快速检疫或产物自动化分选,开拓近红外光谱的实际应用领域。此外,近红外光谱对林业产物品质的检测实际上是对产物成分组成、成分含量及生理生化表征的检测,与林木遗传育种与良种选育的要求契合,可以在常规检测中积累近红外光谱检测数据,建立一定范围的近红外光谱数据库,在得到稳定准确的模型后应用于育种规划和实践工作。

猜你喜欢

木材光谱建模
基于三维Saab变换的高光谱图像压缩方法
橘子皮用来开发透明木材
数字说
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
木材在未来建筑设计中的应用分析
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
严格木材认证