APP下载

基于近红外光谱法的绿豆淀粉和蛋白质无损快速检测

2022-10-28王富豪郭鲁平张晓燕袁星星薛晨晨

江苏农业科学 2022年19期
关键词:决定系数绿豆预处理

黄 璐, 王富豪, 郭鲁平, 张晓燕, 袁星星, 薛晨晨, 陈 新

(1.江苏省农业科学院经济作物研究所,江苏南京 210014; 2.南京财经大学食品科学与工程学院,江苏南京 210095;3.江苏大学食品与生物工程学院,江苏镇江 212013)

绿豆(L.)又称青小豆、植豆,起源于亚洲东南部。绿豆是我国主要的杂粮作物,其营养和经济价值较高。在我国栽培历史长达2 000多年,主产区在东北、长江下游及黄淮河流域,其适应性广、抗逆性强的特点,成为产区农民致富的主要经济作物。绿豆具有清热、解毒等功效,经加工可制成具有药食同源功效的食材,如绿豆汤、绿豆糕、绿豆饼等,其味道香甜、口感松软,老少皆宜,同时还具有解毒、降低胆固醇、抗肿瘤和抗炎等生物学功能。绿豆营养丰富,最主要的成分是淀粉,籽粒中淀粉含量约为50%,主要分为抗性淀粉和非抗性淀粉。其中,抗性淀粉可为人类带来理想的生理健康益处,如降血糖、降低胆固醇和甘油三酯等作用。绿豆淀粉具有热黏度高、易回生等特性,常被用来制做粉丝、粉皮等。绿豆中蛋白质含量(25%~28%)仅次于淀粉,高于其他常见谷物,是小麦面粉的2.3倍、玉米面的3.0倍、大米的3.2倍、小米的2.7倍,且绿豆蛋白富含赖氨酸、亮氨酸和苏氨酸3种必需氨基酸,尤其是赖氨酸水平接近鸡蛋,是优质的植物蛋白来源。

绿豆中淀粉含量的测定通常采用酶水解法和酸水解法,蛋白质可通过凯氏定氮法、分光光度法或燃烧法进行检测。常规化学分析方法用于农产品和食品品质检测通常费时、费力且成本高。近红外光(NIR)是一种电磁波,其波长介于可见光(VIS)与中红外光(IR)之间,近红外谱区为780~2 500 nm,对C—H、N—H、O—H等基团的振动有强烈的感应。近红外光谱技术是基于谱区内所包含的物质信息,快速对有机物质进行定性和定量的物理检测技术。因其操作简便、快捷、成本低、无试剂污染等特点而被广泛研究和应用于农业、医药、石油化工等各个领域。Plans等采用近红外光谱技术对菜豆皮营养品质性状进行模型建立,通过模型准确预测豆皮中的膳食纤维、糖醛酸、灰分、钙和镁的含量,大大缩短了实验时间,为育种和品质质量提供了重要的检测工具。Wang等采用近红外光谱建立了可快速而准确地预测蚕豆淀粉、蛋白质、油分和多酚含量的模型。此外,近红外技术已广泛应用于大豆、油菜、大麦等作物的品质育种中。在美国,近红外被官方认可用于商业贸易中分析大豆中主要成分,但对绿豆主要化学成分的预测缺少商业化模型。

本研究基于笔者所在课题组保存的大量绿豆资源,参考多年种植的数据报告(在省内多点开展种植和农艺性状调查),筛选出100份绿豆核心资源作为试验材料,利用化学方法测定绿豆淀粉(酸水解法)和蛋白质(凯氏定氮法)含量,基于近红外技术建立快速检测模型,用于绿豆育种中蛋白质和淀粉含量的无损检测,以期为绿豆资源的进一步快速测定和利用提供技术支撑,实现绿豆资源的快速评价,提高育种效率。

1 材料与方法

1.1 材料和仪器设备

试验材料:供试的绿豆品种(系)由笔者所在实验室收集并保存,挑选了品质、产地、色泽存在较大差异的100份资源于2020年6月种植于江苏省农业科学院六合实验基地,2020年9月收获。2020年10月至2021年5月期间进行绿豆淀粉和蛋白质无损快速检测研究,试验地点为江苏省农业科学院经济作物研究所。本试验所需试剂均为分析纯,购于国药集团化学试剂有限公司。

仪器设备:Matrix-I傅立叶红外变换光谱仪,购自德国BRUKER公司;K-370全自动凯氏定氮仪,购自瑞士BUCHI公司;Grinder-96高通量组织研磨仪,购自骋克仪器(上海)有限公司;Spark 10M纯水仪,购自四川优普超纯有限公司;AR223CN电子天平,购自奥豪斯仪器有限公司。

1.2 试验方法

1.2.1 绿豆淀粉及蛋白含量测定 淀粉含量根据GB 5009.9—2016中酸水解方法进行测定,蛋白含量根据凯氏定氮法(GB 5009.5—2016)测定。

1.2.2 样品近红外光谱数据的采集 对100份绿豆样品在波长800~2 500 nm(4 000~12 000 cm)范围内进行光谱采集,扫描样品前,将近红外光谱仪预热2 h,以仪器内置参比作为背景校正。开启旋转样品台,将绿豆样品放入旋转样品池,进行绿豆光谱扫描。为降低由取样所造成的光谱漂移,减小误差,每份材料重复装样3次进行扫描,装样时保持样品的装载量、表面平整和实密程度一致。样品扫描温度为25 ℃,每个样品扫描64次,分辨率为8 cm。

1.2.3 近红外光谱分析模型的建立 根据3 ∶1的比例,将100份资源分为校正集和验证集,75份样用于模型建立,25份样用于模型精度检验。采用偏最小二乘法(PLS)将化学方法所得的化学值与光谱数据相关联,建立绿豆淀粉和蛋白检测模型。利用不同的预处理方法对数据优化,模型的预测效果根据交叉验证决定系数、交叉验证均方根误差RMSECV、校正决定系数、校正均方根误差RMSEE、外部验证决定系数和预测均方根误差RMSEP等指标确定最优模型。

1.3 数据分析

绿豆淀粉和蛋白含量测定单项试验重复3次,结果表示为“平均值±标准差”。采用OPUS 6.5软件建立近红外光谱与标准化学值之间的数学模型,并通过预测集对近红外模型的准确度进行评价,同时采用OriginPro 8软件进行绘图。

2 结果与分析

2.1 绿豆近红外光谱图

100份整粒绿豆样品的近红外原始光谱图,见图1。由图1可知,绿豆在波段12 000~4 000 cm范围内存在多个吸收峰,不同样品近红外光谱图变化趋势总体一致,但在近红外的吸光度有较大差异,有利于建模。近红外谱区主要包含2 000 cm以上的基团信息,可检测样品中的C—H、N—H、O—H、S—H等基团振动及光谱叠加吸收,这些基团是有机物的重要组成元素,如淀粉和蛋白质。

2.2 绿豆淀粉和蛋白质化学分析结果

采用传统化学分析方法对100份绿豆中淀粉(酸水解法)和蛋白质(凯氏定氮法)含量进行分析测定,由表1、表2可知,样品中淀粉含量范围为40.88%~53.62%,蛋白质含量范围为20.17%~27.38%,淀粉和蛋白质含量的平均值分别为47.36%和23.36%。本研究所用的绿豆资源,是通过比较品质、产地、色泽等相关性状,挑选了存在较大差异的100份资源。淀粉和蛋白的化学测定结果与前人相关报道相比,有更广泛的区间,涵盖了绿豆种质淀粉和蛋白质含量广泛的分布范围。品种的多样性导致蛋白质和淀粉含量的差异性,数据具有较宽的变幅,适合用于近红外分析模型的建立,有较好的适用性。

表1 绿豆淀粉和蛋白质含量

表2 绿豆淀粉和蛋白质化学含量分布

2.3 模型的建立与优化

使用OPUS软件,通过偏最小二乘法(PLS)统计方法,考察了不同光谱预处理和谱区范围对近红外模型的影响。通过选择信息相关性最大的谱区,选择减少光谱基线偏移、漂移、增加信息量、稳定可靠的光谱预处理方法,对于绿豆样品近红外数学模型的精确度是非常重要的。利用软件的功能和大量的谱区组合选择,优化出所需的最佳光谱预处理方法和谱区范围,从对比验证的统计结果中选择最优的光谱预处理方法和谱区范围用于建立模型(表3)。对于绿豆淀粉,采用无光谱预处理,谱区范围11 772.2~7 498.4、6 102.1~4 597.8 cm效果最佳。对于绿豆蛋白,采用一阶导数+MSC,谱区范围 9 403.9~6 094.4、4 605.5~4 242.9 cm光谱预处理效果最好。由图2可知,为通过一阶导数+MSC方式处理后的近红外光谱,与蛋白质相关信息集中在9 403.9~6 094.4和4 605.5~ 4 242.9 cm波数,表明绿豆样品间的差异主要来源于此范围内。

通过交叉验证,比较不同光谱预处理和谱区范围组合的交叉验证决定系数、交叉验证均方根误差RMSECV等参数,确定绿豆淀粉和蛋白最优模型。由图3和表3可知,对于绿豆淀粉来说,在无光谱预处理条件下,交叉验证决定系数为0.926 9,交叉验证均方根误差RMSECV为0.658,模型效果最佳。对于绿豆蛋白质来说,采用一阶导数+MSC建立的模型效果最佳,交叉验证决定系数为 0.934 1,交叉验证均方根误差RMSECV为0.384。不同光谱预处理和谱区范围对不同营养成分的信息贡献不同, 不同成分近红外模型的最佳光谱预处理方法和谱区范围也不同,每一种营养成分近红外模型的建立都需要单独分析和单独优化,才能建立合适的近红外模型。

表3 绿豆淀粉和蛋白质模型优化

2.4 绿豆淀粉和蛋白质模型外部验证与评价

本研究选用的100份绿豆资源中75份样品为校正集,25份为验证集。为验证模型的准确性,采用未用于建模的、完全独立的且化学值已知的验证集中的25份资源对所建模型的精确度进行评价。由图4可知,剩余25份绿豆种质资源对预测模型进行外部验证的散点图,发现淀粉外部验证决定系数为0.935 1(图4-a),预测均方根误差RMSEP为0.743,蛋白外部验证决定系数为0.921 2(图4-b),预测均方根误差RMSEP为0.31,模型预测效果较好,近红外光谱预测值与真实数值基本一致,满足检测结果,能满足近红外用于绿豆淀粉和蛋白质的无损快速检测。

3 讨论与结论

淀粉和蛋白质是绿豆中主要的营养物质,分别占40.88%~53.62%和20.17%~27.38%,传统化学分析方法是用来测定绿豆淀粉和蛋白的常用方法,但化学分析方法通常较为耗时,需要昂贵的化学试剂、专门的检测设备和熟练的分析人员。本研究选用100份绿豆资源用于近红外数学模型的建立,按3 ∶1比例划分为校正集(75份样品)和验证集(25份样品),通过不同的光谱预处理方法对淀粉和蛋白质的数学模型进行优化。采用无光谱预处理和谱区范围11 772.2~7 498.4、6 102.1~4 597.8 cm得到最优的淀粉数学模型,交叉验证均方根误差为0.658,交叉验证决定系数为0.926 9。采用一阶导数+MSC预处理和谱区范围9 403.9~6 094.4、4 605.5~4 242.9 cm得到最优的蛋白质数学模型,交叉验证均方根误差为0.384,交叉验证决定系数为0.934 1。通过外部检验方法对绿豆淀粉和蛋白质的光谱模型进行检验,淀粉和蛋白外部验证决定系数分别为0.935 1和0.921 2,模型预测效果较好。模型涵盖了绿豆种质淀粉和蛋白质含量的广泛检测分布范围,有较好的适用性。绿豆淀粉和蛋白质近红外模型的建立可快速完成对育种材料的品质测定与分析,极大地缩短检测时间,减小了工作量,且结果准确、可靠,可实现对绿豆资源的快速鉴定与评价,对提高育种效率具有一定意义。

猜你喜欢

决定系数绿豆预处理
基于Python语言路径分析矩阵算法运演
小绿豆变身记
不同规格香港牡蛎壳形态性状对重量性状的影响
2种贝龄合浦珠母贝数量性状的相关与通径分析
清热解毒绿豆香
绿豆
基于颜色读数识别物质浓度的数学模型研究
基于预处理MUSIC算法的分布式阵列DOA估计
绿豆成长记
络合萃取法预处理H酸废水