APP下载

基于GA-RF模型土壤坚实度对黑土区大豆产量的影响

2022-11-11周修理张萍萍霍东旭乔金友

东北农业大学学报 2022年10期
关键词:黑土压实大豆

周修理,张萍萍,秦 娜,霍东旭,乔金友*

(1.东北农业大学电气与信息学院,哈尔滨 150030;2.东北农业大学工程学院,哈尔滨 150030;3.黑龙江省主要农作物生产机械化材料化技术创新中心,哈尔滨 150030)

黑土性状好、肥力高,是适宜大豆生长的优质土壤。黑龙江省位于世界三大黑土区之一的东北平原,大豆种植面积与产量均居全国首位,在保障国家粮食安全中具有不可替代地位[1]。近年来,随着我国农业现代化水平提高,黑龙江地区农业机械化程度快速发展,农业机械作业对黑土压实风险也随之上升。过度压实导致土壤结构破坏、水渗透能力减弱、作物根系生长受阻,影响粮食综合生产能力提升和农业可持续发展[2]。

农业机械作业造成土壤压实已成为制约世界各国农业发展的重要问题,国内外学者就机械压实对土壤物理特性、作物生长发育影响等展开大量研究。在机械压实对土壤物理特性影响上,Kumar等通过研究不同耕作系统压实状况发现,机械压实破坏土壤结构,导致土壤容重与土壤坚实度增加,耕作可在一定程度上缓解压实影响,疏松土壤[3];Sivarajan等研究轮式机械作业对土壤压实影响得出,机械作业对测区土壤压实作用显著,压实后表层土壤易于恢复而深层土壤恢复较慢[4];乔金友等在使用JD-904型拖拉机进行压实试验基础上,结合多因素方差分析,发现土壤深度与压实次数为影响土壤坚实度最主要因素,随压实次数增加,土壤受压实作用范围及程度均增加[5]。关于机械压实对作物生长发育影响,肖芬芳等通过不同压强下水田土壤压实试验,结合单因素方差分析及线性回归拟合得出,机械压实对水稻根系发育及产量造成显著影响,土壤受压实强度与甘蔗成根数量、主根长度、单穴产量之间为负相关[6];Alvarez等研究表明,不同作物受压实影响状况不同,机械压实导致土壤密度增加进而玉米干物质含量降低,与大豆相比,土壤坚实度对玉米根系发育影响更明显[7];Tesfaye等研究发现,随压实次数增加,土壤体积密度与渗透阻力均呈非线性增长,压实地块甘蔗产量较未压实地块出现大幅下降[8];齐红志等通过研究机械压实作业,对玉米植株生长发育影响发现,0~20 cm深度土壤受大型农业机械压实作业影响最大,耕层土壤紧实度增加对玉米根系起到抑制作用,影响茎、叶生长,最终使玉米减产幅度达20%以上[9]。

各国学者针对机械压实问题开展大量研究,但大多基于简单统计分析与线性拟合,未建立机械压实对作物产量影响预测模型,无法科学指导机械压实问题消减研究。随着人工智能兴起,机器学习算法发展迅速。相较于传统模型,机器学习算法可深入挖掘数据内部关系,具有更强数据拟合能力与预测精度[10]。结合农业生产机械化实际引入机器学习方法以探究机械作业造成土壤压实对黑土区大豆产量影响具有重要理论意义。

随机森林(Random forest,RF)是基于Bagging集成学习思想分类器,具有训练样本数量需求少、分类精度高等优点,在作物识别、地块分类、机械故障诊断等领域应用广泛[11-12],但压实对作物产量影响预测尚缺乏研究。本文利用随机森林实现不同深度土壤坚实度对大豆产量影响预测,针对随机森林超参数选择主观性强、泛化能力差问题,使用遗传优化算法(Genetic algorithm,GA)对随机森林进行改进,构建基于GA-RF土壤坚实度对大豆产量影响预测模型,可有效识别因受机械压实影响而导致大豆减产严重地块,对提高大豆品质,保护土壤资源,促进农业机械化向全程全面高质高效发展具有重要意义。

1 数据获取与处理

1.1 试验区概况

试验地点位于黑龙江省哈尔滨市东北农业大学向阳试验示范基地(44°04′N,125°42′E)。试验区处于第一积温带,气候为中温带大陆季风性气候,年平均温度3.5~4.5℃,大于10℃有效积温为2 600~2 700℃,年均降雨量400~600 mm,集中在7~8月,无霜期为135~145 d,土壤类型为典型黑土,土壤质地为粉壤土(砂粒5.3%,粉粒68.5%,黏粒28.9%)。

1.2 试验设计

针对当前黑土区大豆生产作业中多种经营规模并存、不同规模农业机械同时使用情况,设计基于不同类型拖拉机、不同压实次数的梯度压实试验。在春适期播种大豆,选用凯斯210大型拖拉机、约翰迪尔904中型拖拉机、约翰迪尔280小型拖拉机分别进行2、4、6、8、10、12次压实试验,以模拟不同机械化程度土壤受压实情况。为尽可能消除地块差异对试验结果的影响,每组压实处理设置3次重复,设置未经压实地块为对照组(CK),试验过程中控制拖拉机行驶速度保持匀速且一致。

土壤因机械作业导致压实情况可通过土壤坚实度、土壤含水率、土壤容重等进行表征[13],其中土壤坚实度又称土壤渗透阻力,是基于土壤硬度合成指标,由柱塞压入土壤时所受土壤摩擦力、压缩力和抗剪力等构成,对作物种子发芽、幼苗出土、根系生长影响较大;相较于其他土壤物理特性指标,土壤坚实度通过土壤坚实度仪获取,简单易行,故选用不同深度土壤坚实度衡量土壤受机械压实作业影响情况。压实完成,在每个试验区拖拉机压实轮辙中线处随机选取3个测点,使用由荷兰Eijkelkamp公司生产PV6.08土壤坚实度测定仪测定0~80 cm土层深度土壤坚实度(MPa),该仪器每1 cm自动记录一个土壤坚实度数值。土壤坚实度测量时,双手握持PV6.08型贯穿阻力测试仪匀速插入土壤,以避免因受力不均对测量结果产生干扰。

大豆成熟后,采集压实轮辙两侧2 m2大豆样本,脱粒,测定籽粒含水率,计算标准含水率[14]大豆产量(kg·hm-2)。

土壤坚实度测量与大豆样本采集现场,分别如图1和2所示。

图1 土壤坚实度测量Fig.1 Soil penetration resistance measurement

图2 大豆样本采集Fig.2 Soybean sample collection

1.3 数据处理

为探究不同深度层次土壤坚实度对大豆产量影响,将采集的0~80 cm共80个土壤坚实度数据按层次进行划分,计算各试验小区0~10,11~20,…,71~80 cm土壤坚实度平均值作为输入特征xi,i=1,…,N,N为样本个数,本试验共54个试验小区,每个试验小区设置3处土壤坚实度测定点,N值为162。经计算得CK组大豆产量为2 529.95 kg·hm-2,试验组大豆产量为1 816.48~2 518.85 kg·hm-2,较CK组产量下降0.44%~28.20%,即不同机械压实作业组合均对大豆造成减产影响。依据式(1)计算各试验组同CK组大豆产量变化率ci(%),将其按照表1离散化为正常、轻度影响、较严重影响、严重影响4类状况作为待预测类别yi,以分类评估不同深度土壤坚实度对大豆产量影响状况[15]。

表1 类别划分Table 1 Category division

式(1)中,mi为地块i大豆产量;m′为CK组大豆产量。

为消除由地块差异及人为因素带来的误差,将原始数据基于3σ法则作异常值处理。当土壤坚实度数据满足式(2)时视为正常值,否则视为异常值,予以剔除,式中σ为标准差,μ为均值。

异常值剔除导致数据集中部分数据出现缺失,对此使用拉格朗日插值法进行插补[16]。拉格朗日插值法可依据现有数据点分布构造插值函数L(x),实现对未知样本点预测。对有n+1个取值点且分布互异土壤坚实度数据D={(x0,y0),(x1,y1),…,(xn,yn)而言,设x为土层深度,y为其对应土壤坚实度值,对于其中存在缺失值求解过程如下:

①根据已知土壤坚实度土层数据求解拉格朗日基函数lj(x):

②根据式(3)中拉格朗日基函数构造拉格朗日插值多项式:

③将缺失函数值对应点带入式(4)求解得到对未知点土壤坚实度值L(x)估计值,完成缺失值填补工作。

原始数据经异常值与缺失值处理后,依照大豆受影响状况类别整理试验数据,结果如表2所示。

表2 试验数据Table 2 Experimental data

2 研究方法

2.1 皮尔逊相关系数

皮尔逊相关系数(Pearson correlation coefficient)又称皮尔逊积矩相关系数,通过待评估的两组数据与各自离差相乘反映两组数据之间相关程度,其计算公式如式(5)所示。

式(5)中,X、Y为待确定相关程度的两组数据,分别有n个元素;和分别为两组数据平均值。皮尔逊相关性系数取值介于-1与1之间,取值为正时代表X与Y为正相关,值为负时代表负相关。

使用皮尔逊相关系数法衡量不同深度土壤坚实度与大豆产量之间相关性,筛选不同大豆产量关联度高的特征作为分类模型输入。

2.2 改进随机森林(GA-RF)模型

改进随机森林通过引入遗传算法对随机森林模型优化。遗传算法也称进化算法,通过不断选择、交叉、变异等操作,演化产生近似解,具有全局搜索能力[17]。利用遗传算法对随机森林中决策树个数、决策树最大深度、叶子节点含有最小样本数、节点可分最小样本数4个关键参数进行寻优[18],解决随机森林中超参数设置盲目性、泛化性能差问题,实现土壤坚实度对大豆产量影响预测。

图3为GA-RF模型执行过程,步骤如下:

图3 GA-RF模型流程Fig.3 GA-RF model flow

①将采集到的土壤坚实度与大豆产量数据进行预处理,按照3∶1随机划分训练集和验证集,使用训练集数据用于模型建立;

②初始化遗传算法种群参数,设置随机森林中待优化超参数取值范围,采用实数编码方式随机产生一组初始参数编码,用于模型初始化;

③以模型分类误差为适应度函数,计算种群中个体适应度;

④根据适应度选择个体,淘汰适应度低个体,保留适应度高个体作交叉、变异等操作,产生下一代;

⑤重复步骤③~④,直至满足终止条件(迭代次数或停滞代数达到设定值),输出随机森林中决策树个数、决策树最大深度、叶子节点含有最小样本数、节点可分的最小样本数作为最优超参数组合,建立GA-RF模型;

⑥使用构建的GA-RF模型对验证集进行验证,输出预测结果。

2.3 模型评价

选择准确率(Accuracy)以及宏平均(Macro average)后查准率(Precision)、召回率(Recall)、F1值(F-Measure)作为评价标准[19],衡量模型分类效果,计算公式分别如式(6)~式(9)所示。

式(6)~(9)中,n为类别数,N为数据集样本数,TP为正确分类为正例的正样本数,FP为错误分类为正例的负样本数,FN为错误分类为负例的正样本数,TN为正确分类为负例的负样本数。

准确率为正确分类样本占总样本比例;查准率为所有预测结果为正例中真正为正例比例;召回率为所有为正例中被正确预测的样本比例;F1值为查准率和召回率的加权调和平均,综合评价模型性能;宏平均即在多分类问题中计算每一类样本性能指标的算术平均值作为最终评价结果,上述评价指标接近于1代表模型分类性能越好。

3 结果与分析

3.1 不同深度土壤坚实度与黑土区大豆产量相关性分析

试验共采集162组数据,依据3σ法则与拉格朗日插值法对数据异常值及缺失值进行处理,用皮尔逊相关系数法计算不同深度土壤坚实度与黑土区大豆产量相关系数并进行相关性排序,结果如表3所示。

由表3可知,不同深度土壤坚实度与大豆产量之间均为负相关,其中负相关性最强为11~20 cm土壤坚实度,相关系数为-0.935;0~10 cm与21~30 cm土壤坚实度相关系数分别为-0.909和-0.872,不同大豆产量之间存在极强负相关;31~40 cm、41~50 cm与51~60 cm土壤坚实度与大豆产量相关系数绝对值为0.6~0.8,为强相关;61~70 cm与71~80 cm等深层次土壤坚实度与大豆产量相关性较低。选取与黑土区大豆产量之间存在强相关性土壤坚实度特征,作为GA-RF模型输入参量,以降低模型复杂度,提高计算效率。

表3 不同深度土壤坚实度与大豆产量相关性Table 3 Correlation between soil penetration resistance at different depths and soybean yield

3.2 基于GA-RF模型土壤坚实度对黑土区大豆产量影响预测

3.2.1 基于GA的RF参数寻优

根据皮尔逊相关系数分析结果,选择0~10 cm、11~20 cm、21~30 cm、31~40 cm、41~50 cm、51~60 cm 6个与黑土区大豆产量相关性强的土壤坚实度特征,作为预测模型输入参量,预测大豆产量受影响状况。将预处理及特征选择数据按3∶1随机作训练集与验证集划分,输入训练集数据到GARF模型中用于模型建立。使用GA对RF超参数寻优时,GA种群规模设置为20,交叉变异概率设置为0.1,终止条件为最大迭代次数为150或停滞代数为10;RF中待确定的4个超参数寻优范围设置与最终寻优结果见表4。

表4 GA-RF寻优结果Table 4 GA-RF optimization results

根据表4寻优结果可知,当RF中决策树个数设置为11、决策树最大深度为7,叶节点含有最小样本数为2、节点可分最小样本数为5时,GA-RF模型性能最优。

3.2.2 GA-RF与RF对黑土区大豆产量影响预测性能比较

将训练集数据分别应用于GA-RF与RF模型中进行训练,使用验证集数据验证土壤坚实度对黑土区大豆产量影响状况预测模型性能,绘制RF与GA-RF模型训练集与验证集预测结果与真实类别对比曲线,如图4和5所示,图中,X轴为样本编号,Y轴为样本类别,实线为大豆产量受影响状况真实类别,虚线为预测类别。

图4 RF预测结果Fig.4 RF prediction results

计算GA-RF与RF模型在训练集与验证集上准确率及宏平均后查准率、召回率、F1值等评价指标并作对比,结果如表5所示。

图5 GA-RF预测结果Fig.5 GA-RF prediction results

表5 GA-RF与RF模型性能对比Table 5 Comparison between GA-RF and RF model

分析图4、5及表5可知,RF与GA-RF模型在训练集中均有较好预测性能,对大豆产量受影响类别预测准确率分别为95.04%、97.52%;但在应用验证集时,RF模型准确率较训练集出现大幅下降,GA-RF模型准确率下降幅度较小,具有更好的泛化性与鲁棒性。GA-RF模型在验证集中宏平均后准确率、查准率、召回率和F1值,较RF模型分别提高7.31%、8.47%、7.50%和8.15%,在实现土壤坚实度对大豆产量影响状况分类预测时,表现更佳。

在实际生产应用中,更重要的是对受压实作业影响导致产量大幅下降样本的识别,比较图4和5两种模型预测结果可知,RF对正常类别样本预测性能较好,但针对其他受影响类别样本识别能力弱,对于严重影响类别其识别准确率仅为75%,这将对实际生产造成严重误判,不利于后续压实缓解方案实施。结合改进GA算法的RF模型对不同类别样本区分度更好,其在验证集中对严重影响类别预测准确率达到100%,可有效识别因压实作业使大豆产量受严重影响的样本,可为机械压实消减提供正确指导。

3.2.3 GA-RF与其他机器学习模型对黑土区大豆产量影响预测性能比较

为进一步评估GA-RF模型在土壤坚实度对大豆产量影响预测性能上优越性,分别使用支持向量机(Support vector machines,SVM)、K近邻(Knearest neighbors,KNN)、决策树(Decision tree,DT)和梯度提升树(Gradient boosting decision tree,GBDT)等常用机器学习算法进行建模并同GA-RF验证集结果进行对比分析,结果见图6。

图6 不同模型验证集结果对比Fig.6 Comparison of results of different model validation sets

由图6可见,在验证集中,KNN模型表现最差,其准确率、宏平均查准率、召回率、F1值分别为80.49%、77.99%、75.42%、76.52%;SVM与DT准确率均为85.37%,但在查准率与F1值上SVM略优于DT;GBDT在准确率上和传统RF模型接近,但召回率仅为81.67%,整体性能不如随机森林模型。本文提出改进后随机森林模型性能较SVM、KNN、DT、GBDT更为优异,其准确率及宏平均查准率、召回率和F1值分别为95.12%、95.97%、96.25%、95.96%,较其他模型分别提高7.31%、5.63%、9.38%和10.91%,在对大豆产量受土壤坚实度影响状况预测上具有更好识别能力与鲁棒性。

4 讨论

目前针对机械压实对作物产量影响研究多基于简单线性拟合,缺乏相关预测模型构建,通过GA-RF模型将机器学习方法引入机械压实领域,可有效评估压实风险,为机械化调整方案提供指导。GA-RF模型在土壤坚实度对黑土区大豆产量影响预测上准确率达95.12%,较传统RF模型提高7.31%,有效克服传统随机森林模型参数选择主观性、泛化能力弱的问题,可有效识别受压实影响地块,评估压实风险,为机械压实对作物影响预测提供新思路。

皮尔逊相关分析结果表明,表层(0~30 cm)土壤坚实度增加对黑土区大豆带来减产效应最为明显,与Bottinelli等研究结果一致[20]。在实际生产作业中,农机压实效应直接作用于表层土壤,使表层土壤坚实度增幅较大,阻碍作物根系生长发育,导致作物减产。因此,在黑土区大豆机械化生产过程中,应做好表层土壤疏松工作,避免在土壤含水量较高时进行机械作业[21],同时通过增施有机肥等方式改善土壤结构,提高土壤抗压能力。

试验过程中样本数据量较少,试验结果存在一定局限性,导致分析结果可能存在偏差;构建土壤坚实度对大豆产量影响预测模型,仅针对单一年份数据进行训练及验证,对不同年份机械压实作业对大豆产量影响以及不同受影响程度样本压实缓解措施需进一步研究。

5 结论

本文以黑土区大豆为研究对象进行不同梯度土壤压实试验,通过皮尔逊相关系数评估不同深度土壤坚实度与大豆产量之间相关性,结合遗传算法对随机森林超参数作优化,构建基于GA-RF模型土壤坚实度对大豆产量影响预测模型,结果表明:

a.所测8个土层深度土壤坚实度与大豆产量均呈负相关;不同深度层次土壤坚实度对大豆产量影响效应不同。表层0~30 cm土壤坚实度对大豆产量影响最大,其相关性超过0.8;71~80 cm土壤坚实度与大豆产量相关性最小。

b.GA-RF模型引入遗传算法对传统RF模型超参数作优化,克服传统RF模型中鲁棒性差,泛化能力低的问题;采用GA-RF模型实现土壤坚实度对黑土区大豆产量影响预测准确率达95.12%,较传统RF模型提高7.31%,可更好预测土壤坚实度对黑土区大豆产量影响状况。

c.GA-RF模型实现土壤坚实度对大豆产量影响预测效果较好,其宏平均后查准率、召回率和F1值分别为95.97%、96.25%和95.96%,较支持向量机、K近邻、决策树和梯度提升树等常用机器学习算法中最优模型,分别提高5.63%、9.38%和10.91%,分类性能更佳。

猜你喜欢

黑土压实大豆
自然资源部:加强黑土耕地保护
注意防治大豆点蜂缘蝽
添加木本泥炭和膨润土对侵蚀退化黑土理化性质的影响*
从大豆种植面积增长看我国粮食安全
基于Sentinel-2遥感影像的黑土区土壤有效磷反演
巴西大豆播种顺利
大豆的营养成分及其保健作用
寒地黑土无公害水产品健康养殖发展思路
抓落实要“放权赋能”——要压实责任,不要“层层加码”
一场直面问题、压实担子的大考