APP下载

基于无人机和人工智能的异常林木快速识别技术研究

2019-06-05吕明站朱子魁

安徽林业科技 2019年2期
关键词:林木像素卷积

吕明站 朱子魁

(北京如翼信息技术有限公司北京100000)

受厄尔尼诺等自然现象和国内物流、旅游等行业快速发展的影响,林业病虫害出现了跳跃性传播、突发性爆发、常态发生的特征,从而使林业面临病虫害发生难以及时发现。采用无人机可以实现对大面积林木快速获取影像数据,但是大量图像的人工判读存在速度慢、易误判、遗漏的问题;使用人工智能技术可以充分发挥计算机识别速度快、泛化能力强的优点,实现真正的高效识别。

1 背景描述

目前,林业病虫害随着世界和中国的一些变化出现了一些新的特点。

第一,病虫害持续偏重发展。受全球气候进一步恶化,尤其是厄尔尼诺等持续数十年的影响,导致暖冬、干旱、洪涝,对应的生物的自然规律发生变化。以美国为例,春天的提前到来,导致候鸟的迁徙规律发生变化,使得害虫本身、天敌等发生适应性变化。异常天气尤其是最近几年发生的旱情等导致病虫害活动加剧。

第二,一些特色的产业发展使得病虫害出现了跳跃性发展的新特点。目前中国消费市场发展快速,包括物流、跨境电商、全域旅游、跨境旅游等产业的发展,影响了林业病虫害的传统发展行为。以物流为例,目前物流速度已经从以前的十几天缩减到了小时级别,同时出现了更多的个体从事个性产品的电子商务销售,而保鲜等技术使一些商户在制造手工制品的同时,将可能的病菌带进了产品,快速物流使得病菌活体到达了仅靠本身传播到达不了的地方,因此,病虫害出现了很强的跳跃性发展。加上一些地区在进行绿化等工作时,树种单一,更使得异地病虫害一旦出现,就呈现爆发、快速蔓延的特征。

以目前广泛发生的松材线虫病为例。松材线虫病是松属植物的一种毁灭性流行病,有“松树癌症”之称,该病是由松材线虫所致。受影响松树类型包括:赤松、马尾松、黄松、湿地松、黑松等,其从入侵至今已对我国造成巨大的经济损失,累计致死松树5 亿多株,毁灭松林超过333 333.33 hm2,造成经济损失数千亿元。松材线虫病的发生,其中最大一个明显特征是林木出现异常,如枯萎、色变等。这个特征采用目视是可以实现初步判断的。但是因为病虫害跳跃式爆发的特点,导致传统的例行人工踏查监测无法满足监测需求。因为人工踏查存在不够高效、及时和准确的问题,对于高山等人力不易到达的地区,更是无法监测。

因此,采用航空技术,如无人机,可以实现不受地理限制的大面积、快速数据获取,能够解决林业数据获取问题。但是大量数据的产生,依靠人工肉眼判断,依然速度缓慢,常见33 333.33 hm2的松林航拍,需要1 个月的时间进行人工判读、反复核实,才能达到一定准确率,效率极低。

近年来,人工智能的深度学习开始直接尝试解决抽象认知的难题,并取得了突破性进展。目前,深度学习在图像识别领域, 通过构造深度卷积神经网(Convolutional Neural Networks,简称“CNN”),将Top5错误率进一步降低到11%,完全可以实现机器自主学习,实现图像识别的能力。因此,本方案提出采用无人机+人工智能的异常林业快速识别技术,可以大幅提高发现问题的速度和质量。

2 实验过程

试验主要采用无人机采集平台和人工智能识别技术来实现。选取了一块32 334 hm2的林地,经过两天航拍,六个架次,完成了林地的航空摄影工作。

2.1 无人机采集平台

无人机包括多种类型和多种动力、航时等配置。本次实验采用的平台具体参数选择见表1。

表1 无人机平台选择

本次实验采用了自主研发的低成本电动固定翼无人机LW-01 型号,航时为3 h,飞行高度为900 m,分辨率为10 cm,相机像素为2 500 万,航向重叠度为80%,旁向重叠度为40%。一次航拍航线图像如图1 所示。

1.2 人工智能识别

本次实验依次使用了两种技术:基于语义的图像分割和异常林木自动识别。

1.2.1 基于语义的像素级别的图像分割

无人机拍摄的图片经过处理后,单张照片是无法直接采用人工智能手段进行识别的。

图1 航拍轨迹

以本次实验为例。单张照片大小为35 M,单张照片尺寸为7 952 px×5 304 px。而目前人工智能适用的模型基本都采用32 px×32 px、227 px×227 px、300 px×300 px、800 px×800 px,而人工智能识别要达到准确度较高,就需要基于和训练模型采用相同或者相近尺寸的图片进行识别。因此,必须首先对数据进行分割,而林地里面松树是自然生长的,尤其是大块林地,没有明显的边缘和整齐的边界。而基于阀值、基于边缘检测或是基于区域的传统图像分割方法,基本都是利用图像的低级语义,包括图像的纹理信息、外在形状和颜色等,这种分割方法在复杂场景中的实际分割效果并不理想。

本次实验采用了全卷积神经网络(Fully Convolutional Networks,简称“FCN”),即基于CNN 的语义分割方法,利用图像的内容信息,如特征相似性、高级语义来确定图像的区域划分。基于主流的深度神经网络模型,直接进行像素级别的端到端(end-to-end)的语义分割,这个过程主要涉及到三种技术:卷积化(Convolutional)、上采样(Upsample)、连接结构(Skip Layer)。

与传统CNN 相比,FCN 的卷积化过程将全连接层替换为相应的卷积层,可以接受任意大小的输入图像,而不用要求所有的训练图像和测试图像具有相同的尺寸,进而大大缩减了数据的预处理时间。这种全卷积网络以平移不变性作为基础,只依赖相对空间坐标。如在特定层记Xij为坐标(i,j)处的数据向量,在following layer 有Yij,则Yij处的计算公式如下:

其中k 为卷积尺寸,s 为步长或下采样因素,fks决定了层的类型。

虽然FCN 更加高效,避免由于使用像素块而带来的重复存储和计算卷积的问题,但是其缺点也是比较明显的。首先是得到的结果还不够精细,进行8 倍上采样虽然比32 倍的效果好很多,但是上采样的结果还是比较模糊和平滑,对图像中的细节不够敏感。其次是对各个像素进行分类时并没有充分考虑到像素与像素之间的关系,没有考虑到在基于像素分类的图像分割方法中所使用的空间规整(spatial regularization),导致分割结果缺乏空间一致性。

因此,我们在得到像素分类结果的基础上使用全连接的条件随机场 (fully connected conditional random fields),考虑图像中的空间信息,进而得到具有空间一致性且更加精细的结果。在全连接条件随机场中,能量函数中包括数据项和平滑项两部分,数据项与各个像素所属类别的概率有关,平滑项则控制像素与像素间类别的一致性。本次研究中条件随机场模型所表示的条件概率计算公式如下:

其中的分母为划分函数,表达式为:

采用优化方法训练条件随机场模型参数时,主要任务是计算cost 和grad 表达式,其中cost 表达式为:

则相应的grad 表达式为:

对于grad 表达式中的两个期望值表示模型对特征的期望以及数据对特征的期望,其表达式分别如下:

该函数用训练样本X 和标签Y 进行参数优化,迭代次数和初始学习率等超参数在函数内部给定,调用SGD 算法(即随机梯度下降Stochastic Gradient Descent)实现函数的迭代更新。

相对于传统的条件随机场,全连接条件随机场将图像中的任意两个像素之间的类别关联性都考虑进来,这是对FCN 输出结果的一种优化后处理技术,有效避免了分割过程中对植株的整体错分,使得结果更加精细。识别分割前后如图2、图3。

图2 图像识别分割前

图3 图像识别分割后

1.2.2 异常林木自动识别

为了实现对林业病虫灾害的自动识别,需要完成一定量的异常林业样本标注。本次实验采取采样5%部分的图像数据进行标注,作为模型训练的样本。

由于遥感图像的特殊性,如果要学习100 个特征,则需要500 万个参数,计算时间会大幅增加。解决这种图像识别的有效方法是利用图像的局部性,构造一个部分联通的网络,最常见的是卷积神经网络,利用的是图像固有的特性, 即图像局部的统计特性与其他局部相同。因此,从某个局部学习来的特征同样适用于其他的局部。

深层模型训练需要各种技巧, 如网络结构的选取、神经元个数的设定、权重参数的初始化、学习率的调整、控制等等,即便对这些技巧十分精通,实践中也要多次训练,反复摸索尝试。此外,由于深层模型参数多,计算量大,训练数据的规模庞大,因此需要消耗很多计算资源。如果提高了训练速度,就可以在同样的时间内多尝试网络模型,多调试几组参数,工作效率也会明显提升。深度卷积神经网络结构如图4所示。

本次实验中使用的深度卷积神经网络包括多种类型的网络层次结构。其中卷积层完成对数据特征的非线性提取,使用RELU 函数作为神经元的激活函数。

首先,向CNN 网络Resnet 输入任意大小图片,经过CNN 网络前向传播至最后共享的卷积层。一方面得到供区域建议网络(RPN)输入的特征图;另一方面继续前向传播至特有卷积层,产生更高维特征图,供RPN 网络输入的特征图经过RPN 网络得到区域建议和区域得分,并对区域得分采用非极大值抑制【阈值为0.7】,输出其Top-N 得分的区域建议给RoI 池化层,将之前得到的高维特征图和得到的输出的区域建议同时输入RoI 池化层,提取对应区域建议的特征。其次,将得到的区域建议特征通过全连接层后,输出该区域的分类得分以及回归后的bounding-box。

图4 基于faster-RCNN 的深度卷积神经网络结构示意

单个RPN 网络结构如下:

RPN 的作用:RPN 在CNN 卷积层后增加滑动窗口操作以及两个卷积层完成区域建议功能,第一个卷积层将特征图每个滑窗位置编码成一个特征向量,第二个卷积层对应每个滑窗位置输出k 个区域得分和k 个回归后的区域建议,并对得分区域进行非极大值抑制后输出得分Top-N 区域,告诉检测网络应该注意哪些区域,本质上实现了Selective Search、EdgeBoxes 等方法的功能。

基于faster-RCNN 的深度卷积神经网络,对异常林木识别需要使用特定的数据强化步骤和正则化技巧来尽量避免模型过拟合,提高分类精度。我们在该实验中采用的数据强化技巧包括:图像的平移、缩放、旋转、去均值。这些数据强化技术一方面反映了识别目标在不同分辨率、拍摄角度和高度、光照条件下可能发生的变化,丰富了输入数据的类型,增强深度卷积神经网络模型的适应性,使得该模型可以准确处理的场景更加丰富;另一方面,经过数据强化,在训练过程中卷积神经网络实际接收的训练数据总量得到了极大增加,能够有效减小模型过拟合的风险。

我们在该自动识别系统中使用的正则化技术包括:随机DROPOUT、权重衰减(weight decay)、权重矩加权。通过对优化过程的正则化限制,降低了模型的复杂度,避免模型出现严重的过拟合现象。

3 成果

实验采用了NVIDIA GeForce 24GB GDDR5 Tesla K80 4 块,总体运行时间为7 h。在50 万例测试数据集中,对病变树木识别召回率达到86%,定位精度达到5 m。通过对识别出的枯死松树进行调查,准确率达到94%。实验的效果图如下。

图5 松材线虫病识别

同时,结合异常林木运行的实验成果,项目组进行了某地枯萎林木智能识别项目(补种和产量预估,如图5)、棕榈园种植估产智能计算(监测棕榈种植密度,如图6)、烟草清塘点株(监测烟草种植密度和估产,如图7)。采用无人机和人工智能的结合,可以实现快速、准确识别。

图6 实验效果

图7 烟草清塘点株效果

基于人工智能技术的异常林木监测技术相比人工识别有如下突出优势:

第一,速度快,满足了林业病虫灾害防治的时间需求。以32 334 hm2林场的高分辨率航空遥感数字图像处理为例,该系统能够在7 h 内完成识别,相对传统人工处理时间,效率提高了2 个数量级。

第二,泛化能力强。由于传统人工判别的主观标准不同,并且长时间识别判断过程中很容易出现错判、漏判等问题,因此判别结果中有很多人为误差;而智能识别定位系统采用统一的判别标准,有效提高了识别结果的覆盖率。

4 结论

本研究采用适合林业使用的电动长航时无人机,既解决了人工无法快速获取数据的问题,又解决了常见电动无人机飞行时间短、无法适用于大面积林地监测的问题。采用人工智能技术进行异常林木识别,既可以使监测周期大幅缩短,数据处理速度提高2 个数量级,又能避免因为人为因素出现漏判、误判问题,准确率能够达到90%以上。

本研究所采用的技术对于改变林业异常林木监测技术有重要的意义,但依然存在一定的细节需要进一步研究。其一,人工智能的应用需要基于大量数据,因此在同一地区只有连续展开,积累一定量的历史数据,才能实现高准确率的识别和判定。目前,林业系统存在一定量的存量数据,但是缺乏系统的整理,只有投入一定人力对历史数据进行挖掘,才能使得系统应用起来准确率较高。其二,异常林木可能是多种原因导致,并不完全都是病虫害导致,因此需要在最终结果中,结合地区情况进行抽样,来实现精准判定,开展统防统治或者精准处置疫木。

目前,使用无人机进行监测在农业等领域已经成为常态,引入人工智能技术会大大促进监测技术的落地应用。同时,随着人工智能识别技术在手机端的不断应用,可以结合微观技术,即林业工作人员采用手机进行拍照识别异常林业和病虫害,与无人机监测、病虫害自身的生物特性结合,可以更加精准地判断出问题,也可以分析出病虫害发生的趋势,实现精准预警。另外,基于异常林木的模型,采用人工智能的迁移学习技术,可以实现对类似异常林场、估产、灾害评估等领域的应用,对国家基础产业科学发展带来很强的指导作用。

猜你喜欢

林木像素卷积
像素前线之“幻影”2000
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
“像素”仙人掌
从滤波器理解卷积
林木移植的注意事项
基于傅里叶域卷积表示的目标跟踪算法
试论高大林木的病虫害防治技术
天敌昆虫在林木病虫害防治中的重要作用探讨
ÉVOLUTIONDIGAE Style de vie tactile