APP下载

基于病虫害声音识别的自动混药系统研究*

2016-12-12陈爱武郭丙琴李

广西职业技术学院学报 2016年5期
关键词:字典音频喷雾

陈爱武郭丙琴李 荣

(1. 湖南科技学院 电子与信息工程学院, 湖南 永州,425199;2. 湖南科技学院 教学质量管理处, 湖南 永州,425199)

基于病虫害声音识别的自动混药系统研究*

陈爱武1郭丙琴2李 荣1

(1. 湖南科技学院 电子与信息工程学院, 湖南 永州,425199;2. 湖南科技学院 教学质量管理处, 湖南 永州,425199)

近年来,中国的农业机械化技术有了明显的进步,农业自动喷雾技术从常量喷雾转变为变量喷雾,实现了自动混药和减少了农药残余问题。但目前的自动在线混药技术主要集中在机械设备和精度方面的研究,如微流量计设计、流量精度控制等,很少考虑病虫害。在此基础上,该文提出了一种基于声学事件识别方法的在线变量喷雾系统,该方法运用了匹配追踪(Matching Pursuit, MP)算法实现病虫害及自然背景等事件的识别,并通过识别结果进行在线混药的技术。实验结果证明了该方法的可行性。

声学事件;变量喷雾; MP算法

引言

随着信息技术、计算机技术和传感网络等技术的快速发展,音视频等信号处理技术在工业、农业等领域有了较广泛的应用[1,2],如通过音频事件识别进行野生动物监控、通过环境声音分类来分析自然环境[3]等等。我国的农业现代化总体水平处于发展阶段,农业机械技术处于发达国家20世纪50~60年代的水平[4],落后欧美发达国家30~50年。由于农业自动化水平不高,农药的喷洒技术也相对落后,国内农药喷雾很大部分是依靠个人的感知或先验知识进行混药,农药的有效利用率仅为20%~40%[5],很难做到根据病虫害实际情况进行喷药,这样不仅影响到病虫害的防治效果,也容易造成农药残留,对人畜和环境带来影响。

目前,国内农药喷雾技术已从常量喷雾技术转变为变量喷雾技术,如静电喷雾、仿形喷雾、自动对靶喷雾、变量喷雾技术[6]等,这种按需喷药技术在很大程度上改变了农业喷雾的观念,但国内对变量喷雾技术的研究主要集中在机械设备自动化和流量控制精度等方面,很少涉及到病虫害本身。国外虽有基于视频及图像处理的变量喷雾系统,但视频信号处理因计算量较大,成本高,且容易受到光线等天气因素的影响,所以,视频或图像信号处理在农业方面的应用并不广泛。在此基础上,本文提出一种基于音频事件识别方法的变量喷雾技术。由于音频信号获取方便,且性能稳定,欧美等许多国家已经有基于音频事件识别的广泛应用,如通过对急救车、消防车及警匪车的报警声音识别来对交通进行调控、通过对火车站等公共场所的哭喊声、枪炮声和尖叫声等声音识别开发出安全监控系统等。声学事件识别方面的文献较多,如Chu,Selina等作者提出的环境声音分类研究[7],Abcouchacra等在2007年提出了识别30秒自然声音方法[8];Valero等在2012年采用分层的方法对环境噪音进行识别[9];Zhuang,Xiaodan等人实现了环境声音识别[10];齐晓旭提出的场景依赖的音频分析[11]等等。本文提出的基于病虫害声音识别的方法是识别混杂在复杂背景音中的病虫害声音,识别方法采用了信号稀疏表示的匹配追踪算法。

1 系统组成

农药变量喷雾系统由电路、机械和控制三个部分组成,电路装置包括模拟、数字信号通道、恒温电路和驱动模块等,机械设备包括喷油器、流量计等设备,控制部分的实现使用虚拟仪器公司的工控机、PXI-6221采集卡和NI-LabVIEW8.5版本软件平台,PXI-6221是NI公司推出的M系列低价位多功能数据采集卡,它具有2路模拟输出,16路模拟输入,24路数字I/O,分辨率为16bit,采样率为250ks/s。

变量喷雾系统可以任意设定流量值,在实际处理过程总是对采集到的电压值进行处理,电压值需要根据流量以及占空比关系进行标定。本项目其他论文已有相关内容,在此不做详细说明[12],系统框图如图1所示。

图1 农药变量喷雾系统

2 声学事件识别算法

2.1 MP算法实现

现实环境的音频事件识别并不是一件容易的事情,因为音频事件总是混叠在复杂的背景声中,目前文献提供的相关的音频事件的识别率也并不算高,如Pasquale Foggia等 (2015)提出一种短时特征和长时特征及听觉字典的方法对玻璃破碎声(Glass breaking)、枪炮声(Gunshot)及尖叫声(Scream)三类音频事件进行识别,其识别率分别是93.6%、81.6%、79.3%。音频事件识别一般包括特征提取、模型训练和判决等三个步骤。音频信号不同于语音信号,语音信号虽属于随机信号,但语音信号具有短暂平稳性特征,且有固有的基音、共振峰等特性,所以语音信号的识别目前已经有非常高的识别率。而音频信号具有类似噪声的平坦谱特征,且现实环境的音频信号复杂多变,很难找到一种能有效区分多种音频信号的特征,所以提高音频信号的识别就要对音频特征进行研究,目前常用于语音信号识别的特征如梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC),短时能量、过零率、频谱质心(Spectral Centroid)、子带能量(Sub-band Energy)等,这些特征也常用于音频信号识别,另外像Gabor原子、深度神经网络(DNN)等方法在音频信号识别上都有不错的表现。本文采用匹配追踪(Matching Pursuit, MP)算法[13],匹配追踪是一种经典的信号稀疏表示方法,其表示形式如(1)式所示。

其中 D ∈ ℝM×N( M ≪ N ), y ∈ ℝM, x ∈ ℝN。y是观察信号,即是被稀疏的信号,D通常被称为字典,因为M≪N,所以是过完备的字典。D={φ1, φ2,…,φγ}中每一列数据φγ称为原子,该方法的目的是将高维的信号空间表示低维的信号空间,即信号的稀疏表示,如式(2)所示。

这里的Γ的是参数集,γφ是原子,信号χ的近似分解可表示如式所示。

R(m)表示残余量,只要给出χ,m和D,MP追踪法的目的就是找到索引值γi和计算αγi,(其中i=1,2,…,m ),最小化残余量R(m)。在迭代算法开始时设定,x(0)=0,和R(0)=x。

MP算法是一种贪婪搜索法,最初,MP算法计算信号χ里字典原子的所有的内积,选最大的内积的原子为第一个元素,所以原子选择的标准可表示(4)式

在第一次迭代后,信号χ减去原子0γφ并获得残余量(0)R,所以

2.2 MP算法字典选择

在MP算法中,目的是使用MP作为一个工具用来提取特征,MP算法选择原子的原理是消除最大的信号残余能量,也就是在每次分解过程中选择信号中最有用的原子进行分解。那么怎样选择MP算法的原子呢?MP分解算法中有不同的原子字典及其性能,如傅里叶变换、Haar字典和Gabor字典等,Gabor字典是MP算法最优的字典之一[14],因为Gabor原子由于有良好的时-频特性,一个Gabor原子的实部可以表示为一个服从高斯分布的能量包络和一个余弦函数的乘积。

其中,n为时间索引,u为时域上的能量中心位置,s为时域能力的衰减速率,控制原子的长度,φ为相位偏移角度,w为原子中心频率,尺度参数au,s,φ,w将每个原子规整到单位能量,即那么通过MP算法可得到音频特征的时域、频域和位置方面的信息,从理论上说可以大大提高特征的区分性。

3 实验与结果分析

3.1 实验数据和实验平台

本文的实验平台是使用Matlab R2016a,PC机为DELL台式电脑,CPU为四核Intel i7-2600,主频为3.4G Hz,操作系统为64位Win7家庭版,PC机器内存为8G。实验数据为真实环境中录制、专业音效数据库和音效下载网站下载,录音设备采用SONY ICD-UX560F数码录音棒,样本采用16位量化误差,采样率为16K Hz。实验数据分布如表3-1所示。

表3-1 实验数据

3.2 实验结果分析

音频数据统一以30ms为帧长,帧移为10ms,加汉明窗滤波,求得信号频谱,并将不同的其他普特征如谱质心,基频等拼接成23维特征,分类器采用高斯混合模型(Gaussian Mixture Model, GMM),高斯混合度设置8,实验采用2-折交叉验证,即将所有数据随机平均分成2份,每份中每个音效类包括100 个样本。在第一次实验中,使用第一份作为训练数据,第二份作为测试数据;在第二次实验中,使用第二份作为训练数据,第一份作为测试数据。实验结果为两次实验分类结果的加和。分实验结果对风声等非平稳信号的识别结果较差,但对这类类似的病虫害发出的声音还是有相当好的识别结果,如表3-2所示。

表3-2 分类结果混淆表

从表3-2的识别结果可以看出,病虫害从4类背景音中的识别率为97.5%,可说明该方法可以检测出是否有病虫害,病虫害的分布,为自动混药提供依据。

4 结论

本论文提出了一种基于病虫害声音识别的在线自动喷雾技术的方法,该方法是识别混杂在不同背景音下的病虫害发出来的声学事件,并根据识别结果分析病虫害的分布情况,该方法提取了4类不同的背景声音及病虫害的MP特征,并通过GMM模型对新特征进行分类和识别,实验结果表明病虫害的识别率为97.5%,证明了该方法可以实现农药自动在线混药技术。

[1]Srbinovska M, Gavrovski C, Dimcev V, Krkoleva A, Borozan V. Environmental parameters monitoring in precision agriculture using wireless sensor networks[J]. Journal of Cleaner Production. 2015,88:297-307.

[2]Ramirez-Villegas J, Lamanna C, van Wijk M, Corner-Dolloff C, Rosenstock T, Girvetz E. Evidence and risk-based planning for a climate-smart agriculture[J]. 2016.

[3]Ma L, Milner B, Smith D. Acoustic environment classification[J]. ACM Transactions on Speech and Language Processing (TSLP). 2006,3(2):1-22.

[4]胡建军, 雷廷宙, 何晓峰, 李在峰,刘军伟, 王志伟, et al. 小麦秸秆颗粒燃料冷态压缩成型参数试验研究[J]. 太阳能学报. 2008,29(2):241-5.

[5]刘俊展, 王小梦, 刘悦上, 刘玉洪.植保机械发展现状及趋势[J]. 現代農業科技. 2010(17):255.

[6]陈爱武, 刘志壮. 基于 LabVIEW 农作物变量喷雾算法研究[J]. 农机化研究. 2013,35(9):44-7.

[7]Chu S, Narayanan S, Kuo C-CJ, editors. Content analysis for acoustic environment classification in mobile robots. AAAI Fall Symposium, Aurally Informed Performance: Integrating Machine Listening and Auditory Presentation in Robotic Systems; 2006.

[8]Abouchacra K, ŁĘTOWSKI T, Gothie J. Detection and recognition of natural sounds[J]. Archives of Acoustics. 2007,32(3):603-16.

[9]Valero X, Alías F. Hierarchical classification of environmental noise sources considering the acoustic signature of vehicle pass-bys[J]. Archives of Acoustics. 2012,37(4):423-34.

[10]Zhuang X, Zhou X, Hasegawa-Johnson MA, Huang TS. Real-world acoustic event detection[J]. Pattern Recognition Letters. 2010,31(12):1543-51.

[11]齐晓旭. 场景依赖的关键音频事件检测 [D].北京邮电大学,2013.

[12]陈爱武, 刘志壮, 郭丙琴. 基于LabVIEW 的微流量控制系统的研究[J]. 控制工程. 2014,21(2):168.

[13]Mallat SG, Zhang Z. Matching p u r s u i t s w i t h t i m e-f r e q u e n c y dictionaries[J]. Signal Processing, IEEE Transactions on. 1993,41(12):3397-3415.

[14]Chu S, Narayanan S, Kuo C-C. Environmental sound recognition with time–frequency audio features[J]. Audio, Speech, and Language Processing, IEEE Transactions on. 2009,17(6):1142-1158.

Study on the Automatic Pesticide Mixed System Based on the Acoustic Recognition of Pests

CHEN Ai-wu,GUO Bing-qin,Li Rong
(1.Hunan University of Science and Engineering, School of Electronics and Information Engineering, Yongzhou, Hunan 425199 2.Hunan University of Science and Engineering, Teaching Quality Management Office, Yongzhou, Hunan 425199)

China's agriculture mechanization technology has made a significant progress in recent years. To achieve the on-line pesticide-mixture technology and reduce pesticide residues, the spray technology has been changed from the constant one to the variable one. However, the researches of the automatic liquid-mixture systems are mainly concentrated in the mechanical equipment currently, such as the research of micro-flow meter design and the flow accuracy control and so on while there is little concern on the distribution of the pests. On this basis, this paper proposes a new idea of pesticidemixture based on the recognition of acoustic events of pests, and the Matching Pursuit algorithm is also proposed to identify the pests and the environment sound in the study. The results show the feasibility of the proposed method.

acoustic events; the variable spray; the MP algorithm

S499

A

1674-3083(2016)05-0011-04

2016-10-08

湖南省科学技术厅科技计划项目:变量喷雾系统嵌入式实施中的关键问题研究(2014FJ3143);2015年永州市科技计划项目(永科发〔2015〕9号,No.22)。

陈爱武(1976-),男,湖南邵阳人,副高职称,在读博士研究生,Email: aiwu_chen@163.com。

猜你喜欢

字典音频喷雾
能追光、充电、照明和喷雾的太阳伞
保湿喷雾大测评!效果最惊艳的才20块!
还原喷雾
字典的由来
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
大头熊的字典
音频分析仪中低失真音频信号的发生方法
正版字典
Pro Tools音频剪辑及修正