APP下载

基于3D视觉传感器边缘识别和追踪算法的研究

2020-05-12赵跃东孙多润郭警中刘焕晓傅成林

锻压装备与制造技术 2020年2期
关键词:卡尔曼滤波滤波器函数

赵跃东,孙多润,郭警中,刘焕晓,傅成林,王 锐,王 勇

(安徽维德工业自动化有限公司,安徽 合肥 230000)

随着人工智能的迅速发展,计算机视觉的应用越来越广泛,例如:智能交通系统、视频监控系统以及基于视觉的行为分析系统等等,虽然经过几十年的发展,但是视觉跟踪问题仍然是一个重要的但是严峻的话题;本文基于3D视觉传感器边缘识别和追踪算法采获取相机运动轨迹,并通过直接交互对点云进行分割。统计飞点滤波器对模型噪声点进行抑制,最后将模型转换到以模型几何中心点为原点,以包围盒最长边为Z轴,以最短边为X轴的模型坐标系。

1 相关技术概述

1.1 3D视觉传感器

机器视觉作为人工智能领域发展最快速的分支之一,从20世纪50年代起主要基于二维图像的分析、识别与解释;到60年代逐渐从二维平面过渡到三维计算机视觉研究,根据二维图像提取出多面体的三维结构,并描述它们的形状空间关系;再到70年代,Marr教授提出了在视觉系统中第一个较为完善的框架-Marr视觉理论[1],同时也将机器视觉的研究推向了一个新阶段;而自80年代以后,愈来愈多新方法、新概念被提出,并且机器视觉的研究不再仅仅局限于实验室,而开始被更多地应用于实际生活、生产中。机器视觉系统主要是用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。

1.2 边缘识别

基于Sobel算子的边缘检测算法定位准确,具有一定的抗噪能力,虽然单边响应差。但其计算简单是一种十分常用的边缘检测算法。围绕该算法的基于FPGA应用的研究也相对较多。Canny边缘检测算法是经典的边缘检测算法中理论最为完善,效果最好的。

1986年Canny提出好的边缘检测算法应该满足的三个准则:信噪比准则,定位精度准则,单边响应准则,同时列出了函数表示。其中要提高信噪比就需要滤波平滑消除噪声,但滤波的平滑效果同样会作用到边缘像素点,使图像边缘模糊,影响到边缘检测的定位精度。

1.3 追踪算法

3D视觉识别系统中还有一个极为重要的部分那就是对目标物体的识别,一般来说按照被识别目标不同可以分为了两种:静态追踪和动态追踪。动态识别是借助于动态视频的基本序列来实现的。不过不管是动态还是静态,识别过程都是固定的首先是对物体进行检测,然后把关键的物体特征进行数据提取,之后按照数据类型对应的规格参量进行分类。关于目标对象的分类也是与提取特征有直接关系的,常见分类包括支持向量机、卡尔曼滤波等等。卡尔曼滤波模型不仅能够涵盖图像在时间空间上的实时信息还具有着很高的鲁棒性,所以被很多专家学者使用在动态图形的追踪领域。卡尔曼滤波理论的主要算法基础是最大似然准则,在该基础下的卡尔曼滤波模型识别能力较低,所以本文选取的是扩展C型卡尔曼滤波模型,在实际检测过程通过加入状态中心参数来实现模型的扩展,然后依次为基本再借助于状态空间的隐射算法建立更加科学的模型。由上文的介绍可知我们已经成功取得实验所需的图像,由于一个物体图像中包含不止一个表情识别的提取特征,因此需要通过计算特定关键点的方式计算出实验图像的所有特征数据,然后借助于扩展性卡尔曼滤波模型进行追踪。

2 算法总体框架

在本章中,基于卡尔曼滤波的多特征协同作用的多目标跟踪算法主要包含2个部分:目标检测、运动目标模型。在目标检测阶段,本论文采用方向梯度直方图和支持向量机来对目标检测检测。

2.1 运动目标检测

在对人脸表情生物特征进行提取过程中,Gabor往往会因为函数配置系统的不同会得到一个函数族群,通过此族群Gabor函数,就可以实现对图像多角度,多尺度的生物特征的提取和研究。二维Gabor函数可以用以下方式进行表示:

由此可知,二维Gabor函数其实就是在复平面上经过了直流偏移和高斯函数加窗处理的振荡波。

其中:x为二维空间点也是滤波器的有效参数。kμ,v是由多个Gabor函数组成,其直主要代表滤波器的中心频率,反映特定方向上所获得额最大响应,σ为常量,exp(ikμ,vx)为复数域的振荡函数。

对Gabor函数进行傅里叶变换,结果如下式所示,对结果分析可知,二维Gabor函数是一个带通滤波器,常用于特征的检测和提取。

鉴于二维Gabor函数可直接被滤波器采用,所以在对二维图像进行Gabor变换的整个过程中也是对二维图像进行滤波进而提取图像特征的过程。在此过程中,原有的图像会在滤波器下进行不同角度的重合,当图像的纹理方向和滤波器中重合时,此时滤波器就会产生及时的反馈,进而达到对图像生物纹理提取的目的。当所提取的生物特征属性角度适宜,范围够广时,此时系统就可以将原图像的纹理特性全部提炼出来。

图1 5尺度8方向的Gabor小波实部

所以说,对图像做的二维Gabor滤波响应应该是一个复数响应,这样的响应由两部分构成,即实部和虚部。图像的Gabor特征都可以用该结果的实部、虚部、幅值和相位进行表示。一般情况下,Gabor函数的实部和虚部在图像变换周围是不够稳定的,但是幅值和相位在这些位置却具有良好的光滑性,不会出现强度较大的震荡,所以,本文在获取图像Gabor特征时采用的是对滤波结果的幅值提取的方法,如下式所示。

为了能够得出Gabor滤波器在图像特征上更加清楚的响应特性,进行下面的试验分析,在对人脸图像进行滤波的时候使用Gabor滤波器,将得到的幅值变化情况提取出来

2.2 目标模型

为了表示每一个运动目标与其他运动目标的区别,本论文可以提取该运动目标本身的固有属性,比如运动目标的外观颜色直方图、可以体现目标颜色空间信息的纹理特征以及目标位置的空间信息,并以此来计算目标与候选目标之间的相似度,进一步地,可以根据目标所处的不同状态(遮挡、不遮挡、背景相似度),调节每一种模型所占的比例。

2.3 跟踪策略

所谓的运动目标检测就是在有序的图像或视频中将感兴趣的目标从相对复杂的背景中找出来。但是,由于目标发生形变、光照出现变化、目标被挡住、背景出现扰动等因素的存在,使运动目标检测变得更加困难,往往会出现目标检测或追踪不正确的问题,有时甚至会使目标丢失。此外还存在外界光照强度的变化,因此借助动态检测来提取运动前景,进而达到减小搜索范围的目的。

在跟踪过程中,每隔一段时间t取出一帧图像,每得到K帧图像,就更新一次背景图像。背景图像中的每个像素的值是这K张图像中所有对应位置的像素的中值。设背景图像为bg(x,y),得到的K张图像的集合为imgs,则有:

跟踪视频中每帧都会生成一张运动二值图,用来标记当前帧中的所有运动像素(与背景图对应像素差值大于阈值th的像素)。对于所有视频帧中的运动像素,将运动二值图中对应位置的值置 1,否则置0。为了解决静止人脸的检测问题,将上一帧所有检测到的人脸区域标记为运动区域(在运动二值图中将所有对应位置标记为1)。将图像灰度化之后,运动二值图的运算可以表示为:

通过跟踪视频采集后的图像都需要经过一定程度的图像预处理,这样对于后续的检测、识别都具有非常明显的优势。

3 算法实验分析

未验证以上算法的可靠性,本文策划了实验来对算法进行分析,如图对毛球罐,风扇盒子和红茶分别进行建模;将待重建的物体置于由杂志页覆盖的旋转平台上(杂志页纹理丰富用以增加 跟踪算法的稳定性),打开摄像机,手动缓慢旋转平台,采集图像,图2左边栏展示的是采集的三个物体的部分视角图像,可以看到由杂志覆盖的旋转平台。采集图像一周后采集月15~25张图片,即可交由重建算法进行物体重建。重建结果可见图2右边栏,可见对于一般的几何体,该方法可以有效地进行重建。表1比较了重建后尺寸与真实尺寸,可以两者的误差基本在1cm以内,基本可以用于位姿估计和机器人抓取规划。

图2 实验重建结果

表1 模型重建值和真值对比

4 结论

实现了一种基于旋转平台与RGBD相机的简易模型重建方法。该方法3D视觉传感器边缘识别和追踪算法采获取相机运动轨迹,并通过直接交互对点云进行分割。统计飞点滤波器对模型噪声点进行抑制,最后将模型转换到以模型几何中心点为原点,以包围盒最长边为 Z轴,以最短边为X轴的模型坐标系。该方法简易可靠,可用于中小型物体的三维重建。

猜你喜欢

卡尔曼滤波滤波器函数
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
浅谈有源滤波器分析及仿真
基于多模谐振器的超宽带滤波器设计
脉冲星方位误差估计的两步卡尔曼滤波算法
函数备考精讲
卡尔曼滤波在雷达目标跟踪中的应用
卡尔曼滤波在雷达目标跟踪中的应用
从滤波器理解卷积
卡尔曼滤波在信号跟踪系统伺服控制中的应用设计
关于函数的一些补充知识