APP下载

基于GPU的SAR回波仿真高效实现方法

2016-11-11景国彬张云骥李震宇孙光才邢孟道

系统工程与电子技术 2016年11期
关键词:同心圆线程方位

景国彬,张云骥,李震宇,孙光才,邢孟道,保 铮

(1.西安电子科技大学雷达信号处理国家重点实验室,陕西 西安 7100712.西安电子科技大学信息感知技术协同创新中心,陕西 西安 710071)



基于GPU的SAR回波仿真高效实现方法

景国彬1,2,张云骥1,李震宇1,2,孙光才1,2,邢孟道1,2,保铮1,2

(1.西安电子科技大学雷达信号处理国家重点实验室,陕西 西安 7100712.西安电子科技大学信息感知技术协同创新中心,陕西 西安 710071)

针对合成孔径雷达(synthetic aperture radar,SAR)分布式场景回波仿真计算量巨大的问题,提出了一种结合改进的同心圆算法与图形处理器(graphics processing unit,GPU)技术的高效SAR回波仿真方法。首先,针对常规同心圆算法精度较低造成的图像信噪比低的问题,提出了一种改进的同心圆算法。其次,为了充分发挥GPU处理核之间的并行优势,对该算法的GPU并行处理进行了深度优化,进一步提升了仿真速度。具体方法是,根据并行度的高低设计核函数,确定了先采用“线程外推”实现部分目标回波的同心圆累加,再用“归约相加”实现所有目标回波的累加。最后,与常规GPU方法进行了实验对比,验证了所提方法的精确性和高效性。

合成孔径雷达; 分布式场景; 改进同心圆; 图形处理器; 并行处理

0 引 言

合成孔径雷达(synthetic aperture radar,SAR)能够全天时、全天候地对目标或场景进行观测,在灾害监测、资源勘查,尤其是军事和民用领域有着巨大的应用空间[1-2]。在新型SAR系统付诸实践之前,为对该系统进行评估和验证,一般需要对回波信号进行精确仿真,其中,回波仿真包括点目标和分布式场景目标。对于点目标,传统的SAR回波仿真方法(时域逐点扫描法)即可产生回波数据[3],但该方法效率较低。面对日益增长的高分辨宽测绘带要求,需要对分布式场景目标进行回波仿真。在这种情况下,仿真点数可能骤增,甚至达到几百万点,导致计算量巨大。此时,传统仿真方法的计算效率是难以容忍的。

针对SAR回波仿真,国内外学者做出了许多研究。文献[3]针对点目标回波仿真进行说明,但是并没有对场景目标仿真进行延伸。文献[4]对分布式场景目标信号进行了时域和频域对比,但是没有对场景目标仿真的运算效率进行优化。文献[5]对地面起伏的三维场景SAR回波仿真进行了大量工作,不过其并没有对计算量巨大问题进行优化。文献[6]提出了一种基于距离时域脉冲相干的优化算法,但其没有从根本对回波产生这个重复运算进行优化;为了大幅度提高计算效率,文献[7]将具有并行处理功能的图形处理器(graphics processing unit,GPU)应用到SAR回波仿真中。虽然该方法利用GPU提高了计算效率,但采用的回波仿真方法仍然是传统的时域回波仿真算法。对此,文献[8]结合了同心圆算法和GPU进行SAR回波仿真,一方面,该方法采用的同心圆算法精度不高,会导致图像质量恶化;另一方面,该方法没有对GPU设计进行深入优化,效率依然较低,其相对常规的时域回波仿真CPU实现方法,场景目标仿真的加速比仅提高了9.27倍。

针对以上问题,本文提出了一种适用于大场景目标的SAR回波的快速仿真方法。首先,针对常规的同心圆仿回波算法精度不高的问题,提出了一种基于多倍插值的同心圆算法。同时结合GPU对改进的同心圆算法的两个层次的并行性进行详细分析,确定了先采用“线程外推”的方法实现部分点目标回波的同心圆累加,再用“归约相加”思想实现所有的点目标回波的同心圆累加,最后再利用流技术进行加速处理,从而快速得到场景目标的回波。最后对于像素点数为2 048×2 048的实测SAR图像进行回波仿真,本文方法仅需166.6 s,因此本文方法可用于回波仿真实时处理。

1 改进同心圆算法

1.1常规同心圆算法

SAR录取回波的同心圆分布示意图如图1所示,雷达工作在条带模式,载机平台高度为H,以速度V沿X轴飞行,场景目标与雷达最近距离是R0,雷达的采样频率为Fs,对应的距离向采样间隔为

(1)

式中,c表示光速。

图1 同心圆分布示意图Fig.1 Sketch map of concentric circles distribution

不同点目标到雷达相位中心的距离是不一样的,它们将分布在不同的距离单元内。当雷达接收机以采样率Fs对回波进行离散采样时,距离间隔小于δr的相邻点目标将落到同一个距离门内,其能量也累加在同一距离单元上,形成了许多以雷达相位中心为原点的同心圆,位于相同圆上的所有点目标的回波最终会累加在同一个距离单元上。于是,当按每个同心圆累加点目标时,得到的正好是一维距离像,再利用傅里叶变换到频域乘上调频因子,反变换回时域便得到场景的回波数据。处理过程中避免了对每个点目标分别乘以调频项的操作,大大减少了运算量,以上是常规同心圆法提高运算效率的原因所在。

1.2改进的同心圆算法

分布式场景目标仿真过程中,要得到精确的SAR回波,关键在于确定目标的后向散射系数σ,此时的SAR基准图像的灰度值可以表征点目标的后向散射系数的幅度值(基准图像已丢失相位信息)。因此,一般采用基准SAR图像像素点(m,n)处的灰度值作为对应该位置点目标的后向散射系数σ(m,n),即

(2)

式中,P(m,n)表示场景中(m,n)点的图像的灰度值;ξ(m,n)表示为了模拟(m,n)点处目标因电磁特性、地表粗糙度等原因而附加的随机相位。倘若不考虑这个附加相位,基准SAR图像实质上等价为理想导体平面,雷达回波相干分量作用明显,成像处理时会出现明显的“黑带”现象,影响成像效果。

对于常规同心圆算法,场景中所有点目标是按距离采样间隔的整数倍关系分布的,距离相近的点目标可能因采样间隔倍数相同而最终会落在同一个距离单元,这样使得采样点幅度值可能不是点目标的真实主瓣峰值,得到的并不是精确的SAR回波,因此经过成像处理得到的图像失真,图像信噪比较低。

针对常规同心圆算法得到回波不精确这个问题,本文提出了一种改进的同心圆算法,即在同心圆的处理基础上对采样点的幅度值进行了多倍插值处理,从而得到点目标的真实主瓣峰值,并将主瓣峰值点对应新的斜距作为计算点目标相位的距离。通常情况下,SAR图像中点目标都满足sinc分布的,因此本文为了模拟图像幅度起伏真实的散射特性,使得每个点目标的幅度满足sinc分布特性,本文在划分同心圆后,对每个同心圆上点目标的灰度值(后向散射系数的幅度值)进行了多倍的sinc插值,找到点目标像素的主峰值点,使得点目标的后向散射系数精度得到提升,同时计算得到点目标的新斜距历程。当然插值操作会带来额外的计算量,因此本文设计一个插值的核函数在GPU并行计算平台下调用,整体运算效率还是非常高的。

以下具体讨论用改进同心圆仿场景面目标的SAR回波的处理步骤。

如图1所示,设某一方位时刻tm,场景中任意一点到雷达的距离为R,则它所对应的同心圆圈数为

k=round(R/δr)

(3)

式中,round(·)为四舍五入运算。

对场景图像中所有点进行以上运算,即得到同心圆的分布情况,假设此方位时刻第k个同心圆上共有波束照射范围内的Mk个点目标,这Mk个点目标会落在同一个距离单元内,它们的包络距离是相同的。然而为了模拟图像真实的散射幅度,使得每个点目标满足sinc分布特性,本文对第i个点目标进行了多倍的sinc插值,将插值后得到的主峰值σi作为其后向散射系数,并将得到主峰值的斜距作为计算相位的距离Ri。同时,点目标回波信号的方位信息要比包络信息更加敏感,要保证方位相位信息的完整性,所以各点的方位相位信息不能近似。于是第k个同心圆中的第i个点目标的信号为

(4)

于是,第k个同心圆内所有点目标的回波Sk可以表示为

(5)

式中,Mk表示第k个同心圆内的点目标个数。

遍历扫描完场景中的所有同心圆后,得到所有点目标的雷达回波为

(6)

式中,N表示场景里所有的同心圆个数。

(7)

在下一个方位采样时刻,重复以上过程。最终得到整个合成孔径时间T的SAR原始回波数据S_echo为

(8)

式中,tr表示距离快时间的时域表达;tm表示方位慢时间的时域表达;Tr表示场景距离向的采样时间;Tm表示雷达合成孔径时间。

2 基于GPU的同心圆算法并行设计

本节主要讨论如何基于GPU的编程架构对改进的同心圆算法进行并行设计优化,以进一步提高运算效率,满足实际工程应用中的实时信号处理需求。

2.1改进同心圆算法的并行性分析

本文对算法进行并行设计,首先要对算法的并行性进行分析,并以并行度的高低来设计核函数。本文对改进的同心圆算法进行如下两个层次的并行分析:

(1)某方位时刻不同点目标生成回波的并行性

场景目标是由几十万或上百万个点目标构成的,每个点目标产生回波的过程是相互独立的,存在高度的并行性。在所有目标的回波累加为雷达回波的过程中,可以采用“归约相加”的思想[8],大大节省数据累加时间。

(2)不同方位时刻SAR生成回波的并行性

合成孔径雷达在飞行录取回波过程中,按脉冲重复频率(pulse recurrence frequency,PRF)发射脉冲并接收回波,每个回波生成过程要扫描雷达波束范围内所有的点目标,累加为一个回波。不同方位采样时刻,生成雷达回波是完全相互独立的,可以实现完全的并行。

2.2并行优化设计

GPU的编程架构是以大量线程来实现高吞吐量的数据的并行运算的,线程间的独立性越强,可并行效果越明显[10]。基于改进的同心圆算法的SAR回波仿真方法,其处理不同方位采样时刻的雷达回波是相互独立的,处理每个点目标的回波也是相互独立的,因此非常适合用GPU进行并行计算,可以极大提高运算效率,满足实时处理的需求。

2.2.1第1个层次并行优化

根据以上并行性分析可知,第1个层次的并行度要远远高于第2个层次的并行度。因此,第1个层次在核函数设计中,只要开辟足够多的线程,每个线程计算一个点目标的回波。然而实际处理过程中,GPU的线程数目是有限的,因此本文又结合了“线程外推”的方法[7,11],可以使千量级的线程遍历数十万量级的点目标。同时,为了进一步提高运算效率,可以采用了多个GPU并行处理不同方位时刻的脉冲。因此本文中以简化的两个GPU为例进行算法设计的映射关系如图2所示。

图2 GPU并行优化设计Fig.2 GPU parallel optimized design

首先通过CPU分配好物理内存和设备显存,初始化输入,并读入扫描场景中所有的点目标的坐标信息、散射系数等,通过总线发射到显存空间,再在GPU中用多线程并行扫描所有的点目标,生成所有的点目标的回波。其中,编号是0和1的GPU设备端分别生成偶数和奇数序号方位时刻的点目标回波。为了节省内存开销,先采用“线程外推”的方法实现部分点目标回波的同心圆累加,再用“归约相加”思想实现所有的点目标回波的同心圆累加。所有方位时刻累加完成后,再乘上调频项得到回波仿真数据,最后传回CPU进行保存和输出。

在GPU优化处理过程中,涉及到第1个层次并行优化的几个关键步骤,现详细讨论如下:在用一个线程计算一个点目标的回波时,假设在某方位时刻,扫描场景中共有M×N个点目标,生成目标回波的示意图如图3左侧虚线框内所示,框内一个小方格代表一个点目标生成的回波,每个单指令多数据流(single instruction multiple data,SIMD)处理单元负责生成其所对应的块内的点目标回波,并根据同心圆法累加为一个回波。块与块之间的回波累加完成时,生成的回波才是该方位时刻对应的雷达回波。

图3 流技术加速模式示意图Fig.3 Sketch map of stream acceleration mode

图4 回波归约相加的示意图Fig.4 Sketch map of echo reduction adding

2.2.2第2个层次并行优化

对于第2个层次的并行,本文采用了流的思想来加速SAR回波生成的过程。统一计算设备架构(compute unified device architecture,CUDA)流在加速算法执行效率方面起着重要作用。假设在每个GPU上采用了S个流,每个流所对应的方位采样时刻的雷达回波如图3所示的分配模式。为了均衡计算量,每个流所对应的方位时刻的雷达回波的如下分配模式,即让第1个流对应第(0,S,2S…)个方位时刻,第2个流对应第(1,S+1,2S+1…)个方位时刻,以此类推,最后以宽度优先的方式将有关操作放入流队列中。本文中的GPU实验是在NVIDIA公司的Tesla K20C运算显卡上进行的,在SAR回波仿真中,每个显卡上选用了4个流来并行加速计算过程。采用流可以极大地消减CPU与GPU内存互访时的时间开销,极大提高回波仿真的运算效率。

2.3内存分配设计

在GPU内存中,全局内存没有缓存,访问时延非常长;共享内存是GPU片内的高速存储器,同一块内的所有线程访问速度快于全局内存。本文通过多次测试实验可知,当距离单元数较小,一般小于4 096个距离采样单元,可以使用共享内存来实现线程块内各个点目标回波的归约相加,当距离单元数较大时共享内存就会不够用,此时选用全局内存。本文为了提高并行程序的适用性,将程序分成在线程块内生成所有目标的回波并累加、块与块间的回波累加这两个核函数。线程块内回波的累加可用共享内存,块间回波累加则用全局内存。此外,GPU直接通过总线访问,既减少了全局内存的使用,又提高了访问速率;同样,本文还结合CUDA流计算所有方位时刻的雷达回波,并将结果传给CPU时,将回波分配成页锁定内存,并以宽度优先的方式将这些操作过程放入流队列中。本文通过对内存进行合理地分配,极大提高了GPU运算速率。

2.4基于双GPU的改进同心圆算法设计

结合SAR仿回波的同心圆算法与GPU的并行设计方案,得到基于双GPU的改进同心圆并行算法流程如图5所示。GPU是CPU的协处理器,两个GPU中的流程是完全一样的。

图5 基于双GPU的改进同心圆仿SAR回波流程图Fig.5 Flow diagram of modified concentric circles algorithm based on double GPU

3 回波仿真和成像分析

在回波仿真实验中,选用表1所示的仿真平台和具体仿真环境参数,并选用如图6所示的某机场SAR图像作为基准图像,共有2 048×2 048个像素点。并分别利用常规同心圆算法和本文基于GPU的改进同心圆算法对基准图进行回波仿真,仿真过程中都扫描1 728×1 784=3 082 752个点目标。然后利用常规的线频调变标算法对产生的回波数据分别进行成像处理,得到如图7和图8所示的成像结果。

表1 仿真平台和环境参数

图6 SAR回波仿真的基准图像Fig.6 Original image of SAR

图7 常规同心圆算法仿回波的成像结果Fig.7 Imaging result of traditional concentric circles

图8 本文方法仿回波的成像结果Fig.8 Imaging result of modified concentric circles

为了比较常规同心圆算法和本文方法成像结果的细节信息,将图7和图8中的同一区域用红色方框标注,并将方框里的局部图像取出来,如图9和图10所示。通过对比分析图9和图10,可以直观看出,本文方法仿回波的成像结果与常规同心圆方法质量相当。

为了测试本文GPU并行优化设计的计算效率,将本文方法和文献[8]中的GPU仿回波算法两者进行了耗时对比。为了保证测量数据的有效性和对比性,本文方法采用单个GPU进行处理,设定相同的雷达载机的飞行轨迹,并把所有的点目标均设置在扫描范围内。测量时间统计结果如下表1所示,其时间对比图如图9所示。其中,加速比定义为波束扫描相同散射点数时文献[8]GPU方法耗时和本文方法GPU方法耗时比例。

图9 常规同心圆算法仿回波的局部成像结果Fig.9 Partial imaging result of traditional concentric circles

图10 本文方法仿回波的局部成像结果Fig.10 Partial imaging result of modified concentric circles

实验序号扫描点数文献[8]GPU耗时/s本文GPU耗时/s加速比11024181.216.51124096195.916.511.9316384239.616.914.2465536296.418.316.25262144461.224.119.1610485761038.447.521.8741943043819.2166.622.9

从表2可以看出,在前3组实验中,随着扫描点数增加,文献[8]方法和本文方法的耗时都是缓慢增长的;从第4组实验开始,随着仿真扫描点数超过6万点,文献[7]耗时和本文方法的耗时都开始线性增长了,不过不同的是,在扫描相同点数情况下,本文采用的改进同心圆GPU实现方法耗时相对还是非常短的,其中,在同等扫描2 048×2 048=4 194 304个散射点时,本文方法相对文献[8]所提方法的加速比达到了22.9倍。其原因是该本文对GPU进行了两个层次的优化处理,所以随着仿真点数的增多,本文方法并行优势的发挥越来越明显,为了更直观地反映并行处理优势,将表2绘制成图11,其中横坐标表示每个脉冲扫描的点目标个数;纵坐标表示仿真实验的测量时间。

图11 两种GPU设计的损耗时间对比曲线图Fig.11 Consuming-time curves of two methods of GPU designing

4 结束语

SAR回波仿真技术一直以来都是SAR系统仿真中的重要组成部分,当仿真扫描大范围场景时的计算量是相当巨大的,关于该技术的高效设计一直是SAR领域中的研究热点。本文提出的改进同心圆算法保证了仿真精度,提高了图像的信噪比;同时本文引入了GPU,进行了深度优化,并在对GPU并行设计进行了优化处理,极大地提高了仿真效率,可以满足实时需求。对于大范围的扫描场景,本文中的并行设计方案优势明显,可以很好地解决运算效率的难题。此外,本文还可以应用于多模式SAR回波仿真中。

[1] Xing M D,Bao Z,Li Z F,et al.Advancement of radar imaging algorithm[M].Beijing:Publishing House of Electronics Industry,2014:11-45.(邢孟道,保铮,李真芳,等.雷达成像算法进展[M].北京:电子工业出版社,2014:11-45.)

[2] Zhang S X,Xing M D,Xia X G.Robust clutter suppression and moving target imaging approach for multichannel in azimuth high-resolution and wide-swath synthetic aperture radar[J].IEEE Trans.on Geoscience and Remote Sensing,2015,53(2):687-709.

[3] Lü H,Chen T Q.One method of point target’s raw data based on law of spaceborne SAR’s motion[J].Experiment Science & Technology,2006,2(1):27-30.(吕辉,陈天麒.一种SAR的点目标回波生成方法[J].实验科学与技术,2006,2(1):27-30.)

[4] Wang B L,Sun J P,Wu S L,et al.A quick simulation algorithm for SAR raw data with extended scenes[J].Journal of Telemetry,Tracking and Command,2006,26(6):33-36.(王伯岭,孙进平,吴双力,等.扩展场景的SAR回波信号快速仿真算法[J].遥测遥控,2006,26(6):33-36.)

[5] Ren S H.Research on the SAR raw signal simulation technology of three-dimensional scene[D].Changsha:National University of Defense Technology,2007.(任三孩.三维场景SAR回波模拟技术研究[D].长沙:国防科学技术大学,2007.)

[6] Wang L B,He Z H,Zhao H J.A simulation of distributed target’s raw-data in synthetic aperture radar[J].Journal of Air Force Radar Academy,2006,20(2):94-97.(王力宝,贺照辉,赵红军.SAR分布目标原始回波数据模拟[J].空军雷达学院学报,2006,20(2):94-97.)

[7] Qin J,Zhang Z M.Implementation and optimization of SAR echo simulation based on GPU[J].Science Technology and Engendering,2014,14(13):85-89.(秦洁,张志敏.基于图形处理单元架构的合成孔径雷达回波仿真实现与优化[J].科学技术与工程2014,14(13):85-89.)

[8] Li B.Research and implementation of SAR echo signal simulation based on GPU[D].Xi’an:Master Degree Thesis of Xidian University ,2014.(李博.基于GPU的SAR回波信号模拟的研究与实现[D].西安:西安电子科技大学,2014.)

[9] Jin X,Ko S B.GPU-based parallel implementation of SAR imaging[C]//Proc.of the International Symposium on Electronic System Design,2012:125-129.

[10] Sandem J,Kandrot E.CUDA by example:an introduction to general—purpose GPU programming[M].Nie X J,Trans.Beijng:China Machine Press,2011:134-152.(Sandem J,Kandrot E,GPU高性能编程CUDA实战[M].聂雪军,译.北京:机械工业出版社,2011:134-152.)

[11] Zhu H,Xu H,Feng L.Application of GPU for missile-borne SAR raw signal simulation[C]//Proc.of the 2nd International Conference on Artificial Intelligence,Management Science and Electronic Commerce,2011:2816-2820.

[12] Diego C,Debora P,Pierfrancesco L.Exploiting MIMO SAR potentialities with efficient cross-track constellation configu-rations for improved range resolution[J].IEEE Trans.on Geoscience and Remote Sensing,2011,49(1):38-52.

[13] Xiang D L.Research on the Evaluation Techniques of Similarity Measure in SAR Images[D].Changsha:National University of Defense Technology,2012.(项德良.SAR图像相似度评估技术研究[D].长沙:国防科学技术大学,2012.)

Efficient realiazation of SAR echo simulation based on GPU

JING Guo-bin1,2,ZHANG Yun-ji1,LI Zhen-yu1,2,SUN Guang-cai1,2, XING Meng-dao1,2,BAO Zheng1,2

(1.National Lab of Radar Signal Processing,Xidian University,Xi’an 710071,China; 2.Collaborative Innovation Center of Information Sensing and Understanding,Xidian University,Xi’an 710071,China)

Due to the low efficiency of synthetic aperture radar (SAR)raw data generation in distributed scene,a high-efficient SAR echo simulation method based on the modified concentric circles algorithm and the graphics processing unit (GPU)is proposed.Firstly,an improved concentric circles algorithm is proposed to avoid cases of low signal to noise ratio (SNR)when the traditional algorithm whose precision is low is used.Secondly,the parallel processing of GPU is deeply optimized in order to lift the efficiency of the simulation and make full use of the parallel advantages in GPU kernel.Then,the proposed method adopts “thread extrapolation” to accumulate partial data and realize the whole data generation via “reduction adding”.Finally,simulation results validate the high precision and eficiency of the proposed approach.

synthetic aperture radar (SAR); distributed scene; modified concentric circles; graphics processing unit (GPU); parallel processing

2015-12-11;

2016-05-30;网络优先出版日期:2016-07-14。

国家高技术研究发展计划(863计划)(2013AA122202);国家自然科学基金 (61222108,61301292)资助课题

TN 957

ADOI:10.3969/j.issn.1001-506X.2016.11.07

景国彬(1990-),男,博士研究生,主要研究方向为多通道SAR成像、GPU并行计算。

E-mail:Guobinjing01@163.com

张云骥(1990-),男,硕士研究生,主要研究方向为SAR成像、GPU并行计算等。

E-mail:jinshi95588@163.com

李震宇(1991-),男,博士研究生,主要研究方向为SAR成像。

E-mail:zhenyuli_2012@sina.com

孙光才(1984-),男,副教授,硕士研究生导师,博士,主要研究方向为SAR成像、动目标检测。

E-mail:rsandsgc@126.com

邢孟道(1975-),男,教授,博士研究生导师,主要研究方向为SAR成像、ISAR成像、动目标检测。

E-mail:xmd@xidian.edu.cn

保铮(1927-),男,中国科学院院士,博士研究生导师,主要研究方向为自适应信号处理、阵列信号处理、雷达成像和目标识别。

E-mail:zhbao@xidian.edu.cn

网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160714.1455.012.html

猜你喜欢

同心圆线程方位
同心圆梦再出发
认方位
基于C#线程实验探究
同心圆梦再出发
绣出里下河畔最美“同心圆”
同心圆变变变
基于国产化环境的线程池模型研究与实现
线程池调度对服务器性能影响的研究*
借助方位法的拆字
基于TMS320C6678的SAR方位向预滤波器的并行实现