基于GPU的多模式SAR成像加速研究.pdf
《基于GPU的多模式SAR成像加速研究.pdf》由会员分享,可在线阅读,更多相关《基于GPU的多模式SAR成像加速研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 21 卷 第 8 期2023 年 8 月Vol.21,No.8Aug.,2023太赫兹科学与电子信息学报Journal of Terahertz Science and Electronic Information Technology基于GPU的多模式SAR成像加速研究白澜1,3a,魏仁乐*2,3a,郭拯危3a,3b,3c,赵建辉3a,3b,3c,李宁3a,3b,3c(1.郑州科技学院 信息工程学院,河南 郑州 450064;2.中共开封市委党校,河南 开封 475001;3.河南大学 a.计算机与信息工程学院;b.河南省大数据分析与处理重点实验室;c.河南省智能技术与应用工程技术研究中
2、心,河南 开封 475004)摘要:针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于 GPU 的多模式 SAR 统一成像并行加速方法。为充分利用 GPU 的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式 SAR 成像的计算效率,最高加速比达到 55.62,解决了 GPU 显存空间利用率较低的问题。关键词:合成孔径雷达;图形处理器;多模式;并行加速中图分类号:TN958 文献标志码:Adoi:10.11805/TKYDA2021142Multi-mode SAR imaging a
3、cceleration based on GPUMulti-mode SAR imaging acceleration based on GPUBAI Lan1,3a,WEI Renle*2,3a,GUO Zhengwei3a,3b,3c,ZHAO Jianhui3a,3b,3c,LI Ning3a,3b,3c(1.College of Information Engineering,Zhengzhou Institute of Science and Technology,Zhengzhou Henan 450064,China;2.CPC Kaifeng Municipal Party S
4、chool,Kaifeng Henan 475001;3a.College of Computer and Information Engineering;3b.Henan Key Laboratory of Big Data Analysis and Processing;3c.Henan Engineering Research Center of Intelligent Technology and Application,Henan University,Kaifeng Henan 475004,China)AbstractAbstract:In view of the problem
5、 of low computational efficiency in multi-mode Synthetic Aperture Radar(SAR)imaging processing,a parallel acceleration method is proposed for multi-mode SAR imaging based on Graphic Processing Unit(GPU).In order to make full use of GPUs memory resources and improve the efficiency of the algorithm,in
6、 the parallel computing part of the algorithm,the large-scale data parallel is carried out in the matrix transposition and matrix multiplication by using shared memory.The experimental results show that the algorithm greatly improves the efficiency of multi-mode SAR imaging,and the maximum accelerat
7、ion ratio reaches 55.62,which solves the problem of low utilization of GPU.KeywordsKeywords:Synthetic Aperture Radar;Graphic Processing Unit;multi-mode;parallel acceleration合成孔径雷达(SAR)在军事和民生领域应用广泛。为满足不同的观测需求,要求 SAR 图像具有不同的分辨力和场景覆盖范围,越来越多的 SAR 都具备多种工作模式。此时,大数据量的快速处理成为多模式 SAR 成像的主要需求之一1。近年来,图形处理器(GPU)
8、的浮点运算能力和存储带宽得到大幅提升,为多模式 SAR 高效处理提供了很好的平台。统一计算架构(Compute Unified Device Architecture,CUDA)的推出,极大促进了 GPU 在海量数据、高性能计算领域的发展。文献2提出了基于 GPU 的针对较大数据量的 SAR 成像方案,突破了 GPU 显存不能容纳一景SAR 数据的限制,满足大多数情况下的实时性要求。文献3利用 GPU 提高了线性调频尺度变换(Chirp Scaling,CS)成像算法处理速率,但该方法的 GPU 显存占用较大。2018 年,张帆等4利用云计算方法对多模式 SAR 成像进行加速,运行效率提高了近
9、 40 倍。本文提出一种基于 GPU 的多模式 SAR 统一成像并行加速方法,利用共享内存对矩阵转置、相位相乘等进行文章编号:2095-4980(2023)08-1037-06收稿日期:2021-04-07;修回日期:2021-05-12基金项目:国家自然科学基金资助项目(61871175);河南省高等学校重点科研资助项目(19A420005;21A520004),河南省科技攻关计划资助项目(192102210082;212102210093;212102210101);河南省青年人才托举工程资助项目(2019HYTP006)*通信作者:魏仁乐 email:.太赫兹科学与电子信息学报第 21
10、卷并行加速,大幅提高成像效率及 GPU 显存利用率。1多模式 SAR 统一的成像算法在星载 SAR 多模式成像技术上,国内外对条带模式、滑动聚束模式、Scan SAR 模式和滑动扫描(Terrain Observation with Progressive Scans SAR,TOPS SAR)模式有了很多研究5-7。多模式 SAR 的统一成像流程如图 1所示。1.1 去斜预处理本文使用 2 步式预处理算法去除方位向的频谱混叠8。将需要进行预处理的 SAR 回波信号与去斜因子H11进行相位相乘后进行方位向傅里叶变换,再与去斜因子H12进行相位相乘完成去斜处理。H11=exp(j2Vr2cos3
11、()c()iD2Rref)i=-I/2I/2(1)H12=exp(j2Vr2cos3()c()nD2Rref)n=-P/2P/2(2)式中:I 和 P 分别为原始数据采样点数和输出数据采样点数;Vr为卫星速度;c为波束中心指向;Rref为参考距离;为慢时间变量;=1/B,B为信号带宽。azimuth FFTrange FFTrange IFFTChirp Scaling range scalingbulk RCMC range compressionH2H3Chirp Scaling corestripmapraw dataslidingspotlightraw dataTOPSraw dat
12、aScanraw datastripmap imagesSPECAN derampH5azimuth FFTslidingspotlight imagesScanimagesTOPS imagesazimuth FFTderamp factor 1H11deramp factor 2H12azimuth IFFTazimuth compression(stripmap,spotlight spotlight)azimuth Scaling(Scan,TOPS)H4pre-processingpost-processingFig.1 Unified imaging process of mult
13、imode SAR图1 多模式SAR的统一成像流程 1038第 8 期白 澜等:基于GPU的多模式SAR成像加速研究1.2 CS 核心处理首先进行方位向傅里叶变换,将回波信号与H2进行相位相乘。H2(f;Rref)=exp-jKr(f;Rref)Cs(f)(-ref(f)2(3)式中:Kr为发射信号调制频率;为距离时间;f为方位频率;Cs()f为该信号轨迹与开普勒频率之间的关系;ref为回波中心,ref=2cRref()1+Cs()f,c为光速。然后进行距离向傅里叶变换,并与H3相位函数进行相位相乘,完成距离压缩、二次距离压缩和补余距离徙动校正。H3(ff;Rref)=exp jf2Kr()f
14、;Rref1+Cs()f exp j4fRrefCs()fc(4)式中f为距离频率。再进行距离向傅里叶逆变换,在距离多普勒域与相位函数H4进行相位相乘。H4(f;R)=exp j4RD()f(5)式中:R为目标与雷达之间的距离;D(f)=1-cosc(f),(f)=1-()f2v2,为工作波长,v 为平台航速。在成像算法的最后进行方位向傅里叶逆变换转换到时域,CS 算法完成。1.3 SPECAN(Spectral Analysis)后处理为了解决方位输出时的混叠问题,将进行 CS 核心处理后的回波信号与去斜函数H5进行相位相乘,最后进行方位向 FFT 将方位信号聚焦在频域9。H5(t;r)=e
15、xp()-jKrt2-Ta2tTa2(6)式中:r为目标与载机飞行轨迹之间的最短距离;t 为采样时间;Ta为合成孔径时间。2多模式 SAR 实时成像的 GPU 实现2.1 GPU 成像优化策略2.1.1 共享内存共享存储器是 GPU 上的高速存储器,在物理上,它属于流处理器簇(Streaming Multiprocessors,SM)可见的内存,能够被同一个线程块内的所有线程进行读写操作,以便数据同步和通信;在速度上,共享内存访问速度比全局内存访问速度快 100 倍。2.1.2 基于共享内存的原址矩阵转置加速在多模式 SAR 成像算法中,需要进行多次矩阵转置。本实验利用共享内存进行数据转置,以
16、实现数据的合并访问,避免存取延迟过大。线程之间通过调用CUDA 自带的_syncthreads()函数进行同步,保证 tile 数据块中数据的一致性。如图 2 所示,基于共享内存的原址转置 tile 操作步骤如下:1)首先从全局内存中读取数据至共享内存,此时访存满足合并访问;2)由于 NVIDIA GPU 中共享内存较小,将数据划分AtiletileBACC(a)(b)Fig.2 Schematic diagram of matrix transpose图2 矩阵转置示意图1039太赫兹科学与电子信息学报第 21 卷成多个方阵块;3)如图 2(a)所示,将 tile_A 和 tile_B 的数
17、据,按列和行从共享内存读出后,放入与其对角线对称的位置,得到转置矩阵数据。当需要转置的 tile 块正好在对角线上,如 tile_C,将其数据从显存中按行写入共享内存,再按列读入,按行写入在显存的原始位置即可,如图 2(b)所示。将数据维度设为BLOCK_DIMBLOCK_DIM+1,相同列上的数据位于不同的 bank 中,很好地避免了 bank conflicts。2.1.3 基于共享内存的相位复乘加速多模式 SAR 成像算法大多数操作部署在 GPU 上,依赖于点乘实现,因此需对点乘操作进行优化。由于 SAR 原始数据像素间的复数乘法运算互不相关,矢量的每个元素可以由一个线程并行实现。本文基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 GPU 模式 SAR 成像 加速 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。