宽带声源方位估计的多频稀疏贝叶斯学习改进算法.pdf
《宽带声源方位估计的多频稀疏贝叶斯学习改进算法.pdf》由会员分享,可在线阅读,更多相关《宽带声源方位估计的多频稀疏贝叶斯学习改进算法.pdf(11页珍藏版)》请在咨信网上搜索。
1、May2023Chinese Journal(ScientificInstrument2023年5月Vol.44 No.5第5期第44卷表报仪器仪学D0I:10.19650/ki.cjsi.J2209660宽带声源方位估计的多频稀疏贝叶斯学习改进算法陈果,卢永刚(中国工程物理研究院总体工程研究所绵阳621900)摘要:在对空气中未知的宽带声源的波达方向进行估计时,麦克风阵列的阵元间距很容易大于声信号半波长而出现栅瓣,严重影响估计效果。尽管多频带数据的使用在一定程度上可以抑制栅瓣产生,但目前的方法抑制效果比较一般而且计算效率不高。在稀疏贝叶斯学习基础上,提出了一种针对宽带声源方位估计的改进方法。
2、这种方法将超先验引人到传统的多频稀疏贝叶斯估计模型中,然后同时利用声源信号在多个频带上具有的相同空间角度稀疏性并结合期望最大化算法重新推导了多频稀疏贝叶斯模型中各相关参数的代形式。与此同时,考虑到实际场景中的声源方位通常不位于稀疏网格上,离网格修复模型也被加入设计框架中,以解决该问题。为验证算法性能,开展了仿真实验和场地实验。结果表明,相比最近提出的基于1,最小化的多频压缩感知方法和宽带的多频稀疏贝叶斯学习方法,提出方法能更好的利用宽带声源的多频特性以降低栅瓣的干扰,同时具有更高的估计精度和计算速度。在现场实验中,改进方法表现了优于其他先进方法的栅瓣抑制能力,声源方位估计误差可达0.0 9,所
3、需迭代收敛步数相比MF-SBL减少约50%。关键词:宽带声源DOA估计;多频稀疏贝叶斯学习;麦克风阵列信号处理;超先验中图分类号:TH89文献标识码:A国家标准学科分类代码:46 0.40Improved multi-frequency sparse Bayesian learning method for DOAestimation of the wideband sound sourceChen Guo,Lu Yonggang(Institute of Systems Engineering,China Academy of Engineering Physics,Mianyang 621
4、900,China)Abstract:The grating lobe appears when the microphone array element spacing is larger than the half-wavelength of the acoustic signalfor the DOA estimation of the wideband sound source.Although the utilization of multi-frequency bins data can suppress the grating lobesto some degree,the cu
5、rrent methods perform unsatisfactorily and are computationally inefficient.To address these issues,an improvedmethod based on the sparse Bayesian learning is proposed for wideband DOA estimation.This method introduces the hyperprior to themulti-frequency sparse Bayesian estimation model,and then tak
6、es advantage of the fact that the source signal has the same sparsity inmulti-frequency bins and combines the expectation maximization algorithm to derive the iterative form of each hyperparameter in themulti-frequency sparse Bayesian model.In addition,an off-grid model for the wideband sound source
7、 is incorporated into the proposedframework to better fit the practical scenarios.To evaluate the performance of the algorithm,simulations and field experiments areimplemented.Results show that the proposed method can better exploit the multi-frequency characteristics of the wideband sound sourceto
8、reduce the interference of the grating lobes,while having higher estimation accuracy and faster estimation speed compared with themuli-frequency compressive sensing method with l,minimization and the multi-frequency sparse Bayesian learning method.In thepractical tests,the improved method shows bett
9、er grating lobe suppression ability than other advanced methods,and its estimation errorcan reach 0.09.Compared with MF-SBL,the number of iterative convergence steps required is reduced by about 50%.Keywords:wideband sound source DOA estimation;multi-frequency sparse Bayesian learning;microphone arr
10、ay signal processing;hyperprior收稿日期:2 0 2 2-0 4-2 1Received Date:2022-04-21303陈果等:宽带声源方位估计的多频稀疏贝叶斯学习改进算法第5期0引言在声定位和探测领域,远场声源的方位即波达方向(d i r e c t i o n o f a r r i v a l,D O A)是一个重要的测量参数,被广泛应用在地面车辆和空中飞行器定位,水下航行器定位,语音识别定位,战场炸点定位,狙击手测向等领域1-3。与窄带的雷达信号不同,声源信号通常是宽带信号。尽管雷达信号的DOA估计方法已经取得非常快的发展,但传统的窄带DOA估计方法
11、却不能直接应用到宽带声源方位估计当中。非相干信号子空间方法(incoherentsignal-subspacemethod,ISM)4是最早出现的宽带DOA方法,这种方法将宽带信号在频域分解为窄带信号,然后对每个窄带使用MUSIC算法5进行谱估计,最后用各窄带空间谱的平均表示宽带的信号空间谱估计。为解决信号相干问题,相干信号子空间法(coherent signal-subspace method,CSM)6)被提出,它利用一个聚焦矩阵将各频率的信号子空间映射到参考频率上,然后计算平均的信号功率谱,最后也通过窄带的方法进行求解。除了上述这两类典型的基于子空间的方法,近些年,压缩感知(compre
12、ssive sensing,CS)也被引人DOA估计。压缩感知通常被使用在信号源具有稀疏性的场合,可以有效提高信号还原的效率和精度。压缩感知已经被引人到温度场重构7,管道泄漏位置定位8 等领域。考虑到声源方位在角度上总是稀疏分布的,即分布在一个或多个离散的角度上,因此,声源的DOA估计问题本质上也可以等价为一个稀疏信号重建问题9-1相比传统的子空间类方法,稀疏重建类方法从各方面都展现了极大的优势,它们在少数据快拍,甚至单快拍12 和低信噪比条件下都拥有比子空间法更好的性能。压缩感知的求解方法主要包括1最小化搜索和稀疏贝叶斯学习(sparseBayesianlearning,SBL)。l,最小化
13、搜索是先构建稀疏字典,然后最优化一个包含待求稀疏向量0范数的目标函数,这本来是一个NP-hard问题,但可以转化为一个基于1范数(l)惩罚项的次优化问题,如经典的 LASSO 算法13 和基追踪算法(basis pursuit,BP)14。而SBL则是几年来比较火热的用以完成DOA估计的框架15-16,SBL假设待求解稀疏向量的每个元素服从均值为0,方差为的高斯分布,在算法迭代过程中,绝大部分元素对应的方差会逐渐趋于0 或变成0(无噪声情况下),从而获得稀疏的解。相比l,最小化方法,SBL在稀疏字典矩阵的列与列相关性非常强的场景,如DOA估计领域,有更好的表现(17。在标准的SBL框架中,通常
14、被当作一个未知的确定参数,但实际上对于SBL这种完全建立在概率框架上的方法,也可以被认为是一个具有先验分布的随机变量。Tipping18发现如果假定SBL中待求解向量的方差的精度(方差的倒数)满足伽马分布则更容易获得稀疏解,这种先验的伽马分布也被称为促稀疏超先验。虽然DOA估计的稀疏方法发展迅速,但对宽带声源信号DOA估计的稀疏类方法仍然不多,主要的研究思路仍是将宽带信号分解为窄带信号后,再在窄带信号上运用传统的稀疏方法进行单独处理,最后再进行求和或平均。但是,因为空气中声速较低,这使得宽带声源中通常有很大一部分信号的波长较小,而空气中常见的等间距线性声阵列(uniform lineararr
15、ay,U L A)为了避免阵元间距过小而出现耦合或者现场安装方便,通常需要保证一定的物理尺寸。因此,在对波长跨度较大的未知宽带声源测量时,阵列间距d入/2 的情况很容易出现,这将导致栅瓣产生。为了抑制栅瓣产生,基于多频带数据的稀疏方法被提出。文献19-2 0 多频数据被引入到基于l,最小化的CS方法中,实现了对栅瓣的初步抑制。文献2 1-2 2 基于窄带SBL框架,在单频带上利用期望最大化(expectationmaximization,EM)算法或是第2 类最大似然法完成参数更新后,将多频的参数求和作为宽带的参数更新方法,实现了对栅瓣一定程度的抑制,并在水下目标定位实验中取得了不错的效果。尽
16、管如此,目前的多频稀疏方法框架还有两个重要方面值得改进。一方面,大多数基于SBL的多频方法参数迭代更新过程2 1-2,本质上还是将各频带数据先独立处理,但是实际上各频带数据具有相同的稀疏性,这一点尚未得到充分利用。而且,相比l最小化,SBL本身的迭代过程是比较耗时的,这使得SBL应用到多频处理中时,计算效率进一步下降,不利于快速估计;另一方面,实际测量中的宽带声源通常不位于所划分的稀疏网格上,这将导致稀疏基不匹配,使得估计误差上升。针对上述问题,本文对宽带声源方位估计的多频稀疏贝叶斯学习估计方法进行了两个方面的改进。1)基于文献18 提出的具有超先验的SBL框架,以及考虑到伽马分布作为超先验时
17、具有促稀疏能力,文中将其引人到多频稀疏贝叶斯学习中,以提高对多频数据稀疏性的利用能力,然后同时利用多个频带内的数据结合EM算法推导了多频情况下超先验相关参数的迭代方法,而不是简单的将宽带声源信号分解为窄带信号后做平均或求和。2)将离网格修复模型2 1结合到本文设计的框架中,使得改进方法能更适用于实际场景。本文的相关数学符号如下:x、x、x 分别代表向量的共轭、转置和共轭转置;IIl1、IIIl2、IIl,分别指向量的1范数、2 范数和F-范数;Re代表复变量的实数部表304报仪仪第44卷学器分;diag(x)代表以向量x的元素为对角线的方阵;diagiA)表示矩阵A对角线元素构成的向量;tr(
18、A)代表矩阵A的迹;代表Hadamard乘积。1声源的DOA观测模型假设Q个远场声源产生的声波入射到间距为d的由M个麦克风构成的线性阵列上,方向分别是=,。T。声源皆为宽带声源s(t)=【s(t),,so(t)。对麦克风阵列输出的信号做快速傅里叶变换(f a s t Fo u r i e r t r a n s f o r m,FFT)处理,输出信号可以被分解为J个窄带为fi,,f j,为窄带的测量值。信号测量模型可以表示为:y(f)=p(fi)s(fi)+n(f)(1)式中:y(f)=y i(f),,m(f)表示FFT处理后的麦克风阵列输出;s(f)=s(f),,s(f)T 是声源的频域表示
19、形式;n(f)=n t,n m代表测量噪声;(f)=a(f),,a(f)代表窄带f,对应的阵列方向矩阵。当以阵列中第1个麦克风的信号为参考信号,a(0.f)可以表示为:dsinga(0g,f)=1,e(2)式中:c是声在空气中传播的速度。考虑到后面的场地实验中温度大约为2 95K,因此文中声速取c=344m/s。对于观测模型中的噪声和信号,本文做如下的假设。1)信号和噪声都认为满足复高斯分布且互相独立。2)对于j=1,,J频带内的噪声,他们有相同的方差,但彼此独立,信号亦满足该假设。使用SBL对声信号进行定位时,待求解区域-90,90 通常被均分以构造稀疏字典矩阵。但在实际应用中,声源通常不在
20、均匀的求解网格上。尽管采用更密集的网格划分可以提高估计精度,但是会增大字典矩阵的维度使得计算量升高。为此,本文使用了文献2 3提出的离网格模型,一方面,离网格模型能使用较为粗糙的网格解决声源的网格偏移问题,另一方面,本文提出的改进多频稀疏贝叶斯方法能和离网格模型完美结合,表明所提出方法具有很好的模型适应性。假设=1,,0,NM Q 代表在角度范围90,90 内划分的网格,网格间距为d。如果。当q11,Q1,可以在离0 最近的网格点以一阶泰勒展开来估计。处的阵列响应向量,如下所示:a(0,f)=a(0f)+b(0f)(0,-0)(3)其中,b(e f)是a(f)的微分,可以表示为:b(0,f)=
21、0dcosodsing-j2f-j2元f9eC(4)(M-1)dcoso.(M-1)dsing-j2mj2TfeC令B(f)=b(0f),b(%f)T,8,=(0,-0),A(f)=a(0t f),a(0nf)T,8=81,oT。因此,在稀疏贝叶斯学习框架下,离网格的观测模型可以写为:y(f,)=(f)x(f)+n(f)(5)式中:(f)=A(f)+B(f)diag(8);x(f)=x(f),x(f)T,llxlloN,x,(f)(0,s(f,)/。为了简化表示,当只在一个窄带f内讨论时,文中x代替x(f),其他变量亦然。2改进的多频稀疏贝叶斯学习2.1具有超先验的SBL模型根据文献18 的稀
22、疏贝叶斯学习框架,对于第k个时间区间内的待还原稀疏量Xe CN1,可以认为稀疏向量中的元素,满足式(6)复高斯分布。P(xl,)=cn(x,/0,(n)=l)(6)式中:(n)-为方差;,称为方差的精度。这种定义方式常常被使用在多维的高斯分布当中2 1。在大多数的稀疏贝叶斯学习框架当中19-2 0 1,方差(,)-都被当作是一个确定性参数,通过后续的观测数据来学习(,)-l。在这种情况下,实际上是假设,的先验分布是一个无信息的先验,即它取任何值的概率都一样大,相当于假设其为均匀分布。但是,Tippingl18证明了赋予,某些确定的先验分布可以起着促稀疏解的作用,而考虑到概率推导过程的方便,伽马
23、分布被引人其中,因为伽马分布是和高斯分布一样同属指数分布家族,在推导过程中可以保持形式的不变而只与关键参数有关。因此,P()被定义为:n=NP()=II 9G(nlan,bn)(7)九=1Y式中:G(nlan,bh)nexp(-b,)。因此对Qn于基于变量的条件概率P(Xl),P()被称为超先验。对于式(7)中的观测噪声,将其视为复高斯噪声,同样可以写为:P(n;g)=cN(nl0,o-lIm)(8)式中:是方差的倒数。在稀疏贝叶斯学习框架下,噪声const(2 0)tr(E(f.)d(f)(f)argrnew305陈果等:宽带声源方位估计的多频稀疏学习改进算法第5期参数不需要预先设定,可自动
24、学习噪声参数。的先验分布也同样用伽马先验来描述,如下:P(a)=G(g lc,d)(9)另外,对于结合了离网格修复的测量模型,其需要求解参数=8 1,,8,对于连续运动的声源,其方位离开网格节点的距离是任意的,即0,在e,0,+是2n2等概率分布。因此,先验可以用一个均匀分布来描述,16U1综上所述,=,和=8,为待估计参数,其中和=,,8 为与模型有关的待估计参数,为与稀疏性有关的待估计参数。根据第1节的假设,在不同的频率f上,有同样的参数、和。2.2改进的多频SBL为了估计式(5)中的x,需要计算后验概率P(x,ly),但是这个后验概率不能获取解析的形式。因此,根据贝叶斯公式,该后验概率可
25、以写为:P(x,o,ly)=P(xly,o,)P(,o,oly)(10)其中,后验P(xly,g,o)满足复高斯分布cv(x|u,Z)。u、Z可以表示为:E=(pp+diag()-1(11)Lu=gZly根据最大后验概率估计方法,这些超参数可以通过最大化P(,ly)获得。不同于传统的宽带信号处理方法,即每个窄带独立处理后,再取参数平均,本文直接同时利用所有关注的窄带信息构造目标函数,以增强后验的准确性。所以,参数的获取方式为:j=(,g,8)=argmaxIP(,g,s ly(f.)(12)最大化式(12)的目标函数,可以利用最大期望法进行求解,把待还原的稀疏量x(f)当作隐变量,可以获取多频
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 宽带 声源 方位 估计 稀疏 贝叶斯 学习 改进 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。