基于子频带能量特征提取的汽车鸣笛声识别.pdf
《基于子频带能量特征提取的汽车鸣笛声识别.pdf》由会员分享,可在线阅读,更多相关《基于子频带能量特征提取的汽车鸣笛声识别.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 42 卷 第 5 期Vol.42,No.52023 年 9 月Journal of Applied AcousticsSeptember,2023 研究报告 基于子频带能量特征提取的汽车鸣笛声识别侯晓飞1穆瑞林1,2周 晋3贾自杰1(1 天津科技大学机械工程学院天津300222)(2 天津市轻工与食品工程机械装备集成设计与在线监控重点实验室天津300222)(3 天津市房地产市场服务中心天津300222)摘要:为了快速准确地识别城市中汽车违法鸣笛声并将不同种鸣笛声进行分类,该文应用子频带能量提取鸣笛声的特征,利用BP神经网络对提取的子频带能量特征值矩阵进行学习训练,且在神经网络学习过程中利
2、用可变学习速度的方法,减小了神经网络的迭代次数。实验表明,利用此种子频带能量特征提取法使鸣笛声与非鸣笛声的平均识别率达到了94.889%;使不同鸣笛声之间的分类正确率最大达到了93.75%,实现了不同鸣笛声之间的分类。利用子频带能量法,能够很好地满足不同种鸣笛声识别与分类的需求。关键词:鸣笛声识别分类;子频带能量;特征提取;神经网络中图法分类号:TN912.34文献标识码:A文章编号:1000-310X(2023)05-1106-09DOI:10.11684/j.issn.1000-310X.2023.05.025Recognition of automobile whistle sound
3、based on sub-frequency band energyfeature extractionHOU Xiaofei1MU Ruilin1,2ZHOU Jin3JIA Zijie1(1 College of Mechanical Engineering,Tianjin University of Science&Technology,Tianjin 300222,China)(2 Tianjin Key Laboratory of Integrated Design and Online Monitoring for Light Industry&Food Machinery and
4、 Equipment,Tianjin University of Science&Technology,Tianjin 300222,China)(3 Tianjin Real Estate Market Service Center,Tianjin 300222,China)Abstract:In order to identify different kinds of illegal car whistling in cities quickly and accurately,the methodof sub-frequency band energy feature extraction
5、 was applied in the classification and recognition of whistles.And the extracted sub-frequency band energy eigenvalue matrix was trained by BP neural network,and thenumber of iterations of the neural network in the process of learning was reduced by used the method of variablelearning speed.The expe
6、riment shows that the average recognition rate of whistle and other sounds is 94.889%;and the classification accuracy rate of different car whistle sound is 93.75%,the classification among differentwhistles can realized by the method of sub-frequency band energy.The requirements of different whistle
7、 soundidentification and classification can be well satisfied by using the sub-frequency band energy method.Keywords:Identification and classification of whistle;Sub-frequency band energy;Feature extraction;Neuralnetwork2022-07-20收稿;2022-09-20定稿天津市建委科技项目(2017-10)作者简介:侯晓飞(1996),男,河北衡水人,硕士研究生,研究方向:机械测
8、试理论与技术。通信作者 E-mail:第42卷 第5期侯晓飞等:基于子频带能量特征提取的汽车鸣笛声识别11070 引言近年来,城市中违法乱鸣笛行为随着汽车数量的增加而逐渐增多。鸣笛声制造交通噪声的同时,给人们的生产和生活也带来了巨大的影响,尤其是在学校、医院、居民区等这些需要安静的区域。因此,对乱鸣笛行为的治理非常有必要。车辆的识别与分类在创建城市智能交通系统中至关重要,在传统的鸣笛声识别分类中往往采用的是人工监测的方法,此种方法误检率较高,且依赖人工复核。目前车辆识别与分类研究主要集中于视觉方法,对车辆完整的声学识别与分类研究较少。随着声学研究的深入,为了提高鸣笛声的检测效率,在鸣笛声分类识
9、别方面,能量阈值法、互谱矩阵法以及特征提取法等逐渐被应用在鸣笛声识别当中,例如刘建平等1根据信号短时能量与过零率乘积的双门限检测算法对鸣笛声与非鸣笛声进行了识别;孙懋珩等2提出了一种基于传声器阵列和闭式球形插值法的汽车鸣笛声识别系统,但是此种方法只能单方面地确定目标车辆的位置,且会存在较多误判。神经网络近些年受到了研究者越来越多的重视,侍艳华等3设计了梅尔频率倒谱系数(Mel-frequency cepstrum coefficient,MFCC)和卷积神经网络识别鸣笛声的方法;班琦等4在建立鸣笛声样本的基础上利用改进的BP神经网络算法识别了鸣笛声;白琳等5将小波变换6与BP神经网络相结合实现
10、了车辆声信号的分类。在鸣笛声识别分类中,利用神经网络识别时效率与准确率会受到不同特征提取的影响,例如郑皓7将频谱特征作为卷积深度置信网络(Convolu-tional deep belief networks,CDBN)的输入进行训练后得到鸣笛声的CDBN特征,与MFCC特征进行对比分析后发现利用CDBN特征进行识别的准确率更高。可知鸣笛声识别中提取何种特征进行识别仍是一项关键。在违法鸣笛声监管过程中通常利用传声器阵列进行鸣笛声定位8,但随着距离的增加,可能会产生定位误差,而两辆车如果并排行驶且横向距离较近时,由于定位误差的存在,可能会存在车辆之间的误判。为了更准确地识别违法鸣笛声,提高交通执
11、法效率,本文提出了一种基于子频带能量特征提取的汽车鸣笛声识别与分类的方法。本方法对鸣笛声的时频谱特征进行分析与提取,结合可变学习速率的BP神经网络进行鸣笛声识别,可对不同车型的鸣笛声进行有效区分,获取违法鸣笛车辆的完整声学信息,以作为违法鸣笛的辅助判断和处罚依据。利用车辆的鸣笛声特征对鸣笛车辆车型进行识别分类,其目的是在违法鸣笛声治理过程中进行辅助监管与判断,当有异议时,可通过复核对比鸣笛声定位与鸣笛声车型特征两种依据进行更加科学准确的判断,从而减少鸣笛噪声,对道路交通噪声污染治理具有积极意义。1鸣笛声特征提取与分类方法1.1鸣笛声特征提取城市道路中比较常见的鸣笛声是由电喇叭发出的9,因此在研
12、究时以小汽车上装载的电喇叭发出的鸣笛声为主,主要频率集中在4005000 Hz之间。进一步将鸣笛声信号做短时傅里叶变换得到鸣笛声的时频图,如图1所示。进行鸣笛声识别分类之前,需要对采集到的声音样本进行有效声音段截取以保留鸣笛声信号的主要频率。采用短时能量法10确定鸣笛声信号有效声音段,短时能量法计算式如(1)所示:EK=(1+K)Ni=KN+1x(i)2,(1)式(1)中,x(i)为传声器采集测量信号,EK为第K帧的短时能量。为了进一步对鸣笛声进行分析,并将不同的鸣笛声分类,采用子频带能量法提取特征的方法进行鸣笛声识别。通过划分声信号频谱子频带,对子频带内的频率信息进行分析,找出鸣笛声信号在各
13、个子频带与其他声音不同的特征,即可利用此种特征进行鸣笛声识别。首先将鸣笛声的全频带进行划分,划分为N 个子频带。在对鸣笛声频带进行划分时,为了减小计算量,并将鸣笛声信号的子频带能量特征完整提取,可将信号划分为32个子频带。为了保证各频率能量不被泄漏,相邻两个子频带之间的重合度为50%。每一段子频带上能量初始值等于时频图能量值,如式(2)所示:11082023 年 9 月P(f)=P(f),fl6 f 6 fh,0,其他,(2)式(2)中,P(f)为每个子频带内每个频率f 的能量,fl为子频带起始频率,fh子频带截止频率。子频带的起始和截止频率计算式如式(3)、式(4)所示:fl(k)=fL,k
14、=1,fl(k 1)+fH fLN+1,1 k 6 N,(3)fh(k)=fH,k=N,fl(k 1)+2(fH fL)N+1,16kN,(4)其中,fl(k)、fh(k)为第k个子频带的起始与截止频率,fL、fH为鸣笛声整个频率段的起始与截止频率,N 为子频带总个数。进一步将每个子频带内包络的各频率段分为n段并对每一段能量值进行加窗处理,保证各频率的能量不泄漏且输入到神经网络的特征值矩阵容易计算,在取值时数值等于参数N。求取子频带中每一段加窗后的平均能量,如式(5)所示:Ek(i)=1nni=1Fi(j)h(j),(5)式(5)中,Ek(i)为第k段子频带内第i段包含频率的能量进行加窗后的平
15、均能量,Fi(j)为第k个子频带内第i段对应的各频率j 的能量值,h(j)为窗函数在频率j 对应的系数,n为第k个频带内加窗的个数。将第k个子频带中分成的n个窗的n个平均能量构建为一个行向量,共N 个行向量,将N 个子频带的第i段平均能量值构建为一个列向量,共n个列向量。对所有的n个列向量进行叠加处理,构建出同种鸣笛声的N n维特征值矩阵。C=ni=1C(i),(6)式(6)中,C 是同种鸣笛声的特征值矩阵,C(i)为子频带中的第i段平均能量值的列向量。(a)?1(b)?2(c)?3(d)?45.04.03.02.01.00700600500400300200100?/ms7006005004
16、00300200100?/ms700600500400300200100?/ms700600500400300200100?/ms?/kHz5.04.03.02.01.00?/kHz5.04.03.02.01.00?/kHz5.04.03.02.01.00?/kHz图1鸣笛声时频图Fig.1 Time-frequency spectrum of the car whistle第42卷 第5期侯晓飞等:基于子频带能量特征提取的汽车鸣笛声识别1109利用式(6)对图1中鸣笛声信号时频图进行子频带能量特征处理,提取特征值矩阵并进行归一化处理,特征值矩阵包络形成的区域曲线如图2所示。由图2中可以看出,
17、按照上述方法进行特征点提取后,不同种鸣笛声之间的子频带能量特征分布具有较大的差异,具体表现为鸣笛声子频带平均能量归一化后峰值个数、子频带出现的频率位置以及包络形成区域均不相同。因此可利用提取子频带能量特征的方法可以进行鸣笛声的识别以及不同类型鸣笛声的分类。1.2鸣笛声识别与分类BP神经网络应用广泛,具有自适应强的能力11,本文构建3层BP神经网络来对鸣笛声进行识别分类。输入层提取子频带能量特征归一化后的特征值矩阵作为神经网络的输入层参数;中间隐含层对输入的特征值矩阵进行学习与训练,学习过程是通过中间层对输入特征样本的不断逼近来调整神经网络权值和偏置值的过程,如式(7)所示:wij(t+1)=w
18、ij(t)+(di yi)xj(t),(7)式(7)中,wij为神经元j 到神经元i的连接权值,di为神经元的期望输出,yi为神经元的实际输出,为学习速率。神经网络初始化权值时从(1/d,1/d)之间任取一值,其中,d 为中间隐含层神经元个数。为了提高算法的收敛速度,在学习过程中将学习速率按式(8)进行调整,以减小神经网络学习过程中的迭代次数。(k)=0+k(1 0 L)/N,(8)式(8)中,k为第k次学习速率,0为初始学习速率,L为最小学习速率,N 为迭代总次数。为了加快迭代速度,减小迭代次数,神经元激活函数选择为tansig函数,如式(9)所示:tansig(x)=ex exex+ex.
19、(9)输出层在被激活之后,将中间层的实际输出与期望输出进行比较,在误差达到最小时将结果输出。利用BP神经网络对鸣笛声识别分类时,将采集到的鸣笛声利用子频带能量法提取特征值矩阵1.00.80.60.40.20302520151050?1.00.80.60.40.20?1.00.80.60.40.20?1.00.80.60.40.20?302520151050?302520151050?302520151050?(a)?1(b)?2(c)?3(d)?4图2鸣笛声子频带能量特征包络曲线Fig.2 Envelope curve of whistle sub-band energy characteri
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 频带 能量 特征 提取 汽车 鸣笛 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。