![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于小波包分析的声音特性提取.doc
《基于小波包分析的声音特性提取.doc》由会员分享,可在线阅读,更多相关《基于小波包分析的声音特性提取.doc(28页珍藏版)》请在咨信网上搜索。
1、成都信息工程学院学位论文基于小波包分析的声音特性提取 论文作者姓名:申请学位专业:申请学位类别:指导教师姓名(职称):论文提交日期:第 IV 页 共41页基于小波包分析的声音特性提取摘 要说话人识别就是利用说话人的语音特征对说话人身份进行辨识或确认。与语音识别一样,说话人识别也是在提取原始语音信号某些特征参数的基础上,建立相应的模板和模型,然后按照一定的判决规则进行识别。其中前期特征参数提取的效果直接影响到后期识别的准确性。本设计完成了一个基于小波包分析的声音特征参数的提取模型。论文首先介绍小波分析理论的基本知识,阐述了小波理论、小波分析在声音特征提取方面的应用,然后在分析MFCC提取原理的基
2、础上,结合小波包分析理论,得到特征参数。用特征参数提取方法通过对两个人的数字音频样本提取的特征参数对比来观察各个参数之间的区别。仿真实验证明该提取方法可以作为区别说话人的声音特征提取方法,配合识别算法可以达到较高的识别率。关键词:小波包;梅尔倒谱系数;特征参数Extraction of Feature Coefficient Based on Wavelet Packet AnalysisAbstractSpeaker Recognition is to use the speaker feature on the identity of the speaker identification
3、or confirmation. As with speech recognition, speaker recognition is to extract some characteristic parameters of the original speech signal based on the establishment of appropriate templates and models, and according to some decision rules for recognition. One early feature extraction directly affe
4、cts the effect of late the recognition accuracy. The design is completed, a wavelet packet analysis based on a simple model of the voice feature parameter extraction. Paper first introduces the basics of wavelet analysis theory,Described the wavelet theory and wavelet analysis in the application of
5、sound feature extraction, and then we can get two characteristic parameters based on the analysis of MFCC extraction and the theory of wavelet packet analysis. Feature extraction method used by digital audio samples of two characteristic parameters extracted compared to observe the distinction betwe
6、en the various parameters. Simulation results show that the extraction method can distinguish the speakers voice as a feature extraction method, with the recognition algorithm can achieve higher recognition rate.Keywords:Wavelet packet;Mel cepstral;Parameter目 录论文总页数:21页1 引 言11.1 课题背景11.2 国内外研究现状11.3
7、 本课题研究的意义11.4 本课题研究的方法12 小波理论22.1 小波分析背景22.2 小波变换简介22.3从傅里叶变换到小波分析22.4 提升小波变换概述32.5 小波包分析32.6 小波信号分析在声音处理中的应用43 常见声音特征参数提取算法43.1 分类43.1.1 线性预测倒普系数法(LPC)53.1.2 梅尔滤波器提取法(MEL)63.1.3 小波变换法(DWTMFC)363.1.4 小波包分析法(WPTC)73.2 算法比较74 基于小波包分析的声音特性提取实现84.1 概述84.2 总体结构84.3 程序设计84.3.1 语音信号分帧、加窗84.3.2 Mel滤波器组94.4
8、音频特征参数提取结果104.5 特征参数结果分析13结 论18参考文献18致 谢20声 明211 引 言1.1 课题背景声音识别的迅速发展以及高效可靠的应用软件的开发,使声音识别系统在很多方面得到了应用、这种系统可以用声音指令拟应用特定短句实现“不用手”的数据采集、其最大特点就是不用手和眼睛,这对那些采集数据同时还要完成手脚并用的工作场合尤为适用。由于每个人的声音千差万别,因此声音可以用作安全认证的依据之一。别人可以模仿你的签字,猜测你的密码,甚至能留下你的指纹,但要模仿你的声音就有点太苛刻了。美国的一座智能化大厦就采用了声音识别的方式。到达公司门口,你必须通过安全检查。电子门卫通过你的声音来
9、辨别你是不是该公司的工作人员是否给你开门。1.2 国内外研究现状国际上对声音识别研究已经相当成熟。我国目前生物识别行业内厂商有200多家,数量虽然不少,从统计上来看其中96的从事指纹识别技术的相关产品的研究和开发,导致了产品趋同化明显,档次低、规模小;但从IBG统计世界各生物识别技术市场占有率看,指纹识别为36,声纹识别占有11的份额。这说明目前我国生物特征识别产品的发展是极度不平衡,未来几年是多元化的技术产品的协调发展、促进国内该领域和谐发展的最佳时期,也将成为涉足各个生物特征识别产品的企业成长和获得利润的关键期。1.3 本课题研究的意义伴随着生物特征识别技术的发展,声纹识别技术与生俱有的优
10、势随着技术与产品的应用结合,必将成为今后生物识别领域最为主流的技术之一,会在不久的将来为人们创造出更加智能的生活。通过本次设计加深对声纹识别前期技术声音特征参数的学习与研究。1.4 本课题研究的方法设计一基于小波包分析的声音特征提取,然后提取两男声语音样本特征参数并进行数据分析。2 小波理论2.1 小波分析背景1807年 Fourier 提出傅里叶分析,1822年发表“热传导解析理论”论文1910年 Haar 提出最简单的小波1980年 Morlet 首先提出平移伸缩的小波公式,用于地质勘探。1985年 Meyer 和稍后的Daubeichies提出“正交小波基”,此后形成小波研究的高潮。19
11、88年Mallat 提出的多分辨度分析理论(MRA),统一了语音识别中的镜向滤波,子带编码,图象处理中的金字塔法等几个不相关的领域。2.2 小波变换简介小波分析属于时频分析的一种。传统的信号分析是建立在傅里叶(Fourier)变换的基础上的,但是,傅里叶分析使用的是一种全局的变换,即要么完全在时域,要么完全在频域,它无法表述信号的时频局域性质,而时频局域性质恰恰是非平稳信号最根本和最关键的性质。为了分析和处理非平稳信号,人们对傅里叶分析进行了推广乃至根本性的革命,提出并发展了小波变换、Randon Wigner变换、分数阶傅里叶变换、线性调频小波变换、循环统计量理论和调幅调频信号分析等。标识在
12、系统中的所有接收器、实时消息(Real-time Messages)用于MIDI部件之间的同步和独占消息(Exclusive Messages)厂商的标识代码。其中,短时傅里叶变换和小波变换也是因传统的傅里叶变换不能够满足信号处理的要求而产生的。短时傅里叶变换分析的基本思想是:假定非平稳信号在分析窗函数g(t)的一个短时间间隔内是平稳(伪平稳)的,并移动分析窗函数,使f(t)g(tt)在不同的有限时间宽度内是平稳信号,从而计算出各个不同时刻的功率谱。但从本质上讲,短时傅里叶变换是一种单一分辨率的信号分析方法(因为它使用一个固定的短时窗函数),在信号分析上还存在着不可逾越的缺陷。小波变换是一种信
13、号的时间尺度(时间频率)分析方法,它具有多分辨率分析(Multi-resolutionAnalysis)的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变,但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于探测正常信号中夹带的瞬态反常现象并展示其成分,所以被誉为分析信号的显微镜。2.3从傅里叶变换到小波分析傅里叶变换是众多科学领域(特别是信号处理、图像处理、量子物理等)里的重要的应用工具之一。从实用的观点看,当人们考虑傅里叶分析的时候,通常是指(积分
14、)傅里叶变换和傅里叶级数。它是整个时间域内的积分,没有局部化分析信号的功能,完全不具备时域信息,也就是说,对于傅里叶谱中的某一频率,不能够知道这个频率是在什么时候产生的。这样在信号分析中就面临一对最基本的矛盾:时域和频域的局部化矛盾。在实际的信号处理过程中,尤其是对非平稳信号的处理中,信号在任一时刻附近的频域特征都很重要。如柴油机缸盖表面的振动信号就是由撞击或冲击产生的,是一瞬变信号,单从时域或频域上来分析是不够的。这就促使人们去寻找一种新方法,能将时域和频域结合起来描述观察信号的时频联合特征,构成信号的时频谱。这就是所谓的时频分析法,亦称为时频局部化方法。小波分析方法是一种窗口大小(即窗口面
15、积)固定但其形状可改变,时间窗和频率窗都可改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,所以被誉为数学显微镜。正是这种特性,使小波变换具有对信号的自适应性。2.4 提升小波变换概述传统的第一代小波变换是在欧氏空间内通过基底的平移和伸缩构造小波基的,不适合非欧氏空间的应用,因此小波提升方案应运而生,它是构造第二代小波变换的理想方法。提升的实现形式给出了小波完全的空间域解释,它具有许多优良的特性:结构简单、运算量低、原位运算、节省存储空间、逆变化可以直接反转实现,以及可逆的整数到整数变换,便于实现。在高速处理、移动手
16、持设备、低功耗设备的应用中具有很大的吸引力。提升小波在1996年由Sweldens提出后,在许多领域都得到了广泛应用。原有小波的基础上构造出更有效的适用于特殊应用的小波。它从另一个角度给小波的构造和性质作出了解答。同时,它也把数值分析领域的“细分插值”、“均值插值”、“高阶矩”、“欧拉算法”等概念和小波分析的“消失矩”、“尺度函数”、“小波函数”等概念巧妙地融为一体。2.5 小波包分析短时傅里叶变换对信号的频带划分是线性等间隔的。多分辨分析可以对信号进行有效的时频分解,但因为其尺度是按二进制变化的,所以在高频段其频率分辨率较差,而在低频段其时间分辨率较差,即对信号的频带进行指数等间隔划分。那么
17、,在对信号分解的过程中,是否对高频信号能再进行小波分解呢?回答是肯定的,这就要用到小波包分析方法。小波包分析(Wavelet Packet Analysis)能够为信号提供一种更加精细的分析方法,它将频带进行多层次划分,对多分辨分析没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应频带,使之与信号频谱相匹配,从而提高了时频分辨率,因此小波包具有更广泛的应用价值。关于小波包分析的理解,可以以一个三层的分解进行说明,其小波包分解树如图1所示。图1小波包分解树状图2.6 小波信号分析在声音处理中的应用(1)小波分析在语音基音周期检测的应用。人在发音过程中,由于声门闭合形成气流
18、脉冲,引起声带振动,气流脉冲(声带振动)的频率称为基音频率声门闭合瞬间,气流急剧增加,对应在语音波形上即为在该瞬间有一个明显的跳变,可认为是信号的奇异点。每相邻两次声门闭合时间间隔即为瞬态基音周期,而大量瞬态基音周期的均值即为基音周期。所以,只要能检测到因声门闭合产生的语音波形突变,就可求出基音周期。小波变换为检测这类信号突变提供了强有力的工具。由信号的突变检测原理可知,选择光滑函数的一阶导数作为小波,通过定位语音信号小波变换的幅值极大值点位置,就可精确检测到因声门闭合产生的语音波形的突变点。(2)小波分析在语音波形编码中的应用。对该语音编码算法的抗误码性能进行计算机仿真研究的基础上,设计、集
19、成了以C30、C40作为信号处理器的实时水声通信系统。(3)小波分析在语音混合编码中也有相当重要的应用。3 常见声音特征参数提取算法3.1 分类我们可以把提取技术分为两个个基本类型:LPC倒谱特征矢量(LPCC)和Mel倒谱参数(MFCC)。提取算法关键取决于振荡器的实现。特征提取完成从语音信号提取出对语音识别有用的信息,它对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息。一般而言,由于倒频谱(cepstrum) 有着能将频谱上的高低频分开的优点,因此被广泛地应用在语音识别的研究上,例过去常用的线性预测编码导出的倒频谱参数(LPCC)和梅尔频率倒谱参数(MFCC
20、)等都是常用的语音特征。3.1.1 线性预测倒普系数法(LPC)线性预测分析技术是目前被广泛应用的特征参数提取技术,许多成功得以应用的系统都采用基于线性预测技术提取的LPC 倒谱系数作为系统的特征矢量。这里讲的LPC倒谱其实是复倒谱,所谓复倒谱就是信号通过Z变换以后取对数,再求反Z变换而得到的。线性预测分析方法是一种谱估计的方法,而且其声道模型系统函数H(z)反映了声道的频率响应和原始信号的谱包络,因此用lgH(z)做反Z变换即可求出其复倒谱系数。该复倒谱系数根据线性预测模型直接得到,因此又称之为LPC倒谱系数(LPCC)。之所以线性预测分析(LPC)法是目前进行语音特征分析的最有效、最重要的
21、方法之一,这是由于:(1)它有效地解决了短时平稳信号的模型化问题,可把语音信号看成是由全极点模型产生的。(2)能很好地逼近共振峰,提供谱估计。(3)提供的语音信号模型参数(如基音、共振峰、谱、声道面积函数等)简洁而准确,计算量较小,便于实时处理。(4)可用于低数率传输的环境。(5)将LPC 参数形成的模型参数储存起来,在语音识别中提高识别率和减少识别时间。在MATLAB语言处理工具箱中已经提供了LPC系数的函数。这个函数的名字就是lpc,它的语法为:a=lpc(x,p)这里x为一帧语音信号,p为计算LPC 参数的阶数。常x为240点或256点的数据,p取1012,对语音识别已经足够了。但要采用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 波包 分析 声音 特性 提取
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。