基于小波包分析的声音特性提取.doc

上传人：天****

文档编号：2490162

上传时间：2024-05-30

格式：DOC

页数：28

大小：269.50KB

下载积分：10 金币

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档保存到电脑，查找使用更方便

10 金币

下载 开通VIP

还剩页未读，继续阅读

举报
申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：
如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

特殊限制：
部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。

关键词：
基于波包分析声音特性提取

资源描述：

成都信息工程学院学位论文基于小波包分析的声音特性提取论文作者姓名：申请学位专业：申请学位类别：指导教师姓名（职称）：论文提交日期：第 IV 页共41页基于小波包分析的声音特性提取摘要说话人识别就是利用说话人的语音特征对说话人身份进行辨识或确认。与语音识别一样，说话人识别也是在提取原始语音信号某些特征参数的基础上，建立相应的模板和模型，然后按照一定的判决规则进行识别。其中前期特征参数提取的效果直接影响到后期识别的准确性。本设计完成了一个基于小波包分析的声音特征参数的提取模型。论文首先介绍小波分析理论的基本知识，阐述了小波理论、小波分析在声音特征提取方面的应用，然后在分析MFCC提取原理的基础上，结合小波包分析理论，得到特征参数。用特征参数提取方法通过对两个人的数字音频样本提取的特征参数对比来观察各个参数之间的区别。仿真实验证明该提取方法可以作为区别说话人的声音特征提取方法，配合识别算法可以达到较高的识别率。关键词：小波包；梅尔倒谱系数；特征参数 Extraction of Feature Coefficient Based on Wavelet Packet Analysis Abstract Speaker Recognition is to use the speaker feature on the identity of the speaker identification or confirmation. As with speech recognition, speaker recognition is to extract some characteristic parameters of the original speech signal based on the establishment of appropriate templates and models, and according to some decision rules for recognition. One early feature extraction directly affects the effect of late the recognition accuracy. The design is completed, a wavelet packet analysis based on a simple model of the voice feature parameter extraction. Paper first introduces the basics of wavelet analysis theory，Described the wavelet theory and wavelet analysis in the application of sound feature extraction, and then we can get two characteristic parameters based on the analysis of MFCC extraction and the theory of wavelet packet analysis. Feature extraction method used by digital audio samples of two characteristic parameters extracted compared to observe the distinction between the various parameters. Simulation results show that the extraction method can distinguish the speaker's voice as a feature extraction method, with the recognition algorithm can achieve higher recognition rate. Keywords:Wavelet packet;Mel cepstral;Parameter 目录论文总页数：21页 1 引言 1 1.1 课题背景 1 1.2 国内外研究现状 1 1.3 本课题研究的意义 1 1.4 本课题研究的方法 1 2 小波理论 2 2.1 小波分析背景 2 2.2 小波变换简介 2 2.3从傅里叶变换到小波分析 2 2.4 提升小波变换概述 3 2.5 小波包分析 3 2.6 小波信号分析在声音处理中的应用 4 3 常见声音特征参数提取算法 4 3.1 分类 4 3.1.1 线性预测倒普系数法（LPC） 5 3.1.2 梅尔滤波器提取法（MEL） 6 3.1.3 小波变换法（DWT—MFC）[3] 6 3.1.4 小波包分析法（WPTC） 7 3.2 算法比较 7 4 基于小波包分析的声音特性提取实现 8 4.1 概述 8 4.2 总体结构 8 4.3 程序设计 8 4.3.1 语音信号分帧、加窗 8 4.3.2 Mel滤波器组 9 4.4 音频特征参数提取结果 10 4.5 特征参数结果分析 13 结论 18 参考文献 18 致谢 20 声明 21 1 引言 1.1 课题背景声音识别的迅速发展以及高效可靠的应用软件的开发，使声音识别系统在很多方面得到了应用、这种系统可以用声音指令拟应用特定短句实现“不用手”的数据采集、其最大特点就是不用手和眼睛，这对那些采集数据同时还要完成手脚并用的工作场合尤为适用。由于每个人的声音千差万别，因此声音可以用作安全认证的依据之一。别人可以模仿你的签字，猜测你的密码，甚至能留下你的指纹，但要模仿你的声音就有点太苛刻了。美国的一座智能化大厦就采用了声音识别的方式。到达公司门口，你必须通过安全检查。电子门卫通过你的声音来辨别你是不是该公司的工作人员是否给你开门。 1.2 国内外研究现状国际上对声音识别研究已经相当成熟。我国目前生物识别行业内厂商有200多家，数量虽然不少，从统计上来看其中96％的从事指纹识别技术的相关产品的研究和开发，导致了产品趋同化明显，档次低、规模小；但从IBG统计世界各生物识别技术市场占有率看，指纹识别为36％，声纹识别占有11％的份额。这说明目前我国生物特征识别产品的发展是极度不平衡，未来几年是多元化的技术产品的协调发展、促进国内该领域和谐发展的最佳时期，也将成为涉足各个生物特征识别产品的企业成长和获得利润的关键期。 1.3 本课题研究的意义伴随着生物特征识别技术的发展，声纹识别技术与生俱有的优势随着技术与产品的应用结合，必将成为今后生物识别领域最为主流的技术之一，会在不久的将来为人们创造出更加智能的生活。通过本次设计加深对声纹识别前期技术声音特征参数的学习与研究。 1.4 本课题研究的方法设计一基于小波包分析的声音特征提取，然后提取两男声语音样本特征参数并进行数据分析。 2 小波理论 2.1 小波分析背景 1807年 Fourier 提出傅里叶分析，1822年发表“热传导解析理论”论文 1910年 Haar 提出最简单的小波 1980年 Morlet 首先提出平移伸缩的小波公式，用于地质勘探。 1985年 Meyer 和稍后的Daubeichies提出“正交小波基”，此后形成小波研究的高潮。 1988年Mallat 提出的多分辨度分析理论（MRA），统一了语音识别中的镜向滤波，子带编码，图象处理中的金字塔法等几个不相关的领域。 2.2 小波变换简介小波分析属于时频分析的一种。传统的信号分析是建立在傅里叶(Fourier)变换的基础上的，但是，傅里叶分析使用的是一种全局的变换，即要么完全在时域，要么完全在频域，它无法表述信号的时频局域性质，而时频局域性质恰恰是非平稳信号最根本和最关键的性质。为了分析和处理非平稳信号，人们对傅里叶分析进行了推广乃至根本性的革命，提出并发展了小波变换、Randon Wigner变换、分数阶傅里叶变换、线性调频小波变换、循环统计量理论和调幅－调频信号分析等。——标识在系统中的所有接收器、实时消息（Real-time Messages）——用于MIDI部件之间的同步和独占消息（Exclusive Messages）——厂商的标识代码。其中，短时傅里叶变换和小波变换也是因传统的傅里叶变换不能够满足信号处理的要求而产生的。短时傅里叶变换分析的基本思想是：假定非平稳信号在分析窗函数g(t)的一个短时间间隔内是平稳(伪平稳)的，并移动分析窗函数，使f(t)g(t－t)在不同的有限时间宽度内是平稳信号，从而计算出各个不同时刻的功率谱。但从本质上讲，短时傅里叶变换是一种单一分辨率的信号分析方法(因为它使用一个固定的短时窗函数)，在信号分析上还存在着不可逾越的缺陷。小波变换是一种信号的时间—尺度(时间—频率)分析方法，它具有多分辨率分析(Multi-resolutionAnalysis)的特点，而且在时频两域都具有表征信号局部特征的能力，是一种窗口大小固定不变，但其形状可改变，时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率，在高频部分具有较高的时间分辨率和较低的频率分辨率，很适合于探测正常信号中夹带的瞬态反常现象并展示其成分，所以被誉为分析信号的显微镜。 2.3从傅里叶变换到小波分析傅里叶变换是众多科学领域(特别是信号处理、图像处理、量子物理等)里的重要的应用工具之一。从实用的观点看，当人们考虑傅里叶分析的时候，通常是指(积分)傅里叶变换和傅里叶级数。它是整个时间域内的积分，没有局部化分析信号的功能，完全不具备时域信息，也就是说，对于傅里叶谱中的某一频率，不能够知道这个频率是在什么时候产生的。这样在信号分析中就面临一对最基本的矛盾：时域和频域的局部化矛盾。在实际的信号处理过程中，尤其是对非平稳信号的处理中，信号在任一时刻附近的频域特征都很重要。如柴油机缸盖表面的振动信号就是由撞击或冲击产生的，是一瞬变信号，单从时域或频域上来分析是不够的。这就促使人们去寻找一种新方法，能将时域和频域结合起来描述观察信号的时频联合特征，构成信号的时频谱。这就是所谓的时频分析法，亦称为时频局部化方法。小波分析方法是一种窗口大小(即窗口面积)固定但其形状可改变，时间窗和频率窗都可改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率和较低的时间分辨率，在高频部分具有较高的时间分辨率和较低的频率分辨率，所以被誉为数学显微镜。正是这种特性，使小波变换具有对信号的自适应性。 2.4 提升小波变换概述传统的第一代小波变换是在欧氏空间内通过基底的平移和伸缩构造小波基的，不适合非欧氏空间的应用，因此小波提升方案应运而生，它是构造第二代小波变换的理想方法。提升的实现形式给出了小波完全的空间域解释，它具有许多优良的特性：结构简单、运算量低、原位运算、节省存储空间、逆变化可以直接反转实现，以及可逆的整数到整数变换，便于实现。在高速处理、移动手持设备、低功耗设备的应用中具有很大的吸引力。提升小波在1996年由Sweldens提出后，在许多领域都得到了广泛应用。原有小波的基础上构造出更有效的适用于特殊应用的小波。它从另一个角度给小波的构造和性质作出了解答。同时，它也把数值分析领域的“细分插值”、“均值插值”、“高阶矩”、“欧拉算法”等概念和小波分析的“消失矩”、“尺度函数”、“小波函数”等概念巧妙地融为一体。 2.5 小波包分析短时傅里叶变换对信号的频带划分是线性等间隔的。多分辨分析可以对信号进行有效的时频分解，但因为其尺度是按二进制变化的，所以在高频段其频率分辨率较差，而在低频段其时间分辨率较差，即对信号的频带进行指数等间隔划分。那么，在对信号分解的过程中，是否对高频信号能再进行小波分解呢?回答是肯定的，这就要用到小波包分析方法。小波包分析(Wavelet Packet Analysis)能够为信号提供一种更加精细的分析方法，它将频带进行多层次划分，对多分辨分析没有细分的高频部分进一步分解，并能够根据被分析信号的特征，自适应地选择相应频带，使之与信号频谱相匹配，从而提高了时—频分辨率，因此小波包具有更广泛的应用价值。关于小波包分析的理解，可以以一个三层的分解进行说明，其小波包分解树如图1所示。图1小波包分解树状图 2.6 小波信号分析在声音处理中的应用（1）小波分析在语音基音周期检测的应用。人在发音过程中，由于声门闭合形成气流脉冲，引起声带振动，气流脉冲(声带振动)的频率称为基音频率声门闭合瞬间，气流急剧增加，对应在语音波形上即为在该瞬间有一个明显的跳变，可认为是信号的奇异点。每相邻两次声门闭合时间间隔即为瞬态基音周期，而大量瞬态基音周期的均值即为基音周期。所以，只要能检测到因声门闭合产生的语音波形突变，就可求出基音周期。小波变换为检测这类信号突变提供了强有力的工具。由信号的突变检测原理可知，选择光滑函数的一阶导数作为小波，通过定位语音信号小波变换的幅值极大值点位置，就可精确检测到因声门闭合产生的语音波形的突变点。（2）小波分析在语音波形编码中的应用。对该语音编码算法的抗误码性能进行计算机仿真研究的基础上，设计、集成了以C30、C40作为信号处理器的实时水声通信系统。（3）小波分析在语音混合编码中也有相当重要的应用。 3 常见声音特征参数提取算法 3.1 分类我们可以把提取技术分为两个个基本类型：LPC倒谱特征矢量(LPCC)和Mel倒谱参数(MFCC)。提取算法关键取决于振荡器的实现。特征提取完成从语音信号提取出对语音识别有用的信息，它对语音信号进行分析处理，去掉与语音识别无关的冗余信息，获得影响语音识别的重要信息。一般而言，由于倒频谱(cepstrum) 有着能将频谱上的高低频分开的优点，因此被广泛地应用在语音识别的研究上，例过去常用的线性预测编码导出的倒频谱参数(LPCC)和梅尔频率倒谱参数(MFCC)等都是常用的语音特征。 3.1.1 线性预测倒普系数法（LPC）线性预测分析技术是目前被广泛应用的特征参数提取技术，许多成功得以应用的系统都采用基于线性预测技术提取的LPC 倒谱系数作为系统的特征矢量。这里讲的LPC倒谱其实是复倒谱，所谓复倒谱就是信号通过Z变换以后取对数，再求反Z变换而得到的。线性预测分析方法是一种谱估计的方法，而且其声道模型系统函数H(z)反映了声道的频率响应和原始信号的谱包络，因此用lgH(z)做反Z变换即可求出其复倒谱系数。该复倒谱系数根据线性预测模型直接得到，因此又称之为LPC倒谱系数(LPCC)。之所以线性预测分析(LPC)法是目前进行语音特征分析的最有效、最重要的方法之一，这是由于： (1)它有效地解决了短时平稳信号的模型化问题，可把语音信号看成是由全极点模型产生的。 (2)能很好地逼近共振峰，提供谱估计。 (3)提供的语音信号模型参数(如基音、共振峰、谱、声道面积函数等)简洁而准确，计算量较小，便于实时处理。 (4)可用于低数率传输的环境。 (5)将LPC 参数形成的模型参数储存起来，在语音识别中提高识别率和减少识别时间。在MATLAB语言处理工具箱中已经提供了LPC系数的函数。这个函数的名字就是lpc，它的语法为：a=lpc(x,p)这里x为一帧语音信号，p为计算LPC 参数的阶数。常x为240点或256点的数据，p取10～12，对语音识别已经足够了。但要采用迭代算法计算LPC倒谱参数则需要自己再另行编写一段复倒谱递推程序,其推导公式为： h(0)=0 (n≤0) h(1)= (1 ≤n ≤p) ( n > p ) 其中为LPC系数，而p为其阶数，一般LPC倒谱系数的阶数一般取8～32阶就可以比较好的表征声道特征。 3.1.2 梅尔滤波器提取法（MEL）如下图所示，由于语音信号在时域上的变化快速而不稳定，所以通常都将它转换到频域上来观察，此时它的频谱会随着时间作缓慢的变化。所以通常将加窗后的帧经过快速傅立叶变换(FFT)，求出每帧的频谱参数。再将每帧的频谱参数通过一组N个(N一般为20～30个)三角形带通滤波器所组成的梅尔频率滤波器，将每个频带的输出取对数，求出每一个输出的对数能量(log energy)Ek，k =1,2... N。再将此N个参数进行余弦变换(cosine transform)求出L阶的Mel- scale cepstrum 参数。图2 Mel 倒频谱特征参数提取流程图余弦转换公式如下： ,m=1,2,…L 上面用MFCC进行特征提取方法，用MATLAB语言书写程序如下： f=fft(s); x=melbankm(24,256,8000); n2=1+floor(n/2); z=lof(x*abs(f(1:n2)).^2); c=dct(z); c(1)=[]; 3.1.3 小波变换法（DWT—MFC）[3] DWTMFC是在基本类型MFCC基础上把小波变换引入MFCC参数的提取，用离散小波变换代替傅里叶变换，其中梅尔滤波器组不变图3 DWT.MFC流程图 3.1.4 小波包分析法（WPTC）小波包分析可以看作是将信号通过一系列不同频带范围的带通滤波器，从而获得信号在各频带内的信息。因此本文采用小波包分析代替MFCC中离散傅里叶变换，对小波分解后每个频带内的系数求得对数能量，再进行DCT变换，即可得带小波包系数[1]。图4小波包分析法结构图 3.2 算法比较 (1)在语音特征的提取中，预加重和汉明窗两部分是必不可少的，其参数的选取关系决定了提取语音特征的正确与否。 (2)LPC是语音分析的重要手段，它能很好地进行谱估计，即可作为语音特征的参数。因此仅用12个LPC系数就能很好地表示复杂语音信号的特征，这就大大降低了信号的冗余度并有效地减少了计算量和存储量，使之成为语音识别和语音压缩的基础。 (3)倒谱也是语音的特征参数，是研究系统特性的有效数据，在实际运作中大多数语音识别系统都会采用倒谱参数来作为有关距离的度量。LPC倒谱系数是描述说话人声道特性的，广泛应用于声纹识别。 (4)从目前使用的情况来看，Mel刻度式倒频谱参数是描述人耳听觉特性的，在大词汇量语音识别应用中已逐渐取代原本常用的线性预测编码导出的倒频谱参数，原因是它考虑了人类发声与接收声音的特性，具有更好的鲁棒性。（5）小波包分析法代替MFCC中离散傅里叶变换，对小波分解后每个频带内的系数求得对数能量，再进行DCT变换，具有小波离散法的优点又较MFCC简化了步骤。 4 基于小波包分析的声音特性提取实现 4.1 概述利用说话人的语音特征对说话人身份进行辨识或确认。与语音识别一样，说话人识别也是在提取原始语音信号某些特征参数的基础上，建立相应的模板和模型，然后按照一定的判决规则进行识别。但说话人识别是力图找出不同人之间的差别，而语音识别则侧重于对不同说话者的差别进行归一化。说话人识别的关键问题之一就是提取反映说话者个性的语音特征参数。目前常用的特征参数包括线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)、梅尔倒谱系数(Mel Frequency Cepstrum Coefficient，MFCC)等,这两种参数虽然在实用中取得了较好的效果，但这些方法的鲁棒性、适应性、和推广能力都有限，特别是特征参数大都采用平稳信号的分析方法提取的，即只能人为的将语音信号分割成10～30ms的小帧来满足短时平稳的要求。小波理论是一种非平稳信号的分析方法，采用多分辨分析的思想，非均匀的划分时2频空间。本次设计采用小波包分析特征参数的提取，采用小波包分析代替MFCC中离散傅里叶变换。 4.2 总体结构小波包分析信号时，低频部分和高频部分同时进行正交分解，它将频带多层次分割，能根据分析信号的特征，自适应地选择相应频带，匹配于信号频谱，小波包分解后，各个频段的信号时域分辨力降低，采用信号重构方法，把某一频段的成分进行重构，可提高其时域分辨力。总体结构图如下：图5 系统总体结构模型 4.3 程序设计 4.3.1 语音信号分帧、加窗这里的分帧是为了提高特征参数提取的精度，而不是为了满足平稳假设的条件。 function f=enframe(x,win,inc) nx=length(x); nwin=length(win); if (nwin == 1) len = win; else len = nwin; end if (nargin < 3) inc = len; end nf = fix((nx-len+inc)/inc); f=zeros(nf,len); indf= inc*(0:(nf-1)).'; inds = (1:len); f(:) = x(indf(:,ones(1,len))+inds(ones(nf,1),:)); if (nwin > 1) w = win(:)'; f = f .* w(ones(nf,1),:); end 4.3.2 Mel滤波器组特征提取是从语音信号中提取出对语音识别有用的信息，它对语音信号进行分析处理，去掉与语音识别无关的冗余信息，获得影响语音识别的重要信息。美尔频标倒谱系数（MFCC）考虑了人耳的听觉特性，将频谱转化为基于MEL频标的非线性频谱，然后转换到频谱域上。由于充分考虑了人的听觉特性，而且没有任何前提假设，MFCC参数具有良好的识别性能和抗噪声能力。MFCC是采用滤波器组的方法计算出来的，这组滤波器在频率的梅尔坐标上是等带宽的。 function ccc = wtcc(x) bank=melbankm(24,64,22400,0,0.5,'m'); bank=full(bank); bank=bank/max(bank(:)); for k=1:12 n=0:23; dctcoef(k,:)=cos((2*n+1)*k*pi/(2*12)); end w = 1 + 6 * sin(pi * [1:12] ./ 12); w = w/max(w); xx=double(x); xx=filter([1 -0.9375],1,xx); e=1.0e-006; t=pd8(xx); t=t'; [c,d]=size(t); c2 = log(bank*t+e); c1=dctcoef*c2; c2 = c1.*w'; c2 = c2'; for i=1:32 m(i,:)=c2; end dtm = zeros(size(m)); for i=3:size(m,1)-2 dtm(i,:) = -2*m(i-2,:) - m(i-1,:) + m(i+1,:) + 2*m(i+2,:); end dtm = dtm / 3; ccc = [m dtm]; ccc = ccc(3:size(m,1)-2,:); 4.4 音频特征参数提取结果表1 两男声样本“1--4”特征参数提取1—8列小波包系数的能量列数（相应频率）声音 1 2 3 4 5 6 7 8 男A数字“1”的声音特征参数提取结果 -19.1762 -6.3377 -0.8914 -14.5067 -18.9248 -14.7818 10.8201 19.9517 男A数字“2”的声音特征参数提取结果 -15.4975 -9.0090 -3.5209 -10.5052 -27.3442 -12.2060 9.7386 22.3757 男A数字“3”的声音特征参数提取结果 -14.4774 -8.3300 -3.4101 -10.1762 -25.6394 -11.1529 9.0761 22.5569 男A数字“4”的声音特征参数提取结果 -13.0305 -7.0567 -1.1795 -13.2753 -20.4196 -12.5545 9.1436 20.3470 男B数字“1”的声音特征参数提取结果 -19.1762 -6.7393 -3.0196 -14.3797 -23.5850 -13.0696 15.9725 26.0445 男B数字“2”的声音特征参数提取结果 -19.3994 -11.9852 -4.3884 -9.0358 -31.6931 -15.0506 12.2299 29.1440 男B数字“3”的声音特征参数提取结果 -18.1887 -10.9988 -5.1990 -6.5235 -28.1043 -11.3755 11.7341 25.5349 男B数字“4”的声音特征参数提取结果 -17.4147 -11.1379 -4.0426 -13.0118 -27.5517 -11.3141 12.7736 27.7249 男B第二次发数字“1”的声音特征参数提取结果 -19.1487 -5.9441 -0.4996 -15.2670 -23.4189 -10.4117 15.7306 24.7091 男B第二次发数字“2”的声音特征参数提取结果 -19.3555 -11.5930 -4.0854 -6.6733 -29.9998 -16.1796 13.1454 28.3704 表2 两男声样本“1--4”特征参数提取9—16列小波包系数的能量列数（相应频率）声音 9 10 11 12 13 14 15 16 男A数字“1”的声音特征参数提取结果 12.5740 -3.1443 -5.1494 -0.0000 -0.0000 0.0000 0.0000 0.0000 男A数字“2”的声音特征参数提取结果 14.7159 -3.0995 -6.0191 -0.0000 0.0000 0 0.0000 -0.0000 男A数字“3”的声音特征参数提取结果 13.3458 -2.6221 -5.9615 -0.0000 -0.0000 0 -0.0000 0.0000 男A数字“4”的声音特征参数提取结果 12.0474 -2.4197 -5.2808 -0.0000 0 0.0000 0 0.0000 男B数字“1”声音特征参数提取结果 15.2974 -2.6978 -6.0493 -0.0000 0.0000 0 0.0000 -0.0000 男B数字“2”的声音特征参数提取结果 15.3234 -2.9979 -7.1283 -0.0000 0 0.0000 -0.0000 0 男B数字“3”的声音特征参数提取结果 14.5424 -2.7691 -6.3092 -0.0000 0.0000 0.0000 -0.0000 -0.0000 男B数字“4”的声音特征参数提取结果 13.7395 -2.2206 -6.7310 -0.0000 0 -0.0000 0 -0.0000 男B第二次发数字“1”的声音特征参数提取结果 14.1953 -3.2283 -6.0987 -0.0000 -0.0000 0.0000 -0.0000 0.0000 男B第二次发数字“2”的声音特征参数提取结果 15.5054 -3.2414 -6.9300 -0.0000 0 -0.0000 0 -0.0000 表3 两男声样本“1--4”特征参数提取17—24列小波包系数的能量列数（相应频率）声音 17 18 19 20 21 22 23 24 男A数字“1”的声音特征参数提取结果 0.0000 0.0000 -0.0000 0.0000 0.0000 0 0.0000 0.0000 男A数字“2”的声音特征参数提取结果 0 0.0000 0.0000 0 0.0000 0 -0.0000 0 男A数字“3”的声音特征参数提取结果 0 -0.0000 0 0.0000 0 -0.0000 0.0000 0.0000 男A数字“4”的声音特征参数提取结果 0.0000 -0.0000 -0.0000 0.0000 0.0000 0.0000 -0.0000 0.0000 男B数字“1”的声音特征参数提取结果 0 0.0000 -0.0000 -0.0000 0.0000 0.0000 0 0 男B数字“2”声音特征参数提取结果 0.0000 0 0.0000 -0.0000 -0.0000 0.0000 -0.0000 -0.0000 男B数字“3”的声音特征参数提取结果 0 0.0000 -0.0000 0 0.0000 0.0000 0 0 男B数字“4”的声音特征参数提取结果 -0.0000 -0.0000 -0.0000 0.0000 0.0000 0.0000 -0.0000 -0.0000 男B第二次发数字“1”的声音特征参数提取结果 0.0000 0 -0.0000 0 -0.0000 0.0000 0 0 男B第二次发数字“2”的声音特征参数提取结果 -0.0000 0 0.0000 0.0000 0.0000 0.0000 0 0 4.5 特征参数结果分析（1）由4.4中特征参数比较图6男A各个发言特征参数对比图表4 男声A样本“1--4”特征参数提取小波包系数的能量每两两之间差值列数男A不同发音参数差值第1列第2列第3列第4列第5列第6列 “1”与“2” 2.0290 2.6713 2.6295 -4.0015 8.4194 -2.5758 “1”与“3” 1.0089 1.9923 2.5187 -4.3305 6.7146 -3.6289 “1”与“4” -0.4380 0.7190 0.2881 -1.2314 1.4948 -2.2273 “2”与“3” -1.0201 -0.6790 -0.1108 -0.3290 -1.7048 -1.0531 “2”与“4” -2.4670 -1.9523 -2.3414 2.7701 -6.9246 0.3485 “3”与“4” -1.4469 -1.2733 -2.2306 3.0991 -5.2198 1.4016 列数男A不同发音参数差值第7列第8列第9列第10列第11列第12-24列 “1”与“2” 1.0815 -2.4240 -2.1419 -0.0448 0.8697 0 “1”与“3” 1.7440 -2.6052 -0.7718 -0.5222 0.8121 0 “1”与“4” 1.6765 -0.3953 0.5266 -0.7246 0.1314 0 “2”与“3” 0.6625 -0.1812 1.3701 -0.4774 -0.0576 0 “2”与“4” 0.5950 2.0287 2.6685 -0.6798 -0.7383 0 “3”与“4” -0.0675 2.2099 1.2984 -0.2024 -0.6807 0 从上图及差值表可以发现在3—5列数值上有很大差别有些部分数值上基本无差别。这些信号在前11列小波包系数能量上的差别表明了语音只在前11列的相应频率上有能量差别。而特征参数（小波包系数能量）从12列部分开始，几乎是0，这就表明这些不同的语音信号在其他频率上基本没有能量。（2）由5.4.1与5.4.2特征参数比较可以从以下图中清晰看出图7 男A与男B发“1”时特征参数对比图图8 男A与男B发“2”时特征参数对比图图9 男A与男B发“3”时特征参数对比图图10 男A与男B发“4”时特征参数对比图表5 男声A、B样本“1--4”特征参数相对应之间差值1—6列列数男A男B同一发音特征参数差值第1列第2列第3列第4列第5列第6列 “1” 5.7077 0.4016 2.1282 -0.1270 4.6602 -1.7122 “2” 3.9019 2.9762 0.8675 -1.4694 4.3489 2.8446 “3” 3.7113 2.6688 1.7889 -3.6527 2.4649 0.2226 “4” 4.3842 4.0812 2.8631 -0.2635 7.1321 -1.2404 表6 男声A、B样本“1--4”特征参数相对应之间差值7—24列列数男A男B同一发音特征参数差值第7列第8列第9列第10列第11列第12-24列 “1” -5.1524 -6.0928 -2.7234 -0.4465 0.8999 0 “2” -2.4913 -6.7683 -0.6075 -0.1016 1.1092 0 “3” -2.6580 -2.9780 -1.1966 0.1470 0.3477 0 “4” -3.6300 -7.3779 -1.6921 -0.1991 1.4502 0 观察以上四图及差值表较明显看出同一人发音在1—2和6—11列相对的频率上区别不大，而不同人不同人的发音区别在这些列上有了很大的区别。（3）5.4.2与5.4.3特征参数比较图11 男B两次发“1”时特征参数对比图图12 男B两次发“2”时特征参数对比图表7 男声B样本“1--2”特征参数两次同一发音相对应之间差值1—6列列数男B同一数字重复发音特征参数差值第1列第2列第3列第4列第5列第6列 “1” 0.0275 0.7952 2.5200 -0.8873 0.1661 2.6579 “2” 0.0439 0.3922 0.3030 2.3625 1.6933 -1.1290 表8 男声B样本“1--2”特征参数两次同一发音相对应之间差值7—24列列数男B同一数字重复发音特征参数差值第7列第8列第9列第10列第11列第12-24列 “1” -0.2419 -1.3354

展开阅读全文

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

关于本文

本文标题：基于小波包分析的声音特性提取.doc
链接地址：https://www.zixin.com.cn/doc/2490162.html

天****

内容提供者实名认证

平台协调中心【客服】

相似文档自信AI助手

基于pt100热电阻的简易温度测量系统.doc
空乘操作规程8篇.docx
架子工安全操作规程概述与示范.docx
钢筋工安全操作规程的全面解读与应用指南.docx
2022-2023年教科版四年级科学下册期中考试题含答案.doc
酸洗处理安全操作规程6篇.docx
电工安全操作技术规程5篇.docx
钢筋工安全操作规程的正确执行.docx
大厦水泵房技术安全操作规程制度.docx

搜索标签自信AI导航

基于波包分析声音特性提取