基于MATLAB的语音信号分析和处理.doc
《基于MATLAB的语音信号分析和处理.doc》由会员分享,可在线阅读,更多相关《基于MATLAB的语音信号分析和处理.doc(25页珍藏版)》请在咨信网上搜索。
1、毕业论文2012届基于MATLAB的语音信号分析和处理 学生姓名 许少杰 学 号 08104226 院 系 数理信息学院 专 业 电子信息工程 指导教师
2、 刘兆霆 完成日期 2012年5月20日 21基于MATLAB的语音信号分析和处理摘 要语音信号的处理是一门非常重要的学科,如今普遍应用在电话通信、助听器等方面。本次设计主要是为了在Matlab软件的帮助下,处理一段被“污染”的声音信号。该过程会涉及到采样定理,快速傅里叶变换等理论和算法在设计过程中的实际应用。在本次设计中,我们关注的是在驱除噪声污染时所需要的滤波器的选择,充分比较各种滤波器的优缺点后,再利用滤波器来滤除杂音。通过滤波前后的声音信号的频谱图的对比,来了解滤波器的特
3、性和作用,并得到本次设计的结果。关键词 语音信号;Matlab;傅里叶变换;滤波器 。ANALYSIS AND PROSESSING OF THE SPEECH SIGNAL BASED MATLABABSTRACT The voice signal processing is a very important discipline with a wide use range, for example telephone communications, hearing aids and so on. The purpose of my paper is to proc
4、ess a polluted sound signal by using the Matlab software. This process may involve the sampling theorem, the fast Fourier transform theory and practical application of the used algorithm. In this paper, we focus on selecting the appropriate filter, and fully comparing the advantages and disadvantage
5、s of the various filters, and then using the appropriate filter to filter out the noise polluting the voice signal. By comparing the frequency spectrum of the sound signals, we can understand the work nature of the filter, and obtain our results.Keyword Voice signal;Matlab;Fourier transform;Filter目
6、 录 摘 要IABSTRACTII目 录III1绪论11.1 国内外研究状况11.2 课题的背景及意义12语音信号处理的基本理论知识22.1语音信号采样频率和采样位数的选择22.2语音信号的合成22.3时域信号的FFT分析32.4数
7、字滤波器32.4.1 IIR数字滤波器32.4.2 FIR数字滤波器42.4.3 FIR数字滤波器和IIR数字滤波器的比较52.5倒谱63语音处理信号的理论方案论证63.1语音信号的采集63.2语音信号的处理63.3系统框图74语音信号处理的实例分析84.1语音信号的录入84.2语音信号的提取84.3语音信号的时域和频谱图84.4语音信号的“污染”104.5 IIR滤波器的设计及滤波114.6 设计FIR滤器波并滤波134.7 回放语言信号15总结15参考文献16附录17致 谢211绪论本次设计是为了综合运用数字信号处理的理论知识对语音信号进行时频分析和滤波器设计,根据理论知识,设
8、计实验步骤,再利用计算机上的Matlab软件进行编程实现,得到需要的结果。通过本次毕业设计:第一,要学会如何使用Matlab软件,能够独自完成MATLAB的程序设计方法;第二,掌握在Window环境下语音信号采集的方法;第三,掌握在MATLAB环境下设计FIR和IIR数字滤波器的方法。 1.1 国内外研究状况 60年代,语音信号处理的技术就取得了新的进展,其主要有数字滤波器、快速傅里叶等理论和算法的广泛应用,这些理论和算法为语音信号处理奠定了坚实的基础,为以后快速的发展埋下了伏笔。另外一个方面,就是因为数字计算机得到了推广,
9、计算机普遍应用在科研的各个方面,计算的速率比以前老式的计算方式快了许多。而且由于计算机软件的出现,可以使得用软件模拟代替硬件模拟,有效的降低了科研的成本,更可以从多方面来观察研究进展,使得人们可以更加全面、详细的了解试验过程,更容易找出实验中的问题,不断加快各种研究和发明的出现。70年代,日本学者板仓(Itakura)等人最先在语音分析和合成中用到了线性预测技术。线性预测技术是将一个信号看做是一个模型的输出,这样信号的描述就可以用模型来代替。在语音信号处理中,线性预测技术最主要的是提供了一个声道模型,这个模型对于语音信号处理的研究具有非常积极的作用,通过这个模型,我们可以做各种理论方面的研究。
10、线性预测技术对于语音编码也非常适合,不仅如此,线性预测系数对于语音识别也是很重要的信息来源。80年代,矢量量化技术(VQ,即Vector Quantization)的出现,使得在语音信号压缩方面取得突破性进展。它在语音信号处理中有十分重要的地位,广泛应用于语音编码、语音识别与语音合成等领域。另外,用隐马尔可夫模型描述语音信号产生过程代表了语音信号处理技术的重大突破。近年来,许多人在研究如何把人工神经网络应用到语音信号方面,并且取得了一定的成就,尤其语音识别。人们把生物的神经网络的特征应用到人工神经网络上,特别是生物的听觉系统的模拟,让人们建立了一个有类似能力的模型,因而语音的识别效率得到了显著
11、的提高。目前,人机交流是一种热点的研究项目,而其中要用到语音识别和语音合成两种重要技术。在语音信号处理中有很多新兴与前沿技术,主要包括混沌理论在该技术中的应用,分形理论的应用和语音信号的非线性预测编码等。 1.2 课题的背景及意义 语音信号处理是一门非常实用的学科。语言在人类历史的发展上起到了十分重要的作用,它是人们交流沟通的重要手段。小到平时生活中买卖的讨价还价,大到国际上的外交谈判,都是同过语言进行的,通过语言人们
12、进行信息上的交流与沟通,在交流与沟通的过程中,人们得到了长足的发展。语音处理技术的被用到了生活中的方方面面,如公交车上的自动报站设备,汽车上的喇叭,给耳朵不好的人使用的助听器,工业中的自动报警设备等。目前,语音处理技术的研究与实际应用方面结合的很好,充分做到了产研一体化,我们有理由相信在今后语音技术会发展更好,给大家的生活带来更多的帮助。语音信号处理早已经给人类的社会带来了巨大的经济和社会效益,以后它在理论上有更为广泛的发展,在应用方面也会成为社会各个方面的非常有用的工具,它是我们发展不可缺少的一部分,不论是民用还是军用,不论是社会生产还是科学研究,它都将发挥出巨大的作用。目前,科学家们正在研
13、究如何进行人机对话。这个课题具有非常实际的意义,如口呼打字机(即语音输入,文字输出的机器),如语音翻译机(戴在耳朵上,可实现实时中英文翻译),还有用语音指挥机器自动化生产等,这些都是目前的研究焦点,它们并不是科幻中的产物,而是马上就要实现的科学产品。语音信号处理技术的日益发展,体现在我们生活中的方方面面,90年的电话到2000年的手机,都充分说明了语音信号处理技术的重要性及其意义。2语音信号处理的基本理论知识2.1语音信号采样频率和采样位数的选择采样频率指的是1秒内计算机所采集到的声音样本,如20.1KHZ表示的是1秒的时间计算机采集20100次声音样本。一般来说采样频率越大,就与原信号越接近
14、,采样频率越小,就会偏离原信号,造成信号失真。采样位数所表示的是一段声音进行分析的精确度,10位则代表2的10次即1024个精度单位进行分析。如此,采样位数越大则表示这段声音越精准。想要把未处理的模拟信号转换成数字信号,就必须要对语音信号进行采样,从而得到离散的信号。可以把原始的语音信号看作是一条曲线,曲线是有无数的点组成的,采样过程就是在这无数的点中选取一定数量的点,以这些点来构成一条新曲线,这就是采样的具体过程。但是采样不当会造成严重的问题,若是采样频率太小会造成信号的失真,让信号变的不完整;若是采样频率太大会浪费机器上的存储资源。根据奈奎斯特采样定理,采样频率最好选择信号带宽的两倍,这样
15、即不会造成信号失真,又不会造成资源浪费。取样之后要对信号进行采样位数的选择,采样位数是指将取样后得到的样本序列的幅度再离散化,即将时间上离散而幅度仍连续的波形再离散化。同样拿一段曲线来表示信号,采样位数就是对这段曲线的幅度值进行分割,若采样位数是1500,那么表示将这段曲线的幅度值平均分成1500份,每一份算做一个新的幅度值。2.2语音信号的合成 本次设计要求对一段语音进行加载一段噪声,使其受到“污染”。在Matlab软件中要实现这一个要求,一般是给这段语音信号叠加加一个随即函数w*randn(a,b),这样就可以模拟一段被噪声“污染”的语音信号,并可通过参数w来设置
16、噪声的功率,也就是说,我们可以通过改变w的大小来调节信噪比。2.3时域信号的FFT分析FFT是快速傅里叶的英文缩写,它与傅里叶变换相比,没有什么理论上的重大突破,只是对傅里叶变换进行了总结和整理,使它能够在计算机上使用时减小计算量,以适应在计算机上使用。它可以使DFT的运算速度提高一到两个数量级,使得语音信号处理技术应用与各个方面的实时处理创造了条件。在Matlab中,可以直接调用FFT函数与IFFT函数进行快速傅里叶的运算与逆运算,具体的调用格式为y=fft(x),其中x是序列,而y则是序列的傅里叶变换。当然,这里的x不止可以是序列,还可以是向量或矩阵,那么y则是对应的快速傅里叶变换。快速傅
17、里叶变换算法是信号处理领域的重要研究领域。快速傅里叶变换有许多算法,其中最简单和最容易的是基2FFT算法,在Matlab中,y=fft(x)这个函数中的x的长度若是2的幂次方,则进行FFT函数运算时,进行的运算是基2FFT运算,否则进行的是混合基的离散傅里叶变换算法,而且运算速度会相对减慢。2.4数字滤波器所谓的数字滤波器,就是指通过数值运算的方式,改变输入信号的频率,使之达到预定的信号的数字器件或程序。因为数字滤波器是通过数字器件,进行数字运算来实现滤波,所以数字滤波器有着精度高、小巧、稳定等的作用,可以实现模拟滤波器所无法实现的工作,所以在信号处理方面有着巨大的作用。只有先对模拟信号进行模
18、数转换,才可以进行在数字滤波器上进行滤波。数字滤波器从滤波特性上来讲,一般可以分成4类,分别是低通滤波器、高通滤波器、带通滤波器和带阻滤波器。数字滤波器若从实现的网络结构抑或从单位脉冲相应长度这方面来分类,可以分为无限长的单位脉冲相应(IIR)滤波器和有限长的单位脉冲响应(FIR)滤波器。但是IIR滤波器和FIR滤波器之间的设计方法是不相同的。2.4.1 IIR数字滤波器设计IIR数字滤波器的最常用的方法是间接设计法。间接设计法是借助于模拟滤波器的设计方法进行的。并且模拟滤波器的发展已经非常成熟,有现成的方法、数据、公式,可以拿来就用,不用进行多余的实验。不仅如此,模拟滤波器还有很多已经非常成
19、熟的经典设计,可以供我们选择使用。用间接设计法来设计数字滤波器,非常具有实用性。用间接法设计IIR数字滤波器的具体过程如下:首先,在设计之前要先考虑自己想要的是怎么样的滤波器,设计目标的滤波器频率特性,包括相位特性和幅频特性。若是滤波器对相位不作要求,可以只考虑滤波器的幅频特性。再把这些性能数值转换成模拟器的性能数值,具体的是性能包含通带和阻带的截止频率Wp、Ws;通带和阻带的纹波系数Rp和Rs;然后,根据转换而来的技术指标来选择低通滤波器的阶数,并选择相应的函数,确定最小的阶数和固定频率。通过确定模拟滤波器的类型。通过把模拟低通滤波器转换成其他类型的滤波器;最后,运用脉冲相应不变法,把模拟滤
20、波器转化为数字滤波器1。因为用直接法设计滤波器是在时域和频域内直接设计,要用到联立方程组,涉及到的计算比较复杂,要用到计算机来进行计算,所以一般不用直接法。IIR数字滤波器的系统函数为2公式(2-1): (2-1)以上设计步骤中,最重要的就是将模拟低通
21、滤波器转化成系统函数,这其中有两点难关。第一个难关是根据转化而来的性能数值来计算所选取的模拟滤波器的系统函数,因为模拟滤波器已经有了完备的参数图表,这一步可以通过查表来获得各个阶数相对应的分母多项式;第二个难关是把模拟滤波器的系统函数转化成数字滤波器的系统函数,这两个系统函数之间虽然已经有了相互转化的函数,但是由于函数比较复杂,计算起来非常有难度,所以这一步通常是通过matlab软件的函数调用来解决的。 Matlab软件有自己的数据库,里面有很多经常要用到的函数,用户可以很方便的调用出来,运用这些函数,能够使编程变得简单。该软件里有一个buttord函数,通过这个就可以设计滤波器,十分的简单。
22、通过对这个函数中的参数细节上的调整,可以设计出不同的滤波器。通过比较的发现,在满足相同的滤波器的指标的条件下,这四种滤波器的阶数是不同的,巴特沃斯滤波器阶数最高,椭圆滤波器阶数的阶数最低。如果阶数越高,就会造成信号延迟越大。同时在IIR数字滤波器中,阶数高的话,系数要求的精度也会越高,否则很可能使极点移到单位园外。因此在阶数的选择上是要进行综合考虑的。2.4.2 FIR数字滤波器有限脉冲响应(FIR)滤波器在保证幅度特性满足技术要求的同时,很容易做到有严格的线性相位特性5。它的系统函数为公式(2-2): &nb
23、sp; (2-2)是的次多项式,它在平面上有个零点,在原点处有一个重极点。所以,是非常稳定的。FIR数字滤波器最突出的优点是它的稳定性与线性相位特性6。FIR数字滤波器一般用窗函数法来设计实现的,窗函数的形状与带内波动以及阻带衰减有很大的关系,过渡带的宽度与窗函数的长度N有关系,所以就产生几种经典的窗函数,
24、分别是矩形窗(Rectangle Window)、三角形窗(Bartlett Window)、汉宁(Hanning)窗升余弦窗、哈明(Hamming)窗改进的升余弦窗、布莱克曼(Blackman)窗、凯塞贝塞尔窗(KaiserBasel Window)。这些经典的窗函数都有基本的参数如过渡带宽度、阻带最小衰减、旁瓣峰值等,在做具体设计的时候非常方便我们查询,来选择具体的窗函数。 用窗函数法设计FIR滤波器的具体步骤:首先,根据设计任务对过渡带以及阻带衰减的指标要求,查询窗函数的基本参数,选择符合条件的窗函数,并且估计出窗函数的长度N。选择窗函数的方法是在满足阻带衰减这个条件下,尽可能的选择旁瓣
25、峰值的绝对值小的窗函数。然后根据这个函数的过渡带宽度来估计该函数的可、窗口长度N。,这里的A取决于窗口类型,可以从窗函数的基本参数表里得到,数值上为该窗函数的近似值;然后,得到频率响应函数,即 (2-3)在低通滤波器中,满足条件: &n
26、bsp; (2-4)计算出。具体公式为:
27、 (2-5)最后,得到设计的结果: 。 (2-6)2.4.3 FIR数字滤波器和IIR数字滤波器的比较从性能比较上来说,IIR数字滤波器的系统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 08104226 许少杰 基于 MATLAB 语音 信号 分析 处理
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。