语音信号处理课件第九章.ppt
《语音信号处理课件第九章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理课件第九章.ppt(51页珍藏版)》请在咨信网上搜索。
1、数字语音处理及MATLAB仿真 张雪英编著1第九章第九章 语音合成语音合成 9.1 概述概述19.2 语音合成的原理及分类语音合成的原理及分类9.3 共振峰合成法共振峰合成法39.4 线性预测参数合成法线性预测参数合成法49.5 基音同步叠加法基音同步叠加法59.6 文语转换系统文语转换系统621编辑ppt数字语音处理及MATLAB仿真 张雪英编著29.1 概述概述 语语音音合合成成是是人人机机语语声声通通信信的的一一个个重重要要组组成成部部分分,解决让机器像人那样说话的问题。解决让机器像人那样说话的问题。最最早早的的合合成成器器是是1835年年由由W.von Kempelen发发明明,经经W
2、eston改改进进的的机机械械式式会会讲讲话话的的机机器器。而而最最早早的的电电子子式式语语音音合合成成器器是是1939年年Homer Dudley发发明明的的声声码码器器,它它不不是是简简单单的的模模拟拟人人的的生生理理过过程程,而而是是通通过过电电子子线线路路来来实实现现基基于于语语音音产产生生的的源源-滤滤波波器器理理论。论。2编辑ppt数字语音处理及MATLAB仿真 张雪英编著3 在在语语音音合合成成技技术术发发展展中中,早早期期研研究究主主要要是是采采用参数合成方法。用参数合成方法。1990年年提提出出的的基基音音同同步步叠叠加加PSOLA方方法法,使使基基于于时时域域波波形形拼拼接
3、接方方法法合合成成的的语语音音音音色色和和自自然然度度大大大提高。大提高。我我国国的的汉汉语语语语音音合合成成研研究究从从80年年代代初初就就基基本本上上与与国国际际研研究究同同步步发发展展。大大致致也也经经历历了了共共振振峰峰合合成成、LPC合成到应用合成到应用PSOLA技术的过程。技术的过程。3编辑ppt数字语音处理及MATLAB仿真 张雪英编著49.2 语音合成的原理及分类语音合成的原理及分类 9.2.1 波形合成法波形合成法 波波形形编编码码合合成成法法是是一一种种波波形形合合成成法法,类类似似于于语语音音编编码码中中的的波波形形编编解解码码方方法法,该该方方法法直直接接把把要要合合成
4、成的的语语音音的的发发音音波波形形进进行行存存储储或或者者进进行行波波形形编编码码压压缩缩后存储,合成重放时再解码组合输出。后存储,合成重放时再解码组合输出。特特点点:所所需需的的存存储储容容量量太太大大,词词汇汇量量不不能能很很大大;相相对对简简单单,通通常常只只能能合合成成有有限限词词汇汇的的语语音音段段。目目前前用于自动报时、报站和报警等。用于自动报时、报站和报警等。4编辑ppt数字语音处理及MATLAB仿真 张雪英编著5 另另一一种种波波形形合合成成法法是是波波形形编编辑辑合合成成,它它把把波波形形编编辑辑技技术术用用于于语语音音合合成成,通通过过选选取取音音库库中中采采取取自自然然语
5、语言言的的合合成成单单元元的的波波形形,对对这这些些波波形形进进行行编编辑辑拼拼接接后后输输出出。它它采采用用语语音音编编码码技技术术,存存储储适适当当的的语语音音基基元元,合合成成时时,经经解解码码、波波形形编编辑辑拼拼接接、平平滑滑处处理理等等输出所需的短语、语句或段落。输出所需的短语、语句或段落。5编辑ppt数字语音处理及MATLAB仿真 张雪英编著69.2.2 参数合成法参数合成法 参数合成法也称为分析合成法。参数合成法也称为分析合成法。参参数数合合成成法法有有:发发音音器器官官参参数数合合成成和和声声道道模模型型参数合成。参数合成。发音器官参数合成法:发音器官参数合成法:是是对对人人
6、的的发发音音过过程程直直接接进进行行模模拟拟。它它定定义义了了唇唇、舌舌、声声带带的的相相关关参参数数,如如唇唇开开口口度度、舌舌高高度度、舌舌位位置置、声声带带张张力力等等,由由发发音音参参数数估估计计声声道道截截面面积积函函数数,进而计算声波。进而计算声波。缺点:合成语音的质量不理想。缺点:合成语音的质量不理想。6编辑ppt数字语音处理及MATLAB仿真 张雪英编著7 参参数数合合成成方方法法的的优优点点:音音库库一一般般较较小小,并并且且整整个个系系统统能能适适应应的的韵韵律律特特征征的的范范围围较较宽宽,这这类类合合成成器器比特率低,音质适中。比特率低,音质适中。缺缺点点:算算法法复复
7、杂杂,参参数数多多,并并且且在在压压缩缩比比较较大大时时,信信息息丢丢失失亦亦大大,合合成成出出的的语语音音总总是是不不够够自自然然、清晰。清晰。为为了了改改善善音音质质,近近几几年年发发展展了了混混合合编编码码技技术术,以改善激励信号的质量。以改善激励信号的质量。7编辑ppt数字语音处理及MATLAB仿真 张雪英编著89.2.3 规则合成法规则合成法 规规则则合合成成方方法法:一一种种高高级级的的合合成成方方法法,通通过过语语音音学学规规则则产产生生语语音音,可可以以合合成成无无限限词词汇汇的的语语句句。合合成成的的词词汇汇表表不不是是事事先先确确定定,系系统统中中存存储储的的是是最最小小的
8、的语语音音单单位位的的声声学学参参数数,以以及及由由音音素素组组成成音音节节、由由音音节节组组成成词词、由由词词组组成成句句子子和和控控制制音音调调、轻轻重重音音等等韵律的各种规则。韵律的各种规则。算算法法中中,用用于于波波形形拼拼接接和和韵韵律律控控制制的的较较有有代代表性的算法是基音同步叠加表性的算法是基音同步叠加PSOLA技术。技术。8编辑ppt数字语音处理及MATLAB仿真 张雪英编著99.2.3 规则合成法规则合成法 基音同步叠加基音同步叠加PSOLA技术技术主要特点:主要特点:在在语语音音波波形形片片断断拼拼接接之之前前,首首先先根根据据语语义义,用用PSOLA算算法法对对拼拼接接
9、单单元元的的韵韵律律特特征征进进行行调调整整,使使合合成成波波形形既既保保持持了了原原始始语语音音基基元元的的主主要要音音段段特特征征,又又使使拼拼接接单单元元的的韵韵律律特特征征符符合合语语义义,从从而而获获得得很很高高的的可懂度和自然度。可懂度和自然度。9编辑ppt数字语音处理及MATLAB仿真 张雪英编著10项目项目波形合成方式波形合成方式参数合成方式参数合成方式按规则合成方式按规则合成方式语音语音质量质量可懂度可懂度高高高高高高自然度自然度高高中中高高词汇量词汇量小(小(500字以下)字以下)大(数千字)大(数千字)无限无限合成方法合成方法PCM,ADPCMLPC,LSP,共振峰共振峰
10、LPC,LSP共振峰共振峰数码率数码率9.664kbit/s 2.49.6 kbit/s5075 kbit/s1兆比特可合成兆比特可合成的语音长度的语音长度15秒秒100秒秒100秒秒7分分无限无限合成基元合成基元音节、词组、句音节、词组、句子子音节、词组、句子音节、词组、句子音素、双音素、音音素、双音素、音节节装置装置简单简单比较复杂比较复杂复杂复杂硬件主体硬件主体存储器存储器存储器和处理器存储器和处理器处理器处理器表表9.1 三种语音合成方式的比较三种语音合成方式的比较10编辑ppt数字语音处理及MATLAB仿真 张雪英编著119.3 共振峰合成法共振峰合成法 共共振振峰峰合合成成理理论论
11、中中声声道道参参数数、声声道道谐谐振振特特性性一直是研究的重点。一直是研究的重点。共共振振峰峰合合成成模模型型是是把把声声道道视视为为一一个个谐谐振振腔腔,利利用用腔腔体体的的谐谐振振特特性性,如如共共振振峰峰频频率率及及带带宽宽,以以此此为为参参数数构构成成一一个个共共振振峰峰滤滤波波器器。因因为为音音色色各各异异的的语语音音有有不不同同的的共共振振峰峰模模式式,以以每每个个共共振振峰峰频频率率及其宽带为参数,可以构成一个共振峰滤波器。及其宽带为参数,可以构成一个共振峰滤波器。11编辑ppt数字语音处理及MATLAB仿真 张雪英编著129.3 共振峰合成法共振峰合成法 共振峰语音合成器的构成
12、原理:共振峰语音合成器的构成原理:将多个共振峰滤波器组合起来模拟声道的传将多个共振峰滤波器组合起来模拟声道的传输特性,对激励声源发生的信号进行调制,经过输特性,对激励声源发生的信号进行调制,经过辐射得到合成语音。辐射得到合成语音。基于共振峰的理论有三种实用模型。基于共振峰的理论有三种实用模型。12编辑ppt数字语音处理及MATLAB仿真 张雪英编著139.3.1 级联型共振峰模型级联型共振峰模型 在在该该模模型型中中,声声道道被被认认为为是是一一组组串串联联的的二二阶阶谐谐振振器器,共共振振峰峰滤滤波波器器首首尾尾相相接接,其其传传递递函函数数为为各各个个共共振峰的传递函数相乘的结果。振峰的传
13、递函数相乘的结果。13编辑ppt数字语音处理及MATLAB仿真 张雪英编著14激励源激励源V1V2-V5辐射模型辐射模型 语音语音G一个五个极点的共振峰级联模型如下一个五个极点的共振峰级联模型如下图图9.2 共振峰级联模型共振峰级联模型五个极点的共振峰级联模型传递函数为:五个极点的共振峰级联模型传递函数为:即:即:式中,式中,G为增益因子。为增益因子。14编辑ppt数字语音处理及MATLAB仿真 张雪英编著159.3.2 并联型共振峰模型并联型共振峰模型 在在并并联联型型模模型型中中,输输入入信信号号先先分分别别进进行行幅幅度度调调节节,再再加加到到每每一一个个共共振振峰峰滤滤波波器器上上,然
14、然后后将将各各路的输出叠加起来。路的输出叠加起来。其传递函数为其传递函数为:15编辑ppt数字语音处理及MATLAB仿真 张雪英编著16 上式可分解成以下部分分式之和:上式可分解成以下部分分式之和:其中其中Al为各路的增益因子。为各路的增益因子。16编辑ppt数字语音处理及MATLAB仿真 张雪英编著17下图就是一个下图就是一个M=5的并联型共振峰模型。的并联型共振峰模型。激励源激励源+辐射模型辐射模型语音语音图图9.3 并联型共振峰模型并联型共振峰模型17编辑ppt数字语音处理及MATLAB仿真 张雪英编著189.3.3 混合型共振峰模型混合型共振峰模型 比比较较以以上上两两种种模模型型,对
15、对于于大大多多数数的的元元音音,级级联联型型合合乎乎语语音音产产生生的的声声学学理理论论,并并且且无无需需为为每每一一个个滤滤波波器器分分设设幅幅度度调调节节;而而对对于于大大多多数数清清擦擦音音和和塞塞音音,并并联联型型则则比比较较合合适适,但但是是其其幅幅度度调调节节很很复复杂杂。于于是是考考虑虑将将两两者者结结合合在在一一起起,提提出出了了混混和和型型共振峰模型。共振峰模型。18编辑ppt数字语音处理及MATLAB仿真 张雪英编著19混和型共振峰模型如下图所示:混和型共振峰模型如下图所示:图图9.4 混和型共振峰模型混和型共振峰模型19编辑ppt数字语音处理及MATLAB仿真 张雪英编著
16、20 对于共振峰合成器的激励,简单地将其分为浊对于共振峰合成器的激励,简单地将其分为浊音和清音两种类型是有缺陷的,为了得到高质量的音和清音两种类型是有缺陷的,为了得到高质量的合成语音,激励源应具备多种选择,以适应不同的合成语音,激励源应具备多种选择,以适应不同的发音情况。发音情况。混和型共振峰模型中激励源有三种类型:合成混和型共振峰模型中激励源有三种类型:合成浊音语音时用周期冲激序列;合成清音语音时用伪浊音语音时用周期冲激序列;合成清音语音时用伪随机噪声;合成浊擦音语音时用周期冲激调制的噪随机噪声;合成浊擦音语音时用周期冲激调制的噪声。声。20编辑ppt数字语音处理及MATLAB仿真 张雪英编
17、著21 共振峰合成技术弱点共振峰合成技术弱点:(1)由由于于它它是是建建立立在在对对声声道道的的模模拟拟上上,因因此此,声声道道模型的不精确势必会影响其合成质量。模型的不精确势必会影响其合成质量。(2 2)实实际际工工作作中中共共振振峰峰模模型型并并不不能能表表征征影影响响语语音音自自然然度度的的其其他他许许多多细细微微的的语语音音成成分分,从从而而影影响响了了合合成成语音的自然度。语音的自然度。(3 3)共共振振峰峰合合成成器器控控制制十十分分复复杂杂,实实现现起起来来十十分分困困难。难。21编辑ppt数字语音处理及MATLAB仿真 张雪英编著229.4 线性预测参数合成法线性预测参数合成法
18、 是是一一种种“源源滤滤波波器器”模模型型,由由白白噪噪声声序序列列和和周周期期脉脉冲冲序序列列构构成成的的激激励励信信号号,经经过过选选通通、放放大大并并通通过时变数字滤波器,就可以再获得原语音信号。过时变数字滤波器,就可以再获得原语音信号。图图9.5 LPC语音合成器的框图语音合成器的框图22编辑ppt数字语音处理及MATLAB仿真 张雪英编著23 线线性性预预测测合合成成的的形形式式有有两两种种:一一种种是是直直接接用用预预测测器器系系数数构构成成的的递递归归型型合合成成滤滤波波器器,用用这这种种方方法法定定期期地地改改变变激激励励参参数数u(n)和和预预测测系系数数,就就能能合合成成出
19、出语语音。它合成的语音样本由下式决定音。它合成的语音样本由下式决定:其其中中:ai为为预预测测系系数数;G为为模模型型增增益益;u(n)为为激激励励;合成样本为合成样本为s(n);p为预测器阶数。为预测器阶数。23编辑ppt数字语音处理及MATLAB仿真 张雪英编著24图图9.6 直接用预测器系数直接用预测器系数ai构成的合成滤波器构成的合成滤波器 24编辑ppt数字语音处理及MATLAB仿真 张雪英编著25 另另一一种种合合成成的的形形式式是是采采用用反反射射系系数数构构成成的的格格型型合成滤波器。它的合成语音样本由下式决定合成滤波器。它的合成语音样本由下式决定:其中:其中:G为模型增益;为
20、模型增益;u(n)为激励;为激励;ki为反射系数;为反射系数;bi(n)为后向预测误差;为后向预测误差;p为预测器阶数。为预测器阶数。25编辑ppt数字语音处理及MATLAB仿真 张雪英编著26 LPC语音合成和共振峰语音合成比较:语音合成和共振峰语音合成比较:(1)LPC语语音音合合成成有有比比较较简简单单和和完完全全自自动动的的分分析析步步骤骤,合合成成器器结结构构也也比比较较简简单单,采采用用格格形形滤滤波波器器时时,量量化化特特性性和和稳稳定定性性都都比比较较好好,硬硬件件实实现现容容易易;而而共共振振峰峰合合成成需需要要较较多多的的参参数数调调整整,合合成成器器结结构构相相对对讲讲要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 课件 第九
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。