国内统计信号处理在语音识别的应用.doc
《国内统计信号处理在语音识别的应用.doc》由会员分享,可在线阅读,更多相关《国内统计信号处理在语音识别的应用.doc(18页珍藏版)》请在咨信网上搜索。
1、国内统计信号处理在语音识别的应用 作者: 日期:18 个人收集整理 勿做商业用途国内统计信号处理在音频模式识别中的应用摘要语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业,目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模
2、型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通 过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手 表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘, 通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。语音识别技
3、术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98,对特定人语音识别系统的识别精度就更高.这些技术已经能 够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识 别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功 能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85以上的人对语音识别的信息 查询服务系统的性能表示满意.可以预测在
4、近五到十年内,语音识别系统的应用将更加广泛.各种各样的语音识别系统产品将出现在市场上.人们也将调整自己的说话方式以适应各种各样 的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统 的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。就像在60年代,谁又能预测今天超大规模集成电路技术会对我们 的社会产生这么大的影响。 文档为个人收集整理,来源于网络个人收集整理,勿做商业用途 在语音识别系统中必然存在预处理,存在语音信号处理的过程,因此能否对语音信号作很好的处理则是一个很
5、重要的环节,因此我们可利用信号处理的理论对其进行描述。主题 一:我国信号处理技术的发展9 8 年在中国电子学会和中国仪器仪表学会的组织下 成立了信号处理学会 该学会分个专业学组 ,即:理论与方法学组 ,振动信号处理学组,语声、图像及通信信号处理学组,雷声信号处理学组和信号处理系统与设备学组。在信号处理的理论和应用方面取得了一大究成果,使我国信号处理技术水平由起步一跃而进入了国际先进行列。1 9 9 0 年我国在北京主持召开了第一届国际信号处理学术会议,来自 2 3 个国家和地区的专家学者 ,交流了学科最新成果 ,2 5 0 余篇论文中一半以上集中了国内的优秀成果。会议的胜利召开是我国信号进入国
6、际学术行列的标志。特别值得欣慰的是我们学会的取名。我们的学会自成立开始即为信号处理学会,而国际 I E E E 的相应学会“声学,语言信号处理学会 ( A S S P)亦于 1 9 90年起更名为信号处理学会 ( S P )采用了与我国相同的名称。第二届国际信号处理学术会议I c sP 9 3 将于 1 9 9 3 年 1 0 月在北京召开 ,将有国内外稿件 3 5 。余篇发表 ,其中有近一半是国内稿件,将充分反映国内的研究水平。国内信号处理技术的进展可以从以下三个方面来介绍 ,即 :1.理论和算法;2 应用发展。个人收集整理,勿做商业用途个人收集整理,勿做商业用途1 理论和算法。 离散变换
7、19 6 0 年 G oo d 提出了快速付立叶变换的想法,1 9 6 5 年 C o o l e y 和 T u k c y 又独立地发表了F FT 算法,数字信号处理发生了革命性的改变。R a d e r 等于 1 9 7 0 年提出了计算素数点的 D F T 方法 (PF A )使 FFT 算法所适用的范围从幕次序列长度推广到了素数序列长度的场合.W i n o g r ad 于 19 7 8 年在总结了R a d e r 算法后 ,系统地提出了算法的结构理论。1 9 8 4年 D uhm e l 发表了义基基 ZF FT 算法,即 SPFF T使 D F T 和 FFT 的算法进入了比
8、较完善的地步。我国学者在 PFA 方法方面详细地讨论了它与 F FT 的关系,从映射的角度统一了素因子分解算法 (PFA )、时域分解的 C o o l e y一T uke y FFT 算法和频域分解的 C o ol e y一 T uk e y FFT算法.对 PFA 算法与基 ZF FT 算法的差别有了深刻的认识,并且指出基 ZFF T 的计算误差可以用点数近似的素因子分解算法的误差来计算 。在义基基 S PF FT 的研究中指出,时域分解s P FFT 与频域分解的 SPFFT 信号流图之间,并没有经典 FF T 算法那种互相置换的拓扑关系.在算法速度上,除了 N 3 2、N 一 6 4
9、及 N 一 1 2 8 时 ,义基算法明显快于经典算法外,点数较大时两者速度几乎接近。W FT A 一般仅适合于小点数的变换,对于 N ) 1 6 以后,其编程工作的复杂性按指数规律增加,所以对大点数的 D F T仍是一个待研究的问题。利用两个模块构成第4 期 袁保宗:信号处理技术的若干进展 (国内)3PFF T 算法已经给出了 N 一1 3、1 7、1 9、2 3 及 2 9、3 1 点 D F T 算法。根据这一方法实现了长度为1 0 0 9 点的 D F T 快速算法 。我国学者在实现 FFT 方面还提出了素数长度的递归 D FT 算法 ,并且在此基础上又提出了具有 N 次乘法的快速付立
10、叶变换算法。1 9 7 8 年至 1 9 8 1 年 ,H。J。N u s s b a n m e r 在利用多项式变换计算D FT 和卷积后 ,我国学者也做了很多工作,先后实现了二维数字卷积的 FP T (快速多项式变换)和超大型二维循环卷积的 F PT 和 F N T (Fe r m a t 数论变换),这种超大型二维卷积是利用 M = ZJ十1,d 一 2 b 的 F N T 计算规模大于二维循环卷积的方法 ,研究表明将 F N T 和 FPT 结合可以计算任何 N M 二维循环卷积(N 三2 t,M 一 2 十一 )。多变量多项式变换的研究也得到了发展 ,一种计算卷积的新算法已被提出,
11、它 比传统办法压缩更多的乘法和加法次数 ,它被用来计算三维 (1 61 61 6 ) 的卷积时间为 1 7。3 25 ,或三维 (1 2 812 88 )的卷积时间为 7 3.3 2 5 ,或三维 (12 8.12 88 )的卷积时间为 7 3.1 8 5(在 V A X 8 3 0 o 机上)。个人收集整理,勿做商业用途个人收集整理,勿做商业用途离散 W 变换是我国学者的贡献 ,现在得到国际学术界的引用.但是二维离散 W 变换不能直接分解为两个一维 D W T 的乘积 。我国学者又提 出了用一维 D W T 表示及计算 D W T 的新形式,并构造了用一维快速 D W T 来计算二维 D W
12、 T 及实现二维卷积., 谱估计理论 随机信号的谱估计是信号处理的主要内容之一 ,它在振动、医学、航天 、航空以及雷达等领域有重要用途 。尽管以付立叶变换为基础的周期图法是长期以来最流行的功率谱估计算法,但是它致命的弱点是频谱分辨率的限制。为了克服这个缺点,1 9 6 7 年 Bu r g提出了最大嫡谱估计 ,E。Pa r a e n 1 9 8 6 年提 出 A R 谱估计 ,从此 ,高分辨率谱估计方法成了研究的热点,相继出现一系列非线性谱估计方法 ,如最小交叉嫡谱分析法 ,A R MA 模型参数估计法 ,P i s o r e n k.谱分解法 ,最大似然法 ,P r o n y 复极点模
13、型法等。我国学者编写的随机数字信号处理 一书 ,详细地总结了各类谱估计方法,有关的算法程序亦由我国学者完成的 近代数字信号处理通用程序 一书中以源程序方式刊出。这些方法在国内已有了广泛的研究及应用 .最大嫡方法 ME M Z 和倒谱分析方法,初看起来是互不相关的两个领域 ,但是它们的联系被我国学者发现 :最大嫡 M E M I 公式中的拉格朗 日不定乘子与自相关序列的复倒谱及时间序列的实倒谱互为复共扼 ,从而使倒谱分析方法可用于 M E M Z开辟 了新的途径 。利用二阶矩理论所能解决的谱估计或建模问题 ,一般仅能涉及最小相位,因果型,高斯过程激励以及线性问题 .而事实上 ,许多地震信号 、天
14、文时间序列,数字通信中的信道等效信号等问题 ,常常涉及到非最小相位 ,非因果,非高斯过程以及非线性系统等严重问题.这时高阶统计量以及高阶谱起到重要作用。早在 6 0 年代,H。A kaike ,K。H a s sl m a n ,M DG o d f r e y 等人已提出高阶谱的数字基础.但由于计算量大及结构复杂等原因未能应用。直到 8 0 年代初期才又被人们所重视 ,C。L.N ik a i s ,J.M .Me nd el,M .R o s e nbl a t等人做了大量的工作,才使其成为最近以来谱估计方面兴起的又一个新热点。我国是在 1 9 8 6 年第三届信号处理会议时开始注意多谱估
15、计问题 。1 9 8 9 年在电子学报 上较系统地介绍了多谱估计的参数方法 ,之后相继的研究工作给出了一种两步法的扩展 ,根据最小嫡原理 ,提出了一基于 2 阶和 4 阶积累序列匹配的辨识非最小相位系统的有效方法。对于非线性系统 ,我国学者首次推导出非线性 V o l te r r a 核函数和高阶统计量之间的关系。这种关系从形式上与线性模型一样,但意义完全不同,且线性模型是它的一种特例。对于一类非线性模型即 H am m e r s t e i n模型 ,已提 出了多种该模型估计线性子系统参数的算法 。这些算法 ,无迭代过程。文档为个人收集整理,来源于网络文档为个人收集整理,来源于网络空间谱
16、估计 将现代谱估计方法用于空间 目标的参数估计 ,常称为空间谱估计。空间谱估计所估计的参数为信号的空间频率。空间谱估计具有高精度和超高分辨率的性能 ,在无线电4电 信 科 学 1”3 年测向方面有广阔的应用前景。1 9 7 9 年 R。0。S c h m i d t提出了 M U S I c (M ul t i p l e si g n al Ch a r a e -t e r i z a t i on ) 方法,开拓了空间谱分析的序幕。它利用空间相关矩阵作特征分解 ,来确定信号子空间,然后利用信号子空间的正交特性确定信号的方向参数,从而可以实现信号源之间的分离.由于 MU S I C 方法仅
17、适用于非相干信号源,对于有相干源存在的情况,1 9 8 1 年 J.E。E v a n s等人提出空间平滑法,经过空间平滑后的阵列信号按照 MU s I C 方法就可以估计出相干源的方向参数,但这种方法是以损失阵列的有效孔径为代价。我国学者在 1 98 8 年提出大量实验证明:一种以 MU SI C 为基础的特征值分解一奇异值分解法 ( E V D 一S V D ),利用此法比空间平滑法有更好的分辨率和信号方向估计性能 ,更重要的是我国学者所提方法是在广义信号子空间概念上建立的,能更清楚地揭示提高分辨率的关键所在。除此之外 ,在任意几何排列阵列对相干信号源的测向,个人收集整理,勿做商业用途本文
18、为互联网收集,请勿用作商业用途在短数据、低信噪比时的测向以及阵元位置误差与阵元间互报对测向性能的影响等问题也进行了深入的研究,提出了有效的解决方法 。另一种具有很高运算效率的空间谱分析方法 ,于 1 9 8 5 年由T。K a i l a t h 等人提出。该法称为E S p R IT (E s tim a tio n of 5 1 9 : iar a m e te r s v i aR o ta t i o nI nv a r ia n tT e eh n 叫u e )方法。它同样也不适用于相干信号源 ,亦不能用于二维参数估计。我国学者近来对 E S PR IT 方法作了发展,把它推广到相干
19、源的估计和二维的参数估计,提出了 ZD c A 一Es P R I T (2一m e no i o na lC om b i ne d A r r a y 一E SP R IT ) 方法,这种方法所费的时间仅为一维 E s P R I T 方法的两倍 ,同样具有高时效的优点,同时分辨率比二维M U s I C 方法更高。此外在宽带信号的测向、相关信源的自适应特征子空间算法等方面也做了很多工作. 自适应滩波算法 信号处理的另一个活跃领域是自适应滤波。因为信号采集过程中都伴随着噪声 ,因而滤波是必需的。维纳撼波和卡尔曼滤波都要求对信号及噪声的统计知识有一定的先验了解。而 自适应滤波却不需这些知识,
20、自适应滤波在 1 9 6 7 年由B.W id r o w 提出后,一直发展很快。B。W idr o w 的 L MS 法是根据最优方法中的最速下降法提出的,它是通过橄向滤波器来实现的。之后在 1 9 8 0 年前后 ,J。1。Ma k h o u l 提出了模型 自适应撼波 ,M 。MQ r f 及 B 。F r e L a nd e r研究了递归型自适应数字撼波及最小二乘递归格式滤彼等。在国内对 自适应滤波算法进行了广泛的研究。在平方根递归最小二乘 自适应均衡方面,提出了一种分数间隔平方根 R L S 判决反馈算法 ,该算法 比普通 R LS 算法(如加速卡尔曼,斜格算法)有较好的数值稳定
21、性 。对 J.M 。C i off i及 T.K a i l a t h 提出的非归一化 FT F (Fa s t T r a n s v e r s al Fil t e r)算法在有限精度数字实现时的数值不稳定性,提出了一种改进的措施,并给出了相应算法。我国学者在超稳定自适应递归滤波方面,提出了符号超毯定 自适应滤波 ,使算法的计算量大大减少。我国学者还证明了,当信息矢量的内积同原 A R M A 模型的 A R 部分所构成的线性时变系统严格无关时,不需要严格的 SPR 条件,算法就能一致收敛 数字滚波器 数字滤波器是信号处理技术的重要组成部分 常规的设计方法已经编入已出版的数字信号处理程
22、序库和 近代数字信号处理通用程序 等书,同时引进的一些程序库 ,都已广泛地应用于实际工作。近几年在数字滤波器研究中也有很多进展。在研究 l l R 滤波器的极限环振荡时,我国学者提出一种以有限状态机表示抑止极限环振荡的方法。在滤波器组设计方面,提出了利用全通滤波器组成多相网络 ,并实现了话带撼波器组 ,用于 FD M 一T D M 数字转换系统 。在滤波器组的实现方面曾提出了用多速率格形浪数字滤波组开关电容的实现方案。非线性滤波技术在国内也有明显的成果 ,各种类型的近代非线性滤波方法均有实验结果。一种新的二维 Le a p f r o g 滤波器的设计方法可以不受各种非线性的影响,这种滤波是由
23、L C 格形滤波器的二维双线性变换实现的,并且具有很低的灵敏度。同时二维数字滤波器的稳定性判定方面,提出了一种新的定理 ,使用非常方便。三维数字滤波器的稳定性判定是一个困难的问题 ,国内学者提出了第二类非本征奇异值的三维数字滤波器的稳定性充分必要条件。2 应用领域国内语声处理技术已有 3 0 多年的历史 积累了丰富的研 究经验 七五 和“八五”期间是一个由理论研究走向实用的决定性的时刻。( a ) 语声处理 ,首先在语音编码领域 ,在此期间国际 CC I T T 等组织相应对各种码率的编码技术均制订了标准 。编码分为 6 4 k b /s 、3 2 kb /s 、1 6k b /s 、skb
24、/s 、4。sk b /s 、2。4 k b /s六种 ,以满足不同的应用领域。由于高速信号处理器的发展,不同编码速率的编解码器大都可以容纳在一块 D S P 芯片内执行实时的操作。因而编码不仅停 留在算法的研究上,而且可以实用于一些如移动数字无线电话中。 “七五期间,3 2 k b八 的 A DP c M 技术已经满足了CC I T T 的要求,而且研究完成了多路复用终端 ,可试用于交换网中,使话路数目增加一倍。1 6 k b /s的多脉冲激励线性预测编码 M PL PC 已经经过多次改进算法 ,并且装入在一片 T M S 3 2 0 C 2 5 的D S P 芯片,可以试用于数字无线电话系
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国内 统计 信号 处理 语音 识别 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。