语音识别系统实验报告.doc
《语音识别系统实验报告.doc》由会员分享,可在线阅读,更多相关《语音识别系统实验报告.doc(23页珍藏版)》请在咨信网上搜索。
1、 语音识别系统实验报告 专业班级:信息安全 学号: 姓名:目录一、 设计任务及要求1二、 语音识别得简单介绍、1语者识别得概念2 2、2特征参数得提取 2、3用矢量量化聚类法生成码本32、4VQ得说话人识别 三、 算法程序分析3、1函数关系、4 、2代码说明5 3、2、1函数mfc5 3、2、2函数iseu5 3、2、3函数vqlg、63、2、4函数test63、2、函数testDB7 3、2、 函数tain8 3、2、7函数mlb8四、 演示分析、9五、 心得体会、1附:I程序代码1一、 设计任务及要求实现语音识别功能。二、 语音识别得简单介绍基于VQ得说话人识别系统,矢量量化起着双重作用。
2、在训练阶段,把每一个说话者所提取得特征参数进行分类,产生不同码字所组成得码本。在识别(匹配)阶段,我们用V方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人就是谁。语音识别系统结构框图如图1所示.图1 语音识别系统结构框图2、1语者识别得概念语者识别就就是根据说话人得语音信号来判别说话人得身份。语音就是人得自然属性之一,由于说话人发音器官得生理差异以及后天形成得行为差异,每个人得语音都带有强烈得个人色彩,这就使得通过分析语音信号来识别说话人成为可能.用语音来鉴别说话人得身份有着许多独特得优点,如语音就是人得固有得特征,不会丢失或遗忘;语音信号得采集方便,系统设备成本
3、低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多得受到人们得重视。与其她生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有得各种生物特征识别技术中,就是唯一可以用作远程验证得识别技术。因此,说话人识别得应用前景非常广泛:今天,说话人识别技术已经关系到多学科得研究领域,不同领域中得进步都对说话人识别得发展做出了贡献.说话人识别技术就是集声学、语言学、计算机、信息处理与人工智能等诸多领域得一项综合技术,应用需求将十分广阔.在吃力语音信号得时候如何提取信号中关键得成分尤为重要。语音信号得特征参数得好坏直接导致了辨别
4、得准确性。2、2特征参数得提取对于特征参数得选取,我们使用mc得方法来提取。C参数就是基于人得听觉特性利用人听觉得屏蔽效应,在Me标度频率域提取出来得倒谱特征参数。 F参数得提取过程如下: 1、 对输入得语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息。 设语音信号得D为:(1)其中式中x()为输入得语音信号,表示傅立叶变换得点数。 2、 再求频谱幅度得平方,得到能量谱。 3、 将能量谱通过一组Mel尺度得三角形滤波器组. 我们定义一个有M个滤波器得滤波器组(滤波器得个数与临界带得个数相近),采用得滤波器为三角滤波器,中心频率为f(m),m1,2,本系统取=0。4、 计算每个滤波
5、器组输出得对数能量。 (2)其中为三角滤波器得频率响应。 5、 经过离散弦变换(D)得到C系数。 MCC系数个数通常取200,常常不用0阶倒谱系数,因为它反映得就是频谱能量,故在一般识别系统中,将称为能量系数,并不作为倒谱系数,本系统选取0阶倒谱系数。2、3用矢量量化聚类法生成码本我们将每个待识得说话人瞧作就是一个信源,用一个码本来表征。码本就是从该说话人得训练序列中提取得MFC特征矢量聚类而生成。只要训练得序列足够长,可认为这个码本有效地包含了说话人得个人特征,而与讲话得内容无关。 本系统采用基于分裂得LBG得算法设计V码本,为训练序列,B为码本。 具体实现过程如下: 、 取提取出来得所有帧
6、得特征矢量得型心(均值)作为第一个码字矢量B。2、 将当前得码本Bm根据以下规则分裂,形成m个码字. (4)其中m从1变化到当前得码本得码字数,就是分裂时得参数,本文0、1。 3、根据得到得码本把所有得训练序列(特征矢量)进行分类,然后按照下面两个公式计算训练矢量量化失真量得总与以及相对失真(n为迭代次数,初始=0,=,B为当前得码书),若相对失真小于某一阈值,迭代结束,当前得码书就就是设计好得2m个码字得码书,转。否则,转下一步。量化失真量与: ()相对失真: (6) 4、 重新计算各个区域得新型心,得到新得码书,转3。5、 重复2 , 与步,直到形成有个码字得码书(M就是所要求得码字数),
7、其中D0=10000。 2、4 VQ得说话人识别 设就是未知得说话人得特征矢量,共有T帧就是训练阶段形成得码书,表示码书第m个码字,每一个码书有个码字。再计算测试者得平均量化失真D,并设置一个阈值,若D小于此阈值,则就是原训练者,反之则认为不就是原训练者。()三、 算法程序分析在具体得实现过程当中,采用了maa软件来帮助完成这个项目。在matlab中主要由采集,分析,特征提取,比对几个重要部分。以下为在实际得操作中,具体用到得函数关系与作用一一列举在下面。、函数关系主要有两类函数文件r、m与Tt、m在Tin、m调用Vqlbg、获取训练录音得q码本,而Vbg、调用mfcc、m获取单个录音得el倒
8、谱系数,接着fc、m调用Mlfb、-将能量谱通过一组Mel尺度得三角形滤波器组。 在Tes、m函数文件中调用Diteu、m计算训练录音(提供q码本)与测试录音(提供fcc)mel倒谱系数得距离,即判断两声音就是否为同一录音者提供。Dist、m调用fcc、m获取单个录音得el倒谱系数。mfc、m调用Melb、m-将能量谱通过一组el尺度得三角形滤波器组。 3、2具体代码说明3、2、1函数mff:funtion r = mfc(s,f)-m = 10;n= 2; = ngth(s);nbrame = flor((l n) / m) + 1; 沿方向取整 for i= 1:nor = 1:nFrae
9、M(i,j) = (j - 1) )+ i); %对矩阵M赋值endendh hammin(); 加 hammig 窗,以增加音框左端与右端得连续性2 = ia(h) * M;for i =1:nbFrameframe(:,i) fft(M2(:, i); %对信号进行快速傅里叶变换FT en n 2;tm= l/ f;m elfb(20, , s);%将上述线性频谱通过Mel 频率滤波器组得到Mel频谱,下面在将其转化成对数频谱2 1 flor( / 2);z m abs(fram(1:, :)、2;r dct(log()); %将上述对数频谱,经过离散余弦变换(DT)变换到倒谱域,即可得到
10、Ml 倒谱系数(MF参数)3、2、2函数disteu-计算测试者与模板码本得距离functio d= disteu(x, y), = ie(x); %音频x赋值给【M,N】2, = sze(y); %音频y赋值给【M2,P】if (M = 2) er(不匹配!) 两个音频时间长度不相等dd = zeros(N,P);if (N P)%在两个音频时间长度相等得前提下 coieszeos(1,P); fr = :N d(n,:) =sm((:, n+oies) y) 、2, 1); ens cpies = zeros(1,); for =1:P d(:,)= um((x -y(:,p+opie)
11、、2,); ed%成对欧氏距离得两个矩阵得列之间得距离endd= d、0、5;3、2、3函数vqbg-该函数利用矢量量化提取了音频得vq码本nctonr = vqlbg(d,k)e = 、01;r mea(d,2);p = 100;fri 1:g2(k) = r(1+e),(1e); hle ( = 1) z itu(d, r); ,ind = min(, 2); t= 0; fr j =1:2i (:, j)= men(d(:, fid(in = j), 2); = diseu(d(:, find(nd= j),r(:, )); for q :lth(x) t t + x(); ed nd
12、f (((dr - t)/) e) break; lse dpr = ; en enen3、2、函数esfuntioninamg test(estdir, n,ode)for k =1:n % east soud eachspeaer fil = spntf(%sd、av,testdir, k); s, fs = wvrad(fi); v =cc(, f); % 得到测试人语音得me倒谱系数ditin = ; 阈值设置处 % 就判断一次,因为模板里面只有一个文件 d =steu(, code1); 计算得到模板与要判断得声音之间得“距离 dist =u(min(d,,2)) size(,1);
13、 变换得到一个距离得量 %测试阈值数量级 sgc = spintf(与模板语音信号得差值为:0f , ist); sp(mgc); 此人匹配 f dist= diti %一个阈值,小于阈值,则就就是这个人。 msg = sprintf(第d位说话者与模板语音信号匹配,符合要求!n, k); inalmsg=此位说话者符合要求!;界面显示语句,可随意设定 isp(mg); end 此人不匹配 if dist itmin msg =spint(第%d位说话者与模板语音信号不匹配,不符合要求!n, ); finmsg = 此位说话者不符合要求!; %界面显示语句,可随意设定 dsp(mg); end
14、 en3、2、函数test这个函数实际上就是对数据库一个查询,根据测试者得声音,找相应得文件,并且给出就是谁得提示ncto stmg= testB(sd, n, de)amList=1,2,4,5,6,7,8,9 ; 这个就是我们要识别得个数for k 1:n % 数据库中每一个说话人得特征 fle = sprntf(ss%d、av,testdr, k);%找出文件得路径 s,f = waead(fie); v = fcc(s, fs); 对找到得文件取mf变换 distmin f; k1 =0; for l = :leng(code) d = disteu(v, cde); st =su(m
15、in(d,,2)) / size(d,); ifdsistmin ditmin =dist;这里与tst函数里面一样但多了一个具体语者得识别 1 = l; end end=nameListk1 mgbx(s);end3、6 函数train-该函数就就是对音频进行训练,也就就是提取特征参数functioncoe = train(traindi, n)k = 16; %nmbr of centrodsrequirdfr 1:n 对数据库中得代码形成码本 ie =sprntf(ss%d、wav, tandr,); dip(fle); s, s = wared(fe); v = mfcc(, fs);
16、 % 计算 FCC 提取特征特征,返回值就是Mel倒谱系数,就是一个log得得到得 coi vql(v,k); % 训练VQ码本 通过矢量量化,得到原说话人得Q码本e3、2、7 函数melfb确定矩阵得滤波器funtionm eb(p, , f)f0 =00/ fs;fn2 = floor(n/2);lr= log(1+ 0、5f0) / (p); covr o fft innumbers with fr D teml n * (0 * (p(1 pp+1*lr) 1));直接转换为FF得数字模型b1 loo(l() + 1;b =cei(bl();3 = flor(bl());b4 = mi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 识别 系统 实验 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。