![点击分享此内容可以赚币 分享](/master/images/share_but.png)
毕业设计-基于matlab的语谱图的显示与分析及dct域数字.doc
《毕业设计-基于matlab的语谱图的显示与分析及dct域数字.doc》由会员分享,可在线阅读,更多相关《毕业设计-基于matlab的语谱图的显示与分析及dct域数字.doc(19页珍藏版)》请在咨信网上搜索。
1、摘 要语谱图一般根据语音信号的时域特性,通过分帧加窗、短时傅里叶变换计算得到其灰度图,也可以进行伪彩色显示观察。首先,为了得到更高的分辨率和更好的视觉效果来进行语音信号的处理与分析,本文利用MATLAB的编程算法和函数库,对运算得到的语谱图使用伪彩色映射算法来观察能量分布,并对声音作进一步的研究;其次,研究了一种基于DCT域数字水印技术的实现算法;最后,试想利用语谱图将运用于图像水印的算法,是否也能运用到音频当中,如果实现了那么将在音频数字水印领域有很大的应用。文章给出了一种基于MATLAB的语谱图显示原理及实现方法。该算法实现了宽带语谱图的灰度图和彩色图。文中也介绍了语谱图显示的前期准备工作
2、,如语音信号的去噪、预处理和分帧加窗等,实验结果说明了宽带语谱图能够获得较高的时间分辨率,从而反映出频谱快速的时变过程。然后介绍了一种基于DCT域图像水印算法原理及实现方法。文中通过对现有数字图像水印算法的研究,设计并实现了DCT变换域中嵌入水印的算法。该算法能够根据人眼的视觉对图像数据中频区域不敏感的特性,通过一定的规则对宿主图像分块后依次对每块进行DCT变换,从而实现了水印的嵌入。实验结果表明该算法可以很好的兼顾数字图像水印的鲁棒性和不可见性。关键词: MATLAB,语谱图,伪彩色映射,DCT,数字水印I第一章 绪论1.1研究的背景及意义随着时代的变迁和社会的发展,在这个物欲横流的社会背景
3、下,互联网中传播信息的媒介越来越多,如音视频、图像、数字图书等种类日益繁多。21世纪初,一大批的以网络视频、电子图书、商务办公等新的服务和在线运营为科研。商业等创造了无线的发展空间,新媒体的崛起给互联网带来了巨大的商机。但是在利益的驱使下,通过不正当手段获取和传播未经授权的数字产品的盗版者也异军突起了。因此,为了维护版权所有者属于他们的正当利益,防止盗版等侵权事件屡屡发生,建立良好的知识产权保护制度迫在眉睫。与数字图像、网络视频等传播媒介的对嵌入水印的要求一样,数字音频水印技术同样也是必须在保证了不损坏或破坏原有的音频数据的情况下,通过对音频数据特性的研究,采用利用一定的算法嵌入水印后,依然可
4、以使得原始音频数据具有一定鲁棒性、不可感知性及可证明性等。与传统的数字图像水印技术和趋于日渐成熟的视频水印技术相比,数字音频水印技术将会是一个长期需要坚持不懈去努力的方向。一是因为人类听觉系统(HAS human auditory system)比较灵敏,对周围的声音长期处于接收状态中,所以听觉感官对存在改变的音频数据有一定察觉,导致可以嵌入到音频数据中的水印信息少之又少;二是互联网上存在许多音频编辑工具,可以对原始音频的数据进行不可控的修改,将导致着音频数据的丢失,从而对嵌入了水印的原始音频数据的起不到版权保护的作用。语音信号处理的工作的相关研究,可以追溯到20世纪50年代末,贝尔实验室通过
5、研究发明出了一台将语音信号转换成图像显示的语谱图仪,从此为语音信号的研究与分析提供了极大的帮助。首先语谱图的产生为数字音频水印技术的发展奠定了夯实的基础。其次,利用语音信号所产生的语谱图,根据语谱图的灰度及伪彩色显示,通过分析出的关于语谱图相关的特性,将运用于数字图像水印的算法也运用到音频数据当中。最后,利用前人所研究出的关于图像水印和信息隐藏的成果,结合音频数据产生的语谱图,将应用于数字图像水印的算法应用到语谱图上,相信只要坚持研究下去积极面对遇到的问题以及找寻解决方案,那么音频数字水印领域将会有很大的发展前景。1.2国内外研究现状分析关于语音研究分析表明,很早都多是从语音频域和时域开始的,
6、综合其特点。语谱图-语音频谱图,一般是通过处理接收具有足够长度的的时域信号就可以得到频域图,即针对语音数据的频谱分析图。可以理解为把语音复杂的表示过程用三维图谱的分析出来,横轴代表时间,纵轴代表频率,坐标点值代表语音数据能量,强度可以由平面的灰度表示强弱。通过分析语音的特征发现语谱图可以为研究提供重要的工具。早期可以通过语普仪制作语谱图,而现在随着科技的发展,业内人士可以通过计算机和数字信号处理等技术来显示语谱图,语谱图能够将语音的许多特性淋淋尽致地呈现在人们眼前,通过研究语谱图可以得出以下结论:语谱图在语音识别、语音合成及编码等方面的研究都具有重大意义。在1970-1979年中科院声学所大张
7、旗鼓的对进行计算机语音方面等技术领域进行了深入的研究,通过这几年对语谱图的深入研究得出来的经验。进一步推动了语普图在我国的发展。随着科技的发展,水印技术在我国很多领域也受到了足够的重视,已经有很多专业人士投身于数字水印的技术研究,并且已经成立了很多具有相当实力的科研机构投入到这一领域。自20世纪末12月召开了我国信息隐藏学术研讨会之后,随之又有各种相关数字水印的学术会议不断召开,接着国家实施了各项计划,并且国家相关单位也对数字水印技术提供了多项帮助,例如:项目资助。在国家的大力支持和帮助下,数字水印技术领域的学术研究水平几乎可以与世界数字水印水平发达工具相提并论,相信在不久的将来肯定会投入实际
8、应用中。总的说来,因为数字水印的研究基础是:计算机科学、密码学、通信理论、算法设计和信号处理等。每个数字水印方案必将利用以上的多项技术来完成。随着科技的发展,技术也会日新月异,在利用的过程中也会或多或少的存在着一些缺点。尽管人们都在大力探索发展和研究完善数字水印的深层次技术,但从对数字水印发展技术现状而言,数字水印技术还是存在着一些不足,没有完全成熟,并不能完全驾驭。所以说,数字水印只能说是一门新兴的技术领域学科。综上所述:数字水印技术还不是特别的成熟,只是处在一个技术评估的时段。在这个时段,数字水印技术的深层技术并没有完全被人们广泛理解和应用,同样数字水印的高深技术问题还有很多没有得到解决。
9、 音频数字水印是数字水印的一个分支,是以音频数据为载体的防伪及版权保护技术。数字水印是根据互联网中传播的数字媒体作品具有不确定性和存在一定的冗余数据的特征,将日期、图像标志等带有标志性的信息嵌入到原创作者的作品中,从而达到维护版权所有者的作品所有权和支配权的目的。这一操作不能影响宿主数据原先所具有的应用价值,也不能改变原来数据量的大小。嵌入的水印信息可以通过技术软件提取或检测出来,如果水印信息嵌入到音频数据上,则可以通过特殊的设备或软件来检测、提取水印信息。该技术在军事通信,国家信息安全、数字化网络等领域都具有研究发展的空间。1.3本文研究内容和章节安排论文主要研究了语谱图显示的实现方法和基于
10、DCT域数字图像水印算法实现,论文首先通过MATLAB编程实现了音频数据生成宽带语谱图并对器灰度和彩色显示作了对比分析。然后对于原始图像通过DCT变换嵌入水印图像,与原始图像做分析比较,最后实时提取水印并对其质量进行评价。实验结果表明语谱图是语音信号处理中重要的一种工具,用于处理语音信号在图像等领域的应用具有十分重大的意义;证实DCT算法较好达到了数字图像水印的鲁棒性和不可见性之间的平衡。论文各章节具体安排如下:第一章语音信号处理及数字水印算法的研究背景和意义的阐述,以及对语谱图和数字水印国内外现状的分析。第二章首先阐述语音信号的基本特征,然后介绍语音信号的产生、预处理,以及使用分帧加窗函数的
11、作用。最后介绍了数字水印的特点,典型算法以及对数字水印算法的性能评价的基准。第三章主要介绍语谱图的实现过程以及各个过程的具体实施步骤主要包括六个部分:语音录制,数据读入程序,信号分帧加窗,能量密度谱计算,功率谱伪彩色显示,语谱图显示及对结果分析。第四章主要介绍DCT数字水印算法的设计与实现过程,首先根据人眼对图像的敏感程度确定水印嵌入位置对宿主图像嵌入水印;然后通过与原始图像对比来检测水印是否存在,进而生成含有水印信息的二值图像并对其质量进行评价。第五章总结主要概括了本课题进行实验结果的说明,其中存在许多需要解决及有待改进的地方,通过对现有水印算法的设计与实现,根据前人所研究成果进一步对下一步
12、的工作进行了阐述。11第二章 语言信号和图像数字水印技术2.1概述语音的发音过程中,声道通常都是处于运动状态的,因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多,因此一般可以假定它是短时平稳的,每一时刻我们都可以用这时刻附近的一短段(例如15ms)语音信号分析得到一种频谱。基于MATLAB的语谱图显示与分析 李富强2.2 语言信号的预处理2.2.1 预处理利用手机等通讯设备录制一段声音,经过音频剪辑软件的去噪后,接下来就可以针对语音信号做一些预处理。本课题中预处理的步骤有以下两个部分:(1) 预加重。可以很方便快捷的压缩信号大致波动的范围,排除一些外力因素的额干扰,一般
13、可以通过一阶数字滤波器来实现将语音信号信噪比提高。这个数字滤波器有6dB/倍频程的提升特性,它的表达式为式(2.1): (2.1)式(2.1)中,值向1 趋向,其取值范围是0.940.97。由于人耳对语音高频部分较为敏感,预加重还可以将语音高频部分进行加重,提高了实验数据的准确性。(2) 加窗处理。具体的加窗处理条件和分析将在下一小节详细说明。开始对信号进行预处理。信号的预处理过程有预加重、加窗处理等。预加重目的是有三点:一是提升高频段,对语音高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率;二是使得该语音信号在整个频段中保持频谱平坦,方便进行频谱分析。还有就是预加重可以压缩信号的动
14、态范围,提高其信噪比。在计算机中一般通过2.2.2 窗函数的选择在对语音信号进行预加重、去噪等处理之后,接着开始借助MATLAB的窗函数对语音信号进行分帧加窗操作。假设实验中30ms50ms内语音信号平稳。为了能够快速的得到数据量小方便处理的语音信号帧,就要使用窗函数对该语音信号进行加窗处理。窗函数缓缓地滑动,就将去噪操作之后的该段语音信号依次处理成短时语音帧信号。常用的窗函数都是矩形窗和汉明窗。矩形窗表达式: (2.2)汉明窗表达式: (2.3)首先我们需要合理的选择合适的窗函数,通过对这个窗函数所具有的一些短时参数特性的研究和讨论,剖析出实验所需要语音信号相对应的基本性质。在选择汉明窗时所
15、对比的矩形窗和汉明窗的参数数据如表2.1所示。表2.1 矩形窗与汉明窗的比较窗类型旁瓣峰值主瓣宽度最小阻带衰减矩形窗-134/N-21汉明窗-418/N-53由于汉明窗的第一个零值频率位置比矩形窗要大一倍左右,且汉明窗的带宽大约是同样宽度矩形窗带宽的两倍。矩形窗的主瓣宽度小于汉明窗,具有较高的频谱分辨率,但是矩形窗的旁瓣峰值较大,因此其频谱容易泄露,丢失高频成分,汉明窗比矩形窗显得更平滑些,它的旁瓣急剧的发生变化。可以更好地反映信号时频特性。基于声纹识别的身份确认系统的研究 白燕燕 -西安工业大学硕士论文- 2012-05-02(是否引证:否)综上所述,根据短时语音信号是平稳的,我们就可以通过
16、MATLAB编程实现对原始录制的一段语音信号进行分帧加窗处理,这样一来这段语音信号就被分成一小段的短信号帧,便于我们后续实验进行频域变换操作,以达到提取语音信号其特征参数的目的。2.3 数字水印2.3.1数字水印的概念数字水印是将含有一定信息量的数据嵌入到指定需要被证明或保护的宿主数据中,但是不改变宿主数据的外在体现且可以被继续使用或传播。数字水印是根据互联网中传播的数字媒体作品具有不确定性和存在一定的冗余数据的特征,将日期、图像标志等带有标志性的信息嵌入到原创作者的作品中,从而达到维护版权所有者的作品所有权和支配权的目的。它具有:安全性、可证明性、不可感知性、鲁棒性的特点,主要运用于版权保护
17、、篡改提示、隐藏标识,拷贝保护、数据隐藏和保密通讯。2.3.2 数字水印的特点数字水印不仅仅要求一味的维护版权所有者起到知识产权的保护作用,还需要即使加入了版权保护的水印信息,该数字产品也能和未加水印时的一样是可用的,并且应该和宿主数据的一样承载相同的应用价值,即水印不会影响宿主数据的内在主要结构。然而,在不同的领域涉及的各种各样的水印算法,都会为了不同的要求去追求更好的实现效果而不断地进行实验。通常情况下认为数字水印具有以下四个基本特点:(1) 安全性:安全性就是说数字水印的算法是公开的,但是算法实现过程中会选取的适当用于加密的密钥。(2) 可证明性:从宿主数据产品中提取出的水印信息,是一串
18、有效的信息数据,可以通过该信息对数据产品的版权所有做出一定的判断。(3) 不可感知性:嵌入在宿主数据中的水印信息应该是不可见的,主观上是说不能通过人眼直接观察出水印相关信息,客观上来看的话是指无法通过概率学或是统计学的计算得出水印信息。(4) 鲁棒性:是指水印信息在宿主数据中无法被去除。也就是说任何破坏水印信息的动作都会导致原始数据无法实现和原来同样的应用价值,在对嵌入水印算法的分析时,只了解水印信息相关的部分参数也是几乎无法完整的擦除水印信息。2.3.3 数字水印系统的性能评价该评价标准是通过计算图像之间的一些失真量度来测试图片的质量高低,计算较为简单,可重复性较强。常用的评价失真度量方法,
19、如平均绝对差分、均方误差、峰值信噪比等。目前在图像中的编码压缩比较流行的就是峰值信噪比(PSNR)和互相关系数(NC),其计算方法如(2.4)和(2.5)式。 这里的MAX通常是图像的灰度级,一般就是255了。W表示原始水印,大小为,表示提取的水印,大小为。 (2.4) (2.5)第三章 语谱图显示与分析3.1语音的录制用自己的笔记本电脑上自带的录音机或者其他通讯设备(比如说Cool Edit Pro或者手机自带的录音软件)录取人说话的声音,本课题录制的语音为“我是周华”。录制完毕后格式需要做一定的处理,一般将其格式转化wav格式的文件。通过查阅相关书籍,根据语谱图的产生原理,本实验进行的前提
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 基于 matlab 语谱图 显示 分析 dct 数字
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。