JPEG图像的编解码实现.docx
《JPEG图像的编解码实现.docx》由会员分享,可在线阅读,更多相关《JPEG图像的编解码实现.docx(19页珍藏版)》请在咨信网上搜索。
1、毕业论文 论文题目(中文) JPEG图像的编解码实现 论文题目(外文) Encoding and decoding of JPEG image 摘 要JPEG是一种十分先进的图像压缩技术,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像。本文设计和实现一个JPEG图像编解码器来进行图像转换,利用离散余弦变换、熵编码、Huffman编码等图像压缩技术将BMP图像转换成JPEG图像,即进行图像的压缩。验证JPEG压缩编码算法的可行性。通过比对图像压缩前后实际效果,探讨压缩比,峰值信噪比等评价图像数据压缩程度及压缩质量的关键参数,对JPEG压缩编码算法的实用性和优
2、越性进行研究。关键词:JPEG;编码;解码;图像压缩AbstractJPEG is a very advanced image compression technology, it uses lossy compression to remove redundant image data, in obtaining a very high compression rate can show a very rich and vivid image. In this project, a JPEG image codec is designed and implemented to transfo
3、rm image, using discrete cosine transform, entropy coding, Huffman coding and other image compression techniques to convert BMP images into JPEG images. Verifies the feasibility of JPEG compression coding algorithm. Through the comparison of the actual effect of image compression, the key parameters
4、 of compression ratio, peak Snr, and the compression quality of image data are discussed, and the practicability and superiority of JPEG compression coding algorithm are researched.Key words: JPEG; encoding; decoding; image compression目 录摘 要IIAbstractIII目 录IV第一章 绪 论1第二章 JPEG图像编码压缩原理4第三章 实验过程与结论12致 谢
5、1515本科生毕业论文 JPEG图像的编解码实现第一章 绪 论1.1 研究背景和意义在如今这个信息化社会里,计算机网络飞速发展,信息交流成为了人们生活中必不可少的部分,近年来随着自媒体的兴起,大量的信息更是充斥着人们的日常生活,而图像作为日常信息交流中最常用的信息传递媒介之一,充满着各个信息平台和设备终端。随着生活节奏的加快,人们对信息交流的质量和速度也有着越来越高的要求,但是由于图像和视频本身的数据量非常大,给存储和传输带来了很多不便,尤其在网络中传递图形图像时对传输速度有着很高的要求,这就使得图像压缩和视频压缩成为网络技术中的基础性技术。所以图像压缩和视频压缩得到了非常广泛的应用。图像压缩
6、是一种减少描绘一幅图像所需数据量的技术和科学,它是数字图像处理领域中最有用和商业上最成功的技术之一。每天被压缩和解压缩的图像的数量是惊人的。为了理解图像压缩的需要,考虑使用72048024比特像素阵列来描绘2小时的标准清晰度(SD)电视电影所需的数据量。数字电影是由一帧一帧的全彩色静止图像排列起来而组成的,为了能让人眼感觉到流畅的视频画面,视频播放时必须以30帧每秒的速率连续地显示这些帧,因此必须以的速率读取SD数字电影数据。可以计算得2小时电影的数据量为假设用传统的12cm,容量为8.5GB双层光盘的话,这么多的数据需要27张才能存储完。这很明显是不现实的,所以为了能把这部2小时的电影存放在
7、单张光盘上,视频的每一帧应该以平均26.3的系数进行压缩。除此之外,为了减少存储空间和传输时间,网页图像和高分辨率数字摄像机图片也需要进行数据压缩。例如,利用宽带发送数据的速率为12Mbps(兆比特每秒)。以该速率传输一幅12812824比特全彩色小图像需要的时间为0.03秒。而经过压缩后再传输,这个时间可以减少210倍,甚至更多。同理,考虑大小为1GB的闪存卡中可存储的8兆像素数字摄像机所拍摄的未压缩全彩色照片数量约为41幅(每幅约24MB),而经过压缩后,该数量也以210倍的数量增加。除了这些应用外,图像压缩在视频会议、遥感、文本和医学图像处理、传真传输等诸多领域也扮演者重要的角色。1.2
8、 发展历史与现状JPEG的全称为Joint Photographic Experts Group(联合照片专家小组),它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会。它是CCITT于1992年正式通过的用来处理连续色调静止图象的压缩标准。JPEG既可以进行有损压缩,也可以进行无损压缩,最常见也最常用的就是有损压缩的方法,其压缩过程可分为颜色模式转换及采样、DCT变换、量化、编码等几部分。联合照片专家小组制定出了第一套国标静态图像压缩标准:ISO 10918-1,也就是我们俗称的JPEG。因为JPEG压缩编码拥有数据量小且兼容性好的优良品质,所以它在短短的几年内就获得了巨大的
9、成功,目前网络媒体上大约百分之八十的图形图像都采用的是JPEG压缩标准。也正是由于JPEG格式可以对扫描或自然图像进行大幅度的压缩,使它成为迅速显示图像并保存较好分辨率的理想格式,这样利于存储和传输,所以在Internet上得到了广泛的应用。随后,在诸多媒体应用领域的大量激增下,原始JPEG压缩技术已经不能满足人们对多媒体图形图像资料的要求。在此条件下,催生了更高压缩率以及更多新功能的新一代静态图像压缩技术JPEG 2000。JPEG 2000同样是由JPEG组织负责制定的,命名为“ISO 15444”。该小组自1997年三月开始筹划,经过三年的艰苦努力,终于在2000年3月东京的一个会议上,
10、提前出台了规定基本编码系统的最终协议草案。这比人们预计2000年12月才能制定完成要早,没有出现人们担心的改名为JPEG2001的情况。近年来,有关图像编码技术对的研究也成果百出,图像编码技术已经发展到一种很成熟的状态,人们开始突破了传统的信源编码理论,开发出了小波变换编码、分形理论、人工神经网络理论以及视觉仿真理论,这些编码技术的特点是:充分考虑了人的视觉特性,使用了人工神经元网络的压缩编码技术。这些现代编码技术的出现与发展推动着图像编码技术走向繁荣。1.3 课题研究目标和内容 本课题对图像压缩编码的相关基础理论与技术进行学习研究,对BMP和JPEG两种图像文件格式也做针对性的理解和认识,在
11、此基础上进行JPEG图像压缩编码算法的研究,结合实际情况,探索高效的JPEG图像编解码方法,从而在一定意义上实现图形的压缩编码和解码处理,程序采用C+环境,对图像压缩算法进行实现,并能做出一个可视化界面来处理图片,从而能更好地实现两种格式之间的转换,最后通过计算压缩比和峰值信噪比进行算法性能的分析比较。本课题的研究内容包括:图形图像压缩编码原理技术,BMP、JPEG的图像格式,JPEG图像的压缩编码算法,C+编程环境实现图像处理,matlab工具计算峰值信噪比。实现BMP和JPEG图像文件的相互转换,同时研究图像压缩处理算法,对图像处理的未来进行探讨与展望。第二章 JPEG图像编码压缩原理2.
12、1 图像编码方法JPEG专家组研究和开发了两种基本的压缩算法、两种熵编码方法、四种编码模式来实现JPEG图像的编解码。如下所示:压缩算法:(1)有损的离散余弦变换DCT(2)无损的预测压缩技术;熵编码方法:(1)Huffman编码;(2)算术编码;编码模式:(1)基于DCT的顺序模式:通过一次扫描完成编解码;(2)基于DCT的渐进模式:编码、解码需要经过多次扫描才能完成,扫描程度从粗略到精细,逐级递增;(3)无损模式:基于DPCM,这种方法保证解码后图像能完全并精确地恢复到原图采样值;(4)层次模式:图像编码在多个空间分辨率中进行,并可以选择放弃高分辨率信息,只对低分辨率数据做解码;由于在实际
13、应用中JPEG图像的编码算法大多使用的是离散余弦变换、Huffman编码、顺序编码的模式,因此这样的方式也被人们称为JPEG图像压缩的基本系统。2.2 JPEG压缩步骤JPEG压缩是有信息损失的,它的基本原理是针对人的视角系统的某种特性,采用量化以及无损压缩编码相结合的方式,消除视角的冗余信息,并去掉数据本身的冗余信息。如下所列的是JPEG压缩编码算法的主要计算步骤:(1)色彩模式转换及采样(2)离散余弦变换(3)量化(4)Z字形编排(5)直流系数编码(6)交流系数编码(7)熵编码具体过程如图3-1所示图 2-1 JPEG的压缩过程2.3 JPEG压缩编码原理2.3.1 色彩模式转换及采样YC
14、rCb颜色空间中,Y代表亮度,Cr,Cb则代表色度和饱和度,有时也将Cb,Cr两者统称为色度,三者通常以Y,U,V来表示,即用U代表Cb,用V代表Cr。YUV表示法的好处是它利用了人的眼睛的某种特性,来降低图像中彩色所占用的存储空间。相较于对亮度细节的分辨能力,人的眼睛对彩色细节的分辨能力要低很多。如果把人眼能分辨出的黑白条纹换做具有不同色彩的彩色条纹,那么眼睛就不容易能分辨出条纹来。基于此原理,便能够将彩色分量的分辨率减小,这不会对图像的质量有明显影响,因而便能够将相邻几个像素的不一样的彩色值看成是一样的彩色值来处理,这样能减少所需的存储空间。考虑假如要存储RGB为888尺寸为640480像
15、素的彩色图像,即R、G、B分量是用八位二进制数来描述的,那么可以算得需要的存储空间为921,600字节。要是换用YUV来描述这张彩色图像,那么,Y分量将是640480,除此之外Y分量依旧是用八位二进制数来描述,而对每四个相邻像素(22)的U、V值,分别用相同的某个数值来描述,这时,存储这张图像所需要的存储容量便减少到460,800字节,可以看出减少了50%。RGB和YCrCb之间的转换关系如下所示:YCrCb与RGB彩色空间变换模拟区域的彩色空间变换,与数字区域中的彩色空间变换不同。它们的分量用Cb、Cr、Y来表示,与RGB空间的转换方法如下:Y = 0.299000R + 0.587000G
16、 + 0.114000BCb = - 0.168736R - 0.3313G + 0.500002BCr = 0.500000R - 0.418688G - 0.081312BJPEG的图片使用的是YCrCb色彩模型,它们大致为红色度,蓝色度,亮度,这与计算机中最常用的RGB是不一样的。实际的应用表明,YCrCb模型能进行更好压缩图形。因为人眼对图片里的亮度Y的敏感度要比色度C的敏感度高许多。在这里需要强调的一点是,为了有利于此后的最小代码单元(Minimum Code Unit简称MCU)的获得,需要对产生的Cb、Cr、Y对高与宽进行扩充,让它是MCU的整数倍,使用的方法是将图像的最右边一列
17、,以及它最下边一行进行复制,扩展它的宽与高,从而让全部的图像划分为MCU个数的整数倍。而在解码输出时抛弃这些被复制的行列。2.3.3 离散余弦变换DCT(Discrete Cosine Transform,离散余弦变换),是码率压缩中常用的一种编码方法。任何连续实对称函数的傅里叶变换中只包含余弦项,因此,余弦变换同傅里叶变换一样具有明确的物理意义。离散余弦变换是先将一幅图像划分成多个NN的像素块,然后针对每一个NN的像素块逐个进行DCT操作。JPEG的编码过程需要进行正向离散余弦变换,而解码过程是通过反向离散余弦变换实现的。正向离散余弦变换公式: ,当;, 当 反向离散余弦变换公式: 式中的N
18、代表水平和垂直方向的像素数,在本设计中N取值为8。所以图像划分为88的二维像素块,这些像素快在DCT变换之后,便得到了相应88的变换系数矩阵。矩阵中的这些系数,都是有其具体的物理意义的,例如,u=0,v=0时的值是原来64个数据的平均值,也叫做直流分量,亦有人称之为DC系数或直流系数。随着u,v值的增加,相应的其他63个系数则代表了水平和垂直空间的频率分量的大小,它们大多数是一些接近于0的正负浮点数,我们称之为交流系数或AC系数。经过DCT变换后得到的88的变换系数矩阵中,低频分量都集中在矩阵的左上角,高频成分则集中在右下角。因为大多数图像的高频分量都比较小,因而也导致图像高频分量的DCT系数
19、接近于0,再加上高频分量表现在图像上只影响着图像细节的细微变化,而人眼的构造对这种高频成分的变动表现的不太敏感,因此,在图像压缩的时候可以考虑将这些高频成分舍弃,以此来减少传输的数据量。如此一来,传送DCT变换系数所需的编码长度便远远小于传送图像像素所需的编码长度。当数据传送到接收端后,再通过反离散余弦变换便可还原到原来的数据,虽然这种方法会引起部分失真,但这些都是在人眼可接受的范围之内的。2.3.4 Z字形编排(Zigzag)图2-2 Z字形编排经过DCT变换,我们将一个88的数组转换成了另外一个88的数组,但是在内存中所有的数据都是以线性的形式存放的, 如果我们像表格一样一行一行地存放这6
20、4个数字, 那么每行结尾的点和下一行开始的点就不能联系在一起,即没有什么关系了, 所以JPEG规定按如图2-2中的数字顺序依次保存和读取这64个DCT的系数值。这样,数列里相邻的点在图片上便也是相邻的了。可以发现,这种数据扫描、保存以及读取的方式是从88矩阵的左上角开始,按照英文字母Z的形状进行的,我们将其称为Zigzag扫描排序。如图2-2所示:2.3.5 量化图像数据转换为DCT频率系数之后,还要经过量化,才能执行编码过程。量化阶段需要两个88量化矩阵,一个是亮度量化表,另一个称为色度量化表,将频率系数除以量化矩阵的值后取整,以便于执行最后的编码。可以看出,经过量化阶段之后,所有的数据只保
21、留了他的整数近似值,这在一定程度上又损失了一些数据内容。在JPEG算法中,由于对亮度和色度有着不同的精度要求,所以对亮度和色度分别采用不同的量化表。前者细量化,后者粗量化。表2-1和表2-2给出了JPEG的亮度量化表和色度量化表,该量化表是从广泛的实验中得出的。表2-1 JPEG亮度量化表1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399表2-2 JPEG色度量化表17
22、182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999这两张表是根据心理视觉阀制作而成的, 经过大量实验,对8bit亮度和色度的图象的处理有着很不错的效果。在这一步除掉了一部分高频量, 抛弃了许多细节信息,因此量化表成为了控制JPEG图像压缩率的关键部分。从上面两个量化表也可以看出,高频部分采用了相对较长的量化步长,而低频部分则采用了相对较短的量化步长,这样做的目的也是在一定程度上得到更清晰的图像和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- JPEG 图像 解码 实现
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。