以数字图像为载体的隐写分析研究进展本科论文.doc
《以数字图像为载体的隐写分析研究进展本科论文.doc》由会员分享,可在线阅读,更多相关《以数字图像为载体的隐写分析研究进展本科论文.doc(22页珍藏版)》请在咨信网上搜索。
1、以数字图像为载体的隐写分析研究进展 摘 要:隐写和反隐写的对抗是关系到信息安全的重要课题。本文针对常用隐写载体之一即数字图像,回顾反隐写技术的最新进展。根据隐写技术快速发展对反隐写研究提出的挑战,对近几年提出的新方法和新思路进行梳理和归纳,给出系统和扼要的评述,供隐写和反隐写研究者参考。重点围绕三方面展开讨论:对于克服了统计不对称性的LSB匹配嵌入法如何进行有效的检测或嵌入率估计;对于小嵌入率隐写进行分析的研究中有哪些进展;面对层出不穷的隐写新方法,如何实现不针对具体嵌入算法的通用隐写分析。对于反隐写研究的发展趋势和面临的新问题也作了讨论。关键词:隐写,隐写分析,LSB匹配,隐写嵌入率,通用隐
2、写分析1引言自上世纪90年代初以来,信息隐藏作为信息安全中的重要课题引起了国际学术界的重视。首先是对保护多媒体产品版权的数字水印研究急剧升温,公开发表的论文呈指数规律逐年上升,不少开发数字水印产品的公司应运而生。目前数字水印技术的发展势头有增无已。对信息隐藏另一重要领域即数字隐写(steganography)的研究也随之跟上,很早就出现了一些简单的隐写方法1。到世纪之交开始了对这一领域的广泛探索。隐写是以表面上正常的数字载体如图像、音频和视频等作为掩护,在其中嵌入秘密信息,隐藏的数据既不改变载体信号的视听觉效果,也不改变计算机文件的大小和格式,因而可实现不为人知的隐蔽通信。含密媒体通常与大量正
3、常媒体资料混在一起,通过各种渠道特别是互联网传播。不同于传统密码通信的是,“正在进行通信”这一事实本身也被隐藏起来了,因而可用于重要消息的安全传递。随着信息隐藏技术的快速发展,大量隐写方法涌现出来,人们可以方便地获取和使用多种隐写工具。然而对这些工具的滥用却严重威胁着网络信息安全,因此研究反隐写技术是有关领域研究者面临的紧迫任务。最重要的反隐写技术是隐写分析(stegananalysis),也就是根据载体的统计特性判断其中是否含有额外的隐蔽信息。隐写分析也可以包括“定量分析”(quantitative steganalysis)或“主动分析”(active steganalysis)2,即除了
4、检测秘密信息的存在性,还要估计嵌入的秘密信息量3、估计密钥4、识别所用的隐写工具、截获隐蔽信息等。隐蔽信息的截获被认为是隐写分析的终极目标,但目前关于这方面的研究进展报道非常罕见。以检测有无可疑嵌入信息、估计嵌入数据量为基本目标的隐写分析迄今为止仍是最重要的反隐写措施。实际上对隐写的有效分析要比隐写本身更困难,这是因为各类数字载体数量巨大,嵌入方法千变万化,从中搜寻隐蔽信息犹如大海捞针。隐写存在性检测的重要意义在于:一旦数字媒体中含有隐蔽信息的事实受到怀疑,隐写行为即告失败。成功的隐写分析是追踪信息源头、切断敌对隐蔽信道的前提。另外还可以根据检测结果实施主动攻击(active attack),
5、删除嵌入信息或使之不能被提取,达到阻止隐蔽通信的目的。隐写和反隐写的对抗是网络时代信息战的重要内容之一5,在这一相对年轻的研究领域中已涌现了大量的成果。历年来人们从不同的角度对前期研究情况进行过概括和综述6-11,提供了有价值的参考资料。由于相关研究的发展速度很快,有必要对近几来的最新研究情况进行归纳和梳理,着重讨论一些重要的发展方向,供研究者参考。我们根据隐写技术的新发展对反隐写研究提出的挑战,探讨隐写分析中针对若干难题的最新研究动态。可用于隐写的载体中,以数字图像的使用最为广泛。本文主要讨论以图像为载体的隐写分析问题,其中包括未经压缩和曾经过JPEG压缩而又保存为非压缩格式的情况。对JPE
6、G格式图像的隐写分析涉及较少,有关问题将另外单独考虑。第2节简要回顾早期隐写分析方法,第35节讨论近年来具有代表性的新进展,分别考虑对LSB匹配嵌入的分析技术、对小嵌入量的隐写分析、不针对具体嵌入方法的通用检测这三个主要问题。近年来在隐写技术的改进和实际应用方面还出现了一些新的动向和新的思路,向反隐写研究者提出了亟待解决的新课题,我们将在第6节对此进行扼要的阐述。第7节是本文小结。2早期隐写分析研究概况早期隐写方法(如简单LSB替换、EzStego、J-Steg、JP Hide & Seek、OutGuess、Jpeg-Jsteg、F5等)大多可保证优良的含密图像视觉质量,通过视觉无法察觉疑点
7、。但由于对统计特性考虑较少,这些方法很快就被证明在嵌入量足够大的情况下在统计上是不安全的。简单LSB替换方法虽然仅对载体图像进行微小的修改,但仍会在最低位面产生某些异常特性而容易被识别出来。这首先是因为图像最低位并不总是0和1的均匀随机分布,在某些区域呈现与内容有关的结构,LSB替换会破坏这种结构。不仅如此,简单地用隐蔽数据替换LSB还会引入统计上的不对称性,为分析者提供了可靠检测的线索。很早就出现了针对LSB嵌入法的有效检测方法。例如Westfeld等12不仅对某些隐写图像的最低位面方法进行了视觉检测,还提出直方图分析法,利用信息嵌入后每一对象素灰度、颜色指数、变换系数值分布趋于均匀的性质设
8、计c2检验,对有无隐写进行判断,并估计隐蔽数据长度。虽然通过改进设计嵌入方法能保持像素对的值不变从而挫败这种分析13,但很快就又被成功地检测出来14。Fridrich等人的RS分析法1516利用图像空间相关性导出灵敏的双重统计量。他们指出图像LSB可在一定程度上由其它位面预测,篡改LSB会削弱这种可预测性,从而导致有效的隐写分析。研究还表明,在JPEG图像中进行空域嵌入会改变量化引起的数据统计结构,因而容易被识破17。LSB隐写不仅可直接修改像素本身,也可在变换域实现,因此也适用于JPEG图像。常用的J-Steg是对JPEG图像中分块DCT的某些量化系数值进行LSB嵌入,因此也可用类似的分析方
9、法进行成功的检测。研究者又指出,在DCT量化系数上进行LSB隐写会增加块效应,通过构造参考图像可估计原始DCT系数直方图14。针对一种经过多次改进的JPEG图像隐写方法F518,在水平和垂直两个方向分别剪裁4个像素,用原来的量化表对重新得到的88分块进行量化,通过与待检测图像的比较,判断DCT量化系数的直方图是否收缩实现了成功的分析19。张涛和平西建于2003年提出基于差分图像直方图的检测方法20,他们将待测图像的LSB位面置0,将其差分直方图与待检测图像的差分直方图相比较,可由某一转换系数导出用于判断LSB是否被秘密信息替换过的物理量,而且这个量与嵌入数据量之间存在一定的关系,因而可以估计出
10、隐蔽信息的长度。一种对LSB嵌入法的改进是位面复杂度分割(BPCS),将载体多个位面分成大小相等的块,用复杂度高的位面小块承载秘密信息21。但含密图像的位面小块复杂度直方图存在两个明显的不连续点,据此可实现对BPCS 隐写的分析22,由复杂度直方图的不连续性可判断秘密信息存在性,并确定秘密信息块的复杂度范围,测算秘密信息嵌入量。该方法也适用于变换域位面复杂度分割隐写。调色板图像也是常用隐写载体,调整调色板中的颜色可降低隐写失真,但调色板异常会引起监控者的怀疑2324。另一种方法是不改变调色板,而将颜色进行奇偶分配用以代表秘密数据25,但通过最低位面混乱度和逆嵌入操作后的奇异颜色像素个数可察觉秘
11、密信息的存在26。另外还可用一种称为Pair Analysis的高阶统计量方法对典型的调色板图像隐写工具EzStego进行分析并估计信息嵌入量,可检测的最小信息量为每像素0.1比特,性能优于过去提出的c2法和RS法27。早期简单隐写方法所产生的统计不对称性、直方图异常、调色板异常等现象已能被多种方法检测出来,因此在某种意义上这些方法早已不再安全。但是随着反隐写研究的发展,改进的嵌入方法很快地出现,克服了早期技术的明显缺陷。例如用匹配嵌入的方法消除LSB替换所引入的统计不对称性就使统计分析更为困难。即使最简单的LSB替换,当嵌入量很小时,要可靠检测还是一个难题。解决这一难题仍有现实意义,因为LS
12、B替换极容易实现,有研究者指出只需一条Unix命令而不必求助于任何隐写工具就可以进行LSB嵌入28。另外,嵌入方法层出不穷使得针对具体嵌入技术设计分析方法的反隐写方捉襟见肘,难以应付。所有这些都促使隐写分析技术不断地深入发展。3针对LSB匹配隐写的分析LSB替换的主要安全漏洞在于仅存在2i和2i+1之间的转换,而不存在2i和2i-1之间的转换,这就导致了具有成对灰度值的像素数趋于相等的现象。避免这种统计异常性的最简单方法就是LSB匹配嵌入29:当嵌入的比特与像素值最低位相同时,像素值不变;不同时随机选择+1或-1。于是上述两种转换以相等的概率出现,统计不对称现象不再存在,而引起的图像失真却不变
13、。嵌入信息的提取和简单LSB替换时一样,只要取出最低位面就可以了。LSB匹配嵌入又常被称为1隐写。本节着重讨论对像素域LSB匹配嵌入的分析,包括图像是否曾经被JPEG压缩过两种情况。Westfeld提出了一种基于统计相邻颜色数的分析方法30,可检测经过JPEG压缩的彩色图像中的LSB匹配隐写。两个颜色r1, g1, b1和r2, g2, b2,若满足| r1 - r2| 1,| g1 - g2| 1,| b1 - b2| 1,则称为相邻颜色,每种颜色最多有26种相邻颜色。JPEG载体图像中相邻颜色较少,平均为45种,通常最多不超过9种。用LSB匹配法嵌入数据会产生大量相邻颜色,许多颜色甚至会达
14、到26种相邻色的极限值。计算相邻颜色的平均数,例如对于载体图像是2.20,在嵌入量为100%(每一彩色像素嵌入3比特)时上升到5.58。若以最大相邻颜色数为统计检验量28,则对于任何经JPEG压缩过的图像,即使嵌入率低到1%也能可靠检测。但是对于从未进行过JPEG压缩的图像,或者只要对JPEG图像进行重采样,这种检测就完全失效,因为此时载体图像本身就包含具有很多相邻颜色的像素。Harmson et al.31将图像直方图hC(n)的离散Fourier变换HC(k)称为直方图特征函数(histogram characteristic function, HCF)。他们认为含密图像可看作载体图像与
15、加性噪声之和,因此含密图像的直方图hS(n)是hC(n)和噪声概率分布函数fD(n)的卷积。无论是LSB替换还是LSB匹配嵌入,引入的噪声均具有下列概率分布:(1)其离散Fourier变换FD(k) = cos2(pk/N)在k = 0, 1, . , N/2内从1单调下降至0,因此含密图像的HCF总是小于载体图像的HCF:(2)下标C表示载体,S表示隐写。k是“直方图谱”的自变量,物理意义不直观。考虑k0, 1, . , N/2的总效果,定义HCF的质心(center of mass, COM)如下:(3)可利用下列不等式实现对含密图像的检测:(4)直方图特征函数(HCF)及其质心(COM)
16、的概念建立在加性噪声模型上,可成为检测LSB匹配隐写的基础。Ker在此基础上发展了一组有效的方法,以下着重讨论Ker的分析技术。Ker在32中指出,Harmsen的方法直接用于对灰度图像LSB匹配隐写的盲检测并不成功,这是因为不同载体图像之间的CH差异太大,通常超过载体和含密图像CH之间的差异(见图1),在没有原始载体图像的情况下检测器是无法知道CHC的。图1嵌入数据前(圆点)后(叉形)图像的CH值变化32为此,Ker通过计算22像素块的平均值将载体图像和含密图像分别缩小到原来的1/4。载体图像缩小后CHC总体上没有变化。对于用LSB匹配嵌入的含密图像,CH*S还是小于CH*C,只是变小的程度
17、有所下降(上标星号表示亚取样缩小图像)。由于CHC/CH*C对不同载体图像基本一致,因此用CH/CH*作隐写检测的统计量便实现了对COM的校正,消除了不同载体的影响。由于灰度图像仅有256种不同的灰度值(远少于彩色图像中的颜色种类),因此直方图十分稀疏,使得基于HCF的方法效果不佳。Ker引入的第二项改进是计算相邻像素的二维直方图:(5)相应地用二维DFT定义HCF和COM。经改进,对LSB匹配的检测性能(receive operating characteristic, ROC)如图2示32,其中左图由20,000幅曾经JPEG压缩的图像得到,右图由3,000幅从未压缩过的图像得到,嵌入率均
18、为100%。浅色实线为HCF COM方法,带圆点的浅色线为经校正的HCF COM法,深色实线为基于二维直方图的HCF COM方法,带圆点的深色线为经过校正并用二维直方图的HCF COM方法。可见在虚警概率小于10%的条件下,校正的二维直方图HCF COM性能最佳。由图2可知,对于曾经JPEG压缩过的图像,当LSB匹配嵌入量很大时已能可靠检测,对从未压缩过的图像也能进行检测,不过性能较差。由于是基于加性噪声模型的,该方法也可对其他隐写方法产生的含密图像进行检测,但对于小嵌入量无效。 图2 隐写分析性能:横轴为虚警概率,纵轴为检测概率32在应用HCF COM检测彩色图像中的LSB匹配隐写时遇到了计
19、算复杂度的困难30,因为涉及到的颜色数量为2563,DFT的计算时间复杂度为O(N 3 log N),将这种基本的HCF COM方法记为C13D。为了降低计算复杂度,Harmsen曾建议分别考虑RGB三色,计算3个一维HCF,由3个COM构成三维统计检验向量(记为C31D),时间复杂度下降为O(N log N);或者将3种颜色两两组合成RG、GB、BR,计算3个二维直方图的DFT,将3个二维COM组合成6维统计检验向量(记为C32D),时间复杂度为O(N2 log N)33。Ker对这几种不同的HCF COM实现方法进行了大量测试比较,发现C31D的性能很差,而C32D则接近于基本的C13D,
20、这几种方法均能有效检测嵌入量为30%100%的曾经JPEG压缩图像,也能检测JPEG后又重新采样的图像,对从未压缩过的图像则只能检测接近100%嵌入率的图像。可见这种方法优于Westfeld30的早期方法。在28中,Ker将对Harmsen方法的改进(COM的载体图像校正和二维直方图32)扩展到彩色图像。由于计算平均颜色时引入的舍入误差使得用于黑白图像的22像素组平均法对于彩色图像效果不佳,因此改为水平方向的图像“压扁”:(6)显然,在对压扁的图像C计算HCF COM时,涉及的灰度值范围会加倍,使DFT的计算量大增。Ker将三个颜色通道相加成为一维信号,因为他认为LSB匹配嵌入使各颜色分量独立
21、地加入了同样强度的噪声。实验表明,这种检测器能有效检测5%的嵌入率,对于JPEG压缩后又改变尺寸的图像,可检测50%的嵌入率,但是对从未压缩过的图像检测效果不佳。对于未经过JPEG压缩的图像检测难度明显高于经过JPEG的图像,是此类隐写分析技术的共性。综上所述,由于HCF可反映因隐写嵌入而导致的直方图变化,所以可用于检测。从最初的HCF COM,到通过亚取样实现对COM的校正,克服了无法设定阈值的困难,进而考虑二维直方图重新定义HCF COM,检测性能逐步得到提高。但是基于校正和二维直方图的HCF COM方法计算复杂度过高,为此将颜色分量进行适当的组合,使该方法可有效地用于对彩色图像的隐写分析
22、。对于LSB匹配嵌入的另一种分析方法是将LSB匹配嵌入看成两个集合序列之间的状态转移34。对于一幅可能含密的待分析图像,用自适应小波降噪法估计其原始载体,计算待检测图像和估计的载体图像平滑区域的状态转移参数,根据Kullback-Leibler距离可估计嵌入率。4小嵌入量隐写分析近年来对于LSB匹配嵌入法的检测已经取得了较大的进展,特别是对曾经过JPEG压缩的图像,即使嵌入量较低也能实现有效的检测。但是与此同时,隐写嵌入方法也在不断改进。研究者在LSB匹配隐写中引入了各种编码方法,使嵌入相同数据量对载体所作的修改量减小。例如通过不同的编码技术利用LSB匹配嵌入中的随机1嵌入额外信息,使每一像素
23、的秘密信息承载量从1比特提高到log23比特35-39;进一步利用次最低位而不增加嵌入引起的失真可进一步增加嵌入量40等。这些新方法的出现进一步提高了分析的难度,研究更为有效的检测方法是对隐写分析研究者提出的新课题。实际上,即使是简单的LSB替换嵌入,对于低嵌入率的隐写分析仍十分困难。第3节已提到的Westfeld方法具有检测极低嵌入率的能力,但仅限于对曾经JPEG压缩而且后来未经缩放等处理的彩色图像2830。近年对小嵌入率的隐写分析有了新的进展。在早期RS和c2分析等方法之后,陆续提出了一些基于像素对的隐写分析方法20274142,这些方法都利用了LSB嵌入法中像素组合的结构特性,其中最典型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 载体 分析研究 进展 本科 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。