1、 北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 基于 JPEG2000 的应用于多媒体认证的 半脆弱水印算法 A semi-fragile Watermark Scheme for Image Authentication Based on JPEG2000 北京大学电子学系 00 级 刘彬 Dept. of Electronics Peking University 00 Bin Liu 摘要: JPEG2000已经成为国际上应用越来越广泛的图像压缩标准, 基于 JPEG 2000的数字水印技术也随着这项技术的成熟发展的越来越多样化。
2、加之数字水 印技术越来越多的应用于多媒体认证之中。为了防止对多媒体图像的恶意篡改和认证, 本文将对基于这种新兴的图像压缩标准提出一种新颖的半脆弱水印的算法。该算法通过直接从原始图像中提取特征,经过编码作为数字水印嵌入到该图像中去,而不增加其他额外的信息。为了提高算法的安全性,本文还引入了个人私钥对水印信号进行加密。实验的结果显示,在图像没有受到任何改变的情况下,可以顺利的通过此认证系统;进一步,即使图像经过了一些常用的图像处理,如 JPEG压缩等后,仍然可以通过认证;而当图像受到恶意的攻击后,则检测不到水印信号,被恶意攻 击的部分可以被认证系统检测出来。 关键词: JPEG-DCT , JPE
3、G 2000, 半脆弱水印,多媒体认证, DCT,私钥 引言: 因特网技术由于其快速性和极低的价格使其成为一种优秀的多媒体传播途径。但是伴随着因特网的飞速发展,对多媒体的版权保护等问题日益凸现。一些防止非法使用多媒体的方法不断的被提了出来。传统的保护多媒体版权的方法是将数字水印(可以是作者的版权号码等)直接嵌入到被保护的多媒体作品中【 1】。而这样的数字水印技术又因目的不同而有两个分支:一种是鲁棒水印,它用来保护作者的版权,在发生版权纠纷的时 候用来提供法律依据;一种是脆弱水印(或半脆弱水印),它用来检测多媒体作品是否受到了恶意的篡改和损坏。对于鲁棒水印而言,其必须足够鲁棒,以至于在多媒体作品
4、受到攻击和篡改后,仍然能够正确的被提取出来,兹以证明作者的版权。而脆弱水印的主要目的在于证明多媒体作品的合法性。现在多媒体照片不能作为法庭的证据,就是因为多媒体照片可以很容易的被各种软件(如 Photoshop)修改而不被发现;而医学图像中的任意一点变化都可能使医生对病情做出错误的判断。因此在这些场合,对多媒体产品北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 的合法性认证比版权认证更加重要。 就脆弱水印技 术而言,早期的脆弱水印主要将精力集中检测多媒体产品是否被篡改过。但是它们不能准确的定位出被篡改的区域和程度。 Friedman 设计
5、了一种数码相机【 2】,该相机可以在生成每一幅图片的同时加入数字水印,它可以用来证明该图像没有被改动过,也可以通过水印查找特定的一幅图片。 Jaejin Lee 将纠错码( ECC)技术运用到数字水印的生成中去,提高了水印信号的抗干扰能力【 3】。就数字水印算法本身而言,也有空间域和频域的不同。空间域的算法中,例如可以通过选择不同的系数来改变一幅图像象素的最低有效位( LSB)达到嵌入水印信号 的目的【 4】。而 Chen 和 Wang 在【 5】中提出了从图像的空间域提取鲁棒信号,并将其嵌入到图像小波变换后的系数中作为水印的算法。同样,在【 6】中, Lin 和 Chang 为了使算法能够抵
6、御 JPEG 压缩,在设计水印信号时,通过量化系数的选取,保持了 DCT 系数间的不变性。 在本文中,我们设计了一种新颖的半脆弱水印算法 。该算法通过对水印信号的检测,可以有效的探测到对被保护图像的恶意篡改,同时定位出被篡改的区域。对篡改区域的定位使我们能够知道 1) 由篡改区域分析篡改者的动机。 2) 可能的篡改者。 3)篡改的内容是否合法【 7】。为了增加系统的安全性,我们在算法中引入了作者的私钥。 本文的结构如下:在第二部分, 对 JPEG-DCT 与 JPEG2000 的算法进行比较,在第三部分,我们详细的阐述算法本身;第四部分给出实验的结果;而总结在第五部分给出。 2 JPEG 标准
7、 JPEG2000 已经成为一个标准。在这篇论文里,我们将对比她与 JPEG-DCT 以及其它标准图像编码。利用 JPEG2000 的水印算法在第二部分给出。第三部分给出实验结果。第四部分讨论我们的实验结果以及以后的工作。 JPEG DCT 是一种广泛应用的图像压缩标准。但是将是 未来 JPEG2000 是新一代图像压缩的标准。在这一部分将给出基于两种标准的算法。 2.1 JPEG-DCT 编码: JPEG-DCT起源于 80年代是著名的 ISO、 ITU t标准。很多技术例如 baseline和 lossless 模型就是基于 JPEG-DCT。 Baseline 模型支持有损编码。而 lo
8、ssless 模型是无损的。在 baseline 模型下,图像被分割为不相邻的 8 8的块。每一个像素都在 0 2(n-1)之间。然后做 DCT 变换,量化。这时候将 2 维的系数做 zig zag 扫描变为一维的向量,用变长码编码。 DC 系数做插分编码。文献【 9】中有具体的算法描述。在归一化之后,丢弃 0系数。然后做 Huffman 编码。压缩后的图像与压缩前的图像的问题分析在【 9 11】中有分析。还有其它很多类似的模型在【 9 12】中提及。 北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 2.2 JPEG2000 JPEG20
9、00 是一种新的图像压缩算法。由 iso 制定。她也有有损压缩和无损压缩两种【 11】。 JPEG2000 是基于 DWT 的。比 JPEG-DCT 有很多优越的地方。 DWT编码的时候得到的是连续的码流。这样可以避免在 JPEG-DCT 中的块效应。 DWT 一种是基于可逆的( 5, 3)小波,用 于无损编码,一种是基于不可逆( 9, 7)小波,用于有损压缩。量化系数独立于每一个不同的层。每一层都是 64*64 的块。每一层都做熵编码, context code 和 .bit-plane 编码。具体的内容可以参考【 10】和 fig1。 JPEG 有很多优点,也支持很多功能,具体见【 11
10、13】 2.3 JPEG-DCT 和 JPEG2000 的比较 我们考虑不同 bit 流下的两种压缩方式。在所有的情况下, DWT 对图像处理后的效果都要好于 DCT。比如信噪比和图像质量。信噪比一般高 3 6个 dB。结果由 fig2 可以看出。在高压缩比的情 况下, DCT 对图像质量的影响更为严重。在 fig2 中可以看出, DWT 压缩后的图像比 DCT 压缩后的图像有更好的视觉效果。 3 算法: 3.1 信息的提取 我们的这个多媒体认证算法是一种盲检测的算法。对于发送者而言,他从原始的图像中提取有意义的信号,然后将其作为水印信号嵌入到图像中去。在接收方,当他收到嵌入水印的图像以后,用
11、私钥解开水印信号,通过对比通过图像提取的信号与嵌入的水印信号,达到版权认证的目的。 就信号的提取而言,不同的目的,提取信号的方式方法也不一样。在【 5】中, Chen 和 Wang 从原始图像中利用定 义的门限提取鲁棒信号,因为他们的算法需要抵御一些常见的图像压缩方式。 我们用 N*N 大小的灰度图像为例,作为我们的原始图像。利用空间域的方法提取水印信号,然后利用频域的方法嵌入水印信号。 我们在本文中利用 DWT 嵌入北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 水印信号,这是基于 DWT 优良的多尺度分辨能力和精确的定位能力。 Wm,
12、n (x, y)表示小波系数, m, n表示小波分解的层数, x, y 表示每层中的小波系数的位置。经过小波变换后的图像分为四个部分, WL, L表示的是小波分解后的主要部分,该部分基本反应了图像的主体,而 WL, H、 WH, L、 WH, H 表示了原始图 像的一些细节成分。因此我们选择了 WL, L作为嵌入水印信号的系数。我们同时希望能够定位出被篡改的区域,所以将原始图像分成不相重叠的块,然后对每一块做DWT 变换,得到将要嵌入水印的系数。 假设经过分块后,得到了 n个不相重叠的块,而每块中提取了 k bit 的信息,则整个信息的长度是 n*k。矢量 Bi( 1*k)被定义为第 i 块的
13、信息。下面给出 Bi的算法。首先计算每一个块 Ai 的均值然后找到这些值中的最大值与最小值。而量化系数 定义如下: k ii AA 2 )m in ()m a x ( 而 Bi等于: m a xm a x 11 m a x2m in 10 2m inm in 01 m inm in 00 iiiiiAifAifAifAifB 由此可见,当 k越大的时候,量化系数 越小,结果也越精确。在本文中,k 4。 由于量化系数 是由图像本身计算得到的,因此对于接收方而言,不需要知道任何关于量化系数的信息。在【 5】中,量化系数 是由发送方给出的,因此就接收方而言,必须知道这个量化系数才能正确的提取水印信号
14、。这一点而言,降低了系统的安全性。 M i n ( A i ) M a x ( A i )而在我们的实验结果中可以显示,由于改变了小波系数,所以嵌入水印信号的图像跟原始图像有细微差别,但这样的差别不影响我们对水印信号的提取。 3.2 水印的嵌入 在【 8】中,作者将真彩色图像分解为红、绿、蓝三个分量,从红、绿分量中提取的最低有效位( LSB)作为水印信号嵌入到蓝色分量中,替换蓝色分量中的 LSB。因为在彩色图像中,人眼对蓝色分量的敏感度要弱于红色和绿色分量。而在我们这篇文章中,我们将水印信号嵌入到小波系数中那些视觉不是很敏感的部分,这样达到视觉的掩蔽效应 。经过小波变换的系数分为四个部分 WL
15、, L、 WL, H、WH, L、 WH, H,选择 WL, L嵌入水印。这样,一方面水印不至于太脆弱,可以抵御一般的图像处理过程;也不至于过于鲁棒,对于那些恶意的篡改不能检测出来。在提北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 取的信号 S 被嵌入之前我们用了私钥对其加密,得到水印信号 M。 M S xor Key 然后对选择的小波系数进行量化, W( x, y)是我们选择的小波系数,水印嵌入规则如下,假如水印信号 M( i) 0,而该位系数是量化系数的偶数倍,则不改变该位系数;反之 W (x, y)=W (x, y)+Q。而水印信
16、号 M( i) 1,而该位系数是量化系数的奇数倍,则不改变该位系数;反之 W (x, y)=W (x, y)+Q。嵌入水印的算法用下面流程表示: _ For i=1:k*n If M (i)=0 and mod (W (x, y), Q)=even W (x, y) is not changed; Else W (x, y)=W (x, y)+Q; If M (i)=1 and mod (W (x, y), Q)=odd W (x, y) is not changed; Else W (x, y)=W (x, y)+Q; End; _ 进一步而言,此系统可以根据量化系数的选择不同而使水印信号的
17、脆弱程度不同。由实验结果显示假如 Q 1,当图像受到高斯噪声的攻击时,已经不能通过系统的认证。 原始图像分成1 6 1 6 不相邻的块从每一块中提取信息加密成水印信号User KeyDWT选择系数嵌入水印IDWT水印信号WL , L嵌入水印的图像F i g . 1 水印信号嵌入的算法流程3.3 水印信号的认证: 当接收到图像后,接收者可以从中提取出水印信号,算法由 fig 2 给出。第北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 一步,我们将图像分割成为不相邻的块,然后计算每一块的均值,利用嵌入水印的时的算法描述得到每一块的信息。第二步
18、,我们对每一块进行 DWT 变换,提取嵌入水印的小波系数,计算其与量化系数的比值,提取水印信号。然后利用密钥从水印信号中得到每一块的信息。 通过比较直接从图像中提取的信息和从水印信号中提取的信息,我们可以知道接收的图像是否被篡改过。假如图像被篡改,则这两部分提取 的信息是不一致的,图像不能通过认证系统。而且我们知道,不同的块提取的水印是不一样的,因此找到那些错误水印的位置就可以准确的定位被篡改的区域。这样的定位检测在因特网的传输中是很有用的。当图像被篡改后,我们只要重发那些被篡改的区域就可以了,不用整个图像都重新发送,降低了因特网的负荷。 接收的图像DWT分成1 6 1 6 不重叠的块选择系数
19、提取水印信号提取每一块的信息从水印信号中提取信息User Key认证系统ENDF i g . 2 水印认证算法流图4 实验结果: 在这一部分,我们给出实验结果证明该系统的有效性。我们选择了 Lena 图像作为原始图像, Fig 3( a)显示的是原始图像, Fig 3( b)是嵌入水印的图像,比较两 幅图像,产生的差别不为人眼所识别。我们用峰值信噪比( PSNR)描述两者的差别, PSNR 定义如下: 2 5 5lo g10 2 210 dBP S N R q 这里, 2q 是原始图像与嵌入水印图像象素值之差的平方和。本文中 PSNR 大约 21.33。 北京大学校长基金论文集( 2003 年
20、) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 F i g . 3 (a ) o r i g i n a l i m a g e F i g . 3 ( b ) w a te r m a r k e d i m a g e 在实验中, Lena 的两个部分被篡改了,而接收者可以正确的察觉到这样的篡改,并且准确定位,在 Fig 3(d)中,被篡改的区域被白色的块替代标示出来。 F i g . 3 ( c ) m o d i f i e d i m a g e F i g . 3 ( d ) l o c a t e d i m a g e 5 结论: 本文提出了一种新颖的半脆弱水
21、印算法,该算法能够容忍基本的图像处理的操作,例如 JPEG 压缩等,而诸如恶意篡改等不能通过认证系统。由于水印信号是由图像本身生成的,因此可以做到水印的盲检测。该算法不但能够提示图像是否被恶意篡改,而且可以定位出被篡改的区域。实验结果证明了算法的有效性。 但是,为了提高算法的安全性,我们在量化系数的选择上是基于图像块的平均值。如果恰好最大值或者最小值的块被篡改了,则量化系数改变了。此时图像只是不能通过认证系统,但不能正确的定位被篡改的区域。将来的 工作将集中于更好从原始图像中的提取信号和嵌入水印的方案设计方面。 致谢: 感谢我的指导老师许超副教授给我很大的指导, 在科研过程中,他对我的指导让我
22、从一个接收知识的学生逐渐向一个可以自己查阅文献的研究人过渡,在查阅大量文献的过程中,我学习了关于小波变换以及图像压缩的基本知识,掌握了数学工具 MATLAB 的使用。 还要感谢电子学系信号与系统实验室的研究生周翔, 在对水印的研究工作北京大学校长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 中他给了我很多指导和意见。 感谢在学习过程中给过我帮助的所有老师和同学! 参考文献: 1 F.Hartung and M.Kutter “Multimedia Watermarking Techniques” Proc. of IEEE, Vol. l87, P
23、P 1079-1107, July 1999 2 GL.Friedman “The trustworthy digital camera restoring credibility to the photographic image” IEEE Trans, Consumer Electron, Vol. 39, PP.905-910, Nov. 1993 4 Fridrich J. “Methods of data hiding” at site http:/www.ssie.binghamton.edu/fridrich. 5 Tao Chen, Jingchun Wang and Yon
24、glei Zhou, “Combined digital signature and digital watermark scheme for image authentication” Info-tech and Info-net, 2001. Proceedings. ICII 2001 - Beijing. 2001 International Conferences on, Volume: 5, 2001 Page(s): 78 -82 6 C.Y.Lin S.-F Chang, “A robust image authentication method surviving JPEG
25、lossy compression”, SPIE Storage and Retrieval of Image/Video Database, Vol.3312, San Jose, 1998 7 I, J Cox.M.L Miller and J.A.Bloom, “Digital watermarking: algorithms and applications” IEEE Signal Processing Magazine, Vol.18, PP.33-46, July 2001 8 http:/www.jpeg.org/ 9 Gonalez, R., and Wintz, P.”Di
26、gital Image Processing”. Addison Wesley, Second Edition, 1987 10 D.Santa-Cruz. and T.Ebrahimi, “A study of JPEG2000 Still Image Coding Versus other Standards”, Proceeding of the X European Signal Processing Conference (EUSIPCO), V. 2, pp. 673-676, Tampere, Finland, September 5-8, 2000 11 ISO/IEC JTC
27、 1/SC 29/WG 1, ISO/IEC FCD 15444-1: “Information technology JPEG 2000 image coding system: Core coding system, WG 1 N 1646, pp. 1-205, March 2000. Refer to: http:/www.jpeg.org/FCD15444-1.htm 12D. Santa-Cruz, T.Ebrahimi, J. Askelpf, M. Larsson and C. Chrisropoulos. “JPEG 2000 still image coding versu
28、s other standards”, The proceeding of the SPIEs 45th annual meeting, Application of Digital Image Processing XXIII, V4115, pp. 1-10, San Diego, California, Jul. 30-Aug. 4, 2000. 13D. Santa-Cruz, T.Ebrahimi,”An Analytical Study of JPEG2000 Functionalities”. Proceeding of the IEEE International Confer
29、ence on Image Processing (ICIP), V 2, pp. 49-52, Vancouver, Canada, September 10-13, 2000 作者简介 刘彬,女, 1981 年 11 月出生于天津市, 2000 年从天津南开中学考入北京大学信息与科学技术学院电子学系。在校期间,思想政治上积极进步, 学习刻苦认真,成绩优秀,曾获联想奖学金和校级三好学生称号。全面发展,积极参加各种社团活动。 在学习上勤于思考,勤于发问,有旺盛的求知欲望和较科学的学习方法。大学三年总评成绩 10/120。在学习之余不满足于课内的知识 ,乐于挑战自己 , 锻炼自己 . 北京大学校
30、长基金论文集( 2003 年) 基于 JPEG 2000 的应用于多媒体认证的半脆弱水印算法 感语与寄语 本科生做科研基金是一件很具有挑战性的工作,对于我们来说,在学好自己本职课业的前提下,进行一些自学与研究工作 是一个非常大的挑战。当时申请这项基金的时候,我就是抱着要锻炼自己的能力,开阔自己的视野的目的,在这个过程中培养自己的科研素质,为将来的继续深造打下一个基础,比较早的接触研究性的工作,对我们这些理科生是一个再好不过的机会了。 有一点遗憾的是一开始由于没有什么经验,查阅文献和浏览参考书走了好多弯路,由于不知道抓住重点,费了好大劲却不能收到期望的效果, 就这样浪费了一些时间。不过成长就是这
31、个样子的,有了坎坷更激发我的求知欲望,在克服了这个困难之后,结合正在学习的信号与系统这门主干课的实验课程,我将自己的突破口定位 在数字水印上。 我翻阅了一定数量文献,比较前人的差别与特点,创新出一种新型的半脆弱水印的算法。 但是由于时间有限,这项工作没有做的很透彻,还有一些漏洞与不足需要时间来改进。 指导教师简介 许超副教授: 男 年月日出生于 地, 清华大学工学学士,中国科技大学理学硕士,中国科学院电子学所工学博士,北京大学博士后 美国 IEEE 会员,中国电子学会高级会员, DSP 专家委员,多家公司的技术顾问。 承担多项国家 863 高科技研究、 973 重大基础研究和自然科学基金等重点科研项目“位相型调制解调器的研制”项目获得 中国科学院科技进步二等奖“基于小波的视频压缩专用硬件研究”项目被评为 863 重点成果,北京大学 211 工程标志性成果负责多项方正公司、大唐公司等技术研发课题 学术论文三十余篇,发明专利四项 现负责国家 863 高科技研究项目“ JPEG2000 图象压缩集成电路核心技术研究” 国家 973 重大基础项目的子专题 “ 基于小波的 视频压缩与通讯系统研制 ” 教育部骨干教师项目 “ 符合 JPEG2000 的图象压 缩集成电路研究 ” 智诚科技公司研发项目 “ 图象压缩软硬件系统 ”