1、PowerPoint Template,第四章 数字图像基础,图像颜色的模型,彩色空间的线性变换,图像的基本属性及种类,JPEG压缩编码,图像文件基本格式及转换,图像编辑工具,数字图象基础,知识结构,数字图像概述,图像:与视觉相关的媒体表现形式静态图像动态图像视频图像数字化:将自然景物的形象信息转换成计算机可以处理的数字信息,包括颜色信息。图像数据压缩图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量(无损压缩技术)人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的(有损压缩技术),4.1 图像颜色模型,颜色:视觉系统对可见光的感知
2、结果。可见光是波长在380 nm780 nm之间的电磁波 图像的颜色模型:颜色的表示模型,用来描述能感知的和处理的颜色。彩色空间:颜色模型中所有被定义的颜色形成的坐标系空间。颜色用坐标系中的一个点表示。常用颜色模型:RGB(红色、绿色、蓝色) 显示设备CMYK(青色、洋红、黄色、黑色)印刷设备HSB(色调、饱和度、亮度)视觉处理YUV彩色全电视信号数字化,一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;显示彩色图像用RGB相加混色模型 颜色FrR(红色的百分比)gG(绿色的百分比)bB(蓝色的百分比),4.1.1 RGB颜色模型,4.1.1 RGB颜色
3、模型,当三基色等量相加时,得到白色;等量的红绿相加而蓝为0值时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。,RGB颜色相加,4.1.1 RGB颜色模型,颜色相加列表,4.1.1 RGB颜色模型,标准的电视图形阵列适配卡的16色,4.1.1 RGB颜色模型,标准的电视图形阵列适配卡的16色,4.1.1 RGB颜色模型,RGB图像,图象的相加色一幅彩色图像可以看成由许多的点组成的每个像素都有一个值,称为像素值,它表示特定颜色的强度。 一个像素值往往用R,G,B三个分量表示,R G B,R数组 8bit表示(256阶梯)G数组 8bit表示(256阶梯)B数组 8
4、bit表示(256阶梯)最大表示:28 28 28 = 224 = 16777216 (16.7M),4.1.1 RGB颜色模型,RGB图像示例,4.1.2 CMYK颜色模型,一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。 任何一种颜色都可以用三种基本颜料按一定比例混合得到:青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。 用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。,4.1.2 CMYK颜色模型,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R)
5、;等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。,4.1.2 CMYK颜色模型,相减颜色列表,C数组 8bit表示(256阶梯)M数组 8bit表示(256阶梯)Y数组 8bit表示(256阶梯)K数组 8bit表示(256阶梯) 最大表示:28282828 = 232 = 4294967296 (4294M),C M Y K,4.1.2 CMYK颜色模型,CMYK图像示例,4.1.3 HSL色彩空间,HSL(Hue、Saturation、Lightnes)色彩空间是用H、S和L 3个参数来生成颜色。其中,H
6、为颜色的色调,改变它的数值可以生成不同的颜色;S为颜色的饱和度,改变它可以改变颜色的深浅;L为颜色的亮度,改变它可以使颜色变亮或变暗。 HSL色彩空间更符合人的视觉特性,更接近人对彩色的认识和解释。对某一颜色,人眼分辨不出其中R、G、B的比例,但可以感觉到它的颜色的种类、深浅和明暗程度。,4.1.3 HSL色彩空间,色调:是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调;饱和度:指的是颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。亮度:
7、颜色的相对明暗程度。,4.1.3 YUV(YIQ)彩色空间,YUV彩色空间电视系统中常用Y表示亮度,U、V用来表示色差,U、V是构成彩色的两个分量。YUV表示法的重要特性:它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。可以利用人眼的特性来降低数字彩色图像所需要的存储容量。(用Y传送细节,UV进行大面积着色,以减少所需要的数据量。PAL制中,Y的带宽4.43MHz,UV为1.3MHz),4.2 彩色空间的线性变换,彩色空间变换:适应不同设备的要求使用人的视角特性以降低数据量,通常把RGB空间表示的彩色图像变换到
8、其他彩色空间。主要的彩色空间变换:YUV-RGB: YUV适用于PAL和SECAM彩色电视制式YIQ-RGB: YIQ适用于NTSC彩色电视制式YCrCb-RGB:YCrCb适用于数字电视和计算机用数字视频图像 HSB-RGB:计算机视觉处理 和识别,4.2 彩色空间的线性变换,YUV与RGB彩色空间变换,Y = 0.299R + 0.587G + 0.114BU = - 0.147R- 0.289G + 0.436BV = 0.615R - 0.515G - 0.100B,4.2 彩色空间的线性变换,YIQ与RGB彩色空间变换,Y = 0.299R + 0.587G + 0.114BI =
9、0.596R - 0.275G - 0.321BQ = 0.212R - 0.523G + 0.311B,4.2 彩色空间的线性变换,YCrCb与RGB彩色空间变换,Y0.299R0.578G0.114BCr(0.500R0.4187G0.0813B)128Cb=(-0.1687R0.3313G0.500B)128,4.2 彩色空间的线性变换,HSB与RGB彩色空间变换,4.3.1 分辨率,图像的属性:包含分辨率、像素深度、真/伪彩色。 分辨率:显示分辨率和图像分辨率。显示分辨率:指显示屏上能够显示出的像素数目。例如,显示分辨率为640480表示显示屏分成480行,每行显示640个像素,整个显
10、示屏就含有307200个显像点。图像分辨率:指组成一幅图像的像素密度的度量方法。在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点(dots per inch,DIP)表示。如果用300 DIP来扫描一幅810的彩色图像,就得到一幅24003000个像素的图像。分辨率越高,像素就越多。,4.3.1 分辨率,显示分辨率与图像分辨率的区别,图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640480,那末一幅320240的图像只占显示屏的1/4。,4.3.1 分辨率,扫描分辨率:扫描仪扫描图像的
11、扫描精度,单位为每英寸多少点(Dots Per Inch,DPI)表示。扫描分辨率越大,扫描得到的图像越大:300DPI扫描8”x 10”的彩色图像,将产生2400x300像素的图像打印分辨率:图像打印时每英寸可识别的点数,单位为DPI。打印分辨率越大,在纸张大小不变的情况下,打印的图像越精细。,扫描分辨率与打印分辨率的区别,4.3.2 颜色深度(像素深度),像素深度:指存储每个像素所用的位数,它也是用来度量图像的分辨率。 颜色深度:决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。 一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素
12、共用24位表示,就说像素的深度为24,每个像素可以是224=16 777 216种颜色中的一种。 在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1位或几位作为属性(Attribute)位。例如,RGB 555表示一个像素时,用2个字节共16位表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而颜色深度为15位。,4.3.3 真彩色、伪彩色与直接色,真彩色(true color)真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。伪彩色(pseudo
13、 color)伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。,4.3.3 真彩色、伪彩色与直接色,真彩色与伪彩色图像之间的差别,4.3.3 真彩色、伪彩色与直接色,直接色(direct color)每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。试验结
14、果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。,4.3.4 图像种类,矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。矢量图的优点是:缩放、旋转、移动时图像不会失真。存储和传输时数据量较小。矢量图的缺点是:图像显示时花费时间比较长。真实世界的彩色图像难以转化为矢量图。,矢量图,4.3.4 图像种类,位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。位图的优点是:扫描仪、数码相机、摄像机等设备方便的转化为点位图显示速度快。真实世界的图像可以通过。位图
15、的缺点是:存储和传输时数据量比较大。缩放、旋转时算法复杂且容易失真。,位图,RGB彩色图像, RGB 红、绿、蓝,R G B,R G B,R数组 8bit表示(256阶梯)G数组 8bit表示(256阶梯)B数组 8bit表示(256阶梯)最大表示:28 28 28 = 224 = 16777216 (16.7M),4.3.4 图像种类,CMYK彩色图像,C KM Y,C M Y K, CMYK 青、品红、黄、黑,4.3.4 图像种类,4.3.4 图像种类,灰度图象是按照灰度的等级数目进行划分进行如果灰度等级用8位表示,则灰度等级就是256级如果每个象素值用1位表示,只有黑白两种颜色的图像,则
16、称为单色图象。,灰度图像与单色图像,4.4.1 JPEG压缩标准,由ISO和IEC两个组织联合组成的一个专家组,负责制定静态的数字图象数据压缩编码标准可用于静态图象,也可以用于动态图象基本压缩算法:基于离散余弦变换的有损压缩算法基于空间预测技术的无损压缩算法,4.4.1 JPEG压缩标准,基于DPCM的无损压缩编码算法,源图像数据,预测器,熵编码器,表说明,压缩后图像数据,无失真编码器,c,b,a,x,选择值,预测值,选择值,预测值,0,非预测,4,a+b-c,1,a,5,a+(b-c)/2,2,b,6,b+(a-c)/2,3,c,7,(a+b)/2,(a)三领域采样值,(b)预测方式, 压缩
17、比 10:1 100:1 (一般压缩比40:1), 压缩原理 采用无失真预测编码、有失真DCT编码等混合编码方式, 无失真预测编码 线性预测编码,压缩比2:1 有失真DCT编码 1 离散余弦变换压缩编码,压缩比40:1 2 霍夫曼编码 (增强型编码) 3自适应算术编码 (增强型编码),4.4.1 JPEG压缩标准,基于DCT的有损压缩编码算法,JPEG 核心是“离散余弦变换(Discrete Cosine Transform,DCT)”JPEG 压缩算法的基本步骤为:,1、离散余弦变换DCT Transformation,2、系数量子化Coefficient Quantization,3、Hu
18、ffman无损压缩Lossless Compression,4.4.2 JPEG有损压缩算法,4.4.2 JPEG有损压缩算法,静态图象压缩原理图,4.4.2 JPEG有损压缩算法,JPEG算法步骤,正向离散余弦变换(FDCT)。 量化(quantization)。 Z字形编码(zigzag scan)。 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。 使用行程长度编码(run-length encoding,RLE)对交流系数(AC)进行编码。 熵编码(entropy coding)。,对每个单独的彩色图像分
19、量,把整个分量图像分成88的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。,4.4.2 JPEG有损压缩算法,正向离散余弦变换,DCT变换使用下式计算逆变换使用下式计算C(u), C(v) = 1/ , 当u, v = 0;C(u), C(v) = 1, 其他。,正向离散余弦变换,4.4.2 JPEG有损压缩算法,计算两维的DCT变换时,可使用下面的计算式把两维的DCT变换变成一维的DCT变换 。,4.4.2 JPEG有损压缩算法,正向离散余弦变换,4.4.2 JPEG有损压缩算法,量子化Quantization,DCT变换的输入是8位的象素值(025
20、5,JPEG实现时将其减去128,范围变成-128127),但输出范围是从1024到1023 ,占11位。量子化即通过整除运算减少输出值的存储位数。,使用量子化矩阵(Quantization Matrix)来实现量子化。,量子化公式为:量化后的值( i, j ) = ROUND( DCT(i, j) / 量子(i, j) )逆量子化公式为:DCT(i, j) = 量化后的值( i, j ) * 量子(i, j),量子化是JPEG算法中损失图像精度的根源,也是产生压缩效果的源泉,quality = 4,quality = 9,Quantumij = 1 + ( ( 1 + i + j ) * q
21、uality ),量子表Quantum Table,4.4.2 JPEG有损压缩算法,(0,0)-(0,1)-(1, 0)-(2,0)-,将量子化的矩阵按Zig-Zag顺序排列,将原始数列转换为差值数列,对差值数列进行编码,可以使用Huffman编码、算术编码或熵编码等方法,Zig-Zag编码,4.4.2 JPEG有损压缩算法,量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法是按照Z字形的式样编排。这样就把一个8 x 8的矩阵变成一个1x 64的矢量,频率较低的系数放在矢量的顶部。,4.4.2 JPEG有损压缩算法,Z形编码,8 x 8图像块经过DCT变
22、换之后得到的DC直流系数有两个特点:一是系数的数值比较大,二是相邻8x8图像块的DC系数值变化不大。JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码 DeltaDC(0, 0)k-DC(0, 0)k-1,4.4.2 JPEG有损压缩算法,直流系数编码,量化AC系数的特点是1x 64矢量中包含有许多“0”系数,并且许多“0”是连续的游程长度编码(RLE)对它们进行编码JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。,4.4.2 JPEG有损
23、压缩算法,交流系数编码,0的个数,下个非“0”系数位数,量化AC系数的数值,使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用霍夫曼编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表(lookup table)方法进行编码。,4.4.2 JPEG有损压缩算法,熵编码,JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样的组织的数据通常称为JPEG位数据流(JPEG bitstream)。,4.4.2 JPEG有损压缩算法,组成位数据流
24、,4.4.2 JPEG有损压缩算法,一个真实的编码和解码过程,将原始图像划分成多个 8 X 8 或 16 X 16 的矩阵进行处理,要求矩阵中每个点的像素值范围是 0255,二值、16级灰度等均转换为256级灰度图像进行处理,对非256色的彩色图象,先转换成真彩色图像,然后使用分色法将图像分成红、蓝、绿三个256级灰度图像,再进行处理,Independent JPEG Grouphttp:/www.ijg.org/,JPEG的其他问题,4.4.2 JPEG有损压缩算法, BMP格式, Bitmap,Microsoft公司开发,用于Windows环境, 使用要点 (1) 用于表现打印、显示用图像
25、 (2) 不适于网络传送 (3) 不适于提供印刷文件,文件头,调色板数据(反向排列),图像数据, 特点 (1) 扩展名采用“.bmp” (2) 文件描述单一(静止)图像 (3) 彩色模式: 24 232 (4) 调色板RGB数据顺序反向排列 (5) 以图像左下角为起点排列数据 (6) 一般采用非压缩数据格式,4.5.1 基本图像文件格式, TIFF格式,Tag Image File Format,Aldus公司开发,用于精确描述图像的场合, 使用要点 (1) 平面设计作品的最佳表现形式 (2) 用于提供印刷文件 (3) 不适于网络传送,4.5.1 基本图像文件格式, TGA格式,Taga Im
26、age Format,Truevision公司开发,用于屏显和动画帧显示, 使用要点 (1) 用于表现影视广播级动画的帧 (2) 不适于保存高质量印刷文件 (3) 不适于网络传送,4.5.1 基本图像文件格式, GIF格式,Graphics Interchange Format, CompuServe公司开发, 用于屏显和网络, 使用要点 (1) 用于屏幕显示图像和电脑动画 (2) 用于网络传送 (3) 不适于保存高质量印刷文件,4.5.1 基本图像文件格式,PSD格式是Adobe公司开发的图像处理软件PhotoShop中自建的标准文件格式,是PhotoShop的默认文件格式,它支持Photo
27、Shop的所有功能,能保存没有合并的图层、通道和蒙板等信息。,4.5.1 基本图像文件格式, PSD格式, JPEG格式,Joint Photographic Experts Group,联合专家小组开发,用于彩色图像的存储和网络传送。, 使用要点 (1) 用于保存表现自然景观的图像 (2) 用于网络传送 (3) 不适于表现有明显边界的图形 (4) 不适用于高质量印刷文件,4.5.1 基本图像文件格式,英文版 + 中文补丁程序,4.6.1 图像浏览器,(1) 选择路径,(3) 单击图片标记 观看小图片,(2) 选择“图片预览”,(4) 双击图片标记 正式观看图片,(5) 双击图片 返回浏览图片
28、画面,浏览图片, 操作步骤,4.6.1 图像浏览器,(4) 单击全部选中按钮,(5) 单击确定按钮,建立关联, 关联的作用 鼠标双击被关联的对象,自动启动ACDSee软件,并显示对象,4.6.1 图像浏览器,画图工具,4.6.2 获取Windows界面(抓图), 操作要点,获取界面举例, 获取资源管理器菜单 (保留需要的部分), 获取资源管理器界面 (整个窗口),4.6.2 获取Windows界面(抓图),流行的图像处理软件,4.6.3 图像处理,典型的图像处理软件 PhotoShop, 扫描输入功能运行扫描驱动程序,驱动扫描仪,进行扫描编辑 图像编辑功能色彩变换,尺寸变换,抠图,组合等 图层
29、编辑功能变换图层,图层融合,合并图层 打印输出功能彩色RGB输出 文件管理功能打开各类文件、保存多种文件格式 傻瓜编辑功能图像调整,丰富多彩的滤镜,图像处理软件的特点,使用条件, 硬盘150MB,内存64MB 彩色模式16位,显示 800600 若安装到C: 盘以外的驱动器时,C: 盘至少保留16MB的可用空间,4.6.3 图像处理, 双击PhotoShop图标 等待启动,启动与界面, PhotoShop界面,功能菜单辅助工具栏工具盒图像编辑窗口导航器窗口颜色窗口历史纪录窗口图层窗口状态栏,4.6.3 图像处理, 操作步骤,(1) 选择“编辑预设常规”,(6) 单击好按钮,(4) 高速缓存级别
30、:6,设置状态参数,(5) 物理内存用量 的百分比:90,(2) 根据需要,选择 差值方法 临近(较快) 两次线性 两次立方(较好),(3) 选择“内存与图像 高速缓存”,4.6.3 图像处理,调入图像,(1) 选择“文件打开”菜单,(2) 选择图像文件 单击打开按钮,(3) 选择“图像模式” 菜单,(4) 观察菜单中的“”项,4.6.3 图像处理,改变图像显示尺寸, 操作步骤,(1) 选择放大镜工具,(3) 一次性放大与缩小,4.6.3 图像处理,改变图像几何尺寸,(1) 选择“图像图像大小”菜单,(2) 改变图像的像素数值 (适用于显示用图像),(6) 单击好按钮, 操作步骤,(3) 改变文档大小 (适用于印刷用图像),(4) 保持宽/高比,(5) 选择改变图像尺寸的算法 (两次立方),4.6.3 图像处理,保存图像, 操作步骤,(1) 选择“文件/存储为”菜单,(3) 选择文件格式,(4) 起文件名,(2) 选择保存地点 (文件夹),(5) 单击保存按钮,(6) 选择格式参数 (不同的格式显 示不同的画面),(7) 单击好按钮,4.6.3 图像处理,图像简单处理举例, 调入JPG格式的图像, 判断图像类型 (RGB / 8bit), 改变图像几何尺寸 (“图像/图像大小”), 以BMP格式保存图像,4.6.3 图像处理,