1、胡学龙编著数字图像处理(第 3 版)思考题与习题参考答案目 录第 1 章 概述 1第 2 章 图像处理基本知识 4第 3 章 图像的数字化与显示 7第 4 章 图像变换与二维数字滤波 10第 5 章 图像编码与压缩 16第 6 章 图像增强 20第 7 章 图像复原 25第 8 章 图像分割 27第 9 章 数学形态学及其应用 31第 10 章 彩色图像处理 32第1章 概述1.1 连续图像和数字图像如何相互转换?答:数字图像将图像看成是许多大小相同、形状一致的像素组成。这样,数字图像可以用二维矩阵表示。将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像(连续图像)信号,再由模拟/
2、数字转化器(ADC)得到原始的数字图像信号。图像的数字化包括离散和量化两个主要步骤。在空间将连续坐标过程称为离散化,而进一步将图像的幅度值(可能是灰度或色彩)整数化的过程称为量化。1.2 采用数字图像处理有何优点?答:数字图像处理与光学等模拟方式相比具有以下鲜明的特点:1具有数字信号处理技术共有的特点。(1)处理精度高。(2)重现性能好。(3)灵活性高。2数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。3数字图像处理技术适用面宽。4数字图像处理技术综合性强。1.3 数字图像处理主要包括哪些研究内容?答:图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、
3、变换、编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的图像。1.4 说出图像、视频(video)、图形(drawing)及动画(animation)等视觉信息之间的联系和区别。答:图像是用成像技术形成的静态画面;视频用摄像技术获取动态连续画面,每一帧可以看成是静态的图像。图形是人工或计算机生成的图案,而动画则是通过把人物的表情、动作、变化等分解后画成许多动作瞬间的画幅,再用摄影机连续拍摄成一系列画面,给视觉造成连续变化的图画。视频和动画都利用了视觉暂留原理。1.5 如何在你的显示器上观测图像的像素?1 台笔记本的屏幕分辨率为 1366768,长宽比例是 4:3、
4、16:9 还是 16:10?屏幕分辨率(以像素每英寸(DPI )为单位)是多少?选择一个高分辨率图像、一个低分辨率图像,比较分别观察到像素时图像的放大倍数的差异。答:可先拷屏,按照图 1.2 放大局部图像的方法观测图像。屏幕分辨率为 1366768,表示宽高比为 1.7786:1,而 4:3 = 1.3333:1,16:9 = 1.7778:1, 16:10 = 1.6:1。可见,此屏幕的宽高比最接近 16:9。1.6 如何在你的计算机上查看图像文件的各种属性?答:在 Windows 操作系统下,鼠标指针指向文件名,可看到图像文件的 “项目类型”、 标记”、“分级”、“尺寸”、“大小”和“标题
5、”属性(图 1.6a)。右击图像文件名,单击弹出菜单的“属性”命令,可以看到“常规”和“详细信息”两个标签,其中“常规”标签指出文件名、存放“位置”、“时间”、文件“属性”等信息。“详细信息”指出“说明”、“来源”、“图像”、“照相机”、“高级照片”、“文件”等信息。1(a)鼠标指针指向文件名(b)常规 (c)详细信息题 1.6 图 图像属性1.7 讨论在你的智能手机中哪些功能应用了图像处理技术。答:根据手机功能和智能程度的不同,有彩信、视频、相机、游戏、二维码扫描、名片识别等。1.8 设图 1.17 的文件名为“microscopic.jp2”或“microscopic.jpg”,尺寸为 4
6、1403096。针对本图像,讨论可以进行哪些图像处理和图像分析操作?答:处理方面:(1)对图像进行二维变换,观察图像的频谱;(2)图像增强:由于光照不均匀,可以通过增强手段,图像暗处得到照度补偿; 3)图像编码:可以用 DCT 编码的 JPEG格式存放 JPEG 图像,也可用 DWT 编码存放 JPEG2000 图像;(4)图像分割:将感兴趣的目标从背景中分割出来,以便做进一步分析处理。图像分析:(1)对观测对象进行形状分析;(2)对不同大小的颗粒做分布分析。1.9 讨论数字图像处理的主要应用。进一步查找资料,写一篇关于你感兴趣的应用方面的短文。答:图像处理的应用几乎渗透科学研究、工程技术和人
7、类社会生活的各个领域。教师可以分组对学生布置以下 6 个方面的课题,通过阅读参考文献、网络资源等手段写数字图像处2理的主要应用的短文,并安排交流机会。1航天和航空技术方面的应用2生物医学工程方面的应用3通信工程方面的应用4工业自动化和机器人视觉方面的应用5军事和公安方面的应用6生活和娱乐方面的应用3(第 2 章 图像处理基本知识2.1 如何表示图像中一点的彩色值?颜色模型起什么作用?答:图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的颜色空间各分量的含义不同。颜色模型规定了颜色的建立、描述和观察方式。颜色模型都是建立在三维空间中的,所以与颜色空间密不可分。2.2 色调、
8、色饱和度和亮度的定义是什么?在表征图像中一点的颜色时,各起什么作用?答:HSV 模型由色度( H),饱和度( S),亮度(V)三个分量组成的,与人的视觉特性比较接近。HSV 颜色模型用 Munsell 三维空间坐标系统表示。色调(H)表示颜色的种类,用角度来标定,用-18001800 或 003600 度量。色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比来度量,从 0%到完全饱和的 100%。亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从 0%(黑)到 100%(白)。2.3 按照波段的成像图像讨论图像的分类。答:人们常见的是可见光成像,但在科
9、学研究等领域,其他一些不同波段的电磁波成像技术会起到可见光成像无法替代的作用。下面是电磁波谱分布情况:1、 不可见光线:伽马射线、X 射线、紫外线;2、 可见光线:紫、蓝、青、绿、黄、橙、红;3、不可见光线:近红外线、中间红外线、远红外线、微波、工业电波。按波长从短到长有:(1)伽马射线图像:伽马射线是由原子核受激产生的波长极短、能量极高的射线。天文学上利用伽马射线获取伽马射线暴图像。 2)X 射线图像:X 射线是由原子受激产生的,具有很强的穿透能力,其图像在医疗、探伤、物质结构分析等方面具有重要作用。(3)紫外线(UV)图像:红外线波长短于可见光。230-400 nm 的 UV 传感器可用于
10、天文学、火灾检测、细胞的医学成像等。(4)红外线图像:红外线波长长于可见光。红外遥感器接收地物反射或自身发射的红外线而形成的图像,可以解决在夜间观察目标光强不足及对比度差的困难。由于高于绝对零度的物体都会发出红外线,所以红外图像可以描述某个区域的温度分布,这在遥感技术中广泛使用,在医学成像和火灾监测等方面也有实际应用。(5)无线电波图像:波长范围很宽,从 mm 到 km。常用射频成像法。由高频发射机发射的高频电磁波在传播过程中遇到具有不同电学性质的物体时,电磁波的传播规律将大大改变。根据无线电波测量的结果可以绘出物体内的结构图像,如毫米波人体安检成像技术。另一个获得重要应用的是 SAR(合成孔
11、径雷达)成像技术。SAR传感器波长通常在厘米级。SAR 图像则只记录了一个波段的回波信息,以二进制复数形式记录下来。振幅信息通常对应于地面目标对雷达波的后向散射强度,与目标介质、含水量以及粗糙程度密切相关,而相位信息则对应于传感器平台与地面目标的往返传播距离。2.4 设有大小为 3232 的图标,图标的每个像素有 8 种颜色,共有多少种不同的图标?如果每 100 万个可能的图标中有一个有意义,识别一个有意义的图标需要 0.1 s,则选出所有有意义的图标需要多长时间?解:图标数为 83232 = 10925 种4有意义的图标数 10925/106 = 10919 种选择有意义图标的时间 1091
12、90.1 = 10918 s可见随机图像的复杂度是非常高的。2.5 讨论数字图像处理系统的组成。列举你熟悉的图像处理系统并分析它们的组成和功能。答:如教材图 2.6,数字图像处理系统是应用计算机或专用数字设备对图像信息进行处理的信息系统。图像处理系统包括图像处理硬件和图像处理软件。图像处理硬件主要由图像输入设备、图像运算处理设备(微计算机)、图像存储器、图像输出设备等组成。软件系统包括操作系统、控制软件及应用软件等。 教材图 2.6 数字图像处理系统结构图2.6 常见的数字图像处理开发工具有哪些?各有什么特点?答目前图像处理系统开发的主流工具为 Visual C+(面向对象可视化集成工具)和M
13、ATLAB 的图像处理工具箱(Image Processing Tool box)。两种开发工具各有所长且有相互间的软件接口。Microsoft 公司的 VC+是一种具有高度综合性能的面向对象可视化集成工具,用它开发出来的 Win 32 程序有着运行速度快、可移植能力强等优点。VC+所提供的 Microsoft 基础类库 MFC 对大部分与用户设计有关的 Win 32 应用程序接口 API 进行了封装,提高了代码的可重用性,大大缩短了应用程序开发周期,降低了开发成本。由于图像格式多且复杂,为了减轻程序员将主要精力放在特定问题的图像处理算法上,VC+ 6.0 提供的动态链接库ImageLoad.
14、dll 支持 BMP、JPG、TIF 等常用 6 种格式的读写功能。MATLAB 的图像处理工具箱 MATLAB 是由 MathWorks 公司推出的用于数值计算的有力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆脱繁杂的程序代码。MATLAB 图像处理工具箱提供了丰富的图像处理函数,灵活运用这些函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计中的重复劳动。MATLAB 图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检测、二值图像处理、小波分析
15、、分形几何、图形用户界面等。但是,MATLAB 也存在不足之处限制了其在图像处理软件中实际应用。首先,强大的功能只能在安装有 MATLAB 系统的机器上使用图像处理工具箱中的函数或自编的 m 文件来实现。其次,MATLAB 使用行解释方式执行代码,执行速度很慢。第三,MATLAB 擅长矩阵运算,但对于循环处理和图形界面的处理不及 C+等语言。为此,通应用程序接口 API 和编译器与其他高级语言(如 C、C+、Java 等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。API 支持MATLAB 与外部数据与程序的交互。编译器产生独立于 MATLAB 环境的程序,从而使其他语言的应用程
16、序使用 MATLAB。2.7 常见的数字图像应用软件有哪些?各有什么特点?5 f (x, y) f )g(x, y) g f答:图像应用软件是可直接供用户使用的商品化软件。用户从使用功能出发,只要了解软件的操作方法就可以完成图像处理的任务。对大部分用户来说,商品化的图像应用软件无需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。常用图像处理应用软件有以下几种:1PHOTOSHOP:当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘莫及。PHOTOSHOP 已成为出版界中图像处理的专业标准。高版本的 PHOTOSHOP 支持多达 20 多种图像格式和 TWAIN
17、接口,接受一般扫描仪、数码相机等图像输入设备采集的图像。PHOTOSHOP 支持多图层的工作方式,只是 PHOTOSHOP 的最大特色。使用图层功能可以很方便地编辑和修改图像,使平面设计充满创意。利用 PHOTOSHOP 还可以方便地对图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色模式的转换、改变图像的尺寸和分辨率、制作网页图像等。2CorelDRAW:一种基于矢量绘图、功能强大的图形图像制作与设计软件。位图式图像是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块为主。可见,采用不同的技术手段可以满足用户的设计要求。位图式图像善于
18、表现连续、丰富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。CorelDraw 是当今流行的图像处理软件中为数不多的特点明显、功能强大的基于矢量绘图的软件包。利用它,可以方便地制作精美的名片、贺卡、书签、图书封面、广告、宣传画等作品。3ACDSee:快速、高性能的看图程序,是目前最享盛名的图片浏览器。它能广泛应用于图片的获取、管理、浏览和优化,支持 BMP、GIF 、JPG 、TGA、TIF 等超过 50 种常见的图形文件格式,图片打开速度极快,可以直接查看动画 GIF,处理如 Mpeg 之类常
19、用的视频文件,还可以为每一个目录建立一个相册。ACDSee 可以从数码相机和扫描仪高效获取图片,并进行便捷的查找、组织和预览。ACDSee 还是得心应手的图片编辑工具,轻松处理数码影像,拥有去红眼、剪切图像、锐化、浮雕特效、曝光调整、旋转、镜像等功能,还能进行批量处理。2.8 调用函数 Cfg = cov(f, g)计算出图像 f 和图像 g 的协方差矩阵是一个 22 的矩阵。说明该矩阵各个元素的含义,数值大小对图像特性的影响。答:设 f (x,y)和 g(x,y)是大小为 MN 的两幅图像,则两幅图像之间的协方差矩阵为 Cfg:C fg 1MNM1 N1x0 y0协方差矩阵 Cfg 是两幅图
20、像之间的相关程度的一种度量。协方差矩阵为零时表明两图像之间相互独立,反之表示两幅图像之间相互依赖。Cfg 越大,相关程度越强。C fg 是 22 矩阵: 2 cov( f , g )C fgcov( g , f )式中, 2f 和 g2 分别是图像 f 和 g 的方差, cov(f,g)和 cov(g,f) 是图像 f 和 g 的协方差。6第 3 章 图像的数字化与显示3.1 光圈越大,摄取的画面是否越亮?光圈的数字越小是否代表光圈越小?2.8 的光圈与5.6 的光圈,哪个画面更亮?光圈越小,画面是否越有立体感?答:光圈越大,光学镜头进光量越大,摄取的画面也越亮。光圈系数(F)反映镜头的通光量
21、,以焦距 f 和通光孔径 D 表示。通光量与 F 值的平方成反比。所以光圈的数字越小代表光圈越大。2.8 的光圈比 5.6 的光圈更亮。景深(depth of field)是对某景物调焦,以形成前后清晰区域。景深与三个因素有关:光圈、焦距和物距。光圈越小,景深越深。3.2 换一幅图像,重新演算图 3.6 中实际图像量化的运行结果。解:以将灰度为 256 降低为 8(图 d)为例编程并运行程序。level1 = 256;level2 = 8;ratio = level1/level2;I1 = imread(cameraman.tif);subplot(121);imshow(I1);S = s
22、ize(I1);for m = 1: S(1)for n = 1: S(2)I2(m,n) = uint8(round(double(I1(m,n)/ratio);I2(m,n) = uint8(ratio*double(I2(m,n);endendsubplot(122);imshow(I2);imwrite(I2,cameraman_d.tif)程序运行结果如下:(a)原始图像(灰度级为 256) (d)灰度级为 8教材图 3.6 不同量化级别对图像质量的影响3.3 如何合理选取采样率和量化等级数?答:一般,当限定数字图像的大小时,为了得到质量较好的图像,可采用如下原则:(1)对缓变的图像
23、,应该细量化,粗采样,以避免出现假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。73.4 讨论基于二维采样定理,根据图像采集设备的分辨率计算最大像素数。答:采集设备的分辨率反映了其采集图像时的细节效果。高分辨率才采集是保证图像高分辨率的基础。应该根据二维采样定理选择合适分辨率的采集设备,这样既能保证所需的图像质量,又能做到物尽其用。Nyquist 定理表明,为了正确判定信号频率,信号在一个周期内至少被采样两次。二维采样定理应用在实际图像的采集中,意味着如果要达到一个采集设备(如数码相机或扫描仪)最小的空间分辨率,至少需要采两个点。3.5 验证图 3.8 一维向量量化的误差 d(X
24、, Ci)的正确性。解: d(X, C0) = (4-3)2+(2-1)2+(3-2)2+(1-3)2/4= 1+1+1+4/4= 7/4d(X, C1) = (4-1)2+(2-3)2+(3-1)2+(1-4)2 = 9+1+4+9/4 = 23/4d(X, C2) = (4-4)2+(2-3)2+(3-4)2+(1-1)2 = 0+1+1+0/4 = 2/4d(X, C3) = (4-2)2+(2-1)2+(3-2)2+(1-3)2 = 4+1+1+4/4 = 10/43.6 计算图 3.9 图像 X 与图 3.10 码书 C 码字的误差,验证选择码字 Y1 作为 X 的二维向量量化编码的
25、合理性。解:原始图像块 X 是一个 4 灰度级的 16 维向量1 0 0 0 1 1 0 0 2 2 1 0 3 2 1 1,如教材图3.9 所示。码书:Y0 = 0 2 0 0 1 2 1 1 0 3 2 0 0 3 2 1Y2 = 1 1 2 2 2 2 1 2 3 3 1 0 1 1 0 0Y1 = 1 1 0 0 1 1 1 0 2 2 1 0 3 3 1 1Y3 = 0 2 3 3 0 1 3 2 1 1 3 1 1 1 1 0均方误差为:d(X, Y0) = 25/16;d(X, Y1) = 3/16;d(X, Y2) = 25/16 ;d( X, Y3) = 47/16。X Y0
26、 Y1 Y2 Y3教材图 3.9 原始图像和灰度级 教材图 3.10 码书 C Y0, Y1, Y2, Y3如图 3.10 所示。经均方误差准则计算可以发现码字 Y1 离 X 最近,故用索引 01 进行编码。3.7 根据“电视行(TV line)”或扫描线的概念,摄像机的清晰度常用扫描线的线数表示。如果画面是 4:3 的,540 线的像素分辨率多少?720p 是 720 线(p 代表逐行扫描,i 是隔行扫描),帧型为 16:9,像素分辨率为 1280720。解:如果画面是 4:3 的,540 线的像素分辨率是5404/3540 = 7205403.8 摄像机和数码相机分辨率受到哪些因素限制?是
27、否越高越好?如何进一步提高分辨率?答:分辨率往往是用户最关心的指标,但其上限受到像素极限尺寸、CCD 制造工艺、设备性价比等因素限制,并不能无限提高。人们正在研究采用信号处理的超分辨率技术力求解决这些问题。3.9 扫描仪的光学分辨率是 6001200 线,一个具有 5000 个感光单元的 CCD 器件,用于 A4 幅面扫描仪,A4 幅面的纸张宽度是 21 cm,该扫描仪的光学分辨率是多少 dpi?解:(1)6001200 线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵向分辨率。8(2)dpi 是指单位面积内像素的多少,也就是扫描精度 ,目前国际上都是计算一英寸面积内像素的多少。光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际的光点数,是指扫描仪 CCD 的物理分辨率,也是扫描仪的真实分辨率,它的数值是由 CCD的像素点除以扫描仪水平最大可扫尺寸得到的数值。每一个感光单元对应一个像素。由于 CCD 感光单元个数为 5000,21 cm = 8.3 英寸,所以该扫描仪的光学分辨率是 5000/8.3 602 dpi,规格化为 600 dpi。9