1、课程名称 数字图像处理 任课老师 刘金硕 姓名 邱远军 学号 2008202110007 武汉大学计算机学院研究生课程论文 第 1 页 共 5 页 数字 图像处理 学习总结及作业技术报告 邱远军 ( 武汉大学计算机学院 武汉 430072) 1 图像工程的提出 工程是指将然科学的原理应用到工业部门而形成的各学科的总称。 图像工程学科则是将数学、光学等基础科学的原理,结合在图像应用中积累的技术经验而发展起来的一个对整个图像领域进行研究应用的新学科。 2 图像工程的三个层次 如图 1所示, 图像工程可以分为三个层次:低、中、高,相应的分别为图像处理,图像分析和图像理解。低层次图像处理的特点是处理的
2、输入输出都是图像,着重强调在图像之间进行的变换,如 对图像进行各种加工以 改善图像的视觉效果并为自动识别打基础 , 或 是 对图像进行压缩编码以减少对其所需存储空间或传输时间、传输道路的要求 。中层次处理即图像分析的特点是输入图像,输出特征, 主要是对图像中感兴趣的目标进行检测和测量 , 以获得它们的客观信息 , 从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程 , 则图像分析是一个从图像到数据的过程。这里数据可以是对目标特征测量的结果 , 或是基于测量的符号表示。它们描述了图像中目标的特点和性质 。高层次处理即图像理解的特点是模仿人类视觉进行感知,重点是在图像分析的基础上进一步研
3、究图像 中各个目标的性质和它们之间的相互联系 ,并得出对图像内容含义的理解以及对原来客观场景的解释 ,从而指导和规划行动。原始图像数据经过三个层次的加工将逐步转化为更有组织和用途的信息。 3 数字图像处理系统的构成 通过综合各种图像处理技术可以构建一个图像处理系统,一个基本的数字图像处理系统由图像输入、图像存储、图像通信、图像处理和分析五个模块组成,如图 2所示。 3.1 数字图像输入模块:也称图像采集或图像数字化,是利用图像采集设备(数码相机、数码摄像机等)来获取数字图像,或通过数字化设备(如图像扫描仪)将要处 理的连续图像转换成适于计算机处理的数字图像。 3.2 数字图像存储模块:用于图像
4、处理和分析的数字图像存储器可分为三类:处理和分析过程中使用的快速存储器;在线或联机存储器;不经常使用的数据库(档案库)存储器。如计算机内存、硬盘、软盘、闪存盘、 CD光盘、 DVD光盘等。 3.3 数字图像输出模块:在图像分析、识别和理解中,一般需要将处理前后的图像显示出来,或将处理结果永久保存。前者称为软拷贝或显示,使用设备包括 CRT显示器、液晶显示器和投影仪等。后者称为硬拷贝,使用设备包括照相机、激光拷贝和打印机等。 3.4 数字图像通信模块:对图像数据进行传输和通信。由于图像数据量很大,而能提供通信课程名称 数字图像处理 任课老师 刘金硕 姓名 邱远军 学号 2008202110007
5、 武汉大学计算机学院研究生课程论文 第 2 页 共 5 页 的信道传输率又有限,因此传输前必须对表示图像信息的数据进行压缩编码,以减少图像数据量。 3.5 数字图像处理与分析模块:数字图像处理与分析模块:包括处理算法、实现软件和计算机,一般包括下面三种形式: 3.5.1 通用图像处理:适用于功能要求灵活,图像数据量大,但实时性要求不高的图像处理与分析算法,也可辅之于方便灵活的操作界面。 3.5.2 专用图像处理系统:对于象 CT、核磁共振、彩色 B超、机场安检等专用影像处理,可采用能满足实际应 用的专用计算机和专用图像处理算法等,来构成专用图像处理系统。 3.5.3 图像处理芯片:将许多图像处
6、理功能集成在一个很小的芯片上,形成专用或通用的图像处理芯片。 图 2 数字 图像处理系统的构成 4 数字图像处理介绍 数字图像处理( Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于 20世纪 50年 代,作为一门学科大约形成于 20世纪 60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象 ,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室( J
7、PL)。他们对航天探测器徘徊 7号在 1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡 的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。 数字图像处理取得的另一个巨大成就是在医学上获得的成果。 1972年英国 EMI公司工程师 Hou
8、sfield发明了用于头颅诊断的 X射线计算机断层摄影装置,也就是我们通常所说的 CT( Computer Tomograph)。 CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。 1975年 EMI公司又成功研制出全身用的 CT装 置,获得了人体各个部位鲜明清晰的断层图像。 1979年,这项无课程名称 数字图像处理 任课老师 刘金硕 姓名 邱远军 学号 2008202110007 武汉大学计算机学院研究生课程论文 第 3 页 共 5 页 损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开
9、拓性成就,属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。 随着图像处理技术的深入发展, 70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类 似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是 70年代末 MIT的 Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解
10、虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。 5 数字图像处理主要的应用 数字图像处理主要的应用包括以下方面: 5.1 图像变 换:图像处理的方法可以分为两大类:空域法和频域法,其中频域法也成为变换域法。在频域法中最关键的预处理就是图像变换。这种变化一般是线性变换,其基本线性运算是严格可逆的,并且满足一定的正交条件,因此也称为酉变换。常用的图像变换有傅立叶变换、 DCT 变换、小波变换等。 5.2 图像增强:用以改善供人观看的图像的主观质量,而不一定追究图像降质的原因。
11、直方图修正、强化图像轮廓等都是常用手段。由于接受者是人,所以质量好坏就受观看者的心理、爱好、文化素质等因素的影响,评判只能是相对的。 5.3 图像复原(也叫图像恢复) :找出图像降质的起因,并尽可能消除它,使图像恢复本来面目。常用的恢复有纠正几何失真、从已知图像信号和噪声的统计特性入手,用 Wiener 滤波等方法来改善信噪比。 5.4 图像编码:二维数字图像中存在很大的冗余信息。根据 shannon 理论,可以对图像进行一定方式的编码,删除其中冗余信息而实现不失真压缩,或在容许失真限度内进行有失真压缩,以换取更大压缩率。 5.5 图像分割:使计算机能够按照灰度、颜色或几何性质等客观测度,把物
12、体或区域从图像中加以分离,称之为图像分割。 5.6 图像配准:图像配准可以近似地看成 匹配的过程。简单的说,就是根据图像的某些区域或者特征,在另一幅图像中找到对应的区域或者特征。图像配准在图像识别、图像拼接、三维图像的重建等方面有着重要的应用。 5.7 图像分析和特征提取:图像分析可看作是一个描述过程,主要研究用自动或半自动装置和系统,从图像中提取有用的测度、数据或信息,生成非图像的描述或者表示。其内容可分为特征提取、符号描述、目标检测、景物匹配和识别等几个部分。 5.8 目标和运动检测:目标检测在监控系统、控制系统、仿真系统以及识别系统中都扮演着重要角色。按照有无人的参与,目标检 测可分为自
13、动目标检测和交互目标检测。 5.9 形状描述:对于已经从图像中分离出来的区域或物体边界,用适当的数学语言(如图论、句法、形态学等)来表示其统计或者区域之间的关系,称为描述。如果只对物体的形状感兴趣,并对形状进行描述,则称为形状描述。 5.10 图像识别:常用的识别方法包括模板匹配、统计识别等方法,但由于对人的视觉机理至今研究的仍然不够完善,目前所能识别的对象是相对简单的。 6 数字图像处理的一般步骤和方法 6.1 数字图像处理的基本步骤 6.1.1 图像信息的获取:采用图象扫描仪等将图象数字化, 即将非数字形式的图像信号通过课程名称 数字图像处理 任课老师 刘金硕 姓名 邱远军 学号 2008
14、202110007 武汉大学计算机学院研究生课程论文 第 4 页 共 5 页 数字化设备转换成数字图像,包括采样和量化。 6.1.2 图像信息的存储:把获取的数字图像、处理过程中的图像信息以及处理结果存储在计算机等数字系统中。 6.1.3 图像信息的处理:即数字图像处理,它是指用数字计算机或数字系统对数字图像进行的各种处理,如图像变换、图像增强、图像恢复、图像分割等。 6.1.4 图像信息的传输:要解决的主要问题是传输信道和数据量的矛盾问题,一方面要改善传输信道,提高传输速率,另外要对传输的图像信息进行压缩编码,以减少描述图像信息的数据量。 6.1.5 图像信息 的输出和显示:用可视的方法进行
15、输出和显示。 6.1.6 在数字图像处理中,对特殊的问题需要特殊的解决方法,即解决方法与需要求解的问题密切相关,常常为解决一个问题可能有不同的技术方法,而有时看起来类似的应用问题却需要采用不同的技术手段来解决。所以数字图像处理也是一个不断尝试验证,最后选择最有方法的过程。 6.2 以 Matlab 为例,具体 实现数字图像处理分为以下几个过程: 6.2.1 从矩阵的角度分析图象特征,根据图像特征和系统要求设计整个系统的处理流程。 6.2.2 根据系统设计的具体情况,确定最佳图像压缩 方案 。 6.2.3. 利用 M 语言建立图像处理算法,构建数学行为模型,通过数学计算, 验证 该算法的准确性,
16、看看是否符合系统设计指标,不断地完善这个模型,直到它的结果能够最接近系统设计要求为止。 6.2.4. 根据数学模型,在 Simulink 选择相应的模拟硬件电路近可能的实现这个模型的运算过程。注意:选择模拟硬件电路需要考虑系统的稳定性,实时性。注意实际过程中的误差和缺陷,尽可能的避免因为系统缺陷而带来的冗余计算。 6.2.5. 确定 图像预处理方案,根据要求建立并进行预处理的行为仿真和行为,利用编译 软件对该模型进行底层硬件的描述,在软件中实现图像预处理。 6.2.6.系统软件调试,这个过程在软件中进行, 参照需要达到的目标,不断优化,最后选择一种最优的处理方法 。 在 确定 了 输入输出达到
17、最终的设计指标 后 ,再连接到硬件电路中进行总体调试 。 当然上面的步骤,在具体的应用中并不是每一步都需要,根据具体情况可以灵活选择。 7 作业技术报告 下面以 数字图像处理 2008 年作业 中的题目为例具体分析一下数字图像处理的 过程 。 题目 1. 处理给定的图像,将右下角的图像除掉。 分析:方法 1. 可以大致确定右下角的图像(不完整细胞)的位置,将这个区域里面所有像素的灰度值置零。 方法 2. 确定右下角的图像(不完整细胞)的位置,把临近区域的像素的灰度值赋给这个区域里面所有对应的像素。 评价:方法 2 里被处理区域与临近区域的过度要平滑一些,因而方法 2 略优于方法 1。 题目 2
18、. 请利用不同的线性的空域和频域算法做图像增强(噪声消除)。 分析:在空域算法中分别使用拉普拉斯滤波进行图 像增强,使用均值滤波进行图像增强处理,均值滤波进行图像增强处理效果要好些。 在频域算法中使用 sym4 小波滤波进行图像增强,效果较好。 评价:由此可见,图像增强可以使用不同的线性的空域和频域算法,但是要不断比较,直到选出最优方案。 课程名称 数字图像处理 任课老师 刘金硕 姓名 邱远军 学号 2008202110007 武汉大学计算机学院研究生课程论文 第 5 页 共 5 页 题目 3. 请利用非线性的形态学的方法做图像增强(噪声消除)。 分析:做图像增强的形态学的方法有开运算,可以平
19、滑图像的轮廓, 削 弱狭窄的部分,去掉细的突出,但是在这里实现 的 不很理想;这里首先生成背景图像,然后从原始图像中减去背景图像,再使用膨胀操作进行处理,效果较好。 题目 4. 分 割(提取)细胞图像的外边缘,和细胞核的边缘。 分析:分割(提取)细胞图像的外边缘较容易做到,可以使用不同的 边缘检测 算法,如sobel、 log、 canny 等。 分割(提取)细胞核的边缘:在第五题得到了细胞荚膜的基础上,用整个图像减去细胞荚膜的图像,就得到了细胞核的图像,然后使用边缘检测算法即可得到细胞核的边缘。 题目 5. 分割(提取)细胞的荚膜。 处理方法:通过设定一个阈值,把背景图像置成黑色。然后再设定
20、一个阈值,把细胞核的图像也置成黑色(因为细胞核图像的灰度值要小于细胞荚膜的灰度值),从而分割(提取)出细胞的荚膜。 题目 6. 计算细胞的细胞核和整个细胞半径。 分析:计算细胞核的半径: 在第 4 题中可以得到细胞核的图像, 但是直接对其进行处理效果不好,因为噪声比较多,需要先进行滤波增强,这里使用均匀滤波和开操作,最后 只需要对 增强后的 细胞核的图像计算半径即可。 6 1 结果 w = Columns 1 through 8 25.0032 23.5342 23.0422 32.7424 19.8030 25.5074 19.4788 17.9834 Columns 9 through 1
21、1 11.8345 17.6979 13.3512 NR = 11 计算整个细胞半径:先把背景与整个细胞区分开来,然后对整个细胞计算半径。 6 2 结果 w = Columns 1 through 8 38.2985 39.5094 32.2527 50.8272 38.5635 46.8379 29.8967 37.8470 Columns 9 through 11 21.9672 28.5906 31.1482 NR = 11 参考文献 1 刘金硕 数字图像处理 2008 年作业 2 章毓晋 图像处理 清华大学出版社 2006: 1 22 页 3 阮秋琦 数字图像处理学 电子工业出版社 2007: 2 30 页 4 Daniel P. Bovet & Marco Cesati. Understanding the Linux KernelM. OReilly, 2001.