1、1 目录 摘要 3 Abstract4 第 1 章 绪论 .5 1.1 自动识别课题背景5 1.2 机器视觉5 1.2.1 机器视觉的发展概况 5 1.2.2 机器视觉与图像处理 7 1.3 图像处理与识别技术9 1.4 图像处理与识别系统10 1.4.1 关于计算机图像处理系统 10 1.4.2 图像处理与识别系统的构成 11 1.5 斑马线自动识别系统课题研究内容12 第 2 章 图像处理与识别及图像理解 14 2.1 二值图像分析14 2.1.1 阈值运算 15 2.2 图像区域分析17 2.2.1 区域与边缘 17 2.3 图像处理与识别及图像理解所研究的内容19 2.3.1 图像处理
2、技术 19 2.3.2 图像识别技术 20 2.3.3 图像理解 21 2.4 图像处理与识别及图像理解的关系24 2.4.1 图像处理 24 2.4.2 图像理解 25 2.5 图像处理工具 MATLAB26 第三章 斑马线自动识别系统主要算法 .28 3.1 边缘检测28 3.2 坎尼(Canny)算子 29 3.3 模板匹配算法32 第 4 章 基于 matlab 的斑马线自动识别系统 35 4.1 系统结构流图35 4.2 系统功能模块分析与实现36 2 4.2.1 图像分割模块 36 4.2.2 模板读取模块 40 4.2.3 图像识别模块 40 4.3 GUI 界面设计及系统测试
3、42 结论 .45 致谢 .47 参考文献 .48 3 摘要 机器视觉也称图像分析与理解。机器视觉的发展推动智能系统的 发展,也拓宽计算机与各种智能机器的研究范围和应用领域。 图像处理与识别技术是机器视觉的一个重要组成部分。图像处理 与识别技术的发展经历了初创期,发展期,普及期,和实用期4个阶 段。20世纪90年代是图像技术的实用化时期,特点就是图像处理的信 息量巨大,对处理速度的要求极高。 人行道路的斑马线自动识别系统的课题设计,以一幅交通道路识 别为例,具体介绍了斑马线自动识别的原理。整个处理过程分为图像 预处理、图像边缘提取、图像定位、图像分割、图像识别五大模块, 用MATLAB软件编程
4、来实现每一个部分,最后识别出人行道路图像。在 研究的同时对其中出现的问题进行了具体分析。 关键词:机器视觉 图像处理 自动识别 预处理 边缘提取 图像定位 图像分割 图像识别 4 Abstract Machine vision is also Image analysis and understanding.The development of machine vision promote the progress of Intelligent system ,and also widen the research and application field of computer and e
5、very intelligent machine. Technology of image processing and recognition is the important component of machine vision. The progress of image processing and recognition have four phases that is initial period development period universal period and practical period.The practical period of image techn
6、ology is 1990s 20th century.The features is that the information of image processing too big,and so that,its processing speed must be fast. The course of traffic sign automatism recognition system,with one traffic sign recognition, the principle of the traffic sign recognition is introduced concrete
7、ly .This process was divided into image pre-process, image edge extraction, image location, image division and image recognition, which is implemented separated by using MATLAB. The traffic sign image is recognized at last. At the same time, the problems are also analyzed .And solved in the process.
8、 5 Keywords: Machine vision image processing automatism recognition pre-process edge extraction image location image division image recognition 第 1 章 绪论 1.1 自动识别课题背景 人类在征服自然、改造自然和推动社会进步的过程中,面临着自 身能力、能量的局限性,因而发明和创造了许多机器来辅助或代替人 类完成任务智能机器,包括智能机器人,是这种机器最理想的形式, 也是人类科学研究中所面临的最大挑战之一智能机器是指这样一种 系统,它能模拟人类的功能,
9、能感知外部世界并有效地解决人所能解 决问题人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感 觉器官,其中约 80%的信息是由视觉获取的因此,对于智能机器来说, 赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成 了一门新的学科机器视觉(也称机器视觉或图像分析与理解等)机 器视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各 种智能机器的研究范围和应用领域。 1.2 机器视觉 1.2.1 机器视觉的发展概况 70 年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设 “机器视觉”( Machine Vision)课程,由国际著名学者 6 BKP Horn 教授讲授
10、同时,MIT AI 实验室吸引了国际上许多 知名学者参与机器视觉的理论、算法、系统设计的研究,David Marr 教授就是其中的一位他于 1973 年应邀在 MIT AI 实验室领导一个以 博士生为主体的研究小组,1977 年提出了不同于积木世界分析方 法的计算视觉理论(computational vision),该理论在 80 年代成为机器 视觉研究领域中的一个十分重要的理论框架 可以说,对机器视觉的全球性研究热潮是从 20 世纪 80 年代开 始的,到了 80 年代中期,机器视觉获得了蓬勃发展,新概念、新方 法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架, 主动视觉理论框架,
11、视觉集成理论框架等 到目前为止,机器视觉仍然是一个非常活跃的研究领域许多会 议论文集都反应了该领域的最新进展,比如,International Conference on Computer Vision and Pattern Recognition(CVPR); International Conference on Computer Vision(ICCV); International Conference on Pattern Recognition(ICPR); International Conference on Robotics and Automation(ICRA); Wo
12、rkshop on Computer Vision, and numerous conferences of SPIE还有许多学术期刊也包含了这一领域的最新研究 成果, 如, IEEE Transaction on Pattern Analysis and Machine Intelligence(PAMI); Computer Vision, Graphics, and Image Processing(CVGIP); IEEE Transaction on Image Processing; IEEE Transaction on Systems, Man, and Cybernetics
13、(SMC); Machine Vision and Applications; International Journal on Computer Vision(IJCV); Image and Vision Computing; and Pattern Recognition每年还出版许多研究专集、 学术著作、技术报告,举行专题讨论会等所有这些都是研究机器视 7 觉及其应用的很好信息来源 Marr 的视觉计算理论Marr1982立足于计算机科学,系统地概括 了心理生理学、神经生理学等方面业已取得的所有重要成果,是视觉 研究中迄今为止最为完善的视觉理论Marr 建立的视觉计算理论,使 机器视觉
14、研究有了一个比较明确的体系,并大大推动了机器视觉研究 的发展人们普遍认为,机器视觉这门学科的形成与 Marr 的视觉理 论有着密切的关系事实上,尽管 20 世纪 70 年代初期就有人使用机 器视觉这个名词Binford , 1971,但正是 Marr 70 年代末建立的视觉 理论促使机器视觉这一名词的流行 1.2.2 机器视觉与图像处理 机器视觉相关的学科有许多与机器视觉密切相关的领域及机器 视觉与其它学科的关系如下 图像处理是一个发展比较成熟的领域图像处理技术通常是把一 幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像, 输出仍然是图像,信息恢复任务则留给人来完成图像处理包括图像
15、 增强、图像压缩和模糊校正与非聚焦图像等课题机器视觉系统把图 像作为输入,产生的输出为另一种形式,比如图像中物体轮廓的表 示因此,机器视觉的重点是在人的最小干预下,由计算机自动恢复 场景信息图像处理算法在机器视觉系统的早期阶段起着很大的作用, 它们通常被用来增强特定信息并抑制噪声 计算机图形学是通过几何基元,如线、圆和自由曲面,来生成图 像,它在可视化(Visualization)和虚拟现实(Virtual Reality) 中起着很重要的作用机器视觉正好是解决相反的问题,即从图像中 估计几何基元和其它特征因此,计算机图形学属于图像综合,机器 8 视觉属于图像分析这两个领域在其发展的早期阶段是
16、没有什么联系 的,但是近十几年来发展的越来越相近了机器视觉使用了计算机图 形学中的曲线和曲面表示方法以及其它的一些技术,而计算机图形学 也使用机器视觉技术,以便在计算机中建立逼真的图像模型可视化 和虚拟现实把这两个领域紧密地联系在一起 模式识别主要用于识别各种符号、图画等平面图形 模式一般指 一类事物区别于其它事物所具有的共同特征。模式识别方法主要有统 计方法和句法方法两种,统计方法是指从模式抽取一组特征值,并以 划分特征空间的方法来识别每一个模式。句法方法是指利用一组简单 的子模式(模式基元)通过文法规则来描述复杂的模式。模式识别方 法是机器视觉识别物体的重要基础之一机器视觉识别物体还经常需
17、 要其它的技术我们将在物体识别部分简要地讨论统计模式识别的主 要内容 人工智能(artificial intelligent, AI)涉及到智能系统的设 计和智能计算的研究在经过图像处理和图像特征提取过程后,接下 来要用人工智能方法对场景特征进行表示,并分析和理解场景人工 智能有三个过程:感知、认知和行动感知把反应现实世界的信息转 换成信号,并表示成符号,认知是对符号进行各种操作,行动则把符 号转换成影响周围环境的信号人工智能的许多技术在机器视觉的各 个方面起着重要作用事实上,机器视觉通常被视为人工智能的一个 分支 人工神经网络(artificial neural networks, ANNs
18、)是一种信 息处理系统,它是由大量简单的处理单元(称为神经元)通过具有强 度的连接(connection)相互联系起来,实现并行分布式处理 9 (parallel distribution processing, PDP) 人工神经网络的最大 特点是可以通过改变连接强度来调整系统,使之适应复杂的环境,实 现类似人的学习、归纳和分类等功能人工神经网络已经在许多工程 技术领域得到了广泛的应用神经网络作为一种方法和机制将用于解 决机器视觉中的许多问题 神经物理学与认知科学长期将人类视觉作为主要的研究对象机 器视觉中已有的许多方法与人类视觉极为相似目前,许多机器视觉 研究者对研究人类视觉计算模型比研究
19、机器视觉系统更感兴趣,希望 机器视觉更加自然化,更加接近生物视觉。 1.3 图像处理与识别技术 图像就是用各种观测系统以不同形式和手段观测客观世界而获得 的,可以直接或间接作用于人眼而产生视知觉的实体。人类从外界获 得的信息约有 75%来自于视角系统,也就是说,人类的大部分信息都 是从图像中获得。 图像处理是人类视觉延伸的重要手段,可以使人们看到任意波长 上所测得的图像。例如,借助伽马相机,X 光机,人们可以看到红外 和超声图像;借助 CT 可看到物体内部的断层图像;借助相应工具可 看到立体图像。1964 年,美国在太空拍回的大量月球照片就是使用了 计算机对图像进行了处理,使原本不清晰的图像信
20、息得以清晰再现。 这是这门技术发展的重要里程碑。此后,图像处理技术在空间研究方 面得到广泛应用。 总体来说,图像处理技术的发展经历了初创期,发展期,普及期, 和实用期 4 个阶段。20 世纪 90 年代是图像技术的实用化时期,图像 处理的信息量巨大,对处理速度的要求极高。 10 图像识别所讨论的问题,是研究用计算机代替人工自动地处理大 量的物理信息,解决人类生理器官所不能识别的问题,从而部分代替 人的脑力劳动。人类识别图像的过程总是先找出它们外形或颜色的某 些特征进行比较分析,判断,然后加以分门别类,即识别它们。人们 在研制自动识别机时也往往借鉴人的思维活动,采用同样的处理方法, 然后图像的灰
21、度与色彩是由光强和波长不同的光波引起,它们与景物 表面的特性,方向,光线条件以及干预等多种因素有关。在各种恶劣 的工作环境中,图像与景物已有较大的差别。因此要区分图像属于哪 一类,往往要经过预处理,分割,特征抽取,分析,分类,识别等一 系列过程。现在这些技术完全可通过计算机进行模拟,对图像信息进 行处理来达到对它的区别。 21 世纪的图像技术要向高质量化方面发展,主要体现在以下几点: 首先高分辨率,高速度,图像处理技术发展的最终目标是要实现图像 的实时处理,这在移动目标的生成,识别和跟踪上有着重要意义;其 次是立体化,立体化所包括的信息最为完整和丰富,数字全息技术将 有利于达到这个目的;再者是
22、智能化,其目的是实现图像的智能生成, 处理,识别和理解。 1.4 图像处理与识别系统 1.4.1 关于计算机图像处理系统 计算机图像处理技术是以计算机为核心的应用技术,因此,计算 机图像处理系统的发展,是随着计算机技术的提高而提高的。从系统 的层次来看,可分为高、中、低 3 个档次;从图像传感器的敏感区域 看,又可分为可见光、红外、近红外、X 射线、雷达、伽玛射线、超 声波等图像处理系统;从采集部件与景物的距离上来说,还可以分成 11 遥感、宏观和微观图像处理系统;就应用场所而言,又能分成通用图 像处理系统和专用图像处理系统。通用图像处理系统一般用于研究开 发,因此,要求传感器敏感区间宽,线性
23、度好;而专用系统一般用于 特殊用途,是在通用系统研究基础上,研制开发的为现实某一个或几 个功能的商用系统。因此,在保证性能的前提下,由价格因素决定系 统的配置。 1、高档图像处理系统采用高速芯片设计,完全适合图像和信号 处理特有规律的并行阵列图像处理机。这类系统采用多 CPU 或多机结 构,可以以并行或流水线方式工作。 2、中档图像处理工作站以小型机或工作站为主控计算机,加上 图像处理器构成。这类系统有较强的交互处理能力,同时,由于用通 用机做主控机,因而在系统环境下,具有较好的再开发能力。 3、抵挡的微机图像处理系统由微机加上图像采集卡构成,其结 构简单,是一种便于普及和推广的图像处理系统,
24、也是本书着重介绍 的系统。 1.4.2 图像处理与识别系统的构成 微机图像处理系统由图像的采集部件、主机和图像的输出部件 3 个部分组成。 1、采集部件。原始的图像数据是通过图像采集部件进入计算机 的,因此,图像采集部件的作用是采集原始的模拟图像数据,并将模 拟信号转换成数字信号。计算机在接收到图像的数字信号后,将其存 入内存。微机图像处理系统常用的图像采集部件有摄像头加上视频图 像采集卡、图像扫描仪以及数码摄像机等。 2、图像处理部件。在微机图像处理系统中,图像处理工作是由 12 微机完成的,微机的扩展槽上插有带帧存储器的采集卡,图像处理的 过程通常包含从帧存储器读取数据到计算机内存、处理内
25、存中的图像 数据和送数据回图像帧存储器 3 个步骤。对于直接使用内存的采集卡, 则只需和内存进行数据交换,计算机的内存越大,CPU 的运算速度越 快,图像处理的速度也越快。 3、识别结果的输出部件。图像的输出是图像处理的最终目的。 从广义的角度来讲,图像的输出形式可以分为两种: 一种是根据图像处理的结果做出判断,例如质量检测中的合格和 不合格,输出不一定以图像肮作为最终形式,而只需做出提示供人或 机器做出选择。这种提示可以是计算机屏幕信息或是电平信号的高低, 这样的输出往往用于成熟研究的应用上。 另一种则是以图像为输出方式,它包括中间过程的监视以及结果图像的输 出。图像输出方式有屏幕输出、打印
26、输出和视频硬拷贝输出。 1.5 斑马线自动识别系统课题研究内容 斑马线识别,最基本的就是对那些斑马线图标图片的识别,即 是对图片的处理和识别,图像格式一般都是 RGB 等。主要是对输入的 原始 RGB 图像进行处理这一过程借用了大量的图像处理技术和算 法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角 点、边缘、线条、边界以及色彩等关于场景的基本特征;这一过程还 包含了各种图像变换(如校正) 、图像纹理检测、图像运动检测等。 对一幅图像进行一系列处理之后,提取出系统要求的感兴趣区域,最 后和之前做好的模板匹配比较,就得出一组相关的比较系数,从这一 组系数中取出一个最大值,就可以识别出
27、图像就是这个值指定的模板。 13 斑马线自动识别系统图像处理与识别包括斑马线图像的预处理, 图像的分割以及图像的匹配识别。处理识别流程如下: 图 1-1 处理识别流程图 输入斑 马线图 像 斑马线图像的边缘 提取、分割 斑马线图像的预处理 (图像变换、增强) 将分割的斑马线图 像进行后期处理 最后将图像进 行匹配识别 14 第 2 章 图像处理与识别及图像理解 2.1 二值图像分析 一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度 值实际上,图像在量化成数字图像前是一个连续强度函数的集合, 场景信息就包含在这些强度值中图像强度通常被量化成 256 个不同 灰度级,对某些应用来说,也常有
28、32、64、128 或 512 个灰度级的情 况,在医疗领域里甚至使用高达 4096(12bits)个灰度级很明显, 灰度级越高,图像质量越好,但所需的内存也越大 在机器视觉研究的早期,由于内存和计算能力非常有限,而且十 分昂贵,因此视觉研究人员把精力主要集中在研究输入图像仅包含两 个灰度值的二值视觉系统上人们注意到,人类视觉在理解仅由两个 灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用 场合很多 随着计算机计算能力的不断增强和计算成本的不断下降,人们普 遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统尽管如 此,二值视觉系统还是十分有用的,其原因如下: 计算二值图像 特性的
29、算法非常简单,容易理解和实现,并且计算速度很快 二 值视觉所需的内存小,对计算设备要求低工作在 256 个灰度级的视 觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八 倍如若利用游程长度编码等技术。还可使所需内存进一步减少由 于二值图像中的许多运算是逻辑运算而不是算术运算,所以所需的处 理时间很短 (3)许多二值视觉系统技术也可以用于灰度图像视觉系 15 统上在灰度或彩色图像中,表示一个目标或物体的一种简易方法就 是使用物体模板(mask),物体模板就是一幅二值图像,其中 1 表示目 标上的点,0 表示其它点在物体从背景中分离出来后,为了进行决 策,还需要求取物体的几何和拓扑特性,这
30、些特性可以从它的二值图 像计算出来因此,尽管我们是在二值图像上讨论这些方法,但它们 的应用并不限于二值图像 一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地 控制时,二值视觉系统是非常有用的当使用特殊的照明技术和背景 并且场景中只有少数物体时,物体可以很容易地从背景中分离出来, 并可得到较好的轮廓,比如,许多工业场合都属于这种情况二值视 觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值 图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和 物体的反射特性二值图像可用来计算特定任务中物体的几何和拓扑 特性,在许多应用中,这种特性对识别物体来说是足够的二值视觉 系统已经
31、在光学字符识别、染色体分析和工业零件的识别中得到了广 泛应用 2.1.1 阈值运算 视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图 像) ,这种对人来说是件非常容易的事,对计算机来说却是令人吃惊 的困难为了将物体区域同图像其它区域分离出来,需要首先对图像 进行分割把图像划分成区域的过程称为分割,即把图像 划分,jiF 成区域 ,使得每一个区域对应一个候选的物体下面给出kp,21 分割的严格定义 定义 分割是把像素聚合成区域的过程,使得: 16 整幅图像 ( 是一个完备分割 )ikP1iP ,( 是一个完备分割)jji,i 每个区域 满足一个谓词,即区域内的所有点有某种共i 同的性
32、质 不同区域的图像,不满足这一谓词 正如上面所表明的,分割满足一个谓词,这一谓词可能是简单的, 如分割灰度图像时用的均匀灰度分布、相同纹理等谓词,但在大多数 应用场合,谓词十分复杂在图像理解过程中,分割是一个非常重要 的步骤 二值图像可以通过适当地分割灰度图像得到如果物体的灰度值 落在某一区间内,并且背景的灰度值在这一区间之外,则可以通过阈 值运算得到物体的二值图像,即把区间内的点置成 1,区间外的点置 成 0对于二值视觉,分割和阈值化是同义的阈值化可以通过软件 来实现,也可以通过硬件直接完成 通过阈值运算是否可以有效地进行图像分割,取决于物体和背景 之间是否有足够的对比度设一幅灰度图像 中物
33、体的灰度分布,jiF 在区间 内,经过阈值运算后的图像为二值图像 ,即:,21T ,jiT 其 它如 果0, 1, 21jiTjiFT 如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示 为: 其 它如 果0, 1,ZjiFjiFT 17 其中 Z 是组成物体各部分灰度值的集合图 31 是对一幅灰度图像 使用不同阈值得到的二值图像输出结果 阈值算法与应用领域密切相关事实上,某一阈值运算常常是为 某一应用专门设计的,在其它应用领域可能无法工作阈值选择常常 是基于在某一应用领域获取的先验知识,因此在某些场合下,前几轮 运算通常采用交互式方式来分析图像,以便确定合适的阈值但是, 在机器视觉系统
34、中,由于视觉系统的自主性能(autonomy)要求,必 须进行自动阈值选择现在已经研究出许多利用图像灰度分布和有关 的物体知识来自动选择适当阈值的技术 2.2 图像区域分析 图像中的区域是指相互连结的具有相似特性的一组像素由于区 域可能对应场景中的物体,因此,区域的检测对于图像解释十分重 要一幅图像可能包含若干个物体,而每一个物体又可能包含对应于 物体不同部位的若干个区域为了精确解释一幅图像,首先要把一幅 图像划分成对应于不同物体或物体不同部位的区域 2.2.1 区域与边缘 图像区域划分有两种方法:一种是基于区域的方法,另一种是使 用边缘检测的轮廓预估方法在基于区域的方法中,把所有对应于一 个
35、物体的像素组合在一起,并进行标记,以表示它们属于一个区域, 这一处理过程称为分割在某一评判标准下,把像素分配给某一区域, 就可以把这些像素同图像其余部分分开图像分割中的两个最基本的 原则是数值相似性和空间接近性如果两个像素具有相似的强度特性, 或它们之间十分靠近,则可以把它们分配到同一区域,例如,两个像 素之间的数值相似性度量可以是它们的灰度值之差,也可以是区域灰 18 度值分布;它们的空间接近性度量可以是欧几里德距离,也可以是区 域致密度 相似性和接近性原则来源于如下假设:同一物体上的点投影到图 像上得到的像素点在空间上十分靠近,且具有相似的灰度值很显然, 这一假设并不是在任何情况下都成立然
36、而可以使用这一假设来组合 图像中的像素,然后利用相关域知识来匹配物体模型和区域在简单 的情况下,可以通过阈值法和连通成份标记法来进行图像分割对于 复杂的图像,可以使用更高级的方法实现图像分割 分割也可以通过求取区域边界上的像素来进行这些像素点(也 称为边缘)可以通过搜寻邻近像素的方法来得到由于边缘像素是在 边界上,在边界两边的区域具有不同的灰度值,这样,区域的边界可 以通过测量邻近像素差值来求取尽管边缘检测可能使用诱导特性 (如纹理和运动)来检测边缘但大多数边缘检测器仅使用强度特性 作为边缘检测的基础 在理想的图像中,一个区域是由一条封闭轮廓线包围着原则上, 区域分割和边缘检测应该产生相同的结
37、果,即使用边界跟踪算法可以 得到区域的边缘(或封闭的轮廓线) ;反过来,使用区域填充算法也 可以得到边缘所包围的区域但在实际的图像中,很少能够从区域中 得到正确的边缘,反之亦然由于噪声和其它因素的影响,不论是区 域分割还是边缘检测,都无法提供完整的信息 2.3 图像处理与识别及图像理解所研究的内容 2.3.1 图像处理技术 1图像数字化 其目的是将模拟形式的数字图像通过数字化设备变为数字计算机 19 可用的离散的图像数据。 2图像变换 为了达到某种目的(通常是从图像中获得某种重要的信息)而对 图像使用一种数学技巧,经过变换后的图像更为方便、容易地处理和 操作。 3图像增强 图像增强的主要目标是
38、改善图像的质量。采用某种特殊的技术来 突出图像中的某些信息,削弱或消除某些无关信息,从而有目的地强 调图像的整体或局部特征。常常用来改善人对图像的视觉效果,让观 察者能看到更加直接、清晰、适于分析的信息。直方图修正、灰度变 换、强化图像轮廓等都是常用的手段。 4图像分割 在图像的研究和应用中,人们往往仅对图像的某些部分感兴趣。 它们一般对应图像中特定的、具有独特性质的区域。图像分割就是把 图像分割成各具特性的区域并提取出感兴趣的目标。 5图像分析 图像分析也可称为图像理解,主要研究从图像中提取有用的数据 或信息,生成非图像的描述或表示。图像分析的内容分为特征提取、 图像分割、符号描述、纹理分析
39、、运动图像分析和图像的检测和配准。 2.3.2 图像识别技术 图像识别是近 20 年来发展起来的一门新型技术科学,它以研究 某些对象或过程的分类与描述为主要内容。 图像识别所研究的领域十分广泛,它可以是医学图像中的癌细胞 20 识别;机械加工中的零部件的识别、分类;可以是从遥感图片中辨别 农作物、森林、湖泊与军事设施;可以是自导引小车中的路径识别; 邮政系统中自动分炼信函;交通管制、识别违章行使的汽车牌照;银 行的支票识别、身份证识别等。上述都是图像识别研究的课题。总得 来说所研究的问题,主要是分类问题。 1图像识别系统的组成 一个图像识别系统主要包括 3 部分:图像信息获取;信息加工和 处理
40、、抽取特征;判断和分类。如图 22 所示。 图 22 图像识别系统框图 2图像识别方法 图像识别的方法较多,大体上可以归纳为两类方法:统计方法 (数学方法)和语言(或结构)学方法,后者亦称句法结构识别方法。 统计方法以数学上决策理论为基础,根据这种理论建立了统计学 识别模型。其基本模型是在对研究的图像进行大量统计分析,找出规 律性认识,抽出反映图像本质特征进行识别。在这种方法中,大量工 作在于如何抽取图像的特征或决定统计参数,即所谓参数法。另外, 还有非参数决策法,如邻近法则,它是一种跳过概率的估计而直接进 被识别图像 图像信息获 取 处理、特征 抽取 识别判断 21 行决策的方法。对于特征抽
41、取,必须把图像的大量原始信息缩减为少 数的特征,例如采用分差分布、特征向量法。对文字、符号等可只抽 取几何图形特征,对声波信号可抽取频普特征。为了抽取特征,有时 要对原始图像信息进行各种变换,空间投影,把多维的图像点简化到 几个坐标分量上。 句法结构识别法立足于分析图像的结构,一幅图像可以模仿语言 构造,用一些语句来表达。语句的结构是由词、短语等组成,并按照 一定的语法表达出来。也就是说,语句由短语组成,而短语由单词组 成,其中最基本的元素就是单词。那么一些语句又怎么样和图像发生 联系呢?这可从图像的形成说起,任何一幅图像,总是由一些点、直 线、斜线、弧线及环组成,分析图像的这些基本元素,看它
42、们按怎样 的规则构成图像,这就是结构分析的课题。这些基本元素就相当于言 句中的单词;那些直线、曲线可看成短语,它们的全体按怎样的规则 构成整个图像,就相当于语法结构。而对图像识别来说,就相当于检 查图像所代表的某一类句型,是否符合事先规定的语法。若语法正确, 则认为识别出结果。 2.3.3 图像理解 图像理解的研究显然要涉及或包含研究获取图像的方法、装置和 具体应用的实现,这就形成了所谓的计算机视觉。 1、传感器引起失真的补偿 人的图像是用灰度的二维阵列表示的,通常由于传感器的特性会 引起几何学上或者光学上的失真,因此需进行补偿。 2、图像特征的提取 图像凡是亮度发生急剧变化的地方,都是对应于
43、不同物体面与面 22 之间的边缘,这是一个重要特征,所以把图像中亮度急剧变化的点提 取出来并对其性质进行描述(如边缘的方向、幅度、直方图等) ,对 这些特征点的统计分布状况进行研究,可认识到物体的构造。如果把 相邻的特征点连接起来则可以构成输入图像的曲线。 3、景物特征的提取 在观看物体时看到的不仅是亮度急剧变化的点,同时还有各个面 的方向、距离、颜色反射率,这些特征与照明的情况和视点的位置无 关,是物体所固有的特征。为了与图像上特征相区别,一般称为景物 特征。 4、景物的分割物体的发现 利用景物的特征,把其性质大致相同的领域分割开来,这与图像 处理中把亮度相同的领域分割出来的领域法相同。 5
44、、物体的识别 从景物所发现的各物体再参照物体的模型来识别物体,与此同时 确定各物体的位置和方向。 6、景物的识别 研究各物体之间的连接关系,由这个连接关系和模型来认识更复 杂的物体,从而可以对景物的全体进行描述。 23 物体的模型 景物的描述 物体的描述 分离的描述 复杂物体的模型 图 2-3 典型的图像理解系统 图像 图像特征提取 景物的特征 图像颜色、形状、纹理 传感器的模型 景物 关于景物的先验知识 特征描述的一致性 24 2.4 图像处理与识别及图像理解的关系 在研究图像理解时,往往要进行图像的处理、识别及图像理解的 过程,三者关系非常密切,互相交错。 2.4.1 图像处理 在研究图像
45、首先要对获得的图像进行预处理以滤去影响的因素, 作为几何、彩色校正等。这样可提高信噪比:有时由于信息微弱,无 法辨识,还得进行增强处理。并且为了从图像中找到需要识别的东西, 还得对图像进行分割,也就是进行定位和分离,以分出不同的物体。 为了给观察者以清晰的图像,还要对图像进 行改善,即进行复原处理,它是把已经退化了的图像加以重建或恢复 的过程,以便改进图像的保真度。在实际处理中,由于图像信息量非 常大,在存储及传送中,还要对图像进行压缩。 上述工作必须用计算机来完成,因而要进行编码等工作。之前等 等都是图像处理的工作,因此,图像处理包括图像增强,图像编码, 图像压缩,图像复原,图像分割等。输入的是图像,输出的也是图像, 过程如下所示: 图像输入 图像输出 2-4 图像处理示意图 图像处理 (编码、压缩、增强、 分割、复原) 25 图像识别是在上述分割后的每个部分中,找出它的形状及纹理等 特征,即特征抽取(有时也包括图像分割) ,以便对图像进行分类并 对整个图像作结构上的分析。所以,对图像识别来说,输入的是图像, 输出的是类别和图像的结构分析,如下图所示: 图像 类别 结构分析 2-5 图像识