1、 本科 毕业 设计 (论文 ) (二零 届) 模糊图像识别建模与实现 所在学院 专业班级 计算机科学与技术 学生姓名 学号 指导教师 职称 完成日期 年 月 - 2 - 摘要 : 随着 模式识别与 人工智能的发展 , 模式识别技术被越来越多的用 在各个相关领域,图像处理中也有非常广泛的应用。通过利用图像的特征提取算法提取特征对机器学习算法进行训练,并利用训练结果进行预测新的图像对象,例如人脸识别。 本文主要分为四章,第一章介绍图像处理的相关内容,第二章介绍图像判定的知识,包括图像特征的提取, svm介绍,系统环境的搭建等,第三章运用介绍的相关知识进行图像分类实验,第四章实验总结。 关键词 :
2、模式识别;人工智能;机器学习; svm - 3 - Modeling and Implementation of Fuzzy Image Recognition Abstract: With the development of pattern recognition and artificial intelligence, pattern recognition technology is more and more used in various related fields, image processing, also has a very wide range of applicat
3、ions. Through the use of image feature extraction algorithm to extract features for training the machine learning algorithm, and use the training results to predict the new image object, such as face recognition. This paper is divided into four chapters, the first chapter is devoted to image process
4、ing-related content, the second chapter describes the image to determine the knowledge, including image feature extraction, svm is introduced, the system structures, such as the environment, the third chapter describes the use of images related to knowledge Classification, Chapter IV Experiment summ
5、ary. Key words: Pattern recognition; artificial intelligence; machine learning; svm - 4 - 目录 第一章 绪论 . 1 1.1 数字图像处理发 展概况 . 1 1.2 数字图像处理研究的内容 . 1 1.3 数字图像处理的基本特点 . 1 1.4 数字图像清晰度判定技术的发展概况 . 2 1.5 本文的主要研究工作 . 3 第二章 模糊图像判定相关知识 . 4 2.1 图像清晰度判定的概念 . 4 2.2 图像基本特征提取方法 . 4 2.3 SVM算法 . 5 2.3.1 svm介绍 . 5 2.3.2
6、线性分类器 . 6 2.3.3 核函数 . 9 2.3.4 松弛变量 . 11 2.4 MATLAB 平台及其开发环境 . 14 2.4.1 MATLAB . 14 2.4.2 SVM工具箱 . 14 第三章 图像清晰度判定算法研究 . 16 3.1 SVM算法训练 . 16 3.1.1 组建特征向量 . 16 3.1.2 运用训练库进行训练 . 16 3.1.3 读取预估数据的输入,进行数据预处理并进行模型的预测 . 16 3.2 判定图片以及结果显示 . 16 3.2.1 测试图片 . 16 3.2.2 测试数据向量输入 . 17 3.2.3 测试结果输出 . 17 3.3 实验小结 .
7、19 - 5 - 第四章 总结 . 20 4.1 图像特征提取算法的分析 . 20 4.2 SVM算法的分析 . 20 致 谢 . 错误 !未定义书签。 参考文献 . 22 1 第一章 绪论 1.1 数字图像处理发展概况 数字图像处理( Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于 20世纪 50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图 形和图像信息。图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工
8、业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。 随着图像处理技术的深入发展,从 70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。 70年代末 MIT的 Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较 难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。 1.2 数字图像处理研究的内容 数字图像处理主要研究的内容有以下几个方面:( 1)
9、 图像变换。由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。( 2) 图像编码压缩。图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。( 3) 图像增强和复原。图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降 质的原因,突出图像中所感兴趣的部分。( 4) 图像分割。图像分割是数字图像处理中的关键技术之一。( 5) 图像描述。图像描述是图像识别和理解的必要前提。( 6) 图像分类(识别)。图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分
10、割和特征提取,从而进行判决分类 2。 1.3 数字图像处理的基本特点 数字图像处理要抓住图像的特点,也就是要了解图像的信息(与其他东西不同的特征)。( 1) 目前,数字图像处理的信息大多是二维信息,处理信息量很大。( 2)数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。( 3)数字图像中各个像素是不独立的,其相关性大。( 4)由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映2 不出来的。( 5)数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大 3。 1.4 数字图像清晰度判
11、定技术的发展概况 数字图像的清晰度判定主要用到识别模式理论。 模式识别 (Pattern Recognition)是指对表征事物或现象的各种形式的 (数值的、 文字的和逻辑关系的 )信息进行处理和分析 ,以对事物或现象进行描述、辨认、分类和解释的过程 (本文中是指图片信息) ,是信息科学和人工智能的重要组成部分 4。模式识别又常称作模式分类 (在这里是模糊图片与清晰图片要进行分类) ,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类( Supervised Classification)和无监督的分类 (Unsupervised Classification)两种。二者的主要差
12、别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类 别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要。 识别模式的技术有很多,在图像清晰度判定中主要用到统计识别模式,统计模式识别( statistical approach of pattern recognition)是对模式的统计分类方法,把模式类看成是用某个随机向量实现的集合。又称决策理论识别方法。 统计模式识别( statistic pattern recognition)的基本原理是 5:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”(即把清晰的
13、图 像归为一类,把模糊的图像归为另一类)。其分析方法是根据模式所测得的特征向量 Xi=(xi1,xi2, ,xid) T(i=1,2, ,N),将一个给定的模式归入 C个类 1, 2, , c中,然后根据模式之间的距离函数来判别分类。其中, T表示转置; N为样本点数; d为样本特征数。 统计模式识别的主要方法有:判别函数法,近邻分类法,非线性映射法,特征分析法,主因子分析法等。在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。 BP神经网络直接从观测数据 (训练样本 )学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种
14、启发式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论 VC理论的建立,该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新的学习方法 支持向量机( SVM) 6。 统计模式识别系统框图: 3 图 1-1 统计模式识别系统框图 1.5 本文的主要研究工作 根据统计模式识别系统框图,本文主要是研究分类器和学习这两块。但在之前需了解图像特征的提取,因为特征选取好坏 ,直接影响到分类效果。因为图像信息丰富,对它的特征提取异常困难,一般应满足平移、旋转和尺度不变性。图像特征的表达方式有很多,主要从图像中所包含的颜色信息、边缘
15、信息、形状信息、纹理信息和结构相似度等方面加以提取。它的这些因素(特征)决定。因此需要组成一个特征向量,而特征向量中各个特征的选取直接关系到分类效果。本文主要用支持向量机( SVM)进行学习,在学习过程中还需考虑用什么样的分类器才能对图像模糊与清晰能够进行较好的分类。 4 第二章 模糊图像判定相关知识 2.1 图像清晰度判定的概念 图像清晰度的判定要 了解图像清晰与模糊是如何区分的,图像在摄取、传输、存储和处理过程中,不可避免地要引起某些失真而使图像退化。图像退化的典型表现为图像模糊、失真和有噪声等。造成图像退化的原因有很多,如:( 1)成像系统的相差、畸变和有线带宽等造成的图像失真。( 2)
16、涉嫌辐射和大气湍流等造成的照片畸变。( 3)携带遥感的飞机或卫星的不稳定,及地球自转等因素引起的照片几何失真。( 4)模拟图像在数字化得过程中,由于会损失掉部分细节,因而造成图像质量下降。( 5)拍摄时,相机与景物之间的相对运动产生的运动模糊。( 6)镜头焦距焦不准产生的散焦模 糊。( 7)底片感光、图像显示时会造成记录显示失真。( 8)成像系统中存在的噪声干扰。( 9)在拍摄图像的时候,摄像机发生移动,或者因为常见的曝光时间短,导致降低了光子的捕捉量。( 10)共焦显微镜的分散光线失真 6。然后运用相关的特征提取算法,提取图像的特征,将模糊图像与清晰图像的特征进行对比,如果该特征对某类模糊图
17、像有效(模糊图像的特征与清晰图像的特征有区分度)则采用,否则弃用。 虽然用肉眼可以很简单的去判断图像的清晰度,但是对于机器(计算机)却很难。造成图像模糊的因素有很多,对于一未知幅图像(不知道是由于何 种因素导致其模糊)进行清晰度的判断需要考虑到造成其模糊的各个因素的综合。因此要组成特征向量(能造成图像模糊的各个特征的组合) 7。 2.2 图像基本特征提取方法 直方图特征提取 在实际应用中,经常会遇到离散数据,当需要比较数据、分析数据在总和中的比例是,直方图就是一种理想的选择。 对彩色图像进行 rgb分类 ,通过计算每个像素对颜色聚类中心的隶属度构造颜色直方图 ,将得到的模糊颜色直方图 进行归一
18、化操作, 作为表示彩色图像的特征向量进行图像 模糊判定 实验 8。 梯度特征的提取 梯度处理经常用于工业检测、辅助人工检 测缺陷,或者是更为通用的自动检测的预处理。计算图像的梯度要基于在每个像素位置都得到了偏导数和,然后根据梯度向量(向量在坐标处的最大变化率方向)联合使用。著名的梯度算子有 Roberts梯度算子、 Prewitt梯度算子、Sobel梯度算子、 Canny梯度算子等等 8。 边缘特征的提取 5 图像边缘检测技术是图像预处理技术之一 ,边缘作为图像的一种基本特征 ,经常被应用到较高层次的图像应用中去。它在图像识别、图像分割、图像增强以及图像压缩等领域中有着较为广泛的应用。边缘检测
19、质量的好坏直接影响后续图像处理的效果 ,甚至决定 其成败 ,因此 ,边缘检测的作用至关重要。图像边缘检测的方法多种多样。本文主要介绍三种检测方法。传统的边缘检测方法是通过一些差分算子 ,由图像的亮度计算其梯度的变化 ,从而检测出边缘 ,主要有 Roberts、 Sobel、 Prewitt、 LOG等算子 ,它们的优点是算法简单、成熟 ,有现成的程序代码 ,计算量小 ,速度较快。缺点是对噪声的干扰都比较敏感 ,对模糊图像中的边缘检测效果不是很理想。在实际图像处理问题中 ,图像一般都混有噪声 ,边缘提取是模糊的。 因此经过边缘特征提取后模糊图像和清晰图像的区分是明显的。 无参考结构相似度特征 客
20、观图像质量评价方法可以分为三类 :全参考、部分参考和无参考。前两类方法需要原始图像或者原始图像某些特征的集合作为参考来与失真图像比较 ,但是在很多应用场合 ,原始图像是无法获取的 ,所以研究无参考的图像质量评价方法至关重要。 清晰的图像比模糊图像含有更丰富的细节信息 ,即高频分量 ,故可以通过衡量图像包含高频信息的多少来评价图像清晰度。在当前的大多数自动调焦系统中 ,也都是通过计算图像高频分量的多少(例如梯度平方和、 能量熵函数)来进行调焦判断。但是调焦函数的输出范围是无界的,不能用于评价图像清晰度。结合光学系 统成像模型,我们提出了一种评价高频分量多少的方法 NRSS:对原始图像 (由于没有
21、参考图像,原始图像本身即为待评价图像 )进行低通滤波得到一幅参考图像 ,计算参考图像与待评价图像的结构相似度。显然,清晰图像由于包含大量高频信息,故经过低通滤波器之后损失成分多,得到的结构相似度就小,模糊图像刚好相反。这种方法很好地结合了成像系统的数学模型和 SSIM 评价方法的优点 9。 2.3 SVM 算法 2.3.1 svm 介绍 支持向量机 (Support Vector Machine)是 Cortes和 Vapnik于 1995年首 先提出的 10,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)。具体实现理论如下: