1、河北大学 2012 届本科生毕业论文(设计)基于内容的图像检索方法的研究摘 要近年来,随着多媒体技术和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生。其中,颜色特征作为图像的一种重要的视觉特征,已得到广泛的应用。本文主要研究基于图像颜色特征的检索。选用基于颜色直方图的算法,并利用 Visual Basi
2、c 程序设计语言和 Access数据库技术设计实现了基于颜色直方图算法的图像检索系统。主要做法是:采用符合人类视觉特征的 HSV 颜色空间来表示图像的颜色特征,利用人对颜色的感知来对颜色分量进行非等间隔的量化并形成特征矢量,用相似性度量函数进行图像的相似性匹配,从而实现图像的检索。关键字:图像数据库;CBIR;颜色直方图;相似距离河北大学 2012 届本科生毕业论文(设计)The Research of Content-based Image Retrieval MethodABSTRACTWith the rapid development of multimedia and compute
3、r network technique, the quantity of digital image and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information. Currently, rapid and effective searching for desired image from large-scale image databases becomes an
4、 hot research topic. In order to retrieve image quickly and accurately using image visual features such as color, texture, shape, which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This p
5、aper studies the retrieval based on image color characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design to implement the image retrieval system based on color histogram algorithm. The main approach is: to represent the images co
6、lor characteristics consistent with human visual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.Key words: I
7、mage database; CBIR; Color histogram; Similarity distance河北大学 2012 届本科生毕业论文(设计)目 录 前言 .11.1 课题背景及研究意义 .11.2 基于内容的图像检索技术研究的现状和发展方向 .11.3 本文主要研究内容 .22 基于内容的图像检索 .32.1 概念 .32.2 特点 .32.3 CBIR 过程的一般框架 .33 图像特征提取与相似性度量 .53.1 图像的文件格式 .53.2 颜色模型 .63.2.1 RGB 颜色空间 .63.2.2 HSV 颜色空间 .73.2.3 RGB 颜色空间到 HSV 颜色空间的转
8、换 .73.3 颜色量化 .83.4 颜色直方图 .83.5 基于子块颜色直方图算法 .93.6 图像的相似性度量 .103.6.1 图像的相似度 .103.6.2 相似度计算公式 .10河北大学 2012 届本科生毕业论文(设计)4 基于颜色特征的图像检索系统设计和实现 .124.1 系统结构设计 .124.2 图像特征数据库设计 .124.3 系统开发环境 .124.4 系统流程 .134.5 系统的实现 .134.5.1 图像的获取 .134.5.2 图像特征的提取 .144.5.3 图像的检索 .165 总结 .18参考文献 .19致谢 .20河北大学 2012 届本科生毕业论文(设计
9、)1 前言1.1 课题背景及研究意义近年来,伴随着计算机网络技术和多媒体数据库技术的迅猛发展,特别是大量图像数据的广泛应用,实现图像检索成为多媒体数据库中最基本也是最普遍的要求。传统的图像检索是基于文本方式,对图像库中的每一幅图像使用关键字进行标记,然后利用文字属性的匹配进行对图像的检索。这种基于文本的图像检索需要人工注解的工作量很大,且文本描述很难准确的表达图像中丰富的信息,常常会因为不同人对同一内容的描述方式不同而千差万别,造成检索的准确程度降低。在信息需求的不断增加和日益迫切的今天,原始的图像检索系统已经远远不能满足要求。因此,基于内容的图像检索技术的研究越来越成为人们研究的热点。特别是
10、多媒体内容描述接口 MPEG-71的制定和完善,更加推动了这一技术的开发和运用。基于内容的图像检索技术对促进图像技术的发展具有重要的作用。首先,在检索图像的准确度上,基于内容的图像检索技术把图像的颜色、形状、纹理等视觉特征作为图像的内容来查找和匹配图像,通过算法实现图像特征的提取和图像间的相似性匹配,提高了检索结果的准确性。其次,随着数据库技术研究的深入、计算机视觉以及人工智能的发展,我们可以对图像的这些特征进行自动的提取和匹配,大大减少了人工的工作量,从而在提高检索准确度的同时,降低了图像检索所需要的时间。目前,这项技术已经广泛应用于图像的网络搜索、遥感、数字图书馆、计算机辅助设计、地理信息
11、系统、商标版权管理等诸多领域,具有广阔的应用前景。1.2 基于内容的图像检索技术研究的现状和发展方向目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。一些科研部门、高等院校、商业公司甚至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。目前已经推出了一些 CBIR 系统的产品,如美国的 IBM 公司、Virage 和 Excalibur 都已经开发出了的基于图像内容的相似性特征
12、的图像库检索引擎,并在网上提供了演示站点。国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。自 20 世纪 90 年代以来,基于内容的图像检索成为一个研究热点。目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现 MPEG 的全名为 Moving Pictures Experts Group,中文译名是动态图像专家组。河北大学 2012 届本科生毕业论文(设计)2对遥感图像的检索。基于内容的图像检索技术研究的发展方向主要有:(1)两类图像检索技术的结合传统
13、的图像搜索引擎主要侧重于对图像内容的文本描述,而图像库检索技术则更侧重于通过算法对图像内容的特征的提取和匹配,它们虽然侧重不同却相互补充。如果能将二者结合起来,取长补短,则图像检索技术必将会有新的进展。(2)对基于内容的编码技术的研究自20世纪90年代起,国际上就有了对基于内容的图像检索技术的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,推出了大量原型系统。其中,部分已经投入到实际应用中并取得良好效果。在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-7标准,对各种不同类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与TBIR(基
14、于图像文本特征的检索)的互连。总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。1.3 本文主要研究内容本文在介绍基于颜色特征的图像检索技术的基础上,将颜色直方图作为研究重点,对 CBIR 技术进行了较为全面的研究,以多媒体图像数据库为平台,将 CBIR 作为一种信息检索技术,应用到图像数据库中,作为检索引擎来实现基于颜色特征的图像检索功能。(1)详细讨论了常见的颜色特征表示方法以及从 RGB 模型到 HSV 模型的转换和颜色特征的提取方法,采用符合人类视觉感知特征的 HSV 模型来提取颜色特征,并按照人的视觉分辨能力将
15、颜色量化为 36 柄的一维特征向量。(2)运用相似性度量算法,用户可以根据自己的兴趣,针对不同的区域,灵活地调整权重系数,更准确地实现图像颜色特征的匹配。(3)在开发工具上,选用 Visual Basic 6.0 程序设计语言,对图像进行了定义,完成图像特征的读入和提取,用 Access 数据库存放图像的特征索引向量,并通过颜色匹配算法实现基于图像颜色特征的检索功能。河北大学 2012 届本科生毕业论文(设计)32 基于内容的图像检索2.1 概念基于内容的图像检索(CBIR)是指根据图像颜色、纹理、形状等视觉特征,从已定的图像库中查找含有特定特征的图像。与传统的图像检索手段不同,它融合了图像理
16、解技术,在输入图像的同时将其相应的特征向量也存入特征库。在进行图像检索时,对每一幅给定的关键图,进行图像分析,并提取图像的特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据相似距离的大小在图像库中进行搜索就可以得到所需要的检索图了。2.2 特点CBIR 方法利用图像的视觉特性,实现了用图像来检索图像。这比利用传统的文字标注等要有效的多。基于内容的图像检索是根据图像的颜色 、形状、纹理等特征以及这些特征的组合来查询图像的,这是计算机图像处理和数据库技术的很好的结合。它具有以下几个显著的特点 1:(1)用于检索的是反映图像内容的各种量化特征;(2)使用基于相似性度量的近似查询;(3)大
17、多采用实例查询 QBE(Query By Example)方法。对于基于内容的图像检索有三个关键:一是要选取恰当的图像特征;二是要采取有效的特征提取算法;三是要有准确的特征匹配算法。2.3 CBIR 过程的一般框架CBIR 系统可以看作是一个用户和图像数据库之间的一个界面或通道 2,其过程的一般框架可以描述为如图 2-1。图 2-1 基于内容的图像检索各模块的作用:(1)查询模块:为用户提供多样的查询手段,以支持用户进行多种类型的查询;(2)描述模块:将用户查询的外部表达转化成为对图像信息内容的内部表达和描述;(3)匹配模块:将查询描述与库中被查询信息的描述进行匹配,确定它们内容的一致性和相似
18、性;用户界面查询 描述 匹配验证 提取图像库河北大学 2012 届本科生毕业论文(设计)4(4)提取模块:把满足既定条件的信息自动的从库中提取出来;(5)验证模块:为用户提供方便的验证手段以评价提取的效果。目前,很多基于内容的图像检索系统中还包含有用户反馈机制,其主要功能是收集检索出的图像信息,根据用户自己的期望,对搜索到的图像进行粗略的判断,然后修改查询信息并提交给查询模块。河北大学 2012 届本科生毕业论文(设计)53 图像特征提取与相似性度量基于内容的图像检索系统在进行图像检索的过程中,将关键图和被检索的图像进行图像分析,提取出这些图像的特征向量,再将关键图的特征向量和被检索的图像的特
19、征向量进行相似性匹配,根据相似距离检索到期望的图像。由这个工作原理可知,该系统的关键点包括:选取恰当的图像格式,以便提取其有效的颜色特征;选择准确的特征匹配算法,从而实现图像的相似性匹配。因此,如何恰当的提取颜色特征,以及对颜色特征如何进行有效地抽取和匹配也就成为CBIR研究领域的重点。3.1 图像的文件格式本文采用的图像格式是 BMP 格式。BMP 文件是常见的图像文件格式之一,是 Windows 操作系统中的标准文件格式。由于不进行图像压缩,所以 BMP 图像文件能够表达丰富的色彩信息。BMP 图像文件的结构可以分为四个部分:文件头数据结构、文件信息数据结构、调色板以及图像数据。其中,文件
20、头的长度为固定值 54 个字节;调色板数据对所有的不超过 256 色的图像模式都需要进行设置,即使是单色图像模式也不例外;图像数据既可以采用一定的压缩算法进行处理,也可以不必对图像处理软件进行压缩处理,这不仅与图像文件的大小有关,而且也与对应的图像处理软件是否支持经过压缩处理的 BMP 图像文件相关 3。图像文件的文件头和文件信息头的定义形式如下:(1)文件头(BITMAPFILEHEADER)Public Type bitmapfileheaderbftype As Integerbfsize As Longbfreserved1 As Integerbfreserved2 As Integ
21、erbfofbits As LongEnd Type该程序中定义了 BMP 文件的类型、大小,以及图像数据的偏移量,即从文件头开始多少个字节后是图像数据的起始。(2)文件信息头(BITMAPINFOHEADER)Public Type bitmapinfoheaderbisize As Longbiwidth As Longbiheight As Longbiplanes As Integer河北大学 2012 届本科生毕业论文(设计)6bibitcount As Integerbicompress As Longbisizeimage As Longbixpelspermeter As Lo
22、ngbiypelspermeter As Longbicirused As LongBMP 文件信息头基本上包含图像的所有重要的信息,包括宽度、高度和每像素的位数。3.2 颜色模型所谓颜色模型 2是指某个三维颜色空间中的一个可见光子集,包括某个颜色域的所有颜色。常见的颜色模型包括RGB(红、绿、蓝) ,HSV(色调、饱和度、亮度) ,CMYK(青、洋红、黄、黑)等。其中,HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。3.2.1 RGB 颜色空间RGB 颜色空间是一种常用的颜色空间。目前,图像采集系统以及彩色显示器等硬件显示设备大都采用了 RGB 颜色空间来表示颜色。数字图像一般也都采用这一颜色空间来表示。如图 3-1所示,RGB颜色模型是三维直角坐标颜色系统的一个单位正方体。它以红(R)、绿(G)、蓝(B)作为三基色。在空间坐标系的原点上,三基色的亮度均为零,此时代表黑色;当三基色同时达到最高亮度时为白色;由等量的三基色组合而成的颜色是灰色,这些灰色点均落在RGB彩色立方体的对角线上。图3-1 RGB颜色空间虽然RGB空间模型在实际生活中广泛应用,但是它并不具有视觉一致性,不符合人对颜色的感知心理,且RGB颜色空间上的距离并不代表人眼视觉上的差异。因此,需要用另白黑品红蓝 青红 黄绿