1、本科毕业论文科研训练、毕业设计题目基于颜色特征的图像检索方法研究与实现姓名学院信息科学与技术系计算机专业计算机年级2004学号04120074指导教师(校内)职称教授指导教师(校外)职称年月日基于颜色特征的图像检索方法研究与实现【摘要】本文介绍了一个基于改进的加权颜色直方图的图象检索系统。本系统通过将基于改进的加权的局域颜色直方图的图像检索方法和全局直方图的图像检索方法相结合,提高查全率和查准率。其中,基于分块局域直方图的检索方法利用了图像中间部分的重要性,将图像平均划分成33个子块,取中间一块的图像,计算其与参考位图相应位置的颜色特征距离,再计算原图的颜色直方图与参考位图的颜色特征距离,分别
2、赋予权值后得出的值就是图像之间内容的相似程度。本文引入欧氏距离的相似性度量方法实现图像检索。实验表明,该方法具有较好的查全率和查准率。【关键字】图像检索,颜色特征,颜色直方图,相似性度量方法CONTENTBASEDIMAGERETRIEVALSYSTEMLEARNANDREALIZATIONABSTRACTTHISIMAGERETRIEVALSYSTEMISBASEDONAIMPROVEDWEIGHTEDCOLORHISTOGRAMWITHCOMBININGTHEIMPROVEDIMAGERETRIEVALALGORITHEMOFBASEDONTHEWEIGHTEDCENTRALBLOCKCO
3、LORHISTOGRAMANDTHEIMAGERETRIEVALALGORITHEMOFOVERALLHISTOGRAM,THERECALLRATEANDTHERATEOFSEARCHISIMPROVEDUSINGTHEIMPORTANCEOFTHEIMAGEOFTHEMIDDLEPART,THERETRIEVALMETHODBASEDONTHEBLOCKLOCALHISTOGRAMDIVIDEAPICTUREINTOANAVERAGEOF33SUBBLOCKSCHOOSETHEMIDDLEONE,CALCULATETHECOLOURFEATUREDISTANCEBETWEENTHEMIDDL
4、EBLOCKOFORIGINALIMAGEANDTHEMIDDLEBLOCKOFREFERENCEIMAGETHENCALCULATETHECOLOURFEATUREDISTANCEBETWEENTHEORIGINALIMAGEANDREFERENCEIMAGEWEIGHTEDWITHFIXEDVALUE,WECANGETTHESIMILARITYBETWEENTHEMWEINTRODUCETHEEUCLIDEANDISTANCEMEASUREMENTMETHODSTOACHIEVESIMILARIMAGERETRIEVALTHEEXPERIMENTSSHOWTHATTHEMETHODHASA
5、BETTERRECALLRATEANDTHERATEOFSEARCHKEYWORDSIMAGERETRIEVAL,FEATURESOFCOLOR,COLORHISTOGRAM,SIMILARMETHODSOFMEASUREMENT目录摘要IABSTRACTII第一章绪论111课题研究的目的和意义112图像检索系统的关键技术13国内外研究现状14本文所作的主要工作第二章基于颜色特征的图像检索21颜色模型211RGB模型212HSV模型213CMY模型214LAB模型22颜色特征的提取与表达221全局颜色直方图222基于分块颜色直方图法223累加直方图224局部累加直方图23图像特征的相似性匹配2
6、31直方图相交法232欧式距离方法233模糊方法第三章图像检索系统的设计31系统设计311算法分析32系统的实现33一个图像检索实例第一章绪论11课题研究的目的和意义随着多媒体技术的快速发展,计算机硬件技术的不断更新,以图片、图表、动画和视频为形式的信息发布量日益庞大,随之出现了大量庞大的不同内容的图像信息库。数字图像的应用包括国防军事、工业制造、医疗卫生、新闻媒体、大众娱乐等各方面。人们在工作生活中越来越多地接触到大量的各种各样的图像信息。首先,在科学计算、可视化、工程制图及其他众多的应用领域如数字图书馆、天气预报、知识产权保护、天气预报、医疗图像管理、犯罪预防、军事观察和地球资源观察系统、
7、宇宙探测、交通检测等领域,每天都有数量非常巨大的图像信息在不断产生与使用。其次,随着INTERNET的发展,网络的应用和发展对社会各个领域产生了巨大影响,特别是WEB的兴起,网络上传输的信息正以指数级增长。作为一种全新的媒体和公共资源,越来越多的图像信息出现在WEB站点上,但是它们都是无序、无索引的,在这样的环境下寻找感兴趣的资料是非常耗时的。因此,人们对信息检索工具和系统的依赖将会日益增加。面对信息量如此巨大的图像信息,热门迫切需要一种有效的检索方法。传统的图像检索技术是基于文本索引的图像检索,通过用文本描述图像的语义,然后再这些图像文本标注基础上应用成熟的文本搜索算法,为用户搜索预期的图像
8、。虽然检索比较准确而且速度很快,但是随着图像数据库规模的增大(如数十万以上),这种检索消耗的时间大大增加,而且人工标注具有主观性和不确定性。鉴于上述因素,人们提出了一种新的图像检索技术基于图像内容的检索CBIR(CONTENTEDBASEDIMAGERETRIEVAL),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。基于内容的图像检索是一种实用性很强的技术,有着广阔的前景,涉及到社会和生活的方方面面。12图像检索系统的关键技术目前,对于通用的静止图像检索,用于检索的特征主要有颜色(COLOR)、纹理(TEXTURE)、形状(SHAPE)等,其中
9、颜色、纹理、形状应用尤为普遍;活动视频检索脱胎于序列图像分析中的技术。本文主要研究对静止图像检索,其中数据库是专用的图像库。对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。比如SMITH等提出了颜色集合COLORSET方法来抽取空间局部颜色信息并提供颜色区域的有
10、效索引。运用颜色直方图进行检索有如下三种方式(1)指明颜色组成该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。(2)指明一幅示例图像通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。(3)指明图像中一个子图分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。在颜色空间选取方面,最常用的颜色空间是RGB颜色空间。通常,人们采用欧氏距离来刻画两种颜色之间的差异,RGB空间存在的一个严重问题是其中所计算出
11、来的两种颜色之间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。HSI空间比较直观并且符合人的视觉特性。HSI颜色模型有两个重要的特点作为基础。首先,I分量与彩色信息无关,其次H和S分量与人感受彩色的方式紧密相连,其中H分量尤其影响人类的视觉判断。这些特点使得HSI模型非常适合基于人视觉系统对彩色感知特性的图像处理。得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共6种。本文重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。所以,颜色特征的图像检索关键技
12、术路径如图一图11颜色特征的图像检索关键技术路径颜色颜色空相似度量特征表达颜色空间13国内外研究现状基于内容的图像检索技术开始于上世纪90年代初期,目前已有十几年历史,是当前研究的热点,许多著名杂志如IEEETRANSONPAMI、IEEETRANSONIMAGEPROCESSING等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如IEEECONFERENCEOFCVPR、ACMCONFERENCEONMULTIMEDIA等纷纷设立专题交流最新的研究成果。各大研究机构和公司都推出了他们的系统,在商用领域,IBM首先研制出了QBIC系统;在学术研究领域,MIT的PHOTOBOOK系统,新加坡
13、国立大学的CORE系统,美国哥伦比亚大学的VISUALSEEK系统,加利福尼亚大学SANTABARBARA分校的NETRA、伊利诺依大学的MARS、CMU的INFOMEDIA以及哥伦比亚大学的VIDEOQ等。下面主要介绍这些系统概况1QBIC系统IBMALMADEN研究中心研究开发的,是基于内容检索系统的典型代表。QBIC系统允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。2PHOTOBOOK系统MIT的媒体实验室在1994年开发研制的。图像在装入时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码
14、。3CORE系统新加坡国立大学开发的一个基于内容的检索机。其显著技术特色包括多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。4VISUALSEEK系统美国哥伦比亚大学图像和高级电视实验室开发的。它实现了互联网上的“基于内容“的图像/视频检索系统,提供了一套工具供人们在WEB上搜索和检索图像和视频。14本文所作的主要工作从图一的技术路径分析,结合设计要求,我们需要对要素工作具体化,目的是使系统试验简单高效而不失代表性。如下颜色空间选取面向硬件的RGB空间和面向视觉的HSI空间;颜色特征的表达全局直方图,全局累
15、加直方图,局部累加直方图;相似性度量欧氏距离计算方法。第二章基于颜色特征的图像检索图像是通过颜色表现出来的,颜色是图像最重要的属性。所以,对于基于内容的图像检索来说图像采取哪种颜色表示方式就显得尤为重要。本章的主要任务是分析不同的颜色空间表示方式以及适合于图像检索系统的颜色空间。21颜色模型图像是通过颜色表现出来的,颜色是彩色图像的最显著的特征,与其它特征相比,颜色特征具有非常稳定,对于旋转、平移、尺度变化都不敏感,表现出很强的鲁棒性,又由于颜色特征计算简单,因此基于颜色的查询成为现有基于内容的图像检索系统中应用最基本的方法。而如何选取合适的颜色特征,以及对颜色特征如何进行有效的抽取将关系到最
16、终的颜色特征的相似性比较和检索的效果。颜色模型是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。颜色模型的用途是在某个颜色域内方便的指定颜色。由于每一个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。常见的颜色模型包括RGB(红、绿、蓝);HSV(色调、饱和度、亮度);CMYK(青、洋红、黄、黑);以及CIE组织的LAB等。211RGB模型面向硬设备的最常用颜色模型是RGB模型。在RGB模型中,所有颜色都可看作是3个基本颜色,即红(R,RED),绿(G,GREEN)和蓝(B,BLUE)的不同组合。将这三种颜色成分分别人为地分成0到255共256个等级,0表
17、示没有刺激量,255表示刺激量达到最大值。R、G、B均为255时表示白光,均为0时表示黑色。这样,我们就能表示出256256256(约1600万)种颜色。如图21所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。绝大部分的可见光谱可以用红、绿、蓝R、G、B三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为RGB颜色合成产生白色,它们也称为加色。将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。加色用于光照、视频和显示器。RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰
18、度值。0,0,0为黑色,L,1,1为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。在显示屏上显示颜色定义时,往往采用这种模式。图像如用于电视、幻灯片、网络、多媒体,一般使用RGB模式。图21RGB颜色模型虽然RGB彩色模型被广泛应用于CRT设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB颜色空间上的距离并不代表人眼视觉上的颜色知觉差异。但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的视觉心理的视觉彩色模型来表示颜色
19、。212HSV模型HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域25。它把彩色信号表示为三种属性色调HHUE、饱和度SSATURATION和亮度VVALUE,其中亮度又称LIGHTNESS或INTENSITY,所以HSV空间还有HLS和HIS这两种叫法。HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度180180或O360来度量。亮度V是颜色的明暗程度,通常用百分比度量,O为最暗的黑色,而100为最亮的白色。饱和度S指颜色的深浅程度,即在纯色中包含的
20、白色光的成份。例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。饱和度S也用百分比来度量,从浓度最小的O到浓度完全饱和的100。色调H和饱和度S分量合起来定义了颜色的色度CHROMATIEITY特性。HSV颜色模型用MUNSELL三维空间坐标系统表示,其示意图如图22所示。22HSV颜色模型MUNSEN颜色空间具有以下己经被人的眼睛所证实的特点1坐标之间的心理感知独立性PEREEPTUALINDEPENDENEE,即人可以独立感知各颜色分量的变化。2线性伸缩性LINEARSEALABILITY,人眼可感知的颜色差异与HSV颜色分量的相应值上的欧几里德距离EUELIDEANDIST
21、ANEE是成比例的。因为HSV颜色空间根据色调H的值来区分不同的颜色,因此在HSV的三个分量中,H分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。213CMY模型以红、绿、蓝的补色青EYAN、品红MAGENTA、黄YELLOW为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。差别仅在于前者的原点为白,而后者的原点为黑。前者是定义在白色中减去某种颜色来定义一种颜色,而后者是通过从黑色中加入颜色来定义一种颜色。CMY模型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透
22、明油墨上时,部分光谱被吸收,部分被反射回眼睛。理论上,青CYNA、品红MAGENTA、和黄YELOLW色素能够合成吸收所有的颜色并产生黑色。因为所有打印油墨都会包含一些杂质,这三种油墨实际上产生一种土灰色,必须与黑色K油墨混合才能产生真正的黑色。将这些油墨混合产生颜色称为四色印刷。减色CMY和加色RGB是互补色,每对减色产生一种加色,反之亦然。如图23所示。23CMY颜色模型214LAB模型LAB颜色模型是在1931年国际照明委员会CIE制定的颜色度量国际标准的基础上建立的。1976年,这种模型被重新修订并命名为CIELAB。LAB颜色设计为与设备无关,不管使用什么设备创建或输出图像,这种颜色
23、模型产生的颜色都保持一致。LAB颜色由亮度或光亮度分量L和两个色度分量组成即A分量从绿到红和B分量从蓝到黄。22颜色特征的提取与表达1991年SWAIN和BALLARD首次提出了基于颜色直方图的特征表示,其核心思想是在一定的颜色空间中对图像中各种颜色出现的频数进行统计。具体做法是,在给定的颜色空间基础上,统计每种颜色分量的像素数占图像总像素数的比例,从而得到图像各种颜色分量的比例分布直方图,最后把直方图作为图像的颜色特征进行图像检索。由于图像的颜色直方图具有尺度不变性和旋转不变性,因此被广泛采用。颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵坐标是颜
24、色出现的频率像素的个数。但是,直方图也存在着缺陷。首先,颜色直方图只包含了图像中某一颜色值出现的频数,而丢失了像素点所在的位置信息。而且,虽然对任意一幅图像都能唯一的给出与它对应的直方图,但不同的图像却有可能具有相同的直方图特征,也就是直方图与图像之间并非一一对应的,而是一对多的关系。这些缺点都会影响直方图特征检索的有效性。221全局颜色直方图全局直方图是一种经常被采用的颜色特征,已在很多图像检索系统中得到应用。设CX,Y为RGB空间一幅彩色图像,其颜色直方图的定义为其中,M、N为图像CX,Y垂直和水平方向上的像素数目,并简称为图像的高和宽而K为变换空间的颜色数。222基于分块颜色直方图法采用
25、的分块方法是把图像分成单独的NN块,并且图像分块太大则失去分块的意义,不能充分包含颜色的分布信息,分块太小则会增加检索过程的计算量。经试验比较分析,对二维空间进行33划分是较有效的划分方案。223累加直方图当图像中的特征并不能取遍所有可取值时,统计直方图中会出现一些零值。这些零值的出现会对计算直方图的相交带来很大影响,从而使得算出的匹配值并不能正确的反映两图间的颜色差别。累加直方图是以颜色作为横坐标,从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。这样图像的累加直方图向量H可以定义为表示C1CK种颜色的像素的累加频数我们已经计算出图像的一般直方图,可以方便地计算图像累加直方图。
26、这样,最后得到的累加直方图特征向量为224局部累加直方图在HSI空间里,H0基本对应红色,HPI/3基本对应黄色,H2PI/3基本对应绿色。这样在H轴上黄色与红色间,黄色与绿色间距相等。但从人的视觉感知来讲,黄色与红色间,黄色与绿色间本无所谓哪两个更相似。这表明色度信号的分布从视觉意义上讲,并不满足累加直方图应用的前提。所以,对色彩比较复杂的自然景物图像,一般累加直方图算法在检索中就会将不同色度的信号混淆起来。另外,一幅图像的颜色一般非常多,尤其是真彩色图像,因此直方图矢量的维数会非常高。如果能采用局部累加后降维,则计算量要少得多。系统设计中,我们采用PI/3为区间的长度,将H轴共分成6个不重
27、叠的局部区间60K,60K1,K0,1,5,通过分别计算每个局部区间的累加直方图进行检索。上述方法都保留了颜色在图像中出现的概率信息,但也丢失了很多颜色的空间信息,因此不同的图像有可能具有相同颜色特征表示。许多人提出了颜色索引的改进方法局部颜色特征索引。从划分局部区域的角度来说可分为基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的颜色分割方法。局部区域中的颜色信息可以表示为平均颜色、主颜色、颜色直方图和二进制颜色集等来表示。设计系统中暂不做讨论。23图像特征的相似性匹配在基于文本的检索方法中采用的是文本的精确匹配,而基于内容的图像检索则是通过计算查询图像和图像
28、库中候选图像之间在视觉特征上的相似度匹配进行。因此,定义一个合适的视觉特征相似度度量方法对检索的效果有很大的影响。视觉特征大豆可以表示成向量的形式,常用的相似度方法也是向量空间模型,即将视觉特征看作是向量空间中的点,通过计算两个点直接的接近程度来衡量图像特征间的相似度。常见的方法有直方图相交法、直方图欧氏距离、直方图余弦距离、二值集HAMMIMG距离、直方图二次距离度量、二值集二次距离、直方图MAHALANOBIS距离。以下只简要介绍系统中常用的直方图的交、直方图欧氏距离两种距离度量方法。231直方图相交法度量直方图距离的一种经典方法就是直方图相交法。直方图的相交是指两个直方图在每个BIN(维
29、度)中共有的像素数量。具体做法是,根据颜色索引检索出查询图像的颜色直方图,将其与图像库中的每一图像的直方图取交集,根据交集的值来选出最佳匹配图像。在直方图相交法中,令HQK和HRK分别为查询图像Q和数据库图像R的特征统计直方图,则二者之间的匹配值为直方图交集方法能对两幅图像进行详细的比较,然而对于许多合成的图像,如商标等,它们有大量的一致颜色,三维直方图只有几个域的值很高,而其它许多域的颜色信息变化有限。因而,对于这样的图像进行过细的比较是不必要的。又由于在扫描图像时容易产生一些噪音,所以这种过细的比较容易产生错误的结果。232欧氏距离方法我们可以利用欧基里德距离公式(EUCLIDEANDIS
30、TANCE)来计算距离。对于两个N维直方图X,Y,两者的欧氏距离可以表示如下,22222112YXYXYXYXYXYXDTNN此距离公式虽然简单,但是与特定的颜色分布无关,因此我们可以引入相关权值A,这里A是一个NN维矩阵,此时距离公式可以表述如下,2YXAYXYXDT为了简化计算,将直方图X,Y规范化使其满足11,0IIIIIIYXYX且矩阵,IJAA,权IJA表示颜色I与颜色J之间的相似度。若取ZXY,则有AZZDZZTIII2,11,0,取定了距离公式后,我们需要确定A的取值,且要保证此矩阵A能够使02D,我们用IJD表示颜色I与颜色J在RGB颜色空间的距离。取MAX,/1MAXMAXI
31、JIJIJIJDDDDA其中,。有IJIJIJIJJIJIIJJITDDZZZZDDZZAZZDMAXMAX2/1因为IIIJITIDHZHZZDDZ,0/1,0MAX2其中,则233模糊方法1965年,ZADEH提出了他著名的模糊集理论,从此创建了一个新的学科模糊数学。模糊集理论是对传统集合理论的一种推广,在传统集合理论中,一个元素或者属于一个集合,或者不属于一个集合;而对于模糊集来说,每一个元素都是以一定的程度属于某个集合,也可以同时以不同的程度属于几个集合。对人们现实生活中大量使用的一些含义确定但又不准确的语言表达,比如“今天天气很热”、“车速过高,需要适当踩刹车”等,用模糊数学可以很好
32、的表达。第三章图像检索系统的设计31系统设计311算法分析颜色直方图存在一定的缺陷,同样的一个对象在不同的背景中得到的两幅图片,它们的颜色直方图可能有很大的差别,在计算相似度时认为不相似(特别是对象在图像中所占的比例很少时)。一般来说,处于图像中间的部分对图像起着重要的作用,而四周仅仅是图像背景。因此,本文采用的全局颜色直方图与较简易的分块关键直方图相结合的方法设计方法。将图像平均分成九块,因此取图像正中部分以获取分块关键直方图信息,并给这一部分像素分配较大的权值。如图31。图31A图31B这种基于位置划分的改进颜色直方图建立步骤为(1)根据上面提出的分块方法,计算图像中心区域的关键颜色直方图
33、H1(2)计算整幅图像的颜色直方图H2,新的颜色直方图可以表示为H4H2/96H1这样取值的目的是突出了图像中间位置像素的重要性而弱化了背景区域像素,这就达到了不同位置的像素根据重要性分配不同权值的目的。312系统结构框图系统的整个业务流程可以用如下框图表示图32基于彩色特征的图像检索系统业务流程我们可以从系统框图中抽象出三个层次或者功能模块1颜色空间内特征提取对图像数据进行特征提取,提取用户感兴趣的、适合检索要求的特征。颜色空间实现为RGB。对于图像全局的特征表达为全局颜色直方图,对于图像局部的特征表达为局部累计直方图。2图像匹配在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识
34、别的图像的特征与数据库中的哪些图像的特征最接近。该系统使用的相似度量方法为欧氏距离法。3结果输出用户待查图像内容特征分析抽取按相似度排列的检索结果集特征信息标引特征匹配特征信息抽取特征信息标引特征信息索引库图像数据图像索引库计算相似度图像检索将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。32系统性能分析本次设计在XP系统下使用VISUALC60作为开发环境,图像库下载了JZWANG的SIMPLICITY系统测试库,从该库的1000幅图片中抽取100张图片作为测试库,根据欧式距离升序排列前16个样本。该系统的实现,没有采用数据库的形式,直接以文件夹的形式调用图像库。图33检索结
35、果查全率和查准率是基于内容的图像检索系统性能的两个重要的指标。查全率是检索结果中相关的图像与图像库中总的相关图像的比,它反映了系统检索相关图像的能力。查准率检索结果中相关的图像与显示给用户的图像数目,它反映了系统拒绝无关图像的能力。查全率和查准率可以通过下面的式子表示查全率N/N查准率N/T其中N表示查询相关图像,N表示图像库中与查询图像相关的总的图像,T表示列表出的图像数目。本文从公交车,恐龙,大象,玫瑰花,土著,马匹等6个图库中各抽取16张组成一个96张的检索库。因此N16,T96。样本N查全率查准率公交车1062501042恐龙74375729大象1062501042玫瑰花6375062
36、5马匹1062501042土著1168751146平均值95625938第四章总结与展望41论文工作总结本文的主要研究内容及结论在于1广泛查阅和深入研究了国内外基于内容的图像检索技术的历史、最新发展及其应用状况。2详细分析了图像的颜色模型、颜色特征提取方法和颜色空间分布特征提取方法,并总结了常见的相似度匹配算法。3本文提出了一种基于改进的加权颜色直方图的图象检索系统,设计并实现了一个图像检索原型系统。4本文在实现所提出的算法时,采用了RGB颜色空间来表示图像的颜色特征,使用局域的关键直方图和全局颜色直方图的欧式距离加权求和,对所得结果冒泡排序。图像检索取得较好的效果。5检索系统调用MFC,运用丰富的类库可以使系统具有更强大的可扩展性。例如CIMAGE类便实现了多种格式图像同系统的I/O。在设计过程中主要遇到的问题有142进一步的工作致谢参考文献(REFERENCES)1求是科技,苏彦华等,VISUALC数字图像识别技术典型案例人民邮电出版社2求是科技,VISUALC数字图像处理典型算法及实现,人民邮电出版社3刑伟利,“图像检索中颜色的特征提取及匹配算法”,微机发展,20042VOL14NO28688