1、 本科毕业论文 (科研训练、毕业设计 ) 题 目: 基于 灰度直方图 的图像检索系统的研究与实现 姓 名: 学 院:软件学院 系 :软件工程 专 业:软件工程 年 级: 学 号: 指导教师: 职称: 年 月摘 要 近年来,随着互联网的高速发展,网上的多媒体信息也急剧增加,这些多媒体信息以图像为主。如何从浩瀚的图像数据库中快速、准确地找出所需要的图像,己成为一个备受关注的研究课题。有效地组织、管理和检索大规模的图像数据成为迫切 需要解决的问题。于是基于内容的图像检索作为一个崭新的研究领域出现了。 目前的图像数据库,基本上以彩色图片为主,所以在基于内容的图像检索技术中,颜色是使用最广泛的特征之一。
2、 我们知道, 一 幅图像 在 色彩浓度发生变化后 其 生成的图像与原图像是很相似的, 但 由于图像中各像素的色彩值都发生了变化, 2 幅图像的色彩直方图差别却较大。利用传统的基于色彩直方图检索方法,很难把这样 2 幅图像定为相似。 因此本文提出利用图像的灰度直方图的检索图像的方法。首先把彩色图像统一转化为黑白图像。 然后利用图像的 灰度信息提取图像的特征向量,并求出相 应灰度直方图,最终基于相似度的比较来对图像进行检索。 关键词 : 灰度直方图; 相似 度;图像 检索 Abstract During the recent years, with the rapid development of
3、 the Internet, online multimedia information has increased dramatically, which focus on image. How to find the valuable images from the vast databases quickly and accurately has become a closely watched study. Effectively organization, manage and retrieval of large-scale image data has become an urg
4、ent problem to be resolved. Consequently, the content-based image retrieval emerges as a new field of study. In the current images database is mainly composed by the colored pictures. So in the image retrieval technology based on content, color is one of the most widely used characteristics. As we k
5、now, the generated picture is quite similar with the original one when the pictures color consistency has changed. However, due to the change of the color value of each pixel have taken place, the difference of the two color histogram image is huge. It is too difficult to judge that the two images a
6、re similar by means of the traditional method based on color histogram. Therefore, in this essay, I suggest an image retrieval method using the gray-scale image histogram. First, convert the color images into black-and-white uniform image, then extract the features of vector images with the gray-sca
7、le image information, and obtain corresponding gray histogram. At last, we can search out the right pictures based on the similarity of the pictures. Key words: Gray Histogram; Similarity; Image Retrieval 目 录 2 目 录 第一章 引言 . 1 1.1 基于内容的图像检索的研究背景 . 1 1.2 目前图像检索主要的应用领域 . 1 1.3 图像检索系统的功能和性能 . 2 1.4 国际上已
8、开发出的原型系统 . 2 1.5 国内研究状况 . 3 1.6 未来主要研究方向 . 3 1.6.1 综合多特征的检索技术 . 3 1.6.2 高维索引技术 . 4 1.6.3 性能评价准则 . 4 1.7 本文的研究工作 . 4 第二章 图像的灰度特征提取和相似性度量 . 5 2.1 灰度特征提取 . 5 2.2 图像的相似度 . 6 2.3 相似度计算公式 . 6 2.3.1 距离相似测度 . 6 2.3.2 相关相似测度 . 8 2.4 相似度计算的代码部分 . 8 第三章 基于灰度特征的图像检索系统的实现 . 11 3.1 开发工具的选取 . 11 3.2 系统介绍 . 11 3.3
9、系统框架 . 12 3.4 系统详细设计 . 12 3.5 系统主要功能 . 13 3.5.1 选择关键图 . 13 3.5.2 开始检索 . 14 3.6 算法原理 . 14 目 录 3 3.6.1 原理 . 14 3.6.2 算法描述 . 15 3.7 CxImage 类库 . 15 第四章 实验结果及分析 . 17 第五章 结束语 . 20 致 谢 . 21 参考文献 . 22 附 录 . 23 Contents 4 Contents Chapter 1 Introduction . 1 1.1 Background of Content-Based Image Retrieval .
10、1 1.2 Main Image Retrieval Applications . 1 1.3 Functionality And Performance of Image Retrieval System . 2 1.4 Prototype System Developed In World . 2 1.5 Domestic Research Situation . 3 1.6 Future Directions of Main Research . 3 1.6.1 Retrieval of Integrating Multi-Feature . 3 1.6.2 Technology of
11、Multidimensional Index . 4 1.6.3 Evaluation Criteria of Performance . 4 1.7 Research Work In This Thesis . 4 Chapter 2 Extraction And Measurement . 5 2.1 Extraction of Gray Feature. 5 2.2 Similarity of Image . 6 2.3 Formula of Similarity. 6 2.3.1 Distance Similar Measure . 6 2.3.2 Related Similar Me
12、asure . 8 2.4 Code of Similarity Calculation . 8 Chapter 3 Implementation of Gray-Based Image Retrieval System . 11 3.1 Select Development Tools. 11 3.2 System Introduced. 11 3.3 Framework . 12 3.4 System Detailed Design . 12 3.5 Main Functions of System . 13 3.5.1 Select Key Figure. 13 3.5.2 Begin
13、Crawling . 14 3.6 Principle of Algorithm . 14 Contents 5 3.6.1 Principle . 14 3.6.2 Algorithm Descriptons . 15 3.7 CxImage Class . 15 Chapter 4 Results and Analysis. 17 Chapter 5 Conclusion. 20 Ackonwledgements . 21 References . 22 Appendix . 23 第一章 引言 1 第一章 引言 1.1 基于内容的图像检索的研究背景 数字照相机、摄像机、扫描仪、打印机等图
14、像设备的普及使得视觉图像每天都大量产生 。随着互联网的发展,越来越多的人能够更加方便、快捷、经济地接触到这些数字媒体 (如照片、医学图像、卫星图像、地震数据、 气象 数据、视频图像、扫描文本、音乐数据等 )。人们面临的问题不再是缺少多媒体内容,而是如何在浩如烟海的多媒体世界中找到自己所需要的信息,互联网上的文本搜索引擎就是应这种需要产生的。从目前来看,图像数据的检索方法主要还是依靠文本,即依靠从图像内容中提取注解和数据,通过注解来检索图像 数据。然而,这种基于文本的图像检索存在三大困难 : 1) 人工提取注解所需的工作量太大 ; 2) 文本描述很难准确地表达图像中丰富的信息内容 ; 3) 文本
15、描述常有二义性,往往给准确的检索带来困难。 由于文本信息难以完整地描述多媒体数据丰富多变的内容,手工生成文本索引费时费力,而且缺乏统一的描述标准。为了能够方便人们寻找多媒体数据,近年来,基于内容的多媒体数据库的研究逐渐升温,多媒体内容描述接口 MPEG-7的制定和完善,更加推动了高效的基于内容的多媒体搜索引擎的开发。 1.2 目前图像检索主要的应用领域 1) 搜索引擎 :各种网站的搜索引擎,随着各种电子商务网站的发展、图像检索系统将成为这些网站的重要工具。 2) 医学 CT, X 射线检索系统 :数据库中相关的 CT、 X 射线照片,可以为医生提供重要的参考。 3) 家庭用图像检索 :数码科技
16、使得普通家庭也会产生成千上万的图像,家庭基于灰度直方图的图像检索系统的研究与实现 2 图像检索系统将成为家庭 PC 的一个工具。 4) 商标检索系统 :可在收录了已注册商标库中查找是否有欲注册商标类似的,防止商标的雷同。 5) 邮票检索系统 :用于邮票资料的查询。 6) 公安 :根据嫌疑犯面部特征在照片库中进行查找类似人员。 1.3 图像检 索系统的功能和性能 1) 实现基于内容的图像检索 :用户可以通过示例图像或手工定义图像的属性进行搜索 2) 快速的图像检索功能 :采用一般 PC 服务器的配置,系统可以在数秒钟的时间内从上十万张图像数据库检索出需要的图像 ; 3) 准确的图像检索 :数据挖
17、掘技术和多种算法技术的结合,使得用户可以很方便地查找出需要的图像。 1.4 国际上已开发出的原型系统 自 90 年代早期开始,基于内容的图像检索已经成为了一个非常活跃的研究领域。迄今,已有许多商用和研究性的图像检索系统面世 ,如 QBIC 系统 、Photobook 系统 、 CORE 系统 、 VisualSEEK 和 WebSEEK 系统 等 。大多数图像检索系统支持如下一个或多个检索方式 : 1) 随机图像浏览 ; 2) 基于样图的图像检索 ; 3) 基于草图的图像检索 ; 4) 基于文本的图像检索 (包括关键字等 ); 5) 根据定制图像类别进行导航 ; 第一章 引言 3 1.5 国内
18、研究状况 近年来,基于内容的图像检索研究己经在国内得到了广泛的重视,其中清华大学、中科院、上海交通大学以及国防科技大学等单位率先开始了这方面的研究。 值得一提的是,清华大学结合国家 863 高科技研究发展项目“ Web 上基于内容的图像检索”的 研究,成功的研制了一个 Internet 上的静态图像的基于内容检索的原型系统。目前该系统对 12000 张图像的高维特征建立了 GSS-索引,采用 Java 语言来实现人机交互模块,通过浏览器为检索用户提供一个友好的人机交互界面,该系统的检索时间与网络所造成的延时相比基本上可以忽略,表现出了相当好的实时性。 目前,国内一些研究所和高等院校正积极地将原型检索系统转化为实用的检索系统。 1.6 未来主要研究方向 1.6.1 综合多特征的检索技术 图像具有多种不同的特征,对于同一种特征有不同的表示方法。如何有机的组织多种 特征,使应用能够调用合适的特征和特征表示来支持查询,并按照用户的查询要求合并各种特征的检索结果,是一个值得研究的问题。综合还意味着采纳其它学科领域的成果,如传统的基于文本的信息检索文本、知识发现、人工智能等领域中的方法。基于内容的检索系统要充分利用文本、关键字和其它客观属性。基于内容的检索系统并不排斥这些常规的检索方法,相反,要充分利用现有的文本检索功能并集成到基于内容的图像检索系统中,以向用户提供完备的检索能力。