1、 本 科 毕 业 论 文 图像感兴趣区域提取技术研究 系统实现 Region of Interest Extraction Research System Implementation 姓 名: 学 号: 学 院:软件学院 系:软件工程 专 业:软件工程 年 级: 指导教师: 年 月 摘 要 随着信息化社会的到来,多媒体技术 、 通信技术的发展,人们越来越多的接触到图像信息。每天都有海量的图像数据产生,并且在因特网上流动着。因此怎样有效地管理 ,检索这些庞大的数据成为了当今越来越多的人关注并研究的主题。 如今 传统的基于关键字的信息检索技术 因为不能按照图像本身的特点搜索, 已逐渐不能满足要求
2、 。 因此 , 基于内容的图像检索技术成为 了 当今的一个研究热点 。 基于感兴趣区域( Region of Interest, 简称 ROI) 的搜索技术是基于 内容 的 图像搜索技术的一个重要的分支 ,也是图像检索技术的最新发展形式之 一 。 这种图像检索技术 , 以图像中最能体现其特点 和价值的 区域来 检索 , 因此 更能体现用户检索的目的 。基于感兴趣区域的检索 技术 已经 被越来越多的人关注并研究着。 感兴趣区域是最能 引起用户兴趣、最能表现图像 有价值 内容的区域 ,因此这项检索技术中,如何正确提取感兴趣区域,变得尤其重要。 感兴趣区域的提取方法由视觉特征的提取和图像分割两个 部
3、分组成 。视觉特征 的 提取是根据人类 的视觉注意从图像中提取特征量。图像分割则根据视觉特征,从原图中提取感兴趣区域。 本文对 目前主流的 基于感兴趣区域的 图像搜索技术 中提及的感兴趣区域提取算法 进行 了全面 的综述后 , 对提取感兴趣区域 的算法 进行了新的研究与实践。 关键词 : 感兴趣区域 ; 视觉注意 ; 图像分割 Abstract As the advent of the information society, Multimedia and Communication technologies have developed. Everyone contact with imag
4、e information more frequently. Every day, a mass of image information was produced and flowed though the Internet. Therefore, how to manage and search for these enormous information efficiently has become a focus all around the world. By far, the traditional information search technique which is bas
5、ed on keywords could not meet the current need, because it can not search according to characteristics of the images. Therefore, image search technique based on contents has become a hot topic. Whats more, search technique based on region of interest (ROI) is one important branch, and one of the lat
6、est evolving forms. It meets the users objective better as its proceeded according to the most valuable and important characteristic of the image. So this technique has been catching the attention of more people and is being researched. ROI is the region that users are most interested in and present
7、s the value of the image, therefore, how to extracts the ROI correctly is very important. The method of extracting ROI is made up of two parts. The extracting of visual characteristic gets characteristic value based on human sight. Meanwhile, image segmentation extracts ROI from source based on visu
8、al characteristic. After summarizing the extracting algorithm which is referred in the mainstream of image search technique based on interested region, this paper is focused on researching and practicing on the new algorithm of extracting interested region. Keywords: region of interest; visual atten
9、tion; image segmentation 目录 第一章 绪论 . 1 1.1 选题背景和研究意义 . 1 1.2 国内外研究现状 . 1 1.3 本文的主要工作和论文结构 . 3 第二章 背景知识 . 4 2.1 图像在计算机中的表示 . 4 2.2 高斯低通滤波器 . 4 2.3 高斯高通滤波器 . 5 2.4 中值滤波器 . 7 2.5 高 斯图像金字塔 . 7 2.6 本章小结 . 8 第三章 图像感兴趣区域提取方法 .10 3.1 图像分割算法 .10 3.1.1 边缘检测法 .10 3.1.2 区域生长法 .10 3.2 基于用户交互的提取方法 . 11 3.3 基于视觉注意
10、的提取方法 .12 3.3.1 视觉注意 .12 3.3.2 显著图概念 .12 3.3.3 显著度图的生成 .13 3.3.4 根据区域生长法提取图像区域 .15 3.4 本章小结 .16 第四章 图像感兴趣区域提取 软件系统的实现 .17 4.1 系统结构 .17 4.2 算法实现 .18 4.3 界面实现 .19 4.3.1 缩略图浏览窗口 .20 4.3.2 详细图像浏览窗口 .23 4.3.3 控制窗口 .24 4.3.4 主框架窗口 .25 4.3.5 主框架窗口分隔条 .26 4.3.6 程序实例类 .26 4.4 最终效果展示 .26 4.5 本章小结 .27 第五章 总结 .
11、28 致谢 .29 参考文献 .30 Contents Chapter1 Introduction . 1 1.1 Research Topics Background and Significance . 1 1.2 The Status Quo at Home and Abroad . 1 1.3 The main work and contents of this paper . 3 Chapter2 Background . 4 2.1 The expression of image in computer. 4 2.2 Gaussian low-pass filter. 4 2.3
12、Gaussian high-pass filter . 5 2.4 Median Filter . 7 2.5 Gaussian Pyramid . 7 2.6 Chapter Summary. 8 Chapter3 The method of extracting ROI .10 3.1 Algorithem of image segmentation .10 3.1.1 Edge detection method.10 3.1.2 Region growing method.10 3.2 The extracting method based on user interaction . 1
13、1 3.3 The extracting method visual attention .12 3.3.1 Visual attention .12 3.3.2 The concept of saliency map.12 3.3.3 The generation of saliency map .13 3.3.4 Extract image region based on Region growing method .15 3.4 Chapter Summary.16 Chapter4 The implementation of system on extracting ROI of im
14、age .17 4.1 Structure of application .17 4.2 The implementation of algorithem .18 4.3 The implementation of user interface .19 4.3.1 Preview window.20 4.3.2 Detailed image window .23 4.3.3 Control window .24 4.3.4 Mainframe window .25 4.3.5 Seperator of Mainframe window .26 4.3.6 Instance of applica
15、tion .26 4.4 The final effect of display .26 4.5 Chapter Summary.27 Chapter5 Summary .28 Acknowledgements .29 References .30 基于用户感兴趣区域的图像检索技术研究 1 第一章 绪论 1.1 选题背景和研究意义 随着信息化社会的到来,多媒体技术 、 网络技术的发展,人们越来越多的接触到图像信息。每天都有海量的图像信息不断产生。现在全人类每年 会 产生 10 亿 20 亿 GB 的新信息 ,而这些信息中有 20%以上为图像信息 。 有人估计世界上每年产生的新图像会达到 800
16、 亿幅。 美国加州某医院多年前已将 医学 X 光图片数字化。而每张图片需要 8MB 的空间来存储。考虑每天需要做 1000 张 X光片,而一般 X光片需 要 保存 7年,这样一来每年这类图像数据的数量都将 在 1013B 的量级。 视觉数据的爆炸式增长使得图像的管 理和检索成为关键问题。如何快速有效地寻找感兴趣的相关信息已变得日趋困难,所以,迫切需要对海量数据实时有效管理 。 传统的方法是通过关键字 的 方法, 将 每一幅图像都和几个关键字想关联,通过关键字将图像 分类 。但是关键字方式已经不能满足图像信息飞速发展的需求,不足以对这些庞大的图像信息进行全面合理的描述。 因此 , 一种崭新的图像
17、检索技术 基于内容的图像检索技术 (Content-Based Image Retrieval, 简称 CBIR)出现了 。 这种技术更能体现出用户检索的目的,因此,在信息日益膨胀的情况下,研究这项技术意 义重大。 1.2 国内外研究现状 从 90 年代基于内容的图像检索技术兴起至今。 CBIR 已经逐渐成为一个非常活跃的研究领域,国内外多个研究机构都在积极充实这项工作地研究,并取得了一系列令人瞩目的成果。比较有代表性的有,国外的 BIC 系统 、 Photo book 系统、 Netra 系统、 chabot 系统、 VisualSEEK系统、 MARS系统 、 恶化 Viage图像搜索引擎
18、等等。国内有浙江大学的基于颜色的检索系统 Photo Navigator、 基于形状的检索系统 Photo Engine、 基于内容的多媒体检索系统 WebscopCBR、国防科技大学的 MIRC、 中国科技学院计算机技术研究所开发研制的 MIRES 等。这些系统的框架和查询的处理过程很相似,只是采用的特征描述和搜索方法各有特色,性能也有差异,有的已经达到了可以使用的程度,但总的来还不成熟,需要进一步的研究来逐渐完善。 目前 基于内容的图像检索有如下几种技术: ( 1)基于颜色特征的图像检索。为提取图像颜色特征,首先应将图像映射到一个颜色空基于用户感兴趣区域的图像检索技术研究 2 间。最常用的
19、颜色空间是 RGB 空间,然而 RGB 空间结构不符合人们对颜色相似性的主观判断,因此有人提出了其它颜色空间的概念,如 HSV、 Luv 和 Lab空间等。图像颜色特征提取的一个有代表性的方法是颜色直方图,其中 HSV 空间是直方图最常用的颜色空间。图像颜色的统计直方图描述了每种色彩在一幅图像中所占的比例,但是当图像中的颜色特征并不能取遍所有可取值时,统计直方图中会出现一些零值,对匹配算法的正确性造成干扰。一个解决办法就是采用累加直方图。累加直方图能减少统计直方图中的零值数目,从而使两种颜色在特征轴上的距离与它们的相似度成正比。累加直方图要求信号本身在特征轴上距离小的两点要比距离大的两点更相似
20、,这个特性对于颜色简单、颜色数目少,从而色度信号相关性质较简单 的合成图像来说更容易满足,而对色彩较复杂的自然图像,一般不适用累加直方图法。由于人眼对色度的分辨能力是有限的,因而可认为一幅图像的色度分量在其分布轴上的局部区间内仍满足累加直方图有效的条件。因此,可把色度沿分布轴分成若干局部区间,在各区间内分布应用累加直方图法,这种方法被称为局部累加直方图法。 ( 2)基于纹理特征的图像检索。纹理目前尚无统一的定义。 John R.Smith 等认为纹理是指图像中不依赖于某种颜色或亮度的具有同质性的视觉模式,是所有物体表面共有的内在特性。 Robert M.Haralick 等认为纹 理特征包含了
21、物体表面结构组织排列的重要信息以及它们与周围环境的联系。图像纹理的描述模型可分为基于空间性质、基于频域性质和基于结构感知性质的模型,其中基于空间性质的纹理模型包括自相关函数、共生矩阵、随机分形和随机场模型;基于频域性质的纹理模型包括功率谱和小波变换模型;基于结构感知性质的纹理模型包括纹理基元法和 Tamura 纹理特征。基于内容的图像检索中常用的纹理特征主要包括Tamura 纹理特征、自回归纹理模型、共生矩阵和小波变换等。 ( 3)基于形状特征的图像检索。形状的描述方法有很多,一般可分为特征法、变形法和关系法三种。其中特征法借助一组特征来描述形状,有些特征描述目标形状的全局特性,如面积、伸长度
22、、主轴方向等,有些特征则描述目标边界的局部特性,如角点、特征点等。这样某种形状可用形状特征空间的点,也就是一个向量来表示。根据形状特征表达时利用目标区域内的象素集合或者利用区域边界上的象素集合,特征表达又可分为内部参数法和外部参数法。变形法利用把一种形状转换为另一种形状所需的投入来描述形状,这种方法能即时进行形状差别的估算,但不支持索引。关系法把形状分解为一组给定的组元,每个组元可用某些特征描述,而对整体的描述既包括 对各个组元的描述,也包括它们之间联系的描述。该方法更多地用于对复杂形状的识别和描述。 ( 4)基于空间特征的图像检索。颜色、纹理和形状等多种特征反映的都是图像的整体特基于用户感兴
23、趣区域的图像检索技术研究 3 征,而无法体现图像中所包含的对象或物体。事实上,图像中对象所在的位置和对象之间的空间关系同样是图像检索中非常重要的特征。基于空间关系特征的图像检索可以分为两类,一类是基于图像分割的方法,首先对图像进行自动分割,划分出其中所含的对象或颜色区域,然后根据这些区域对图像索引 。 1.3 本文的主要工作和论文结构 前面的分析已经提到, 基于 区域的图像检索方法是 目前 基于 内容的图像检索的研究热点之一,相对全局图像特征, 使用区域特征 可以对图像进行更进一步的理解和分析,也 更 容易获取图像的语义信息。但是由于图像分割技术的不成熟 , 无法准确的提取到图像中的物体,而且
24、用户 可能对 提取的区域不感兴趣,这些无关区域不但增减了图像匹配算法的复杂度,而且 由于 不能体现用户的检索目的而 降低 检索准确率。 基于用户感兴趣区域的图像检索方法体现了用户的检 索目的,区分了区域的重要程度,突出了图像的主要内容,消除了不相关 区域 的干扰。 鉴于以上的分析 , 本文把研究重点放在基于感兴趣区域的搜索技术中的,提取 用户感兴趣区域的方法上。 第二章,介绍了该项技术中 所 用到的一些 关键性技术 。 第三章,仔细阐述了现有 的几种 感兴趣区域的提取方法 。 第 四 章,描述了 图像感兴趣区域提取软件 系统的具体实现 。 基于用户感兴趣区域的图像检索技术研究 4 第二章 背景知识 本章主要 对 图像感兴趣区域提取 技术 中所涉及到的一些关键性技术进行了 简单 的介绍。 2.1 图像在计算机中的表示 图像资源可以用 f(x,y)二维 函数形式表示,在特定的坐标 (x,y)处, f 的值或幅度是一个正的标量 1