1、毕业设计开题报告 测控技术与仪器 WEB 图像语义特征的分析与提取研究及实现 一、 选题的背景、意义 伴随着多媒体技术、计算机图像技术以及互联网技术的飞速发展,网络上的web图片数量呈集合技术增长,图像数据库容量不断增大,这对传统的数据库技术和早期的图像检索技术提出了严峻的挑战。如何从浩瀚的图像海洋中快速、准确地找出用户所需要的图像,已经收到广泛关注的研究课题。 早期的图像检索技术是基于关键字的检索,这些关键字由人工进行标注,效率较低,得不到令人满意的检索结果,因为标注的方式不可能给出图像所有的特征,而且不同的用户 对于同一幅图像的理解也是不同的。 为了克服标注方法的不足, 20世纪 90年代
2、初, CBIR(Content Based Image Retrieva1)作为一种新的检索方法被提出并很快地成为了研究的热点。 CBIR主要是根据图像的颜色、纹理、图像对象的形状及它们的空间关系等内容特征作为图像的索引,通过计算查询图像和目标图像的相似距离,然后按相似度进行检索。 目前,国内外已经对“如何通过单一的视觉特征进行检索从而得到更好的效果”进行了大量的研究,但是实验表明,基于多种特征综合 CBIR的结果优于基于单一视觉特征 CBIR的结果。 基于多特征的检索技术是一种综合的集成技术 ,其研究涉及认知科学、人工智能、模式识别、图像处理、信息检索等多个领域。目前国际上在基于多特征的图像
3、检索领域的诸多研究已经取得了很大进展 ,但仍存在很多不完善的地方 ,仍需进一步深入研究。 二、研究的基本内容与拟解决的主要问题 随着网络和多媒体技术的快速发展,在互联网上出现了海量的 WEB图像。传统的基于内容的图像处理技术由于没有很好地考虑图像高层语义,因此,在实际应用中常常会失效。另一方面,由于 WEB图像的特征维数较高,导致的运算量很大,从提高后续分类的准确率 来说,都需要从 WEB图像中提取出最为有效的可视化特征。本课题提出一种融合多种可视化特征的提取方法,并将其运用到针对 WEB图像中自然风景图像的识别任务。具体为:充分利用人类的视觉感知,分析 WEB图像的特性,将多种图像的可视化特
4、征相互融合,并通过建立适当的距离度量对图像进行有效识别,得到应用哪些可视化特征能够较好地表述 WEB图像的高层语义的结论,并通过实验加以验证。 提出的基于多种可视化特征融合的 WEB图像语义特征提取方法,应建立在充分分析 WEB图像的特性的基础之上,并利用人类的视觉感知来鉴别需要提取的特征的种 类,选择并提取出来的可视化特征应具有表述 WEB图像的特性的能力。提出的方法应能够在下载自互联网上的自然风景图像数据集上进行实验,以验证它的可行性和有效性。 三、 研究的方法与技术路线、研究难点,预期达到的目标 目前图像语义的获取主要有 3种来源,分别是基于知识的语义提取;人工交互语义提取;利用外部信息
5、源的语义生成,它们构成了目前语义提取方法的 3条主线。 1 利用系统知识的语义提取 基于知识的语义提取 ,主要特征是需要预先给系统提供必要的知识 ,如对象模板、图像场景分类器等等。依据提取的语义内容和采取的方法 ,又可以分为基于对 象识别的处理方法和全局处理方法。 2 系统交互中语义的生成 目前通用的完全自动的图像语义处理,还存在一些难以逾越的障碍。要在机器视觉、人工智能现有发展的水平上进行语义处理 ,必须充分考虑到人的作用 , 把人当作系统的一个组成部分。人工交互的语义提取 ,主要体现在图像库预处理和反馈学习两个方面。预处理最简单的情况是人工标注 ,更加合理的方法是结合基于知识的方法 :在特
6、定的领域中 ,先让系统自动学习对象和场景的描述 , 再由人工修正。用户反馈可以起到两个作用 ,一是根据用户对于检索结果的操作 , 逐步把握用户真正的需求;二是根据用户 的操作 ,建立特定语义与视觉特征的对应 ,或是修正与图像关联的高层概念。交互主要在两个层面上进行 :根据低层视觉特征的反馈;对于高层概念与图像联系的修正。 3 基于外部信息的语义提取 外部信息源的语义提取 ,是指根据图像的来源处的其它信息 ,来获得与图像相关的相对高层的描述信息。由于多媒体描述方式的普及 ,目前图像出现在各种场合 ,报刊杂志、论文报告等电子文献 ,特别是在 Internet上的各种 Web网页中 ,都出现大量的图
7、像。 Internet可以看成是一个巨型的媒体库 ,而且其中的信息都是非结构化的 ,在其上进行操作 ,往往比仅 仅在本地的一个几万幅的演示图像库中检索更有意义。目前针对 Internet,已有了实用化的 Web文本检索技术 ,而对于图像等多媒体信息 ,目前还没有可靠的方法。 图像语义的提取研究必须考虑人对图像的理解机制,这就要涉及到心理学和人的视觉认知模型。同时在多特征提取上采用何种算法来提取和分析才能更好体现原始 web图像 ,融合颜色、纹理、形状等多特征也是个较难以解决的问题。 从分析与挖掘 WEB图像的特性出发,研究各种可视化特征,如颜色、纹理、形状等的提取技术与方法,分析它们在获取 W
8、EB图像高层语义中的作用,特别是各种可视 化特征之间的互补或冗余关系、以及多种特征的融合对 WEB图像的识别能力,较好地揭示图像底层特征与图像高层语义之间的内在联系。并以 WEB图像中大量的自然风景图像为例,设计一种多特征融合的特征提取方法。 四、论文详细工作进度和安排 第八学期 第 1周 至第 3周( 2011年 03月 11日前):撰写论文提纲,完成毕业论文(设计)初稿、需求分析和概要设计。 第八学期 第 4周 至第 12周( 2011年 05月 13日前):详细设计、系统调试、和毕业论文(设计)完成定稿。 第八学期第 13周( 2011年 05月 20日前):完成应用软件系 统的设计和毕
9、业论文(设计)送指导老师和评阅老师评阅,准备答辩。 第八学期第 14周:参加毕业论文(设计)答辩。 五、主要参考文献: 1Faloutsos C., Equitz W., et al. Efficient and Effective Querying by Image ContentJ. Journal Intelligent Information Systems, 1994,3(1):231-262. 2Man junath B.S. Color and Texture Descriptors J. IEEE Trans. on Circuits & Systems for Video T
10、echnology, 2001, 11(6):703-715. 3Smeulders A.W.M., Worring M., Santini S.,et al. Content-based Image Retrievals at the End of the Early YearsJ.IEEE Trans. on Pattern Anal Intell,2000,22(12):1349-1380. 4 马鲜艳 .多特征融合的图形图像分类算法 J.微电子学与计算机 ,2009,26(6):250-253. 5 刘忠伟 ,章毓晋 .十种基于颜色特征图像检索算法的比较和分类 J.信号处理 ,2009
11、,26(6):250-253. 6袁昕 ,朱淼良 .基于主色匹配的图像检索系统 J.计算机辅助设计与图形学学报 ,2000,16(1):79-84. 7胡必鑫 .基于内容图像检索中颜色特征描述 J.计算机工程与应用 ,2005,41(16):48-50. 8孙君顶 ,武学东 ,周利华 .基于颜 色和形状的图像检索 J.计算机科学 ,2005,31(5):180-183. 9朱守业 .基于多特征融合和 ADABOOST算法的图像检索 J.计算机工程与应用 ,2007,43(36):137-140. 10秦文学 ,李宁 .基于 MPEG-7的多特征图像检索方法 J.北京机械工业学院学报 ,2007,22(4):29-36. 11陈蔚 ,肖国强 .基于多特征的图像检索算法 J.计算机工程与设计 ,2008,29(17):4507-4467. 12罗军 ,况夯 .基于内容的多特征融合图像检索 J.计算 机工程与应用 ,2009,45(1):153-197. 13孟祥娜 ,秦玉平 ,王春立 .基于内容的图像检索技术综述 J 14王惠锋 ,孙正兴 ,王箭 .语义图像检索研究进展 J 15王崇骏 ,杨育彬 ,陈世福 .基于高层语义的图像检索算法 J