1、毕业设计开题报告 计算机科学与技术 面向违禁品图像的特征提取研究及实现 一、选题的背景、意义 计算机视觉领域的突出特点是其多样性与不完善性。 这一领域的先驱可追溯到更早的时候,但是直到 20 世纪 70 年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。 尽管如此,人们已开始掌握部分解决具体计算机视觉任务的 方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、文字等),因而无法被广泛
2、地应用于不同场合。 对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。 自然照片图像和计算机生成图形之间的差别体现在许多方面 ,如应用环境、视觉效果、图像统计特征等在计算机色彩管理领域 ,没 有一种色域匹配算法对所有图像都有理想的匹配效果针对不同类型的图像采用相应的色彩渲染方式 ,才能达到最优的视觉与实用效果 ICCProfile 规范规定了三类色彩渲染方式
3、:饱和度渲染方式主要用于高彩度的商业图像 ;感观渲染方式用于自然图像 1;色度渲染方式则主要用于计算机生成图形现有色彩管理系统再现图像时由人工指定渲染方式 ,这对用户要求较高 ,且不能实现图像输入输出的自动化处理若能依据图像特征自动识别其类型 ,并根据类型采用最佳的渲染方式 ,则图像再现的作业流程将会得到改善近期 ,ZhigangFa 等人提出基于纹理能量特征 的图像分类算法 ,算法局限于扫描图像 ,对一般图像不适用 ;针对自然图像的分类不能判断图形 ,文献中提出一种基于亮度特征的分类算法 ,单特征不足以对图像准确分类 ,鲁棒性较差文中对照片图像和计算机生成图形的多个特征进行了统计 ,提取灰度
4、、边缘、纹理三个特征 ,实现了一种多特征相融合的分类算法 ,并通过神经网络对自然照片和计算机生成图形进行了分类。 二、研究的基本内容与拟解决的主要问题 毒品的性状 鸦片罂粟(以下简称罂粟)是两年生草本植物,每年初冬播种,春天开花。其花色艳丽,有红、粉红、紫、白等多种颜色,初夏罂粟花落,约半个月 后果实接近完全成熟之时,用刀将罂粟果皮划破,渗出的乳白色汁液经自然风干凝聚成粘稠的膏状物,颜色也从乳白色变成深棕色,这些膏状物用烟刀刮下来就是生鸦片。生鸦片有强烈的类似氨的刺激性气味,味苦,长时间放置后,随着水分的逐渐散失,慢慢变成棕黑色的硬块,形状不一,常以球状、饼状或砖状出售。 K 粉(俗称“嗨粉”
5、)性状:其盐酸盐为白色结晶性粉末,无臭。吗啡性状 : 纯净吗啡为无色或白色结晶或粉末,难溶于水,易吸潮。随着杂质含量的增加颜色逐渐加深,粗制吗啡则为咖啡似的棕褐色粉末。 基于颜色的检索 人们普遍认为颜色并不是刻划一 个物体的关键特征,因而在传统的注重几何特征的计算机视觉研究中,颜色未能得到充分的重视。然而相对于各种几何特征,颜色具有大小、方向、位置不变性,同时它也是描述图像最有效的特征之一。如果客户只希望从库存中查到所有红色衣服的样本图像,则使用其它检索方式很难达到要求。 QBIC 系统将基于颜色的检索作为缺省的检索方式 2。 基于形状的检索 形状是图像目标的显著特征之一,许多物体具有不同的颜
6、色,但其形状总是类似的。例如,一套以国徽为主要图案的邮票,其形状大体都是圆形。再比如苹果公司的商标,基本形状都是一个圆形缺一角的苹 果,差别仅在于一些细微的地方,如苹果中有无横线。形状包括面积、连通性、环形性、偏心率、主轴方向等特征 3。形状的表征方法很多, 包括本征方程、几何常量、 Fourier 级数、力矩等等。浙大人工智能研究所在此基础上,进一步提出了狭长度以及基于内角的特征量,对于形状检索有较好的效果。 基于纹理的检索 所谓纹理,是指图像像素灰度集或颜色的某种规律性变化 4。纹理特征主要包括粗糙度、方向性、对比度以及规则性。基于纹理的检索适用于检索诸如水波、布匹、建材等类型的图像,通常
7、采用统计方法、结构方法以及频谱分析方法进行。统计方法主要用于分析像木纹、沙地、草坪等细致而不规则的物体,根据图像像素间灰度的统计性质对纹理规定出特征以及特征与参数间的关系 5。结构方法适于像布料或砖瓦等一类元素组成的纹理以及排列比较规则的东西,根据纹理基元及其排列规则来描述纹理特征。 三、研究的方法与技术路线、研究难点,预期达到的目标 基于颜色的检索 在国际标准 MPEG-7 中建议了一种描述符颜色布局 6,它表达了颜色的空间分布信息。在颜色布局描述符中,对分割好的 8 8 的图像取每一块图像的颜色平均值,形成一个颜色平均值矩阵,然后对其用二维离散余 弦进行变换,取低频分量作为颜色特征。考虑到
8、本文所选的测试图片都是 bmp 图片,以及减少计算量,提高检索速度的因素,本文的颜色布局描述符 2, 3的提取方法如下: (1)将整幅图像分成 4 4 块,计算每一块中所有象素 RGB 三个颜色通道的颜色平均值,并以此作为该块的代表颜色(主颜色)。 (2)将各块的颜色平均值进行离散余弦变换( DCT),得到 DCT 系数矩阵。 DCT 是一种分离的变换,是国际静止图像压缩标准 JPEG 的基础。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的 失 真不太敏感,所以可用更粗的量化。因此,在一般检索中可以利用部分 DCT 系数作为特征向量。 (3)对 DCT 系
9、数矩阵进行之字形扫描和量化,得到 DCT 系数。 (4)对于 R、 G、 B 三个通道,分别从 DCT 系数中取出 4 个低频分量,形成 12 个参数,共同构成该图像的颜色特征向量 7。 基于形状的检索 形状的局部特征即对连续边界的分割点集。图像分割需要利用物体区域内部某种同一性和均匀性进行划分,采用的经典算法包括门限法、区域增长点、空间聚类法等 8。分割后得到物体边界点的集合,进行付氏变换,得到复系数集合。系数 在频域描述物体的形状,低频代表形状属性,高频代表图像细节。目前出现有限元法、图灵函数、小波描述等 9。 对于基于形状的检索来说,形状的表示和匹配是重点要解决的问题。在传统的计算机视觉
10、中,曾先后用 Freeman 链码、曲线、 Fourier 描述子、二次曲线及 B样条等来描述平面曲线 10。其后采用超二次曲线 (super_quadrie)以及小波描述来逼近形状:在复杂 (不连通 )形状的表示方面,提出了矩 Fourier 描述子方法,并将其用于汉字识别。也有人采用隐式多项式的表示方法,并对其表示能力进行了分析。对于形状匹 配来说, Hough 变换例是较为经典的方法,它对于噪声和遮挡具有良好的抗干扰性。但此法仅能解决形状的平移、旋转和缩放所带来的匹配问题,而对实际应用中广泛的变形匹配问题无能为力。针对由关节点联结起来的活动物体,例如剪刀, Mehrotra 等提出了基于
11、索引特征的相似形状检索方法 FIBSSR (Feature Index Based Similar Shape Retrieva1),专门用于此类物体的匹配 11。 基于纹理的检索 统计方法通常在频率域和空间域上进行。在频率域上,主要采用傅立叶变换和小波分析。傅立叶变 换在能量谱上反映图像粗糙度和方向性 12;小波分析中采用 Gabor 滤波能够表现出最好的特征。在空间域主要采用 Haraliek 和 Shanmugam 提出的共生矩阵法,共生矩阵的每个元素表示从灰度 i 像素点开始离开某固定位置 t 的像素点灰度为 j 的概率。该法的缺点在于矩阵很大且含有大量的冗余信息。Tamura 是纹理
12、分析的另一主要方法,它定义了粗糙度、方向、归整等 6 种特征,每种特征相互独立且可视。其优点在于几乎没有冗余信息,算法的效率比较高。下面介绍一下提取的具体步骤: (1)将 bmp 图像转换成灰度图。每个象素的灰 度值可以根据 RGB 颜色分量按下列公式计算得到: Gray=20.299*R+0.587*G+0.114*B (2)将整幅图像分成 4 4 块。 (3)分别对 16 块 1/16 子图像进行 sobel 边缘算子运算,到边缘图像。 (4)统计子图像中的边缘直方图,该直方图包括 4 个直方条。(横轴为 0, 1,2, 3 四个边缘方向,纵轴为该方向上的象素数占子图像总的象素数的比率)
13、(5)将 16 个子图像的直方条综合起来,得到包括 64 个直方条的整幅图像的边缘直方图。 毕业论文(设计)完成定稿。 四、论文详细工作进度和安排 第七学期第 10周至第 18周( 2011年 01月 06日前):文献检索和资料收集,完成毕业论文(设计)文献综述、开题报告和外文翻译。 第八学期 第 1周 至第 3周( 2011年 03月 11日前):撰写论文提纲,完成毕业论文(设计)初稿、需求分析和概要设计。 第八学期 第 4 周 至第 12 周( 2011 年 05 月 13 日前):详细设计、系统调试、和第八学期第 13 周( 2011 年 05 月 20 日前):完成应用软件系统的设计和
14、毕业论文(设计)送指导老师和评阅老师评阅,准备答辩。 第八学期第 14 周:参加毕业论文(设计)答辩。 五、主要参考文献 : 1Ryszard S. Chiras. Image Feature Extraction Techniques and Their Applications for CBIR and Biometrics Systems, International Journal of Biology and Biomedical Engineering J.2007, 1(1):6-17. 2Man junath B.S. Color and Texture Descriptors
15、 J. IEEE Trans. on Circuits & Systems for Video Technology, 2001, 11(6):703-715. 3Smeulders A.W.M., Worring M., Santini S.,et al. Content-based Image Retrievals at the End of the Early YearsJ.IEEE Trans. on Pattern Anal Intell,2000,22(12):1349-1380. 4 马鲜艳 .多特 征融合的图形图像分类算法 J.微电子学与计算机 ,2009,26(6):250-
16、253. 5 刘忠伟 ,章毓晋 .十种基于颜色特征图像检索算法的比较和分类 J.信号处理 ,2009,26(6):250-253. 6袁昕 ,朱淼良 .基于主色匹配的图像检索系统 J.计算机辅助设计与图形学学报 ,2000,16(1):79-84. 7胡必鑫 .基于内容图像检索中颜色特征描述 J.计算机工程与应用 ,2005,41(16):48-50. 8孙君顶 ,武学东 ,周利华 .基于颜色和形状的图像检索 J.计算机科学 ,2005,31(5):180-183. 9朱守业 .基于多特征融合和 ADABOOST算法的图像检索 J.计算机工程与应用 ,2007,43(36):137-140. 10秦文学 ,李宁 .基于 MPEG-7的多特征图像检索方法 J.北京机械工业学 院学报 ,2007,22(4):29-36. 11陈蔚 ,肖国强 .基于多特征的图像检索算法 J.计算机工程与设计 ,2008,29(17):4507-4467. 12罗军 ,况夯 .基于内容的多特征融合图像检索 J.计算机工程与应用 ,2009,45(1):153-197.