1、毕业设计(论文)外文翻译原文题目ASURVEYOFBIOLOGICALLYINSPIREDIMAGEPROCESSINGFOROBJECTSRECOGNITION译文题目一种目标识别调查仿生的图像处理摘要人类视觉系统是一种模拟人类或动物的视觉系统的非常复杂的图像处理和对象识别机理。这种能自动化产生视觉功能的机器,很难解释宇宙中像环境物体明确的感知部分和全部的视觉的场景的认知观。摘要本文首先提出了介绍一个重要性的生物激励的计算机视觉和复习视觉功能在神经科学的角度看问题。和更重要的是,我们会把重要的摘要来和探讨生物的具体应用,包括生物灵感启发模型的图像预处理、图像感知,对象识别。最后,提出了一些对
2、今后研究工作有挑战性的关于计算机视觉重要的主题。关键词人类视觉系统图像预处理,图像的感知,物体识别、计算模型。1介绍近年来,图像处理和目标匹配这种技术被广泛应用于工业、农业、通讯、军队、机器人等领域。随着机器视觉的性能提高,人类一直希望有朝一日,电脑将通过视觉和自动适应环境像人类一样去观察和理解世界。在过去的几十年中,许多学者在此领域取得了巨大成就。然而,机器视觉识别环境的能力远远低于人类。例如,对一个五岁的孩子来说过马路,简直就是小菜一碟的事情,但是对于电脑和机器人,却很难做到。人类视觉系统是一个非常复杂的图像处理和对象识别机理。常规方法相比,曾经自动图像分析没有多大的成功,视觉分析基本识字
3、能力,并大大减少了训练时间、图像分析时间。以往的努力在知识工程的软件设计方法,启发式逻辑或几何科学知识领域问题的基础上,进行图像数据的分析。分析人士是分析分类适应能力和性能主要是由于他们的大脑被预定与域知识和自然史的物理图像生成。人的大脑发现有一项专长,主要是作为一个函数的接触的感觉,源自先天的规则实施层次的突触神经环路组织中,并将这信息的通过环境中学习。广泛的研究视觉计算已经有一个世纪的历史了,而且在最近的25年里,已经开发了灵长类动物丰富的视觉模型计算,包括编制模型,从生态学灵感可以应用于计算系统。在本文中,概述了从神经科学的视觉系统的功能体系结构研究等几个关键问题的发现,并描述和分析了对
4、相关生物激发了机器视觉技术的处理方法。2人类视觉系统的事实在谈论到在处理视觉信息所涉及的机制的详情时,让我们简单地总结了整个过程。如图所示。1,光实现眼睛投射到视网膜视神经从哪里视觉信息发送到视交叉从那里两条途径导致了两个大脑,半球分开通路导致的丘上丘(SC)和更重要的是,视网膜膝状体途径,传输大约90的视觉信息,导致外侧膝状体核(LGN的)。那么信息是从外膝体转移到初级视皮层(V1)的,这也被称为流处理初级视途径。然后信息被进一步传播从V1到“更高“的大脑区域V2的V4中,颞皮层(资讯科技),中颞区(吨或V5)和后顶叶皮质(聚丙烯)。在下面的章节中,我们将讨论在视网膜,V1的信息处理机制和心
5、理功能,这是对研究图像处理和目标识别很有帮助。21视网膜性能人眼是人类能够看到是在很多成分相互配合工作。视网膜是最关键的一个。它有一些重要的属性,在视网膜中含有6个细胞类型和许多分十层排列类型。这六个细胞类型是光受体,水平,双极,无长突,神经节,跨丛状细胞。十层的光受体(PH值)是,外界膜,外核,亨勒,外网,内核,内丛状,神经节,神经纤维层和内界膜。关于视网膜细胞结合如图。2。光受体是PH值和奥尔姆完全组成的。这些层是位于眼睛后面。他们是距离视网膜比其他层更远。因此,层上的光受体的影响已经通过在视网膜上的其他细胞通过光线。有四种光受体在视网膜上,这是调整,以不同波长的光的类型。照片的受体被称为
6、锥三种类型,指定红,绿,蓝,或长(L),中(M)和短(S)波长分别。作者光受体第四类被称为视杆细胞,其峰值波长灵敏度在绿色的发生。值得注意的是,密度和光受体分布随从视网膜中心的偏心率。视网膜的中心是一个轻微的抑郁症称为中心凹,并从所有的细胞空间总和,在凹提供了在凹我们最高的视力。的光受体是通过连接,如图双极细胞神经节细胞。2。在光感受器和双极细胞反应分级彼此通过生产潜力。神经节细胞是产生尖峰放电,然后转换成模拟信号的离散一最早的细胞。一个神经节细胞感受野是圆形,分为两个方面一个中心区和一个如图所示周边地区。3。它由两个不同类型的细胞在中心的细胞,这些细胞对光线作出反应兴奋在中心和偏离中心的细胞
7、,这些细胞对光线作出反应抑制在中心。此外,非古典的神经节细胞感受野在哺乳动物的视网膜报告。22视觉皮层1962年,HUBEL和WIESEL发表关于猫的视皮层功能结构的文章。他们的发现引发了众人对皮质的研究的兴趣。这是第一次,观察到大脑如何处理一个图像。视觉皮层是大脑中的最大的部分,每一部分都有在大脑的视觉处理方面的独特功能,组成结构之一。皮质的第一部分有几个名字,最常见的两个分别是17区和V1。一个在数量大幅度增加的信号,发现在V1。据估计,有超过50万V1输出连接到细胞的视觉皮层的所有部分。面积V1的细胞,基本上有两种类型。首先,有一个定向不敏感和色彩敏感的细胞,可检测在视觉空间的颜色特殊区
8、域。其次,有一个定向敏感和颜色不敏感的细胞,用于检测图像中的线条。灵敏度的定向帮助大脑确定一个行的方向。此外V1的皮质涵盖像运动检测、肤色检测等的其他领域。区域V1面积是V2的几分之一。区域V2由许多较小的区段检测,并建立大段。这个过程可能被看作是一个层次结构,开始连接成较大的结构基本元素的第一阶段。V3为所在区域的对象的本形状是决定区域。区域V4是皮质的,它决定了大区域以及个别对象的颜色。它工作在并行路径的形状路径,但也接收和发送数据到其他领域,以至于从皮质的最终输出是一个完全集成描述能看到的实体。最后,面积V5是运动检测区域,采取从视觉流连续帧并决定如何移动一个实体的能力。这是一个皮质功能
9、的简要概述。更详细的描述中可以找到许多其他文献。23在人类大脑的注意机制研究在人类大脑的选择性注意的机制仍然是一个在对知觉的尚未解决的问题。也许最突出的新的视觉注意的神经生理学研究结果是,有没有一个脑区的指导人们,但相关的视觉神经选择似乎是在几乎所有的视觉处理相关脑区的反映。更具体的注意力机制进行了解剖一个区域网络,在若干研究结果下进行了综述如下,注意三个方面的主要功能描述第一,定向注意,第二,目标探测,第三,警觉性。他们声称,第一个函数,面向注意突出刺激,是由三方面的相互作用的解释聚丙烯,督导委员会,并枕。预防原则是脱离从目前关注的焦点位置负责,资深大律师的关注转移到新的位置,而是从读出的数
10、据专门索引位置。第二个注意的功能,目标检测,是开展了作者称之为前注意系统。他们声称,在大脑的额叶前部扣带回的部分是在参与这项工作。最后,他们国家的警觉性高的信号都是在蓝斑去甲肾上腺素的系统活动所产生。最近,已有证据表明,自上而下偏置信号源可能来自一个地区,顶叶和额叶皮质网络。这些领域包括顶上小叶,前眼领域,补充眼区,在顶下小叶,横向在额中前额叶皮质区域的家伙,和前扣带皮质区。结果表明,两个独立但相关联的大脑区域相互作用与自下而上和自上而下的注意力机制,支持这些结论。总括来说,它已经知道没有一个单一的大脑区域,控制注意力,相反,一些领域已核实为成注意过程参与。但具体的任务和每个区以及跨其中扮演行
11、为仍然是一个开放的问题。3有效图像处理灵感来自于人类视觉机制尽管我们对人类视觉机制现有知识的了解,其复杂性使得这个还不可能构建一个完整的生理模式。过去几十年它已经尝试取得了一些成果,但智能机器视觉模型是远远不及了人类视觉系统的。31图像预处理方法及处理结果的灵感来自视网膜的生物人类的视网膜是一个权力下放分析和连续时间系统,并有与图像处理相关的重要性质。有关这些属性的简短详情列载于表1。根据早期的作品,视网膜计算模型主要分为两大类第一类是使用筛选模式,创造了视网膜的中心,周围结构,或视网膜,显示了相同的结构是使用硅芯片的集成设备,第二类包括每一个模型,一个巨大的细胞类型模拟在一个非常有限的区域上
12、的方法。过滤建模的视网膜的例子中可以找到一些文献。首先,这些过滤器使用高斯内核,对内核的参数调整,以创建过滤器的大小和形状。该过滤器的大小决定了细胞的感受行。因此,过滤器可以调整为与周边中心凹造型。过滤器的形状上创建中心和非中心结构,反之亦然,以模拟视网膜。这种类型的造型非常适合计算机快速模拟。然而,有人认为,有更多的视网膜结构,而这些相对简单的执行功能也是组成其结构。据调查,多种类型的细胞之间的相互联系创造超越由过滤器生产的增强功能模型。另一项发现,近年来有在试图模仿视网膜光变空间分辨率成像受体分布的一些文献。似乎有四个广泛的实施办法几何方法,以质量为基础的方法,多分辨率的方法,对核函数积分
13、算子的基础的方法。几何方法是实现从统一前使用视网膜中央凹视网膜取样几何图像空间分辨率的变种。这种方法的困难是,原来位于图像的像素点整数被移动到非整数位置的网格,因此很难为它们编制索引。基于质量的视网膜中央凹成像的方法,在这些文献中发现,这是比上面介绍的HVS更接近几何方法。虽然这种做法表明的承诺,但目前还不清楚人类视觉系统的空间灵敏度可与DCT的质量因素密切相关。块体边界文物也成为一个地方的问题远离中心凹。以多分辨率的优势,盖斯勒和佩里提出的一个形象表现为视网膜中央凹成像金字塔使用。目前已在近几年的增殖与各种文学小波变换多分辨率成像视网膜中央凹。最后,出现了一些试图用不同的参数模型和视网膜中央
14、凹其统一的形象和预核函数的图像重建新文学的纯数学运算符。结果表明,这些公司属于充分研究算子代数,以及近似均匀的预图像恢复是可行的。但是,选择核函数将是困难的,因为对不同的内核函数的积分运营商的变种,必要和充分条件。视网膜芯片的例子可以在某些特定的文献。这些说法是,芯片晶体管网络模拟神经细胞的发射。这些芯片是非常快,因为它们的性质在视网膜上是平行的。这些例子中所看到的困难是,他们的结构非常几何。他们使用一个电阻网络,建立相互联系。每个连接点,它代表一个像素,具有特定的几何图案连接到邻近的像素。一个像素的两个距离另一像素必须穿过中间像素的效果。但是,正如阁下DAVSON规定,视网膜是轴突和树突的交
15、错编织。每个细胞的动作只会影响到它的细胞连接。互连矩阵更密切相关的生物,因为它们描述的连接,可以跳过一个特定的细胞,如果需要的话。32形象感知的方法和结果的灵感来自生物视觉皮层更高级别的知觉,如轮廓,形状和对象,都建立了由人类视觉皮层的复杂处理过程。特别是,人类系统具有查看不变的物体,如环境感知能力或进程的共性。当应用于图像处理,研究计算模型是在最近才有深刻的启发。321首先启发子空间方法和缓慢的学习功能,为本地的不变性该子空间的重要性在于,它允许子空间特征,代表了在空间相关程度图像结构,而在该组的子空间方法是不变的这种转变。从神经科学的角度来看,这种反应主要表现是类似在哺乳动物视觉皮层的复杂
16、细胞的转变。复杂的细胞反应是在不能由来自视网膜上的像素强度线性变换解释皮质处理的第一阶段,但它需要一个简单的多细胞的类似功能团体的反应非线性分离。因此,复杂的细胞模型是前沿不变的反应,建立在大脑皮质机械中。有些版本的子空间方法强加的功能或设置一个网络拓扑图,迫使附近的地图部分类似功能的学习一样,也发生在皮层。自适应子空间方法,开始显示出图像的自动描述和检索使用。另一个地方不变性建模方法不对网络上的子空间的经验上,但让他们出现在一个有原则的方式。现场发现了典型的运动不变性类似于自适应图像稳定,本地执行,并已被称为慢的特点学习。另一种方法,被称为时间相干性学习,旨在组件,在应对自然视频序列的一些拥
17、有相对较短的时间周期自己的活动时间相关性。322第二启发层次和多方面的造型特征分析组合性是一种在神经科学和机器学习研究相对欠发达地区。早期工作确定了成分分析方法和层次表达结构成分的需要。组成的一个解析的功能分析方法层次最近的例子是多层HMAX的物体识别方法。对象是博学多才的观点在调谐单位的最高水平。实践中,明确综合功能层次的想法似乎与PANEDMONIUM模型,在这种信号的输入信号在一个层次的先后顺序,最终决定于行为起源融合处理的恶魔的报告。这个概念后来被投在与认知控制,它使用的加工步骤,以发展平移不变的视觉模式识别神经结构方面。在计算机视觉,层次分析法的功能运作良好学习联想到旋转的多种意见“
18、的文件夹“对象,这是人为的图像产生的使用所作的线段注册三维刚性物体的二维投影。从识别的意见,副署长李建议,人类感知的方式,在分流对象,TENENBAUM、ROWEIS等。提出了嵌入在低维凡感官数据的真实维度自由度可以明确参数化,可视化的子空间的高维流形类似的方法。流形学习的本质是,当采样数据在低维流形空间,他们的维度可以归结为显示固有的低维流形几何分布规律。这样,流形学习方法可以更好地揭示对象的本质特征。这种非线性非监督学习方法简单,直观和有效。目前,其主流的方法包括局部线性嵌入(LLE),等规度映射(ISOMAP算法),拉普拉斯特征映射,局部保持投影(LPP),随机邻居嵌入(SNE)的,图表
19、一流形,局部线性光滑等一般来说,层次和多方面的造型特征分析的基础上观测到的数据点感觉邻里关系。在图像识别,两种方法都很好地利用了特征提取,从而起到自下而上的物体识别的关键作用。然而,人类视觉系统感知与自上而下相关的自下而上的方法外面的世界。因此,从功能层次和多方面的造型特征分析信息,为进一步较好的识别结果困难。在事实的基础上,生物激励特征提取是图像处理具有挑战性的工作,以及结合自下而上和自上而下的办法可能更有效的特征分析。323第三启发以人关注系统的目标识别和分类迄今为止,电脑视觉能解决一般物体识别。为了使这一进展,有必要考虑什么人都能够做到人类在识别物体上做的非常好。根据神经科学,人类感知对
20、象的识别是通过两个步骤首先,注意过程中选择一个感兴趣的区域,二是复杂的对象仅限于承认这些地区。在下面的两个段落,我们会检讨对上述两个方面分别最具影响力的工作。近年来,在研究增加视觉注意力的兴趣有所提升,建立了一套种类繁多方法用于识别和分类计算系统。对于一个视觉注意计算架构的第一个办法是由KOCH和厄尔曼提出的。KOCH和厄尔曼的工作的重要贡献是WTA的网络一个神经网络决定了一个最突出的区域地形图。当它首次发表,该模型还没有实施,但它提供的算法推理作为后期实施和目前许多视觉注意计算模型的基础服务。对视觉注意力系统最早的一个实现是由米兰实现的。他们用于计算的特征映射过滤器操作。这些模型特别适合应用
21、到现实世界的场景,因为筛选操作,并提供有效的现场性能检测有用的工具,如对比或定向边缘。视觉的神经形态工具包是一个有用的广泛关注计算机视觉系统。从输入图像,计算三个特征颜色,强度和方向。对于每项功能,图像金字塔是建立在不同的尺度,使计算。它的扩展模型在给定的文献报道。其他复杂的系统,提出关注,这使得对分层对象为基础的感兴趣区域选择的重要贡献。在人类感知的第二个步骤执行复杂的物体识别。这是很难产量由去年仅高品质的分类识别结果。因此,关注和识别物体相结合,取得了最近的兴趣。一个例子就是提交妙和ITTI。由于该模型模拟了在初级视觉皮层的结构复杂,被检测的对象是在人工图像椭圆和矩形。可视化系统提出注意结
22、合低的SIFT特征关键点检测,他们成功地完成复杂场景中的多目标识别。分类系统的一些其他的例子中找到更多的文献。这些案件包括三个主要部分组成生物激励视觉选择性注意,知识结构和视觉信息聚类。特别是湖东提出的方法结合自下而上和自上而下的选择性注意信息处理机制。其他几个工作组也已在此采用自下而上和自上而下的系统领域的关注,但很多重要问题需要解决,实现高智能图像识别的呼吁。4总结和讨论生物启发图像识别机器视觉是一种巨大的挑战。灵感来自人类视网膜计算模型广泛用于前处理的图像,这有利于数据压缩,降噪,对比度增强,边缘增强,图像增强。特别是,动态预测编码,发现人类视网膜,图像处理的重要。视觉皮层中的信息机制,
23、从神经科学的角度进行审查,分别给出启发图像理解的生物状态。一些有用的机器学习方法子空间方法,特点是学习过程比较缓慢慢,从层次特征分析,流形造型系统和人类的关注提到的物体识别。综上所述,人类视觉系统是不完全知道,因此有必要进一步研究探索早期视力,中层视觉,注意力,识别,机器人,视觉系统和认知。下列三个主题仍然是计算机视觉良好的价值1人类视觉系统和自然景观之间的统计特性感知机制的关系。特别是,对自然场景统计特性的研究有助于了解视觉选择注意。另一方面,人类视觉系统的生物机制可能被认定简单地从与知觉对象的统计特性分析。2如何提高了图像处理的效率。正如本文所述,这些方法不能完全呈现模仿,模拟真正的生物结构和信息人类视觉系统的机制。有先进的图像处理及其在人类视觉系统对象的识别机制选择具有明显的特点是基于内容的图像感兴趣区域的看法。然而,这是很难实现计算机视觉。3建筑智能化机器人,也是模拟人类视觉系统的最终目的。今天,机器视觉的能力,人类远远高于它。这个问题的核心是如何改变高维的低维空间机收集的数据,从而快速识别天然的目标和效率。简单地说,是如何计算的确认方法由已知或未知的功能这个答案可能在未来的研究里发现。