人体检测方法研究与实现【文献综述】.doc

资源描述

1、毕业设计文献综述计算机科学与技术人体检测方法研究与实现一、前言部分人体的检测和实现是计算机视觉研究的主要问题之一，它融合了图像处理、模式识别、自动控制、人工智能及计算机等许多领域的先进技术，在无人机视觉导航、视频监控、医疗诊断、智能交通等方面都广泛的应用。人体目标的检测的目的是从序列图像中将变化区域从背景图像中提取出来，运动区域的有效分割对于目标分类、跟踪和行为理解等后期处理是非常重要的。然而，由于背景图像的动态变化，如天气、光照、影子及混乱干扰。在此，只研究在背景静止状况下的人的运动 1。所谓跟踪，就是对图像序列中的运动物体，通过提取它的某些特征，并且把这些特征从一幅图像到另一

2、幅图像匹配起来，这个过程叫作跟踪。运动跟踪主要通过建立目标链来实现，目的是获得运动物体的运动轨迹。如果把所有的这些图像重叠起来，就可以得到这个运动物体的运动轨迹，所以运动物体的跟踪也可以看作是对运动物体的运动状态进行估计。二、主题部分人体检测系统的分析研究具有广泛的应用前景， Gavrila 总结了它的一些主要应用领域，下面对其典型应用做出进一步的介绍。运动人体检测、识别、和跟踪技术是人体运动分析的重要内容，也是计算机视觉研究的重要领域之一。它在智能监控、虚拟实现、人机交互、辅助临床医学诊断等领域均具有广阔的运用前景和经济价值。近年来，随着中国城市化建设不断深入，大型城市（如上海、北

3、京、广州）的人口呈爆炸式增长，随之而来的交通压力也日益增大，矛盾日益突出。本文主要是针对城市交通环境下如何保障行人交通顺畅和出行安全等问题，研究了摄像机静止情况下基于单目视觉的运动人体检测、识别和跟踪方法，详细介绍了从复杂场景中分析行人运动的算法研究和编程实现的过程。智能系统的需求主要来自那些安全要求敏感的场合，如银行、酒店、停车场等，目前监控摄像机在商业应用中已经普遍存在，但是并没有充分发挥其实际主动的监督作用，因为它们通常是将摄像机的输出结果记录下来，当异常情况（如停车场中的车辆被盗）发生后，保安人员才能通过记录的结果观察发生的事实，但往往为时已晚。而我们需要的监控系统能够每天连续 2

4、4 小时的实时监视，并自动分析摄像机捕捉到的图像数据，当盗窃发生或发现到具有异常的行为可疑的人时，系统能向保卫人员准确几十地发出警报，从而避免犯罪的发生，同时也减少了雇佣大批监视人员所需要的人力、物力和财力的投入。现在，在很多场合我们都可以看到一些用于监控的摄像头。如银行，超市，商场，居民社区，停车场，教室，高速公路等，可以说监控的应用无处不在。但目前大部分的监控是由相关人员通过监视器进行人工监控，这样由于监控的区域过大或监控时间过长使人产生疲劳，造成一些区域的漏检，没有对一些异常情况做出及时的反应，失去了监控的作用。因此，人体检测技术的应用，可以使通常被动的监控成为智能的主动的监控。当一

5、些人员出现在场景中，我们的监控设备就会自动检测出人体，通知监控人员。这样一方面可以减轻监控人员的工作，减少一些人力，物力和财力的投入。另一方面可以提高家弄的准确度，可以及时对异常情况进行报警，减少不必要的损失。同时，人体监测还可以对交通管理，地铁，及其他公共场所的人流信息进行分析和计算。运动检测是一项相当困难的工作，下面归纳出目前几种常用的方法【 2】： 1。背景减除。背景减除方法是目前运动分割中最常用的一种方法，它是利用当前图像与背景图像的差分来检测运动区域的一种技术，它一般能够提供最完全的特征数据，但对于动态场景的变化，如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均

6、图像，大部分研究人员目前都致力于开发不同的背景模型，以期减少动态场景变化对于运动分割的影响。 2。时间差分。时间差分方法是在连续的图像序列中两个或者三个相邻帧间采用基于像素的时间差分并且阀值化来提取图像中的运动区域。 3。流光。基于流光的运动检测采用了运动目标随时间变化的光流特征，如 Meyer等通过计算位移向量光流场来初始化基于轮廓的跟踪算法，从而有效的提取和跟踪运动的目标。该算法的优点是在摄像机运动存在的前提下也能检测出独立的运动目标。然而，大多数的光流计算方法相当复杂，且抗噪性能差，如果没有特别的硬件装置则不能被应用于全帧视频流的实时处理 2。在摄像机静止的情况下，本文首先采用 Dir

7、ectShow 技术读取视频流，并对场景进行初始化，利用初始不含前景的连续 N 帧图像构造初始的背景模型，然后根据一定的刷新速度更新背景模型，使它能够适应缓慢的光照变化。当有运动目标出现时系统立即用背景差分法进行检测，如果差值象素面积大于阈值说明是前景（否则重新检测）可检测到运动区域的大小和形心坐标（ x,y） , 在一定的时间间隔 t（ t1s）后，再次利用背景差分法检测运动区域，如果差值象素面积小于阈值，说明运动物体刚进入就消失了，这可能是光线的剧变或强烈的干扰，跟踪结束，等待目标进入监控区域。否则在视频图像中可检测到当前帧的运动区域的形心坐标（ x y）。由两个形心坐标（ x,y）和

8、（ x y）。可算出运动物体的初始速度 X， Y 再通过粒子滤波器技术利用背景差分法检测和运算得到的目标区域的大小、形心坐标、初始速度三个参数建立跟踪模型，对运动目标进行跟踪，直到运动目标离开监控区域。该方法很好的解决了人体目标跟踪问题，可广泛应用于非线性非高斯系统。一般来说，运动目标检测算法有两种分类方法：一是按被监测场景分为室内场景监测和室外场景监测；另外一种分类方法根据由运动目标所形成的图像序列分为静止背景和运动背景的目标检测，当视频监测系统中摄像头与场景之间处于相对静止的状态，那么背景图像的大小和位置在不同帧中将保持不变，当前，对于这种情况常用的运动目标检测方法主要有光流法，帧间差

9、分法和背景减除法等，然而，这三种方法都存在一定的局限性。本文主要针对室内，静态背景下的运动人体进行检测。人体检测是对象检测中的一个极难的问题。在很多学者眼中甚至是计算机视觉中最难的问题之一。人体检测问题几乎涉及到计算机视觉从低层的特征提取到高层的图像理解的全部问题，而其还有其他问题所不具备的独有难题，其主要的难题有以下几点： 1，对象复杂性高：相对于车辆，文字等几何，颜色，纹理比较简单的对象而言，人体的对象要复杂得多，因此很难用简单的模型对其进行描述。读取视频图像场景初始化添加背景模型当前帧与背景差分获取目标大小形心设定时间间隔t 当前帧与背景差分结束跟踪人体运动目标用粒

10、子滤波器跟踪模型由两个形心坐标算初速度获取目标形心坐标面积大于阀值面积大于阀值跟新背景模型颜色与纹理信息的多样性：人体由于衣服，肤色，光照等的变化，不同的人在灰度以及颜色空间上拥有不同的特征。同样由于不同的人有不同的衣服样式或者肤色变换的不同，在纹理特征方面也没有统一的特征模式可寻。 2，姿态的多样性：由于人体不是一个刚体模型，很难用一个统一人体模型对其进行描述。相比较而言，人脸等问题由于大体上眼耳鼻嘴等位置分布有较为固定的模式，可以相对容易的建立起模型框架。而人体在运动的时候，其姿态是完全不一样的，其各个部分的组合很难找到统一的模式去定义或者描述，这也增加了人体监测

11、的难度。 3，视觉的多样性：与很多情况下人脸检测识别不同的是，人机检测的应用情况统筹并不像人脸检测识别那样是在固定的视觉（正常）情况下得到的，人体检测中的人体可能是从正视或者测试等不同的视觉角度来进行观测的，更有可能从俯视，平视或者仰视的不同角度观看。所以视觉的多样性也是人体检测中的一个难题。综上所诉，人体检测目前在计算机视觉研究领域还远未成熟。而不同的学者也在通过不同的途径进行研究，通常情况下都是将复杂的问题简化在一定的条件下利用现有的方法进行改进的检测。文本主要研究固定摄像头拍摄下的视频序列中检测出运动人体的问题。该系统预期达到的目标为：在静止画面中能准确分析提取并区分和标记运动的人体

12、。三、总结部分尽管人体检测的分析与研究已经取得了一定的成果，但仍然有许多问题需要解决，而随着其他相关技术的发展，下述几个方面已经成为未来的发展趋势： 1，音频与视觉相结合的多模态借口。人的相互交流主要是依据语言，过去的许多工作是语音理解，但语音识别受距离和环境噪音的限制，尤其在机场等高噪音声环境，将会严重影响语音识别的性能。 2。人的运动分析与生物特征识别相结合。在智能房间的门禁系统、军事安全基地的视觉监控系统、高级人机交互等应用中，人的运动分析与生物特征识别相结合的研究日益显得重要。 3，人的运动分析向行为理解与描述高层处理的转变。人的行为理解是需要引起高度注意并且是最具有挑战的研究方

13、向。因为观察人的最终目标就是分析和理解人的行为、人与人之间及人与其他目标之间的交互等。人体检测技术已经成为计算机视觉中的一个重要研究领域，它在各个方面的应用前景引起了广大科研人员的浓厚兴趣。近来的技术发展更是证明了人体检测的实用性，而且许多研究者们正逐渐将其成果推向更加智能的应用场合【 2】。四、计划进度第七学期第 10 周至第 18 周（ 2011 年 01 月 06 日前）：文献检索和资料收集，完成毕业论文（设计）文献综述、开题报告和外文翻译；第八学期第 1 周至第 3 周（ 2011 年 03 月 11 日前）：撰写论文提纲，完成毕业论文（设计）初稿、需求分析和概要设计

14、；第八学期第 4 周至第 12 周（ 2011 年 05 月 13 日前）：详细设计、系统调试、和毕业论文（设计）完成定稿；第八学期第 13 周（ 2011 年 05 月 20 日前）：完成应用软件系统的设计和毕业论文（设计）送指导老师和评阅老师评阅，准备答辩；第八学期第 14 周：参加毕业论文（设计）答辩。五、参考文献 1 陈明，蔡自兴。基于 DirectShow技术的移动机器人视频采集系统 J。华中科技大学学报：自然科学版， 2004(Z1)： 87 89。 2 王亮，胡卫明，谭铁牛。人运动的视觉分析综述 J。计算机学报， 2002， 25(3)： 225 237。 3 周术

15、诚 ,周明全 ,耿国华，基于小波变换的自适应阈值三维图像分割 J，计算机应用与软件， 2006,23(10):20-22。 4 王剑峰，肖国强，江健民综合距离和相关性的图像检索算法 2007(10)。 5 杜庆海 ,于忠清 ,张佳，基于不变矩特征的图像识别，信息技术与信息化。 2008， (6)。 6 侯志强，韩崇昭。视觉跟踪技术综述 J。自动化学报， 2006(4)： 603 617。 7 宋磊，黄祥林，沈兰荪。视频监控系统概述 J。测控技术， 2003(5)： 33 35。 8 范勇 ,等，一种快速运动目标检测和跟踪算法，光电工程 ,2000， 12 9 刘雷。人体运动建模仿真方

16、法研究 J。计算机仿真， 2009(1)： l66 168。 10 孙剑，李克平。行人运动建模及仿真研究综述 J。计算机仿 11 图像工程（上册）图像处理和分析章毓晋清华大学出版社， 1999 12 王安静，陈玲等。用 Vc+实现图像连通区域标记。电脑编辑与维护技巧， 2003， 1：74-77 13 杨莉，李玉山。复杂背景下的多运动目标轮廓检测。电子与信息学报。 2005， 2（ 2）。306309， 14 I-7Neri A， Clonnese S， Russo G， et a1。 Automatic Moving Ob ject and Background SeparationJ。 Signal Processing， 1998， 66： 219 232。 15 Peter Meer。 Real Time Tracking of Non Rigid Objectsusing Mean ShiftA。IEEE CVPRfC。 2000

展开阅读全文