1、 西南科技大学本科生毕业论文 基于 Kalman 滤波的视频目标跟踪方法摘要:在计算机视觉的应用中,视频目标的识别和跟踪是一项重要的研究课题,它融合了军事和民用等许多领域的先进技术,包括图像处理、模式识别、人工智能、医疗诊断等,它在人机交互,军事制导、智能交通、医学图像处理等许多方面有了广泛的应用。但是,由于受到光照的变化、噪声、遮挡、同色等诸多因素的影响,要在视频序列中实现稳定的跟踪并准确的分析目标运动的变化,现有的算法在实际应用中面临许多问题,因此,研究和设计可靠地视频目标跟踪方法仍具有很大的挑战。本文首先论述了课题的背景、意义以及现状,并对常用的运动目标跟踪适用方法中帧间差分法、背景差分
2、法、光流法等目标检测的基本方法进行介绍和对比,并对其应用的优劣以及适用范围进行说明,为后续 Kalman 滤波器的实现奠定基础。本文在分析目标跟踪和检测的基础上,进而深入探讨 Kalman 滤波的基本理论以及算法的实现、实现的性能,分析 Kalman 滤波在线性运动中的目标检测的应用及优缺点,其次,在此基础上探讨扩展 Kalman 滤波在非线性运动中的目标检测的应用,最后,通过对算法的改进并利用 Matlab 对该算法的精确跟踪进行仿真与误差分析。关键词:Kalman 滤波;目标检测;目标跟踪;扩展 Kalman 滤波西南科技大学本科生毕业论文 第一章 绪 论 .11.1 课题研究的背景及意义
3、 .11.2 目标跟踪技术的研究现状 .21.3 各章节内容安排 .3第二章 经典目标检测技术 .52.1 背景差分法 .52.2 帧间差分法 .72.3 光流法 .82.4 本章小结 .10第三章 Kalman 滤波理论及算法 .113.1 线性离散 Kalman 滤波器基本方程 .113.2 线性 Kalman 滤波器算法 .133.3 Kalman 滤波的特性 .153.4 扩展 Kalman 滤波器 .163.5 本章小结 .20第四章 Kalman 滤波的视频目标跟踪算法 .234.1 视频目标跟踪技术的基本要求和流程 .234.1.1 视频目标跟踪技术的基本要求 .234.1.2
4、视频目标跟踪流程图 .244.2 基于 Kalman 滤波的视频目标跟踪算法 .244.2.1 基本参数的讨论 .244.2.2 Kalman 滤波器在视频目标跟踪中的应用 .344.4 仿真实验和实验结果分析 .374.5 本章小结 .43第五章 总结和展望 .435.1 总结 .435.2 展望 .44致谢 .44参考文献 .45西南科技大学本科生毕业论文 0第一章 绪 论1.1 课题研究的背景及意义随着社会信息化的普及与计算机技术的发展,人们对多媒体信息的需求不断的增长,利用计算机实现人类视觉功能成为目前计算机领域中最热门的课题之一,促使着计算机视觉 【1】 的发展,计算机视觉是一门综合
5、性、交叉性很强的学科,涉及范围也很广,主要包括:图像处理、人机交互、模式识别、医疗诊断等。运动目标跟踪作为其必不可少的核心内容之一,是对视频图像序列中的运动目标进行检测、识别和跟踪,在获得运动目标的特征信息之后,通过进一步的处理和分析,达到对运动目标的行为进行解释和描述,以完成跟高级任务的目的。运动目标跟踪 【2】 在技术上视频图像处理、计算机图像处理、模式识别以及人工智能等多个领域,因此具有较强的研究价值。并且它的应用非常广泛,如在商业上对银行、商场、写字楼等设施的监控;在公共事业上对车站、交通、机场等设施的监控;在军事上对基于军事制导、雷达导航的跟踪系统等。目前,运动目标跟踪技术已经被广泛
6、应用于人们的生活和工作,其主要应用领域包括以下几个方面:(1)在智能交通领域,智能交通信息分析系统可以在不需要人为干预的情况下,通过固定摄像设备获取道路上的车辆信息,借助计算机软件对视频帧序列进行分析,完成车辆、行人等目标的自动记录、获取、检测和跟踪,分析交通事故,记录违章车辆的信息,进行车辆异常行为以及行人行为的判定等,进一步分析和判断其行为,可以对违规车辆进行跟踪,从而实现对交通的自动监控。(2)在军事上,精确制导、精确打击的武器是军事研究领域中的一个热点,其中打击精度主要依赖于制导技术,这种技术相比红外线和雷达等装置具有精度该、抗干扰能力强,分辨率高等特点,其精确制导系统利用了人工智能、
7、信号处理、图像处理等技术,能够独立的检测,跟踪和攻击目标,只要目标跟踪准确就可以准确击中目标。(3)在人机交互方面,目前,人们通过键盘和鼠标和计算机进行交互,但西南科技大学本科生毕业论文 1随着技术的提高,人们希望能更快捷的、更智能化以及人性化的人机交互方式,随着语音识别、指纹识别和图像识别等技术的发展,人机交互得到了大大的简化,通过运动目标检测和人脸识别,使得计算机更容易收集人体行为变化的视频信号,在利用计算机相关理论分析视频信号,最终分辨出人体的动作,从而使用户与计算机的交互更加智能化。(4)在医疗领域,现代医疗中的病情诊断都无一例外使用着超声波和核磁共振等技术,拍摄器官影像由于使用了目标
8、检测、跟踪技术,可以让获得实时的人体内器官的运动特征信息,因此可以通过对不同时刻图像之间的变化来估算和获取人体器官的运动变化信息,从而对病人进行检测、诊断,为准确做出有效的治疗方案提供重要的参考。(5)在日常生活中,运动目标跟踪技术也应用广泛,在医院,机场,银行等重要公共场所,运动目标跟踪技术为安保、安检等部门提供了有效的监控手段;在天气预测方面,通过对气象卫星传送的视频目标帧序列进行预测,可以准确的估算出云层动态、风向和风速等从而实现对天气情况进行预测。但由于在实际情况中收到光照变化、噪声和遮挡等因素的干扰,运动目标跟踪的有效性和精确性受到了不同程度的影响,进而对最终的判断产生影响。因此研究
9、实时性好、准确率高、稳定性好的运动目标跟踪方法具有很大的挑战性,但运动目标跟踪的研究很具有意义,其研究成果也很广阔的应用前景。1.2 目标跟踪技术的研究现状在过去的四、五十年中,随着计算机技术的不断发展,越来越多的国内外学者对视频运动目标的检测和跟踪做了广泛而深入的研究,提出来了许多有效的方法,也出现了各种面向于复杂环境中的视频跟踪系统。自 20 世纪 60 年代以来,目标跟踪技术得到了极大的发展。国内外很多机构和学校都在研究,如美国国防高级研究计划局、麻省理工学院;国内的上海交通大学、清华大学、浙江大学等也都取得了一定的研究成果。从当前的研究情况可以看出,国外在视频运动目标检测和跟踪的理论研
10、究以及实际应用比国内早。美国在考虑到国防安全等问题时开发了一种为未来战场的监控和日常生活等自主视频解析技术,一些国际性的大企业如西南科技大学本科生毕业论文 2IBM、Microsoft 等公司正在逐步将手势识别、语音识别和面部识别等技术应用到商业领域中;英国雷丁大学在对车辆和行人的跟踪以及交互识别的相关研究;美国马里兰大学开发的 W4 实时视频检测系统能共同时实现对目标的定位和分割的功能,并且还能通过建立运动目标模型来实现多目标的跟踪,以及目标在有叠加或者遮挡的影响下也能够进行准确的跟踪。国内虽然在运动目标跟踪技术方面的研究较晚,上世纪 90 年代,国内开始对运动目标检测与跟踪技术进行研究,清
11、华大学和上海交通大学等在图像识别与人工智能研究 【3】 等做了大量工作,通过多年的努力,我国在这一领域内也取得了许多显著的成绩。在国内的研究机构中,中科院自动化研究所建立了模式识别国家重点实验室,在交通场景的视觉监控、人的运动视觉监控和行为模式识别等方面取得了一定的成果,国防科技大学、西安电子科技大学、西安交通大学人工智能与机器人研究所等也在运动目标的检测和跟踪领域做了大量的努力,他们在人脸识别、指纹识别、图像处理等方面研究的同时,也提出了许多行之有效的思想和方法,比如算法融合的思想,在线多目标处理技术及分段控制随动系统策略等在很大程度上促进了国内在这一领域的发展。总的来说,尽管国内外大量学者
12、都在目标检测、识别和跟踪方面做了许多努力并取得了很多成果,目标跟踪相关技术以及算法都在不断深入,但由于在现实中需要面临的情况复杂多变,而且现阶段这些算法和理论还不够完善,因此此课题仍有需要解决的困难和技术难点,在理论研究和实际应用方面都具有很大的研究、应用和发展空间。1.3 各章节内容安排本文以静态环境下的视频图像作为研究对象,运用目标检测技术和图像处理相关知识将运动目标从视频帧序列中检测出来,然后利用 Kalman 滤波视频目标跟踪算法进行跟踪和数学软件 Matlab 进行模拟与仿真,最后对实验结果进行分析得出结论。为更好完成论文,本文个章节安排如下:第 1 章是绪论,主要介绍了课题的研究背
13、景和意义,回顾国内外运动目标检测与跟踪技术的发展现状,最后给出本文的主要工作和章节安排。第 2 章是视频运动目标检测技术的综述,对背景差分法、帧间差分法以及西南科技大学本科生毕业论文 3光流法等最常用的运动目标检测方法的思想和理论进行阐述,并对其应用过程中检测方法的优劣、适应的条件进行了比较,以及其检测结果的展示。第 3 章是 Kalman 滤波理论,主要对线性离散 Kalman 滤波的基本理论、算法、方程式和性质进行详细的介绍,然后从 Kalman 滤波应用的角度讨论了非线性扩展 Kalman 滤波以及其基本理论、算法,最后对它们在理论和应用的不同方面进行了比较。第 4 章是基于 Kalma
14、n 滤波的视频目标跟踪算法,首先介绍了运动目标检测的基本要求和 Kalman 滤波方程式基本参数关系的讨论,然后应用 Kalman 滤波进行大量视频目标跟踪,利用数学软件 Matlab 对其进行模拟和仿真,最后对其结果进行分析。第 5 章是全文的总结和展望,对本文所做的主要工作做了总结并对指出其不足之处,并结合相关知识对今后的研究内容提出了展望。西南科技大学本科生毕业论文 4第二章 经典目标检测技术一个完整的运动目标跟踪系统一般包括两个部分:运动目标检测和运动目标跟踪。所谓运动目标检测 【4】 就是目标跟踪实现的初始化过程,利用运动分析和特征分析等手段,从原始的视频帧序列的背景中将到要研究的运
15、动目标准确的提取出来,该过程基本任务是从图像帧序列中检测出目标运动的信息,简化图像处理过程并得到所需的运动矢量从而能够检测到被跟踪的目标。视频目标跟踪往往会受到其他物体运动的干扰或者周围环境变化的影响,能否快速且清晰地将目标检测出来,将直接对下一步的运动目标跟踪甚至整个跟踪系都会产生非常大的影响,因此应该给予足够高的重视。现阶段,运动目标的检测方法并没有一个通用的方法,比较常用的方法有背景差分法、帧间差分法和光流法 【5】 。这三种方法各有不同的优缺点,下面将对它们一一地进行介绍和比较。2.1 背景差分法背景差分法是目前运动目标中最为常用的一种方法,它的基本思想:在已知图像序列参考帧的情况下,
16、获得没有运动目标的背景图像,然后利用其后续的图像序列与背景图像做差,得到差值图像,通过阀值的设定,得到差分图像,从差分图像中很容易提取出运动目标。这种方法是利用当前图像与背景图像差值来检测运动目标区域,其中背景图像是没有运动目标的图像,它是提前获取的。背景差分法对于视频序列图像中场景固定的情形有很大的优势,它为背景静止的图像序列建立背景模型,然后将当图像和背景模型做差,根据图像像素点的灰度值来判断是否为运动目标,达到了检测的目的。其基本原理图如图(2-1)所示。西南科技大学本科生毕业论文 5视频图像序列背景模型输入图像差分图像 二值化 形态学 运动目标背景图像图 2-1 背景差分法流程图 由图
17、(2-1)可知,利用背景差分法对运动目标进行检测的前提是背景图像的获取,在当前图像帧,如果有运动者的目标进入,则与已知背景图相比较,它的部分区域会出现亮度变化。所以,在事先获得背景图像的条件下,将待检测的当前图像与已知背景图像进行差分并进行阀值化处理,就可以得到这些亮度变化的区域,也就是运动目标所在的区域。在背景差分中设当前帧图像 ,背景图像为 ,差分后的图像为 ,二值kfkBkD化后的图像为 ,视频序列第 k 帧像素(x,y)处的灰度值为 ,背景差分kT (,)kfxy法可以用以下公式表示:(2-1)(,)(,)(,)kkkDxyfBxy(2-2)0,1,()kkTT式(2-2)中 为 0
18、或 1 是分别表示非运动目标区域和运动目标区域,(,)kxy阀值 T 的确定可采用静态图像中阀值分割所使用的方法,当差分值大于给定的阀值 T 时,认为它是运动目标的像素,反之则认为它是背景的像素。西南科技大学本科生毕业论文 6图 2-3 原图 图 2-4 二值化图像背景差分法的优点在于算法实现简单而且实时性较强,在背景图像已知的情况下,简单的差分运算就能准确快速的分割出完整的运动目标,极大地减少了计算的时间,但在实际应用中存在较大不足之处,由于受到周围环境变化的影响,现实中往往难以获得准确的背景图像,从而导致差分图像的不准确,同时,由于阀值的变化,此算法的鲁棒性较差。在实际应用中,为了适应外部
19、不断变化环境的干扰,需要将此方法与其他方法相结合来克服环境受外部干扰的问题,实现北京模型的动态更新。2.2 帧间差分法帧间差分法是运动目标检测中使用最多的一种检测方法,帧间差分法是基于连续的图像序列中相邻帧做差分运算来提取运动目标,其基本思想是通过图像序列中相邻两帧之间的强相关性,对比相邻两帧做差分,在差分图像中,像素点的灰度不变的区域被减掉,然后通过判断差分图像的灰度值是否大于阀值来确定图像序列的运动特征,从而确定运动目标的位置和轮廓信息。其原理图如图(2-5)所示。西南科技大学本科生毕业论文 7视频图像序列第 k - 1 帧图像第 k 帧图像差分图像 二值化 形态学 运动目标图 2-5 帧
20、间差分法流程图由图(2-5)可知,利用帧间差分法对运动目标进行检测于利用背景差分法对目标进行检测的基本步骤大致一样,二者的不同之处在于背景差分法是将待测的当前图像与已知背景图像进行差分,二帧间差分法则是将连续相邻的两帧图像进行差分,故帧间差分法又称为两帧差分法。与背景差分法类似,首先设差分图像为 ,第 k-1 帧与第 k 帧图像像(,)kDxy素在(x,y)点分别为 与 , 通过差分与二值化处理后可得公式:1(,)kfxy(,)kf(2-3)1(,)(,)(,)kkkDffxy(2-4),0,()kkTTxy式中 T 为阀值,二值化的结果为 ,取值为 1 的像素点代表变化区域,,xy上述变化反
21、映了运动目标位置变化的性能主要受二值化处理过程中阀值选取的影响。显然,这种方法的优点在于算法实现简单,有较好的实时性,程序复杂度低,与背景差分法相比较不需要背景图像,能够克服背景差分法对背景图像的依赖性,对目标具有敏感性,且对光线等外部条件造成的干扰影响小,检测结果具有稳定性,在动态环境下具有较强的自适应性;其缺点是当目标像素点的灰度值均匀分布的情况下,只能提取出运动目标的大致边界和位置,不能获取完整的运动目标区域,无法检测出两帧间的重叠区域,容易产生目标内部的“空间”现象。为了克服帧间差分法存在不足,实际应用中有一种它的改进算法-三帧差分法。其原理和帧间差分类似,通过对相邻的三帧图像的处理来检测运动目标,分别计算前两帧图像和后两帧图像的差值图像并对得到的两个差分图像而值化