1、山东建筑大学信电学院课程设计说明书1基于视频的人体姿态检测一、 设计目的和要求1.根据已知要求分析视频监控中行人站立和躺卧姿态检测的处理流程,确定视频监中行人的检测设计的方法,画出流程图,编写实现程序,并进行调试,录制实验视频,验证检测方法的有效性,完成系统软件设计。2.基本教学要求:每人一台计算机,计算安装 matlab、visio 等软件。二、 设计原理2.1 图像分割中运动的运用(运动目标检测)首先利用统计的方法得到背景模型,并实时地对背景模型进行更新以适应光线变化和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在 HSV 色度空间下检测阴影,得到
2、准确的运动目标。噪声的影响,会使检测结果中出现一些本身背景的区域像素点被检测成运动区域,也可能是运动目标内的部分区域被漏检。另外,背景的扰动,如树枝、树叶的轻微摇动,会使这部分也被误判断为运动目标,为了消除这些影响,首先对上一步的检测结果用形态学的方法进行处理,在找出经过形态学处理的后的连通域,计算每个连通域中的面积,对于面积小于一定值的区域,将其抛弃,不看做是前景运动目标。2.2 bwlabel 函数用法:L = bwlabel(BW,n)L,num = bwlabel(BW,n),这里 num 返回的就是 BW 中连通区域的个数。返回一个和 BW 大小相同的 L 矩阵,包含了标记了 BW
3、中每个连通区域的类别标签,这些标签的值为 1、2、num(连通区域的个数) 。n 的值为 4 或 8,表示是按 4 连通寻找区域,还是 8 连通寻找,默认为 8。四连通或八连通是图像处理里的基本感念:8 连通,是说一个像素,如果和其他像素在上、下、左、右、左上角、左下角、右上角或右下角连接着,则认为他们是联通的;4 连通是指,如果像素的位置在其他像素相邻的上、下、左或右,则认为他们是连接着的,连通的,在左上角、左下角、右上角或右下角连接,则不认为他们连通。2.3 regionprops 统计被标记的区域的面积分布,显示区域总数山东建筑大学信电学院课程设计说明书2函数 regionprops 语
4、法规则为:STATS = regionprops(L,properties)该函数用来测量标注矩阵 L 中每一个标注区域的一系列属性。L 中不同的正整数元素对应不同的区域,例如:L 中等于整数 1 的元素对应区域 1;L 中等于整数 2 的元素对应区域 2;以此类推。返回值 STATS 是一个 长度为 max(L(:)的结构数组,结构数组的相应域定义了每一个区域相应属性下的度量。Properties 可以是由逗号分割的字符串列表、包含字符 串的单元数组、单个字符串all或者basic。如果 properties 等于字符串all,则表 4.1 中的度量数据都将被计算;如果 properties
5、 等于字符串basic,则属性:Area,Centroid和BoundingBox将被计算。Area 图像各个区域中像素总个数BoundingBox 包含相应区域的最小矩形Orientation 与区域具有相同标准二阶中心矩的椭圆的长轴与 x 轴的交角(度)三、 设计内容3.1 理论依据3.1.1 应用背景与意义随着监控系统到位,以帮助人们甚至完成监控任务。可以减少人力和财力的投入,由于就业监视人员进行。另外,如果长时间不运动图像信息记录,保存几下,就失去了意义和视频监控系统的存储资源浪费存储空间。因此,传统的监视系统浪费了大量的人力,并有可能引起报警,性能差的实时监控的泄漏。监控等实时行为分
6、析系统来识别人体,不仅可以替代监控人员的工作的一部分,提高监测系统的自动化水平,同时也提高监视存储的效率,还有一个广泛的应用,并在视频监视系统的潜在经济价值之前。由于人的行为具有自由的伟大程度,因为身体宽松长裙不同程度和它的外貌和从图像捕获设备位置不同距离的表现风格将是一个很大的分歧,这是人的行为分析,找出了一定的难度。但是,人类行为的实时分析,智能监控系统,以确定关键技术及其广阔的前景药,安全性,虚拟现实,军事和潜在的经济价值,国内外研究机构和学者越来越多的关注,并在许多全球领先的刊物和会议专题讨论。美国和欧洲都进行了一些相关的研究项目。3.1.2 运动分割算法首先利用统计的方法得到背景模型
7、,并实时地对背景模型进行更新以适应光线变化山东建筑大学信电学院课程设计说明书3和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在 HSV 色度空间下检测阴影,得到准确的运动目标。本次采用了基于累积差分和数学形态学处理的运动区域提取算法。在时域窗口内,首先对图象进行降级处理得到灰度带图象,对灰度带差分图象累积并进行数学形态学处理得到运动目标的轨迹模版,将轨迹模版与当前帧差分图象与运算得到当前帧运动目标象素,最后进行多级数学形态学处理得到当前帧运动区域。实验结果表明,该算法不仅能够对静止背景序列运动区域有较好的分割结果,而且在没有进行全局运动补偿的情况下,对
8、部分运动背景序列也能成功的提取出运动区域。3.1.3 研究人体姿态的特征描述BoundingBox 包含相应区域的最小矩形Orientation 与区域具有相同标准二阶中心矩的椭圆的长轴与 x 轴的交角(度)3.2 方案设计根据设计要求确定视频监控中行人分割和人体姿态识别的方法,选择确定运动目标检测、行人人体姿态特征信息提取实现方法。画出流程图见附录 2 并对各部分功能进行说明。(1)判断是否为人体在目标提取之前,首先要对输入的图片进行检测。本文通过连通域的面积来检测判断目标是否为人体。 (2)人体目标提取 如果是人体导入背景图片与背景图片做差,再通过背景差阈值分割法进行提取。 (4)行为识别
9、 在解决了以上的问题之后,接下来就是要选择一种合适的算法来进行人体姿态识别,这也是本文研究的重点和难点。本文采用人体目标的连通区域的长宽比例和方向角的方法来对人体行为进行识别。3.3 程序设计根据设计要求确定视频中行人检测和人体姿态特征信息提取方法,进行程序设计,编写实现程序,使用 matlab 等软件。3.3.1 图像分割中运动的运用(运动目标检测)运动目标检测首先利用统计的方法得到背景模型,并实时地对背景模型进行更新以山东建筑大学信电学院课程设计说明书4适应光线变化和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在 HSV 色度空间下检测阴影,得到准
10、确的运动目标。该段程序读取了视频从 100 帧到 400 帧的图像。先对导入视频采用近似中值滤波背景模型参考图像实现运动目标分割,然后创建边长为 3 的方形结构元素,用于对分割结果形态学滤波。原视频、近似中值滤波后的视频以及采用形态学滤波后的视频如图3.3.11 所示图 3.3.11 原视频、近似中值滤波后的视频以及采用形态学滤波后的结果videoObj = VideoReader(gyz.avi);本程序使用了 VideoReader 函数, 该函数用于读取视频文件对象。函数调用格式:obj = VideoReader(filename)obj = VideoReader(filename,
11、Name,Value)其中 obj 为结构体,包括如下成员:Name - 视频文件名Path - 视频文件路径Duration - 视频的总时长(秒)FrameRate - 视频帧速(帧/秒)NumberOfFrames - 视频的总帧数Height - 视频帧的高度Width - 视频帧的宽度se = strel(square,3);本程序通过创建方形结构元素,用于对分割结果形态学滤波。pixInc = find(Idiff 0);fmed(pixInc) = fmed(pixInc) + beta;pixDec = find(Idiff ori_low) elseif ratio(n)bo
12、_z1elseif title(strcat(其他,NO. , int2str(n); end 本程序采用循环语句来判断图像每一帧的人体姿态,根据该帧图像的参数判断该参数处在哪一个的范围内,就可以在图像上方显示此时人体正处于的姿态,从而达到预期的效果,下面的图片就是采用统一的参考视频根据所编的程序进行人体检测后所得到的结果。在输出的图像中可以看到人体在站立时,视频的上方会出现“站立”的文字,如下图 3.3.31 所示图 3.3.31 对站立姿势的判断在躺卧时,视频的上方会出现“躺卧”的文字,如下图 3.32 所示山东建筑大学信电学院课程设计说明书8图 3.32 对躺卧姿势的判断在不是站立和躺卧
13、时,视频的上方会出现“其他”的文字,如下图 3.33 所示图 3.3.33 对其他姿势的的判断3.4 程序调试对编写的软件程序,以测试视频为例进行调试,根据结果,再使用另一个视频进行测试,并完善程序功能。山东建筑大学信电学院课程设计说明书9新视频中检测人体站立姿态的检测结果,如图 3.4-1 所示图 3.4-1 对站立姿势的判断新视频中检测人体躺卧姿态的检测结果,如图 3.4-2 所示图 3.4-2 对躺卧姿势的判断山东建筑大学信电学院课程设计说明书10新视频中检测人体其它姿态的检测结果,如图 3.4-3 所示图 3.4-3 对其他姿势的的判断通过比对,新视频的结果基本上达到了预期的效果,说明本次设计的程序可以实现对人体姿态的站姿与躺卧姿态的检测。