1、毕业设计文献综述 计算机科学与技术 人脸检测关键技术研究与实现 一、 前言部分: 人脸是常见而复杂的视觉模式,人脸所反映的视觉信息在人与人交流和交往中有着重要的作用和意义,对人脸进行处理和分析在视屏监控、出入口控制、视屏会议以及人迹交互等领域都有着广泛的应用前景,因此是模式识别和计算机视觉领域持续的研究热点。对人脸进行处理和分析包括人脸识别、人脸跟踪、姿态估计和表情识别等,早期的人脸处理和分析一般都假设已知图像中的人脸的位置和大小,但对于一个人脸自动处理和分析系统而言,人脸检测是关键性的第一步,人脸检测算 法的精度直接影响着整个系统的性能。 近几年来,由于人脸检测在人脸处理和分析中的地位,人脸
2、检测已经引起了越来越多研究者的注意,并逐渐发展成为一个相对独立的研究方向,其研究方法和等手段上也逐渐成熟出现了各种各样实用的人脸检测算法。人脸检测问题一般描述为:给定静止或动态图像,判断其中是否有人脸;若有,将所有的人脸从背景中分割出来,并确定每个人脸早图像中的位置和大小 1,2。 人脸检测问题最初来源于人脸识别,人脸自动识别的研究最早可以追溯到 20世纪 60-70年代。经过几十年的曲折发展,人脸自动识别已经有了一些较为 成功的方法,目前正日趋成熟。早期的人脸识别研究主要针对具有强约束条件的人脸图像(如无背景或背景简单的图像),往往假设人脸位置已知或很容易获得,因此人脸检测问题并未受到重视。
3、在 20世纪 90年代以后,随着网路安全的电子商务等应用需要的剧增人脸识别成为最有潜力的生物身份鉴别方式,出现了实际的人脸识别系统和商用产品,这种应用背景要求自动人脸识别系统能够对一般环境图像具有一定的适应能力,由此所面临的一系列问题使得人们对人脸检测的各个重要方面引起了极大的研究兴趣,并逐渐独立分离出来 3。 目前,国外对人脸检测问题的研 究很多,比较著名的有美国麻省理工大学( MIT)的媒体实验室和人工智能实验室、以及 Illinois大学的 Beckman研究所等;国内的清华大学、北京工业大学、上海交通大学等都有人员从事人脸检测方面的研究 4。 二、 主题部分 1 SVM的基本原理 支持
4、向量机( SuportVectorMachines, SVM)是在统计学习理论的基础上发展起来的一种新的学习机器,能够较好地解决人脸检测中的小样本、非线性、高维数、局部极将小点等实际问题,其与常用的人脸检测算法相结合,对于人脸检测技术的研究具有重要意义。为了解决小样 本的学习问题, Osuna等刚首先将支持向量机 (Support VectorMachine。 SVM)引入人脸检测中。 SVM是 daVapnik提出的一种基于结构风险最小化原理的统计学习算法,其基本思想是通过用内积函数定义的非线性变换,将输入空间变换到一个高维的线性空间,然后在这个空间中求最优分类面。支持向量机的最大特点是根据
5、 Vapnik结构风险最小化原则,尽量提高学习机的泛化能力,而且支持向量机算法是一个凸优化问题,因此其局部最优解一定是全局最优解。这些特点使得支持向量机可以有效克服其它学习算法,如神经网络学习 算法存在的过学习问题和局部极值问题,从而成为国际上机器学习领域新的研究热点。 Osuna等首先将支持向量机引入人脸检测中 5。通过非线性变换把样本输入空间转化为某个高维空间中的线性问题,在高维空间中求线性最优分类超平面,这样的高维空间也称为特征空间或高维特征空间 (Hilbert空间 )。 因为线性可分支持向量机的决策函数值仅仅依赖于内积 ( ji xx )和( xxi ), i,j=l, , l ,所
6、以经过 映射后的非线性支持向量机的决策函数仅仅依赖于变换后的 Hilbert空间中的内积 ji xx 和 xxi , i, j=1, , l 。这样,在高维特征空间中实际上只需进行积运算,而这种内积运算是可以用输入空问中的某些特殊函数来实现的因此,如果能够找一个函数 K使得 K jiji xxxx ,我们就没有必要知道变换 的具体形式。这特殊的函数 K称为核函数。因此,在最优分类超平面中采用适当的核函数 K就可以现某一非线性交换后的线性分类,而计算复杂度却没有增加。分类问题就变为,引入从输入空间 nR 到一个高维 Hilbert空间 H的变换: xxxHR ln ,: 利用这个变换,由原来的对
7、应于输入空间 nR 的训练集得到对应于 Hilbert空间 H的新的训练集 llllllll yxyxyxyxT , . . . , . . . , , 然后在空间 H中求出一个超平面 0 bxw ,这个超平面应该能正确分划训练集 T ,并使得训练集 T 关于这个超平面的几何间隔达到最大。 由此,通过 Lagrange变换和对偶理论即可以得到,非线性支持向量机的一般求解过程: ( 1)设出一个已知训练集 llll yxyxT ,., lYX ( 2)选择适当的核函数量 xxK , ,构造并求解出最优化问题。 ( 3) 根据求解的分量,构造出属于自己研究方向的决策函数。 支持向量机巧妙地利用输入
8、空阈的核函数取代了高维特征空间中的内积算,这一特 点提供了解决算法可能导致的“维数灾难”问题的方法:在构造判别函时,不是对输入 空间的样本作非线性变换,然后在特征空间中求解;而是先在输入空间比较向量 (例如 求点积或是某种距离 ),对结果再作非线性变换。这样,大的工作量将在输入空间而不 是在高维特征空间中完成。 SVM分类函数形式上类似于一个神经网络 6,7。最底层为输入的 n维空间上的 l 个向量 ,输出是 s个中间节点的线性组合,每个中间节点对应一个支持向量,用支持向量的核函数与权值 iiya , i=l, , s进行决策分类。 2 肤色建模 肤色是人脸的主要特征,所以从肤色区域内搜索人脸
9、可以大大减小搜索空间 ,也是人脸检测过程中的主要组成部分。现今,可以从文献中总结出将肤色作为特征进行人脸检测的方法主要有三种形式:将肤色作为人脸检测的核心方法、将肤色作为人脸捡测的预处理、将肤色作为人脸检测的后期验证。在肤色建模中,合理的选择颜色空间也是相当重要的环节。许多研究人员提出著名 的格拉斯曼定律能有效的解决这一问题,它反映了视觉对颜色的反应取决于红、绿、蓝三种颜色在输入量中的代数和这一事实。格拉斯曼定律主要内容: ( 1)所有颜色都可以用互相独立的三基色混合而得到。 ( 2)假如三基色的混合比相等,则色调和色饱和度也相等。 ( 3)任意两种颜色相混合产生的新颜色与采用三基色分别和成这
10、两种颜色的各自成份再混合起来得到的结果相同。 ( 4)混合色的光亮度是原来各分量光亮度的总和。 这里色调、色饱和度、亮度是表示色觉程度的。色调表示各种颜色,色饱和度表示 颜色深浅。以三基色为基础的格拉斯曼 定律可以用下面的公式来表示: F=R(R)+G(G)+B(B) 根据计算机色彩理论,对于同一种颜色而言,在计算机中有不同的表达方式,这样就形成了各种不同的颜色空间模型。每一种颜色空间模型都有其各自得产生背景及应用领域 8。 在人脸检测中肤色特征相当明显,利用肤色进行检测,主要是根据肤色集中分布在色彩空间中很小的区域这个特征,建立肤色模型,但由于光源谱线的变化以及背景与目标光照的差异造成肤色的
11、检测并不十分有效。任何一种模型都不能精确检测出所有的肤色点,而且需要大量的先验知识确定脸部所在,所以肤色特征常常被用 于初检或辅助检测手段,以便有效地剔出大部分非人脸区域。实验表明肤色信息的使用可以大大降低计算消耗,减少问题的复杂性。人的肤色具有以下三个重要特征; (1)人的肤色分布在颜色空间中很小的一个范图内; (2)人的肤色不同主要由颜色的强度不同引起; (3)在一定的光照条件下,人的肤色分布近似为高斯分布。 这为我们肤色建模提供了理论基础,肤色的聚类性使我们利用肤色缩小人脸范围,简化问题的复杂度成为可能。在选择的合适的颜色空间中植入图像并根据相应的公式遍历所有像素点,判断出哪些点是肤色
12、9。 3 肤色分割 肤 色是人脸的显著特征之一,其不依赖于人脸面部的细节特征,与大多数背景存在差异,且具有相对的稳定性,对表情和姿态的变化不敏感,故可以通过肤色分割来对输入图像进行预处理,利用肤色分割快速排除图像中大量的非人脸区域,可以实现人脸区域的快速粗检测10。肤色分割作为人脸检测的预处理,具有明显的速度优势,在人脸检测过程中至关重要,它的性能直接影响着人脸检测的结果 11。对于彩色图像中的每个像素点,计算其相似度,可以得知该像素点属于肤色区域的可能性大小。据肤色相似度,采用阈值化技术可以对输入图像进行肤色分割。然而,采 用固定的阈值可能存在这样的问题:如果阈值取得过大,许多肤色区域将无法
13、检出,造成漏检;如果阈值取得过小,将导致许多非肤色区域被误检成肤色区域。因此给出 种动态阈值确定方法,并将肤色相似度与求得的动态阈值相结合,以实现对输入图像的肤色区域进行精确分割,从而提高人脸检测的速度与性能 12。在许多文献中我们可以看到这一方法可行性。 4 基于 SVM原理的分类策略 SVM 在解决非线性及高维模式识别问题中表现出了显著优势,能够在特征空间中寻找一个最优分类面将两类样本点正 确地区分开来,并具有良好的推广能力。在众多文献中可以得出基于 SVM的分类策略分为学习和测试两个过程。基于 SVM的分类策略,训练数据越多时分类越准确。人脸具有相当复杂的细节变化,比如人的年龄、表情、性
14、别、肤色以及胡须、头发、眼镜等都会对人脸的模式空间造成一定的影响。为了能比较全面地描述人脸空间,这就要求采集的样本应该尽可能包含各种可能情况,比如园脸型,方脸型,瘦长脸型等,以及喜怒哀乐等各种表情,还应该注意到不同性别和年龄之间的差异。其次,样本数要尽量多,因为只有足够多的样本才能对样本空间进行细致的描述。因为统 计模型的人脸检测方法是建立在对大量人脸和非人脸样本学习的基础上,如果没有大量的数据,学习的效果可能会大打折扣 13。 在大量的人脸样本提取的情况下,对于非人脸样本的选取也是非常重要的。人脸样本的收集虽然费对费力,但人脸样本的定义非常清晰,收集的时候目标明确。而非人脸样本的收集则困难多
15、了因为任何不是脸的图像都可以作为非人脸样本,导致非人脸的模式空间太过于庞大,如果我们不能收集到具有代表性的非人脸样本,那么也就不能很好的描述非人脸的模式空间,用这样的数据训练出来的支持向量机的性能必然不可能达到令人满意的效果 。非人脸样本只能用不是人脸的样本都是非人脸样本来描述,所以非人脸样本的多样性和不易界定是基于统计的方法中的一个难题。有人也提出 bootstraps(自举 )14方法来解决这一问题,它是先用小样本训练一个弱学习机,将得到的分类器对大量图片进行搜索,得到的错误分类就归为非人脸图片。但是不加约束的非人脸样本空间庞大、所需迭代次数多、收敛十分困难如果考虑到入脸及非人脸在图像空间
16、的子空间的特性,就可以缩小非人脸样本的范围。因为是对彩色图像进行处理,所以可以将图像的子空间限定在肤色空间中。也就是说利用肤色分割的方法 将错选为人脸的区域收集成非人脸样本,然后再利用 bootstrap的方法进行训练来收集非人脸样本 15。 在做好人脸和非人脸的样本学习以后,还可以适当的进行样本的预处理工作,使得不同的人脸样本图像进行归一化而且人脸的主要特征为五官特征,所以将图片上的背景、头发及耳朵等信息去除掉会对人脸检测工作更加有帮助。 三、 结论 部分 综上所述,随着科技的不断进步,人脸检测的应用也会越加广泛,在现今我们可以看到在视屏会议、图像与视屏检索、智能人机交互等方面都有重要的作用
17、。可以这么说,只要有将人脸作为内容的视屏或者图像必然 会使用到人脸检测技术。虽然现今在人脸检测的领域已经有了一些成果,但是人脸所反映出来的表情、发型、化妆、整容、肤色检测复杂性判断等多样性的复杂性都给其带来了一定的困难,要想更加准确的检测出人脸还需要不断的尝试和努力。在将来,对于人脸检测中的相关技术也会越加成熟。 四、 主要参考文献: 1Hjelmas E and Low B K,Face detection:a survey,Computer Vision anf Image understanding,83(1),2001 2Yang M-H, kriegman D,Ahuja N,Det
18、ecting face in image:a survey,IEEE Transactions on Pattern Analysis and Machine Intelligence,24(1),2002 3梁路宏、艾海舟、徐光佑、张钹等,人脸检测研究综述,计算机学报, 25(5), 2002 4刘万春、贾云得、徐一华等,基于肤色的人脸实时跟踪方法,北京理工大学学报, 20( 4),2000 5张永新,基于 SVM的人脸检测算法研究论文, 2009,西北大学 6Vapnik V, The Mature of Statistical Learning Theory, Springer, 199
19、5 7陈泽宇,威飞虎,基于级联神经网络的人脸检测方法的研究,红外与毫米波学报, 19( 1) ,2000 8梁路宏、艾海舟、徐光佑等,基于肤色和模板的人脸检测,软件学报, 12( 12), 2001 9王嵘,基于支持向量机的人脸检测系统的设计与实现论文, 2007,天津师范大学 10宁桂英,周永权基于双种群的小生境差分进化算法阴计算机应用与软件, 2009, 26(3):29 31 11吴亮红,王耀南,周少武,等双群体伪并行差分进化算法研究及应用 J控制理论与应用, 2007, 24(3): 453 458 12付忠良图像阈值选取方法的构造 J中国图象图形学报, 2000, 5 (6)。 13刘明宝,高文,复杂背景下的人脸检测与跟踪系统,计算机研究与发展, 34(SI): 54 58,1997 14Sung K K Poggio T, Examplc-BasedLcaming for View-Based Human Face Detection,Technical Report AI Memo 1521, Massachusetts Inst.of Tcchnology AI Lab, 1994 15 姚鸿勋,刘明宝,高文等基于彩色图像的色系坐标变换的面部定位与跟踪法计算机学报, 2000,23(2)