1、青岛理工大学毕业设计(论文)I青岛理工大学毕业设计(论文)题目基于分块离散余弦变换和主成分分析法的人脸识别学生姓名指导教师通信与电子工程学院电子信息工程专业信息101班2014年6月14日青岛理工大学毕业设计(论文)I摘要随着计算机和网络技术的快速发展,信息安全呈现出前所未有的重要性。人脸识别因其广阔的发展前景和重要的理论研究价值,受到国内外众多研究机构的广泛重视。其中分块DCT变换是最近几年以来比较常见的图像处理工具,在人脸识别领域得到广泛的发展。本文在研究了分块散余弦变换(DCT)的特点的基础上研究了基于分块DCT变换和PCA的人脸识别算法,充分利用了分块DCT变换快速高效的特点以及PCA
2、方法降维减少运算时间的优势,大大缩短识别时间。首先利用分块DCT对人脸图像进行预处理,将DCT预处理后的低频信息作为特征。最后通过使用KL变换取特征值、特征向量以及PCA降维的方式来形成特征脸,识别部分采用欧氏距离最近邻法进行了人脸识别。在ORL及YALE人脸库上实验结果表明,本方法不仅能提高人脸识别的识别率,并且利用了分块DCT快速高效的特点,能够显著缩短识别时间。关键词离散余弦变换DCT;主成分分析法PCA;KL变换;人脸识别;预处理青岛理工大学毕业设计(论文)IIABSTRACTWITHTHERAPIDDEVELOPMENTOFCOMPUTERANDNETWORKTECHNOLOGY,I
3、NFORMATIONSECURITYSHOWSUNPRECEDENTEDIMPORTANCEFACERECOGNITIONBECAUSEOFITSWIDEDEVELOPMENTPROSPECTANDIMPORTANTTHEORETICALRESEARCHVALUE,EXTENSIVEATTENTIONBYMANYRESEARCHINSTITUTIONSATHOMEANDABROADTHEBLOCKDCTTRANSFORMISMORECOMMONINRECENTYEARSSINCETHEIMAGEPROCESSINGTOOLS,HASBEENWIDELYDEVELOPMENTINTHEFIELD
4、OFFACERECOGNITIONBASEDONTHESTUDYOFTHEBASICBLOCKDISCRETECOSINETRANSFORMDCTONTHECHARACTERISTICSOFTHESTUDYONDCTANDPCAFACERECOGNITIONALGORITHMBASEDONFULLUSEOFTHEBLOCKOFDCTFASTANDEFFICIENTFEATURESANDPCADIMENSIONREDUCTIONMETHODSTOREDUCETHECOMPUTATIONADVANTAGEOFTIME,GREATLYREDUCINGRECOGNITIONTIMEFIRSTLY,BL
5、OCKDCTFACEIMAGEPREPROCESSING,THELOWFREQUENCYDCTPREPROCESSEDINFORMATIONASAFEATUREFINALLY,BYUSINGTHEKLTRANSFORMTAKENEIGENVALUES,EIGENVECTORSANDTHEWAYTOFORMTHEPCADIMENSIONALITYREDUCTIONFEATURESFACERECOGNITIONPARTOFTHEFACERECOGNITIONUSINGEUCLIDEANDISTANCENEARESTNEIGHBORMETHODTHEEXPERIMENTALRESULTSONTHEO
6、RLANDYALEDATABASESSHOWTHATTHISMETHODCANNOTONLYIMPROVETHEFACERECOGNITIONRATE,ANDCANSIGNIFICANTLYSAVETHEIDENTIFICATIONTIMEKEYWORDSDISCRETECOSINETRANSFORMSDCTPRINCIPALCOMPONENTANALYSISPCAKLTRANSFORMRECOGNITIONPREPROCESS青岛理工大学毕业设计(论文)III目录前言1第1章人脸识别相关理论211人脸识别研究的背景及意义212人脸识别的现状及难点2121人脸识别的现状2122人脸识别的难点及
7、现况3123人脸识别的应用前景4124现有人脸图像集简介513人脸识别技术相关6131人脸识别的技术特点6132人脸识别研究的技术过程714小结8第2章离散余弦变换的基本理论研究921DCT的初期发展9211快速算法9212块效应消除922第二代DCT编码的进展1023二维离散余弦变换原理1124分块DCT的实现过程1125小结12第3章KL变换和PCA的基本理论研究1331简介1332KL变换和PCA分析1333KL变换原理1434主成分分析法PCA)16341PCA原理16342PCA的优点18青岛理工大学毕业设计(论文)IV35KL变换和PCA的实现过程1936小结19第4章实验与仿真2
8、041分块DCT实验研究20411子块大小的选择20412子块DCT变换系数的选择2142PCA实验研究21421根据指定值选择22422根据能量比选择22423维数的选定2343人脸库实验及仿真23431算法实现过程23432ORL人脸库实验仿真24433YALE人脸库实验仿真25434实验结果分析2644小结26第5章总结27致谢28参考文献29附录3041原始图像识别程序3042原始图像分块DCT处理识别程序3143图像分块DCT及PCA处理识别程序33青岛理工大学毕业设计(论文)1前言随着IT技术及网络技术的高速发展,信息化、数字化日益融入人们的日常生活,个人信息的安全和保障越来越受到
9、人们的重视,身份识别与认证技术也随之得到了飞速发展。作为图像分析和处理技术在生物特征识别领域最成功的应用之一,人脸识别具有隐蔽性高、方便快捷、数据易采集等诸多优点,成为近年来的研究热点之一,受到了众多研究者的关注。人脸识别技术是一种生物特征识别技术1,依据各人的面部特征来自动进行身份鉴别。由于人脸识别技术在所有生物特征识别技术领域中具有众多的优势,尤其是直观、非侵犯方面非常突出,决定了其广泛的应用前景可以用来对敏感人物,诸如罪犯、恐怖分子等,进行识别,协助公安部门布控、海关身份验证2。但人脸识别尚存在很多问题,其中一个关键性问题就是特征选择,其基本任务是从许多特征中找出最有效的特征。但因为人脸
10、图像数据量十分庞大,直接用于识别效率不高,所以必须要对原始图像进行有效降维。离散余弦变换DISCRETECOSINETRANSFORM,DCT正是基于压缩的较为有效的降维方法。DCT既能有效地降低特征维数,又可将光照、表情和姿态不敏感等类别信息进行保留。但是,由于DCT基于统计表征,所以其所包含的类别信息并不丰富,因此对DCT系数的特征进行深入分析将会有助于提取识别性能更好的人脸特征。本文主要研究如何将分块DCT变换与PCA方法结合形成有效的人脸识别算法,直接研究关于使用分块离散余弦变换(DCT)和主成分分析法(PCA)进行人脸识别的方法,并着重分析了多种DCT变换参数以及PCA维数的选取方式
11、和实际效果。利用分块DCT对人脸图像进行预处理,将DCT预处理后的低频信息作为特征,然后通过使用KL变换取特征值、特征向量以及PCA降维的方式来形成特征脸,最终采用欧氏距离最近邻法完成模板图像与测试图像的匹配。实验表明采用分块DCT变换和PCA算法来选取特征脸进行识别的方法是一种可行的快速算法。青岛理工大学毕业设计(论文)2第1章人脸识别相关理论11人脸识别研究的背景及意义随着计算机和网络技术的快速发展,信息化、数字化日益融入人们的日常生活,身份识别与认证作为保证信息安全的必要前提越来越受到人们的重视。在国家安全、公安系统、司法系统、电子商务、电子政务、安保监控等领域都需要准确的身份识别与认证
12、。身份是人们日常生活的重要组成部分,对身份进行识别与认证是人们基本社会生活之一。目前广泛采用的身份识别方法主要有标识号码、磁卡、IC卡等技术,这些传统方法虽然在日常生活中应用广泛,但从本质上来讲这些验证手段都依赖于后天赋予的信息,存在着易丢失、易伪造、安全性差等不足。随着科学技术的不断发展和信息安全要求的不断提高,对个人进行方便、快捷、可靠性高的身份认证变得日益迫切。其中利用人脸特征进行身份验证又是最自然直接的手段,相比其它人体生物特征它具有直接、友好、方便的特点,易于为用户所接受3。人脸识别是指对于输入的图像或视频,首先进行人脸检测,找出图像中存在的人脸,然后进一步识别每个人脸的位置、大小等
13、信息,并依据这些信息,提取每个人脸中所蕴含的身份特征,并将其与已知入脸库中的人脸进行对比,从而识别每个人脸的身份。人脸识别技术除了拥有巨大的市场应用前景外,其在理论研究上也具有重要价值。作为典型的图像模式分析、理解与分类计算问题,人脸识别技术为模式识别、计算机视觉、神经计算、人工智能、图像处理与分析、人机交互、计算机图形学、人类生理学和心理学等诸多学科提供了良好的实验平台,有利于这些学科融合,解释新现象、尝试新方法、验证新理论。相信随着人脸识别技术的进一步发展,将极大地促进这些学科的发展。12人脸识别的现状及难点121人脸识别的现状人脸识别因其广阔的发展前景和重要的理论研究价值,受到国内外众多
14、研究青岛理工大学毕业设计(论文)3机构的广泛重视。国外一些著名的研究机构如美国麻省理工学院人工智能和媒体实验室MIT、卡内基美隆大学机器人研究所CUM均走在人脸识别领域研究的前列,引导着国际人脸识别领域的技术潮流。中国虽然对人脸识别领域的研究起步较晚,但也取得了不错的成果。目前全国各大高校及一些著名科研院所均开展了对人脸识别的研究。在国内人脸识别研究始于20世纪80年代,虽然起步相比国外晚,但发展很快。同时,国家对人脸识别方面的研究高度重视,863计划、国家科技支撑计划、自然科学基金等都拨出专款资助人脸识别技术的相关研究。国家“十一五”科技发展规划也将人脸识别技术的研究与发展列入其中,明确的指
15、出“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别技术研究,开发高安全性、低误报率的出入识别新产品。在这种环境下,国内一些科研院所和院校在人脸识别技术方面积极研究,取得重大发展。2002年,由中科院计算机所等单位承担的国家863计划之一的面像检测与识别技术顺利通过专家鉴定,该系统只需1/10秒或1/20秒就可自动检测到人脸。中科院自动化所的中科奥森近红外入脸识别系统设计的基于近红外图像的人脸识别核心技术,在不同光线条件下,能够拍摄到不受光照变化影响的近红外人脸图像,解决了困扰人脸识别领域的光照影响问题,识别率达到992。在由清华大学苏光大教授主持的二代身份证识别系统,通过二
16、代身份证内只有12K大小的图像作为入脸的数据库,获得了较好的识别率和识别速度,并且在距离摄像头2米左右便可检测出人脸并进行识别,为我国人脸识别技术的研究奠定了坚实的基础。在人脸识别技术商业化应用方面,国外的一些较为成熟的商用软件有NEVENVISION公司的PERSONSPOTTER、ETURE公司的TRUEFACE、VISIONSPHERE公司的UNMASK和CVIS公司的FACESNAP等。虽然国内企业进入人脸识别领域的时间较晚,但也发展迅速,目前已有诸多产品投入市场,在公共安全领域发挥着重要作用,其中具有代表性的产品有中科院计算所的GODEYE、奥森科技的奥森人脸识别系统等。122人脸识
17、别的难点及现况权威评测机构在2006年发布的FRVT2006FACERECOGNITIONVENDORTEST2006青岛理工大学毕业设计(论文)4测试结果表明,理想条件下的人脸识别技术已相当成熟,千人左右的系统识别率己达到90;但当外界条件不可控如光照发生变化时,系统性能下降极快,因此人脸识别技术仍有许多问题亟待解决,尤其针对非理想条件下如光照、姿态、表情变化、用户不配合等的识别技术。人脸识别的主要难点,包括光照、姿态、表情变化问题,遮挡、采集设备、样本缺乏所引起的问题,识别算法的泛化能力及自适应学习问题等,并指出这些问题往往是组合出现的。因为人脸识别技术主要依赖从样本图像中提取的有效人脸特
18、征,即那些对不同个体差异较大但对相同个体保持稳定的特征量度,但由于人脸本身表示极其复杂且人脸图像维数一般较高,故如何有效地进行特征选择与提取是解决人脸识别问题的关键之一。目前一种常见的方法是利用小波变换WAVELETTRANSFORM的时频局域特性将光照、表情等变化区分在不同频段,从中提取出鲁棒性较强的低频系数作为人脸特征进行识别。小波变换成功应用到人脸识别领域的重要原因是由于其能有效地表达图像中的点奇异性,而在人脸图像中,更多的是面部轮廓及五官的曲线信息,人脸图像的曲线奇异性影响了很多小波系数,导致其不能成为曲线的稀疏表达,影响了人脸识别的精度。由CANDES和DONOHO等人提出的曲波变换
19、CURVELETTRANSFORM在尺度和位移参量的基础上增加了一个方向参量,使之具有更好的方向辨识能力和曲线稀疏表达能力,为解决人脸特征选择与提取提供了新思路。123人脸识别的应用前景生物识别技术已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。同时当前社会上社会治安案件频繁出现并不断发生,鉴于此种原因,防盗门开始走进千家万户,给家庭带来安宁;然而,随着社会的发展,技术的进步,生活节奏的加速,消费水平的提高,人们对于家居的期望也越来越高,对便捷的要求也越来越迫切,基于传统的纯粹机械设计的防盗门,除了坚固耐用外,很难快速满足这些新兴的需求便捷,开门记录等功能。人脸识别技术已经
20、得到广泛的认同,但其应用门槛仍然很高技术门槛高(开发周期长),经济门槛高(价格高)。青岛理工大学毕业设计(论文)5人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。2、电子护照及身份证。中国的电子护照计划公安部一所正在加紧规划和实施。3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。4、自助服务。5、信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,
21、电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。124现有人脸图像集简介由于人脸检测问题最初来自人脸识别问题,长期以来,研究人员虽然提出了大量的人脸检测方法,但在说明各自检测方法的性能时,往往使用不同的人脸测试集,因此,这就使得各种人脸检测方法的优劣评价缺乏一个统一的平台。针对此种情况就出现了一些标准人脸图像集,但是对于怎样才是一个“成功的人脸测试方法”,仍旧缺乏一个统一标准;另一方面,对于不同的训练集,尤其是一些基于统
22、计信息的人脸检测方法,对测试结果的影响也是巨大的。下面简单介绍一下国内外已有的部分人脸图像集41MIT图像集美国,麻省理工学院包括16人,每个人有不同光照、不同尺寸、不同角度的27张照片。2FERET图像集美国军方此图像集包含大量的人脸图像,并且每幅图中均只有一个人脸。该集中,同一个人的照片有不同表情,光照,姿态和年龄的变化。3UMIST图像集英国,曼切斯特大学20个人共564幅图像,每个人具有不同角度、不同姿态的多幅图像。青岛理工大学毕业设计(论文)64YALE图像集美国,耶鲁大学15人,每人11张照片,共165张。主要包括光照条件的变化,表情的变化。5ORL图像集英国,剑桥大学40人,每人
23、10张照片,包括表情变化,微小姿态变化,20以内的尺度变化。6CMUPIE图像集美国,卡耐基梅隆大学所谓PIE就是姿态POSE,光照I1LUMINATION和表情EXPRESSION的缩写。CMUPIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片,现有的多姿态人脸识别的文献基本上都是在CMUPIE人脸库上测试的。最近几年来,随着人脸检测研究的不断深入,研究者们编辑了多个人脸检测测试图像集。SUNG和POGGIO提出了两个人脸检测测试集,第一个集中包含了71个人的301个正视或近似正视人脸图像,这些图像各自
24、的光照条件均不相同。第二个集中包括23幅图像共149个人脸,每幅具有复杂背景。而用的最广泛的测试集是由ROWLEY等人提出来的CMU测试图像集,包括130幅图像共507个人脸,除此之外还有CMU侧面人脸图像集,共280幅图像。虽然它们具有一定规模和涵盖面,但仍不能满足评价的要求,因此还有待于建立规模更大、覆盖面更广的测试集和针对不同具体应用背景的测试集。13人脸识别技术相关131人脸识别的技术特点传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。
25、解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但这两种技术还远不成熟,识别效果不尽人意。迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。青岛理工大学毕业设计(论文)7人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点非强制性用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸
26、图像,这样的取样方式没有“强制性”;非接触性用户不需要和设备直接接触就能获取人脸图像;并发性在实际应用场景下可以进行多个人脸的分拣、判断及识别;除此之外,还符合视觉特性“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。132人脸识别研究的技术过程人脸识别系统主要包括四个组成部分,分别为人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。(1)人脸图像采集及检测人脸图像采集不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。人脸检测人脸检测
27、在实际中主要用于人脸识别的预处理,即在图像中准确标定出人脸的位置和大小。人脸图像中包含的模式特征十分丰富,如直方图特征、颜色特征、模板特征、结构特征及HAAR特征等。人脸检测就是把这其中有用的信息挑出来,并利用这些特征实现人脸检测。主流的人脸检测方法基于以上特征采用ADABOOST学习算法,ADABOOST算法是一种用来分类的方法,它把一些比较弱的分类方法合在一起,组合出新的很强的分类方法。人脸检测过程中使用ADABOOST算法挑选出一些最能代表人脸的矩形特征弱分类器,按照加权投票的方式将弱分类器构造为一个强分类器,再将训练得到的若干强分类器串联组成一个级联结构的层叠分类器,有效地提高分类器的
28、检测速度。(2)人脸图像预处理人脸图像预处理对于人脸的图像预处理是基于人脸检测结果,对图像进行青岛理工大学毕业设计(论文)8处理并最终服务于特征提取的过程。系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。对于人脸图像而言,其预处理过程主要包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等。(3)人脸图像特征提取人脸图像特征提取人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也
29、称人脸表征,它是对人脸进行特征建模的过程。人脸特征提取的方法归纳起来分为两大类一种是基于知识的表征方法;另外一种是基于代数特征或统计学习的表征方法。基于知识的表征方法主要是根据人脸器官的形状描述以及他们之间的距离特性来获得有助于人脸分类的特征数据,其特征分量通常包括特征点间的欧氏距离、曲率和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成,对这些局部和它们之间结构关系的几何描述,可作为识别人脸的重要特征,这些特征被称为几何特征。基于知识的人脸表征主要包括基于几何特征的方法和模板匹配法。(4)人脸图像匹配与识别人脸图像匹配与识别提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一
30、个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。这一过程又分为两类一类是确认,是一对一进行图像比较的过程,另一类是辨认,是一对多进行图像匹配对比的过程。14小结本章主要探讨了人脸识别技术的相关理论,阐述了人脸识别技术的研究意义及现状,分析了人脸识别的一般技术过程,对人脸识别性能评价标准做了简要描述,令读者对人脸识别技术具有了一定初步了解,同时为后文算法的引入作了铺垫。青岛理工大学毕业设计(论文)9第2章离散余弦变换的基本理论研究21DCT的初期发展211快速算法第一代DCT及其应用主要表现
31、在快速算法进步和减小块虚像上是面向波形或过程的5,如一个88图像子块直接DCT需要8192次乘和3584次加操作,在MPEG1解码时,计算IDCT的时间占总时间的387。利用2D或3DDCT/IDCT的正交可分解性,20世纪90年代末DCT快速算法已近极限,1DDCT的快速算法譬如LOEFFLER等人提出的,其乘法器和加法器的数目减少到理论下线。目前集成电路的发展,一次乘与一次加的耗时几乎相等,运用DCT的正交性、对称性,包括一些碟形算法等,进行一个88图像块的DCT需要时间降为原来的1/51/36。DCT以它的“提取特征成分的能力和运算速度之间的最佳平衡”显示出它的应用优越性。在传统的2DD
32、CT图像压缩编码中,依据信号的自然属性和视觉特性(HVS)将DCT后的系数按ZIGZAG扫描,取前若干较大的低频系数作为特征分量,用零代替后面高频系数的截短DCT编码,也能重建满意的图像。正是DCT的简捷高效性,才能在众多变换编码中脱颖而出实际中传输甚低码率如在H263中,利用图像(块)间平缓区域占多数,通过快速运动补偿(减小时间冗余)得到帧间或帧内的88预测误差图像块XM,N,若满足707016,YXQNMXABS21其中Q为量化参数,即判断该块为全零DCT系数,因而可以避免计算该DCT块的所有频率系数提高实时应用能力。212块效应消除传统的块DCT、量化和编码的方法需改进,是因为它易产生块
33、虚像这是由于对低频系数的量化导致相邻块之间的强度不连续,尤其是在低比特率时。消除块虚像采用后处理的技术较多20世纪90年代后期出现了速度更快的直接在DCT域中进行块虚像(盲)检测和消除技术,特点是当一个DCT系数由LAPLACIAN概青岛理工大学毕业设计(论文)10率函数模型化时,减小块虚像可通过对直流DC和交流AC系数进行修正或重新计算来实现,其中DC系数尤为重要。实验证明,量化后的各块之间斜率均方误差(MSDS)较量化前大,因此综合使水平、垂直和对角方向上的MSDS为最小,可有效地减小或去除块虚像,也可对每个DCT块所形成的大小为原图像1/64的DC图像中,采用SOBEL梯度算子把原图像所
34、有边缘块划分成3类,采用不同的处理方法。这样在尽可能多保留原图像完整性的同时减小了块虚像7。且通过SOBEL算子或块方差的大小检测图像块是否为边缘和纹理块,进而采用DPCM或奇异值分解(SVD)编码,对于DPCM获得的冗余用RICE编码较为简单,而SVD以稍高的编解码复杂性换取恢复的图像质量高。如在“DCT系数域中进行块虚像检测以及结合后处理技术”以彻底消除DCT(块)虚像的理想方案是值得研究的。此外,根据网络、缓冲器传输能力自适应调整DCT系数的量化步长达到控制变长编码码率的传输速度也有实际意义。或者说DCT系数结合运动补偿或输出码流缓冲时的参数自适应选择问题,也还有文章可做。22第二代DC
35、T编码的进展第二代DCT编码体现出以下几个特征从内容上强调人眼视觉特性(HVS)的充分利用,力图用物体的纹理和形状结构或轮廓等特征信息来描述对象;其次DCT系数应不仅为压缩与恢复原图像所专用,还可实现其他功能即DCT本身发生实质性跃变。1995年基于分块DCT数字水印技术以及形状自适应SADCT的发表标志着DC进入了新时代,此时MPEG2也刚刚成为国际编码标准,而兼容MPEG1标准的MPEG2就是以DCT结合运动补偿为图像压缩编码的,是目前图像编码的主要应用标准之一。进入第二代DCT以后,面对SPIHT成功应用,针对区域的DCT及其运动补偿、DCT与其他变换编码的结合,块虚像消除以及利用DCT
36、域进行信息隐藏等等的研究相当活跃,一些更高的压缩标准MPEG4、H263/等相继推出。近年来,为进一步减少图像失真同时便于计算机处理,出现整型小波变换、整型DCT等。至于整型DCT首先通过计算DCT浮点变换的整数可逆矩阵分解,从而得到可以整数实现的可逆矩阵变换,然后再利用得到的分解矩阵依次对图像样本进行变换,最后将变换得到的系数用多种高效编码方法进行编码。1999年后青岛理工大学毕业设计(论文)11发展起来的二进制DCT利用提升结构消去了乘法,只用移位和加法来实现,既能实现灵活的正交变换又能达到无损压缩,采用仅有移位和加法操作的提升步长的双正交DCT其编码速度与DCT相比有很大提高,双正交DC
37、T已经实践于H263视频压缩编码中,最新的H264标准使用的基于44数据块的变换,就是类似于DCT的整数变换8,因此不存在逆变换因取舍而产生的误差。基于(近)无损的区域DCT编码将是最有潜力的编码形式,是第三代DCT编码的基本要求。23二维离散余弦变换原理对于一幅MN的灰度图像,XX,Y表示灰度图像中坐标X,Y处的灰度值,其离散余弦变换定义9为212COS212COS1010NVYMUXYXXVAUAVUYNYMX,22其中U0,1,2,M1;V0,1,2,N1,被称为频域变换因子;YU,V为变换结果,也称为DCT系数。分析离散余弦变换的定义可知当频域变换因子较大时,DCT系数YU,V的值较小
38、。DCT系数较大的数值主要分布在系数矩阵的左上角区域,而能量信息主要集中在左上角区域。即左上角区域的少量系数是能量的集中体现。本文利用了这一特点,提取DCT之后左上角区域的少量系数作为特征进行识别。离散余弦变换的逆变换定义9为212COS212COS1010NVYMUXVAUAVUYYXXNVMU,23其中X0,1,2,M1Y0,1,2,N1。24分块DCT的实现过程本过程以ORL人脸库中的部分图像为例。首先,输入ORL人脸库中的一幅人脸图像,首先将此11292的人脸图像缩放为11296的图像,利用排列矩阵的方式分割为一系列共168个互不覆盖的88子块。然后,对每个88的子块做DCT,得到64
39、个变换系数,利用亮度量化矩阵量化所得到的变换系数矩阵。青岛理工大学毕业设计(论文)12最后提取每个量化系数矩阵的第一个系数DCT之后的直流系数,组成一个1681的向量作为识别特征矩阵。图1为利用分块DCT及其逆变换实现图像重建的过程。图1A为ORL人脸库中的第一个人的第一幅原始人脸图像。图1B为将图1A经过分块DCT和量化之后,直接进行DCT重建之后的图像。比较图1A与图1B可以看出两幅图像存在差异,但是差异细微。图1C为图1A经过分块DCT和量化之后,利用保留的低频信息重建后的人脸图像。由图可以看出,低频信息体现了人脸图像的轮廓信息,可以作为一种识别特征。(A)原始图像(B)重构图片(C)低
40、频信息图片图21分块DCT实现25小结本章主要探讨了离散余弦变换的相关理论,阐述了离散余弦变换的发展进程,介绍了二维离散余弦变换的基本原理,简要描述了分块离散余弦变换的实现过程,令读者对离散余弦变换有了一定初步了解,同时为实验部分分块DCT部分的过程进行了简单介绍。青岛理工大学毕业设计(论文)13第3章KL变换和PCA的基本理论研究31简介主成分分析PRINCIPALCOMPONENTSANALYSIS。即PCA,是图像压缩中的一种最优正交变换。它从图像整体代数特征出发,基于图像的总体信息进行分类识别。SIMVICH和KIRBY首先将KL变换用于人脸图像的最优表示。TURK和PENTLAND进
41、一步提出了“特征脸”EIGCNFACE这个概念。下文首先介绍了KL变换及PCA算法的原理和实现过程。将PCA方法用于人脸识别,其实是假设所有的人脸都处于一个低维线形空间,而且不同的人脸在这个空间中具有可分性。其具体做法是由高维图像空间经KL变换后得到一组新的正交基,对这些正交基作一定的取舍,保留其中的一部分生成低维的人脸空间。通过KL变换得到高维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸EIGENFACE方法10。32KL变换和PCA分析对给定的信号XN,如果它的各个分量之间完全不相关,那么表示该数据中没有冗余若X
42、N中有相关成分,通过去除其相关性则可达到数据压缩的目的。主成分分析方法PCA基本思想是提取出空间原始数据中的主要特征主元,减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的有用信息,从而解决数据空间维数过高的瓶颈问题。一个宽平稳的实随机向量TNXXX1,1,0XN,其协方差矩阵XC定义为1,10,11,00,0NNNNTXXCCCCXXXEC31式中E代表求均值运算,EX是信号X的均值向量,XC的元素,IJCJXIXEJICXXXX32即协方差阵是实对称的。显然,矩阵XC体现了信号向量X的各分量之间的青岛理工大学毕业设计(论文)14相关性。若X的各分量互不相关,那么
43、XC中除对角线以外的元素皆为零。KL变换的思路是寻求正交矩阵A,使得A对X的变换Y的协方差阵XC为对角矩阵,其步骤如下先由的N阶多项式0XCI,求矩阵XC的特征值110,N,以及N个特征向量110,NAAA。然后将110,NAAA归一化,即令1,JIAA,I0,1,2,N1。由归一化的向量成110,NAAA就构成归一化正交矩阵A,即TNAAAA,11033最后由YAX实现对信号X的KL变换。显然,矩阵A各向量之间相互独立,体现了去相关性,在图像编码中去除了冗余。33KL变换原理假设X为N维的随机变量,X可以用N个基向量的加权和来表示NIIIAX134式中1A为加权系数,1为基向量,此式也可以用
44、矩阵的形式表示TNNAAAX212135其中21N,TNAAA21。我们取基向量为正交向量,由正交向量构成,所以是正交矩阵,即IT将公式4211两边左乘T,并考虑到为正交矩阵,得XT即XT11。我们希望向量的各个向量间互不相关。那么如何保证的各个分量互不相关呢这取决于选取什么样的正交向量集。设随即向量的总体自相关矩阵为XXERT36将公式4211代入上式4213,得TTTTATAAEAEXXER37我们要求向量的各个分量间互不相关,即满足下列关系青岛理工大学毕业设计(论文)15KKKJAAEJKJ038写成矩阵的形式为N139则TR310将上式两边右乘上,得TR311因为是正交矩阵,所以得R3
45、12,3,2,1NJRJJJ313可以看出,I是X的自相关矩阵R的特征值,J是对应特征向量。因为R是实对称矩阵,其不同本征值对应的特征向量应正交。综上所述,KL展开式的系数可用下列步骤求出步骤一求随即向量X的自相关矩阵XXERT,由于没有类别信息的样本集的均值向量,常常没有意义,所以也可以把数据的协方差矩阵作为KL坐标系的产生矩阵,这里召是总体均值向量。步骤二求出自相关矩阵或协方差矩阵R的特征值I和特征向量J。其中I1,2,N。同时本征向量组成的矩阵为J,其中J1,2,N。步骤三展开式系数即为XT。KL变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变换,这个变换解除了原有
46、数据向量的各个分量之间相关性,从而有可能去掉那些带有较少信息的坐标系以达到降低特征空间维数的目的。青岛理工大学毕业设计(论文)1634主成分分析法PCA)341PCA原理主成分分析法PCA在人脸识别领域成功应用的一个重要理论基础是较好的解决了KL变换后协方差矩阵的特征向量的求解问题。人脸识别是一个典型的高维小样本问题,即人脸图像向量的维数一般较高,比如,实验用的ORL人脸库的图像大小为11292的人脸图像,其对应的图像向量特征空间高达10304维,在如此高维的图像空间内,按照通常的算法,计算样本的协方差矩阵的特征向量是异常耗时的。同时,在人脸识别问题中,由于客观条件的限制,训练样本的数目一般较
47、小,通常,训练样本的总数远远小于人脸图像向量的维数。针对高维小样本的情况,求解特征向量所采取算法的基本思想是,将高维的问题转化为低维的问题加以解决。主成分分析法PCA是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩。主成分分析法的原理如下已知N维空间的随机向量用NR表示,利用公式将进行零均值处理,EX,则0XE。如果对X用一组完备正交基J,J1,2,N展开,可得JKIIUAX1314假设只用前K项进行重构,则KJJJRECUAX1315其均方误差为RECTRECX
48、XXXE316因为青岛理工大学毕业设计(论文)17IJIJUUJTI01317且XATJJ318所以NKJJTJNKJJTTJCUUUXXUE11319其中TTEEEXXEC是X和的总体协方差矩阵。为了使重构的均方误差最小,并满足正交条件的约束,采用拉格朗日乘子法,将函数NKJNKJJTJJTJJUUCUUUJ111320对,2,1NJJ求导,得NKKJUICJJ,2,1,0321令K1,此时NUUU,21为总体协方差矩阵C的本征向量,N21,分别是它们对应的特征值,这些特征向量经过正交化处理所形成的空间称为特征空间。将特征向量NUUU,21按照它们的特征值进行降序排列N321,则得到结论对于任一随机变量X,如果采用总体协方差矩阵C的前K个最大非0特征值所对应的特征向量作为坐标轴展开,可在相等截断长度下获得所有正交展开中最小的截断均方误差MINNKJI1MIN322下面我们将主成分分析法用于人脸识别11。假设训练人脸图像的个数为M,将每一副图像按列串相接的方式排成长度为N的向量N,321,其均值向量即平均脸为NKJIM1/1323则每个图像相对于均值图像的差为,2,1MII。令矩阵,21NA,则散布矩阵可以表示为青岛理工大学毕业设计(论文)18NKJTIITMAA1/1324求出的