毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx

上传人:文****钱 文档编号:25458 上传时间:2018-05-05 格式:DOCX 页数:61 大小:1.26MB
下载 相关 举报
毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx_第1页
第1页 / 共61页
毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx_第2页
第2页 / 共61页
毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx_第3页
第3页 / 共61页
毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx_第4页
第4页 / 共61页
毕业论文:Face image compression and reconstruction base on PCA and improved PCA algorithm.docx_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、西南科技大学本科生毕业论文I基于PCA及其改进算法的人脸图像压缩与重建摘要首先介绍了主成分分析(PCA)算法的基本原理,提出了利用PCA进行图像数据压缩与重建的基本模型。主成分分析方法从矩阵角度也称为KL变换。首先将图像训练库里的每个二维图像拉伸成向量,然后对其进行主成分分析得到主成份的变换矩阵以及图像均值向量。图像压缩过程就是把压缩的图像减去训练得到的图像均值向量并通过变换矩阵变换成维数很小的一个向量的过程。图像的重建就是将压缩的图像通过变换矩阵的逆变换矩阵的逆变换后再加上图像均值向量得到的压缩前向量的近似向量。然后介绍了一系列的主成分分析方法的改进算法。其中包括MATPCA算法、2DPCA

2、算法、MODULEPCA算法等。其中MODULEPCA算法是将每一个训练图像都划分成一些尺寸大小一样的子图像,将所有训练图像的所有子图像集合在一起进行PCA分析,得到相应的总体协方差矩阵。在对测试图像进行压缩时,首先按照训练图像那样的划分方法将测试图像划分成子图像,然后逐个对子图像进行压缩。重建时逐个对压缩的子图像进行重建,然后再拼接成原来的图像。实验结果表明,利用模块化PCA能有效减少数据的维数,实现图像压缩,同时能根据实际需要重建图像。关键词图像压缩;图像重建;PCA;特征提取西南科技大学本科生毕业论文IIFACEIMAGECOMPRESSIONANDRECONSTRUCTIONBASEO

3、NPCAANDIMPROVEDPCAALGORITHMABSTRACTFIRST,THISARTICLEHAVEINTRODUCEDTHEBASICPRINCIPLEOFPCA,ANDITHASPROPOSEDTHEBASICMODULEOFUSINGPCATOCOMPRESSANDRECONSTRUCTTHEIMAGEDATAPRINCIPALCOMPONENTANALYSISISALSOKNOWNASKLTRANSFORMATIONFROMTHEPERSPECTIVEOFMATRIXFIRST,EACHOFTHETWODIMENSIONALIMAGESHOULDBESTRETCHEDINT

4、OAVECTORFROMTHEIMAGEDATABASESTHEN,THROUGHPRINCIPALCOMPONENTANALYSISTOOBTAINATRANSFORMATIONMATRIXANDVECTORMEANOFIMAGESTHEIMAGECOMPRESSIONISAPROCESSTHATUSINGTHECOMPRESSTHEIMAGEBYSUBTRACTINGTHEMEANVECTOROFTHETRAININGIMAGESOBTAINEDBYATRANSFORMATIONMATRIXANDCONVERTEDINTOAVERYSMALLDIMENSIONOFAVECTORTHEREC

5、ONSTRUCTEDIMAGEISTHATACOMPRESSEDIMAGEBYTHEINVERSETRANSFORMMATRIXOFTHETRANSFORMATIONMATRIXANDTHENANINVERSETRANSFORMOBTAINEDWITHAMEANVECTOROFTHEIMAGEBEFORECOMPRESSIONVECTORAPPROXIMATIONTHEN,THISARTICLEINTRODUCEDASERIESOFIMPROVEDALGORITHMOFPRINCIPALCOMPONENTANALYSISMETHOD,INCLUDINGMATPCAALGORITHM,2DPCA

6、ALGORITHM,MODULEPCAALGORITHMTHENEACHONEOFTHETRAININGIMAGESAREDIVIDEDINTOANUMBEROFSSUBIMAGEWHICHISOFTHESAMESIZE,ANDBRINGALLTHESUBIMAGEOFALLTHESETRAININGIMAGEFORPCAANALYSISAFTERTHATWECANGETTHECORRESPONDINGCOVARIANCEMATRIXOFTHEOVERALLWHENCOMPRESSINGTHETESTIMAGE,WEALSONEEDDIVIDETHETESTIMAGEINTOSUBIMAGEA

7、SWEDOTOTHETRAININGIMAGE,ANDTHENCOMPRESSTHESUBIMAGEONEBYONEIFWEWANTTORECONSTRUCTTHEIMAGE,WEHAVETORECONSTRUCTTHESUBIMAGEONEBYONEFIRST,WHENTHERECONSTRUCTIONOFTHESUBIMAGEISOVER,PIECINGTOGETHERALLTHESUBIMAGEFORTHEORIGINALIMAGETHERESULTOFTHEEXPERIMENTSHOWSWECANREDUCETHEDIMENSIONOFTHEDATABYUSINGMODULEPCA,M

8、EANWHILE,WECANALSOUSEMODULEPCAFORIMAGECOMPRESSIONANDRECONSTRUCTTHEIMAGEACCORDINGTOOURDEMANDSKEYWORDSIMAGECOMPRESSION,IMAGERECONSTRUCTION,PCA,FEATUREEXTRACTION西南科技大学本科生毕业论文III目录第1章绪论111本文选题背景及意义112国内外研究现状213本文主要内容及章节安排2第2章PCA算法理论基础421引言422PCA算法理论概述7221KL变换8222SVD分解8223特征向量的选取10224PCA算法流程框图1123本章小结13第

9、3章PCA改进算法理论基础1431引言14322DPCA算法理论概述143212DPCA算法理论15322基于2DPCA的图像压缩17323基于2DPCA的图像重建173242DPCA的流程框图1833MATPCA算法理论概述19331MATPCA简介19332MATPCA算法20333MATPCA算法流程2134MODULEPCA算法概述22341MODULEPCA算法简介22342MODULEPCA算法22343MODULEPCA算法流程2335本章小结24第4章MATLAB程序实现2541概述2542PCA、2DPCA和MATPCA程序实现25421总体算法框架代码25西南科技大学本科生

10、毕业论文IV422训练图像26423测试图像30424添加噪声30425压缩图像32426图像重建3343MODULEPCA程序实现35431训练图像35432测试图像37433压缩图像38434图像重建3944本章小结39第5章实验结果及分析4051概述4052PCA、2DPCA和MATPCA结果分析40521总体框架40522PCA算法实验分析415232DPCA算法实验分析46524MATPCA算法实验分析4853MODULEPCA结果分析51531MODULEPCA算法总体框架515312MODULEPCA算法实验分析5153本章小结53结论54致谢55参考文献56西南科技大学本科生毕

11、业论文1第1章绪论11本文选题背景及意义目前数字图像的数据量呈爆炸型增长,占用大量的存储和传输等资源1,主要是由于图像数据中的相邻像素的相关性高,图像数据表示中存在着大量的冗余;与此同时在图像的特征表示的过程中,维数很高,使人难以理解数据之间的关系,使得存储、传输、处理变得更加困难,在处理、计算过程中必须分配很大的存储空间以及消耗大量的计算时间,维数数据处理成了问题的瓶颈。压缩后的图像传输到目的地后,要经过解压缩恢复到原图像才可以使用,因此有必要对压缩的图像和数据进行重构。采用的主成分分析(PCA)方法能够出去除去图像数据的相关性3,将图像信息浓缩到几个主要成分的特征图像中,有效地实现了图像的

12、压缩;同时可以根据主成分多少恢复不同的数据图像,满足不同层次对图像压缩与重建的需要。一般将所有的图像称为图像空间IMAGESPACE,图像被认为是该空间中的一个元素。要对图像空间中的所有图像进行研究是非常复杂的,而且大部分也不是我们感兴趣的。一个方法是将图像空间分成若干子空间,对其中的子空间进行统计分析。这些子空间中,研究人员最为感兴趣的就是人脸图像。得到了学术界的广泛关注和深入研究。特征提取和降维是人脸压缩的关键步骤。在主成分分析的算法中存在着很多不足,对面部表情变化很大和光线很强的等许多外界条件变换很大以及图片的维数很高的情况下普通的PCA压缩方法不能够达到很好的效果。所以研究PCA的改进

13、算法就非常有必要,改进算法可以大大的提高压缩的效率,以及提高重建时的准确度。图像数据量越大,占用的存储、处理和传输等资源就越多。为了提高图像存储、传输和处理效率,必须对图像中的冗余数据进行压缩。压缩后的图像传输到目的地后,要经过解压缩恢复为原始图像,因此又需要对压缩的图像数据进行重构。西南科技大学本科生毕业论文212国内外研究现状目前学术界已经发展了多种经典的压缩图像算法,待处理的人脸图像本质上都是多维的人脸图像,而PCA是基于向量的数据降维算法,因此使用PCA对这些对象压缩的必须将原始观测的张量对象向量化。原始数据因此丢失了空间结构信息和关联信息等高维特性,针对上述问题本文提出的基于张量的主

14、成分分析方法考虑到了输入的张量样本的结构信息对原始张量数据直接进行压缩有利于人脸图像的判别分析。主成分分析(PRINCIPALCOMPONENTANALYSIS,PCA)也称主分量分析2,它是一种利用降维思想,将原有的多个变量通过线性变换转化为少数几个新的综合变量的统计分析方法。这些新变量(主成分)互不相关,能有效地表示原变量的信息(不丢失或尽量少丢失原有变量的信息)。主成分分析方法能除去图像数据的相关性,将图像信息浓缩到几个主要成分的特征图像中,有效地实现图像的压缩;同时可以根据主成分多少恢复不同的数据图像,满足不同层次对图像压缩与重建的需要。基本的PCA图像压缩算法,虽然可取得较理想的压缩

15、比,但该方法对保留特征个数的选取没有一个好的标准,信噪比十分低且对非线性非平稳图像信号没进行考虑。主要研究基于PCA的人脸图像压缩及重建方法,同时针对PCA方法的不足,研究PCA图像压缩及重建改进方法,并通过MATLAB实现基于PCA及其改进算法的图像压缩及重建。13本文主要内容及章节安排本文的工作主要是研究分析了以人脸图像为载体的图像压缩与重建的PCA算法及其相关的改进算法。文中重点研究了基于PCA的改进算法包括2DPCA、MATPCA和MODULEPCA三个改进算法。从而很好的实现对人脸图像的压缩以及重建。全文共分为四章,内容和组织结构如下第一章,绪论。首先介绍了本文的选题背景以及选题意义

16、,然后重点介绍了该课题在国内外的研究状况,最后介绍了本文的主要内容及各章节安排。第二章,PCA算法理论基础。首先对PCA算法的理论进行介绍,包括KL变换、SVD分解等基础知识。西南科技大学本科生毕业论文3第三章,PCA改进算法理论基础。介绍PCA改进算法的主要理论包括2DPCA、MATPCA以及MODULEPCA的相关知识。第四章,MATLAB程序实现。在上一章节的理论基础上,通过MATLAB将算法实现,在这章将给出主要的一部分代码。并且会对代码进行一些简要的说明。本章将实现PCA、2DPCA、MATPCA和MODULEPCA这四种算法。第五章,给出算法的实验结果。并且对PCA、2DPCA、M

17、ATPCA和MODULEPCA这四种算法人脸压缩以及重建的效果进行分析对比,通过对比总结出这四种算法的性能。最后,结论。总结了本文的工作,并提出人脸压缩与重建技术存在的问题并展望下一步研究方向。西南科技大学本科生毕业论文4第2章PCA算法理论基础本章首先对人脸图像压缩以及重建的相关背景知识做了一个介绍,然后提出了PCA算法及其改进算法的相关理论,包括KL变换,SVD分解,以及相关的压缩图像与重建图像的基础理论。21引言图像的基本特性之一是图像的像素之间是高度相关的1,因此很多图像信息是冗余的。这也是图像压缩技术基础。图像压缩技术第一步就是去除像素间的这种相关性,现在已经有两种技术可以达到这个目

18、的,其中一种是预测PREDICTIVE技术,另外一种方法是变换技术TRANSFORM。图像压缩技术据此可以分成两个大类,一类是预测编码,一类是变换编码。另外因为图像数据还存在编码冗余,所以还可以用普通的数据压缩手段例如变长编码来进一步增加人脸图像压缩性能。实际人脸图像压缩系统中经常都采用这些压缩技术,一个经典的压缩系统如图21所示,包括量化器,符号编码器以及转换器。其中转换器负责去除原始人脸图像的冗余信息利用变换技术或者预测,而量化器用于更进一步增加转化后图像数据的编码冗余同时也使得人脸图像的部分信息变成不可恢复,所以无损压缩没有该步骤,对于符号编码器则主要负责将量化后的图像数据进行编码传输。

19、在图像重建端,压缩的数据首先通过符号解码器来得到解压后的量化数据,然后通过反向转换器恢复出压缩的人脸图像。21经典的图像压缩系统西南科技大学本科生毕业论文5基于预测技术的图像压缩方法,一般按照行列的顺序依次对图像每个像素点进行编码。对每个像素点进行编码之前,要先通过当前和先前行已经编码的像素点对当前像素点进行预测值PI,这个预测值代表了人脸图像中的冗余信息。把预测值与实际值I进行相减得到差值I,也被称为预测误差PREDICTIONERROR。最后仅对预测误差进行压缩编码。由于每个像素的预测值仅用到了先前已经编码的像素,这个编码过程也被称为是因果的。基于因果编码的解码过程如下首先通过先前解码的像

20、素得到当前像素的预测值,然后再加上编码过程存储的预测误差得到像素的解码值。由于在因果的编码过程中,像素的预测值仅从先前编码的像素得到,因而只利用其上方和左边的像素。如果预测时同时利用下面和后边的像素则可以得到更高的预测精度,同时也意味着更高的压缩比,这就是非因果预测。然而这种方式使得编解码过程不能顺序的进行。非因果图像预测编码过程一般还包含了图像的变换或需要求解大量的联立方程。这些编码技术一般都是对图像整个进行编码,或者按块进行编码。基于预测技术的典型编码技术有差分脉冲调制DPCM,DIFFERENTIALPULSECODEMODULATION和向量量化VECTORQUANTIZATION。经

21、典的基于预测的压缩系统如图22所示1。22经典基于预测的压缩系统图像压缩的另一种途径是通过变换。在变换编码中,图像首先通过某些变换线输入序列量化器符号编码预测器解码器图像重建预测器西南科技大学本科生毕业论文6性或非线性得到一系列变换系数,再将这些系数量化后得到压缩图像。在解码端,编码的系数首先经过反量化,然后再通过反变换得到实际图像。典型的基于变换的压缩系统如图23所示。变换编码的基本原理是图像在变域中信号能量趋向于向低频聚集。这表现为变换系数大量集中于零值附近,只有少部分系数较大,这也被称为系数分布的稀疏性。根据变换系数的这一特点,通常在量化后对量化系数进行一次熵编码变长编码,以进一步增加图

22、像的压缩比,典型的基于变换编码的系统如下图所示。基于变换的经典图像压缩技术有JPEG和JPEG2000,前者基于DCT变换,而后者基于小波变换。图23典型的基于变换的压缩系统预测编码和变换编码都有着各自的优势,前者实现相对简单,而且算法本身是对图像的局部信息自适应的后者一般具有更高的压缩比,但是代价是变换计算的复杂度较高,这同时也使得实现较为复杂。评价图像压缩方法通常分两个方面,压缩性能以及压缩图像质量4。其中压缩性能常以压缩比RC或者相对数据冗余大小R来衡量,定义为原始数据总量B与压缩数据总量B之比,而相对数据冗余R定义如下压缩后数据减少量相对于原数据量的百分比RBCB(21)11RBBBR

23、BBC(22)此外还常用每个像素所用比特数BPP,BITSPERPIXEL来衡量压缩性能,定义为压分成大小的子块输入图像变换量化符号编码压缩图像符号解码反变换合并子块重建图像西南科技大学本科生毕业论文7缩数据总量与总像素数的之比,单位为BITS/PIXEL。BBPPPIXELS(23)压缩图像的质量可以通过主观或者客观质量评价得到。其中比较常见的客观质量评价手段有均方根误差RMSE、信噪SNR和峰值信噪比PSNR,分别是下面的公式2426定义7112001,MNRMSXYEIXYIXYMN(24)1120011200,MNXYMNXYIXYSNRIXYIXY(25)22110LOGNPSNRM

24、SE(26)其中,IXY和,IXY力分别表示解压图像和原始图像PSNR计算公式中,N为每个像素所占比特数,常见的为8比特,MSE表示均方根误差。虽然客观质量评价手段方便易行,但是并不能真正反映出人对图像的主观感受,因此主观质量评价更为准确。主观质量评价可以让多个观察者对图像进行打分,最后取其平均得到。由于主观质量评价需要大量人员参加,因此实际实行并不方便。图像质量评价正是在这种背景下产生的一个图像处理领域的新热点,人们通过各种方法试图设计和人眼感官一致的图像质量评价算法。本文中主要采用均方根误差来评价图像重建质量的好坏。22PCA算法理论概述基于PCA的人脸图像的压缩与重建算法是统计学中的一种

25、方法,这种方法主要是通过对图像的主要成分的统计和计算,然后将较高维的图像映射到低维的图像空间中从而实现图像的压缩。当要实现图像的重建的时候,只需要将压缩时候实现图像压缩的逆矩阵与压缩后的图像相乘就可以实现图像的重建。基于PCA的图像压缩算法相对于传统的图像压缩算法较为简单5。西南科技大学本科生毕业论文8221KL变换KL变换是PCA方法的主要过程之一,要实现人脸图像的压缩与重建就要用到KL变换。KL变换方法经典,而且实现起来比较容易。基本的PCA方法在对人脸图像压缩前首先要挑选一些图像作为训练图像。假设要训练的图像的尺寸为NN,那么它的所有列的像素可以首尾相接串起来。这样,每一幅图像可以拉伸成

26、一个长为2N的列向量,它可以看成2N维空间中的一个点。由于所训练的图像彼此之间都具有很多相似的地方,所以这些向量在这一超高维空间中的分布并不是随机或者杂乱无章的,它们彼此之间具有很强大的相关性,可以对其进行主成分分析(KL变换),即用一个低维子空间描述这些图像,同时又不丢失关键信息6。假设空间描述这些训练图像集含有M副图像,令,1,2,MIXI为第I个训练样本图像向量,12,UMXXXX为所有训练样本图像的平均图像向量,即11MIIUXM27,UUUUU主成分分析需要训练样本集的总体散布矩阵,即协方差矩阵XUXUTE28或11MTIIIXUXUM29是一个维数为22NN的矩阵,主成分分析方法需

27、要计算其特征值和正交归一化的特征向量由于实际应用中2N都会非常大,直接计算式非常困难的。为此下面的SVD分解可以很好的解决这个问题。222SVD分解SVD分解是处理维数很高的矩阵经常用的方法8,通过SVD分解可以有效的将很高维的矩阵分解到低维空间里面来进行求解。通过SVD分解我们可以很容易的求解出高维矩阵的特征值和其相应的特征向量。下面就是SVD分解的相关的具体西南科技大学本科生毕业论文9理论。设A是一个秩为R的NR维矩阵,则存在两个正交矩阵12,NRRUUUUTUUI21012,NRRVVVVTVVI211以及对角阵12,NRRDIGTUUI212且12R满足12TAUAV其中,1,2,II

28、R为矩阵TAA和TAA的非零特征值9;IU和IV分别为TAA和TAA对应于I的特征向量。上述分解成为矩阵A的奇异值分解(SINGULARVALUEDECOMPOSITION,SVD),A的奇异值为I。由于可表示为111MTTIIIXUXUXXMM213故,构造矩阵TMMRXX214容易求出其特征值I及相应的正交归一化特征向量1,2,IVIM从上述推论可知,的正交归一化特征向量为1,1,2,IIIUXVIM215这就是图像特征向量。它是通过计算较低维矩阵R的特征值和特征向量而间接求出的。将特征值按照从大到小的顺序排列12,M其对应的特征向量为IU。这样,每一幅人脸图像都可以投影到由12,MUUU

29、张成的子空间中。因此,每一幅人脸图像对应于子空间中的一个点。同样,子空间中的任意一点也对应于一幅图像。有了这样一个由12,MUUU张成的子空间,任何一幅人脸图像都可以向其投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置。换句话说,任何一幅人脸西南科技大学本科生毕业论文10图像都可以表示为12,MUUU的线性组合,其加权系数即是KL变换的展开系数,也可以称为该图像的代数特征。对于任意待压缩的人脸图像F,可以通过向特征子空间投影得到其系数向量12,TMYUFUUUUU216得到的系数向量Y可以被认为是对它的压缩,因为这个系数向量维度M通常远远小于F,从而可大大节省存储空间。并且通过U可

30、以将其变换回去FUYU217223特征向量的选取图像训练后将可以开始对图像进行压缩,然而特征向量的选取这个阶段确实相当的重要,如果特征向量选取的不恰当,那么我们对图像进行压缩将不会有一个好的结果,同时图像也不能够顺利的重建。所以图像的压缩关键还在我们对特征向量的选取。在222中提到的U中,一共有M个特征向量10。虽然在很多情况下M要比2N小很多,然而在通常情况下,M仍然显得较大,所以我们需要对特征向量进行选取。事实上,我们在实际应用中并不需要保留所有的特征向量U。本文考虑到使用KL变换作为对人脸图像的压缩手段,可以选取最大的前K个特征向量使得11KIIMII(218)在上面的式子中,根据问题需

31、要可以选取适当的值,如选取99。这样说明样本集在前K个轴上的信息的99。令12,KUUUU则上述对图像的压缩就变为TUUFU(219)相应的重建图像为FUYU(220)西南科技大学本科生毕业论文11224PCA算法流程框图通过上面的详细理论介绍,PCA方法压缩人脸图像大致可以通过下面的描述来表达首先PCA方法压缩人脸图像需要将很多的图像数据作为训练图像输入进去,在训练图像的阶段需要完成压缩图像子空间的搭建。接着输入待压缩的测试图像,将测试图像投影到训练阶段得到的子空间里面就可以对图像实现图像的降维工作从而完成对图像的压缩工作。当图像需要重建的时候,只需要将图像压缩后的数据经过反变换就可以实现对

32、图像的重建。总体的流程如下图24PCA人脸图像压缩与重建总体流程上面的就是PCA人脸图像压缩与重建的总体流程,具体的图像压缩过程与重建的过程是这样的在压缩人脸图像的过程中首先要从ORL库中找出N副图像作为训练图像。具体的训练过程是首先计算N副图像的灰度值的平均值,然后用N副图像依次减去它们的平均值来构建协方差矩阵,由于一般情况下构建的这个协方差矩阵都会很大,直接计算起来会很复杂,所以一般都通过SVD分解求解该协方差矩阵的特征值以及特征向量。当求出了协方差矩阵的特征值以及特征向量后12,在将求出来的特征值依次从大到小的排列以便于选出主成分的特征值,当选出了主成分的特征值后,这些特征值所对应的特征

33、向量就构成了压缩图像所需要的子空间。输入图像训练图像输入测试图像图像压缩图像重建开结束西南科技大学本科生毕业论文12这样训练图像的阶段就完成了。接下来就需要输入将要压缩的图像,将待压缩图像投影到训练图像所得到的子空间上面就完成了图像的压缩。当重建图像时,只需要将子空间矩阵的逆矩阵乘以压缩后的图像就可以实现对压缩图像的重建。流程图如图25所示。图24PCA人脸图像压缩与重建总体流程计算N副图像的平均值开始输入N副图像将特征值从大到小排序找出主成分对应的特征值构建N副图像的协方差矩阵计算特征值和特征向量用选出的特征值构建特征空间将图像投影到特征空间实现图像压缩压缩后的图像乘以逆变换矩阵实现图像重建

34、结束西南科技大学本科生毕业论文1323本章小结本章主要讲诉的是关于PCA算法的基本理论,在PCA算法理论里面主要将的就是KL变换以及用来计算特征值以及特征向量的SVD分解。本章的PCA算法基本理论是所有的PCA改进算法的基础,后面的改进算法都是在本章所介绍的PCA算法基础上面做出的改进。西南科技大学本科生毕业论文14第3章PCA改进算法理论基础31引言上面章节讲到的是最基本的主成分分析方法对图像进行压缩和重建的大致过程。基本的主成分分析方法存在以下一些缺点当人脸图像光照以及位置发生较大变化时,基本的PCA无法有效捕捉这些变化,而且有研究表明,基本的PCA几乎不能捕捉到图像之间的一些最简单的一致

35、性,除非这些信息包含在训练图像中。除此之外,基本的PCA都要把图像的像素按某种方式(一般是各列首位相接)拉伸成一个维数很高的向量。当图像尺寸稍大时,这个拉伸后的向量维数会非常高,更不用说训练图像之间的协方差矩阵了。虽然利用SVD分解可以近似得到特征图像,从而避免生成巨大的协方差矩阵,但是这样做很多时候是不精确的。由于PCA方法的不足,这里将提出一系列的改进方法,即2DPCA、MATPCA以及MODULEPCA这三种改进的方法,如图31所示。图31PCA算法分类322DPCA算法理论概述从对基本的PCA实现人脸图像压缩与重建的介绍中得知,二维的人脸图像事先必须转换成一维的向量,而且这一向量的维数

36、往往是很高的。根据一批训练样本PCA算法2DPCAMATPCAMODULEPCA西南科技大学本科生毕业论文15实际计算得到的协方差矩阵是对真实协方差矩阵的近似,而训练样本的数量相对协方差矩阵的维数来说往往显得过小,因此,想精确得到协方差矩阵是困难的,虽然实际应用中往往并不直接得到这个协方差矩阵,而是通过其他途径间接得到其特征值和相应的特征向量,但并不说明这样可以精确的得到特征值和特征向量,因为特征值和特征向量是由协方差矩阵决定的,这和用什么方法得到他们无关。所以,协方差矩阵的不精确必然导致相应的特征值和特征向量的不精确。为了克服上诉缺点,2DPCA这种人脸图像的压缩和重建方法可以是这种情况的到

37、改善。这种方法和基本的PCA方法不同,它基于二维矩阵而不是一维向量。也就是说,图像矩阵不必事先转换成一个长向量,而是基于原始图像矩阵得到一个图像协方差矩阵。相对于基本的PCA方法得到的协方差矩阵,2DPCA方法得到的图像协方差矩阵的尺寸要小的多。2DPCA相对于基本的PCA主要有两方面的优点一方面它可以比较精确的得到协方差矩阵;另一方面,2DPCA求相应的特征向量所用的时间也比基本的PCA方法所用的时间短。3212DPCA算法理论假设X为一个N维归一化的列向量。2DPCA算法是将图像A(一个MN的矩阵)按照公式YAX(31)投影到X上。因而,得到了一个M维的投影向量Y,这里就称Y为图像A的投影

38、特征向量。在2DPCA方法中求的一个好的投影方向X就是一个关键的步骤,投影向量X的区分样本能力的强弱可以由样本投影后的分散程度来判定。投影后的样本分散度越高,投影方向X就越好。通过研究知道,我们可以用投影后的向量的协方差的迹来刻画样本投影后的分散程度。即XJXTRS(32)式中,XS表示训练样本投影后的向量的协方差;XTRS表示XS的迹。最大化公式(32)的物理意义在于找到一个投影方向,使得所有训练样本在其上投影后的向量之间的分散度最大。XS的协方差矩阵可以表示为TXSEYEYYEY西南科技大学本科生毕业论文16TEAXEAXAXEAXTEAEAXAEAX(33)因此TTXTRSXEAEAAE

39、AX(34)可以定义下面的矩阵TTGEAEAAEA(35)矩阵TG被称为图像协方差矩阵。从定义容易知道,TG是NN的非负定矩阵。可以利用训练样本图像直接计算TG。假设一共有M个训练图像样本,MN矩阵JA1,2,JM表示第J个训练图像,A表示所有训练样本的平均图像。11MJJAAM36那么,TG可以写成11MTTJJJGAAAAM(37)因此,式子(36)可以改写成为TTJXXGX(38)式子中,X为归一化的列向量。式子(38)为一般总体分散度准则(GENERALIZEDTOTALSCATTERCRITERION)。使得JX最大化的归一化向量OPTX被称为最优投影轴。也就是说,所有训练图像样本矩

40、阵投影在OPTX之后得到的向量之间的分布散度最大。通过文献4我们可以知道,OPTX是与TG的最大特征值对应的特征向量。一般来说,只有一个最佳投影方向远远是不够的,需要找出一系列的投影方向,即投影方向集12,DXXX,满足使得JX尽量最大化以及彼此正交的原则,即12,ARGMAX0,1,2,DTIJXXXJXXXIJIJD(39)事实上,满足上述原则的投影方向集12,DXXX是与TG的前D个最大特征值对应的彼此正交的特征向量。西南科技大学本科生毕业论文17322基于2DPCA的图像压缩2DPCA方法在图像压缩方面,关键的步骤就是投影方向集的选取,当投影方向集选取好了之后,将待压缩的图像减去训练图

41、像时得到的平均图像,然后在分别投影到投影方向集12,DXXX上面得到各自在不同的投影方向上的投影,然后将得到的投影向量组合在一起就得到了图像压缩后的图像。可以利用由2DPCA得到的投影方向集12,DXXX对图像进行压缩。对于一个给定的图像样本A,令KKYAAX,1,2,KD(310)这样可以得到一系列的投影向量12,DYYY,称之为样本图像A的主成分(向量)。这里我们可以明显的看到,用2DPCA方法得到的主成分是一个向量,而基本的PCA方法得到的主成分是标量。令12,DBYYY称其样本图像A的压缩矩阵或者特征矩阵(特征图像)。这就完成了对给定图像的压缩。323基于2DPCA的图像重建基于2DP

42、CA的图像重建总的来说,就是图像压缩的一个逆过程。基本的PCA方法中,可以利用图像压缩后的特征向量和主成分来完成对图像的重建。与之类似,2DPCA可以按照下面的步骤完成压缩后图像的重建。设属于图像协方差矩阵TG的最大的前D个特征值的特征向量为12,DXXX,当图像矩阵在其上投影后,得到的主成分向量为KKYAAX,1,2,KD令12,DVYYY12,DUXXX因此对于给定的样本图像AVAAU(311)由于12,DXXX是彼此正交的,所以从式子(311)容易得到A的重建图像西南科技大学本科生毕业论文18TAVUA1DTKKKYXA(312)如果令TKKKAAYXD我们称KA为A的重建子图像,它和A

43、以及A的尺寸一样。从式子(312)可以看到,A可以近似地表示成K个子图像之和。重建的精度和之前选择的TG的前D个最大特征值的具体D值有关,如果DN(N为TG的全部特征值个数),那么重建后的AA;否则,A是A的近似。以上就是2DPCA关于图像重建的一些主要的理论算法,有了这些理论实现图像重建就很容易了。3242DPCA的流程框图基于2DPCA的人脸图像压缩算法在进行人脸图像的压缩时,和PCA方法在大体的流程上面是一样的,都首先需要在ORL库中选出N张图片作为训练图像。然后在输入测试图像来实现图像的压缩。当需要重建图像的时候,就需要将压缩后的图像数据做相应的逆变换就可以实现图像的重建。2DPCA方

44、法与普通的PCA方法不同的地方是普通的PCA算法压缩图像后压缩的图像数据是一个标量,而2DPCA方法在压缩图像后图像的数据是一个向量。2DPCA方法压缩图像首先需要训练图像,训练图像时需要从ORL人脸图像数据库中选取N张图像作为训练图像,训练图像主要是为了找出最优的投影轴,寻找最优投影轴和普通PCA方法寻找特征值和特征向量来构建投影子空间很类似。都是首先要求出所有训练图像的平均灰度值,然后用每个训练图像减去平均灰度值,从而构建协方差矩阵。然后利用SVD分解来求取协方差矩阵的特征值以及特征向量。然后选取归一化的特征向量作为投影轴。选取最优投影轴主要就是利用方差最大化的方法进行的一个筛选。然后使待

45、压缩的图像投影到投影轴上时分散度最大的投影轴。完成了训练图像后就可以开始对图像进行压缩了,压缩图像时需要将待压缩的人脸图像依次乘以投影向量集来实现图像的投影,压缩后的图像在每个投影方向上面都有一个投影的向量。具体的流程图如西南科技大学本科生毕业论文19下图322DPCA人脸图像压缩与重建总体流程33MATPCA算法理论概述331MATPCA简介在处理庞大的向量形态特征时,将其转化成矩阵形态特征来利用2DPCA方法对转换后的特征矩阵进行二次特征提取。这样处理在模式识别的时候就可以提高识别准确率以及处理速度。MATPCA在面对向量形态的特征时会转化成矩阵形态的特征,前提是这个向量的长度必须是合数,

46、否则无法转化成二维矩阵。如果是矩阵形态的特征,那么MATPCA就不用提前对其进行处理了。因此对于图像矩阵来说,如果是矩阵形态的特征,那么MATPCA就不用提前对其进行处理了。因此对于图像矩阵来说,如果将其看成矩阵特征,那么MATPCA方法和2DPCA方法是类似的。对于图像矩阵,MATPCA方法和2DPCA方法是类似的。只不过2DPCA是对原始图像矩阵进行投影,从方差最大化的角度来寻找最优投影方向,而MATPCA是对原始图像矩阵进行列投影,从重构误差最小的角度来寻找最优投影方向。两种方法殊途同归,都要对各自的图像协方差矩阵求特征值,并根据实际需要确定选择最大特征值的个数。计算特征值以及特征向量输

47、入训练图像选取最优投影轴将图像依次投影到投影轴上输入测试图像实现压缩实现重建乘以逆矩阵完成方差最大化西南科技大学本科生毕业论文20332MATPCA算法设一共有M个MN的训练图像样本1,2,JAJM,训练样本的平均图像为A。令12,DXXXX满足TXXI其中,12,DXXX为长为M的列向量。对于图像IA我们可以得到如下的线性变换TIIIYXAA(313)类似于2DPCA算法,在寻找合适的投影轴X时,需要遵循一定的原则,是的投影后尽可能多的保留原来训练图像样本的信息。一种可行的原则就是采用重建误差原则(RECONSTRUCTEDERROR,RCE),即最小化211|MIIIRECXAAM(314

48、)式子中,|IIAA表示矩阵2范数,1,2,IIAXYAIM。对于矩阵A来说,|TATRAA,因此211|MIIIRECXAAM211|MTMATIITIAATRXSXM(315)其中11MMATTTIIISAAAAMMATTS称为由给定样本矩阵得到的总体协方差矩阵。从式子(315)可以明显看出,只需要最大化式子(316)即可TMATTJXTRXSX(316)式子(316)等价于求解如下矩阵方程MATTSXX(317)其中,12,MDIAG是对角阵,其对角元素即MATTS的所有非负特征值,X是西南科技大学本科生毕业论文21由特征向量组成的矩阵。接下来在选取特征值的时候可以参考基本的PCA方法以及2DPCA方法,即选取适当的值使得11DIIMIIA在确定合适的D之后进而得到由相应的特征向量组成的投影矩阵X。333MATPCA算法流程MATPCA算法在大体上面的流程和普通的主成分分析方法压缩图片是基本一样的,都是首先从ORL人脸图像数据库中间选取适当数量的人脸图像作为训练图像。训练图像的时候需要计算所选取的平均的图像的灰度值。然后压缩图像和普通的PCA算法不同,MATPCA算法是从列向量投影。2DPCA算法是从行向量方向进行投影。和2DPCA算法从方差最大化的角度筛选投影向量不同的是,MATPCA算法是从

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。