基于离散余弦变换的人脸识别作者:姚传奇(信息与控制系,信息安全0401班)指导教师:范九伦(信息与控制系,教授)摘要:离散余弦变换(DCT)是一种优良的数据压缩方法。在预处理环节中,本文先介绍了DCT在人脸识别中的降维应用:DCT变换系数矩阵左上角的有限个系数包含了人脸图像的大部分信息,这部分信息更有利于识别,因此仅保留这部分系数可以起到降维的目的。样本经离散余弦变换后提取的特征值,采用BP神经网络进行训练,得到权值和阈值矩阵,从而可以实现人脸识别的仿真。实验结果表明,本文实现的方法能满足一定的识别速度和准确率要求,并且对表情、光照、姿态变化等具有一定的鲁棒性。关键词:ransformAuthor:YAOChuan-qi(Class-0101,MajorofInformationSecurity,DepartmentofInformation&Control)Tutor:FANJiu-lun(ProfessorofDepartmentofInformation&Control)Abstract: ransform(DCT),wefirstintroducetheapplicationofDCTtoreducedimension:erofDCTmatrixcontainmostinformationofanimagewhicharemoreusefulforrecognition,,worktraining,andgettherightvaluethresholdmatrix,,uracyanditsinsensitivitytothefacialexpression, 引言人脸识别是对于输入的图像,首先判断图像中是否存在人脸,如果存在人脸,则进一步给出每个人脸的位置、大小和面部主要器官的位置信息,依据这些信息进一步提取出每个人脸中所蕴含的身份特征,并将其与已知人脸库中的模板信息进行匹配,从而识别每个人脸的身份,达到身份鉴别的目的。2 离散余弦变换(DCT)的理论基础在人脸识别中,人脸作为一幅图片,其信息量是巨大的,将原始图片作为人脸识别的计算对象显然是不现实的。因此需要对人脸图像进行特征提取,也就是“降维”。降维的方法也是多种多样的。特征提取的过程,和图像有损压缩的过程类似,都是用少量的信息来表示图像的主要特征。常见的数字压缩技术有DFT、DCT、小波变换等。离散余弦变换定义对于一幅MxN的数字图像f(x,y),其二维的离散余弦变换定义为:其中:u=0,1,2,…,M-1;v=0,1,2,…,N-1 式中C(u,v)为变换结果,也称为DCT系数。a(u)、a(v) DCT域的性质和优点利用DCT的性质,可以直接在DCT域中施加多种数学运算。它们主要有乘法-卷积运算、线性运算、矩阵运算,几何变换运算等。这些DCT域中的数学运算关系是DCT域数据处理的理论基础。DCT在以下几点优于特征脸方法:(1)每一幅图像矩阵看成一个向量,DCT可以对每个向量进行单独处理,提取出特征向量,放入特征库里面,用于后面的识别;(2)当新的图像需加入库中,经过预处理之后,可以对该图像进行DCT变换,无需考虑其他的图像。这样即使库中人脸图像很多时,计算量也不大。而特征脸方法当有新的图像加入时,必须重新计算新图像与原库中所有图像的协方差矩阵,以求出新的特征空间离散余弦变化的特点是:频域变化因子u,v较大时,DCT系数C(u,v)的值很小;而数值较大的C(u,v)主要分布在u,v较小的左上角区域,这也是有用信息的集中区域。a原图片) b离散余弦变换 图2-,必须在大量DCT系数中选出包含分类信息的有用成分,这些信息主要是离散余弦变换的低频分量,对应于图像的左上角区域。由于需要输入的是1D向量,而图像的离散余弦变换得到的是2D矩阵,这里涉及到如何将2D转化成1D的问题。图3-3提供了两种转换方法,图a直接从左上角选取一大小为P*P的方形区域,然后将DCT
离散余弦变换的人脸识别 来自淘豆网m.daumloan.com转载请标明出处.