人脸朝向识别
摘要
人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。
本文利用BP神经网络的理论知识来研究人脸识别技术,对图像中的人脸朝向判别建立数学模型,建立了基于BP网络的人脸朝向识别方法。
首先运用主成分分析法提取40幅图像像素的灰度值,经过一定的处理,转换为含7个元素的特征向量组成BP神经网络的输入向量,并对输入向量进行归一化处理,使取值在[-1,1]之间,加快网络的训练速度。设置一个输出端,输出值(0,1,2,3,4)对应5个人脸朝向:右方、右前方、前方、左前方、左方。通过设置不同的中间层神经元个数并修改相应的网络参数得到:当BP神经网络的输入层神经元个数为40个,输出层神经元个数为1个,隐含层的神经元个数为10个时,收敛速度较快。其中隐含层神经元的传递函数采用型正切函数,输出层神经元传递函数采用纯线性函数,采用训练函数,得到的样本为40时的训练误差曲线较为理想,仿真输出与目标输出较吻合,%。说明基于BP神经网络对人脸识别具有一定的准确率。最后,利用已建立的模型对9号和10号两组图像共计十X进行判断,正确率高达100%。从以上的实验中可以看出,BP网络有着良好的非线性映射能力,在人脸识别和图像处理方面具有一定的优势。
本文大量的数据计算通过软件实现。
关键词:图像像素处理;主成分分析法;特征向量;BP神经网络;工具箱;人脸朝向识别
人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。现有10个人的人脸照片,每人5幅共计50X。每个人5X照片的人脸朝向分别为:右方、右前方、前方、左前方和左方。我们需要利用现有图像,建立人脸朝向识别数学模型,实现人脸朝向识别功能。
每X图片由一定的像素确定,每X不同图片互相区分则需要对这些像素进行观察找出其区别于其他图片的典型特征。我们知道一X图像的像素维数十分庞大,如何实现降维处理并找出其特征点是一个关键。我们采用了PCA(主成分分析法)降维处理并提取了特征值。取40X图片作为训练样本,把40X图片的特征向量组成一矩阵并归一化处理得到了待训练的特征向量矩阵,这能够减小运算量和加快运算速度。
为了实现对图像的识别,则需要通过对样本的处理来实现对每个方向进行分类,BP神经网络能够很好的解决这一问题。输入训练样本后,不断地修改网络参数,即是不断调整权值,阈值使实际输出与目标输出的误差逐渐减小以至趋于零。这样在一定的误差允许X围内可以得到一个比较准确的分类结果。然后再选择新的图片按照相同的方法提取特征向量去检验系统的准确率。
三.基本假设
;
,无污迹;
,偏差十分小。
;
,人物所受光照强度相同;
,人物没有过于明显的表情;
1.:相关系数矩阵;
2. :相关系数矩阵的特征值;
3. 特征值对应的特征向量;
4. 像素矩阵的第行第列的灰度值;
5.:各主成分载荷;
6. :加入到网络的输入矢量;
;
;
;
10.:表示输出单元到隐单元的权值;用和
;
;
;
14. 测试样本的特征向量;
;
;
四.模型的建立及求解
基于PCA的像素矩阵的降维处理
通过统计工具箱的函数读取图片,构成一个420420的像素矩阵(见附录1),显然该矩阵维数太高。在BP神经网络的输入层中,我们不可能把一X图片的全部像素点作为输入向量输进去,因为其数据量非常庞大,会明显减缓训练过程。如果像素更大的话计算会更加困难,所以通常在使用图像像素信息时都会进行降维处理。我们按照下面的方法先降一定的维数:把420420的像素矩阵依次按相邻10行,相邻10列的顺序分别求均值得到一个4242像素图像的低分辨率矩阵(附录2),这样就可以大大降低维数过大给计算机运行带来的压力,然后再进行主成分分析。
主成分分析(PCA)是一种经典的降维方法。它的主要思想是采用组合特征的方法来表达原数据,是一个很好的数据压缩和表达工具。这一方法的目的是寻找在最小均方意义下最能够代表原数据的投影方法;它能最大程度保持能量情况
人脸朝向识别数模论文 来自淘豆网m.daumloan.com转载请标明出处.