基于主成分分析(PCA)方法的人脸识别

更新时间:2024-04-29 01:04:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

摘要

主成分分析(Principal Component Analysis,PCA)是一种基于代数特征的人脸识别方法,是一种基于全局特征的人脸识别方法, 它基于K-L分解。基于主成分分析的人脸识别方法首次将人脸看作一个整体,特征提取由手 工定义到利用统计学习自动获取是人脸识别方法的一个重要转变。简单的说, 它的原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表示为一个低维向量,并不会损失任何信息。即通过低维向量和特征向量矩阵,可以完全重构出 所对应的原来高维向量。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此 ,可以采用K-L变换获得其正交K-L基底。对应其中较大特征值的基底具有与人脸相似的形状 , 因此又称为特征脸,利用这些基底的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸识别。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征空间中的位置,从而进行判别。

这次设计主要是完成了基于主成分分析(PCA)方法的人脸识别,PCA方法的基本原理是:利用离散K-L变换提取人脸的主要成分,构成特征脸空间,识别时把测试样本投影到该空间,构成一组投影系数,通过与特征脸的距离比较,距离最小的特征脸对应的即是识别结果。基于PCA的人脸识别分为三个阶段,第一个阶段利用训练样本集构建特征脸空间;第二个阶段是训练阶段,主要是将训练图像投影到特征脸子空间上;第三个阶段是识别阶段,将测试样本集投影到特征脸子空间,然后与投影后的训练图像相比较,距离最小的为识别结果。基于PCA的人脸识别其实是一种统计性的模板比配方法,原理简单,易于实现,但也有不足,它的识别率会随着关照,人脸角度,训练样本集的数量而变换,但仍不失为一种比较好的方法。 关键词:PCA MATLAB 特征脸 图像预处理

1

数字图像处理论文

Abstract

The design is mainly based on principal component analysis completed (Principal Component Analysis, PCA) method for face recognition, in order to facilitate the operation, using matlab GUI made a visual interface, which also added such as image smoothing, sharpening, grayscale, binary, dilation, erosion, and the application of the secondary wavelet edge detection operators for other functions, the use of these additional functions can be done to treat a simple pre-identified images, to improve the recognition rate. The basic principle of PCA method: using discrete KL transform to extract the main component of the face, constitute a feature face space, recognition at the time of the test samples are projected into the space, constitute a group of projection coefficients, the distance by comparison with the characteristics of the face, from the smallest Eigenfaces corresponding to that is to identify the results. Face recognition based on PCA is divided into three phases, the first phase of training set constructed using eigenface space; the second stage is the training phase, mainly to train the image projected to the subspace on; the third stage is to identify stage, will test the sample set the projector to the subspace, and then after training image with the projector compared to the smallest distance to recognize the results. Face recognition based on PCA in fact a statistical method than with the template, the principle is simple, easy to implement, but there are less than its recognition rate with the care, face angle, the number of training sample set transformation, but still after all, a better approach.

KEYWORD: PCA MATLAB Preprocessing discrete K-L transform Image

preprocessing

2

数字图像处理论文

1 概述

1.1 人脸识别技术

1.1.1人脸识别的发展及现状

人脸识别的研究已经有很长的历史,在19世纪,法国人Galton就曾对此问题进行了研究,他用一组数字代表不同的人脸侧面特征来实现对人脸侧面图像的识别。国内外对于人脸识别的研究发展,分别经历了三个阶段:传统的人机交互式阶段、机器自动识别初级阶段、机器自动识别高级阶段。 (1) 传统的人机交互式阶段

第一阶段是以Bertilion为代表,主要研究人脸识别所需要的面部特征,该阶段的识别依赖于人的操作。这些人脸识别方法都需要利用操作员的某些先验知识,仍然摆脱不了人的干预。

(2)自动识别初级阶段

第二阶段主要是采用机器自动识别的手段进行识别,20世纪90年代以来,随着高速度高性能计算机的出现,人脸识别方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究也得到了前所未有的重视。 (3)机器自动识别高级阶段

第三阶段是真正利用机器进行对人脸的自动识别,随着计算机的大型化、高速化和人脸识别的方法的发展,提出了许多人脸自动识别的系统。

1.1.2人脸识别应用及前景

在现代社会中,身份鉴定技术具有非常重要的应用价值,随着网络技术的发展,信息安全也显示出前所未有的重要性。在金融、保安、司法、网络传输等应用领域,都需要精确的身份鉴定。作为人类,我们依靠天生的能力,通过声音、脸形和其他特征来辨认别人。而对于机器,则必须由程序去告诉它该如何利用同样可以观察到的信息来识别不同的人。目前广泛采用的身份验证形式主要有标识号码、磁卡、IC卡等,这些方式的优点是技术已经比较成熟,并可以采用各种加密手段加以保护,但从根本上讲这些验证手段依赖的都是后天赋予人的信息,容易丢失、被盗窃、被伪造,更为严重的是无法区分真正的用户和取得用户标识的冒名顶替者。在这种情况下,由于人体的生理特征具有不可复制的特点,人们把目光转向了生物识别技术,希望可以籍此技术来应付现行系统安全所面临的挑战。生物特征识别技术是根据身体和行为特征来识别或验证一个有生命的人的自动方法,也就是使用人体本身所固有的物理特征(如指纹、虹膜、人脸、掌纹等)及行为特征(如书写、声音步态等),通过图像处理和模式识别的方法来鉴别个人身份的技术。应用生物特征识别技术的优越性在于可以以更大的可靠性、更快的速度、更便利的方式和更低廉的价格提供身份的保证,或者准确地识别某个人。而人脸识别作为

3

数字图像处理论文

一种典型生物特征识别技术,以其自然性、高可接受性等优点受到了人们的青睐,可应用于各行各业中。人脸因人而异,即使一对双胞胎,其面部也一定存在某方面的差异。人类在判断一个人的身份时,一般都是通过人脸来判断,从人脸得到的判断信息要超过90%。这些给人脸识别的提出提供了理论依据和实践根据。虽然人类在表情、年龄、发型、光线等发生巨大变化的情况下,可以毫无困难的根据人脸识别出一个人,但要建立一个能够完全自动进行人脸识别的系统却是非常网难的,它涉及到模式识别、图像处理、计算机视觉、生理学、心理学、数据库以及认知科学等方面的诸多知识。与指纹、基因、掌纹等其他的生物识别系统相比,人脸识别系统更加直接、友好,使用者无任何心理障碍,并且通过人脸的表情与姿态分析,还能获得其他识别系统难以得到的一些信息。人脸识别技术应用背景广泛,可用于公安系统的罪犯身份识别,驾驶执照及护照等与实际持证人的核对,银行和海关的监控系统以及自动门卫系统、视频会议、机器人的智能化研究、医学等方面。

863计划、国家科技支撑计划、自然科学基金都拨出专款资助人脸识别的相关研究。国家“十一五”科技发展规划中也将人脸识别技术的研究与发展列入其中,明确指出:“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究,人脸识别具有高安全性、低误报率的出入口控制新产品。”在这种环境下,国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所,清华大学,中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。人脸识别作为一种新兴的生物特征识别技术(Biometrics),与虹膜识别、指纹扫描、掌形扫描等技术相比,人脸识别技术在应用方面具有独到的优势:

(1)人脸识别使用方便,用户接受度高。人脸识别技术使用通用的摄像机作为识别信息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过程。

(2)直观性突出。人脸识别技术所使用的依据是人的面部图像,而人脸无疑是肉眼能够判别的最直观的信息源,方便人工确认、审计,“以貌取人”符合人的认知规律。

(3)识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识别精度处于较高的水平,误识率、拒认率较低。

(4)不易仿冒。在安全性要求高的应用场合,人脸识别技术要求识别对象必须亲临识别现场,他人难以仿冒。人脸识别技术所独具的活性判别能力保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。举例来说,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。

(5)使用通用性设备。人脸识别技术所使用的设备为一般的PC、摄像机等常规设备,由于目前计算机、闭路电视监控系统等已经得到了广泛的应用,因此对于多数用户而言使用人脸识别技术无需添置大量专用设备,从而既保护了用户的原有投资又扩展了用户已有设备的功能,满足了用户安全防范的需求。

(6)基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取的人脸图像,因而无疑是最容易获得的。

(7)成本较低,易于推广使用。由于人脸识别技术所使用的是常规通用设备,价格均在一般用户可接受的范围之内,与其它生物识别技术相比,人脸识别产品具有很高的性能价格比。

概括地说,人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高的生物特征识别技术,具有极其广阔的市场应用前景。人脸自动识别系统在安全领域和商贸领域以及经济领域都有非常广泛的应用前景,丰要有以下四类应用:

(1)刑侦破案

4

数字图像处理论文

公安部门获得案犯的照片后,可以利用人脸识别技术,在存储罪犯照片的数据库中找到最相像的人为嫌疑犯。公安部门根据目击证人的描述,画出犯罪分子的草图,然后用这张草图到人脸库中寻找嫌疑犯。由于罪犯数据库比较大,有可能有几千张甚至几万张人脸。如果人工完成这项搜索工作,不仅搜索效率低,而且容易出错。

(2)证件验证 身份证、驾驶证以及其他很多证件上都有照片,现在的证件验证一般都是由人进行验证,如果利用人脸识别技术,这项工作就可以交给机器完成,从而实现自动化智能管理。当前普遍使用的验证方法有符号或条形码标记,比如信用卡、自动提款机等。此类验证的安全性比较低。如果运用人脸识别技术,则安全性将大大改善。

(3)入口控制

入口控制的范围很广,它可以是楼宇、单位或私人住宅入口处的安全检查,也可以是计算机系统或情报系统的入口控制。目前比较常用的手段是检查证件。人员频繁出入时,保安人员再三检查证件是比较麻烦的,而且安全系数也不高。在保密要求非常严格的部门除了证件,还可以加上另外一些生物识别手段,如指纹识别、手掌识别、语音识别等。人脸识别与之相比,具有直接、方便和界面友好的特点。当前计算机系统的安全管理,通常使用字符和数字组成的密码口令管理,此口令容易被遗忘或破解,如果使用人脸作为口令则既方便又安全。

(4)视频监视

在许多银行、公司、公共场合等处设有24小时的视频监视。另外侦查员在破案时也要用摄影机对人进行跟踪。在对图像进行集体分析时,就要用到人脸的检测、跟踪和识别技术。

除了上述几部分外,人脸识别技术还可以用在视频会议、机器人的智能化研究以及医学等方面。

1.1.3人脸识别技术在相关场所的重要性

1.在维护国家和公共的安全方面

(1)如何在机场、车站、码头、宾馆、商场等口岸或公共场所的人群中发现特定的目标。安全部门、公安部门以往的做法只能是靠人工布控、蹲守。这种方式除了耗费大量的警力以外,还往往因为有关人员的疏忽而造成特定目标漏网

(2)犯罪嫌疑人在被控制以后,不愿意透露自己的真实身份,而且身上没有任何可以证明身份的线索。公安人员往往因为无从确认其身份而不得不将其释放。在受害人身份确认方面同样也存在类似的难题; (3)在出入境管理方面,常常有受控人员使用假的身份证件而成功逃脱有关部门的监控。

而基于视频的实时人脸识别系统,使用视频图像的比对,已经能够较好地满足安全、公安部门的需求。人脸识别系统所具备的高速自动识别能力很大程度上可以将公安、安全部门从以往的“人海战术”中解脱了出来,大大提升了整个国家、社会的安全防范水平,从而达到威慑犯罪、惩治罪犯、维护社会稳定、保障国家安全的目的。

2.在对门禁/出入控制系统的完善方面

门禁及出入控制系统的核心在于人的身份鉴别与核查,从而确保合法用户能够顺畅地进入受控区域,使非法用户被拒之门外。

传统的身份鉴别技术主要有如下几种类型:

5

数字图像处理论文

3.1.2PCA算法在人脸识别中的应用

设人脸图像I(x,y)为二维N*N灰度图像,用向量R表示。人脸图像训练集为

Ri(i?1,2M),其中M为训练集中图像总数,这M幅图像的平均向量为:

1??M?R

ii?1M每个人脸Ri与平均人脸ψ的差值向量是:

?i?Ri??(i?1,训练图像的协方差矩阵可表示为:

C?AAT,其中A?[?1,?2M)

?M]

计算C的特征向量,并按照特征值的权重取前若干个特征向量组成特征空间U。 基于特征脸的人脸识别过程由训练阶段和识别阶段两个阶段组成。在训练阶段,每个已知人脸Ri映射到由特征脸构成的子空间上,得到m维向量

?k?UT(Rk??)(k?1,Nc)

其中N为已知人数,距离阈值为:

?c?1?j??k(j,k?1,max2j,k??Nc)

其中U为C的特征向量组成的矩阵。在识别阶段,首先把待识别的图像R映射到特征脸空间。得到向量:

??UT(R??),?与每个人脸集的距离定义为:

?k2?R?Rk(k?1,2Nc)

为了区分人脸和非人脸,还需计算原始图像R与其由特征空间重建的图像Rf之间的距离ε:?2?R?Rf,

其中Rf?U???

2 采用最小距离法对人脸进行分类,分类规则如下:

21

数字图像处理论文

(1)若???c,则输入图像不是人脸图像; (2)若 (3)若

???c,?k,?k??c则输入图像包含未知人脸;

则输入图像为库中第k个人的人脸。

???c,?k,?k?min{?k}??c3.2 基于主成分分析法的人脸识别

将PCA方法用于人脸识别,其实是假设所有的人脸都处于一个低维线形空间,而且不同的人脸在这个空间中具有可分性。其具体做法是由高维图像空间经K-L变换后得到一组新的正交基,对这些正交基作一定的取舍,保留其中的一部分生成低维的人脸空间,也即人脸的特征子空间。完整的PCA人脸识别算法步骤包括: (1)人脸图像预处理。

(2)读入人脸库,训练形成特征子空间。

(3)把训练图像和测试图像投影到上一步骤中得到的子空间上。

(4)选择一定的距离函数进行识别。

3.2.1 读入人脸库

近几年来,人脸识别技术一直是图像研究领域的一个热门话题。许多专家和学者也纷纷提出了各种人脸识别的算法。然而,依据这些算法所建立起来的人脸特征模型大多都是基于有限图像库的经验模型。图像库的选择在很大程度上影响了模型的适用面和鲁棒性。下面是一些常用的人脸图像数据库。

(1)英国的ORL (Olivertti Research Laboratory)人脸数据库 ORL人脸数据库总共由400幅灰度图像组成,图像尺寸均为92*I12,图像背景均为黑色。这些图像来自40个不同年龄、不同性别和不同种族的人脸。每张人脸对应10副不同表情和细节的图像。如:笑和不笑,戴眼镜和不戴眼镜,睁眼睛或闭眼睛等。每副图像都是不一样的,包括了旋转幅度达20的深度旋转和平面旋转。人脸的尺寸也不一样,其变化范围最大达10%。该人脸库是在1992年到1994年间由英国剑桥大学Olivertti实验室的成员拍摄而成的,是目前使用最广泛的人脸图像库之一。 (2)美国的FERET(Face Recognition Technology)人脸数据库

FERET人脸库是由美国国防部建立的,目前最大容量的人脸图像库。该库包含了5000多幅从不同角度拍摄的人脸正面图像。每张人脸对应8张图片,其中正面的两张,侧面的六张。所有图像均为黑白图像,背景均为纯色。该图像库中的图像常被用于比较不同人脸识别技术的优劣。 (3)耶鲁人脸库

耶鲁人脸库由165副人脸图像组成,包括15个人的脸部图像,每个人对应11张不同的图像。这些图像的区别在于人物的脸部表情、不同的光照条件和脸部是否有局部被遮掩。

(4) MIT数据库

该数据库由960幅人脸图像组成,每幅图像的大小为128* 128,包括了62个人的

22

数字图像处理论文

脸部图像,每人对应15副不同姿态的表情。MIT数据库中的图像不包含光照变化的效果。

(5)欧洲M2VTS多模态数据库

该库包含了37个人的脸部序列图像。每一周对一个人的脸部按从右侧面到左侧面的角度拍摄,拍摄时每个人的嘴形是从一到九的数数,连续拍摄五周。该数据库是从工程项目中发展起来的,其中的图像识别难度较高,适用于算法复杂的访问控制实验测试。 (6) UMIST人脸库

UMIST人脸库包含了564副不同的图像,这些图像采自20个人的脸部图像。通过拍摄这20个人从右侧面到正面的脸部姿态而得。UMIST人脸库中的图像识别起来相对比较简单

(7)Purdue AR人脸库

Purdue AR人脸库包含了3276幅彩色的人脸正面图像。这些图像采自70个男性和56个女性的脸部表情。该图像库包含的范围比较全面,涵盖了不同的表情(如:微笑、愤怒和冷酷等),不同的光照效果(如:左光源、右光源等)和脸部局部遮掩(如:戴眼睛)。每个两周进行一次脸部拍摄。该图像库适用于识别从视频中获取的图像,常用于做表情区分实验。

除上述人脸库外,还有CMU, PIE等常用的人脸图像库。不同的人脸图像库,其包含的图像在质量和内容方面都是不同的。本设计采用的人脸图像主要来自ORL人脸图像库。

这次设计中选用英国剑桥大学人脸库即ORL人脸库,此人脸数据库有40人,每人有10幅图像。这些图像具有以下特点:有些图像拍摄于不同的时期;人的脸部表情和脸部细节有着不同程度的变化,比如,笑或不笑,眼睛或睁或闭,戴或不戴眼镜;人脸姿态也有相当程度的变化,深度旋转和平面旋转可达20。人脸的尺度也有多达10%的变化;图像的分辨率是 112×92。在ORL人脸库中选出每个人的前5幅图像作为训练图像,构成一个200幅图像的训练集,剩下的200幅图像构成测试集。每幅图像按列相连构成10304维列向量,读入的训练样本集就构成10304×200的矩阵。

图3-1 ORL人脸样本

图3-2第一个人脸的十个样本

23

数字图像处理论文

读入每一个二维的人脸图像数据并转化为一维的向量。每人选择一定数量的图像构成训练集,其余构成侧试集。假设图像的大小是w?h(w和h分别为图像的宽度和高度),整个人脸库中图像个数是n,用于训练的人脸图像个数是n1,测试的图像个数是n2,令

m?w?h,则训练集是一个m?n1的矩阵,测试集是m?n2的矩阵。第i幅人脸可以表

示为(m为一位向量维数):

iixi?x1i,x2,...xm??

T3.2.2 计算K-L变换的生成矩阵

读入每一个二维的人脸图像数据并转化为一维的向量。每人选择一定数量的图像构成训练集,其余构成侧试集。假设图像的大小是w?h(w和h分别为图像的宽度和高度),整个人脸库中图像个数是n,用于训练的人脸图像个数是n1,测试的图像个数是n2,令

m?w?h,则训练集是一个m?n1的矩阵,测试集是m?n2的矩阵。第i幅人脸可以表

示为(m为一位向量维数):

iixi?x1i,x2,...xm??

T 计算K-L变换的生成矩阵?,进行K-L变换. K-L变换的生成矩阵可以是训练样本的总体散布矩阵

St,也可以是训练样本的类间散布矩阵

Sb等。散布矩阵由训练集生成。

总体散布矩阵可表示为(忽略系数):

St??xi?xxi?x?Rm?mi?1n1

????T

若取总体散布矩阵

St作为生成矩阵?,记

m?n1X?x?x,x?x,...,x?x?R12n1

??则?可写成:

??XXT?Rm?m

若将类内散布矩阵

cSb(忽略系数)作为K工变换的生成矩阵?,即:

TSb???m?x??m?x?iii?1

24

数字图像处理论文

这里c训练样本集中模式类别数,mi?i?1,...,c?是训练样本集中各类模式样本的均值矢量,且记:

X?m1?x,m2?x,...,mc?x?Rn1?c 则生成矩阵?为:

??XXT?Rn1?n1

??此时产生矩阵的秩r一般为c

以训练样本集的总体散布矩阵为生成矩阵St,即

St??(Xi??)(Xi??)T

i?1200其中Xi为第i幅训练样本的图像向量,?为训练样本集的均值向量,训练样本的总数为200。

图3-3 平均脸

3.2.3计算特征向量

计算特征值和特征向量的基本步骤是:(1)创建协方差矩阵;(2)计算协方差矩阵的特征值和特征向量;(3)按特征值由小到大顺序排列特征值和特征向量。

这些特征向量对应的图像很像人脸,所以被称为“特征脸”。有了这样一个由“特征脸”组成的降维子空间,任何一幅图像都可以向其投影并获得一组坐标系数,这组坐标系数表明了该图像在“特征脸”子空间的位置,从而可以作为人脸识别的依据。 虽然协方差矩阵E最多有对应于非零特征值的k(k?n1且k远小于m)个特征向量,但是通常情况下,k仍然很大,而事实上,根据应用的要求,并非所有的特征向量都有需要保留,而特征空间投影的计算速度是直接与创建子空间所用的特征向量的数目相关,若考虑到计算时间的因素,可以适当的减去一些信息量少的特征向量,而且,去掉这些特征向量之后不一定不利于分类结果,有的情况下反而能够提高识别性能。下面讨

25

数字图像处理论文

3.3.3 选取阈值提取训练样本特征

上面得到的200个特征向量,虽然已经比较小了,但计算量还是比较大。其实不必要保留所有的特征向量,较大特征值对应的特征向量已经能够提供足够多的用于识别的特征。一般是通过计算阈值进一步降低维数,这种方法的具体做法是把特征向量和特征值从大到小排列,选取特征值占总特征值之和的比值大于一定值所对应的特征向量。阈值?一般是取0.9。计算公式是????i/??i。但发现在这里?取0.91更好,识别率更

j?1j?1pM高一点。通过程序运行可以发现,阈值选择为0.91时特征值个数减少为75个,就是说很多特征值是很小的,数值小的特征值对应的特征向量对识别只能提供很少的信息。所以通过阈值选择,计算量减少了很多。程序如下:

d1=diag(d);%obtain the diagonal of the sigma dsort=flipud(d1); vsort=fliplr(v); dsum=sum(dsort); dsum_extract=0; p=0;

while(dsum_extract/dsum<0.90) p=p+1;

dsum_extract=sum(dsort(1:p)); end

base = xmean' * vsort(:,1:p) * diag(dsort(1:p).^(-1/2)); allcoor=allsamples*base; accu = 0; for i=1:40

for j=8:10

3.3.4 选取测试样本进行识别

测试样本识别的过程就是把测试图像投影到特征脸子空间,得到一组特征系数,然后按照欧式距离的最小近邻法与训练样本集投影得到的系数匹配,找到距离最小的样本就是识别的结果。但为了克服单个样本的偶然性,这里选择最近的3个样本,然后把待识别人脸判别为这3个样本中同类样本最多的那个类别。程序如下:

a=imread(strcat('e:\\ORL\\s',num2str(i),'\\',num2str(j),'.pgm')); b=a(1:10304);

b=double(b);

tcoor=b*base;

31

数字图像处理论文

for k=1:280

mdist(k)=norm(tcoor-allcoor(k,:));

end;

[dist,index2]=sort(mdist);

class1=floor( (index2(1)-1)/7)+1;

class2=floor((index2(2)-1)/7)+1;

class3=floor((index2(3)-1)/7)+1;

if class1~=class2 && class2~=class3

class=class1;

elseif class1==class2

class=class1;

elseif class2==class3

class=class2;

end;

if class==i

accu=accu+1;

end;

end; end;

accuracy=accu/120

32

数字图像处理论文

3.4 实验结果及分析

对于ORL人脸库,选用每人前5幅图像作为训练样本,后5幅图像作为测试样本,训练样本和测试样本总数均为200,阈值选为0.91。程序运行可得识别率为0.885。选取的特征空间的维数是88。PCA算法是基于人脸图像整体特征的人脸识别方法,影响识别率的因素主要有很多,如人脸库的差异,算法的差异,参数的选择,都会产生很大的影响。但现在主要考虑两点因素:(1)阈值的选择,即特征空间的维数;(2)训练样本的数量。下面就看一下选择不同的参数时候他们各自对识别率的影响如表3-1所示。

表3-1阈值及样本数量对识别率的影响

每人7幅 每人6幅 每人5幅 每人4幅 每人3幅 每人2幅 每人1幅 0.20 0.3583 0.3688 0.3200 0.3500 0.3607 0.3469 0.3222 0.40 0.6500 0.6312 0.6150 0.5667 0.5714 0.5375 0.4250 0.60 0.8667 0.8313 0.7650 0.7167 0.7036 0.6656 0.6083 0.80 0.9333 0.8938 0.8600 0.8083 0.7643 0.7344 0.6444 0.85 0.9417 0.8875 0.8600 0.8333 0.7857 0.7375 0.6639 0.88 0.9417 0.9063 0.8700 0.8417 0.7893 0.7500 0.6639 0.90 0.9417 0.9063 0.8800 0.8458 0.7893 0.7500 0.6778 0.92 0.9333 0.8938 0.8800 0.8333 0.7964 0.7625 0.6806 0.94 0.9333 0.9000 0.8750 0.8292 0.7964 0.7531 0.6972 0.96 0.9333 0.8938 0.8800 0.8250 0.7857 0.7469 0.6944 从上表可以看出当阈值一定时,训练样本数的增加会使识别率提高,大概每人每增加一幅图像,识别率提高4个百分点。在训练样本数一定时,阈值的改变也相应的影响识别率,阈值太小的时候识别率显然很低,大概阈值到0.8以上时,识别率变化不大,这就说明,降低特征矩阵维数不但可以减少计算量,而且基本上不会影响识别率太多。

33

数字图像处理论文

4 总结

人脸识别是一个跨学科富挑战性的前沿课题,但目前人脸识别还处在研究阶段,还未达到实用化.人脸识别难度较大,主要是在光线、表情、姿态变化以及附加物的影响时,很难找到一种算法能适应所有的情况。本文采用的特征提取提和识别的方法是基于奇异值分解的特征提取法,在判断输入图像与训练图像之间的类似度时,用了较常用的欧式距离。

有待研究的问题还有:一是如何利用各种图像的特点,对静态人脸图像做相应的预处理,从而克服光照,表情变换对识别的影响,提高人脸识别的鲁棒性;二是在人脸识别的特征提取过程中,如何能利用图像的各种信息,比如灰度统计信息和结构信息,将各种可能的信息集合起来,找到能最大限度利用各种信息的识别方法。

人脸识别的方法是很多,各种方法都有各自的优缺点。如果能把各种方法融合起来,将会是一个很好的方向。

PCA技术的一大好处是对数据进行降维的处理。我们可以对新求出的“主元”向量的重要性进行排序,根据需要取前面最重要的部分,将后面的维数省去,可以达到降维从而简化模型或是对数据进行压缩的效果。同时最大程度的保持了原有数据的信息。

PCA方法识别率并不是很高(只有84%),这样的识别率在实际中还无法广泛的应用。因此,需要与其他方法结合才能达到较好的效果。当它与粗糙集的理论相结合时,识别率可以到95%,与神经网络结合时,识别率近97%。此外,另外对于大型数据库, 图像之间的相关性的增大会导致识别率的降低和训练时间的延长。这是进一步研究时需要解决的问题。尽管如此,本文提出的基于PCA的人脸特征提取仍然有很强的现实意义和指导意义。相信随着相关技术的成熟和不断发展,上述问题定可以得到进一步解决,进而不断推动相关学科的内涵和外延,为社会的进步和科技的发展做出更大的贡献。

34

数字图像处理论文

5 参考文献

[1]O'Toole A J,Abdi H,Deffenbacher K A,etal. A low dimensional representation of faces in the higher dimensions of space.[J].Journal of the Optical Society of 2 America,1993,10:405~411

[2]张翠萍,苏光大.人脸识别技术综述.中国图像图形学报,2000,5(11):885-894

[3]A.Samal,P. A. Iyengar.Automatic recognition and analysis of human faces and facial expressions: a survey [J]. Pattern Recognition,1992,25(1):65-67

[4]Turk M,Pentland A. Eigenfaces for recognition [J]. Journal of Cognitive Neuroscience,1991,3(1):71~86

[5]Bartlett M S,Movellan J R,Sejnowski TJ. Face Recognition by Independent Component Analysis [J]. IEEE Trans. on Neural Network, 2002,13(6):1450-1464

[6]Manjunath B S,Shekhar C and Chellappa R. A new approach to image feature detection with application[J]. Patt. Recog,1996,29(4):627-640

[7]Cheng Y. Liu K,Yang J,etal.Human face recognition method based on the statistical model of small sample size. SPIE Proc,Intell. Robots and Computer Vision X: Algorithms and Techn.1991,1606:85-95

[8]Nefian A V Embedded Bayesian Networks for Face Recognition [A]. Proceedings. IEEE International Conference on Multimedia and Expo [C] 2002,2:133-136

[9]Gutta S,Wechsler H. Face Recognition Using Hybrid Classifiers [J]. Pattern Recognition,1997,30(4):539-553

[10]Haddadnia J,Ahmadi M,Faez K A Hybrid Learning RBF Neural Network for Human Face Recognition with Pseudo Zernike Moment Invariant [A]. Proceedings of the 2002 International Joint Conference on Neural Networks [C].2002,1:11-16

[11]M.Lades,J.C.Vorbruggen,J.Buhmann,ect.Distortion invariant object recognition in the dynamic link architecture. IEEE Trans.on Computer,1993,42(3):300-311

[12]Nastar C,Moghaddam B A .Flexible Images: Matching and Recognition Using Learned Deformations [J]. Computer Vision and Image Understanding,1997,65(2):179-191 [13]羊牧.基于KL投影和奇异值分解相融合人脸识别方法的研究[D].四川大学.2004,5,1 [14]白冬辉.人脸识别技术的研究与应用[D].北方工业大学.2006,5

[15]Adam D. Tibbalds. Three Dimensional Human Face Acquisitions for Recognition [D]. Phd. Thesis Cambridge,University of Cambridge,1998.

[16]Wenyi Zhao. Robust image based 3D face recognition [D]. PhD. Thesis. University of Maryland,College Park,1999

35

本文来源:https://www.bwwdw.com/article/im0g.html

Top