1 人脸检测的意义,国内外的情况综述
基于视频流的人脸分析是目前计算机模式识别和图形图像领域中的研究热点,其目的是在视频中自动检测、定位、跟踪和识别人脸。该技术能广泛应用于基于内容的图像检索、视频编码、生物认证、计算机安全、电子商务等领域。虽然已经有很多人脸检测和识别算法,但至今仍有大量的研究者在研究这项技术,这是因为人脸是一个动态的目标,在表达形式上有高度的可变性,导致该项技术仍然是机器视觉中的难点。
基于WEBCAM(INTERNET上的摄像头)的人脸检测和跟踪技术是将人脸分析技术与基于INTERNET的视频流相结合的一项技术,可以应用于在INTERNET上的身份认证和安全。目前已经有大量的生物认证技术(如指纹识别,虹膜识别,人脸识别)应用于身份认证,用于加强传统身份认证技术(如口令)。但是这些技术均只能用于本机操作,而不能用于INTERNET上身份的验证。例如,我系计算机教育与应用研究所开发出了基于B/S模式的考试系统,从理论上说可以实现在INTERNET上的考试。然而,由于不能解决在INTERNET上的身份认证,该系统目前只能适用于在局域网中进行在线测试。可以设想,如果有了基于WEBCAM的人脸检测和跟踪技术,我们就可以在此基础上实现考试过程中的身份认证和考试监控。
基于WEBCAM(INTERNET上的摄像头)的人脸检测和跟踪技术的核心是人脸分析。人脸分析的任务包括人脸检测,人脸识别和人脸跟踪。人脸检测是许多后期应用的预处理过程。有许多方法可以用于人脸检测,这些方法可以分成四大类:
(1)基于知识(KNOWLEDGE-BASED)的方法,是基于规则的方法,试图对人脸特征在直觉上建模。
(2)基于特征不变性(FEATURE INVARIANT)的方法,是利用特征的不变性进行检测,如比例、方位、灰度级和肤色等)。
(3)模板匹配(TEMPLATE MATCHING)的方法,通过手工定义人脸的模板,或者是脸部特征,来与输入图像进行匹配。
(4)基于外貌(APPEARANCE-BASED)的方法,通过机器学习的方法找到人脸中的相关特征。
STYLE=BORDER-RIGHT: MEDIUM NONE; BORDER-TOP: MEDIUM NONE; BORDER-LEFT: MEDIUM NONE; BORDER-BOTTOM: MEDIUM NONE; BORDER-COLLAPSE: COLLAPSE; MSO-PADDING-ALT: 0CM 5.4PT 0CM 5.4PT; MSO-BORDER-ALT: THREE-D-EMBOSS WINDOWTEXT 2.25PT CELLSPACING=0 CELLPADDING=0 BORDER=1>
方法
代表文章
基于知识
MULTIRESOLUTION RULE-BASED METHOD
不变特征
面部特征
GROUPING OF EDGES
肌理(皮肤)
SPACE GRAY-LEVEL DEPENDENCE MATRIX(SGLD) OF FACE PATTERN
肤色
MIXTURE OF GAUSSIAN
多重特征
INTEGRATION OF SKIN COLOR,SIZE AND SHAPE
模板匹配
预先确定的人脸模板
SHAPE TEMPLATE
可变的(人脸)模型
ACTIVE SHAPE MODEL(ASM)
基于外观的(识别)方式
特征人脸
EIGENVECTOR DECOMPOSITION AND CLUSTERING
分布式
GAUSSIAN DISTRIBUTION AND MULTIPLAYER PERCEPTRON
神经系统网络
ENSEMBLE OF NEURAL NERWORKS AND ARBITRATION SCHEMES
支持矢量机技术
SVM WITH POLYNOMIAL KERNEL
简单贝叶斯分类
JOINT STATISTICS OF LOCAL APPEARANCE AND POSITION
隐马尔可夫模型
HIGHER ORDER STATICSTICS WITH HMM
信息理论法
KULLBACK RELATIVE INFORMATION
表格一 概括了单一图像中这四类人脸检测的算法和具有代表性的文章
其中,人脸的肤色作为一种有效的特征已经在人脸识别和人手跟踪等许多应用中得到使用和证明。虽然不同的人有不同的肤色,但经研究表明:这主要是由于肤色的亮度和色度之间存在差异造成的。
许多基于肤色不变性的人脸识别方法都是构建一个肤色模型。最简单的肤色模型是定义一个肤色像素的色调阈限,用CR,CB标识值,例如R(CR,CB)是从肤色模型像素的实例中取值的。选用适合的阈限(CR1,CR2)和(CB1,CB2),如果一个像素(CR,CB)的值符合这个范围域内,即CR1
CROWLEY和COUTAZ根据规格化RGB彩色空间中的直方图H(R,G)的(R,G)值,得到由特殊RGB向量给出的某像素的出现概率,如果H(R,G)>=Τ,Τ是从直方图的实例中根据经验选定的一个表示肤色像素出现概率的域值,那么这个像素被归类到相应的肤色中去。
SAXE和FOULDS提出一种迭代的皮肤识别方法,这种方法使用HSV色彩空间〔138〕的直方图交集。肤色像素中的一个初始化的点,被称为控制点。这些点是由用户选择的,常被用于迭代算法的初始化。为了识别肤色的区域,他们的方法是通过一幅图像中某一时刻的点移动,把来自该图像的控制直方图和当前直方图的比较关系表现出来。直方图交集被用于比较控制直方图和当前直方图,如果匹配值或公共的实例数目(例如交集)比一个域值大,那么当前点被当做肤色来分类。
相对于前面所述的非参数方法,高斯密度函数和混合高斯是常被用于模拟肤色的参数方法。KJELDSEN和KENDER定义一个在HSV色彩空间中用来从背景中区分出皮肤区域的色彩术语。常常使用可能性大的值来估算单峰高斯分布中的参数,且宁可使用一种混合高斯而不使用一种多模型分布,因为有报告表明不同种族背景的有色人种不能构造一种多模型的分布的色彩直方图。
JONES和REHG在从规格化RGB色彩空间中搜集来的、近十亿个被标识的皮肤色调像素中进行一项大级别的实验。比较直方图的性能和混合模型对皮肤的识别,他们发现直方图模型在正确度和计算代价上更有优势。如果肤色模型能够完全适应于不同光照条件的需要,那么肤色信息是用于识别脸部区域和特殊脸部特征的有效工具。然而,这样的肤色模型在光源变化显著的光谱中就无效了。换句话说,由于背景和前景光照的变化,肤色表现出来的状态经常是不稳定的。虽然通过使用物理学模型能明确地表达色彩稳定不变的性质,但是在光照条件变化的情况下使用肤色识别还是存在有些问题的。