CN106326828B - 人脸识别中的眼睛定位方法 - Google Patents
人脸识别中的眼睛定位方法 Download PDFInfo
- Publication number
- CN106326828B CN106326828B CN201510767147.8A CN201510767147A CN106326828B CN 106326828 B CN106326828 B CN 106326828B CN 201510767147 A CN201510767147 A CN 201510767147A CN 106326828 B CN106326828 B CN 106326828B
- Authority
- CN
- China
- Prior art keywords
- eye
- face
- image
- region
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明的眼睛定位方法,检测并去除图像的反光区域;用Ada‑Boost算法的Viola‑Jones方法检测人脸;计算人脸区域归一化梯度向量,二值化,检测眼镜的黑框,用相邻不在黑框区域像素的平均灰度值替换黑框区域的像素灰度值;构造眼睛和非眼睛的训练集,训练二次核函数的非线性SVM,对以眼睛周围像素为中心的区域,计算评估,评估最大值所在的像素作为眼睛位置并称为置信度;如果置信度大于设定的阈值,则为最终定位结果,否则用PCA估算眼睛位置,对人脸区域作旋转和缩放变换,计算变换后图像的Gabor系数,并计算人脸检测的置信度,选取置信度最大的图像,把该图像中眼睛的平均位置作为原始图像的眼睛位置。
Description
技术领域
本发明涉及人脸识别中的眼睛定位方法。
背景技术
采用人脸图像来进行身份认证的人脸识别是一种使用非常自然和便利的生物特征识别技术。光照的变化是影响人脸识别系统性能的最主要因素。为了避免光照的影响,人脸识别已广泛采用近红外图像。通常,人脸识别过程包含人脸检测、眼睛定位、预处理、特征提取和比对。鲁棒的眼睛定位在人脸识别系统中起着非常重要的作用。
传统的眼睛定位方法可大致分为三类:基于模板的方法、基于外观的方法、基于几何特征的方法。
基于几何特征的方法根据眼睛的特性来定位眼睛位置比如边缘和虹膜的强度。这些方法在对比度高的图像上才能获得准确的定位。
基于模板的方法,首先基于眼睛形状设计通用眼睛模型,然后用模板匹配方法搜索眼睛。基于外观的方法需要收集大量的训练数据,包含不同个体的不同人脸朝向和不同光照情况下的眼睛。这些训练数据用作训练分类器,并检测训练数据是否通过分类。这种方法能够准确检测眼睛,但是对戴眼镜的人脸的检测效果不稳定。
特别地,在人脸识别过程中,反光区域和眼镜边缘是人脸检测和眼睛定位的瓶颈。
发明内容
本发明提供一种无论图像质量好坏均可以快速、稳定地定位人脸中眼睛的方法及应用该眼睛定位方法的人脸识别系统。
本发明的技术方案一提供一种人脸识别中眼睛的定位方法。该眼睛定位方法,首先检测并去除图像中的反光区域,然后进行人脸检测、检测和去除眼镜的黑框、基于SVM(Support Vector Machine)的眼睛定位,最后用基于PCA(Principal ComponentAnalysis)的眼睛定位来定位眼睛位置。
在所述检测并去除图像中的反光区域处理中,
计算人脸图像的灰度直方图,用Otsu方法确定反射区域的阈值,如果像素满足设定的条件,则被认为在反射区域中。用相邻的不在反射区域的像素平均灰度值替换在反射区域的像素灰度值;
在所述人脸检测处理中,
在去除反射区域的图像上采用Ada-Boost算法的Viola-Jones人脸检测方法检测人脸;
在所述检测和去除眼镜的黑框处理中,
对检测到的人脸区域的每个像素,计算归一化的梯度向量,用一个适当的阈值得到一个二值图像,
在二值图像上检测眼镜的左边黑框和右边黑框,
用相邻的不在黑框区域的像素平均灰度值替换在黑框区域的像素灰度值;
在所述的基于SVM的眼睛定位处理中,
构造眼睛的训练集,计算以眼睛准确位置为中心的固定大小区域的Gabor系数向量,
构造非眼睛的训练集,计算以真实眼睛的像素距离为中心的固定大小区域的Gabor系数向量,
对眼睛训练集和非眼睛训练集,训练具有二次核函数的非线性SVM。
对于以眼睛周围像素为中心的区域,计算Gabor系数得到SVM评估,
以评估的最大值所在的像素作为眼睛位置,并被称为眼睛位置的置信度;
在所述的基于PCA的眼睛定位处理中,
如果在SVM中眼睛定位的置信度大于预先设定的阈值,则该位置为最终定位结果,不再进行处理,
如果在SVM中眼睛定位的置信度不大于预先设定的阈值,采用PCA再次估算眼睛位置,
利用手工找到的眼睛位置归一化脸部图像大小,在特定点计算Gabor系数,构造包含这些系数的向量,并作PCA得到线性变换矩阵,
对检测到的人脸区域作一系列旋转和缩放变换,
对变换后的每个图像,计算Gabor系数,并计算人脸检测的置信度,
选取置信度最大的图像,并把该图像中眼睛的平均位置作为原始图像的眼睛位置。
本发明的技术方案二提供一种人脸识别系统。该人脸识别系统包括:
人脸检测及眼睛定位模块,应用技术方案一的眼睛定位方法,检测并去除反光区域、检测人脸、检测并去除眼镜的黑框、眼睛定位;
预处理模块,为避免光照的影响,归一化局部均值和方差;
特征提取模块,对检测到的人脸区域提取采样点,对每个采样点计算M个频率和N个方向的Gabor系数绝对值,其中,M、N为大于0的自然数;及
比对模块,对于两幅人脸图像,对应的采样点计算M*N维向量的归一化内积,并将内积值相加得到相似度。如果相似度大于预设的阈值,则判断为两幅图像来自同一个人。
发明的效果
根据本发明的眼睛定位方法及人脸识别系统,无论图像质量好坏均能够快速、稳定地定位眼睛位置。
附图说明
图1是人脸识别系统的框图。
图2是眼睛定位的说明图。
具体实施方式
下面,结合附图,对本发明的眼睛定位方法及使用该眼睛定位方法的人脸识别系统进行详细说明。
眼睛定位方法包括检测并去除反光区域的处理、人脸检测的处理、检测和去除眼镜的黑框的处理、基于SVM的眼睛定位的处理、基于PCA的眼睛定位的处理。
<检测并去除反光区域的处理>
检测并去除反光区域的处理包括如下(1)~(4)的处理。
(1)计算输入图像I的灰度直方图。
hist(k),k=0,1,…,255为计算出的直方图。
(2)用Otsu方法确定反射区域的阈值。Otsu法是公知的方法,这里不再详细叙述。确定出的阈值如下。
其中,
(3)如果一个像素(i0,j0)满足以下两个条件,则认为该像素在反射区域中,
·I(i0,j0)>Th
·rate(i0,j0)>Th_rate
其中h和H是预定义的常量(H>h),Th_rate是预定义的阈值。
(4)用相邻的不在反射区域的像素的平均灰度值替换在反射区域的像素的灰度值。
<人脸检测的处理>
采用Ada-Boost算法的Viola-Jones人脸检测方法,根据去除反射区域的图像来检测人脸。
<检测和去除眼镜的黑框的处理>
检测和去除眼镜的黑框的处理包括如下(1)~(4)的处理。
(1)检测
对于检测到的人脸区域的每个像素(i,j),计算归一化的梯度向量grad(i,j),用一个适当的阈值Th_grad得到一个二值图像B。
(2)检测眼镜的左边黑框
根据图像B计算出如下序列,
其中w和h是检测到人脸图像的宽度和高度,h1和h2是预设的常数。
在i=h/2的邻域,找到序列C的局部最大值点,在该点计算B的一个联通区域。然后,用一个抛物线近似该联通区域,如果二次系数大于0则认为该联通区域为眼镜边缘。
(3)检测眼镜的右边黑框
眼镜右边黑框的检测类似于左边黑框的检测。
(4)去除
用相邻的不在黑框区域的像素的平均灰度值替换在黑框区域的像素的灰度值
<基于SVM的眼睛定位的处理>
基于SVM的眼睛定位的处理包括如下(1)~(2)的处理。
(1)SVM训练
构造眼睛的训练集,计算以眼睛准确位置为中心的固定大小区域的Gabor系数向量。
构造非眼睛训练集,计算以真实眼睛的像素距离为中心的固定大小区域的Gabor系数向量。
采用上述训练集,训练具有二次核函数的非线性SVM如下:
c(x)=∑iαik(si,x)+b
其中si是一个支持向量,αi是权重,b是偏差,k是核函数。
(2)眼睛位置估计
对于以眼睛周围像素为中心的区域,计算Gabor系数得到SVM评估。
以评估的最大值所在的像素作为眼睛位置,这种估算被称为眼睛位置的置信度
<基于PCA的眼睛定位的处理>
如果在SVM中眼睛定位的置信度大于预先设定的阈值,则该位置为最终定位结果,不再执行基于PCA的眼睛定位。如果置信度不大于预先设定的阈值,采用PCA再次估算眼睛位置。
基于PCA的眼睛定位的处理包括(1)~(2)的处理。
(1)PCA训练
利用手工找到的眼睛位置归一化脸部图像大小,在特定点计算Gabor系数,构造包含这些系数的向量。对向量做PCA。设A为得到的线性变换。
(2)估算眼睛位置
对检测到的人脸区域作一系列旋转和缩放变换(以质心为中心,左右分别旋转3度、5度、10度、15度等,并分别缩小为0.95、0.90、0.85倍,放大为1.05、1.10、1.15倍等),对变换后的每个图像,像上面一样计算Gabor系数Gabor_vec。然后按下式计算人脸检测的置信度。
score=||A*Gabor_vec||/||Gabor_vec||
选取置信度最大的图像,并把该图像中眼睛的平均位置作为原始图像的眼睛位置。
如上所述,能够定位出眼睛的位置。
下面,结合图1和图2对使用了本发明的眼睛定位方法的人脸识别系统进行说明。
人脸识别系统包括人脸检测及眼睛定位模块、预处理模块、特征提取模块及比对模块。
人脸检测及眼睛定位模块执行如下处理。
·检测并去除反光区域;
·人脸检测;
·检测并去除眼镜的黑框;
·基于SVM的眼睛定位;
·基于PCA的眼睛定位
预处理模块执行如下处理。
归一化局部均值和方差,归一化为128个7×7大小区域的均值和方差。
特征提取模块执行如下处理:
在检测到的人脸区域取10×10个采样点,对每个采样点计算5个频率12个方向的Gabor系数绝对值。
比对模块执行如下处理。
对两幅人脸图像的每个对应采样点计算两个包含60个元素的向量的归一化内积,并将这些值相加得到相似度。如果相似度大于预设的阈值,则认为两张人脸图像来自同一人。
本发明人通过实验验证了本发明的效果。
在本公司数据库上的测试结果如下:
该数据库包含40人的400幅图像,眼睛定位的准确率为97%,等错误率为0.2%。因此,通过本发明的眼睛定位方法,对于现有技术无法定位正确的眼睛的情况,也能够快速、稳定地定位眼睛。
如上所述,对本发明的优选的实施方式进行了说明,但上述实施方式仅仅是作为例子来提示的,并不对本发明的保护范围进行限定,例如,上述涉及的归一化区域大小及个数、所取的采样点的数量、向量的维数等也仅仅是例示,根据实际要求的速度、定位精度等,也可以是其他的数量。
Claims (2)
1.一种眼睛定位方法,根据人脸图像定位眼睛的位置,其特征在于,包括:检测并去除反光区域处理、人脸检测处理、检测和去除眼镜的黑框处理、基于SVM的眼睛定位处理、基于PCA的眼睛定位处理,其中,
在所述检测并去除反光区域处理中,
计算输入图像的灰度直方图,确定反射区域的阈值,进行反射区域判断,用非反射区域的像素平均灰度值替换反射区域的像素值;
在所述人脸检测处理中,
在去除反射区域的图像上检测人脸;
在所述检测和去除眼镜的黑框处理中,
在人脸区域计算归一化梯度向量,并得到二值图像,根据联通区域检测眼睛的黑框,用相邻的不在黑框区域的像素平均灰度值替换在黑框区域的像素灰度值;
在所述基于SVM的眼睛定位处理中,
构造眼睛和非眼睛训练集训练具有二次核函数的非线性SVM,对以眼睛周围像素为中心的区域作SVM评估,评估最大值所在的像素作为眼睛位置,该评估最大值被称为眼睛位置的置信度;
在所述基于PCA的眼睛定位处理中,
如果在SVM眼睛定位中得到的置信度大于预先设定的阈值,则该位置为最终定位结果,否则,采用PCA再次估算眼睛位置;
对人脸区域作旋转和缩放变换,对变换后的图像,计算Gabor系数,根据PCA训练后得到的变换矩阵计算人脸检测的置信度,选取置信度最大的图像,并把该图像中眼睛的位置作为原始图像的眼睛位置。
2.一种人脸识别系统,包括:
人脸检测及眼睛定位模块,应用权利要求1的眼睛定位方法,检测人脸并定位眼睛位置;
预处理模块,归一化局部均值和方差,得到128个7×7大小区域的均值和方差;
特征提取模块,在检测到的人脸区域取10×10个采样点,对每个采样点计算5个频率12个方向的Gabor系数绝对值;及
比对模块,对于两幅人脸图像的每个对应采样点计算两个60维向量的归一化内积,并将这些值相加得到相似度,如果相似度大于预设的阈值,则认为两张人脸图像来自同一人。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510767147.8A CN106326828B (zh) | 2015-11-08 | 2015-11-08 | 人脸识别中的眼睛定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510767147.8A CN106326828B (zh) | 2015-11-08 | 2015-11-08 | 人脸识别中的眼睛定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106326828A CN106326828A (zh) | 2017-01-11 |
CN106326828B true CN106326828B (zh) | 2019-07-19 |
Family
ID=57725067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510767147.8A Active CN106326828B (zh) | 2015-11-08 | 2015-11-08 | 人脸识别中的眼睛定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326828B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102410834B1 (ko) * | 2017-10-27 | 2022-06-20 | 삼성전자주식회사 | 반사 영역을 제거하는 방법, 사용자의 눈을 추적하는 방법 및 그 장치 |
EP3699808B1 (en) * | 2017-11-14 | 2023-10-25 | Huawei Technologies Co., Ltd. | Facial image detection method and terminal device |
CN108564540B (zh) * | 2018-03-05 | 2020-07-17 | Oppo广东移动通信有限公司 | 去除图像中镜片反光的图像处理方法、装置和终端设备 |
CN109272016B (zh) * | 2018-08-08 | 2021-03-23 | 广州视源电子科技股份有限公司 | 目标检测方法、装置、终端设备和计算机可读存储介质 |
CN110427054B (zh) * | 2019-07-18 | 2022-07-22 | 太原理工大学 | 一种应用于野生动物活动检测的云台监控装置及其监控方法 |
CN111259778B (zh) * | 2020-01-13 | 2022-06-17 | 天津众阳科技有限公司 | 一种人脸反射区的定位方法 |
CN111488843A (zh) * | 2020-04-16 | 2020-08-04 | 贵州安防工程技术研究中心有限公司 | 基于漏报与误报率分步骤抑制的人脸墨镜判别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040040826A (ko) * | 2002-11-08 | 2004-05-13 | 한국전자통신연구원 | Svm을 이용한 얼굴 영역 검출 방법 |
CN1731418A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中鲁棒的眼睛精确定位方法 |
CN101196985A (zh) * | 2006-12-18 | 2008-06-11 | 北京海鑫科金高科技股份有限公司 | 一种用于复杂背景图像的眼睛定位装置与方法 |
CN102163289A (zh) * | 2011-04-06 | 2011-08-24 | 北京中星微电子有限公司 | 人脸图像中眼镜的去除方法和装置、佩戴方法和装置 |
TW201140511A (en) * | 2010-05-11 | 2011-11-16 | Chunghwa Telecom Co Ltd | Drowsiness detection method |
CN102314598A (zh) * | 2011-09-22 | 2012-01-11 | 西安电子科技大学 | 基于Retinex理论的复杂光照下的人眼检测方法 |
CN103632136A (zh) * | 2013-11-11 | 2014-03-12 | 北京天诚盛业科技有限公司 | 人眼定位方法和装置 |
CN103927509A (zh) * | 2013-01-16 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 眼睛定位方法及装置 |
-
2015
- 2015-11-08 CN CN201510767147.8A patent/CN106326828B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040040826A (ko) * | 2002-11-08 | 2004-05-13 | 한국전자통신연구원 | Svm을 이용한 얼굴 영역 검출 방법 |
CN1731418A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中鲁棒的眼睛精确定位方法 |
CN101196985A (zh) * | 2006-12-18 | 2008-06-11 | 北京海鑫科金高科技股份有限公司 | 一种用于复杂背景图像的眼睛定位装置与方法 |
TW201140511A (en) * | 2010-05-11 | 2011-11-16 | Chunghwa Telecom Co Ltd | Drowsiness detection method |
CN102163289A (zh) * | 2011-04-06 | 2011-08-24 | 北京中星微电子有限公司 | 人脸图像中眼镜的去除方法和装置、佩戴方法和装置 |
CN102314598A (zh) * | 2011-09-22 | 2012-01-11 | 西安电子科技大学 | 基于Retinex理论的复杂光照下的人眼检测方法 |
CN103927509A (zh) * | 2013-01-16 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 眼睛定位方法及装置 |
CN103632136A (zh) * | 2013-11-11 | 2014-03-12 | 北京天诚盛业科技有限公司 | 人眼定位方法和装置 |
Non-Patent Citations (3)
Title |
---|
A Threshold Selection Method from Gray-Level Histograms;Nobuyuki Otsu;《IEEE Transactions on Systems, Man, and Cybernetics 》;19790131;第9卷(第1期);第62-66页 |
Eye Detection Using Gabor Filter and SVM;Vijayalaxmi等;《IEEE Xplore》;20130124;第880-883页 |
基于 Gabor 小波的眼睛和嘴巴检测算法;王湘平等;《计算机工程》;20051130;第31卷(第22期);第169-171页 |
Also Published As
Publication number | Publication date |
---|---|
CN106326828A (zh) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326828B (zh) | 人脸识别中的眼睛定位方法 | |
US9881204B2 (en) | Method for determining authenticity of a three-dimensional object | |
US8098901B2 (en) | Standoff iris recognition system | |
CN103093215B (zh) | 人眼定位方法及装置 | |
EP2737434B1 (en) | Gait recognition methods and systems | |
US8682073B2 (en) | Method of pupil segmentation | |
US11908117B2 (en) | Image processing method and apparatus for object detection | |
KR20180109665A (ko) | 객체 검출을 위한 영상 처리 방법 및 장치 | |
US20030059124A1 (en) | Real-time facial recognition and verification system | |
CN105956578A (zh) | 一种基于身份证件信息的人脸验证方法 | |
Kawulok et al. | Precise multi-level face detector for advanced analysis of facial images | |
KR20080033486A (ko) | 서포트 벡터 머신 및 얼굴 인식에 기초한 자동 생체 식별 | |
Raffei et al. | Feature extraction for different distances of visible reflection iris using multiscale sparse representation of local Radon transform | |
KR101373274B1 (ko) | 안경 제거를 통한 얼굴 인식 방법 및 상기 안경 제거를 통한 얼굴 인식 방법을 이용한 얼굴 인식 장치 | |
Salve et al. | Iris recognition using SVM and ANN | |
US20140140584A1 (en) | Method and apparatus for generating personal information of client, recording medium thereof, and pos systems | |
Heusch et al. | Pulse-based features for face presentation attack detection | |
Bhanu et al. | Face recognition from face profile using dynamic time warping | |
Khan et al. | Iris recognition using machine learning from smartphone captured images in visible light | |
US8457363B2 (en) | Apparatus and method for detecting eyes | |
Kim et al. | Multi-scale gabor feature based eye localization | |
WO2016192213A1 (zh) | 一种图像特征提取方法和装置、存储介质 | |
Nanayakkara et al. | A review of literature on iris recognition | |
Kaudki et al. | A robust iris recognition approach using fuzzy edge processing technique | |
Ng et al. | An effective segmentation method for iris recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |