CN110555426A - 视线检测方法、装置、设备及存储介质 - Google Patents
视线检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110555426A CN110555426A CN201910860197.9A CN201910860197A CN110555426A CN 110555426 A CN110555426 A CN 110555426A CN 201910860197 A CN201910860197 A CN 201910860197A CN 110555426 A CN110555426 A CN 110555426A
- Authority
- CN
- China
- Prior art keywords
- image
- key point
- point information
- eye
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 194
- 210000001508 eye Anatomy 0.000 claims abstract description 125
- 210000005252 bulbus oculi Anatomy 0.000 claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 29
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 230000001815 facial effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 210000001747 pupil Anatomy 0.000 claims description 11
- 210000004279 orbit Anatomy 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 7
- 230000004438 eyesight Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010033799 Paralysis Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种视线检测方法、装置、设备及存储介质。该方法包括:基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。通过上述方案,只需要通过普通图像采集设备就可以实现视线检测,降低了对硬件性能的要求,再基于具有较高稳定性和鲁棒性的各模型精准得到检测结果,解决了人工特征计算造成的计算量不稳定及缺乏泛化能力的问题,从而提高了视线检测的准确性和稳定性。
Description
技术领域
本发明实施例涉及视线检测技术领域,尤其涉及一种视线检测方法、装置、设备及存储介质。
背景技术
人眼视线检测指利用眼球追踪设备对人眼眼球及瞳孔运动进行测量,并给出人眼注视方向的估计结果。这种技术经过几十年的发展正被广泛应用于人机交互领域,如辅助瘫痪病人或残疾人阅读,辅助遥控电视选台及切换频道,老师教学时辅助观察学生的注意力是否集中等。
但是,目前的视觉检测方案需要额外设备及传感器的辅助对人眼的运动进行跟踪和记录,并且对设备的放置位置及人员适配有较高要求,具有一定的使用限制,并且对硬件性能要求均较高无法在低成本移动设备端实施应用,场景受限。另外,在人眼视线检测过程中,3D建模及手工特征的引入造成计算量不稳定、准确性差及缺乏泛化能力,无法稳定地完成各种场景下的人眼视线估计操作。
发明内容
本发明实施例提供一种视线检测方法、装置、设备及存储介质,以解决视线检测中检测准确性差、不稳定以及对硬件性能要求较高的问题。
第一方面,本发明实施例提供了一种视线检测方法,该方法包括:
基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
第二方面,本发明实施例提供了一种视线检测装置,该装置包括:
面部关键点检测模块,用于基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
眼部子图像确定模块,用于根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
眼球关键点信息检测模块,用于基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
视线检测模块,用于基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的视线检测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的视线检测方法。
本发明实施例通过基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。通过上述方案,只需要通过普通图像采集设备就可以实现视线检测,降低了对硬件性能的要求,再基于具有较高稳定性和鲁棒性的各模型精准得到检测结果,解决了人工特征计算造成的计算量不稳定及缺乏泛化能力的问题,从而提高了视线检测的准确性和稳定性。
附图说明
图1是本发明实施例一中的一种视线检测方法的流程图;
图2是本发明实施例一中的面部关键点信息示意图;
图3是本发明实施例二中的一种视线检测方法的流程图;
图4是本发明实施例二中的人眼眼球示意图;
图5是本发明实施例三中的一种视线检测装置结构示意图;
图6是本发明实施例四中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中的一种视线检测方法的流程图。本实施例提供的视线检测方法可适用于对人眼的视线进行检测的情况,该方法具体可以由视线检测装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在设备中,所述设备装载有图像采集装置,用于采集用户的面部图像,参见图1,本发明实施例的方法具体包括:
S110、基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息。
其中,所述面部检测模型为预先进行训练得到的模型,用于对用户面部图像进行检测。所述面部关键点为在用户面部图像中的面部各个关键点的位置点坐标。例如,选取用户面部单侧眉部的五个点作为关键点,可以得到用户面部图像单侧眉部的五个关键点的位置点坐标,可选的,位置点坐标可以用标号来表示,如图2所示,以标号的形式表示用户面部图像中面部各关键点的位置点坐标。
具体的,在对人眼视线进行检测时,若通过算法提取用户面部图像中的人工特征进行计算,再通过几何映射的到实现的方向,会导致人工特征的引入导致计算量不稳定以及缺乏泛化能力,视线检测的准确性和稳定性差,无法鲁棒以及稳定地完成各种场景下对人眼视线的检测。因此,在本发明实施例中,基于预先训练得到的面部检测模型,对图像采集器采集得到的用户面部图像进行检测,从而得到面部关键点信息,以根据面部关键点信息进一步获取眼部子图像。通过预先训练面部检测模型,并基于面部检测模型得到面部关键点信息,从而避免了因人工特征引入造成的计算量不稳定及缺乏泛化能力的问题,提高了检测的准确性和稳定性。
S120、根据所述面部关键点信息确定所述用户面部图像中的眼部子图像。
其中,所述眼部子图像为包括用户的眼睛以及眼睛周围部分面部的图像。面部关键点信息中包括各个器官对应部位的关键点信息,根据其中的眼部关键点信息可以确定用户面部图像中的眼部子图像,从而进一步根据眼部子图像进行视线检测。通过从用户面部图像中获取眼部子图像,从而使视线检测更具针对性,从而提高视线检测的准确性。
S130、基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息。
其中,所述眼球检测模型为预先训练得到的模型,用于对眼部子图像进行检测。所述眼球关键点信息包括瞳孔位置点坐标和虹膜关键点位置点坐标。
具体的,对人眼视线检测需要根据人眼的瞳孔和虹膜的位置进行检测和追踪,以便根据瞳孔和虹膜的位置确定用户的实现方向。因此,在本发明实施例中,通过预先训练得到的眼球检测模型对眼部子图像进行检测,从而得到眼球关键点信息,即人眼的瞳孔位置点坐标和虹膜关键点位置坐标,以便进一步进行视线确定。通过眼球检测模型获取眼球关键点信息,避免了因常规算法检测导致的计算误差较大、眼球关键点信息不准确的问题,进一步提高了视线检测的准确性。
S140、基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
其中,所述实现检测模型为预先通过训练得到的模型,用于对所述眼球关键点信息进行检测。所述视线检测结果包括人眼视线的方向信息,可以通过姿态角坐标对人眼视线的方向信息进行表示。
具体的,将眼球关键点信息中的瞳孔位置点坐标和虹膜关键点位置坐标输入至视线检测模型中,从而得到人眼视线的方向信息,从而实现对人眼视线的检测和追踪。通过视线检测模型得到视线检测结果,从而避免了直接通过公式计算造成的误差,从而提高了视线检测的准确性。
本发明实施例的技术方案,通过基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。通过上述方案,只需要通过普通图像采集设备就可以实现视线检测,降低了对硬件性能的要求,再基于具有较高稳定性和鲁棒性的各模型精准得到检测结果,解决了人工特征计算造成的计算量不稳定及缺乏泛化能力的问题,从而提高了视线检测的准确性和稳定性。
实施例二
图3是本发明实施例二中的一种视线检测方法的流程图。本实施例在上述实施例的基础上进行了优化,未在本实施例中详细描述的细节详见上述实施例。参见图3,本实施例提供的视线检测方法可以包括:
S210、基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息。
可选的,所述面部检测模型通过如下方式构建:获取样本用户面部图像集合,对样本用户面部图像标注面部关键点信息,得到标注用户面部图像集合;将标注用户面部图像集合作为训练数据集,对卷积神经网络模型进行训练,得到所述面部检测模型。示例性的,预先通过图像采集装置采集得到大量样本用户面部图像,组成样本用户面部图像集合,对样本用户面部图像标注标号,构成样本用户面部图像的关键点信息。再将标注用户面部图像集合作为训练数据对卷积神经网络模型进行训练得到面部检测模型。
S220、根据所述面部关键点信息对所述用户面部图像进行分割,得到面部区域子图像。
具体的,面部关键点信息包括各个器官部位的关键点信息,根据各个器官部位的关键点信息能够将用户面部图像分割成包括各个器官区域的子图像。根据面部关键点信息中的各个器官部位的关键点信息对获取的用户面部图像进行分割,分别得到面部各器官区域的面部区域子图像。通过对用户面部图像进行分割得到面部区域子图像,从而使视线检测更具针对性,便于准确地对人眼视线进行检测。
S230、根据面部关键点信息中的眼部关键点信息,确定所述面部区域子图像中的眼部子图像。
具体的,面部关键点信息中包括眼部关键点信息,眼部关键点信息包括眼眶关键点位置坐标和眼球位置点坐标,将包含眼眶关键点位置坐标和眼球位置点坐标的区域图像作为眼部子图像,从而便于进一步对眼部子图像进行检测。
S240、对所述眼部子图像进行灰度化处理,得到眼部灰度子图像。
具体的,获取的用户面部图像可能为彩色图像,因此得到的眼部子图像可能为彩色图像,而彩色图像增加了视线检测的复杂度,并且较多的色彩会影响检测的稳定性,因此,在本发明实施例中,对眼部子图像进行灰度化处理,得到眼部灰度子图像,从而降低实现检测的复杂度,并且在此场景下,实现的检测只与瞳孔和虹膜的位置有关,不会受到色彩的影响,提高了是视线检测的稳定性。
S250、获取眼部灰度子图像中的任意一侧眼部区域图像,作为第一眼部灰度子图像。
具体的,对于眼部灰度子图像中的双眼眼部区域图像,选取其中任意一侧眼部区域图像,作为第一眼部灰度子图像。
S260、对所述第一眼部灰度子图像进行图像水平镜像翻转处理,得到第二眼部灰度子图像。
具体的,将第一眼部灰度子图像进行图像水平镜像翻转处理,得到第二眼部灰度子图像,从而得到初方向外其他特征一致的两幅图像,从而在实现检测中只需要进行一次检测,并且在模型训练过程中只需要对一侧眼部的子图像进行训练,而不需要对两侧眼部的子图像进行检测,从而提高了视线检测的效率。
S270、分别将所述第一眼部灰度子图像和所述第二眼部灰度子图像输入至所述眼球检测模型,得到所述眼球检测模型输出的眼球关键点信息。
具体的,将两幅图像输入至眼球检测模型,从而得到眼球关键点信息,便于进一步根据眼球关键点信息中的瞳孔位置点信息和虹膜关键点位置信息得到实现的方向。
可选的,所述眼球检测模型通过如下方式构建:获取模拟三维眼部模型的模拟眼部子图像和模拟眼球关键点信息;将所述模拟眼部子图像和所述模拟眼球关键点信息作为训练数据集,对卷积神经网络进行训练,得到所述眼球检测模型。示例性的,预先通过三维建模软件生成模拟三维眼部模型,在获取模拟三维眼部模型的模拟眼部子图像和模拟眼球关键点信息,将其作为训练数据训练卷积神经网络得到眼球检测模型。
S280、基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
可选的,所述视线检测模型根据如下方式构建:获取模拟三维眼部模型的模拟眼球关键点信息和模拟视线方向数据;将所述模拟眼球关键点信息和模拟视线方向数据作为训练数据集,对卷积神经网络进行训练,得到视线检测模型,其中,所述视线检测模型的隐含层层数小于面部关键点信息检测模型或眼球关键点信息检测模型的隐含层层数。示例性的,如图4所示,得到模拟眼球关键点信息,即瞳孔或虹膜中心点a的位置坐标为(x0,y0),眼球中心点b的坐标为(xc,yc),根据公式其中,r为眼球中心与虹膜边缘点的距离,从而得到视线的方向坐标表示将模拟眼球关键点信息和模拟视线方向数据作为训练数据对卷积神经网络得到视线检测模型。本发明实施例中,由于在视线检测时的复杂度较低,因此设置所述视线检测模型的隐含层层数小于面部关键点信息检测模型或眼球关键点信息检测模型的隐含层层数,例如可以设置视线检测模型的隐含层层数小于10层,从而提高检测效率和检测速度。
本发明实施例的技术方案,通过对用户面部图像进行分割得到面部区域子图像,从而使视线检测更具针对性,便于准确地对人眼视线进行检测。对眼部子图像进行灰度化处理,得到眼部灰度子图像,从而降低实现检测的复杂度,并且在此场景下,实现的检测只与瞳孔和虹膜的位置有关,不会受到色彩的影响,提高了是视线检测的稳定性。对所述第一眼部灰度子图像进行图像水平镜像翻转处理,得到第二眼部灰度子图像,根据两幅图像得到眼球关键点信息,从而提高了视线检测的效率。
实施例三
图5是本发明实施例三中的一种视线检测装置结构示意图。该装置适用于对人眼的视线进行检测的情况,该装置可以由软件和/或硬件的方式实现,该装置可以集成在设备中,所述设备装载有图像采集装置,用于采集用户的面部图像。参见图5,该装置具体包括:
面部关键点检测模块310,用于基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
眼部子图像确定模块320,用于根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
眼球关键点信息检测模块330,用于基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
视线检测模块340,用于基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
可选的,所述眼部子图像确定模块320,包括:
面部区域子图像确定单元,用于根据所述面部关键点信息对所述用户面部图像进行分割,得到面部区域子图像。
眼部子图像获取单元,用于根据面部关键点信息中的眼部关键点信息,确定所述面部区域子图像中的眼部子图像。
可选的,还包括:
眼部灰度子图像确定模块,用于对所述眼部子图像进行灰度化处理,得到眼部灰度子图像;
第一获取模块,用于获取眼部灰度子图像中的任意一侧眼部区域图像,作为第一眼部灰度子图像;
第二获取模块,用于对所述第一眼部灰度子图像进行图像水平镜像翻转处理,得到第二眼部灰度子图像;
相应的,所述眼球关键点信息检测模块330,具体用于:
分别将所述第一眼部灰度子图像和所述第二眼部灰度子图像输入至所述眼球检测模型,得到所述眼球检测模型输出的眼球关键点信息。
可选的,所述面部检测模型通过如下方式构建:
获取样本用户面部图像集合,对样本用户面部图像标注面部关键点信息,得到标注用户面部图像集合;
将标注用户面部图像集合作为训练数据集,对卷积神经网络模型进行训练,得到所述面部检测模型。
可选的,所述眼球检测模型通过如下方式构建:
获取模拟三维眼部模型的模拟眼部子图像和模拟眼球关键点信息;
将所述模拟眼部子图像和所述模拟眼球关键点信息作为训练数据集,对卷积神经网络进行训练,得到所述眼球检测模型。
可选的,所述视线检测模型根据如下方式构建:
获取模拟三维眼部模型的模拟眼球关键点信息和模拟视线方向数据;
将所述模拟眼球关键点信息和模拟视线方向数据作为训练数据集,对卷积神经网络进行训练,得到视线检测模型,其中,所述视线检测模型的隐含层层数小于面部关键点信息检测模型或眼球关键点信息检测模型的隐含层层数。
可选的,所述眼部关键点信息包括:眼眶关键点位置坐标和眼球位置点坐标;
所述眼球关键点信息包括:瞳孔位置点坐标和虹膜关键点位置点坐标。
本发明实施例的技术方案,面部关键点检测模块基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;眼部子图像确定模块根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;眼球关键点信息检测模块基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;视线检测模块基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。通过上述方案,只需要通过普通图像采集设备就可以实现视线检测,降低了对硬件性能的要求,再基于具有较高稳定性和鲁棒性的各模型精准得到检测结果,解决了人工特征计算造成的计算量不稳定及缺乏泛化能力的问题,从而提高了视线检测的准确性和稳定性。
实施例四
图6是本发明实施例四中的一种设备的结构示意图。图6示出了适于用来实现本发明实施例的示例性设备412的框图。图6显示的设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,设备412包括:一个或多个处理器416;存储器428,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器416执行,使得所述一个或多个处理器416实现本发明实施例所提供的视线检测方法,包括:
基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
以通用设备的形式表现。设备412的组件可以包括但不限于:一个或者多个处理器或者处理器416,系统存储器428,连接不同系统组件(包括系统存储器428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备412典型地包括多种计算机系统可读存储介质。这些存储介质可以是任何能够被设备412访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
系统存储器428可以包括易失性存储器形式的计算机系统可读存储介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁存储介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块462包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块462通常执行本发明所描述的实施例中的功能和/或方法。
设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器426等)通信,还可与一个或者多个使得用户能与该设备412交互的设备通信,和/或与使得该设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与设备412的其它模块通信。应当明白,尽管图6中未示出,可以结合设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在系统存储器428中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种视线检测方法,包括:
基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
实施例五
本发明实施例五还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视线检测方法:
基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种视线检测方法,其特征在于,所述方法包括:
基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
2.根据权利要求1所述的方法,其特征在于,根据所述面部关键点信息确定所述用户面部图像中的眼部子图像,包括:
根据所述面部关键点信息对所述用户面部图像进行分割,得到面部区域子图像;
根据面部关键点信息中的眼部关键点信息,确定所述面部区域子图像中的眼部子图像。
3.根据权利要求1所述的方法,其特征在于,所述根据所述面部关键点信息确定所述用户面部图像中的眼部子图像之后,还包括:
对所述眼部子图像进行灰度化处理,得到眼部灰度子图像;
获取眼部灰度子图像中的任意一侧眼部区域图像,作为第一眼部灰度子图像;
对所述第一眼部灰度子图像进行图像水平镜像翻转处理,得到第二眼部灰度子图像;
相应的,所述基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息,包括:
分别将所述第一眼部灰度子图像和所述第二眼部灰度子图像输入至所述眼球检测模型,得到所述眼球检测模型输出的眼球关键点信息。
4.根据权利要求1所述的方法,其特征在于,所述面部检测模型通过如下方式构建:
获取样本用户面部图像集合,对样本用户面部图像标注面部关键点信息,得到标注用户面部图像集合;
将标注用户面部图像集合作为训练数据集,对卷积神经网络模型进行训练,得到所述面部检测模型。
5.根据权利要求1所述的方法,其特征在于,所述眼球检测模型通过如下方式构建:
获取模拟三维眼部模型的模拟眼部子图像和模拟眼球关键点信息;
将所述模拟眼部子图像和所述模拟眼球关键点信息作为训练数据集,对卷积神经网络进行训练,得到所述眼球检测模型。
6.根据权利要求5所述的方法,其特征在于,所述视线检测模型根据如下方式构建:
获取模拟三维眼部模型的模拟眼球关键点信息和模拟视线方向数据;
将所述模拟眼球关键点信息和模拟视线方向数据作为训练数据集,对卷积神经网络进行训练,得到视线检测模型,其中,所述视线检测模型的隐含层层数小于面部关键点信息检测模型或眼球关键点信息检测模型的隐含层层数。
7.根据权利要求2-6任一所述的方法,其特征在于,
所述眼部关键点信息包括:眼眶关键点位置坐标和眼球位置点坐标;
所述眼球关键点信息包括:瞳孔位置点坐标和虹膜关键点位置点坐标。
8.一种视线检测装置,其特征在于,所述装置包括:
面部关键点检测模块,用于基于面部检测模型,对获取的用户面部图像进行检测,得到面部关键点信息;
眼部子图像确定模块,用于根据所述面部关键点信息确定所述用户面部图像中的眼部子图像;
眼球关键点信息检测模块,用于基于眼球检测模型,根据所述眼部子图像确定眼球关键点信息;
视线检测模块,用于基于视线检测模型,根据所述眼球关键点信息确定视线检测结果。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的一种视线检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的一种视线检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910860197.9A CN110555426A (zh) | 2019-09-11 | 2019-09-11 | 视线检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910860197.9A CN110555426A (zh) | 2019-09-11 | 2019-09-11 | 视线检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110555426A true CN110555426A (zh) | 2019-12-10 |
Family
ID=68739919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910860197.9A Pending CN110555426A (zh) | 2019-09-11 | 2019-09-11 | 视线检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555426A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110381368A (zh) * | 2019-07-11 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 视频封面生成方法、装置及电子设备 |
CN111353429A (zh) * | 2020-02-28 | 2020-06-30 | 深圳壹账通智能科技有限公司 | 基于眼球转向的感兴趣度方法与系统 |
CN111368717A (zh) * | 2020-03-02 | 2020-07-03 | 广州虎牙科技有限公司 | 视线确定方法、装置、电子设备和计算机可读存储介质 |
CN111476151A (zh) * | 2020-04-03 | 2020-07-31 | 广州市百果园信息技术有限公司 | 眼球检测方法、装置、设备及存储介质 |
CN111639702A (zh) * | 2020-05-29 | 2020-09-08 | 深圳壹账通智能科技有限公司 | 一种多媒体数据分析方法、设备、服务器及可读存储介质 |
CN111632367A (zh) * | 2020-05-18 | 2020-09-08 | 歌尔科技有限公司 | 基于视觉引导的手游系统及手游响应方法 |
CN113269148A (zh) * | 2021-06-24 | 2021-08-17 | 中国平安人寿保险股份有限公司 | 视线估计方法、装置、计算机设备及存储介质 |
CN113468956A (zh) * | 2021-05-24 | 2021-10-01 | 北京迈格威科技有限公司 | 注意力判定方法、模型训练方法及对应装置 |
CN115100728A (zh) * | 2022-05-27 | 2022-09-23 | 中国科学院半导体研究所 | 视力状态的检测方法、装置、存储介质和程序产品 |
CN115494934A (zh) * | 2021-06-17 | 2022-12-20 | 博泰车联网科技(上海)股份有限公司 | 基于眼球视线定位的方法、装置和存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102830793A (zh) * | 2011-06-16 | 2012-12-19 | 北京三星通信技术研究有限公司 | 视线跟踪方法和设备 |
CN105094337A (zh) * | 2015-08-19 | 2015-11-25 | 华南理工大学 | 一种基于虹膜和瞳孔的三维视线估计方法 |
CN108229301A (zh) * | 2017-11-03 | 2018-06-29 | 北京市商汤科技开发有限公司 | 眼睑线检测方法、装置和电子设备 |
CN108509890A (zh) * | 2018-03-27 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN108615014A (zh) * | 2018-04-27 | 2018-10-02 | 京东方科技集团股份有限公司 | 一种眼睛状态的检测方法、装置、设备和介质 |
CN108734078A (zh) * | 2017-12-14 | 2018-11-02 | 北京市商汤科技开发有限公司 | 图像处理方法、装置、电子设备、存储介质及程序 |
CN108875524A (zh) * | 2018-01-02 | 2018-11-23 | 北京旷视科技有限公司 | 视线估计方法、装置、系统和存储介质 |
CN108985172A (zh) * | 2018-06-15 | 2018-12-11 | 北京七鑫易维信息技术有限公司 | 一种基于结构光的视线追踪方法、装置、设备及存储介质 |
CN108985210A (zh) * | 2018-07-06 | 2018-12-11 | 常州大学 | 一种基于人眼几何特征的视线追踪方法及系统 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN109359512A (zh) * | 2018-08-28 | 2019-02-19 | 深圳壹账通智能科技有限公司 | 眼球位置追踪方法、装置、终端及计算机可读存储介质 |
CN109359575A (zh) * | 2018-09-30 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 人脸检测方法、业务处理方法、装置、终端及介质 |
CN109508679A (zh) * | 2018-11-19 | 2019-03-22 | 广东工业大学 | 实现眼球三维视线跟踪的方法、装置、设备及存储介质 |
CN109740491A (zh) * | 2018-12-27 | 2019-05-10 | 北京旷视科技有限公司 | 一种人眼视线识别方法、装置、系统及存储介质 |
CN109886107A (zh) * | 2019-01-15 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 眼部图像处理方法、设备、图像处理设备、介质 |
-
2019
- 2019-09-11 CN CN201910860197.9A patent/CN110555426A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102830793A (zh) * | 2011-06-16 | 2012-12-19 | 北京三星通信技术研究有限公司 | 视线跟踪方法和设备 |
CN105094337A (zh) * | 2015-08-19 | 2015-11-25 | 华南理工大学 | 一种基于虹膜和瞳孔的三维视线估计方法 |
CN108229301A (zh) * | 2017-11-03 | 2018-06-29 | 北京市商汤科技开发有限公司 | 眼睑线检测方法、装置和电子设备 |
CN108734078A (zh) * | 2017-12-14 | 2018-11-02 | 北京市商汤科技开发有限公司 | 图像处理方法、装置、电子设备、存储介质及程序 |
CN108875524A (zh) * | 2018-01-02 | 2018-11-23 | 北京旷视科技有限公司 | 视线估计方法、装置、系统和存储介质 |
CN108509890A (zh) * | 2018-03-27 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN108615014A (zh) * | 2018-04-27 | 2018-10-02 | 京东方科技集团股份有限公司 | 一种眼睛状态的检测方法、装置、设备和介质 |
CN108985172A (zh) * | 2018-06-15 | 2018-12-11 | 北京七鑫易维信息技术有限公司 | 一种基于结构光的视线追踪方法、装置、设备及存储介质 |
CN108985210A (zh) * | 2018-07-06 | 2018-12-11 | 常州大学 | 一种基于人眼几何特征的视线追踪方法及系统 |
CN109359512A (zh) * | 2018-08-28 | 2019-02-19 | 深圳壹账通智能科技有限公司 | 眼球位置追踪方法、装置、终端及计算机可读存储介质 |
CN109214343A (zh) * | 2018-09-14 | 2019-01-15 | 北京字节跳动网络技术有限公司 | 用于生成人脸关键点检测模型的方法和装置 |
CN109359575A (zh) * | 2018-09-30 | 2019-02-19 | 腾讯科技(深圳)有限公司 | 人脸检测方法、业务处理方法、装置、终端及介质 |
CN109508679A (zh) * | 2018-11-19 | 2019-03-22 | 广东工业大学 | 实现眼球三维视线跟踪的方法、装置、设备及存储介质 |
CN109740491A (zh) * | 2018-12-27 | 2019-05-10 | 北京旷视科技有限公司 | 一种人眼视线识别方法、装置、系统及存储介质 |
CN109886107A (zh) * | 2019-01-15 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 眼部图像处理方法、设备、图像处理设备、介质 |
Non-Patent Citations (2)
Title |
---|
左林翼: "基于深度选择性神经网络的视线检测", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
苏海明等: "使用人眼几何特征的视线追踪方法", 《中国图象图形学报》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110381368A (zh) * | 2019-07-11 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 视频封面生成方法、装置及电子设备 |
CN111353429A (zh) * | 2020-02-28 | 2020-06-30 | 深圳壹账通智能科技有限公司 | 基于眼球转向的感兴趣度方法与系统 |
WO2021169642A1 (zh) * | 2020-02-28 | 2021-09-02 | 深圳壹账通智能科技有限公司 | 基于视频的眼球转向确定方法与系统 |
CN111368717A (zh) * | 2020-03-02 | 2020-07-03 | 广州虎牙科技有限公司 | 视线确定方法、装置、电子设备和计算机可读存储介质 |
CN111476151A (zh) * | 2020-04-03 | 2020-07-31 | 广州市百果园信息技术有限公司 | 眼球检测方法、装置、设备及存储介质 |
CN111476151B (zh) * | 2020-04-03 | 2023-02-03 | 广州市百果园信息技术有限公司 | 眼球检测方法、装置、设备及存储介质 |
CN111632367A (zh) * | 2020-05-18 | 2020-09-08 | 歌尔科技有限公司 | 基于视觉引导的手游系统及手游响应方法 |
CN111639702A (zh) * | 2020-05-29 | 2020-09-08 | 深圳壹账通智能科技有限公司 | 一种多媒体数据分析方法、设备、服务器及可读存储介质 |
CN113468956A (zh) * | 2021-05-24 | 2021-10-01 | 北京迈格威科技有限公司 | 注意力判定方法、模型训练方法及对应装置 |
CN115494934A (zh) * | 2021-06-17 | 2022-12-20 | 博泰车联网科技(上海)股份有限公司 | 基于眼球视线定位的方法、装置和存储介质 |
CN113269148A (zh) * | 2021-06-24 | 2021-08-17 | 中国平安人寿保险股份有限公司 | 视线估计方法、装置、计算机设备及存储介质 |
CN115100728A (zh) * | 2022-05-27 | 2022-09-23 | 中国科学院半导体研究所 | 视力状态的检测方法、装置、存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555426A (zh) | 视线检测方法、装置、设备及存储介质 | |
US11403757B2 (en) | Sight line detection method and sight line detection device | |
EP3712805B1 (en) | Gesture recognition method, device, electronic device, and storage medium | |
Memo et al. | Head-mounted gesture controlled interface for human-computer interaction | |
WO2019237942A1 (zh) | 一种基于结构光的视线追踪方法、装置、设备及存储介质 | |
CN114120432B (zh) | 基于视线估计的在线学习注意力跟踪方法及其应用 | |
CN109712234B (zh) | 三维人体模型的生成方法、装置、设备和存储介质 | |
KR102334139B1 (ko) | 적응적 호모그래피 매핑에 기초한 눈 시선 추적 | |
CN111046734B (zh) | 基于膨胀卷积的多模态融合视线估计方法 | |
US12314467B1 (en) | On-the-fly calibration for improved on-device eye tracking | |
JP2022128414A (ja) | 深層学習に基づく気管挿管位置決め方法、装置及び記憶媒体 | |
CN110051319A (zh) | 眼球追踪传感器的调节方法、装置、设备及存储介质 | |
CN111368668B (zh) | 三维手部识别方法、装置、电子设备及存储介质 | |
CN110298569B (zh) | 基于眼动识别的学习评价方法及装置 | |
CN115994944B (zh) | 关键点预测模型的训练方法、三维关键点预测方法及相关设备 | |
CN112446322A (zh) | 眼球特征检测方法、装置、设备及计算机可读存储介质 | |
CN111589138A (zh) | 动作预测方法、装置、设备及存储介质 | |
Cao et al. | Gaze tracking on any surface with your phone | |
CN113139491A (zh) | 视频会议控制方法、系统、移动终端及存储介质 | |
WO2023249694A1 (en) | Object detection and tracking in extended reality devices | |
CN113342157B (zh) | 眼球追踪处理方法及相关装置 | |
CN109857244B (zh) | 一种手势识别方法、装置、终端设备、存储介质及vr眼镜 | |
CN116048374A (zh) | 虚拟隐形键盘的在线考试方法及系统 | |
CN109284002B (zh) | 一种用户距离估算方法、装置、设备及存储介质 | |
CN115410242A (zh) | 视线估计方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210817 Address after: Room 301-112, floor 3, building 2, No. 18, YANGFANGDIAN Road, Haidian District, Beijing 100089 Applicant after: Beijing Rubu Technology Co.,Ltd. Address before: Room 508-598, Xitian Gezhuang Town Government Office Building, No. 8 Xitong Road, Miyun District Economic Development Zone, Beijing 101500 Applicant before: BEIJING ROOBO TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191210 |