CN114897024A - 一种基于深度学习的注意力检测方法 - Google Patents
一种基于深度学习的注意力检测方法 Download PDFInfo
- Publication number
- CN114897024A CN114897024A CN202210560123.5A CN202210560123A CN114897024A CN 114897024 A CN114897024 A CN 114897024A CN 202210560123 A CN202210560123 A CN 202210560123A CN 114897024 A CN114897024 A CN 114897024A
- Authority
- CN
- China
- Prior art keywords
- attention
- deep learning
- method based
- detection method
- yaw
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
一种基于深度学习的注意力检测方法,包括以下步骤:优化参数a和r;人脸图像I(t)输入深度神经网络,输出视线方向{pitch(t),yaw(t)};计算注意力A(t)=|pitch(t)a+yaw(t)a|r;经对A(t)滤波和平滑得到注意力信号L(t)。
Description
技术领域
本发明属于深度学习领域,具体是一种利用深度学习网络得到的视线方向来获取注意力信号。
背景技术
注意是人类的一种心理活动,是对一定对象的指向和集中;注意力就是将心理活动指向和集中于一定对象的能力。注意力是调控信息进入意识中心的门户,对注意力的精密感知和有效控制,是个体提高学习和工作效率﹑缓解压力﹑改善情绪和发现异常的有效方法。
当前,注意力检测的方法包括问卷法、基于脑电信号的方法和基于虚拟现实的方法,这些方法要么不能定量,要么硬件要求较高,要么硬件要求复杂,还没有一种不受头部姿态影响的,非侵入的,客观的,实时的检查方法。
发明内容
本发明的目的是提供一种不受头部姿态影响的,非侵入的,客观的,实时的检查方法。
为达到上述目的,本发明所述的一种基于深度学习的注意力检测方法,包括以下步骤:
步骤一,优化参数a和r;
步骤二,人脸图像I(t)输入深度神经网络,输出视线方向{pitch(t),yaw(t)};
步骤三,按照以下公式计算注意力:
A(t)=|pitch(t)a+yaw(t)a|r;
步骤四,经对A(t)滤波得到B(t),经对B(t)平滑得到注意力信号L(t)。
本发明的步骤一中,优化参数a和r,具体采用以下步骤:
步骤一,采集人脸图像I(t),初始化参数k=1,a0=0,r0=0,△a=0.1,△r=0.02;
步骤二,人脸图像I(t)输入深度神经网络,得到视线方向{pitch(t),yaw(t)};
步骤三,采用下式计算a、r参数:
ak=ak-1+Δa,rk=rk-1+Δr;
步骤四,采用下式计算注意力:
步骤五,采用下式计算信噪比:
SNR=10log10[(∑A0(t)2)/|∑A(t)2-∑A(t)2|],
其中,参考信号为:
A0(t)=0.5sin(0.5πt)+0.5;
步骤六,判断SNR是否大于15dB,如果是,输出优化的参数a、b,否则,k=k+1,并进入步骤三。
本发明的步骤三中,计算注意力的公式为:
A(t)=|pitch(t)a+yaw(t)a|r
其中,a和r受成像系统的焦距、工作距离、像差和球差等因素的影响,优化后可提高测量精度。
本发明的步骤四中,经对A(t)滤波和平滑得到注意力信号L(t),具体采用以下步骤:
步骤一,对A(t)采用卡尔曼滤波得到B(t);
步骤二,对B(t)经Savitzky-Golay滤波器平滑得到注意力信号L(t)。
附图说明
图1为本专利的流程图;
图2为优化参数a和r的流程图;
图3为注意力检测的装置图;
图4为深度学习网络的结构图;
图5为注意力原始信号A(t);
图6为A(t)经卡尔曼滤波后的信号B(t);
图7为B(t)经平滑后的信号。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细说明。
一种基于深度学习的注意力检测具体实施如图3所示,包括电脑PC和摄像头。PC机硬件环境为Intel(R)Core(TM)i9-9900K、NVIDIA GTX1080Ti、DDR4 16GB和500GB硬盘;软件环境Ubuntu16.04操作系统、Python3.7.4和Pytorch1.4.0深度学习框架。摄像头的帧率为20fps,分辨率为1280*720。
摄像头置于电脑显示器上边缘,参与者在距离屏幕大约60cm处,在自然的坐姿下注视屏幕。
基于深度学习的注意力检测流程如图1所示,包括以下步骤:
步骤一,按照如图2的流程优化参数a和r:初始时刻,注视点在屏幕正中,在水平方向匀速移动,先右后左地,保证一个周期4秒;优化参数的典型值为a=2,b=0.8;
步骤二,人脸图像I(t)输入至如图4所示的DenseNet-88深度学习网络,得到视线方向{pitch(t),yaw(t)};
步骤三,按照以下公式计算注意力:
A(t)=|pitch(t)a+yaw(t)a|r
得到的信号如图5所示的注意力原始信号,该信号不可避免地包含了噪声和畸变;
步骤四,经对A(t)信号进行卡尔曼滤波得到B(t)如图6所示;
步骤五,经对B(t)进行Savitzky-Golay平滑得到注意力信号L(t)如图7所示。
Claims (4)
1.一种基于深度学习的注意力检测方法,其特征在于,包括以下步骤:
步骤一,优化参数a和r;
步骤二,人脸图像I(t)输入深度神经网络,该网络输出视线方向{pitch(t),yaw(t)};
步骤三,按照以下公式计算注意力:
A(t)=|pitch(t)a+yaw(t)a|r;
步骤四,经对A(t)滤波得到B(t),经对B(t)平滑得到注意力信号L(t)。
2.根据权利要求1所述的一种基于深度学习的注意力检测方法,其特征在于,步骤一中优化参数a和r,具体采用以下步骤:
步骤一,采集人脸图像I(t),初始化参数k=1,a0=0,r0=0,△a=0.1,△r=0.02;
步骤二,人脸图像I(t)输入深度神经网络,得到视线方向{pitch(t),yaw(t)};
步骤三,采用下式计算a、r参数:
ak=ak-1+Δa,rk=rk-1+Δr;
步骤四,采用下式计算注意力:
步骤五,采用下式计算信噪比:
SNR=10log10[(∑A0(t)2)/∑A(t)2-∑A(t)2|],
其中,参考信号为:
A0(t)=0.5sin(0.5πt)+0.5;
步骤六,判断SNR是否大于15dB,如果是,输出优化的参数a、b,否则,
k=k+1,并进入步骤三。
3.根据权利要求1所述的一种基于深度学习的注意力检测方法,其特征在于,步骤三中计算注意力的公式为:
A(t)=|pitch(t)a+yaw(t)a|r
其中,a和r受成像系统的焦距、工作距离、像差和球差等因素的影响,优化后可提高测量精度。
4.根据权利要求1所述的一种基于深度学习的注意力检测方法,其特征在于,步骤四中经对A(t)滤波和平滑得到注意力信号L(t),具体采用以下步骤:
步骤一,对A(t)采用卡尔曼滤波得到B(t);
步骤二,对B(t)经Savitzky-Golay滤波器平滑得到注意力信号L(t)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210560123.5A CN114897024B (zh) | 2022-05-23 | 2022-05-23 | 一种基于深度学习的注意力检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210560123.5A CN114897024B (zh) | 2022-05-23 | 2022-05-23 | 一种基于深度学习的注意力检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114897024A true CN114897024A (zh) | 2022-08-12 |
CN114897024B CN114897024B (zh) | 2025-07-18 |
Family
ID=82724948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210560123.5A Active CN114897024B (zh) | 2022-05-23 | 2022-05-23 | 一种基于深度学习的注意力检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114897024B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3225154A2 (en) * | 2016-03-31 | 2017-10-04 | Fujitsu Limited | Gaze detection apparatus and gaze detection method |
CN107944415A (zh) * | 2017-12-06 | 2018-04-20 | 董伟 | 一种基于深度学习算法的人眼注意力检测方法 |
CN108108684A (zh) * | 2017-12-15 | 2018-06-01 | 杭州电子科技大学 | 一种融合视线检测的注意力检测方法 |
CN109446892A (zh) * | 2018-09-14 | 2019-03-08 | 杭州宇泛智能科技有限公司 | 基于深度神经网络的人眼注意力定位方法及系统 |
US20200214614A1 (en) * | 2019-01-07 | 2020-07-09 | Stmicroelectronics S.R.L. | Image processing method and corresponding system |
WO2020186883A1 (zh) * | 2019-03-18 | 2020-09-24 | 北京市商汤科技开发有限公司 | 注视区域检测及神经网络训练的方法、装置和设备 |
CN112800815A (zh) * | 2019-11-13 | 2021-05-14 | 北京卡尔斯通科技有限公司 | 一种基于深度学习的视线方向估计方法 |
CN113468956A (zh) * | 2021-05-24 | 2021-10-01 | 北京迈格威科技有限公司 | 注意力判定方法、模型训练方法及对应装置 |
KR102309111B1 (ko) * | 2020-11-27 | 2021-10-06 | 가천대학교 산학협력단 | 딥러닝 기반 비정상 행동을 탐지하여 인식하는 비정상 행동 탐지 시스템 및 탐지 방법 |
CN113869229A (zh) * | 2021-09-29 | 2021-12-31 | 电子科技大学 | 基于先验注意力机制引导的深度学习表情识别方法 |
US11222217B1 (en) * | 2020-08-14 | 2022-01-11 | Tsinghua University | Detection method using fusion network based on attention mechanism, and terminal device |
CN114387679A (zh) * | 2022-01-14 | 2022-04-22 | 上海大学 | 基于递归卷积神经网络实现视线估计与注意力分析的系统及其方法 |
KR20220050617A (ko) * | 2020-10-16 | 2022-04-25 | 연세대학교 산학협력단 | 약한 지도학습 기반 객체 위치 검출 방법 및 장치 |
-
2022
- 2022-05-23 CN CN202210560123.5A patent/CN114897024B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3225154A2 (en) * | 2016-03-31 | 2017-10-04 | Fujitsu Limited | Gaze detection apparatus and gaze detection method |
CN107944415A (zh) * | 2017-12-06 | 2018-04-20 | 董伟 | 一种基于深度学习算法的人眼注意力检测方法 |
CN108108684A (zh) * | 2017-12-15 | 2018-06-01 | 杭州电子科技大学 | 一种融合视线检测的注意力检测方法 |
CN109446892A (zh) * | 2018-09-14 | 2019-03-08 | 杭州宇泛智能科技有限公司 | 基于深度神经网络的人眼注意力定位方法及系统 |
US20200214614A1 (en) * | 2019-01-07 | 2020-07-09 | Stmicroelectronics S.R.L. | Image processing method and corresponding system |
WO2020186883A1 (zh) * | 2019-03-18 | 2020-09-24 | 北京市商汤科技开发有限公司 | 注视区域检测及神经网络训练的方法、装置和设备 |
CN112800815A (zh) * | 2019-11-13 | 2021-05-14 | 北京卡尔斯通科技有限公司 | 一种基于深度学习的视线方向估计方法 |
US11222217B1 (en) * | 2020-08-14 | 2022-01-11 | Tsinghua University | Detection method using fusion network based on attention mechanism, and terminal device |
KR20220050617A (ko) * | 2020-10-16 | 2022-04-25 | 연세대학교 산학협력단 | 약한 지도학습 기반 객체 위치 검출 방법 및 장치 |
KR102309111B1 (ko) * | 2020-11-27 | 2021-10-06 | 가천대학교 산학협력단 | 딥러닝 기반 비정상 행동을 탐지하여 인식하는 비정상 행동 탐지 시스템 및 탐지 방법 |
CN113468956A (zh) * | 2021-05-24 | 2021-10-01 | 北京迈格威科技有限公司 | 注意力判定方法、模型训练方法及对应装置 |
CN113869229A (zh) * | 2021-09-29 | 2021-12-31 | 电子科技大学 | 基于先验注意力机制引导的深度学习表情识别方法 |
CN114387679A (zh) * | 2022-01-14 | 2022-04-22 | 上海大学 | 基于递归卷积神经网络实现视线估计与注意力分析的系统及其方法 |
Non-Patent Citations (3)
Title |
---|
LINA WANG ET AL.,: "CNN Model Based on Attention Mechanism and Its Application in Time Series Data", 《2022 11TH INTERNATIONAL CONFERENCE OF INFORMATION AND COMMUNICATION TECHNOLOGY (ICTECH)》, 6 February 2022 (2022-02-06), pages 264 - 267, XP034171468, DOI: 10.1109/ICTech55460.2022.00060 * |
夏禹: "基于树莓派和头部姿态估计的注意力监测系统研究与实现", 《中国优秀硕士学位论文全文数据库(电子期刊) 社会科学II辑》, no. 9, 15 September 2021 (2021-09-15), pages 127 - 114 * |
聂瀚文: "融合头部姿态与视线估计的学习注意力检测方法研究与应用", 《中国优秀硕士学位论文全文数据库(电子期刊) 信息科技》, no. 1, 15 January 2021 (2021-01-15), pages 138 - 1597 * |
Also Published As
Publication number | Publication date |
---|---|
CN114897024B (zh) | 2025-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019237942A1 (zh) | 一种基于结构光的视线追踪方法、装置、设备及存储介质 | |
CN111443804B (zh) | 基于视频分析的注视点轨迹描述方法及其系统 | |
CN107713981A (zh) | 一种ai眼科健康检测设备及其检测方法 | |
Rosas-Cholula et al. | Gyroscope-driven mouse pointer with an EMOTIV® EEG headset and data analysis based on empirical mode decomposition | |
CN113693573B (zh) | 一种基于视频的非接触式多生理参数监测的系统及方法 | |
Das et al. | Non-contact heart rate measurement from facial video data using a 2D-VMD scheme | |
CN117012344B (zh) | 一种4cmos相机采集的图像分析方法 | |
CN109009052A (zh) | 基于视觉的嵌入式心率测量系统及其测量方法 | |
Krecichwost et al. | 4D multimodal speaker model for remote speech diagnosis | |
Rivera-Flor et al. | Compressive sensing applied to SSVEP-based brain–computer interface in the cloud for online control of a virtual wheelchair | |
CN114897024A (zh) | 一种基于深度学习的注意力检测方法 | |
Karayiannis et al. | Quantifying motion in video recordings of neonatal seizures by regularized optical flow methods | |
Samsudin et al. | Initial assessment of facial nerve paralysis based on motion analysis using an optical flow method | |
Chhimpa et al. | Empowering individuals with disabilities: a real-time, cost-effective, calibration-free assistive system utilizing eye tracking | |
CN118248278A (zh) | 一种基于物联网的残疾人保健辅助管理系统 | |
CN112382390A (zh) | 生成健康评估报告的方法、系统及存储介质 | |
CN217408819U (zh) | 基于近红外光谱和动态视觉追踪的意识检测及评价系统 | |
Wolf et al. | Towards an altered body image through the exposure to a modulated self in virtual reality | |
Shellikeri et al. | Compensatory articulation in amyotrophic lateral sclerosis: Tongue and jaw in speech | |
TWI742696B (zh) | 多參數生理訊號量測方法 | |
TWI741708B (zh) | 非接觸式呼吸檢測方法及其系統 | |
Jafari et al. | 3D video tracking Technology in the Assessment of orofacial impairments in neurological disease: clinical validation | |
CN113317766A (zh) | 一种基于a311d的嵌入式非接触式生理参数监测系统 | |
CN116269285B (zh) | 一种非接触式常态化心率变异性估计系统 | |
CN113011286A (zh) | 基于视频的深度神经网络回归模型的斜视判别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |