CN110807352B - 一种用于危险驾驶行为预警的车内外场景视觉分析方法 - Google Patents
一种用于危险驾驶行为预警的车内外场景视觉分析方法 Download PDFInfo
- Publication number
- CN110807352B CN110807352B CN201910808682.1A CN201910808682A CN110807352B CN 110807352 B CN110807352 B CN 110807352B CN 201910808682 A CN201910808682 A CN 201910808682A CN 110807352 B CN110807352 B CN 110807352B
- Authority
- CN
- China
- Prior art keywords
- loss function
- scene
- cab
- road
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 29
- 230000000007 visual effect Effects 0.000 title claims abstract description 20
- 230000006399 behavior Effects 0.000 claims abstract description 77
- 238000013528 artificial neural network Methods 0.000 claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 11
- 230000000306 recurrent effect Effects 0.000 claims abstract description 10
- 238000012805 post-processing Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 148
- 238000000034 method Methods 0.000 claims description 28
- 210000005252 bulbus oculi Anatomy 0.000 claims description 22
- 230000004913 activation Effects 0.000 claims description 10
- 210000001508 eye Anatomy 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 6
- 238000001994 activation Methods 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000001360 synchronised effect Effects 0.000 abstract description 3
- 108091006146 Channels Proteins 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001282135 Poromitra oscitans Species 0.000 description 1
- 208000032140 Sleepiness Diseases 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- 206010048232 Yawning Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000035080 detection of muscle activity involved in regulation of muscle adaptation Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000037321 sleepiness Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
- G06V20/597—Recognising the driver's state or behaviour, e.g. attention or drowsiness
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种用于危险驾驶行为预警的车内外场景视觉分析方法,包括如下步骤:S1、数据采集、同步以及预处理;S2、道路场景语义编码;S3、驾驶室场景语义编码;S4、时序危险驾驶行为分类;S5模型前向运算部署以及输出后处理。本技术方案输入为同步前视以及驾驶室场景图像,道路场景以及驾驶室场景经卷积神经网络特征编码后,级联送入基于递归神经网络的时序行为分类器,输出危险驾驶行为类别,用于后续相应预警算法,对于危险驾驶行为的的判定准确。
Description
技术领域
本发明涉及驾驶员行为辅助系统领域,具体的,涉及一种用于危险驾驶行为预警的车内外场景视觉分析方法。
背景技术
据道路交通事故数据统计,有超过半数的交通事故是由驾驶员的危险或错误车辆操作所导致的。然而,此类人为事故中大部分是由于驾驶疲劳或注意力分散造成的。因而主动安全系统以及驾驶员行为分析系统具有重要的应用价值。现有乘用车以及商用车的辅助驾驶系统或根据道路场景重要参数,如预碰撞时间(TTC)以及预压线时间(TLC)等,或根据驾驶室场景重要参数,如眼球开度以及面部朝向等,分别进行危险驾驶行为预警。
然而,此两类系统都有各自的优势与不足;其中,基于道路场景分析的系统无法准确反映驾驶员对车辆操作的专注以及疲劳程度,基于驾驶室场景分析的系统易受安装角度以及视场范围的影响,某些正常驾驶行为会误触发相应预警信号,并且对一些未训练危险行为,系统无法准确发出预警信号。因而,两者系统存在着潜在的互补关系,综合分析车内外场景能够有效提升危险驾驶行为的预警准确性及可靠性,目前,尚未有基于车内外场景视觉联合分析的方法应用于辅助驾驶(预警)系统。
目前尚未有量产车型所部署的辅助驾驶系统综合分析车内外场景后发出相应危险驾驶行为的预警信号(如车距过近、车道偏离、疲劳驾驶、注意力分散等)。现有辅助驾驶系统主要根据:i).车辆动力学参数以及操控信号;ii).视觉系统感知结果;iii).毫米波雷达系统感知结果进行相应驾驶行为预警。其中,所使用视觉系统按场景分析依据可分为两类:i).驾驶室视觉系统,主要通过驾驶员面部图像特征分析进行部分疲劳以及分神驾驶状态的识别,如瞌睡、哈欠等;ii).前视系统,主要通过道路场景图像特征分析进行特定车辆驾驶状态识别,如偏航、预碰撞等。
单独使用上述两种视觉系统进行危险驾驶行为预警存在的潜在问题有:i).基于道路场景分析的系统需要靠特定信号输入识别驾驶员意图(如以转向灯识别变道意图),容易触发误报警,并且系统无法准确反映驾驶员对车辆操作的专注以及疲劳程度;ii).基于驾驶室场景分析的系统易受安装角度以及视场范围的影响,某些正常驾驶行为会误触发相应预警信号,并且对一些未训练危险行为,系统无法准确发出预警信号。
发明内容
本发明的目的是解决驾驶室视觉系统和前视系统融合度不高导致的对危险驾驶情形判断不准确的问题,提出了一种用于危险驾驶行为预警的车内外场景视觉分析方法,本技术方案输入为同步前视以及驾驶室场景图像,道路场景以及驾驶室场景经卷积神经网络特征编码后,级联送入基于递归神经网络的时序行为分类器,输出危险驾驶行为类别,用于后续相应预警算法,对于危险驾驶行为的的判定准确。
为实现上述技术目的,本发明提供的一种技术方案是,一种用于危险驾驶行为预警的车内外场景视觉分析方法,包括如下步骤:
S1、数据采集、同步以及预处理;
S2、道路场景语义编码;
S3、驾驶室场景语义编码;
S4、时序危险驾驶行为分类;
S5、模型前向运算部署以及输出后处理。
本方案中,首先,采集并同步道路场景以及驾驶室场景图像输入,经格式转换、ROI选取以及缩放等预处理操作后,送入后续深度卷积神经网络模块分析模块;其次,基于前视交通场景图像输入,利用离线训练所得道路场景深度卷积神经网络进行前视场景语义特征描述,激活部分为道路边界、车辆、行人等图像区域,输出编码后道路场景语义特征,与驾驶室场景语义特征级联后送入时序分析模块;然后,基于驾驶室场景图像输入,利用离线训练所得驾驶室场景深度卷积神经网络进行驾驶室场景语义特征描述,激活部分为驾驶员面部以及上半身肢体等图像区域,输出编码后驾驶室场景语义特征,与道路场景语义特征级联后送入时序分析模块;最后,基于上述级联车内外场景特征,根据不同预警应用需求,利用递归神经网络模型或支持向量机对时序行为进行分类。
所述步骤S1包括如下步骤:
S11、道路场景图像预处理:通过前视相机采集道路场景图像数据并存储在图像缓存池中,经卷积神经网络特征描述后级联送入基于递归神经网络的时序行为分类器;
S12、驾驶室场景图像预处理:通过驾驶室相机采集驾驶室场景图像数据并存储在图像缓存池中,经卷积神经网络特征描述后级联送入基于递归神经网络的时序行为分类器。
所述步骤S2包括如下步骤:
S21、道路场景神经网络拓扑:输入为320*180*3通道道路场景RGB图像,主干网络包括有卷积、池化、归一化、激活以及反卷积基础网络;
S22、道路场景训练数据集:采集交通场景数据集,人工标注生成多任务训练标签;
S23、道路场景模型离线训练:综合考虑道路场景神经网络在辅助驾驶系统中的应用以及网络特征的兼容性与可移植性,设计道路场景特征损失函数Ltraffic。
所述步骤损失函数Ltraffic采用下列计算公式:
Ltraffic=k1Lobj+k2Lroad
Lce(y,g)=glogy+(1-g)log(1-y)
式中,Lobj为目标损失函数,Lroad为路面语义损失函数,k1为目标损失函数Lobj的权重系数,k2为路面语义损失函数Lroad的权重系数,L1s(loci,gloc,i)和Lce(attki,gatt,ki)为交叉熵损失函数,L1s(y,g)为smoothL1损失函数,目标损失函数Lobj包括有各目标的分类损失函数、位置回归损失函数以及属性分类损失函数,α为分类损失函数的权重系数,β为位置回归损失函数的权重系数,λj为属性分类损失函数的权重系数,道路语义损失函数Lroad由图像像素级交叉熵求和所得。
所述步骤S3包括如下步骤:
S31、驾驶室场景神经网络拓扑:输入为320*180*1通道驾驶室场景红外图像,主干网络包括有卷积、池化、归一化、激活以及反卷积基础网络;
S32、驾驶室场景训练数据集:采集驾驶室场景数据集,人工标注生成多任务训练标签;
S33、驾驶室场景模型离线训练:综合考虑驾驶室场景神经网络在辅助驾驶系统中的应用以及网络特征的兼容性与可移植性,设计驾驶室场景特征损失函数Ldriver。
所述损失函数Ldriver采用下列计算公式:
Ldriver=μ1Lfd+μ2Lgd+μ3Lhp
式中:Lfd为人脸检测损失函数,Lgd为眼球朝向损失函数,Lhp为面部朝向损失函数,μ1为人脸检测损失函数Lfd的权重系数,μ2为眼球朝向损失函数Lgd的权重系数,μ3为面部朝向损失函数Lhp的权重系数,人脸检测损失函数Lfd包括有人脸分类损失函数、人脸区域回归损失函数以及关键点回归损失函数,α1为人脸分类损失函数的权重系数,α2为人脸区域回归损失函数的损失函数,α3为关键点回归损失函数的权重系数,面部朝向回归损失函数Lhp包括有面部朝向分类损失函数、面部朝向角度回归损失函数以及朝向分类与角度一致性损失函数,β1为面部朝向分类损失函数的权重系数,β2为面部朝向角度回归损失函数的权重系数,β3为朝向分类与角度一致性损失函数的权重系数,眼球朝向回归损失函数Lgd包括有眼球朝向分类损失函数、眼球朝向角度回归损失函数以及眼球朝向分类与角度一致性损失函数,γ1为眼球朝向分类损失函数的权重系数,γ2为眼球朝向角度回归损失函数的权重系数,γ3为眼球朝向分类与角度一致性损失函数的权重系数。
所述步骤S4包括如下步骤:
S41、长短期记忆神经网络拓扑;
S42、长短期记忆神经网络训练数据集;
S43、长短期记忆神经网络离线训练;固化卷积特征层网络参数构造驾驶行为分类损失函数Lbehavior,按批量随机梯度下降的方式求优此损失函数Lbehavior。
所述损失函数Lbehavior采用下列计算公式:
式中:Bi,j为预测行为类别,gb,ij为行为类别真值,N为独立片段数,T为单独片段帧数。
所述步骤S5中,所述模型包括有道路场景模型、驾驶室场景模型,危险驾驶行为分类模型。
本发明的有益效果:
1、综合分析驾驶员驾驶以及车辆行驶状态,相较于基于单一场景输入的视觉分析系统,本发明的危险行为预警的可靠性较强;
2、利用深度学习的方法,通过端到端神经网络以及海量驾驶数据训练所生成的行为类别,适用于不同的驾驶人群以及驾驶习惯,相较于基于特定规则以及数值判据的预警系统,本发明的危险行为预警鲁棒性较强;
3、各场景激活区域与各系统单独应用时感兴趣激活区域一致,可以集成于基于神经网络的架构视觉系统中而不引入额外特征运算量,因而本发明的可移植性以及可扩展性也较好。
4、同时识别潜在的危险车辆运动以及潜在的疲劳驾驶状态,关联车辆行驶状态预警与相应驾驶员驾驶状态,从而识别相应危险行车状态的下的驾驶员的驾驶状态以减少正常驾驶状态下部分不必要的误告警。
附图说明
图1为本发明的一种用于危险驾驶行为预警的车内外场景视觉分析方法的方法流程图。
图2为本发明的一种用于危险驾驶行为预警的车内外场景视觉分析方法的具体方法流程。
图3为适用于本发明的一种深度神经网络架构示意图。
具体实施方式
为使本发明的目的、技术方案以及优点更加清楚明白,下面结合附图和实施例对本发明作进一步详细说明,应当理解的是,此处所描述的具体实施方式仅是本发明的一种最佳实施例,仅用以解释本发明,并不限定本发明的保护范围,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:如图1所示,一种用于危险驾驶行为预警的车内外场景视觉分析方法的方法流程图,包括如下步骤:
S1、数据采集、同步以及预处理;
S2、道路场景语义编码;
S3、驾驶室场景语义编码;
S4、时序危险驾驶行为分类;
S5、模型前向运算部署以及输出后处理。
本实施例中,首先,采集并同步道路场景以及驾驶室场景图像输入,经格式转换、ROI选取以及缩放等预处理操作后,送入后续深度卷积神经网络模块分析模块;其次,基于前视交通场景图像输入,利用离线训练所得道路场景深度卷积神经网络进行前视场景语义特征描述,激活部分为道路边界、车辆、行人等图像区域,输出编码后道路场景语义特征,与驾驶室场景语义特征级联后送入时序分析模块;然后,基于驾驶室场景图像输入,利用离线训练所得驾驶室场景深度卷积神经网络进行驾驶室场景语义特征描述,激活部分为驾驶员面部以及上半身肢体等图像区域,输出编码后驾驶室场景语义特征,与道路场景语义特征级联后送入时序分析模块;最后,基于上述级联车内外场景特征,根据不同预警应用需求,利用递归神经网络模型或支持向量机对时序行为进行分类。
如图2所示是一种用于危险驾驶行为预警的车内外场景视觉分析方法的具体方法流程图,
本发明提出了一种用于危险驾驶行为预警的车内外场景视觉联合分析方法,输入为前视相机所采集的道路场景图像(彩色)以及驾驶室相机所采集的驾驶室场景图像(红外),经CNN(卷积神经网络)特征描述后级联送入基于递归神经网络的时序行为分类器,输出危险驾驶行为类别。前视相机水平视场角50°,左右居中安装于前档玻璃高度1-1.2米处,方向水平向前;驾驶室相机水平视场角50°,采用红外补光,安装于A柱处朝向驾驶员区域,S1、数据采集、同步以及预处理:离线调节配置曝光、增益等采集参数,图像原始数据经采集后标注系统时间戳,匹配时间戳后按相同序号送入各自预处理处理缓存队列,经如下预处理操作后,输入神经网络运算单元。
S11、道路场景图像预处理:读取道路场景图像缓存池顶部图片(YUV格式,1280*720),先转化为RGB格式,后截取预定义ROI后缩放至道路场景神经网络输入大小(根据相应网络输入接口而定,默认为320*180*3)。
S12、驾驶室场景图像预处理:读取驾驶室场景图像缓存池顶部图片(YUV格式),先截取Y通道数据,后截取预定义ROI缩放至驾驶室场景神经网络输入大小(根据相应网络输入接口而定,默认为320*180*1)。
S2、道路场景语义编码:道路场景语义编码神经网络如图2所示,输入为前视交通场景图像,经离线数据采集、神经网络模型训练以及在线模型推理,输出道路场景激活语义特征。
S21、道路场景神经网络拓扑:输入为320*180*3通道道路场景RGB图像,主干网络主要由卷积(conv)、池化(pooling)、归一化(BN)、激活(Relu)以及反卷积(deconv)等基础网络操作构成。场景特征包括网络输入的1/4,1/16以及1/64尺度下的特征描述,离线训练所采用计算损失函数的分支包括目标检测分支、道路语义分割分支以及目标属性分类分支。
S22、道路场景训练数据集:采集交通场景数据集,包含不同时间(白天、晚上等)、天气(晴、阴、雨等)、驾驶场景(城市、高速、隧道等),提取时序离散样本,人工标注生成多任务训练标签,主要包括目标检测标签(目标框形式)、车道边界标签(语义图层形式)以及可行驶区域标签(语义图层形式)。其中,目标框形式包括目标类别(0-其他,1-小车,2-大车,3-行人,4-非机动车,5-信号灯,6-标识牌),位置(x,Y,W,H)以及其他自定义属性(如标识牌类别、车辆3D属性等)。
S23、道路场景模型离线训练:综合考虑道路场景神经网络在辅助驾驶系统中的应用(包括其他交通参与者、交通信号标识的识别以及车道、道路边界的识别)以及网络特征的兼容性与可移植性,设计道路场景特征损失函数Ltraffic如下:
Ltraffic=k1Lobi+k2Lroad
Lce(y,g)=glogy+(1-g)log(1-y)
式中,Lobj为目标损失函数,Lroad为路面语义损失函数,k1为目标损失函数Lobj的权重系数,k2为路面语义损失函数Lroad的权重系数,L1s(loci,gloc,i)和Lce(attki,gatt,ki)为交叉熵损失函数,L1s(y,g)为smoothL1损失函数,目标损失函数Lobj包括有各目标的分类损失函数、位置回归损失函数以及属性分类损失函数,α为分类损失函数的权重系数,β为位置回归损失函数的权重系数,λj为属性分类损失函数的权重系数,道路语义损失函数Lroad由图像像素级交叉熵求和所得。
采用色彩、几何变换等方式扩充步骤S22中所述训练数据集,利用批量样本梯度下降的方式反向传播上述损失函数梯度信息,更新相应神经网络权重参数。
S3、驾驶室场景语义编码:如图3所示,是适用于本发明的一种深度神经网络架构示意图,驾驶室场景语义编码神经网络如图3所示,输入为驾驶室场景图像,经离线数据采集、神经网络模型训练以及在线模型推理,输出驾驶室场景激活语义特征。
S31、驾驶室场景神经网络拓扑:输入为320*180*1通道驾驶室场景红外图像,与道路场景神经网络类似,主干网络部分由卷积(conv)、池化(pooling)、归一化(BN)、激活(Relu)以及反卷积(deconv)等基础网络操作构成。驾驶室场景特征主要包含神经网络输入的1/4,1/8以及1/16的尺度下的特征描述。
S32、驾驶室场景训练数据集:采集驾驶室场景数据集,包含不同时间(白天、晚上等)、天气(晴、阴、雨等)、驾驶室相机安装位置(中间、a柱等)、驾驶室空间结构(轿车、suv等)以及驾驶员身份(不同外貌、性别等特征的车辆驾驶者),提取时序离散样本,人工标注生成多任务训练标签,主要包括人脸区域、关键点标签以及面部、眼球朝向标签。其中,人脸区域标签格式同一般目标框标签格式,人脸关键点标签包括13个关键点(包括眼部8个关键点、鼻尖部1个关键点以及口部4个关键点的图像坐标位置),面部朝向(相机坐标系下头部三自由度转动角度)以及眼球朝向为二自由度角度标签(即面部平面内眼球上下以及左右转动的角度)。
S33、驾驶室场景模型离线训练:综合考虑驾驶室场景神经网络在辅助驾驶系统中的应用(包括疲劳、分神驾驶行为的检测)以及网络特征的兼容性与可移植性,设计驾驶室场景特征损失函数Ldriver如下:
Ldriver=μ1Lfd+μ2Lgd+μ3Lhp
式中:Lfd为人脸检测损失函数,Lgd为眼球朝向损失函数,Lhp为面部朝向损失函数,μ1为人脸检测损失函数Lfd的权重系数,μ2为眼球朝向损失函数Lgd的权重系数,μ3为面部朝向损失函数Lhp的权重系数,人脸检测损失函数Lfd包括有人脸分类损失函数、人脸区域回归损失函数以及关键点回归损失函数,α1为人脸分类损失函数的权重系数,α2为人脸区域回归损失函数的损失函数,α3为关键点回归损失函数的权重系数,面部朝向回归损失函数Lhp包括有面部朝向分类损失函数、面部朝向角度回归损失函数以及朝向分类与角度一致性损失函数,β1为面部朝向分类损失函数的权重系数,β2为面部朝向角度回归损失函数的权重系数,β3为朝向分类与角度一致性损失函数的权重系数,眼球朝向回归损失函数Lgd包括有眼球朝向分类损失函数、眼球朝向角度回归损失函数以及眼球朝向分类与角度一致性损失函数,γ1为眼球朝向分类损失函数的权重系数,γ2为眼球朝向角度回归损失函数的权重系数,γ3为眼球朝向分类与角度一致性损失函数的权重系数。
采用色彩、几何变换等方式扩充步骤S32中所述训练数据集,利用批量样本梯度下降的方式反向传播上述损失函数梯度信息,更新相应神经网络权重参数。
S4、时序危险驾驶行为分类:级联上述编码驾驶室内外场景,作为单一时刻行为特征描述,利用长短期记忆神经网络(LSTM,如图3所示)对预定义片段长度行为特征进行分类,输出预定义驾驶行为类别(0-正常驾驶,1-车道偏离,2-前车潜在碰撞,3-疲劳驾驶,4-不专注驾驶)。
S41、LSTM网络拓扑:时序递归单元个数为12(按12.5帧/秒的处理速度,近似为1秒的时序数据所对应的行为),所使用公式如下:
ft=sigmoid(σf(xt,ht-1))
it=sigmoid(σi(xt,ht-1))
ot=sigmoid(σo(xt,ht-1))
ct=ft·ct-1+it·tanh(σc(xt,ht-1))
ht=ot·tanh(ct)
式中:xt为输入向量,ft为遗忘门向量,it为更新门向量,ht为隐层向量,ot为输出门向量,ct为元组状态向量。
S42、LSTM网络训练数据集:按1中的数据采集与同步方式采集与4中预定义驾驶行为的相应驾驶室内外场景图像数据,包括步骤S2与步骤S3数据集中描述的场景与工况,按12.5帧的帧率截取相应视频片段(2秒对应一个事件),每一个视频片段对应一个行为标签。
S43、LSTM网络离线训练:固化卷积特征层网络参数(即梯度不反向传播至此部分),构造驾驶行为分类损失函数Lbehavior如下,按批量随机梯度下降的方式求优此损失函数:
式中:Bi,j为预测行为类别,gb,ij为行为类别真值,N为独立片段数,T为单独片段帧数。
S5、模型前向运算部署以及模型输出后处理:如步骤S2、步骤3以及步骤4部分所述,模型共包含三个分支,分别为道路场景模型、驾驶室场景模型,危险驾驶行为分类模型。其中步骤S2,和步骤S3部分所包含的分支仅供训练计算损失函数以及反向传播梯度使用,前向运算时只保留相应场景特征层部分,相应模型参数按前端平台运算特性进行数据量化与稀疏化等压缩操作后,按预设定特征通道顺序级联后传入长短记忆模块进行时序驾驶行为在线分类。
本发明一种用于危险驾驶行为预警的车内外场景视觉分析方法的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明之形状、结构所作的等效变化均在本发明的保护范围内。
Claims (8)
1.一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:包括如下步骤:
S1、数据采集、同步以及预处理;
S2、道路场景语义编码;
S21、道路场景神经网络拓扑:输入为320*180*3通道道路场景RGB图像,主干网络包括有卷积、池化、归一化、激活以及反卷积基础网络;
S22、道路场景训练数据集:采集交通场景数据集,人工标注生成多任务训练标签;
S23、道路场景模型离线训练:综合考虑道路场景神经网络在辅助驾驶系统中的应用以及网络特征的兼容性与可移植性,设计道路场景特征损失函数Ltraffic;
S3、驾驶室场景语义编码;
S4、时序危险驾驶行为分类;
S5、模型前向运算部署以及输出后处理。
2.根据权利要求1所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述步骤S1包括如下步骤:
S11、道路场景图像预处理:通过前视相机采集道路场景图像数据并存储在图像缓存池中,经卷积神经网络特征描述后级联送入基于递归神经网络的时序行为分类器;
S12、驾驶室场景图像预处理:通过驾驶室相机采集驾驶室场景图像数据并存储在图像缓存池中,经卷积神经网络特征描述后级联送入基于递归神经网络的时序行为分类器。
3.根据权利要求1所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述步骤损失函数Ltraffic采用下列计算公式:
Ltraffic=k1Lobj+k2Lroad
Lce(y,g)=glogy+(1-g)log(1-y)
式中,Lobj为目标损失函数,Lroad为路面语义损失函数,k1为目标损失函数Lobj的权重系数,k2为路面语义损失函数Lroad的权重系数,L1s(loci,gloc,i)和Lce(attki,gatt,ki)为交叉熵损失函数,L1s(y,g)为smoothL1损失函数,目标损失函数Lobj包括有各目标的分类损失函数、位置回归损失函数以及属性分类损失函数,α为分类损失函数的权重系数,β为位置回归损失函数的权重系数,λj为属性分类损失函数的权重系数,道路语义损失函数Lroad由图像像素级交叉熵求和所得。
4.根据权利要求1所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述步骤S3包括如下步骤:
S31、驾驶室场景神经网络拓扑:输入为320*180*1通道驾驶室场景红外图像,主干网络包括有卷积、池化、归一化、激活以及反卷积基础网络;
S32、驾驶室场景训练数据集:采集驾驶室场景数据集,人工标注生成多任务训练标签;
S33、驾驶室场景模型离线训练:综合考虑驾驶室场景神经网络在辅助驾驶系统中的应用以及网络特征的兼容性与可移植性,设计驾驶室场景特征损失函数Ldriver。
5.根据权利要求4所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述损失函数Ldriver采用下列计算公式:
Ldriver=μ1Lfd+μ2Lgd+μ3Lhp
式中:Lfd为人脸检测损失函数,Lgd为眼球朝向损失函数,Lhp为面部朝向损失函数,μ1为人脸检测损失函数Lfd的权重系数,μ2为眼球朝向损失函数Lgd的权重系数,μ3为面部朝向损失函数Lhp的权重系数,人脸检测损失函数Lfd包括有人脸分类损失函数、人脸区域回归损失函数以及关键点回归损失函数,α1为人脸分类损失函数的权重系数,α2为人脸区域回归损失函数的损失函数,α3为关键点回归损失函数的权重系数,面部朝向损失函数Lhp包括有面部朝向分类损失函数、面部朝向角度回归损失函数以及朝向分类与角度一致性损失函数,β1为面部朝向分类损失函数的权重系数,β2为面部朝向角度回归损失函数的权重系数,β3为朝向分类与角度一致性损失函数的权重系数,眼球朝向损失函数Lgd包括有眼球朝向分类损失函数、眼球朝向角度回归损失函数以及眼球朝向分类与角度一致性损失函数,γ1为眼球朝向分类损失函数的权重系数,γ2为眼球朝向角度回归损失函数的权重系数,γ3为眼球朝向分类与角度一致性损失函数的权重系数。
6.根据权利要求1所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述步骤S4包括如下步骤:
S41、长短期记忆神经网络拓扑;
S42、长短期记忆神经网络训练数据集;
S43、长短期记忆神经网络离线训练;固化卷积特征层网络参数构造驾驶行为分类损失函数Lbehavior,按批量随机梯度下降的方式求优此损失函数Lbehavior。
7.根据权利要求6所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述损失函数Lbehavior采用下列计算公式:
式中:Bi,j为预测行为类别,gb,ij为行为类别真值,N为独立片段数,T为单独片段帧数。
8.根据权利要求1所述的一种用于危险驾驶行为预警的车内外场景视觉分析方法,其特征在于:
所述步骤S5中,所述模型包括有道路场景模型、驾驶室场景模型,危险驾驶行为分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910808682.1A CN110807352B (zh) | 2019-08-29 | 2019-08-29 | 一种用于危险驾驶行为预警的车内外场景视觉分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910808682.1A CN110807352B (zh) | 2019-08-29 | 2019-08-29 | 一种用于危险驾驶行为预警的车内外场景视觉分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110807352A CN110807352A (zh) | 2020-02-18 |
CN110807352B true CN110807352B (zh) | 2023-08-25 |
Family
ID=69487468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910808682.1A Active CN110807352B (zh) | 2019-08-29 | 2019-08-29 | 一种用于危险驾驶行为预警的车内外场景视觉分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110807352B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396235B (zh) * | 2020-11-23 | 2022-05-03 | 浙江天行健智能科技有限公司 | 基于眼球动作追踪的交通事故发生时间预测建模方法 |
CN113221613B (zh) * | 2020-12-14 | 2022-06-28 | 国网浙江宁海县供电有限公司 | 生成场景图辅助建模上下文信息的电力场景预警方法 |
CN113179389A (zh) * | 2021-04-15 | 2021-07-27 | 江苏濠汉信息技术有限公司 | 一种输电线路危险车辆吊车扬臂识别系统及识别方法 |
CN113255519A (zh) * | 2021-05-25 | 2021-08-13 | 江苏濠汉信息技术有限公司 | 一种输电线路危险车辆吊车扬臂识别系统及多目标跟踪方法 |
CN113537115A (zh) * | 2021-07-26 | 2021-10-22 | 东软睿驰汽车技术(沈阳)有限公司 | 驾驶员的驾驶状态获取方法、装置及电子设备 |
CN114387586A (zh) * | 2021-12-31 | 2022-04-22 | 西安航空学院 | 一种基于yolo神经网络的驾驶员专心度检测方法 |
CN114758270A (zh) * | 2022-03-22 | 2022-07-15 | 同济大学 | 一种基于深度学习的跟随车驾驶辅助系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103770733A (zh) * | 2014-01-15 | 2014-05-07 | 中国人民解放军国防科学技术大学 | 一种驾驶员安全驾驶状态检测方法及装置 |
CN103818256A (zh) * | 2012-11-16 | 2014-05-28 | 西安众智惠泽光电科技有限公司 | 汽车疲劳驾驶实时提醒系统 |
WO2018039646A1 (en) * | 2016-08-26 | 2018-03-01 | Netradyne Inc. | Recording video of an operator and a surrounding visual field |
CN108319909A (zh) * | 2018-01-29 | 2018-07-24 | 清华大学 | 一种驾驶行为分析方法及系统 |
CN108764034A (zh) * | 2018-04-18 | 2018-11-06 | 浙江零跑科技有限公司 | 一种基于驾驶室近红外相机的分神驾驶行为预警方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10298741B2 (en) * | 2013-07-18 | 2019-05-21 | Secure4Drive Communication Ltd. | Method and device for assisting in safe driving of a vehicle |
US10467488B2 (en) * | 2016-11-21 | 2019-11-05 | TeleLingo | Method to analyze attention margin and to prevent inattentive and unsafe driving |
-
2019
- 2019-08-29 CN CN201910808682.1A patent/CN110807352B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103818256A (zh) * | 2012-11-16 | 2014-05-28 | 西安众智惠泽光电科技有限公司 | 汽车疲劳驾驶实时提醒系统 |
CN103770733A (zh) * | 2014-01-15 | 2014-05-07 | 中国人民解放军国防科学技术大学 | 一种驾驶员安全驾驶状态检测方法及装置 |
WO2018039646A1 (en) * | 2016-08-26 | 2018-03-01 | Netradyne Inc. | Recording video of an operator and a surrounding visual field |
CN108319909A (zh) * | 2018-01-29 | 2018-07-24 | 清华大学 | 一种驾驶行为分析方法及系统 |
CN108764034A (zh) * | 2018-04-18 | 2018-11-06 | 浙江零跑科技有限公司 | 一种基于驾驶室近红外相机的分神驾驶行为预警方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110807352A (zh) | 2020-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110807352B (zh) | 一种用于危险驾驶行为预警的车内外场景视觉分析方法 | |
US11392131B2 (en) | Method for determining driving policy | |
JP7332726B2 (ja) | ヒートマップを使用したドライバーの注目の検出 | |
CN110097109B (zh) | 一种基于深度学习的道路环境障碍物检测系统及方法 | |
CN107368890B (zh) | 一种以视觉为中心的基于深度学习的路况分析方法及系统 | |
Peng et al. | MASS: Multi-attentional semantic segmentation of LiDAR data for dense top-view understanding | |
Zhang et al. | ISSAFE: Improving semantic segmentation in accidents by fusing event-based data | |
US10814815B1 (en) | System for determining occurrence of an automobile accident and characterizing the accident | |
DE102018201054A1 (de) | System und Verfahren zur Bilddarstellung durch ein Fahrerassistenzmodul eines Fahrzeugs | |
US11688179B2 (en) | Inferring intent using computer vision | |
US20170300763A1 (en) | Road feature detection using a vehicle camera system | |
CN111860269B (zh) | 一种多特征融合的串联rnn结构及行人预测方法 | |
US20170300767A1 (en) | Parallel scene primitive detection using a surround camera system | |
Jiang et al. | Target detection algorithm based on MMW radar and camera fusion | |
Yuan et al. | Adaptive forward vehicle collision warning based on driving behavior | |
CN110781718B (zh) | 一种驾驶室红外视觉系统及驾驶员注意力分析方法 | |
US20180208201A1 (en) | System and method for a full lane change aid system with augmented reality technology | |
DE102018212655A1 (de) | Erkennung der Bewegungsabsicht eines Fußgängers aus Kamerabildern | |
CN111292366A (zh) | 一种基于深度学习和边缘计算的视觉行车测距算法 | |
Franke et al. | From door to door—Principles and applications of computer vision for driver assistant systems | |
CN113386775B (zh) | 一种考虑人-车-路特性的驾驶员意图识别方法 | |
DE102022130540A1 (de) | Systeme und verfahren zur vermeidung von fehldetektionen von verfolgten objekten in der umgebenden umgebung eines fahrzeugs | |
CN111985388B (zh) | 行人注意力检测驾驶辅助系统、装置和方法 | |
CN111062311B (zh) | 一种基于深度级可分离卷积网络的行人手势识别与交互方法 | |
DE102017215901A1 (de) | Assistenzsystem für ein Fahrzeug |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 310051 1st and 6th floors, no.451 Internet of things street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Zhejiang Zero run Technology Co.,Ltd. Address before: 310051 1st and 6th floors, no.451 Internet of things street, Binjiang District, Hangzhou City, Zhejiang Province Applicant before: ZHEJIANG LEAPMOTOR TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |