CN111738212B - 基于人工智能的交通信号灯识别方法、装置、设备及介质 - Google Patents
基于人工智能的交通信号灯识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111738212B CN111738212B CN202010695795.8A CN202010695795A CN111738212B CN 111738212 B CN111738212 B CN 111738212B CN 202010695795 A CN202010695795 A CN 202010695795A CN 111738212 B CN111738212 B CN 111738212B
- Authority
- CN
- China
- Prior art keywords
- target
- image
- traffic signal
- anchor box
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 238000010586 diagram Methods 0.000 claims abstract description 29
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 24
- 239000002131 composite material Substances 0.000 claims description 21
- 238000013507 mapping Methods 0.000 claims description 19
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 11
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract 1
- 230000001737 promoting effect Effects 0.000 abstract 1
- 238000004590 computer program Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及人工智能及图像检测技术领域,提供一种基于人工智能的交通信号灯识别方法、装置、设备及介质,能够利用darknet53网络提取resize处理后的目标图像的目标特征信息并输入至采用Mixup算法及残差注意力网络训练的交通信号灯识别模型,输出目标特征图以精准提取细节特征,提高召回率和准确率,获取目标anchor box在每个目标特征图上进行识别,输出目标anchor box坐标及目标得分,将得分最高的目标anchor box坐标作为预测的位置坐标并映射到待识别图像上,得到识别结果,进而基于人工智能手段实现对交通信号灯的自动识别,识别的准确率更高。本发明还涉及区块链技术,识别结果及交通信号灯识别模型可存储至区块链。本发明还可应用于智慧交通场景中,从而推动智慧城市的建设。
Description
技术领域
本发明涉及人工智能及图像检测技术领域,尤其涉及一种基于人工智能的交通信号灯识别方法、装置、设备及介质。
背景技术
随着车辆闯红灯等违法行为的不断增多,对交通卡口图像中的信号灯进行快速定位与识别已经成为城市交通管理中极其重要且具有挑战性的任务。
传统的YOLOv3检测算法由于具有检测速度较快且精度良好的优点,成为目前业界主流的目标检测算法之一,YOLOv3检测算法对于大目标的检测效果较好,但对于类似交通信号灯等小目标的检测效果还有很大的提升空间,尤其是对夜间或者雾霾等复杂场景下的检测识别,效果较弱。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的交通信号灯识别方法、装置、设备及介质,能够基于Mixup算法及残差注意力网络更加精准地提取信号灯的细节特征,从而提高交通信号灯检测的召回率和准确率,进而基于人工智能手段实现对交通信号灯的自动识别,识别的准确率更高。
一种基于人工智能的交通信号灯识别方法,所述基于人工智能的交通信号灯识别方法包括:
响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
利用darknet53网络提取所述目标图像的目标特征信息;
将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到;
获取所述交通信号灯识别模型的目标anchor box;
利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
根据本发明优选实施例,在将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图之前,所述基于人工智能的交通信号灯识别方法还包括:
获取训练样本;
对所述训练样本以预设数量为一组进行组合运算,得到至少一组训练数据;
将每组训练数据采用Mixup算法进行合成,得到与每组训练数据对应的合成图像;
利用darknet53网络提取每张合成图像的特征信息;
获取所述darknet53网络中至少一种尺度的残差块;
基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果;
对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图;
获取预先聚类得到的anchor box;
利用所述anchor box在每个特征图上进行识别,输出与每个特征图对应的anchorbox坐标及每个anchor box坐标的得分;
获取每张合成图像的至少一种尺度的特征图中得分最高的anchor box坐标作为每张合成图像的预测坐标;
确定每张合成图像的实际坐标;
基于每张合成图像的实际坐标及每张合成图像的预测坐标计算准确率及召回率;
计算损失函数的值;
当所述准确率达到预设准确率、所述召回率达到预设召回率、所述损失函数的值低于预设损失时,停止训练,得到所述交通信号灯识别模型,并将所述交通信号灯识别模型存储于区块链上。
根据本发明优选实施例,所述基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果包括:
获取所述darknet53网络的多个层中具有相同尺度的多个特征信息;
对于每种尺度的多个特征信息,对每个特征信息进行压缩变换,得到多个压缩数据;
基于对应尺度的残差块对所述多个压缩数据进行squeeze处理,得到多个处理结果;
采用attention算法计算每个处理结果的得分;
将得分最高的处理结果确定为所述拼接结果。
根据本发明优选实施例,所述对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图包括:
将所述拼接结果依次输入至conv_layer层、conv_block层及conv层进行卷积运算,输出每张合成图像的至少一种尺度的特征图。
根据本发明优选实施例,所述基于人工智能的交通信号灯识别方法还包括:
确定每个特征图对应的anchor box的中心点坐标、每个特征图对应的anchor box的宽高坐标,及每个anchor box坐标的得分;
根据每个特征图对应的anchor box的中心点坐标计算中心点坐标误差;
根据每个特征图对应的anchor box的宽高坐标计算宽高坐标误差;
根据每个anchor box坐标的得分计算目标误差;
计算所述中心点坐标误差、所述宽高坐标误差及所述目标误差的和作为所述损失函数。
根据本发明优选实施例,所述将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果包括:
确定偏移量;
根据所述偏移量转换所述位置坐标,得到转换坐标;
确定所述待识别图像的第一尺度,及确定所述位置坐标对应的目标特征图的第二尺度;
计算所述第一尺度与所述第二尺度的商作为系数;
将所述系数与所述位置坐标相乘,得到所述位置坐标在所述待识别图像上的对应位置,得到所述待识别图像的识别结果。
根据本发明优选实施例,所述基于人工智能的交通信号灯识别方法还包括:
响应于接收到的检测指令,确定与所述检测指令对应的终端;
将所述识别结果发送至所述终端。
一种基于人工智能的交通信号灯识别装置,所述基于人工智能的交通信号灯识别装置包括:
处理单元,用于响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
提取单元,用于利用darknet53网络提取所述目标图像的目标特征信息;
输入单元,用于将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到;
获取单元,用于获取所述交通信号灯识别模型的目标anchor box;
识别单元,用于利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
映射单元,用于将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果。
一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述基于人工智能的交通信号灯识别方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述基于人工智能的交通信号灯识别方法。
由以上技术方案可以看出,本发明能够响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像,利用darknet53网络提取所述目标图像的目标特征信息,并将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到,基于Mixup算法及残差注意力网络能够更加精准地提取信号灯的细节特征,从而提高交通信号灯检测的召回率和准确率,获取所述交通信号灯识别模型的目标anchor box,并利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标,将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,进而基于人工智能手段实现对交通信号灯的自动识别,识别的准确率更高。
附图说明
图1是本发明基于人工智能的交通信号灯识别方法的较佳实施例的流程图。
图2是本发明基于人工智能的交通信号灯识别装置的较佳实施例的功能模块图。
图3是本发明实现基于人工智能的交通信号灯识别方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明基于人工智能的交通信号灯识别方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述基于人工智能的交通信号灯识别方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像。
通过resize处理,使所述待识别图像满足模型对于图像大小的需求,便于后续利用模型进行自动识别。
S11,利用darknet53网络提取所述目标图像的目标特征信息。
其中,所述目标特征信息包括,但不限于以下一种或者多种特征的组合:
颜色特征、边缘特征、形状特征等。
另外,所述特征信息为矩阵形式。
S12,将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到。
在本实施例中,还需要训练所述交通信号灯识别模型。
具体地,在将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图之前,所述基于人工智能的交通信号灯识别方法还包括:
获取训练样本;
对所述训练样本以预设数量为一组进行组合运算,得到至少一组训练数据;
将每组训练数据采用Mixup算法进行合成,得到与每组训练数据对应的合成图像;
利用darknet53网络提取每张合成图像的特征信息;
获取所述darknet53网络中至少一种尺度的残差块;
基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果;
对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图;
获取预先聚类得到的anchor box;
利用所述anchor box在每个特征图上进行识别,输出与每个特征图对应的anchorbox坐标及每个anchor box坐标的得分;
获取每张合成图像的至少一种尺度的特征图中得分最高的anchor box坐标作为每张合成图像的预测坐标;
确定每张合成图像的实际坐标;
基于每张合成图像的实际坐标及每张合成图像的预测坐标计算准确率及召回率;
计算损失函数的值;
当所述准确率达到预设准确率、所述召回率达到预设召回率、所述损失函数的值低于预设损失时,停止训练,得到所述交通信号灯识别模型,并将所述交通信号灯识别模型存储于区块链上。
例如:所述预设数量可以为2,当所述训练样本中包括图片1、图片2及图片3时,则经过组合运算后得到的三组训练数据分别为:图片1、图片2;图片2、图片3;图片1、图片3。
鉴于某些汽车尾灯的颜色偏黄,再加上光线等多方面因素的影响,容易与交通信号灯造成混淆,本案在传统的YOLOv3框架中引入了一种新的图像增强算法Mixup,能够对特征进行增强,因此有效减少了将汽车尾灯等非信号灯误识别成交通信号灯的情况,从而提高了交通信号灯检测的准确率。
另外,本案在传统的残差网络中加入了注意力机制(attention),并将得到的残差注意力网络引入了YOLOv3框架,需要说明的是,原有的YOLOv3框架采用的是静态残差连接,将一步预测的残差值作为最终的残差,而本案将原始的静态残差连接改为动态残差连接,即利用残差注意力网络将多步预测的残差进行拼接作为最后的残差值,因此能够更加精准地提取信号灯的细节特征,而由于细节特征的提取更精准,那么交通信号灯检测的准确率也将随之提高,同时,由于召回率表征的是样本数据中的正例有多少被正确预测,那么由于细节特征的提取更精准,样本数据中正例被正确预测(即带有交通信号灯的图片被正确识别出交通信号灯)的概率也将提高,也就是说,交通信号灯检测的召回率也将随之提高。
具体地,所述基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果包括:
获取所述darknet53网络的多个层中具有相同尺度的多个特征信息;
对于每种尺度的多个特征信息,对每个特征信息进行压缩变换,得到多个压缩数据;
基于对应尺度的残差块对所述多个压缩数据进行squeeze处理,得到多个处理结果;
采用attention算法计算每个处理结果的得分;
将得分最高的处理结果确定为所述拼接结果。
通过上述实施方式,能够基于attention算法更加有针对性地专注于重要信息,进一步提高了识别地准确性。
具体地,所述对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图包括:
将所述拼接结果依次输入至conv_layer层、conv_block层及conv层进行卷积运算,输出每张合成图像的至少一种尺度的特征图。
需要说明的是,所述conv_layer层、所述conv_block层及所述conv层的层组成方式可以根据实际需求进行设置,本发明不限制。
例如:通过获取历史数据得知,所述conv_layer层可以包括5层卷积、1层BN层(Batch Normalization)及1层激活层,所述conv_block层可以包括1层卷积、1层BN层及1层激活层,所述conv层可以包括1层卷积。
进一步地,所述基于人工智能的交通信号灯识别方法还包括:
确定每个特征图对应的anchor box的中心点坐标、每个特征图对应的anchor box的宽高坐标,及每个anchor box坐标的得分;
根据每个特征图对应的anchor box的中心点坐标计算中心点坐标误差;
根据每个特征图对应的anchor box的宽高坐标计算宽高坐标误差;
根据每个anchor box坐标的得分计算目标误差;
计算所述中心点坐标误差、所述宽高坐标误差及所述目标误差的和作为所述损失函数。
通过上述实施方式构建的损失函数,能够从多个层面评价模型的损失,进而使模型的效果更佳。
S13,获取所述交通信号灯识别模型的目标anchor box。
其中,所述目标anchor box的数量为所述至少一种尺度的倍数,以确保每种尺度的目标特征图能够得到相同的目标anchor box。
S14,利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标。
通过上述实施方式,能够在输出的每个目标特征图对应的目标anchor box坐标中获取到得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标,以分值进行进一步筛选再次提高了识别的准确度。
S15,将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
在本实施例中,所述将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果包括:
确定偏移量;
根据所述偏移量转换所述位置坐标,得到转换坐标;
确定所述待识别图像的第一尺度,及确定所述位置坐标对应的目标特征图的第二尺度;
计算所述第一尺度与所述第二尺度的商作为系数;
将所述系数与所述位置坐标相乘,得到所述位置坐标在所述待识别图像上的对应位置,得到所述待识别图像的识别结果。
通过上述实施方式,相当于将识别到的交通信号灯位置映射在原始图像上,便于用户查看识别结果。
进一步地,所述基于人工智能的交通信号灯识别方法还包括:
响应于接收到的检测指令,确定与所述检测指令对应的终端;
将所述识别结果发送至所述终端。
在将所述识别结果发送至所述终端后,可以利用所述识别结果辅助进行交通信号灯是否损坏,以及是否有闯红灯行为等的检测。
需要说明的是,在本实施例中,为了确保数据的安全性及提高隐私性,将所述识别结果及所述交通信号灯识别模型存储至区块链。
由以上技术方案可以看出,本发明能够响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像,利用darknet53网络提取所述目标图像的目标特征信息,并将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到,基于Mixup算法及残差注意力网络能够更加精准地提取信号灯的细节特征,从而提高交通信号灯检测的召回率和准确率,获取所述交通信号灯识别模型的目标anchor box,并利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标,将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,进而基于人工智能手段实现对交通信号灯的自动识别,识别的准确率更高。
如图2所示,是本发明基于人工智能的交通信号灯识别装置的较佳实施例的功能模块图。所述基于人工智能的交通信号灯识别装置11包括处理单元110、提取单元111、输入单元112、获取单元113、识别单元114、映射单元115、运算单元116、合成单元117、拼接单元118、确定单元119、训练单元120、发送单元121。本发明所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
处理单元110响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像。
通过resize处理,使所述待识别图像满足模型对于图像大小的需求,便于后续利用模型进行自动识别。
提取单元111利用darknet53网络提取所述目标图像的目标特征信息。
其中,所述目标特征信息包括,但不限于以下一种或者多种特征的组合:
颜色特征、边缘特征、形状特征等。
另外,所述特征信息为矩阵形式。
输入单元112将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到。
在本实施例中,还需要训练所述交通信号灯识别模型。
具体地,在将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图之前,获取单元113获取训练样本;
运算单元116对所述训练样本以预设数量为一组进行组合运算,得到至少一组训练数据;
合成单元117将每组训练数据采用Mixup算法进行合成,得到与每组训练数据对应的合成图像;
所述提取单元111利用darknet53网络提取每张合成图像的特征信息;
所述获取单元113获取所述darknet53网络中至少一种尺度的残差块;
拼接单元118基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果;
所述运算单元116对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图;
所述获取单元113获取预先聚类得到的anchor box;
识别单元114利用所述anchor box在每个特征图上进行识别,输出与每个特征图对应的anchor box坐标及每个anchor box坐标的得分;
所述获取单元113获取每张合成图像的至少一种尺度的特征图中得分最高的anchor box坐标作为每张合成图像的预测坐标;
确定单元119确定每张合成图像的实际坐标;
所述运算单元116基于每张合成图像的实际坐标及每张合成图像的预测坐标计算准确率及召回率;
所述运算单元116计算损失函数的值;
当所述准确率达到预设准确率、所述召回率达到预设召回率、所述损失函数的值低于预设损失时,训练单元120停止训练,得到所述交通信号灯识别模型,并将所述交通信号灯识别模型存储于区块链上。
例如:所述预设数量可以为2,当所述训练样本中包括图片1、图片2及图片3时,则经过组合运算后得到的三组训练数据分别为:图片1、图片2;图片2、图片3;图片1、图片3。
鉴于某些汽车尾灯的颜色偏黄,再加上光线等多方面因素的影响,容易与交通信号灯造成混淆,本案在传统的YOLOv3框架中引入了一种新的图像增强算法Mixup,能够对特征进行增强,因此有效减少了将汽车尾灯等非信号灯误识别成交通信号灯的情况,从而提高了交通信号灯检测的准确率。
另外,本案在传统的残差网络中加入了注意力机制(attention),并将得到的残差注意力网络引入了YOLOv3框架,需要说明的是,原有的YOLOv3框架采用的是静态残差连接,将一步预测的残差值作为最终的残差,而本案将原始的静态残差连接改为动态残差连接,即利用残差注意力网络将多步预测的残差进行拼接作为最后的残差值,因此能够更加精准地提取信号灯的细节特征,而由于细节特征的提取更精准,那么交通信号灯检测的准确率也将随之提高,同时,由于召回率表征的是样本数据中的正例有多少被正确预测,那么由于细节特征的提取更精准,样本数据中正例被正确预测(即带有交通信号灯的图片被正确识别出交通信号灯)的概率也将提高,也就是说,交通信号灯检测的召回率也将随之提高。
具体地,所述拼接单元118基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果包括:
获取所述darknet53网络的多个层中具有相同尺度的多个特征信息;
对于每种尺度的多个特征信息,对每个特征信息进行压缩变换,得到多个压缩数据;
基于对应尺度的残差块对所述多个压缩数据进行squeeze处理,得到多个处理结果;
采用attention算法计算每个处理结果的得分;
将得分最高的处理结果确定为所述拼接结果。
通过上述实施方式,能够基于attention算法更加有针对性地专注于重要信息,进一步提高了识别地准确性。
具体地,所述运算单元116对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图包括:
将所述拼接结果依次输入至conv_layer层、conv_block层及conv层进行卷积运算,输出每张合成图像的至少一种尺度的特征图。
需要说明的是,所述conv_layer层、所述conv_block层及所述conv层的层组成方式可以根据实际需求进行设置,本发明不限制。
例如:通过获取历史数据得知,所述conv_layer层可以包括5层卷积、1层BN层(Batch Normalization)及1层激活层,所述conv_block层可以包括1层卷积、1层BN层及1层激活层,所述conv层可以包括1层卷积。
进一步地,所述确定单元119确定每个特征图对应的anchor box的中心点坐标、每个特征图对应的anchor box的宽高坐标,及每个anchor box坐标的得分;
所述运算单元116根据每个特征图对应的anchor box的中心点坐标计算中心点坐标误差;
所述运算单元116根据每个特征图对应的anchor box的宽高坐标计算宽高坐标误差;
所述运算单元116根据每个anchor box坐标的得分计算目标误差;
所述运算单元116计算所述中心点坐标误差、所述宽高坐标误差及所述目标误差的和作为所述损失函数。
通过上述实施方式构建的损失函数,能够从多个层面评价模型的损失,进而使模型的效果更佳。
所述获取单元113获取所述交通信号灯识别模型的目标anchor box。
其中,所述目标anchor box的数量为所述至少一种尺度的倍数,以确保每种尺度的目标特征图能够得到相同的目标anchor box。
识别单元114利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标。
通过上述实施方式,能够在输出的每个目标特征图对应的目标anchor box坐标中获取到得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标,以分值进行进一步筛选再次提高了识别的准确度。
映射单元115将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
在本实施例中,所述映射单元115将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果包括:
确定偏移量;
根据所述偏移量转换所述位置坐标,得到转换坐标;
确定所述待识别图像的第一尺度,及确定所述位置坐标对应的目标特征图的第二尺度;
计算所述第一尺度与所述第二尺度的商作为系数;
将所述系数与所述位置坐标相乘,得到所述位置坐标在所述待识别图像上的对应位置,得到所述待识别图像的识别结果。
通过上述实施方式,相当于将识别到的交通信号灯位置映射在原始图像上,便于用户查看识别结果。
进一步地,所述确定单元119响应于接收到的检测指令,确定与所述检测指令对应的终端;
发送单元121将所述识别结果发送至所述终端。
在将所述识别结果发送至所述终端后,可以利用所述识别结果辅助进行交通信号灯是否损坏,以及是否有闯红灯行为等的检测。
需要说明的是,在本实施例中,为了确保数据的安全性及提高隐私性,将所述识别结果及所述交通信号灯识别模型存储至区块链。
由以上技术方案可以看出,本发明能够响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像,利用darknet53网络提取所述目标图像的目标特征信息,并将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到,基于Mixup算法及残差注意力网络能够更加精准地提取信号灯的细节特征,从而提高交通信号灯检测的召回率和准确率,获取所述交通信号灯识别模型的目标anchor box,并利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标,将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,进而基于人工智能手段实现对交通信号灯的自动识别,识别的准确率更高。
如图3所示,是本发明实现基于人工智能的交通信号灯识别方法的较佳实施例的电子设备的结构示意图。
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于人工智能的交通信号灯识别程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,所述电子设备1既可以是总线型结构,也可以是星形结构,所述电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(Secure Digital, SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的交通信号灯识别程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的交通信号灯识别程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的交通信号灯识别方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成处理单元110、提取单元111、输入单元112、获取单元113、识别单元114、映射单元115、运算单元116、合成单元117、拼接单元118、确定单元119、训练单元120、发送单元121。
或者,所述处理器13执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如:
响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
利用darknet53网络提取所述目标图像的目标特征信息;
将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到;
获取所述交通信号灯识别模型的目标anchor box;
利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述基于人工智能的交通信号灯识别方法的部分。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述电子设备1中的所述存储器12存储多个指令以实现一种基于人工智能的交通信号灯识别方法,所述处理器13可执行所述多个指令从而实现:
响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
利用darknet53网络提取所述目标图像的目标特征信息;
将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到;
获取所述交通信号灯识别模型的目标anchor box;
利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种基于人工智能的交通信号灯识别方法,其特征在于,所述基于人工智能的交通信号灯识别方法包括:
响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
利用darknet53网络提取所述目标图像的目标特征信息;
将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到,其中,在将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图之前,还包括:获取训练样本;对所述训练样本以预设数量为一组进行组合运算,得到至少一组训练数据;将每组训练数据采用Mixup算法进行合成,得到与每组训练数据对应的合成图像;利用darknet53网络提取每张合成图像的特征信息;获取所述darknet53网络中至少一种尺度的残差块;基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果;对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图;获取预先聚类得到的anchor box;利用所述anchorbox在每个特征图上进行识别,输出与每个特征图对应的anchor box坐标及每个anchorbox坐标的得分;获取每张合成图像的至少一种尺度的特征图中得分最高的anchor box坐标作为每张合成图像的预测坐标;确定每张合成图像的实际坐标;基于每张合成图像的实际坐标及每张合成图像的预测坐标计算准确率及召回率;计算损失函数的值;当所述准确率达到预设准确率、所述召回率达到预设召回率、所述损失函数的值低于预设损失时,停止训练,得到所述交通信号灯识别模型,并将所述交通信号灯识别模型存储于区块链上;
获取所述交通信号灯识别模型的目标anchor box;
利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果,并将所述识别结果存储于区块链上。
2.如权利要求1所述的基于人工智能的交通信号灯识别方法,其特征在于,所述基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果包括:
获取所述darknet53网络的多个层中具有相同尺度的多个特征信息;
对于每种尺度的多个特征信息,对每个特征信息进行压缩变换,得到多个压缩数据;
基于对应尺度的残差块对所述多个压缩数据进行squeeze处理,得到多个处理结果;
采用attention算法计算每个处理结果的得分;
将得分最高的处理结果确定为所述拼接结果。
3.如权利要求1所述的基于人工智能的交通信号灯识别方法,其特征在于,所述对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图包括:
将所述拼接结果依次输入至conv_layer层、conv_block层及conv层进行卷积运算,输出每张合成图像的至少一种尺度的特征图。
4.如权利要求1所述的基于人工智能的交通信号灯识别方法,其特征在于,所述基于人工智能的交通信号灯识别方法还包括:
确定每个特征图对应的anchor box的中心点坐标、每个特征图对应的anchor box的宽高坐标,及每个anchor box坐标的得分;
根据每个特征图对应的anchor box的中心点坐标计算中心点坐标误差;
根据每个特征图对应的anchor box的宽高坐标计算宽高坐标误差;
根据每个anchor box坐标的得分计算目标误差;
计算所述中心点坐标误差、所述宽高坐标误差及所述目标误差的和作为所述损失函数。
5.如权利要求1所述的基于人工智能的交通信号灯识别方法,其特征在于,所述将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果包括:
确定偏移量;
根据所述偏移量转换所述位置坐标,得到转换坐标;
确定所述待识别图像的第一尺度,及确定所述位置坐标对应的目标特征图的第二尺度;
计算所述第一尺度与所述第二尺度的商作为系数;
将所述系数与所述位置坐标相乘,得到所述位置坐标在所述待识别图像上的对应位置,得到所述待识别图像的识别结果。
6.如权利要求1所述的基于人工智能的交通信号灯识别方法,其特征在于,所述基于人工智能的交通信号灯识别方法还包括:
响应于接收到的检测指令,确定与所述检测指令对应的终端;
将所述识别结果发送至所述终端。
7.一种基于人工智能的交通信号灯识别装置,其特征在于,所述基于人工智能的交通信号灯识别装置包括:
处理单元,用于响应于接收到的待识别图像,对所述待识别图像进行resize处理,得到目标图像;
提取单元,用于利用darknet53网络提取所述目标图像的目标特征信息;
输入单元,用于将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图,其中,所述交通信号灯识别模型采用Mixup算法及残差注意力网络训练而得到,其中,在将所述目标特征信息输入至预先训练的交通信号灯识别模型,输出至少一种尺度的目标特征图之前,还包括:获取训练样本;对所述训练样本以预设数量为一组进行组合运算,得到至少一组训练数据;将每组训练数据采用Mixup算法进行合成,得到与每组训练数据对应的合成图像;利用darknet53网络提取每张合成图像的特征信息;获取所述darknet53网络中至少一种尺度的残差块;基于残差注意力网络对每张合成图像的特征信息与对应尺度的残差块进行拼接,得到拼接结果;对所述拼接结果进行卷积运算,得到每张合成图像的至少一种尺度的特征图;获取预先聚类得到的anchor box;利用所述anchor box在每个特征图上进行识别,输出与每个特征图对应的anchor box坐标及每个anchor box坐标的得分;获取每张合成图像的至少一种尺度的特征图中得分最高的anchorbox坐标作为每张合成图像的预测坐标;确定每张合成图像的实际坐标;基于每张合成图像的实际坐标及每张合成图像的预测坐标计算准确率及召回率;计算损失函数的值;当所述准确率达到预设准确率、所述召回率达到预设召回率、所述损失函数的值低于预设损失时,停止训练,得到所述交通信号灯识别模型,并将所述交通信号灯识别模型存储于区块链上;
获取单元,用于获取所述交通信号灯识别模型的目标anchor box;
识别单元,用于利用所述目标anchor box在每个目标特征图上进行识别,输出与每个目标特征图对应的目标anchor box坐标及每个目标anchor box坐标的目标得分,将所述目标得分最高的目标anchor box坐标作为预测的交通信号灯的位置坐标;
映射单元,用于将所述预测的交通信号灯的位置坐标映射到所述待识别图像上,得到所述待识别图像的识别结果。
8.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至6中任意一项所述的基于人工智能的交通信号灯识别方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至6中任意一项所述的基于人工智能的交通信号灯识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010695795.8A CN111738212B (zh) | 2020-07-20 | 2020-07-20 | 基于人工智能的交通信号灯识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010695795.8A CN111738212B (zh) | 2020-07-20 | 2020-07-20 | 基于人工智能的交通信号灯识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111738212A CN111738212A (zh) | 2020-10-02 |
CN111738212B true CN111738212B (zh) | 2020-11-20 |
Family
ID=72654978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010695795.8A Active CN111738212B (zh) | 2020-07-20 | 2020-07-20 | 基于人工智能的交通信号灯识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111738212B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132032B (zh) * | 2020-09-23 | 2024-07-12 | 平安国际智慧城市科技股份有限公司 | 交通标志牌检测方法、装置、电子设备及存储介质 |
CN112418278A (zh) * | 2020-11-05 | 2021-02-26 | 中保车服科技服务股份有限公司 | 一种多类物体检测方法、终端设备及存储介质 |
CN112560708A (zh) * | 2020-12-18 | 2021-03-26 | 深圳赛安特技术服务有限公司 | 基于兴趣区域路标识别方法、装置及存储介质 |
CN112488083B (zh) * | 2020-12-24 | 2024-04-05 | 杭州电子科技大学 | 基于heatmap提取关键点的交通信号灯的识别方法、装置、介质 |
CN115546755A (zh) * | 2021-06-30 | 2022-12-30 | 上海商汤临港智能科技有限公司 | 交通标识的识别方法、装置、电子设备及存储介质 |
CN114630396A (zh) * | 2021-12-31 | 2022-06-14 | 厦门阳光恩耐照明有限公司 | 一种基于图像识别的智能灯蓝牙配置方法和配置系统 |
CN115457409A (zh) * | 2022-08-01 | 2022-12-09 | 佛山中科云图智能科技有限公司 | 基于红外图像的非法船只的检测方法、装置以及设备 |
CN115909284A (zh) * | 2022-12-27 | 2023-04-04 | 北京百度网讯科技有限公司 | 获取目标交通信号灯三维属性的方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650641A (zh) * | 2016-12-05 | 2017-05-10 | 北京文安智能技术股份有限公司 | 一种交通信号灯定位识别方法、装置及系统 |
CN108108761A (zh) * | 2017-12-21 | 2018-06-01 | 西北工业大学 | 一种基于深度特征学习的快速交通信号灯检测方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
CN109508580A (zh) * | 2017-09-15 | 2019-03-22 | 百度在线网络技术(北京)有限公司 | 交通信号灯识别方法和装置 |
CN109657622A (zh) * | 2018-12-21 | 2019-04-19 | 广东工业大学 | 一种交通信号灯的检测与识别方法、装置及设备 |
CN109740662A (zh) * | 2018-12-28 | 2019-05-10 | 成都思晗科技股份有限公司 | 基于yolo框架的图像目标检测方法 |
CN110197152A (zh) * | 2019-05-28 | 2019-09-03 | 南京邮电大学 | 一种用于自动驾驶系统的道路目标识别方法 |
CN110472467A (zh) * | 2019-04-08 | 2019-11-19 | 江西理工大学 | 基于YOLO v3的针对交通枢纽关键物体的检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069986B (zh) * | 2019-03-13 | 2021-11-02 | 北京联合大学 | 一种基于混合模型的交通信号灯识别方法及系统 |
CN110210621B (zh) * | 2019-06-06 | 2022-09-20 | 大连理工大学 | 一种基于残差网络改进的目标检测方法 |
CN110852347B (zh) * | 2019-10-17 | 2023-07-18 | 天津大学 | 采用改进YOLO v3的火灾检测方法 |
CN111310861B (zh) * | 2020-03-27 | 2023-05-23 | 西安电子科技大学 | 一种基于深度神经网络的车牌识别和定位方法 |
-
2020
- 2020-07-20 CN CN202010695795.8A patent/CN111738212B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650641A (zh) * | 2016-12-05 | 2017-05-10 | 北京文安智能技术股份有限公司 | 一种交通信号灯定位识别方法、装置及系统 |
CN109508580A (zh) * | 2017-09-15 | 2019-03-22 | 百度在线网络技术(北京)有限公司 | 交通信号灯识别方法和装置 |
CN108108761A (zh) * | 2017-12-21 | 2018-06-01 | 西北工业大学 | 一种基于深度特征学习的快速交通信号灯检测方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
CN109657622A (zh) * | 2018-12-21 | 2019-04-19 | 广东工业大学 | 一种交通信号灯的检测与识别方法、装置及设备 |
CN109740662A (zh) * | 2018-12-28 | 2019-05-10 | 成都思晗科技股份有限公司 | 基于yolo框架的图像目标检测方法 |
CN110472467A (zh) * | 2019-04-08 | 2019-11-19 | 江西理工大学 | 基于YOLO v3的针对交通枢纽关键物体的检测方法 |
CN110197152A (zh) * | 2019-05-28 | 2019-09-03 | 南京邮电大学 | 一种用于自动驾驶系统的道路目标识别方法 |
Non-Patent Citations (1)
Title |
---|
"Real-Time Detection Method for Small Traffic Signs Based on Yolov3";HUIBING ZHANG 等;《IEEE ACCESS》;20200331;第8卷;第64145-64156页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111738212A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738212B (zh) | 基于人工智能的交通信号灯识别方法、装置、设备及介质 | |
CN111476324B (zh) | 基于人工智能的交通数据标注方法、装置、设备及介质 | |
CN111932564B (zh) | 图片识别方法、装置、电子设备及计算机可读存储介质 | |
CN111476225B (zh) | 基于人工智能的车内人脸识别方法、装置、设备及介质 | |
CN112052850A (zh) | 车牌识别方法、装置、电子设备及存储介质 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN112396005A (zh) | 生物特征图像识别方法、装置、电子设备及可读存储介质 | |
CN112231586A (zh) | 基于迁移学习的课程推荐方法、装置、设备及介质 | |
CN112507934A (zh) | 活体检测方法、装置、电子设备及存储介质 | |
CN113705462A (zh) | 人脸识别方法、装置、电子设备及计算机可读存储介质 | |
CN111931729B (zh) | 基于人工智能的行人检测方法、装置、设备及介质 | |
CN112132037B (zh) | 基于人工智能的人行道检测方法、装置、设备及介质 | |
CN112329777B (zh) | 基于方向检测的文字识别方法、装置、设备及介质 | |
CN111950621A (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN115063589A (zh) | 基于知识蒸馏的车辆部件分割方法及相关设备 | |
CN112749653A (zh) | 行人检测方法、装置、电子设备及存储介质 | |
CN114913518A (zh) | 基于图像处理的车牌识别方法、装置、设备及介质 | |
CN111932413B (zh) | 案件要素提取方法、装置、设备及介质 | |
CN111652226B (zh) | 基于图片的目标识别方法、装置及可读存储介质 | |
CN111985545A (zh) | 基于人工智能的目标数据检测方法、装置、设备及介质 | |
CN111488876B (zh) | 基于人工智能的车牌识别方法、装置、设备及介质 | |
CN112115890B (zh) | 基于人工智能的酒驾识别方法、装置、设备及介质 | |
CN112017763B (zh) | 医疗影像数据传输方法、装置、设备及介质 | |
CN112132140B (zh) | 基于人工智能的车品牌识别方法、装置、设备及介质 | |
CN113536782A (zh) | 敏感词识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |