[go: up one dir, main page]

CN111104893B - 目标检测方法、装置、计算机设备及存储介质 - Google Patents

目标检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111104893B
CN111104893B CN201911304904.2A CN201911304904A CN111104893B CN 111104893 B CN111104893 B CN 111104893B CN 201911304904 A CN201911304904 A CN 201911304904A CN 111104893 B CN111104893 B CN 111104893B
Authority
CN
China
Prior art keywords
target
target object
image
parallax
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911304904.2A
Other languages
English (en)
Other versions
CN111104893A (zh
Inventor
崔迪潇
江志浩
徐生良
陈安
龚伟林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhijia Usa
Suzhou Zhijia Technology Co Ltd
Original Assignee
Zhijia Usa
Suzhou Zhijia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhijia Usa, Suzhou Zhijia Technology Co Ltd filed Critical Zhijia Usa
Priority to CN201911304904.2A priority Critical patent/CN111104893B/zh
Publication of CN111104893A publication Critical patent/CN111104893A/zh
Application granted granted Critical
Publication of CN111104893B publication Critical patent/CN111104893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种目标检测方法、装置、计算机设备及存储介质,属于自动驾驶技术领域。本发明实施例通过确定车辆环境图像中的目标区域和道路区域,并对所述目标区域进行对象分割,从而得到包括有目标对象的对象类别和初始轮廓的目标语义信息,从多个角度实现对目标对象的全面描述,然后根据视差图像和目标语义信息,进一步精确定位目标对象的轮廓,大大提高了轮廓的精确度,最终根据道路区域和精确定位的轮廓,准确的确定出目标对象的空间位置,由于能够基于目标语义信息来描述对目标对象,并基于高精确度的轮廓定位目标对象的空间位置,从而提高了目标检测的准确性。

Description

目标检测方法、装置、计算机设备及存储介质
技术领域
本发明涉及自动驾驶技术领域,特别涉及一种目标检测方法、装置、计算机设备及存储介质。
背景技术
自动驾驶技术是代替人类来感知车辆周围环境、进行驾驶决策规划并自动执行驾驶操作的技术。车辆自动驾驶过程中,需要实时基于周围环境的图像、点云数据等,对周围环境中的车辆、障碍物等进行检测,以保证车辆安全行驶。
相关技术中,目标检测过程可以包括:车载终端获取周围环境的图像,并在图像中采用2D检测框,例如,矩形框,对图像中的目标物进行标注,例如,车辆、交通指示牌、行人等;并结合周围环境的激光点云数据中目标物的立体形状,确定出该目标物体在车辆坐标系的位置坐标,从而将周围的物体一一投影在车辆坐标系中。
上述目标检测过程中,采用2D检测框标注目标物体以得到目标物体的位置,然而,2D检测框只能粗略估计目标物体的大致位置,使得最终的检测结果不准确,从而导致上述目标检测过程的准确性较差。
发明内容
本发明实施例提供了一种目标检测方法、装置、计算机设备及存储介质,能够解决相关技术中目标检测过程的准确性较差问题。所述技术方案如下:
一方面,提供了一种目标检测方法,所述方法包括:
在车辆行驶过程中,基于车辆环境图像的视差图像,确定所述车辆环境图像中的目标区域和道路区域,所述目标区域内包括目标对象;
对所述目标区域进行对象分割,得到目标对象的目标语义信息,所述目标语义信息包括所述目标对象的对象类别和所述目标对象的初始轮廓;
根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓;
根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置。
在一种可能实现方式中,所述根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓包括:
基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整;
基于调整后的初始轮廓和图像采集设备的标定参数,构建所述目标对象的三维立体模型,所述图像采集设备用于采集所述车辆环境图像;
根据所述目标对象的三维立体模型的深度,对所述三维立体模型在水平面的投影区域进行调整,得到所述目标对象在所述水平面的轮廓。
在一种可能实现方式中,所述基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整包括:
在所述视差图像中确定出所述目标对象的初始轮廓对应的多个边界像素点;
根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整。
在一种可能实现方式中,所述根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整包括:
当所述边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留所述边界像素点;
当所述边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将所述边界像素点替换为所述多个邻域像素点中满足所述目标突变条件的像素点。
在一种可能实现方式中,所述在车辆行驶过程中,基于车辆环境图像的视差图像,确定所述车辆环境图像中的目标区域和道路区域包括:
在所述车辆行驶过程中,基于至少两帧车辆环境图像,确定所述车辆环境图像的视差图像;
对所述视差图像沿所述视差图像的图像坐标系的纵坐标进行投影,确定所述车辆环境图像的纵向视差图像,所述纵向视差图像中像素点的灰度值用于指示所述视差图像中每行像素点的视差分布;
根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域和道路区域。
在一种可能实现方式中,所述根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域和道路区域包括:
根据所述纵向视差图像中每个像素点的灰度值,在所述纵向视差图像的图像坐标系中确定路面直线;
基于所述路面直线和所述视差图像中像素点的视差值,确定所述车辆环境图像中的道路区域;
根据所述纵向视差图像中每列像素点的灰度值,确定所述车辆环境图像中目标区域的视差值;
在所述纵向视差图像中,根据所述目标区域的视差值,在所述道路区域上方确定所述目标区域的纵向坐标范围;
根据所述纵向坐标范围和所述目标区域的视差值,在所述视差图像中确定出所述目标区域的横向坐标范围。
在一种可能实现方式中,所述对所述目标区域进行对象分割,得到目标对象的目标语义信息包括:
识别出所述目标区域内至少一个目标对象的在所述目标区域的对象区域;
根据所述对象区域内多个像素点的像素值,确定每个目标对象的对象类别和所述每个目标对象的初始轮廓。
在一种可能实现方式中,所述根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置包括:
基于所述目标对象的轮廓,确定所述目标对象在水平面的最小外接矩形;
基于所述最小外接矩形在车辆坐标系的位置坐标,确定所述目标对象的平面大小;
基于所述道路区域的路面高度,确定所述目标对象在所述路面上的相对高度。
另一方面,提供了一种目标检测装置,所述装置包括:
确定模块,用于在车辆行驶过程中,基于车辆环境图像的视差图像,确定所述车辆环境图像中的目标区域和道路区域,所述目标区域内包括目标对象;
分割模块,用于对所述目标区域进行对象分割,得到目标对象的目标语义信息,所述目标语义信息包括所述目标对象的对象类别和所述目标对象的初始轮廓;
所述确定模块,还用于根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓;
所述确定模块,还用于根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置。
在一种可能实现方式中,所述确定模块,还用于基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整;基于调整后的初始轮廓和图像采集设备的标定参数,构建所述目标对象的三维立体模型,所述图像采集设备用于采集所述车辆环境图像;根据所述目标对象的三维立体模型的深度,对所述三维立体模型在水平面的投影区域进行调整,得到所述目标对象在所述水平面的轮廓。
在一种可能实现方式中,所述确定模块,还用于在所述视差图像中确定出所述目标对象的初始轮廓对应的多个边界像素点;根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整。
在一种可能实现方式中,所述确定模块,还用于当所述边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留所述边界像素点;当所述边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将所述边界像素点替换为所述多个邻域像素点中满足所述目标突变条件的像素点。
在一种可能实现方式中,所述确定模块,还用于在所述车辆行驶过程中,基于至少两帧车辆环境图像,确定所述车辆环境图像的视差图像;对所述视差图像沿所述视差图像的图像坐标系的纵坐标进行投影,确定所述车辆环境图像的纵向视差图像,所述纵向视差图像中像素点的灰度值用于指示所述视差图像中每行像素点的视差分布;根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域和道路区域。
在一种可能实现方式中,所述确定模块,还用于根据所述纵向视差图像中每个像素点的灰度值,在所述纵向视差图像的图像坐标系中确定路面直线;基于所述路面直线和所述视差图像中像素点的视差值,确定所述车辆环境图像中的道路区域;根据所述纵向视差图像中每列像素点的灰度值,确定所述车辆环境图像中目标区域的视差值;在所述纵向视差图像中,根据所述目标区域的视差值,在所述道路区域上方确定所述目标区域的纵向坐标范围;根据所述纵向坐标范围和所述目标区域的视差值,在所述视差图像中确定出所述目标区域的横向坐标范围。
在一种可能实现方式中,所述分割模块,还用于识别出所述目标区域内至少一个目标对象的在所述目标区域的对象区域;根据所述对象区域内多个像素点的像素值,确定每个目标对象的对象类别和所述每个目标对象的初始轮廓。
在一种可能实现方式中,所述确定模块,还用于基于所述目标对象的轮廓,确定所述目标对象在水平面的最小外接矩形;基于所述最小外接矩形在车辆坐标系的位置坐标,确定所述目标对象的平面大小;基于所述道路区域的路面高度,确定所述目标对象在所述路面上的相对高度。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上述的目标检测方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如上述的目标检测方法所执行的操作。
本发明实施例提供的技术方案带来的有益效果是:
通过确定车辆环境图像中的目标区域和道路区域,并对所述目标区域进行对象分割,从而得到包括有目标对象的对象类别和初始轮廓的目标语义信息,从多个角度实现对目标对象的全面描述,然后根据视差图像和目标语义信息,进一步精确定位目标对象的轮廓,大大提高了轮廓的精确度,最终根据道路区域和精确定位的轮廓,准确的确定出目标对象的空间位置,由于能够基于目标语义信息来描述对目标对象,并基于高精确度的轮廓定位目标对象的空间位置,从而提高了目标检测的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种目标检测方法的流程图;
图2是本发明实施例提供的一种目标检测方法的流程图;
图3是本发明实施例提供的一种目标检测框架示意图;
图4是本发明实施例提供的一种目标检测流程示意图;
图5是本发明实施例提供的一种目标检测装置的结构示意图;
图6是本发明实施例提供的一种终端的结构示意图;
图7是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种目标检测方法的流程图。该发明实施例的执行主体为计算机设备,例如,该计算机设备服务器或终端。参见图1,该方法包括:
101、在车辆行驶过程中,基于车辆环境图像的视差图像,确定该车辆环境图像中的目标区域和道路区域,该目标区域内包括目标对象;
102、对该目标区域进行对象分割,得到目标对象的目标语义信息,该目标语义信息包括该目标对象的对象类别和该目标对象的初始轮廓;
103、根据该视差图像和该目标对象的目标语义信息,确定该目标对象的轮廓;
104、根据该道路区域和该目标对象的轮廓,确定该目标对象在车辆环境中的空间位置。
在一种可能实现方式中,该根据该视差图像和该目标对象的目标语义信息,确定该目标对象的轮廓包括:
基于该目标对象的初始轮廓在该视差图像对应的边界像素点,对该目标对象的初始轮廓进行调整;
基于调整后的初始轮廓和图像采集设备的标定参数,构建该目标对象的三维立体模型,该图像采集设备用于采集该车辆环境图像;
根据该目标对象的三维立体模型的深度,对该三维立体模型在水平面的投影区域进行调整,得到该目标对象在该水平面的轮廓。
在一种可能实现方式中,该基于该目标对象的初始轮廓在该视差图像对应的边界像素点,对该目标对象的初始轮廓进行调整包括:
在该视差图像中确定出该目标对象的初始轮廓对应的多个边界像素点;
根据每个边界像素点的多个邻域像素点的视差值的变化程度,对该目标对象的初始轮廓所对应的多个边界像素点进行调整。
在一种可能实现方式中,该根据每个边界像素点的多个邻域像素点的视差值的变化程度,对该目标对象的初始轮廓所对应的多个边界像素点进行调整包括:
当该边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留该边界像素点;
当该边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将该边界像素点替换为该多个邻域像素点中满足该目标突变条件的像素点。
在一种可能实现方式中,该在车辆行驶过程中,基于车辆环境图像的视差图像,确定该车辆环境图像中的目标区域和道路区域包括:
在该车辆行驶过程中,基于至少两帧车辆环境图像,确定该车辆环境图像的视差图像;
对该视差图像沿该视差图像的图像坐标系的纵坐标进行投影,确定该车辆环境图像的纵向视差图像,该纵向视差图像中像素点的灰度值用于指示该视差图像中每行像素点的视差分布;
根据该纵向视差图像中每个像素点的灰度值以及和该视差图像中每个像素点的视差值,确定该车辆环境图像中的目标区域和道路区域。
在一种可能实现方式中,该根据该纵向视差图像中每个像素点的灰度值以及和该视差图像中每个像素点的视差值,确定该车辆环境图像中的目标区域和道路区域包括:
根据该纵向视差图像中每个像素点的灰度值,在该纵向视差图像的图像坐标系中确定路面直线;
基于该路面直线和该视差图像中像素点的视差值,确定该车辆环境图像中的道路区域;
根据该纵向视差图像中每列像素点的灰度值,确定该车辆环境图像中目标区域的视差值;
在该纵向视差图像中,根据该目标区域的视差值,在该道路区域上方确定该目标区域的纵向坐标范围;
根据该纵向坐标范围和该目标区域的视差值,在该视差图像中确定出该目标区域的横向坐标范围。
在一种可能实现方式中,该对该目标区域进行对象分割,得到目标对象的目标语义信息包括:
识别出该目标区域内至少一个目标对象的在该目标区域的对象区域;
根据该对象区域内多个像素点的像素值,确定每个目标对象的对象类别和该每个目标对象的初始轮廓。
在一种可能实现方式中,该根据该道路区域和该目标对象的轮廓,确定该目标对象在车辆环境中的空间位置包括:
基于该目标对象的轮廓,确定该目标对象在水平面的最小外接矩形;
基于该最小外接矩形在车辆坐标系的位置坐标,确定该目标对象的平面大小;
基于该道路区域的路面高度,确定该目标对象在该路面上的相对高度。
本发明实施例中,通过确定车辆环境图像中的目标区域和道路区域,并对该目标区域进行对象分割,从而得到包括有目标对象的对象类别和初始轮廓的目标语义信息,从多个角度实现对目标对象的全面描述,然后根据视差图像和目标语义信息,进一步精确定位目标对象的轮廓,大大提高了轮廓的精确度,最终根据道路区域和精确定位的轮廓,准确的确定出目标对象的空间位置,由于能够基于目标语义信息来描述对目标对象,并基于高精确度的轮廓定位目标对象的空间位置,从而提高了目标检测的准确性。
图2是本发明实施例提供的一种目标检测方法的流程图。该发明实施例的执行主体为计算机设备,该计算机设备服务器或终端,本发明实施例中仅以终端为例进行说明,例如,该终端可以为车载终端或个人计算机等。参见图2,该方法包括:
201、终端在车辆行驶过程中,基于车辆环境图像的视差图像,确定该车辆环境图像中的目标区域和道路区域。
其中,该目标区域内包括目标对象;本发明实施例中,车辆行驶过程中,该终端可以实时获取车辆周围环境的车辆环境图像,并基于车辆环境图像检测出周围环境中的目标对象,该目标对象可以为具备一定立体形状的任一对象,例如,车辆的相邻车辆、周围的路标、道路两旁的树木、过马路的行人等。
本步骤中,该终端可以先根据两帧车辆环境图像,获取该车辆环境图像的视差图像,该视差图像包括该车辆环境图像中每个像素点的视差值,该终端可以根据该视差图像中像素点的视差值,对车辆环境图像进行分割,得到目标区域和道路区域。在一种可能的实施方式中,本步骤可以包括:终端在该车辆行驶过程中,基于至少两帧车辆环境图像,确定该车辆环境图像的视差图像;终端对该视差图像沿该视差图像的图像坐标系的纵坐标进行投影,确定该车辆环境图像的纵向视差图像,该纵向视差图像中像素点的灰度值用于指示该视差图像中每行像素点的视差分布;终端根据该纵向视差图像中每个像素点的灰度值以及和该视差图像中每个像素点的视差值,确定该车辆环境图像中的目标区域和道路区域。
其中,视差图像中每个像素点的灰度值可以为该像素点的视差值。该视差图像的图像坐标系可以为UOV直角坐标系,其中,U代表坐标系的横轴,V代表坐标系的纵轴,视差图像中坐标(u,v)代表第u列、第v行的像素点,该像素点的灰度值可以为该像素点的视差值d。该终端根据视差图像中每个像素点的视差值,沿V轴纵坐标进行灰度值投影,也即是,视差值投影,得到纵向视差图像,也即是V视差图像。其中,该V视差图像的图像坐标系可以为dOV直角坐标系,其中,d代表坐标系的横轴,V代表坐标系的纵轴,d表示视差值,纵向视差图像中像素点(d1,v)代表第d1列、第v行的像素点,该像素点的灰度值可以表示:视差图像的第v行像素点中,视差值取值为d1的像素点的个数。例如,像素点(2,3)的灰度值为4,则表示视差图像的第3行像素点中,视差值取值为2的像素点的个数位4。
在一种可能的实施方式中,该终端可以根据纵向视差图像中像素点的灰度值变化情况,确定该道路区域,该过程可以包括:终端根据该纵向视差图像中每个像素点的灰度值,在该纵向视差图像的图像坐标系中确定路面直线;终端基于该路面直线和该视差图像中像素点的视差值,确定该车辆环境图像中的道路区域。
在一个可能示例中,该终端可以对纵向视差图进行变换,每行仅保留灰度值最大的点,从而得到二值图像,该终端对该二值图像进行霍夫变换,确定出V视差图的直角坐标系中得到代表路面的直线如下公式一所示:
公式一:f(d)=kd+b;
其中,d代表dOV直角坐标系中横坐标,f(d)代表dOV直角坐标系中纵坐标。
该终端根据该路面直线,对视差图像中每个像素点进行检测,基于以下公式二,确定出视差图像中的道路平面:
公式二:Δ(u,v)=d(u,v)-f(d);
Figure BDA0002322815160000101
其中,d(u,v)表示视差图像中像素点(u,v)的视差值;ε为判定阈值。该终端根据该判定阈值,确定出车辆环境图像中的道路平面,其中,该视差图像中,。对于非路面的点,Δ(u,v)小于判定阈值的像素点为道路平面中的像素点,或者天空等背景。反之,Δ(u,v)小于判定阈值的像素点为非路面的像素点,例如,路面上车辆、指示牌等障碍物上的像素点,从而该终端检测出该车辆环境图像中的道路等可行驶区域。
在一种可能的实施方式中,该终端可以先根据该纵向视差图像中像素点的灰度值变化情况,确定目标区域的视差值和纵向坐标范围,然后在视差图像中确定出目标区域的横向坐标范围,从而得到目标区域,该过程可以包括:该终端根据该纵向视差图像中每列像素点的灰度值,确定该车辆环境图像中目标区域的视差值;该终端在该纵向视差图像中,根据该目标区域的视差值,在该道路区域上方确定该目标区域的纵向坐标范围;该终端根据该纵向坐标范围和该目标区域的视差值,在该视差图像中确定出该目标区域的横向坐标范围。在一个可能示例中,该终端可以对V视差图像中每列所包括的所有像素点的灰度值进行求和,得到列与求和结果的映射关系d~s(d),该终端可以以d为横坐标,s(d)为纵坐标建立直角坐标系,在该直角坐标系中,该终端基于该映射关系,获取该映射关系中的多个极大值点di。由于路面上的车辆、行人等显著障碍物的表面与地面之间近似于垂直于的关系。因此,该目标对象在V视差图中对应的直线也近似与路面直线垂直,所以,该终端可以将极大值点di确定为目标对象在V视差图中对应的横坐标。在V视差图像中,该终端以(di,f(di))为起点,在路面区域的上方区域中,搜索与该路面直线垂直的垂直线段:
Figure BDA0002322815160000111
该垂直线段即为目标对象在V视差图像中对应的像素点,该
Figure BDA0002322815160000112
中两个元素分别为目标对象沿纵向坐标轴的上下边界以及目标对象的平均视差。该终端在V视差图像中确定出目标对象的纵向坐标范围后,该终端则可以在视差图像中,在该纵向坐标范围内沿横向上进行搜索,确定出纵向坐标区间为(vui,vdi)的区域中,视差值满足目标条件的像素点,该目标条件可以为,视差值与极大值点的平均视差值di之间的差值小于目标阈值,从而该终端确定出横向上大部分视差接近di的横向区域,据此分别从横向与纵向确定了目标对象的区域位置。
202、终端对该目标区域进行对象分割,得到目标对象的目标语义信息。
其中,该目标语义信息包括该目标对象的对象类别和该目标对象的初始轮廓;在一种可能的实施方式中,该终端可以先利用目标检测方法获取多个目标对象的大致区域位置,在利用语义分割、实例分割等从多个目标对象的大致区域位置中分割出每个目标对象。该过程可以包括:该终端识别出该目标区域内至少一个目标对象的在该目标区域的对象区域;该终端根据该对象区域内多个像素点的像素值,确定每个目标对象的对象类别和该每个目标对象的初始轮廓。在一种可能示例中,该终端可以利用实例分割算法,实现对象分割。例如,该终端利用MaskR-CNN(MaskRegions with Convolutional NeuralNetworkFeatures,掩膜基于区域的卷积神经网络)算法,对目标区域进行分割。
在一种可能的实施方式中,该终端可以利用实例分割算法,直接对车辆环境图像中的目标区域进行分割,得到该目标对象的目标语义信息。或者,该终端也可以利用实例分割算法,直接对车辆环境图像进行分割,并基于步骤201中得到的目标区域对分割结果进行调整,进一步得到该目标对象的目标语义信息。本发明实施例对此不做具体限定。
需要说明的是,该Mask R-CNN算法基于深度学习,其中主干网络使用的是经典的50层的深度残差网络ResNet50。Mask R-CNN算法可有效检测单张RGB图像中的目标对象并进行实例分割,得到目标对象的类别并进行逐像素点的分割,能够准确、高效的分割出目标对象的初始轮廓以及识别出对象类别,从而基于语义方面更为准确的实现对目标对象的进一步描述,进一步提高了后续确定目标对象轮廓的准确性。
203、终端根据该视差图像和该目标对象的目标语义信息,确定该目标对象的轮廓。
本发明实施例中,该终端可以基于目标对象的三维立体模型在水平面的投影,进一步优化出更为精确的目标对象的轮廓。本步骤可以通过以下步骤2031-2033实现。
2031、该终端基于该目标对象的初始轮廓在该视差图像对应的边界像素点,对该目标对象的初始轮廓进行调整。
在一种可能的实施方式中,由于在视差图像中从目标对象的轮廓边缘内部到轮廓边缘外部,像素点的视差值变化较大,该终端可以根据该初始轮廓在视差图像中对应边界像素点的视差变化情况,对初始轮廓进行修正。该过程可以包括:该终端可以在该视差图像中确定出该目标对象的初始轮廓对应的多个边界像素点;该终端可以根据每个边界像素点的多个邻域像素点的视差值的变化程度,对该目标对象的初始轮廓所对应的多个边界像素点进行调整。其中,当该边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,该终端可以保留该边界像素点;当该边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,该终端可以将该边界像素点替换为该多个邻域像素点中满足该目标突变条件的像素点。该目标突变条件可以为该多个邻域像素点的最大视差值与最小视差值之间的差大于目标阈值。
需要说明的是,该终端可以根据车辆环境图像中的初始轮廓的像素点的位置,在视差图像中定位出该初始轮廓,从而将对象分割出来的不同对象类别的轮廓单独提取出来做进一步优化,具体的,该终端基于该目标突变条件,在分割的每个边界像素点的邻域内进行搜索,以定位出邻域内视差值发生突变的像素点作为目标对象的边界像素点,从而进一步精确的修正了目标对象的轮廓,提高了初始轮廓的准确性和精确度。
2032、该终端基于调整后的初始轮廓和图像采集设备的标定参数,构建该目标对象的三维立体模型。
其中,该图像采集设备用于采集该车辆环境图像。
该终端可以构建出目标对象在三维的车辆坐标系中的对应的点集。其中,该车辆坐标系可以为XYZ空间直角坐标系,其中,X轴正方向可以为与车辆行驶方向垂直的水平向右的方向,Y轴正方向可以为车辆行驶方向,Z轴正方向可以为垂直水平面向上的方向。该终端根据调整后的初始轮廓得到目标对象在车辆环境图像的区域位置,基于该区域位置中像素点对应的视差值和相机标定参数,求解该目标对象在该车辆坐标系中的三维空间坐标,从而构建出模拟目标对象的空间模型。
在一个可能示例中,该终端还可以基于该道路平面的视差,确定该道路平面在三维空间的位置。例如,该终端可以根据该道路平面中每个像素点的视差值和相机标定参数,确定道路平面中每个像素点在三维的车辆坐标系的三维空间坐标,进一步的,该终端还可以基于该道路区域在三维的车辆坐标系对应的三维空间坐标,确定该道路区域的路面高度。
2033、该终端根据该目标对象的三维立体模型的深度,对该三维立体模型在水平面的投影区域进行调整,得到该目标对象在该水平面的轮廓。
该投影区域可以为终端在水平面,也即是XOY平面上对该三维立体模型进行投影的区域。该三维立体模型的深度是指该三维立体模型在沿车辆行驶方向上的长度,也即是,该三维立体模型在Y轴方向上的长度。在视差图像中,目标对象的轮廓边界处和背景、路面之间的像素点的像素值可能有混淆。本步骤中,该终端还可以在Y轴方向上,对目标对象的轮廓进一步优化。
在一种可能的实施方式中,该终端可以基于目标对象在Y轴方向的坐标,找出目标对象的轮廓与周围环境之间可能混淆的像素点。在一个可能示例中,该终端根据该目标对象所包括的多个像素点在Y轴方向的Y坐标,确定该多个Y坐标的平均坐标值,该终端根据该平均坐标值,保留该多个像素点中Y坐标属于目标范围内的多个目标像素点,例如,该终端可以只保留Y坐标属于区间[m-3σ,m+3σ]内的像素点。其中,m表示多个像素点在Y轴方向的Y坐标的平均坐标值,σ是多个像素点在Y轴方向的Y坐标的标准差。然后,该终端将多个目标像素点和该多个目标像素点所在区域转化为0-1矩阵,利用目标卷积核,对矩阵进行卷积操作,例如,该目标卷积核可以为一定大小的全“1”卷积核,则该终端可以仅保留卷积前是“1”而卷积后大于目标阈值的目标像素点的坐标,然后,该终端对该矩阵进行转换,将该矩阵中多个目标像素点转化到投影后的XOY平面上的点集,从而进一步对投影区域进行修正。
需要说明的是,该终端可以利用Y轴方向的Y坐标,对目标对象的轮廓与周围环境之间可能混淆的像素点进行修正,通过目标范围的Y坐标筛选过程和卷积过程,将目标对象的点云中表现为孤立的离群的异常点删除,从而进一步沿Y轴方向对目标对象的轮廓进行优化,提高了目标检测的准确性。
204、终端根据该道路区域和该目标对象的轮廓,确定该目标对象在车辆环境中的空间位置。
本步骤中,该终端可以基于路面的高度,确定出目标对象在周围环境中相对于路面的位置,例如,高出前方路面3米,从而更直接的给出该目标对象的有效空间位置。该终端可以基于该目标对象的轮廓,确定该目标对象在水平面的最小外接矩形;该终端基于该最小外接矩形在车辆坐标系的位置坐标,确定该目标对象的平面大小;该终端基于该道路区域的路面高度,确定该目标对象在该路面上的相对高度。其中,该终端确定目标对象的最小外接矩形时,该终端可以将目标对象的所有像素点都包括在最小外接矩形的内部,将该包括有所有像素点的最小的矩形作为该目标对象的检测边框,从而确定出该目标对象在水平面上的二维平面位置。并且,该终端确定出该最小外接矩形后,还可以基于目标对象在真实物理世界的实际尺寸,对该最小外接矩形的大小做进一步调整。另外,该终端可以根据该目标对象在垂直方向上的高度以及路面高度,例如,该终端可以根据该目标对象在Z轴方向上的最大坐标值和最小坐标值,确定出该目标对象的高度,并根据路面在Z轴方向上的高度坐标,确定出该目标对象相对于路面的相对高度。该终端还可以根据该相对高度、最小外接矩形,确定出该目标对象在车辆坐标系中精准的三维空间坐标,进一步的,该终端还可以基于该三维空间坐标,将目标对象投影到二维平面上,例如,投影到二维水平面上,当然,该终端也可以将该二维水平面上的精准投影展示在车辆的车载终端屏幕上,以便于用户浏览,例如,方便了车辆自动驾驶测试过程中测试人员的校验。
例如,以目标对象为本车辆的相邻车辆为例进行说明,该终端找到相邻车辆在视差图像中对应的像素点,结合相机标定参数计算出像素点在车辆坐标系中的对应三维坐标点,然后在XOY平面上投影代表相邻车辆的三维坐标点。一般来说,该终端可以基于投影区域中的分布得到相邻车辆的位置与朝向。然后终端经过Y轴方向上对目标对象的投影区域进一步优化,去除孤立点后,检测该投影区域的最小外接矩形,得到相邻车辆在地面上的位置。该终端根据相邻车辆在车辆坐标系中Z轴方向上的最大坐标值和最小坐标值,以及路面高度,确定出相邻车辆相对于路面的高度。
为了更清晰的对本发明实施例的流程进行说明,下面以图3所示的框架图和图4所示的目标检测流程图,对上述步骤201-204的整体流程进行介绍。如图3所示,该终端可以配置有道路区域和目标区域的粗分割模块,用于根据V视差图像,分割出车辆环境图像中的目标区域和道路区域,实现不同功能区域的粗略分割;该终端还可以配置有融合语义信息的三维目标检测模块,该三维模块检测模块用于对车辆环境图像进行语义实例分割,并基于分割得到的初始轮廓进行进一步修正、优化。如图4所示,该终端获取视差图像,对目标区域进行对象分割后得到的目标语义信息,基于视差图像和目标语义信息,对初始轮廓进行修正,并基于相机内外参数和修正后的初始轮廓,构建目标对象的三维立体模型,将三维立体模型投影到水平面后,再次基于Y轴方向的Y坐标,对投影区域进行去除异常点的优化过程,从而得到精确度更高的轮廓。该终端确定目标对象的最小外接矩形,并基于实际尺寸调整外接矩形的长、宽后,该终端基于路面高度和该水平面上的精准投影,确定出目标对象在车辆坐标系的准确三维空间坐标,当然,该终端还可以进一步对该目标对象进行二维投影。
本发明实施例提供的方法,通过确定车辆环境图像中的目标区域和道路区域,并对该目标区域进行对象分割,从而得到包括有目标对象的对象类别和初始轮廓的目标语义信息,从多个角度实现对目标对象的全面描述,然后根据视差图像和目标语义信息,进一步精确定位目标对象的轮廓,大大提高了轮廓的精确度,最终根据道路区域和精确定位的轮廓,准确的确定出目标对象的空间位置,由于能够基于目标语义信息来描述对目标对象,并基于高精确度的轮廓定位目标对象的空间位置,从而提高了目标检测的准确性。
图5是本发明实施例提供的一种目标检测装置的结构示意图。参见图5,该装置包括:
确定模块501,用于在车辆行驶过程中,基于车辆环境图像的视差图像,确定该车辆环境图像中的目标区域和道路区域,该目标区域内包括目标对象;
分割模块502,用于对该目标区域进行对象分割,得到目标对象的目标语义信息,该目标语义信息包括该目标对象的对象类别和该目标对象的初始轮廓;
该确定模块501,还用于根据该视差图像和该目标对象的目标语义信息,确定该目标对象的轮廓;
该确定模块501,还用于根据该道路区域和该目标对象的轮廓,确定该目标对象在车辆环境中的空间位置。
在一种可能实现方式中,该确定模块501,还用于基于该目标对象的初始轮廓在该视差图像对应的边界像素点,对该目标对象的初始轮廓进行调整;基于调整后的初始轮廓和图像采集设备的标定参数,构建该目标对象的三维立体模型,该图像采集设备用于采集该车辆环境图像;根据该目标对象的三维立体模型的深度,对该三维立体模型在水平面的投影区域进行调整,得到该目标对象在该水平面的轮廓。
在一种可能实现方式中,该确定模块501,还用于在该视差图像中确定出该目标对象的初始轮廓对应的多个边界像素点;根据每个边界像素点的多个邻域像素点的视差值的变化程度,对该目标对象的初始轮廓所对应的多个边界像素点进行调整。
在一种可能实现方式中,该确定模块501,还用于当该边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留该边界像素点;当该边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将该边界像素点替换为该多个邻域像素点中满足该目标突变条件的像素点。
在一种可能实现方式中,该确定模块501,还用于在该车辆行驶过程中,基于至少两帧车辆环境图像,确定该车辆环境图像的视差图像;对该视差图像沿该视差图像的图像坐标系的纵坐标进行投影,确定该车辆环境图像的纵向视差图像,该纵向视差图像中像素点的灰度值用于指示该视差图像中每行像素点的视差分布;根据该纵向视差图像中每个像素点的灰度值以及和该视差图像中每个像素点的视差值,确定该车辆环境图像中的目标区域和道路区域。
在一种可能实现方式中,该确定模块501,还用于根据该纵向视差图像中每个像素点的灰度值,在该纵向视差图像的图像坐标系中确定路面直线;基于该路面直线和该视差图像中像素点的视差值,确定该车辆环境图像中的道路区域;根据该纵向视差图像中每列像素点的灰度值,确定该车辆环境图像中目标区域的视差值;在该纵向视差图像中,根据该目标区域的视差值,在该道路区域上方确定该目标区域的纵向坐标范围;根据该纵向坐标范围和该目标区域的视差值,在该视差图像中确定出该目标区域的横向坐标范围。
在一种可能实现方式中,该分割模块502,还用于识别出该目标区域内至少一个目标对象的在该目标区域的对象区域;根据该对象区域内多个像素点的像素值,确定每个目标对象的对象类别和该每个目标对象的初始轮廓。
在一种可能实现方式中,该确定模块501,还用于基于该目标对象的轮廓,确定该目标对象在水平面的最小外接矩形;基于该最小外接矩形在车辆坐标系的位置坐标,确定该目标对象的平面大小;基于该道路区域的路面高度,确定该目标对象在该路面上的相对高度。
本发明实施例中,通过确定车辆环境图像中的目标区域和道路区域,并对该目标区域进行对象分割,从而得到包括有目标对象的对象类别和初始轮廓的目标语义信息,从多个角度实现对目标对象的全面描述,然后根据视差图像和目标语义信息,进一步精确定位目标对象的轮廓,大大提高了轮廓的精确度,最终根据道路区域和精确定位的轮廓,准确的确定出目标对象的空间位置,由于能够基于目标语义信息来描述对目标对象,并基于高精确度的轮廓定位目标对象的空间位置,从而提高了目标检测的准确性。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的目标检测装置在目标检测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的目标检测装置与目标检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是本发明实施例提供的一种终端的结构示意图。该终端600可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端600包括有:处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的目标检测方法。
在一些实施例中,终端600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、触摸显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。
外围设备接口603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(UserInterface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置终端600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在终端600的不同表面或呈折叠设计;在再一些实施例中,显示屏605可以是柔性显示屏,设置在终端600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
定位组件608用于定位终端600的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件608可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于:加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。
加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号,控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器612可以检测终端600的机体方向及转动角度,陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时,可以检测用户对终端600的握持信号,由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时,由处理器601根据用户对触摸显示屏605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器614用于采集用户的指纹,由处理器601根据指纹传感器614采集到的指纹识别用户的身份,或者,由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器601授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时,指纹传感器614可以与物理按键或厂商Logo集成在一起。
光学传感器615用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器615采集的环境光强度,控制触摸显示屏605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏605的显示亮度;当环境光强度较低时,调低触摸显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器615采集的环境光强度,动态调整摄像头组件606的拍摄参数。
接近传感器616,也称距离传感器,通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中,当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时,由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态;当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时,由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图6中示出的结构并不构成对终端600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图7是本发明实施例提供的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)701和一个或一个以上的存储器702,其中,该存储器702中存储有至少一条指令,该至少一条指令由该处理器701加载并执行以实现上述各个方法实施例提供的目标检测方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端或服务器中的处理器执行以完成上述实施例中的目标检测方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种目标检测方法,其特征在于,所述方法包括:
在车辆行驶过程中,基于至少两帧车辆环境图像,确定所述车辆环境图像的视差图像;
对所述视差图像沿所述视差图像的图像坐标系的纵坐标进行投影,确定所述车辆环境图像的纵向视差图像,所述纵向视差图像中像素点的灰度值用于指示所述视差图像中每行像素点的视差分布;
根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域,所述目标区域内包括目标对象;
对所述目标区域进行对象分割,得到目标对象的目标语义信息,所述目标语义信息包括所述目标对象的对象类别和所述目标对象的初始轮廓;
根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓;
根据所述纵向视差图像中每个像素点的灰度值,在所述纵向视差图像的图像坐标系中确定路面直线;
基于所述路面直线和所述视差图像中像素点的视差值,确定所述车辆环境图像中的道路区域;
根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓包括:
基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整;
基于调整后的初始轮廓和图像采集设备的标定参数,构建所述目标对象的三维立体模型,所述图像采集设备用于采集所述车辆环境图像;
根据所述目标对象的三维立体模型的深度,对所述三维立体模型在水平面的投影区域进行调整,得到所述目标对象在所述水平面的轮廓。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整包括:
在所述视差图像中确定出所述目标对象的初始轮廓对应的多个边界像素点;
根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整。
4.根据权利要求3所述的方法,其特征在于,所述根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整包括:
当所述边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留所述边界像素点;
当所述边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将所述边界像素点替换为所述多个邻域像素点中满足所述目标突变条件的像素点。
5.根据权利要求1所述的方法,其特征在于,所述根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域包括:
根据所述纵向视差图像中每列像素点的灰度值,确定所述车辆环境图像中目标区域的视差值;
在所述纵向视差图像中,根据所述目标区域的视差值,在所述道路区域上方确定所述目标区域的纵向坐标范围;
根据所述纵向坐标范围和所述目标区域的视差值,在所述视差图像中确定出所述目标区域的横向坐标范围。
6.根据权利要求1所述的方法,其特征在于,所述对所述目标区域进行对象分割,得到目标对象的目标语义信息包括:
识别出所述目标区域内至少一个目标对象的在所述目标区域的对象区域;
根据所述对象区域内多个像素点的像素值,确定每个目标对象的对象类别和所述每个目标对象的初始轮廓。
7.根据权利要求1所述的方法,其特征在于,所述根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置包括:
基于所述目标对象的轮廓,确定所述目标对象在水平面的最小外接矩形;
基于所述最小外接矩形在车辆坐标系的位置坐标,确定所述目标对象的平面大小;
基于所述道路区域的路面高度,确定所述目标对象在所述路面上的相对高度。
8.一种目标检测装置,其特征在于,所述装置包括:
确定模块,用于在车辆行驶过程中,基于至少两帧车辆环境图像,确定所述车辆环境图像的视差图像;对所述视差图像沿所述视差图像的图像坐标系的纵坐标进行投影,确定所述车辆环境图像的纵向视差图像,所述纵向视差图像中像素点的灰度值用于指示所述视差图像中每行像素点的视差分布;根据所述纵向视差图像中每个像素点的灰度值以及和所述视差图像中每个像素点的视差值,确定所述车辆环境图像中的目标区域,所述目标区域内包括目标对象;
分割模块,用于对所述目标区域进行对象分割,得到目标对象的目标语义信息,所述目标语义信息包括所述目标对象的对象类别和所述目标对象的初始轮廓;
所述确定模块,还用于根据所述视差图像和所述目标对象的目标语义信息,确定所述目标对象的轮廓;
所述确定模块,还用于根据所述纵向视差图像中每个像素点的灰度值,在所述纵向视差图像的图像坐标系中确定路面直线;基于所述路面直线和所述视差图像中像素点的视差值,确定所述车辆环境图像中的道路区域;
所述确定模块,还用于根据所述道路区域和所述目标对象的轮廓,确定所述目标对象在车辆环境中的空间位置。
9.根据权利要求8所述的装置,其特征在于,
所述确定模块,还用于基于所述目标对象的初始轮廓在所述视差图像对应的边界像素点,对所述目标对象的初始轮廓进行调整;基于调整后的初始轮廓和图像采集设备的标定参数,构建所述目标对象的三维立体模型,所述图像采集设备用于采集所述车辆环境图像;根据所述目标对象的三维立体模型的深度,对所述三维立体模型在水平面的投影区域进行调整,得到所述目标对象在所述水平面的轮廓。
10.根据权利要求9所述的装置,其特征在于,
所述确定模块,还用于在所述视差图像中确定出所述目标对象的初始轮廓对应的多个边界像素点;根据每个边界像素点的多个邻域像素点的视差值的变化程度,对所述目标对象的初始轮廓所对应的多个边界像素点进行调整。
11.根据权利要求10所述的装置,其特征在于,
所述确定模块,还用于当所述边界像素点的多个邻域像素点的视差值变化程度满足目标突变条件时,保留所述边界像素点;当所述边界像素点的多个邻域像素点的视差值变化程度不满足目标突变条件时,将所述边界像素点替换为所述多个邻域像素点中满足所述目标突变条件的像素点。
12.根据权利要求8所述的装置,其特征在于,
所述确定模块,还用于根据所述纵向视差图像中每列像素点的灰度值,确定所述车辆环境图像中目标区域的视差值;在所述纵向视差图像中,根据所述目标区域的视差值,在所述道路区域上方确定所述目标区域的纵向坐标范围;根据所述纵向坐标范围和所述目标区域的视差值,在所述视差图像中确定出所述目标区域的横向坐标范围。
13.根据权利要求8所述的装置,其特征在于,
所述分割模块,还用于识别出所述目标区域内至少一个目标对象的在所述目标区域的对象区域;根据所述对象区域内多个像素点的像素值,确定每个目标对象的对象类别和所述每个目标对象的初始轮廓。
14.根据权利要求8所述的装置,其特征在于,
所述确定模块,还用于基于所述目标对象的轮廓,确定所述目标对象在水平面的最小外接矩形;基于所述最小外接矩形在车辆坐标系的位置坐标,确定所述目标对象的平面大小;基于所述道路区域的路面高度,确定所述目标对象在所述路面上的相对高度。
15.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至权利要求7任一项所述的目标检测方法所执行的操作。
16.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的目标检测方法所执行的操作。
CN201911304904.2A 2019-12-17 2019-12-17 目标检测方法、装置、计算机设备及存储介质 Active CN111104893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911304904.2A CN111104893B (zh) 2019-12-17 2019-12-17 目标检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911304904.2A CN111104893B (zh) 2019-12-17 2019-12-17 目标检测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111104893A CN111104893A (zh) 2020-05-05
CN111104893B true CN111104893B (zh) 2022-09-20

Family

ID=70422608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911304904.2A Active CN111104893B (zh) 2019-12-17 2019-12-17 目标检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111104893B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233150B (zh) * 2020-09-09 2024-12-31 北京迈格威科技有限公司 图像处理和虚化方法、装置、电子设备及存储介质
CN112200172B (zh) * 2020-12-07 2021-02-19 天津天瞳威势电子科技有限公司 一种可行驶区域的检测方法及装置
CN112950535B (zh) * 2021-01-22 2024-03-22 北京达佳互联信息技术有限公司 视频处理方法、装置、电子设备及存储介质
CN114219992B (zh) * 2021-12-14 2022-06-03 杭州古伽船舶科技有限公司 一种基于图像识别技术的无人船避障系统
CN114219791B (zh) * 2021-12-17 2025-01-03 盛视科技股份有限公司 基于视觉的道路积水检测方法、电子设备及车辆报警系统
CN117710734A (zh) * 2023-12-13 2024-03-15 北京百度网讯科技有限公司 用于获得语义数据的方法、装置、电子设备、介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197590B (zh) * 2018-01-22 2020-11-03 海信集团有限公司 一种路面检测方法、装置、终端及存储介质
CN108520536B (zh) * 2018-03-27 2022-01-11 海信集团有限公司 一种视差图的生成方法、装置及终端

Also Published As

Publication number Publication date
CN111104893A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN111126182B (zh) 车道线检测方法、装置、电子设备及存储介质
CN111104893B (zh) 目标检测方法、装置、计算机设备及存储介质
EP3779883B1 (en) Method and device for repositioning in camera orientation tracking process, and storage medium
WO2021128777A1 (en) Method, apparatus, device, and storage medium for detecting travelable region
US11978219B2 (en) Method and device for determining motion information of image feature point, and task performing method and device
CN111126276B (zh) 车道线检测方法、装置、计算机设备及存储介质
CN110059685A (zh) 文字区域检测方法、装置及存储介质
CN110490179B (zh) 车牌识别方法、装置及存储介质
CN110599593B (zh) 数据合成的方法、装置、设备及存储介质
CN110335224B (zh) 图像处理方法、装置、计算机设备及存储介质
CN110570460A (zh) 目标跟踪方法、装置、计算机设备及计算机可读存储介质
CN111784841B (zh) 重建三维图像的方法、装置、电子设备及介质
CN110503159B (zh) 文字识别方法、装置、设备及介质
CN111538009B (zh) 雷达点的标记方法和装置
CN112150560A (zh) 确定消失点的方法、装置及计算机存储介质
CN113205515A (zh) 目标检测方法、装置、及计算机存储介质
CN113378705A (zh) 车道线检测方法、装置、设备及存储介质
CN111127541A (zh) 车辆尺寸的确定方法、装置及存储介质
CN111444749B (zh) 路面导向标志的识别方法、装置及存储介质
CN113689484B (zh) 深度信息的确定方法、装置、终端及存储介质
CN115965936A (zh) 边缘位置标注方法及设备
CN111127539B (zh) 视差确定方法、装置、计算机设备及存储介质
CN111563402B (zh) 车牌识别方法、装置、终端及存储介质
CN114623836A (zh) 车辆位姿确定方法、装置及车辆
CN113920222A (zh) 获取地图建图数据的方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200611

Address after: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant after: Zhijia (Cayman) Co.

Applicant after: Zhijia (USA)

Address before: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant before: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210310

Address after: 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant after: Zhijia (USA)

Address before: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant before: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant before: Zhijia (Cayman) Co.

Applicant before: Zhijia (USA)

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant