[go: up one dir, main page]

JP6972797B2 - Information processing device, image pickup device, device control system, mobile body, information processing method, and program - Google Patents

Information processing device, image pickup device, device control system, mobile body, information processing method, and program Download PDF

Info

Publication number
JP6972797B2
JP6972797B2 JP2017171531A JP2017171531A JP6972797B2 JP 6972797 B2 JP6972797 B2 JP 6972797B2 JP 2017171531 A JP2017171531 A JP 2017171531A JP 2017171531 A JP2017171531 A JP 2017171531A JP 6972797 B2 JP6972797 B2 JP 6972797B2
Authority
JP
Japan
Prior art keywords
image
information
objects
predetermined
predetermined object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017171531A
Other languages
Japanese (ja)
Other versions
JP2018088233A (en
Inventor
元気 渡邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to US15/783,307 priority Critical patent/US10628960B2/en
Publication of JP2018088233A publication Critical patent/JP2018088233A/en
Application granted granted Critical
Publication of JP6972797B2 publication Critical patent/JP6972797B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及びプログラムに関する。 The present invention relates to an information processing device, an image pickup device, a device control system, a mobile body, an information processing method, and a program.

自動車の安全性において、従来は歩行者や自動車と衝突したときに、いかに歩行者を守れるか、乗員を保護できるかの観点から自動車のボディー構造などの開発が行われてきた。しかしながら近年、情報処理技術、画像処理技術の発達により、高速に人や自動車等を検出する技術が開発されてきている。これらの技術を応用して、衝突する前に自動的にブレーキをかけ、衝突を未然に防ぐという自動車もすでに発売されている。 In terms of automobile safety, the body structure of automobiles has been developed from the viewpoint of how to protect pedestrians and occupants when they collide with pedestrians or automobiles. However, in recent years, with the development of information processing technology and image processing technology, technology for detecting people, automobiles, and the like at high speed has been developed. Automobiles that apply these technologies to automatically apply the brakes before a collision to prevent a collision have already been released.

自動的にブレーキをかけるには人や他車等の物体までの距離を測定する必要があり、そのために、ステレオカメラの画像を用いた測定が実用化されている(例えば、特許文献1参照)。 In order to automatically apply the brakes, it is necessary to measure the distance to an object such as a person or another vehicle, and for that purpose, measurement using an image of a stereo camera has been put into practical use (see, for example, Patent Document 1). ..

このステレオカメラの画像を用いた測定では、あるフレームの視差画像で自車両よりも前方にある車両等の物体を検出した後、それ以降のフレームの視差画像において、当該物体をトラッキング(追跡)する技術が知られている。 In the measurement using the image of this stereo camera, an object such as a vehicle in front of the own vehicle is detected in the parallax image of a certain frame, and then the object is tracked in the parallax image of the subsequent frames. The technology is known.

しかし、従来技術には、例えば、周囲の照度変化等による誤差や、物体の移動速度や移動方向の変化等によって、以前のフレームにて検出された一の物体と、今回のフレームにて検出された他の物体を、同一の物体であると誤判定される場合があるという問題がある。また、例えば、歩行者が交差したり、同様の色や形状の複数台の車両が並走している場合等においても、以前のフレームにて検出された一の物体と、今回のフレームにて検出された他の物体を、同一の物体であると誤判定される場合があるという問題がある。 However, in the prior art, for example, one object detected in the previous frame and one object detected in the current frame due to an error due to a change in ambient illuminance, a change in the moving speed or a moving direction of the object, etc. There is a problem that other objects may be erroneously determined to be the same object. Also, for example, even when pedestrians cross each other or multiple vehicles of the same color and shape are running side by side, one object detected in the previous frame and this frame There is a problem that other detected objects may be erroneously determined to be the same object.

そこで、精度の高いトラッキングを継続できる技術を提供することを目的とする。 Therefore, it is an object of the present invention to provide a technology capable of continuing highly accurate tracking.

複数の時点における、物体の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報を取得する取得部と、前記取得部により以前に取得された前記情報における所定の物体の位置に基づき、前記取得部により今回取得された前記情報における前記所定の物体の位置を予測する予測部と、今回の前記情報から、前記所定の物体の位置に応じた所定の条件を満たす複数の物体を抽出し、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、今回の前記情報における前記複数の物体のうち、以前の前記情報における前記所定の物体と同一の物体を抽出する抽出部と、を備え、前記所定の物体の位置に応じた前記所定の条件を前記複数の物体が満たすことは、前記予測部により算出された前記所定の物体の位置から、前記所定の物体の種別に応じた所定の距離以内に前記複数の物体が位置することである、情報処理装置。
An acquisition unit that acquires information in which a vertical position, a horizontal position, and a depth position of an object are associated with each other at a plurality of time points, and a predetermined value in the information previously acquired by the acquisition unit. Based on the position of the object, the prediction unit that predicts the position of the predetermined object in the information acquired this time by the acquisition unit, and the predetermined condition according to the position of the predetermined object from the information this time. A plurality of objects to be satisfied are extracted, and among the plurality of objects in the present information, the predetermined object in the previous information is based on the similarity between each image of the plurality of objects and the image of the predetermined object. The plurality of objects satisfy the predetermined conditions according to the position of the predetermined object, and the predetermined object is calculated by the prediction unit. An information processing apparatus in which the plurality of objects are located within a predetermined distance according to the type of the predetermined object from the position of.

開示の技術によれば、精度の高いトラッキングを継続することが可能となる。 According to the disclosed technology, it is possible to continue highly accurate tracking.

実施形態に係る機器制御システムの構成を示す図である。It is a figure which shows the structure of the device control system which concerns on embodiment. 実施形態に係る撮像ユニット及び画像解析ユニットの構成を示す図である。It is a figure which shows the structure of the image pickup unit and the image analysis unit which concerns on embodiment. 三角測量の原理を利用することで視差値から距離を算出する原理を説明するための図である。It is a figure for demonstrating the principle of calculating a distance from a parallax value by using the principle of triangulation. 機器制御システムの機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of a device control system. 視差画像データ、及びその視差画像データから生成されるVマップについて説明するための図である。It is a figure for demonstrating the parallax image data, and the V map generated from the parallax image data. 一方の撮像部で撮像された基準画像としての撮影画像の画像例と、その撮影画像に対応するVマップを示す図である。It is a figure which shows the image example of the photographed image as a reference image imaged by one image pickup part, and the V map corresponding to the photographed image. 基準画像の一例を模式的に表した画像例を示す図である。It is a figure which shows the image example which represented the example of the reference image schematically. 画像例に対応するUマップを示す図である。It is a figure which shows the U map corresponding to the image example. Uマップに対応するリアルUマップを示す図である。It is a figure which shows the real U map corresponding to the U map. Uマップの横軸の値からリアルUマップの横軸の値を求める方法を説明するための図である。It is a figure for demonstrating the method of obtaining the value of the horizontal axis of a real U map from the value of the horizontal axis of a U map. 孤立領域検出処理の一例を示すフローチャートである。It is a flowchart which shows an example of the isolated area detection process. 孤立領域検出部で検出された孤立領域が内接する矩形領域を設定したリアル頻度Uマップを示す図である。It is a figure which shows the real frequency U map which set the rectangular area inscribed by the isolated area detected by the isolated area detection part. 矩形領域に対応する走査範囲を設定した視差画像を示す図である。It is a figure which shows the parallax image which set the scanning range corresponding to a rectangular area. 走査範囲を探索してオブジェクト領域を設定した視差画像を示す図である。It is a figure which shows the parallax image which searched the scanning range and set the object area. 視差画像の対応領域検出部及びオブジェクト領域抽出部で行われる処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the process performed in the corresponding area detection part and the object area extraction part of a parallax image. オブジェクトタイプの分類を行うためのテーブルデータの一例を示す図である。It is a figure which shows an example of the table data for classifying an object type. オブジェクトトラッキング処理の一例を示すフローチャートである。It is a flowchart which shows an example of the object tracking process. オブジェクトトラッキング処理の詳細な一例を示すフローチャートである。It is a flowchart which shows the detailed example of the object tracking process. 対象オブジェクトのオブジェクトタイプに応じた実距離の範囲について説明する図である。It is a figure explaining the range of the actual distance according to the object type of the target object. オブジェクトトラッキング処理の詳細な他の一例を示すフローチャートである。It is a flowchart which shows the other detailed example of the object tracking process. 重なり度について説明する図である。It is a figure explaining the degree of overlap.

以下、実施形態に係る画像処理装置を有する機器制御システムについて説明する。 Hereinafter, a device control system having an image processing device according to the embodiment will be described.

〈機器制御システムの構成〉
図1は、実施形態に係る機器制御システムの構成を示す図である。
<Device control system configuration>
FIG. 1 is a diagram showing a configuration of a device control system according to an embodiment.

この機器制御システム1は、移動体である自動車などの自車両100に搭載されており、撮像ユニット101、画像解析ユニット102、表示モニタ103、及び車両走行制御ユニット104からなる。そして、撮像ユニット101で、移動体の前方を撮像した自車両進行方向前方領域(撮像領域)の複数の撮像画像データ(フレーム)から、自車両前方の物体を検知して追跡し、その追跡結果を利用して移動体や各種車載機器の制御を行う。移動体の制御には、例えば、警告の報知、自車両100(自移動体)のハンドルの制御、または自車両100(自移動体)のブレーキが含まれる。 This device control system 1 is mounted on an own vehicle 100 such as a moving vehicle, and includes an image pickup unit 101, an image analysis unit 102, a display monitor 103, and a vehicle travel control unit 104. Then, the imaging unit 101 detects and tracks an object in front of the own vehicle from a plurality of captured image data (frames) in the front region (imaging region) in the traveling direction of the own vehicle, which is an image of the front of the moving body, and the tracking result. Is used to control mobile objects and various in-vehicle devices. Control of the moving body includes, for example, warning notification, control of the steering wheel of the own vehicle 100 (self-moving body), or braking of the own vehicle 100 (self-moving body).

撮像ユニット101は、例えば、自車両100のフロントガラス105のルームミラー(図示せず)付近に設置される。撮像ユニット101の撮像によって得られる撮像画像データ等の各種データは、画像処理手段としての画像解析ユニット102に入力される。 The image pickup unit 101 is installed near, for example, a rearview mirror (not shown) of the windshield 105 of the own vehicle 100. Various data such as captured image data obtained by the imaging of the imaging unit 101 are input to the image analysis unit 102 as an image processing means.

画像解析ユニット102は、撮像ユニット101から送信されてくるデータを解析して、自車両100が走行している路面部分(自車両の真下に位置する路面部分)に対する自車両前方の走行路面上の各地点における相対的な高さ(位置情報)を検出し、自車両前方の走行路面の3次元形状を把握する。また、自車両前方の他車両、歩行者、各種障害物などの認識対象物を認識する。 The image analysis unit 102 analyzes the data transmitted from the image pickup unit 101, and on the traveling road surface in front of the own vehicle with respect to the road surface portion (the road surface portion located directly under the own vehicle) on which the own vehicle 100 is traveling. The relative height (position information) at each point is detected, and the three-dimensional shape of the traveling road surface in front of the own vehicle is grasped. It also recognizes objects to be recognized such as other vehicles, pedestrians, and various obstacles in front of the own vehicle.

画像解析ユニット102の解析結果は、表示モニタ103及び車両走行制御ユニット104に送られる。表示モニタ103は、撮像ユニット101で得られた撮像画像データ及び解析結果を表示する。なお、表示モニタ103はなくともよい。車両走行制御ユニット104は、画像解析ユニット102による自車両前方の他車両、歩行者、各種障害物などの認識対象物の認識結果に基づいて、例えば、自車両100の運転者へ警告を報知したり、自車両のハンドルやブレーキを制御するなどの走行支援制御を行う。 The analysis result of the image analysis unit 102 is sent to the display monitor 103 and the vehicle travel control unit 104. The display monitor 103 displays the captured image data and the analysis result obtained by the imaging unit 101. The display monitor 103 may not be provided. The vehicle travel control unit 104 notifies, for example, a warning to the driver of the own vehicle 100 based on the recognition result of the recognition target object such as another vehicle, a pedestrian, and various obstacles in front of the own vehicle by the image analysis unit 102. It also performs driving support control such as controlling the steering wheel and brakes of the own vehicle.

〈撮像ユニット101及び画像解析ユニット102の構成〉
図2は、実施形態に係る撮像ユニット101及び画像解析ユニット102の構成を示す図である。
<Structure of image pickup unit 101 and image analysis unit 102>
FIG. 2 is a diagram showing a configuration of an image pickup unit 101 and an image analysis unit 102 according to an embodiment.

撮像ユニット101は、撮像手段としての2つの撮像部110a,110bを備えたステレオカメラで構成されており、2つの撮像部110a,110bは同一のものである。各撮像部110a,110bは、それぞれ、撮像レンズ111a,111bと、受光素子が2次元配置された画像センサ113a,113bを含んだセンサ基板114a,114bと、センサ基板114a,114bから出力されるアナログ電気信号(画像センサ113a,113b上の各受光素子が受光した受光量に対応する電気信号)をデジタル電気信号に変換した撮像画像データを生成して出力する信号処理部115a,115bとから構成されている。撮像ユニット101からは、輝度画像データと視差画像データが出力される。 The image pickup unit 101 is composed of a stereo camera provided with two image pickup units 110a and 110b as image pickup means, and the two image pickup units 110a and 110b are the same. Each of the image pickup units 110a and 110b is an analog output from the sensor boards 114a and 114b including the image pickup lenses 111a and 111b and the image sensors 113a and 113b in which the light receiving elements are two-dimensionally arranged, and the sensor boards 114a and 114b, respectively. It is composed of signal processing units 115a and 115b that generate and output captured image data obtained by converting an electric signal (an electric signal corresponding to the amount of light received by each light receiving element on the image sensors 113a and 113b) into a digital electric signal. ing. Luminance image data and parallax image data are output from the image pickup unit 101.

また、撮像ユニット101は、FPGA(Field-Programmable Gate Array)等からなる処理ハードウェア部120を備えている。この処理ハードウェア部120は、各撮像部110a,110bから出力される輝度画像データから視差画像を得るために、各撮像部110a,110bでそれぞれ撮像した撮像画像間の対応画像部分の視差値を演算する視差画像情報生成手段としての視差演算部121を備えている。 Further, the image pickup unit 101 includes a processing hardware unit 120 including an FPGA (Field-Programmable Gate Array) or the like. In order to obtain a parallax image from the brightness image data output from the imaging units 110a and 110b, the processing hardware unit 120 determines the parallax value of the corresponding image portion between the captured images captured by the imaging units 110a and 110b, respectively. A parallax calculation unit 121 is provided as a parallax image information generation means for calculation.

ここでいう視差値とは、各撮像部110a,110bでそれぞれ撮像した撮像画像の一方を基準画像、他方を比較画像とし、撮像領域内の同一地点に対応した基準画像上の画像部分に対する比較画像上の画像部分の位置ズレ量を、当該画像部分の視差値として算出したものである。三角測量の原理を利用することで、この視差値から当該画像部分に対応した撮像領域内の当該同一地点までの距離を算出することができる。 The parallax value referred to here is a comparison image with respect to an image portion on the reference image corresponding to the same point in the imaging region, with one of the captured images captured by each of the imaging units 110a and 110b as a reference image and the other as a comparison image. The amount of positional deviation of the upper image portion is calculated as a parallax value of the image portion. By using the principle of triangulation, it is possible to calculate the distance from this parallax value to the same point in the imaging region corresponding to the image portion.

図3は、三角測量の原理を利用することで視差値から距離を算出する原理を説明するための図である。図において、fは撮像レンズ111a,111bのそれぞれの焦点距離であり、Dは光軸間の距離である。また、Zは撮像レンズ111a,111bから被写体301までの距離(光軸に平行な方向の距離)である。この図において、被写体301上にある点Oに対する左右画像での結像位置は、結像中心からの距離がそれぞれΔ1とΔ2となる。このときの視差値dは、d=Δ1+Δ2と規定することができる。 FIG. 3 is a diagram for explaining the principle of calculating the distance from the parallax value by using the principle of triangulation. In the figure, f is the focal length of each of the image pickup lenses 111a and 111b, and D is the distance between the optical axes. Further, Z is a distance (distance in a direction parallel to the optical axis) from the image pickup lenses 111a and 111b to the subject 301. In this figure, the image formation positions in the left and right images with respect to the point O on the subject 301 have distances from the image formation center of Δ1 and Δ2, respectively. The parallax value d at this time can be defined as d = Δ1 + Δ2.

図2の説明に戻る。画像解析ユニット102は、画像処理基板等から構成され、撮像ユニット101から出力される輝度画像データ及び視差画像データを記憶するRAMやROM等で構成される記憶手段122と、識別対象の認識処理や視差計算制御などを行うためのコンピュータプログラムを実行するCPU(Central Processing Unit)123と、データI/F(インタフェース)124と、シリアルI/F125を備えている。 Returning to the description of FIG. The image analysis unit 102 includes a storage means 122 composed of an image processing board or the like and including a RAM or ROM for storing brightness image data and parallax image data output from the image pickup unit 101, and recognition processing of an identification target. It includes a CPU (Central Processing Unit) 123 that executes a computer program for performing disparity calculation control and the like, a data I / F (interface) 124, and a serial I / F 125.

処理ハードウェア部120を構成するFPGAは、画像データに対してリアルタイム性が要求される処理、例えばガンマ補正、ゆがみ補正(左右の撮像画像の平行化)、ブロックマッチングによる視差演算を行って視差画像の情報を生成し、画像解析ユニット102のRAMに書き出す処理などを行う。画像解析ユニット102のCPUは、各撮像部110A,110Bの画像センサコントローラの制御および画像処理基板の全体的な制御を担うとともに、路面の3次元形状の検出処理、ガードレールその他の各種オブジェクト(物体)の検出処理などを実行するプログラムをROMからロードして、RAMに蓄えられた輝度画像データや視差画像データを入力として各種処理を実行し、その処理結果をデータI/F124やシリアルI/F125から外部へと出力する。このような処理の実行に際し、データI/F124を利用して、自車両100の車速、加速度(主に自車両前後方向に生じる加速度)、操舵角、ヨーレートなどの車両動作情報を入力し、各種処理のパラメータとして使用することもできる。外部に出力されるデータは、自車両100の各種機器の制御(ブレーキ制御、車速制御、警告制御など)を行うための入力データとして使用される。 The FPGA constituting the processing hardware unit 120 performs processing that requires real-time performance for image data, for example, gamma correction, distortion correction (parallelization of left and right captured images), and parallax calculation by block matching to perform a parallax image. Information is generated and written to the RAM of the image analysis unit 102. The CPU of the image analysis unit 102 is responsible for controlling the image sensor controllers of the image pickup units 110A and 110B and overall control of the image processing board, as well as detecting the three-dimensional shape of the road surface, guard rails, and various other objects (objects). A program that executes detection processing, etc. is loaded from the ROM, various processes are executed by inputting the brightness image data and the parallax image data stored in the RAM, and the processing results are obtained from the data I / F 124 or serial I / F 125. Output to the outside. When executing such processing, the data I / F124 is used to input vehicle operation information such as vehicle speed, acceleration (mainly acceleration generated in the front-rear direction of the own vehicle), steering angle, yaw rate, etc. of the own vehicle 100, and various types are input. It can also be used as a processing parameter. The data output to the outside is used as input data for controlling various devices of the own vehicle 100 (brake control, vehicle speed control, warning control, etc.).

なお、撮像ユニット101及び画像解析ユニット102は、一体の装置である撮像装置2として構成してもよい。 The image pickup unit 101 and the image analysis unit 102 may be configured as an image pickup device 2 which is an integrated device.

〈物体検出処理〉
次に、図4を参照し、図2における処理ハードウェア部120及び画像解析ユニット102で実現される物体検出処理を行う機能について説明する。図4は、機器制御システム1の機能ブロック図の一例を示す図である。以下、本実施形態における物体検出処理について説明する。
<Object detection processing>
Next, with reference to FIG. 4, a function for performing object detection processing realized by the processing hardware unit 120 and the image analysis unit 102 in FIG. 2 will be described. FIG. 4 is a diagram showing an example of a functional block diagram of the device control system 1. Hereinafter, the object detection process in this embodiment will be described.

ステレオカメラを構成する2つの撮像部110a,110bからは輝度画像データが出力される。このとき、撮像部110a,110bがカラーの場合には、そのRGB信号から輝度信号(Y)を得るカラー輝度変換を、例えば下記の式〔1〕を用いて行う。 Luminance image data is output from the two image pickup units 110a and 110b constituting the stereo camera. At this time, when the imaging units 110a and 110b are in color, color luminance conversion for obtaining a luminance signal (Y) from the RGB signal is performed using, for example, the following equation [1].

Y=0.3R+0.59G+0.11B …式〔1〕
《視差画像生成処理》
次に、視差演算部121によって構成される視差画像生成部132において、視差画像データ(視差画像情報。「検出対象物の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報」の一例。)を生成する視差画像生成処理を行う。視差画像生成処理では、まず、2つの撮像部110a,110bのうちの一方の撮像部110aの輝度画像データを基準画像データとし、他方の撮像部110bの輝度画像データを比較画像データとし、これらを用いて両者の視差を演算して、視差画像データを生成して出力する。この視差画像データは、基準画像データ上の各画像部分について算出される視差値dに応じた画素値をそれぞれの画像部分の画素値として表した視差画像を示すものである。
Y = 0.3R + 0.59G + 0.11B ... Equation [1]
<< Parallax image generation processing >>
Next, in the parallax image generation unit 132 configured by the parallax calculation unit 121, the parallax image data (parallax image information. “The vertical position of the detection object, the horizontal position, and the depth direction correspond to each other. An example of "attached information".) Performs a parallax image generation process to generate). In the parallax image generation process, first, the brightness image data of one of the two image pickup units 110a and 110b is used as the reference image data, and the brightness image data of the other image pickup unit 110b is used as the comparison image data. The difference between the two is calculated using the difference, and the difference image data is generated and output. This parallax image data shows a parallax image in which the pixel value corresponding to the parallax value d calculated for each image portion on the reference image data is represented as the pixel value of each image portion.

《Vマップ生成処理》
次に、Vマップ生成部134において、視差画像生成部132から視差画像データを取得し、Vマップを生成するVマップ生成処理を実行する。視差画像データに含まれる各視差画素データは、x方向位置とy方向位置と視差値dとの組(x,y,d)で示される。これを、X軸にd、Y軸にy、Z軸に頻度fを設定した三次元座標情報(d,y,f)に変換したもの、又はこの三次元座標情報(d,y,f)から所定の頻度閾値を超える情報に限定した三次元座標情報(d,y,f)を、視差ヒストグラム情報として生成する。本実施形態の視差ヒストグラム情報は、三次元座標情報(d,y,f)からなり、この三次元ヒストグラム情報をX−Yの2次元座標系に分布させたものを、Vマップ(視差ヒストグラムマップ、V-disparity map)と呼ぶ。
<< V map generation process >>
Next, in the V map generation unit 134, the parallax image data is acquired from the parallax image generation unit 132, and the V map generation process for generating the V map is executed. Each parallax pixel data included in the parallax image data is represented by a set (x, y, d) of the x-direction position, the y-direction position, and the parallax value d. This is converted into three-dimensional coordinate information (d, y, f) in which d is set on the X-axis, y is set on the Y-axis, and frequency f is set on the Z-axis, or the three-dimensional coordinate information (d, y, f). Three-dimensional coordinate information (d, y, f) limited to information exceeding a predetermined frequency threshold is generated as disparity histogram information. The disparity histogram information of the present embodiment consists of three-dimensional coordinate information (d, y, f), and the three-dimensional histogram information distributed in the XY two-dimensional coordinate system is a V map (distortion histogram map). , V-disparity map).

具体的に説明すると、Vマップ生成部134は、画像を上下方向に複数分割して得られる視差画像データの各行領域について、視差値頻度分布を計算する。この視差値頻度分布を示す情報が視差ヒストグラム情報である。 Specifically, the V-map generation unit 134 calculates the parallax value frequency distribution for each row region of the parallax image data obtained by dividing the image into a plurality of parts in the vertical direction. The information indicating the parallax value frequency distribution is the parallax histogram information.

図5は視差画像データ、及びその視差画像データから生成されるVマップについて説明するための図である。ここで、図5Aは視差画像の視差値分布の一例を示す図であり、図5Bは、図5Aの視差画像の行毎の視差値頻度分布を示すVマップを示す図である。 FIG. 5 is a diagram for explaining the parallax image data and the V map generated from the parallax image data. Here, FIG. 5A is a diagram showing an example of the parallax value distribution of the parallax image, and FIG. 5B is a diagram showing a V map showing the parallax value frequency distribution for each row of the parallax image of FIG. 5A.

図5Aに示すような視差値分布をもった視差画像データが入力されたとき、Vマップ生成部134は、行毎の各視差値のデータの個数の分布である視差値頻度分布を計算し、これを視差ヒストグラム情報として出力する。このようにして得られる各行の視差値頻度分布の情報を、Y軸に視差画像上のy方向位置(撮像画像の上下方向位置)をとりX軸に視差値をとった二次元直交座標系上に表すことで、図5Bに示すようなVマップを得ることができる。このVマップは、頻度fに応じた画素値をもつ画素が前記二次元直交座標系上に分布した画像として表現することもできる。 When the parallax image data having the parallax value distribution as shown in FIG. 5A is input, the V-map generation unit 134 calculates the parallax value frequency distribution which is the distribution of the number of data of each parallax value for each row. This is output as parallax histogram information. The information of the parallax value frequency distribution of each row obtained in this way is on a two-dimensional Cartesian coordinate system in which the y-direction position (vertical position of the captured image) on the parallax image is taken on the Y-axis and the parallax value is taken on the X-axis. By representing in, a V map as shown in FIG. 5B can be obtained. This V-map can also be expressed as an image in which pixels having pixel values corresponding to the frequency f are distributed on the two-dimensional Cartesian coordinate system.

図6は、一方の撮像部で撮像された基準画像としての撮影画像の画像例と、その撮影画像に対応するVマップを示す図である。ここで、図6Aが撮影画像であり、図6BがVマップである。即ち、図6Aに示すような撮影画像から図6Bに示すVマップが生成される。 FIG. 6 is a diagram showing an image example of a captured image as a reference image captured by one of the imaging units and a V map corresponding to the captured image. Here, FIG. 6A is a photographed image, and FIG. 6B is a V map. That is, the V map shown in FIG. 6B is generated from the captured image as shown in FIG. 6A.

図6Aに示す画像例では、自車両が走行している路面401と、自車両の前方に存在する先行車両402と、路外に存在する電柱403が映し出されている。また、図6Bに示すVマップには、画像例に対応して、路面501、先行車両502、及び電柱503がある。 In the image example shown in FIG. 6A, the road surface 401 on which the own vehicle is traveling, the preceding vehicle 402 existing in front of the own vehicle, and the utility pole 403 existing outside the road are projected. Further, in the V map shown in FIG. 6B, there are a road surface 501, a preceding vehicle 502, and a utility pole 503 corresponding to an image example.

《路面形状検出処理》
次に、本実施形態では、Vマップ生成部134が生成したVマップの情報(視差ヒストグラム情報)から、路面形状検出部135において、自車両100の前方路面の3次元形状を検出する路面形状検出処理が実行される。
<< Road surface shape detection processing >>
Next, in the present embodiment, the road surface shape detection unit 135 detects the three-dimensional shape of the road surface in front of the own vehicle 100 from the V map information (parallax histogram information) generated by the V map generation unit 134. The process is executed.

図6Aに示す画像例は、自車両100の前方路面が相対的に平坦な路面、すなわち、自車両100の前方路面が自車両100の真下の路面部分と平行な面を自車前方へ延長して得られる仮想の基準路面(仮想基準移動面)に一致している場合のものである。この場合、画像の下部に対応するVマップの下部において、高頻度の点(路面501)は、画像上方へ向かうほど視差値dが小さくなるような傾きをもった略直線状に分布する。このような分布を示す画素は、視差画像上の各行においてほぼ同一距離に存在していてかつ最も占有率が高く、しかも画像上方へ向かうほど距離が連続的に遠くなる検出対象物を映し出した画素であると言える。 In the image example shown in FIG. 6A, the road surface in front of the own vehicle 100 is relatively flat, that is, the surface in which the front road surface of the own vehicle 100 is parallel to the road surface portion directly under the own vehicle 100 is extended to the front of the own vehicle. This is the case when it matches the virtual reference road surface (virtual reference moving surface) obtained. In this case, in the lower part of the V map corresponding to the lower part of the image, the high frequency points (road surface 501) are distributed in a substantially straight line with an inclination so that the parallax value d becomes smaller toward the upper part of the image. Pixels showing such a distribution are pixels that are present at almost the same distance in each row on the parallax image, have the highest occupancy rate, and project a detection target whose distance is continuously increased toward the upper part of the image. It can be said that.

撮像部110Aでは自車前方領域を撮像するため、その撮像画像の内容は、図6Bに示すように、画像上方へ向かうほど路面の視差値dは小さくなる。また、同じ行(横ライン)内において、路面を映し出す画素はほぼ同じ視差値dを持つことになる。したがって、Vマップ上において上述した略直線状に分布する高頻度の点(路面501)は、路面(移動面)を映し出す画素が持つ特徴に対応したものである。よって、Vマップ上における高頻度の点を直線近似して得られる近似直線上又はその近傍に分布する点の画素は、高い精度で、路面を映し出している画素であると推定することができる。また、各画素に映し出されている路面部分までの距離は、当該近似直線上の対応点の視差値dから高精度に求めることができる。なお、路面の推定により路面の高さが求められるため、当該路面上の物体の高さを求めることができる。これは、公知の方法により算出できる。例えば、推定した路面を表す直線式を求め、視差値d=0のときの対応するy座標y0を路面の高さとする。そして、例えば、視差値がdでy座標がy'である場合、y'−y0が視差値dのときの路面からの高さを示す。上述の座標(d,y')の路面からの高さHは、H=(z×(y'−y0))/fという演算式で求めることができる。なお、この演算式における「z」は、視差値dから計算される距離(z=BF/(d−offset))、「f」は撮像部10a、10bの焦点距離を(y'−y0)の単位と同じ単位に変換した値である。ここで、BFは、撮像部10a、10bの基線長Bと焦点距離fを乗じた値、offsetは無限遠のオブジェクトを撮影したときの視差である。 Since the image pickup unit 110A captures the area in front of the vehicle, the parallax value d of the road surface becomes smaller toward the upper side of the image as shown in FIG. 6B. Further, in the same line (horizontal line), the pixels projecting the road surface have substantially the same parallax value d. Therefore, the high-frequency points (road surface 501) distributed in a substantially straight line on the V-map correspond to the characteristics of the pixels that project the road surface (moving surface). Therefore, it can be estimated that the pixels of the points distributed on or near the approximate straight line obtained by linearly approximating the high frequency points on the V map are the pixels projecting the road surface with high accuracy. Further, the distance to the road surface portion projected on each pixel can be obtained with high accuracy from the parallax value d of the corresponding point on the approximate straight line. Since the height of the road surface can be obtained by estimating the road surface, the height of the object on the road surface can be obtained. This can be calculated by a known method. For example, a linear equation representing the estimated road surface is obtained, and the corresponding y-coordinate y0 when the parallax value d = 0 is set as the height of the road surface. Then, for example, when the parallax value is d and the y coordinate is y', the height from the road surface when y'−y0 is the parallax value d is shown. The height H of the above-mentioned coordinates (d, y') from the road surface can be obtained by the arithmetic expression H = (z × (y'−y0)) / f. In this calculation formula, "z" is the distance calculated from the parallax value d (z = BF / (d-offset)), and "f" is the focal length of the imaging units 10a and 10b (y'-y0). It is a value converted to the same unit as the unit of. Here, BF is a value obtained by multiplying the baseline length B of the imaging units 10a and 10b by the focal length f, and offset is the parallax when an object at infinity is photographed.

《Uマップ生成処理》
次に、Uマップ生成部137は、Uマップ(U-disparity map)を生成するUマップ生成処理として、頻度Uマップ生成処理及び高さUマップ生成処理を実行する。
<< U map generation process >>
Next, the U map generation unit 137 executes a frequency U map generation process and a height U map generation process as the U map generation process for generating the U map (U-disparity map).

頻度Uマップ生成処理では、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸にx、Y軸にd、Z軸に頻度を設定し、X−Yの2次元ヒストグラム情報を作成する。これを頻度Uマップと呼ぶ。本実施形態のUマップ生成部137では、路面からの高さHが所定の高さ範囲(たとえば20cmから3m)にある視差画像の点(x,y,d)についてだけ頻度Uマップを作成する。この場合、路面から当該所定の高さ範囲に存在する物体を適切に抽出することができる。 In the frequency U map generation process, the set (x, y, d) of the x-direction position, the y-direction position, and the difference value d in each difference pixel data included in the difference image data is x on the X-axis and d on the Y-axis. , Set the frequency on the Z axis and create XY two-dimensional histogram information. This is called a frequency U map. In the U map generation unit 137 of the present embodiment, the frequency U map is created only for the points (x, y, d) of the parallax image in which the height H from the road surface is in a predetermined height range (for example, 20 cm to 3 m). .. In this case, an object existing in the predetermined height range can be appropriately extracted from the road surface.

また、高さUマップ生成処理では、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸にx、Y軸にd、Z軸に路面からの高さを設定して、X−Yの2次元ヒストグラム情報を作成する。これを高さUマップと呼ぶ。このときの高さの値は路面からの高さが最高のものである。 Further, in the height U map generation process, the set (x, y, d) of the x-direction position, the y-direction position, and the difference value d in each difference pixel data included in the difference image data is x, Y on the X-axis. Set the d on the axis and the height from the road surface on the Z axis to create XY two-dimensional histogram information. This is called a height U map. The height value at this time is the highest from the road surface.

図7は、撮像部110aで撮像される基準画像の一例を模式的に表した画像例であり、図8は、図7の画像例に対応するUマップである。ここで、図8Aは頻度Uマップであり、図8Bは高さUマップである。 FIG. 7 is an image example schematically showing an example of a reference image captured by the image pickup unit 110a, and FIG. 8 is a U map corresponding to the image example of FIG. 7. Here, FIG. 8A is a frequency U map, and FIG. 8B is a height U map.

図7に示す画像例では、路面の左右両側にガードレール413,414が存在し、他車両としては、先行車両411と対向車両412がそれぞれ1台ずつ存在する。このとき、頻度Uマップにおいては、図8Aに示すように、左右のガードレール413,414に対応する高頻度の点は、左右両端側から中央に向かって上方へ延びるような略直線状603,604に分布する。一方、先行車両411と対向車両412に対応する高頻度の点は、左右のガードレールの間で、略X軸方向に平行に延びる線分の状態601,602で分布する。なお、先行車両411の背面部分又は対向車両412の前面部分以外に、これらの車両の側面部分が映し出されているような状況にあっては、同じ他車両を映し出している画像領域内において視差が生じる。このような場合、図8Aに示すように、他車両に対応する高頻度の点は、略X軸方向に平行に延びる線分と略X軸方向に対して傾斜した線分とが連結した状態の分布を示す。 In the image example shown in FIG. 7, guardrails 413 and 414 are present on both the left and right sides of the road surface, and as other vehicles, one preceding vehicle 411 and one oncoming vehicle 412 are present. At this time, in the frequency U map, as shown in FIG. 8A, the high frequency points corresponding to the left and right guardrails 413 and 414 are substantially linear 603,604 extending upward from both left and right ends toward the center. It is distributed in. On the other hand, the high-frequency points corresponding to the preceding vehicle 411 and the oncoming vehicle 412 are distributed between the left and right guardrails in the states of lines 601 and 602 extending in parallel in the substantially X-axis direction. In a situation where the side surface portions of these vehicles are projected in addition to the rear portion of the preceding vehicle 411 or the front portion of the oncoming vehicle 412, the parallax is generated in the image area in which the same other vehicle is projected. Occurs. In such a case, as shown in FIG. 8A, the high frequency points corresponding to other vehicles are in a state where a line segment extending parallel to the substantially X-axis direction and a line segment inclined with respect to the substantially X-axis direction are connected. The distribution of is shown.

また、高さUマップにおいては、左右のガードレール413,414、先行車両411、及び対向車両412における路面からの高さが最高の点が頻度Uマップと同様に分布する。ここで、先行車両に対応する点の分布701及び対向車両に対応する点の分布702の高さはガードレールに対応する点の分布703,704よりも高くなる。これにより、高さUマップにおける物体の高さ情報を物体検出に利用することができる。 Further, in the height U map, points having the highest height from the road surface in the left and right guardrails 413 and 414, the preceding vehicle 411, and the oncoming vehicle 412 are distributed in the same manner as in the frequency U map. Here, the height of the point distribution 701 corresponding to the preceding vehicle and the point distribution 702 corresponding to the oncoming vehicle is higher than the height of the point distribution 703 and 704 corresponding to the guardrail. Thereby, the height information of the object in the height U map can be used for the object detection.

《リアルUマップ生成処理》
次に、リアルUマップ生成部138について説明する。リアルUマップ生成部138では、リアルUマップ(Real U-disparity map)(「分布データ」の一例)を生成するUマップ生成処理として、リアル頻度Uマップ生成処理及びリアル高さUマップ生成処理を実行する。
<< Real U map generation process >>
Next, the real U map generation unit 138 will be described. In the real U map generation unit 138, as the U map generation process for generating a real U-disparity map (an example of "distribution data"), a real frequency U map generation process and a real height U map generation process are performed. Run.

リアルUマップは、Uマップにおける横軸を画像の画素単位から実際の距離に変換し、縦軸の視差値を距離に応じた間引き率を有する間引き視差に変換したものである。 In the real U map, the horizontal axis in the U map is converted from the pixel unit of the image to the actual distance, and the parallax value on the vertical axis is converted into the thinned parallax having the thinning rate according to the distance.

リアルUマップ生成部138は、リアル頻度Uマップ生成処理において、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸に水平方向の実際の距離、Y軸に間引き視差、Z軸に頻度を設定して、X−Yの2次元ヒストグラム情報を作成する。なお、本実施形態のリアルUマップ生成部138は、Uマップ生成部137と同様に、路面からの高さHが所定の高さ範囲にある視差画像の点(x,y,d)についてだけリアル頻度Uマップを作成する。なお、リアルUマップ生成部138は、Uマップ生成部137が生成したUマップに基づいて、リアルUマップを生成する構成としてもよい。 In the real frequency U-map generation process, the real U-map generation unit 138 sets a set (x, y, d) of the x-direction position, the y-direction position, and the difference value d in each difference pixel data included in the difference image data. Two-dimensional histogram information of XY is created by setting the actual distance in the horizontal direction on the X-axis, the thinning difference on the Y-axis, and the frequency on the Z-axis. The real U-map generation unit 138 of the present embodiment, like the U-map generation unit 137, is only for the points (x, y, d) of the parallax image in which the height H from the road surface is within a predetermined height range. Create a real frequency U map. The real U map generation unit 138 may be configured to generate a real U map based on the U map generated by the U map generation unit 137.

図9は、図8Aに示す頻度Uマップに対応するリアルUマップ(以下、リアル頻度Uマップ)を示す図である。図示のように、左右のガードレールは垂直の線状のパターン803,804で表され、先行車両、対向車両も実際の形に近いパターン801、802で表される。 FIG. 9 is a diagram showing a real U map (hereinafter referred to as a real frequency U map) corresponding to the frequency U map shown in FIG. 8A. As shown in the figure, the left and right guardrails are represented by vertical linear patterns 803,804, and the preceding vehicle and the oncoming vehicle are also represented by patterns 801 and 802 close to the actual shape.

縦軸の間引き視差は、遠距離(ここでは50m以上)については間引きなし、中距離(20m以上、50m未満)については1/2に間引き、近距離(10m以上、20m未満)については1/3に間引き、近距離(10m以上、20m未満)については1/8に間引いたものである。 The thinning parallax on the vertical axis is not thinned out for long distances (here, 50 m or more), thinned out to 1/2 for medium distances (20 m or more and less than 50 m), and 1 / for short distances (10 m or more and less than 20 m). It is thinned out to 3 and 1/8 for short distances (10 m or more and less than 20 m).

つまり、遠方ほど、間引く量を少なくしている。その理由は、遠方では物体が小さく写るため、視差データが少なく、距離分解能も小さいので間引きを少なくし、逆に近距離では、物体が大きく写るため、視差データが多く、距離分解能も大きいので間引きを多くする。 In other words, the farther away, the smaller the amount of thinning. The reason is that the object is small in the distance, so the parallax data is small, and the distance resolution is small, so the thinning is small. To increase.

横軸を画像の画素単位から実際の距離へ変換する方法、Uマップの(x,d)からリアルUマップの(X,d)を求める方法の一例について図10を用いて説明する。 An example of a method of converting the horizontal axis from a pixel unit of an image to an actual distance and a method of obtaining (X, d) of a real U map from (x, d) of a U map will be described with reference to FIG.

カメラから見て左右10mずつ、即ち20mの幅をオブジェクト検出範囲として設定する。リアルUマップの横方向1画素の幅を10cmとすると、リアルUマップの横方向サイズは200画素となる。 The width of 10 m on each side when viewed from the camera, that is, 20 m is set as the object detection range. Assuming that the width of one pixel in the horizontal direction of the real U map is 10 cm, the horizontal size of the real U map is 200 pixels.

カメラの焦点距離をf、カメラ中心からのセンサの横方向の位置をp、カメラから被写体までの距離をZ、カメラ中心から被写体までの横方向の位置をXとする。センサの画素サイズをsとすると、xとpの関係は「x=p/s」で表される。また、ステレオカメラの特性から、「Z=Bf/d」の関係がある。 Let f be the focal length of the camera, p be the lateral position of the sensor from the center of the camera, Z be the distance from the camera to the subject, and X be the lateral position from the center of the camera to the subject. Assuming that the pixel size of the sensor is s, the relationship between x and p is represented by "x = p / s". Further, due to the characteristics of the stereo camera, there is a relationship of "Z = Bf / d".

また、図より、「x=p*Z/f」の関係があるから、「X=sxB/d」で表すことができる。Xは実距離であるが、リアルUマップ上での横方向1画素の幅が10cmあるので、容易にXのリアルUマップ上での位置を計算することができる。 Further, since there is a relationship of "x = p * Z / f" from the figure, it can be represented by "X = sxB / d". Although X is an actual distance, since the width of one pixel in the horizontal direction on the real U map is 10 cm, the position of X on the real U map can be easily calculated.

図8Bに示す高さUマップに対応するリアルUマップ(以下、リアル高さUマップ)も同様の手順で作成することができる。 A real U map (hereinafter referred to as a real height U map) corresponding to the height U map shown in FIG. 8B can also be created by the same procedure.

リアルUマップには、縦横の長さをUマップより小さくできるので処理が高速になるというメリットがある。また、横方向が距離に非依存になるため、遠方、近傍いずれでも同じ物体は同じ幅で検出することが可能になり、後段の周辺領域除去や、横分離、縦分離への処理分岐の判定(幅の閾値処理)が簡単になるというメリットもある。 The real U map has the advantage that the processing speed can be increased because the vertical and horizontal lengths can be made smaller than the U map. In addition, since the horizontal direction is independent of the distance, it is possible to detect the same object with the same width both in the distance and in the vicinity. There is also an advantage that (width threshold processing) becomes easy.

Uマップにおける縦方向の長さは、測定可能な最短距離を何メートルにするかで決定される。つまり、「d=Bf/Z」であるから、測定可能な最短のZに応じて、dの最大値は決定される。また、視差値dはステレオ画像を扱うため、通常画素単位で計算されるが、少数を含むため、視差値に所定値を乗じて小数部分を四捨五入して整数化した視差値を使用する。 The vertical length in the U-map is determined by how many meters the shortest measurable distance is. That is, since "d = Bf / Z", the maximum value of d is determined according to the shortest measurable Z. Further, since the parallax value d handles a stereo image, it is usually calculated in pixel units, but since it includes a small number, a parallax value obtained by multiplying the parallax value by a predetermined value and rounding off a decimal part is used.

測定可能な最短のZが1/2になると、dは2倍になるので,それだけUマップのデータは巨大となる。そこで、リアルUマップを作成するときには、近距離ほど画素を間引いてデータを圧縮し、Uマップよりもデータ量を削減する。
そのため、ラベリングによるオブジェクト検出を高速に行うことができる。
When the shortest measurable Z is halved, d is doubled, so the U-map data becomes huge. Therefore, when creating a real U-map, the closer the distance is, the more pixels are thinned out to compress the data, and the amount of data is reduced as compared with the U-map.
Therefore, object detection by labeling can be performed at high speed.

《孤立領域検出》
次に、孤立領域検出部139が行う孤立領域検出処理について説明する。図11は、孤立領域検出処理の一例を示すフローチャートである。孤立領域検出部139では、まずリアルUマップ生成部138で生成されたリアル頻度Uマップの情報の平滑化を行う(ステップS111)。
《Isolated area detection》
Next, the isolated area detection process performed by the isolated area detection unit 139 will be described. FIG. 11 is a flowchart showing an example of the isolated area detection process. The isolated area detection unit 139 first smoothes the information of the real frequency U map generated by the real U map generation unit 138 (step S111).

これは、頻度値を平均化することで、有効な孤立領域を検出しやすくするためである。即ち、視差値には計算誤差等もあって分散があり、かつ、視差値がすべての画素について計算されているわけではないので、リアルUマップは図9に示した模式図とは異なり、ノイズを含んでいる。そこで、ノイズを除去するためと、検出したいオブジェクトを分離しやすくするため、リアルUマップを平滑化する。これは画像の平滑化と同様に、平滑化フィルタ(例えば3×3画素の単純平均)をリアルUマップの頻度値(リアル頻度Uマップ)に対して適用することで、ノイズと考えられるような頻度は減少し、オブジェクトの部分では頻度が周囲より高い、まとまったグループとなり、後段の孤立領域検出処理を容易にする効果がある。 This is to make it easier to detect effective isolated areas by averaging the frequency values. That is, since the parallax value has a variance due to a calculation error and the like, and the parallax value is not calculated for all the pixels, the real U map is different from the schematic diagram shown in FIG. 9 and has noise. Includes. Therefore, in order to remove noise and to make it easier to separate the object to be detected, the real U map is smoothed. Similar to image smoothing, this can be considered as noise by applying a smoothing filter (for example, a simple average of 3 x 3 pixels) to the frequency value of a real U map (real frequency U map). The frequency is reduced, and the frequency is higher than the surroundings in the object part, forming a cohesive group, which has the effect of facilitating the isolated area detection process in the subsequent stage.

次に、二値化の閾値を設定する(ステップS112)。最初は小さい値(=0)を用いて、平滑化されたリアルUマップの二値化を行う(ステップS113)。その後、値のある座標のラベリングを行って、孤立領域を検出する(ステップS114)。 Next, the threshold value for binarization is set (step S112). Initially, the smoothed real U map is binarized using a small value (= 0) (step S113). After that, the coordinate with a value is labeled to detect the isolated region (step S114).

この二つのステップでは、リアル頻度Uマップで頻度が周囲より高い孤立領域(島と呼ぶことにする)を検出する。検出には、リアル頻度Uマップをまず二値化する(ステップS113)。最初は閾値0で二値化を行う。これは、オブジェクトの高さや、その形状、路面視差との分離などがあるため、島は孤立しているものもあれば他の島と連結しているものもあることの対策である。即ち、小さい閾値からリアル頻度Uマップを二値化することで最初は孤立した適切な大きさの島を検出し、その後、閾値を増加させていくことで連結している島を分離し、孤立した適切な大きさの島として検出することを可能にしたものである。 In these two steps, the real frequency U-map detects isolated areas (called islands) whose frequency is higher than their surroundings. For detection, the real frequency U map is first binarized (step S113). Initially, binarization is performed with a threshold value of 0. This is a countermeasure against the fact that some islands are isolated and some are connected to other islands because of the height of the object, its shape, and separation from the road surface parallax. That is, by binarizing the real frequency U map from a small threshold, first isolated islands of appropriate size are detected, and then by increasing the threshold, the connected islands are separated and isolated. It made it possible to detect the island as an island of appropriate size.

二値化後の島を検出する方法はラベリングを用いる。二値化後の黒である座標(頻度値が二値化閾値より高い座標)をその連結性に基づいてラベリングして、同一ラベルが付いた領域を島とする。 Labeling is used as a method for detecting the binarized islands. Coordinates that are black after binarization (coordinates whose frequency value is higher than the binarization threshold) are labeled based on their connectivity, and the areas with the same label are designated as islands.

検出された複数の孤立領域についてそれぞれ大きさの判定を行う(ステップS115)。これは、検出対象が歩行者から大型自動車であるため、孤立領域の幅がそのサイズの範囲であるか否かを判定するのである。もし、その大きさが大きければ(ステップS115:YES)、二値化閾値を1だけインクリメントして(ステップS112)、リアル頻度Uマップの当該孤立領域内だけ二値化を行う(ステップS113)。そしてラベリングを行い、より小さな孤立領域を検出して(ステップS114)、その大きさを判定する(ステップS115)。 The size of each of the detected isolated regions is determined (step S115). This is because the detection target is from a pedestrian to a large vehicle, so it is determined whether or not the width of the isolated region is within the range of the size. If the size is large (step S115: YES), the binarization threshold is incremented by 1 (step S112), and binarization is performed only within the isolated region of the real frequency U map (step S113). Then, labeling is performed, a smaller isolated region is detected (step S114), and the size thereof is determined (step S115).

上記の閾値設定からラベリングの処理を繰り返し行い、所望の大きさの孤立領域を検出するのである。所望の大きさの孤立領域が検出できたなら(ステップS115:NO)、次に周辺領域除去を行う(ステップS116)。これは、遠方にある物体で、路面検出の精度が悪く、路面の視差がリアルUマップ内に導入され、物体と路面の視差が一塊になって検出された場合のその左右、近傍の高さが路面に近い部分の領域(孤立領域内の周辺部分)を削除する処理である。除去領域が存在する場合は(ステップS117:YES)、もう一度ラベリングを行って孤立領域の再設定を行う(ステップS114)。 The labeling process is repeated from the above threshold setting to detect an isolated region of a desired size. If an isolated region of a desired size can be detected (step S115: NO), then peripheral region removal is performed (step S116). This is a distant object, the accuracy of road surface detection is poor, the parallax of the road surface is introduced in the real U map, and the height of the left, right, and near when the parallax between the object and the road surface is detected as a mass. Is a process of deleting the area near the road surface (peripheral part in the isolated area). If the removed area exists (step S117: YES), labeling is performed again to reset the isolated area (step S114).

《視差画像の対応領域検出、及びオブジェクト領域抽出》
次に、視差画像の対応領域検出部140及びオブジェクト領域抽出部141について説明する。図12は、孤立領域検出部で検出された孤立領域が内接する矩形領域を設定したリアル頻度Uマップを示す図であり、図13は、図12における矩形領域に対応する走査範囲を設定した視差画像を示す図であり、図14は、図13における走査範囲を探索してオブジェクト領域を設定した視差画像を示す図である。
<< Detection of corresponding area of parallax image and extraction of object area >>
Next, the corresponding area detection unit 140 and the object area extraction unit 141 of the parallax image will be described. FIG. 12 is a diagram showing a real frequency U map in which a rectangular area inscribed by the isolated area detected by the isolated area detection unit is set, and FIG. 13 is a parallax in which a scanning range corresponding to the rectangular area in FIG. 12 is set. It is a figure which shows the image, and FIG. 14 is a figure which shows the parallax image which searched the scanning range in FIG. 13 and set the object area.

孤立領域検出部139によりオブジェクト候補領域として決定された孤立領域について、図12に示すように、当該孤立領域としての第1車両801、第2車両802が内接する矩形領域として第1検出島811及び第2検出島812を設定したとき、この矩形領域の幅(Uマップ上のX軸方向長さ)は、当該孤立領域に対応する識別対象物(オブジェクト)の幅に対応する。また、設定した矩形領域の高さは、当該孤立領域に対応する識別対象物(オブジェクト)の奥行き(自車両進行方向長さ)に対応している。一方で、各孤立領域に対応する識別対象物(オブジェクト)の高さについては、この段階では不明である。視差画像の対応領域検出部140は、オブジェクト候補領域に係る孤立領域に対応したオブジェクトの高さを得るために、当該孤立領域に対応する視差画像上の対応領域を検出する。 Regarding the isolated area determined as the object candidate area by the isolated area detection unit 139, as shown in FIG. 12, the first vehicle 801 as the isolated area, the first detection island 811 and the first detection island 811 as the rectangular area inscribed by the second vehicle 802. When the second detection island 812 is set, the width of this rectangular region (length in the X-axis direction on the U map) corresponds to the width of the identification object (object) corresponding to the isolated region. Further, the height of the set rectangular area corresponds to the depth (length in the traveling direction of the own vehicle) of the identification object (object) corresponding to the isolated area. On the other hand, the height of the identification object (object) corresponding to each isolated area is unknown at this stage. The corresponding area detection unit 140 of the parallax image detects the corresponding area on the parallax image corresponding to the isolated area in order to obtain the height of the object corresponding to the isolated area related to the object candidate area.

視差画像の対応領域検出部140は、孤立領域検出部139から出力される孤立領域の情報に基づき、リアルUマップから検出した第1検出島811及び第2検出島812島の位置、幅と最小視差から、図13に示す視差画像で検出すべき範囲である第1検出島対応領域走査範囲481及び第2検出島対応領域走査範囲482のx方向範囲(xmin,xmax)を決定できる。また、視差画像においてオブジェクトの高さと位置(ymin="最大視差dmaxの時の路面からの最大高さに相当するy座標"からymax="最大視差dmaxから得られる路面の高さを示すy"まで)を決定できる。 The corresponding area detection unit 140 of the disparity image is the position, width and minimum of the first detection island 811 and the second detection island 812 islands detected from the real U map based on the information of the isolated area output from the isolated area detection unit 139. From the parallax, the x-direction range (xmin, xmax) of the first detection island corresponding region scanning range 481 and the second detection island corresponding region scanning range 482, which are the ranges to be detected in the parallax image shown in FIG. 13, can be determined. Further, from the height and position of the object in the parallax image (y-coordinate corresponding to the maximum height from the road surface at the time of maximum parallax dmax), ymax = "y indicating the height of the road surface obtained from the maximum parallax dmax". Up to) can be determined.

次に、オブジェクトの正確な位置を検出するため、設定した走査範囲を走査し、孤立領域検出部139で検出した矩形の奥行き(最小視差dmin,最大視差dmax)の範囲の値を視差にもつ画素を候補画素として抽出する。そして、抽出した候補画素群の中で検出幅に対して横方向に所定の割合以上あるラインをオブジェクト候補ラインとする。 Next, in order to detect the exact position of the object, a pixel that scans the set scanning range and has a value in the range of the rectangular depth (minimum parallax dmin, maximum parallax dmax) detected by the isolated area detection unit 139 as the parallax. Is extracted as a candidate pixel. Then, among the extracted candidate pixel groups, a line having a predetermined ratio or more in the lateral direction with respect to the detection width is defined as an object candidate line.

次に、縦方向に走査して、ある注目しているオブジェクト候補ラインの周囲に他のオブジェクト候補ラインが所定の密度以上ある場合には、その注目しているオブジェクト候補ラインをオブジェクトラインとして判定する。 Next, it scans vertically, and if there are other object candidate lines around a certain object candidate line of interest at a predetermined density or higher, the object candidate line of interest is determined as an object line. ..

次に、オブジェクト領域抽出部141は、視差画像の探索領域でオブジェクトラインを探索して、オブジェクトラインの最下端、最上端を決定し、図14に示すように、オブジェクトライン群の外接矩形461,462を視差画像におけるオブジェクト(第1車両、第2車両)の領域451,452として決定する。 Next, the object area extraction unit 141 searches for an object line in the search area of the parallax image, determines the lowermost and uppermost ends of the object line, and as shown in FIG. 14, the circumscribing rectangle 461 of the object line group. 462 is determined as the regions 451 and 452 of the objects (first vehicle, second vehicle) in the parallax image.

図15は、視差画像の対応領域検出部140及びオブジェクト領域抽出部141で行われる処理の流れを示すフローチャートである。まずリアルUマップにおける島の位置、幅と最小視差から、視差画像に対するx軸方向の探索範囲を設定する(ステップS161)。 FIG. 15 is a flowchart showing the flow of processing performed by the corresponding area detection unit 140 and the object area extraction unit 141 of the parallax image. First, the search range in the x-axis direction with respect to the parallax image is set from the position, width, and minimum parallax of the island in the real U map (step S161).

次に島の最大視差dmaxと路面高さの関係から、視差画像に対するy軸方向の最大探索値ymaxを設定する(ステップS162)。次にリアル高さUマップにおける島の最大高さ、及びステップS172で設定したymaxとdmaxとから、視差画像に対するy軸方向の最小探索値yminを求めて設定することで、視差画像に対するy軸方向の探索範囲を設定する(ステップS163)。 Next, the maximum search value ymax in the y-axis direction with respect to the parallax image is set from the relationship between the maximum parallax dmax of the island and the road surface height (step S162). Next, the minimum search value ymin in the y-axis direction for the parallax image is obtained and set from the maximum height of the island in the real height U map and ymax and dmax set in step S172, so that the y-axis for the parallax image is set. The search range of the direction is set (step S163).

次いで設定した探索範囲で視差画像を探索して、島の最小視差dmin,最大視差dmaxの範囲内にある画素を抽出し、オブジェクト候補画素とする(ステップS164)。そのオブジェクト候補画素が横方向に一定以上の割合にあるとき、そのラインをオブジェクト候補ラインとして抽出する(ステップS165)。 Next, the parallax image is searched in the set search range, and the pixels within the range of the minimum parallax dmin and the maximum parallax dmax of the island are extracted and used as object candidate pixels (step S164). When the object candidate pixels are at a certain ratio or more in the horizontal direction, the line is extracted as an object candidate line (step S165).

オブジェクト候補ラインの密度を計算して、密度が所定の値より大きい場合はそのラインをオブジェクトラインと決定する(ステップS166)。最後にオブジェクトライン群の外接矩形を視差画像内のオブジェクト領域として検出する(ステップS167)。 The density of the object candidate line is calculated, and if the density is larger than a predetermined value, the line is determined as the object line (step S166). Finally, the circumscribed rectangle of the object line group is detected as the object area in the parallax image (step S167).

それにより、識別対象物(オブジェクト、物体)を認識することができる。 Thereby, the identification object (object, object) can be recognized.

《オブジェクトタイプ分類》
次に、オブジェクトタイプ分類部142について説明する。
《Object type classification》
Next, the object type classification unit 142 will be described.

前記オブジェクト領域抽出部141で抽出されるオブジェクト領域の高さ(yomax−yomin)から、下記の式〔2〕より、そのオブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の実際の高さHoを計算できる。ただし、「zo」は、当該オブジェクト領域内の最小視差値dから計算される当該オブジェクト領域に対応するオブジェクトと自車両との距離であり、「f」はカメラの焦点距離を(yomax−yomin)の単位と同じ単位に変換した値である。 From the height (yomax-yomin) of the object area extracted by the object area extraction unit 141, the identification object (object) projected on the image area corresponding to the object area is obtained from the following equation [2]. The actual height Ho can be calculated. However, "zo" is the distance between the object corresponding to the object area calculated from the minimum parallax value d in the object area and the own vehicle, and "f" is the focal length of the camera (yomax-yomin). It is a value converted to the same unit as the unit of.

Ho=zo×(yomax−yomin)/f …式〔2〕
同様に、オブジェクト領域抽出部141で抽出されるオブジェクト領域の幅(xomax−xomin)から、下記の式〔3〕より、そのオブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の実際の幅Woを計算できる。
Ho = zo × (yomax-yomin) / f ... Equation [2]
Similarly, from the width (xomax-xomin) of the object area extracted by the object area extraction unit 141, the identification object (object) projected in the image area corresponding to the object area from the following equation [3]. The actual width Wo of can be calculated.

Wo=zo×(xomax−xomin)/f …式〔3〕
また、当該オブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の奥行きDoは、当該オブジェクト領域に対応した孤立領域内の最大視差dmaxと最小視差dminから、下記の式〔4〕より計算することができる。
Wo = zo × (xomax-xomin) / f ... Equation [3]
Further, the depth Do of the identification object (object) projected in the image area corresponding to the object area is calculated by the following equation [4] from the maximum parallax dmax and the minimum parallax dmin in the isolated area corresponding to the object area. ] Can be calculated.

Do=BF×{(1/(dmin−offset)−1/(dmax−offset)} …式〔4〕
オブジェクトタイプ分類部142は、このようにして計算できるオブジェクト領域に対応するオブジェクトの高さ、幅、奥行きの情報から、そのオブジェクトタイプの分類を行う。図16に示す表は、オブジェクトタイプの分類を行うためのテーブルデータの一例を示すものである。図16の例では、例えば、幅が1100mm未満、高さが250mm未満、かつ奥行きが1000mmを超えていれば、「オートバイ、自転車」と判定される。また、幅が1100mm未満、高さが250mm未満、かつ奥行きが1000mm以下であれば、「歩行者」と判定される。これによれば、自車両前方に存在する識別対象物(オブジェクト)が、歩行者なのか、自転車またはオートバイなのか、小型車なのか、トラックなどか等を区別して認識することが可能となる。
Do = BF × {(1 / (dmin-offset) -1 / (dmax-offset)} ... Equation [4]
The object type classification unit 142 classifies the object type from the height, width, and depth information of the object corresponding to the object area that can be calculated in this way. The table shown in FIG. 16 shows an example of table data for classifying object types. In the example of FIG. 16, for example, if the width is less than 1100 mm, the height is less than 250 mm, and the depth is more than 1000 mm, it is determined to be a "motorcycle, bicycle". If the width is less than 1100 mm, the height is less than 250 mm, and the depth is 1000 mm or less, it is determined to be a "pedestrian". According to this, it is possible to distinguish whether the identification object (object) existing in front of the own vehicle is a pedestrian, a bicycle or a motorcycle, a small vehicle, a truck, or the like.

《3次元位置決定》
次に、3次元位置決定部143の処理について説明する。3次元位置決定部143は、自車両100に対する識別対象物(オブジェクト)の相対的な3次元の位置を決定する。
<< 3D position determination >>
Next, the processing of the three-dimensional positioning unit 143 will be described. The three-dimensional position determination unit 143 determines the relative three-dimensional position of the identification object (object) with respect to the own vehicle 100.

3次元位置決定部143は、検出されたオブジェクト領域に対応するオブジェクトまでの距離や、視差画像の画像中心と視差画像上のオブジェクト領域の中心との画像上の距離に基づいて、オブジェクトの3次元座標(実空間)における中心位置を、例えば以下の式により算出する。 The three-dimensional positioning unit 143 is a three-dimensional object based on the distance to the object corresponding to the detected object area and the distance on the image between the image center of the parallax image and the center of the object area on the parallax image. The center position in the coordinates (real space) is calculated by, for example, the following formula.

視差画像上のオブジェクト領域の中心座標を(region_centerX,region_centerY)とし、視差画像の画像中心座標を(image_centerX,image_centerY)としたとき、識別対象物(オブジェクト)の撮像部110a,110bに対する相対的な横方向の中心位置Xoおよび高さ方向の中心Yo位置は、下記の式〔5〕及び式〔6〕より計算できる。 When the center coordinates of the object area on the disparity image are (region_centerX, region_centerY) and the image center coordinates of the disparity image are (image_centerX, image_centerY), the laterality of the identification object (object) relative to the image pickup units 110a and 110b. The center position Xo in the direction and the center Yo position in the height direction can be calculated from the following equations [5] and [6].

Xo=Z×(region_centerX−image_centerX)/f …式〔5〕
Yo=Z×(region_centerY−image_centerY)/f …式〔6〕
《オブジェクトトラッキング》
次に、オブジェクトトラッキング部144について説明する。オブジェクトトラッキング部144は、以前(過去)のフレームから検出されたオブジェクト(物体)を、今回(現在)のフレームにおいてトラッキング(追跡)する処理を実行する。
Xo = Z × (region_centerX-image_centerX) / f ... Equation [5]
Yo = Z × (region_centerY-image_centerY) / f ... Equation [6]
《Object Tracking》
Next, the object tracking unit 144 will be described. The object tracking unit 144 executes a process of tracking an object (object) detected from a previous (past) frame in the current (current) frame.

オブジェクトトラッキング部144は、予測部1441、及び抽出部1442を有する。 The object tracking unit 144 has a prediction unit 1441 and an extraction unit 1442.

予測部1441は、以前のフレームに基づいて検出された所定の物体の位置に基づき、今回のフレームにおける当該所定の物体の位置を予測する。具体的には、予測部1441は、以前の複数のフレームの各オブジェクトの位置を用いて、当該オブジェクトと自車両100との相対的な移動速度及び移動方向を特定し、この移動速度及び移動方向に基づいて、今回のフレームの視差画像に対する各オブジェクトの位置を予測する。なお、この物体追跡処理には、公知の技術を適用可能である。 The prediction unit 1441 predicts the position of the predetermined object in the current frame based on the position of the predetermined object detected based on the previous frame. Specifically, the prediction unit 1441 identifies the relative movement speed and movement direction between the object and the own vehicle 100 by using the positions of the objects in the previous plurality of frames, and the movement speed and the movement direction. Based on, the position of each object with respect to the parallax image of this frame is predicted. A known technique can be applied to this object tracking process.

抽出部1442は、今回のフレームから、予測部1441により予測された位置に関する条件を満たす複数の物体を抽出する。また、抽出部1442は、当該複数の物体の各画像と、当該所定の物体の画像との類似度に基づいて、当該複数の物体のうち、当該所定の物体と同一の物体を抽出する。 The extraction unit 1442 extracts a plurality of objects satisfying the conditions relating to the position predicted by the prediction unit 1441 from this frame. Further, the extraction unit 1442 extracts the same object as the predetermined object from the plurality of objects based on the similarity between each image of the plurality of objects and the image of the predetermined object.

次に、図17を参照し、オブジェクトトラッキング部144によるオブジェクトトラッキング処理について説明する。図17は、オブジェクトトラッキング処理の一例を示すフローチャートである。なお、図17では、オブジェクト領域抽出部141により抽出された各オブジェクトのうちの一のオブジェクト(対象オブジェクト)についての処理を説明する。そのため、図17の処理は、オブジェクト領域抽出部141により抽出された各オブジェクトに対して行われる。 Next, with reference to FIG. 17, the object tracking process by the object tracking unit 144 will be described. FIG. 17 is a flowchart showing an example of the object tracking process. Note that FIG. 17 describes the processing of one object (target object) among the objects extracted by the object area extraction unit 141. Therefore, the process of FIG. 17 is performed on each object extracted by the object area extraction unit 141.

ステップS201において、オブジェクトトラッキング部144の予測部1441は、3次元位置決定部143により以前の複数のフレームに基づいて決定された対象オブジェクトの位置に基づき、今回のフレームに対する対象オブジェクトの位置を予測する。例えば、予測部1441は、前々回のフレームにおける対象オブジェクトの位置と、前回のフレームにおける対象オブジェクトの位置との差分を、自車両に対する相対速度とする。そして、前回のフレームにおける対象オブジェクトの位置から、当該相対速度の分だけ移動させた位置を、今回のフレームにおける対象オブジェクトの位置であると予測する。すなわち、例えば、相対速度がリアルUマップ上で横方向(X軸方向)に1m/フレーム、奥行き方向(Y軸方向)に2m/フレームの場合、横方向に1m、奥行き方向に2m移動させた位置が、今回のフレームにおける対象オブジェクトの位置であると予測される。なお、ステップS201における位置の予測は、他の公知技術を用いてもよい。 In step S201, the prediction unit 1441 of the object tracking unit 144 predicts the position of the target object with respect to the current frame based on the position of the target object determined by the three-dimensional position determination unit 143 based on the previous plurality of frames. .. For example, the prediction unit 1441 uses the difference between the position of the target object in the previous frame and the position of the target object in the previous frame as the relative speed with respect to the own vehicle. Then, the position moved by the relative speed from the position of the target object in the previous frame is predicted to be the position of the target object in the current frame. That is, for example, when the relative velocity is 1 m / frame in the lateral direction (X-axis direction) and 2 m / frame in the depth direction (Y-axis direction) on the real U map, the relative velocity is moved 1 m in the lateral direction and 2 m in the depth direction. The position is predicted to be the position of the target object in this frame. In addition, other known techniques may be used for the prediction of the position in step S201.

続いて、オブジェクトトラッキング部144の抽出部1442は、ステップS201で対象オブジェクトについて予測した位置と、今回のフレームに基づいて検出された位置とが、所定の条件を満たす1以上のオブジェクトを抽出する(ステップS202)。なお、当該所定の条件を満たすか否かの閾値は、例えば設定に応じて変更できるようにしてもよい。また、抽出部1442は、例えば今回のフレームに基づいて検出されたオブジェクトの数が所定数以上の場合や、追跡しているオブジェクトの数が所定数以上の場合に、当該所定の条件が満たされにくくなるように、当該閾値を変更してもよい。これにより、例えば、障害物等が比較的多く検出される道路を走行している場合に、今回のフレームで検出された一の物体を、以前のフレームで検出された他の物体と同一であると誤判定される可能性を低減できる。 Subsequently, the extraction unit 1442 of the object tracking unit 144 extracts one or more objects whose positions predicted for the target object in step S201 and the positions detected based on the current frame satisfy a predetermined condition ( Step S202). The threshold value for whether or not the predetermined condition is satisfied may be changed, for example, according to the setting. Further, the extraction unit 1442 satisfies the predetermined condition, for example, when the number of objects detected based on the current frame is a predetermined number or more, or when the number of objects being tracked is a predetermined number or more. The threshold value may be changed so as to be difficult. As a result, for example, when traveling on a road where a relatively large number of obstacles are detected, one object detected in the current frame is the same as another object detected in the previous frame. It is possible to reduce the possibility of being erroneously determined.

続いて、オブジェクトトラッキング部144の抽出部1442は、対象オブジェクトの特徴と、抽出した各オブジェクトの特徴とに基づいて、抽出した各オブジェクトのうち、対象オブジェクトと一致するオブジェクトを抽出する(ステップS203)。これにより、複数のフレームにおいて、同一の物体は、同一の物体として把握される。 Subsequently, the extraction unit 1442 of the object tracking unit 144 extracts an object that matches the target object from the extracted objects based on the characteristics of the target object and the characteristics of each extracted object (step S203). .. As a result, the same object is grasped as the same object in a plurality of frames.

ステップS203において、オブジェクトの特徴として、例えば画像の特徴量が用いられてもよい。この場合、例えば、高次局所自己相関特徴抽出法(HLAC:Higher-order Local AutoCorrelation)や、HOG(Histogram of Oriented Gradient)等の公知の方法を用いて、画像の特徴量が算出されてもよい。 In step S203, for example, an image feature amount may be used as the feature of the object. In this case, for example, a known method such as a higher-order local autocorrelation (HLAC) or a HOG (Histogram of Oriented Gradient) may be used to calculate the feature amount of the image. ..

HLACは、画像の濃淡を表す関数g(x, y)の自己相関をN次に拡張し、g(x, y)g(x+a1, y+b1)‥g(x+aN, y+bN)の変位ai, biを、参照画素(x, y)周辺の局所領域に限定して、画像の特徴を抽出する方法である。相関の次数を二次まで(3点相関)、変位を3×3画素の局所領域に限定すると、白黒2値画像の場合は、25次元のパターンとなり、この25次元のパターンで示される画素値を画像の特徴量とする。 HLAC extends the autocorrelation of the function g (x, y), which represents the shading of an image, to the Nth order, and g (x, y) g (x + a1, y + b1) ‥ g (x + aN, y + This is a method of extracting the features of an image by limiting the displacements ai and bi of bN) to the local region around the reference pixel (x, y). When the degree of correlation is up to the second order (three-point correlation) and the displacement is limited to the local area of 3 × 3 pixels, in the case of a black-and-white binary image, a 25-dimensional pattern is obtained, and the pixel value indicated by this 25-dimensional pattern is obtained. Is the feature amount of the image.

HOGは、入力画像から計算したエッジ画像に対して、各ブロック領域ごとの方位ヒストグラムを特徴量として計算する方法である。 HOG is a method of calculating an orientation histogram for each block region as a feature amount for an edge image calculated from an input image.

抽出部1442は、以前のフレームにおける対象オブジェクトの画像の特徴量と、抽出した各オブジェクトの画像の特徴量とをそれぞれ比較することにより、画像間の類似度を算出する。例えば、HLAC等を用いて算出した2つの画像の25次元の各特徴量間のユークリッド距離を、2つの画像間の類似度として算出する。そして、抽出部1442は、例えば、類似度が最も高いオブジェクトを、今回のフレームにおける対象オブジェクトであると判定する。 The extraction unit 1442 calculates the similarity between the images by comparing the feature amount of the image of the target object in the previous frame with the feature amount of the image of each extracted object. For example, the Euclidean distance between the 25-dimensional feature quantities of the two images calculated using HLAC or the like is calculated as the degree of similarity between the two images. Then, the extraction unit 1442 determines, for example, that the object having the highest degree of similarity is the target object in the current frame.

なお、オブジェクトの特徴として、画像の特徴量のみならず、オブジェクトの位置も用いてもよい。例えば、画像の特徴量が対象オブジェクトに近く、かつ、オブジェクトの位置が予測された位置に近い程、値が高くなるスコアを用いてもよい。 As the feature of the object, not only the feature amount of the image but also the position of the object may be used. For example, a score may be used in which the value becomes higher as the feature amount of the image is closer to the target object and the position of the object is closer to the predicted position.

また、オブジェクトの特徴として、視差画像または基準画像におけるオブジェクトの領域の重なり度も用いてもよい。例えば、画像の特徴量が対象オブジェクトに近く、オブジェクトの位置が予測された位置に近く、かつ、視差画像または基準画像におけるオブジェクトの領域の重なり度が高い程、値が高くなるスコアを用いてもよい。 Further, as a feature of the object, the degree of overlap of the area of the object in the parallax image or the reference image may also be used. For example, even if a score is used in which the feature amount of the image is closer to the target object, the position of the object is closer to the predicted position, and the overlap degree of the object area in the parallax image or the reference image is higher, the higher the value is. good.

次に、図18を参照し、図17のオブジェクトトラッキング処理のより詳細な例について説明する。図18は、オブジェクトトラッキング処理の詳細な一例を示すフローチャートである。 Next, with reference to FIG. 18, a more detailed example of the object tracking process of FIG. 17 will be described. FIG. 18 is a flowchart showing a detailed example of the object tracking process.

ステップS2001において、予測部1441は、3次元位置決定部143により以前の複数のフレームに基づいて決定された対象オブジェクトの1以上の候補の位置に基づき、今回のフレームに対する対象オブジェクトの1以上の候補の各々の位置(予測位置)を予測する。なお、対象オブジェクトの候補については後述する。 In step S2001, the prediction unit 1441 is one or more candidates for the target object for the current frame based on the positions of one or more candidates for the target object determined by the three-dimensional positioning unit 143 based on a plurality of previous frames. Predict each position (predicted position) of. The candidates for the target object will be described later.

続いて、抽出部1442は、オブジェクトタイプ分類部142により判定された、対象オブジェクトのオブジェクトタイプを取得する(ステップS2002)。 Subsequently, the extraction unit 1442 acquires the object type of the target object determined by the object type classification unit 142 (step S2002).

続いて、抽出部1442は、ステップS2001で対象オブジェクトの1以上の候補の各々について予測した位置から、対象オブジェクトのオブジェクトタイプに応じた実距離の範囲内に、今回のフレームに基づいて検出されたオブジェクトが複数存在するか否かを判定する(ステップS2003)。ここで、オブジェクトタイプに応じた範囲は、例えば、オブジェクトタイプが「歩行者」等であれば予測位置を中心とする半径2m以内、「小型車」等であれば予測位置を中心とする半径3m以内の範囲とされてもよい。図19は、対象オブジェクトのオブジェクトタイプに応じた実距離の範囲について説明する図である。図19(A)では、対象オブジェクトのオブジェクトタイプが「歩行者」等である場合の、予測位置901aからの実距離の範囲902aの例を示す。図19(B)では、対象オブジェクトのオブジェクトタイプが「小型車」等である場合の、予測位置901bからの実距離の範囲902bの例を示す。このように、自車両に対する相対速度が比較的大きいと考えられるオブジェクトタイプの場合、予測位置からの実距離の範囲が比較的大きく設定される。 Subsequently, the extraction unit 1442 was detected based on the current frame from the position predicted for each of the one or more candidates of the target object in step S2001 within the range of the actual distance according to the object type of the target object. It is determined whether or not there are a plurality of objects (step S2003). Here, the range according to the object type is, for example, within a radius of 2 m centered on the predicted position if the object type is "pedestrian" or the like, and within a radius of 3 m centered on the predicted position if the object type is "small car" or the like. It may be in the range of. FIG. 19 is a diagram illustrating a range of actual distances according to the object type of the target object. FIG. 19A shows an example of a range 902a of the actual distance from the predicted position 901a when the object type of the target object is “pedestrian” or the like. FIG. 19B shows an example of the range 902b of the actual distance from the predicted position 901b when the object type of the target object is "small car" or the like. As described above, in the case of the object type in which the relative speed with respect to the own vehicle is considered to be relatively large, the range of the actual distance from the predicted position is set to be relatively large.

複数存在しない場合(ステップS2003でNO)、処理を終了する。この場合、範囲内に存在する1のオブジェクトが、対象オブジェクトと一致するオブジェクトであると判定され、以降のフレームにおいて追跡されてもよい。 If there are no more than one (NO in step S2003), the process ends. In this case, one object existing in the range may be determined to be an object matching the target object and may be tracked in subsequent frames.

複数存在する場合(ステップS2003でYES)、抽出部1442は、当該複数のオブジェクトの各々について、対象オブジェクトとの画像の類似度を算出する(ステップS2004)。なお、対象オブジェクトの画像は、以前の複数のフレームの輝度画像または視差画像における対象オブジェクトの領域の画像の平均値を用いてもよい。または、対象オブジェクトが追跡対象とされた際の画像を用いてもよい。 When a plurality of objects exist (YES in step S2003), the extraction unit 1442 calculates the similarity of the image with the target object for each of the plurality of objects (step S2004). As the image of the target object, the average value of the images in the region of the target object in the luminance image or the parallax image of the previous plurality of frames may be used. Alternatively, the image when the target object is tracked may be used.

続いて、抽出部1442は、当該複数のオブジェクトのうち、対象オブジェクトとの画像の類似度が最も高いオブジェクトを、対象オブジェクトと一致するオブジェクトであると判定する(ステップS2005)。 Subsequently, the extraction unit 1442 determines that the object having the highest image similarity with the target object among the plurality of objects is an object that matches the target object (step S2005).

続いて、抽出部1442は、当該複数のオブジェクトのうち、対象オブジェクトとの画像の類似度が高い順に、所定数以下のオブジェクトを、対象オブジェクトと一致するオブジェクトの候補として選択する(ステップS2006)。
これにより、以降のフレームにおいて、対象オブジェクトと一致するオブジェクトの候補についても、ステップS2005で対象オブジェクトと一致すると判定されたオブジェクトと同様に、対象オブジェクトであるか否かの判定対象とされる。そのため、今回のフレームにおいて例えば一時的な光の反射や、一時的に何らかの物体の影に入ったこと等により、画像の類似度が低く算出され、別のオブジェクトが対象オブジェクトとして追跡された場合でも、以降のフレームにおいて、対象オブジェクトを正しく検出できる。
Subsequently, the extraction unit 1442 selects, among the plurality of objects, the objects having a predetermined number or less in descending order of the degree of similarity of the image with the target object as the candidate objects matching the target object (step S2006).
As a result, in the subsequent frames, the candidate objects that match the target object are also subject to determination as to whether or not they are the target objects, as with the objects that are determined to match the target object in step S2005. Therefore, even if the similarity of the image is calculated to be low due to, for example, temporary reflection of light or temporary shadow of some object in this frame, and another object is tracked as the target object. , The target object can be detected correctly in the subsequent frames.

<変形例>
次に、図20を参照し、図17のオブジェクトトラッキング処理のより詳細な他の例について説明する。図20は、オブジェクトトラッキング処理の詳細な他の一例を示すフローチャートである。
<Modification example>
Next, with reference to FIG. 20, another more detailed example of the object tracking process of FIG. 17 will be described. FIG. 20 is a flowchart showing another detailed example of the object tracking process.

ステップS3001において、予測部1441は、3次元位置決定部143により以前の複数のフレームに基づいて決定された対象オブジェクトの位置に基づき、今回のフレームに対する対象オブジェクトの位置を予測する。 In step S3001, the prediction unit 1441 predicts the position of the target object with respect to the current frame based on the position of the target object determined by the three-dimensional position determination unit 143 based on the previous plurality of frames.

続いて、抽出部1442は、ステップS3001で算出した予測位置に基づいて、今回のフレームに対して予想される対象オブジェクトの視差画像内の領域を算出する(ステップS3002)。例えば、抽出部1442は、上述した視差画像の対応領域検出部140と同様の処理により、対象オブジェクトの視差画像内の領域を算出する。 Subsequently, the extraction unit 1442 calculates an area in the parallax image of the target object expected for the current frame based on the predicted position calculated in step S3001 (step S3002). For example, the extraction unit 1442 calculates the region in the parallax image of the target object by the same processing as the parallax image corresponding region detection unit 140 described above.

続いて、抽出部1442は、ステップS3002で算出した今回のフレームに対して予想される対象オブジェクトの視差画像内の領域と、オブジェクト領域抽出部141により抽出された、今回のフレームにおける各オブジェクトのオブジェクト領域との重なり度をそれぞれ算出する(ステップS3003)。 Subsequently, the extraction unit 1442 has the area in the parallax image of the target object expected for the current frame calculated in step S3002, and the object of each object in the current frame extracted by the object area extraction unit 141. The degree of overlap with the region is calculated (step S3003).

ここで、重なり度は、2つの領域の一致度を示す値であり、例えば、今回のフレームに対して予想される対象オブジェクトの視差画像内の領域の面積をL、今回のフレームにおける一のオブジェクトのオブジェクト領域の面積をKとし、当該2つの領域が重なる領域の面積をMとした場合に、K及びLに対するMの割合としてもよい。この場合、重なり度Wは、例えば、下記の式〔7〕より計算できる。 Here, the degree of overlap is a value indicating the degree of coincidence between the two regions. For example, the area of the region in the parallax image of the target object expected for the current frame is L, and one object in the current frame. When the area of the object area of is K and the area of the area where the two areas overlap is M, the ratio of M to K and L may be used. In this case, the overlap degree W can be calculated by, for example, the following equation [7].

W=M/{(K+L)/2} …式〔7〕
図21は、重なり度について説明する図である。図21では、今回のフレームに対して予想される対象オブジェクトの視差画像内の領域911と、今回のフレームにおける各オブジェクト912a、912bのオブジェクト領域913a、913bとが重なる領域914a、914bの例が示されている。
W = M / {(K + L) / 2} ... Equation [7]
FIG. 21 is a diagram illustrating the degree of overlap. FIG. 21 shows an example of regions 914a and 914b in which the region 911 in the parallax image of the target object expected for the current frame and the object regions 913a and 913b of the objects 912a and 912b in the current frame overlap. Has been done.

続いて、抽出部1442は、今回のフレームにおける各オブジェクトのうち、当該重なり度が第1の閾値以上であるオブジェクトが存在するか否かを判定する(ステップS3004)。 Subsequently, the extraction unit 1442 determines whether or not there is an object whose overlap degree is equal to or higher than the first threshold value among the objects in the current frame (step S3004).

当該重なり度が第1の閾値以上であるオブジェクトが存在する場合(ステップS3004でYES)、抽出部1442は、当該オブジェクトを、対象オブジェクトと一致するオブジェクトであると判定し(ステップS3005)、処理を終了する。 When there is an object whose overlap degree is equal to or higher than the first threshold value (YES in step S3004), the extraction unit 1442 determines that the object is an object that matches the target object (step S3005), and performs processing. finish.

当該重なり度が第1の閾値以上であるオブジェクトが存在しない場合(ステップS3004でNO)、抽出部1442は、今回のフレームにおける各オブジェクトのうち、当該重なり度が第1の閾値よりも低い第2の閾値以上である1以上のオブジェクトを抽出する(ステップS3006)。なお、第2の閾値以上であるオブジェクトが存在しない場合、処理を終了してもよい。この場合、例えば、以降の所定数のフレームにおいて、対象オブジェクトと一致するオブジェクトが検出できない場合、対象オブジェクトをトラッキングの対象から除外してもよい。 When there is no object whose overlap degree is equal to or higher than the first threshold value (NO in step S3004), the extraction unit 1442 has a second object whose overlap degree is lower than the first threshold value among the objects in the current frame. Extract one or more objects that are equal to or greater than the threshold value of (step S3006). If there is no object that is equal to or greater than the second threshold value, the process may be terminated. In this case, for example, if an object matching the target object cannot be detected in the subsequent predetermined number of frames, the target object may be excluded from the tracking target.

続いて、抽出部1442は、ステップS3006で抽出した1以上のオブジェクトの各々について、対象オブジェクトとの画像の類似度を算出する(ステップS3007)。 Subsequently, the extraction unit 1442 calculates the similarity of the image with the target object for each of the one or more objects extracted in step S3006 (step S3007).

続いて、抽出部1442は、当該1以上のオブジェクトのうち、対象オブジェクトとの画像の類似度が所定値以上であり、かつ、ステップS3003で算出した重なり度が最も高いオブジェクトを、対象オブジェクトと一致するオブジェクトであると判定する(ステップS3008)。なお、抽出部1442は、ステップS3008において、例えば、当該1以上のオブジェクトのうち、画像の類似度に、重なり度に応じた重み係数を乗算した値が最も高いオブジェクトを、対象オブジェクトと一致するオブジェクトであると判定してもよい。これにより、重なり度が一定以上のオブジェクトがなく、対象オブジェクトが検出できない状況であったとしても、条件を緩めてオブジェクトの候補を抽出したうえで、異なる条件により対象オブジェクトを検出するため、精度の高いトラッキングを継続できる。 Subsequently, the extraction unit 1442 matches the object having the same image similarity with the target object as the predetermined value or more and having the highest degree of overlap calculated in step S3003 among the one or more objects with the target object. It is determined that the object is to be used (step S3008). In step S3008, the extraction unit 1442 selects, for example, the object having the highest value obtained by multiplying the similarity of images by the weighting coefficient according to the degree of overlap among the one or more objects, as an object that matches the target object. It may be determined that. As a result, even if there are no objects with a certain degree of overlap and the target object cannot be detected, the target object is detected under different conditions after relaxing the conditions and extracting the object candidates. High tracking can be continued.

なお、図18と同様に、今回のフレームで選択した対象オブジェクトと一致するオブジェクトの候補を選択し、当該候補についても、以降のフレームにおいて、ステップS3005またはステップS3008で対象オブジェクトと一致すると判定されたオブジェクトと同様に、対象オブジェクトであるか否かの判定対象としてもよい。この場合、例えば、対象オブジェクトとの画像の類似度が所定値以上であり、かつ、ステップS3003で算出した重なり度が高い順に、所定数以下のオブジェクトを、対象オブジェクトと一致するオブジェクトの候補として選択されてもよい。 As in FIG. 18, a candidate for an object that matches the target object selected in this frame is selected, and it is determined that the candidate also matches the target object in step S3005 or step S2008 in the subsequent frames. Like an object, it may be a target for determining whether or not it is a target object. In this case, for example, objects having a predetermined number or less are selected as candidate objects matching the target object in descending order of the degree of similarity of the image with the target object to the predetermined value or more and the degree of overlap calculated in step S3003. May be done.

<まとめ>
上述した実施形態によれば、以前のフレームで検出された所定の物体について、今回における当該所定の物体の予測位置が算出される。そして、当該予想位置に応じた条件を満たす複数の物体のうち、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、前記所定の物体と同一の物体が抽出される。それにより、精度の高いトラッキングを継続できる。
<Summary>
According to the above-described embodiment, the predicted position of the predetermined object detected in the previous frame is calculated at this time. Then, among the plurality of objects satisfying the conditions corresponding to the predicted positions, the same object as the predetermined object is extracted based on the degree of similarity between each image of the plurality of objects and the image of the predetermined object. Will be done. As a result, highly accurate tracking can be continued.

なお、距離の値(距離値)と視差値は等価に扱えることから、本実施形態においては距離画像の一例として視差画像を用いて説明しているが、これに限られない。例えば、ステレオカメラを用いて生成した視差画像に対して、ミリ波レーダやレーザレーダ等の検出装置を用いて生成した距離情報を統合して、距離画像を生成してもよい。また、ステレオカメラと、ミリ波レーダやレーザレーダ等の検出装置を併用し、上述したステレオカメラによる物体の検出結果と組み合わせることにより、検出の精度をさらに高める構成としてもよい。 Since the distance value (distance value) and the parallax value can be treated equivalently, the parallax image is described as an example of the distance image in the present embodiment, but the present invention is not limited to this. For example, a distance image may be generated by integrating the parallax image generated by using a stereo camera with the distance information generated by using a detection device such as a millimeter wave radar or a laser radar. Further, a stereo camera and a detection device such as a millimeter wave radar or a laser radar may be used in combination and combined with the detection result of an object by the stereo camera described above to further improve the detection accuracy.

上述した実施形態におけるシステム構成は一例であり、用途や目的に応じて様々なシステム構成例があることは言うまでもない。また、上述した各実施形態の一部又は全部を組み合わせることも可能である。 The system configuration in the above-described embodiment is an example, and it goes without saying that there are various system configuration examples depending on the application and purpose. It is also possible to combine some or all of the above-described embodiments.

例えば、処理ハードウェア部120及び画像解析ユニット102の各機能部の少なくとも一部の処理を行う機能部は、1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。 For example, the functional unit that performs processing at least a part of each functional unit of the processing hardware unit 120 and the image analysis unit 102 may be realized by cloud computing composed of one or more computers.

また、上述の実施の形態では、機器制御システム1が自車両100としての自動車に搭載される例について説明したが、これに限定されるものではない。例えば、他の車両の一例としてバイク、自転車、車椅子または農業用の耕運機等の車両に搭載されるものとしてもよい。また、移動体の一例としての車両だけでなく、ロボット等の移動体に搭載されるものとしてもよい。 Further, in the above-described embodiment, an example in which the device control system 1 is mounted on an automobile as the own vehicle 100 has been described, but the present invention is not limited thereto. For example, as an example of another vehicle, it may be mounted on a vehicle such as a motorcycle, a bicycle, a wheelchair, or an agricultural cultivator. Further, it may be mounted not only on a vehicle as an example of a moving body but also on a moving body such as a robot.

また、処理ハードウェア部120及び画像解析ユニット102の各機能部は、ハードウェアによって実現される構成としてもよいし、CPUが記憶装置に格納されたプログラムを実行することによって実現される構成としてもよい。このプログラムは、インストール可能な形式又は実行可能な形式のファイルによって、コンピュータで読み取り可能な記録メディアに記録されて流通されるようにしても良い。また、上記記録メディアの例として、CD−R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、ブルーレイディスク等が挙げられる。また、このプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、このプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。 Further, each functional unit of the processing hardware unit 120 and the image analysis unit 102 may be configured to be realized by hardware, or may be configured to be realized by the CPU executing a program stored in the storage device. good. The program may be recorded and distributed on computer-readable recording media in installable or executable files. Examples of the recording media include CD-R (Compact Disc Recordable), DVD (Digital Versatile Disk), and Blu-ray Disc. Further, this program may be stored on a computer connected to a network such as the Internet and provided by downloading via the network. In addition, this program may be configured to be provided or distributed via a network such as the Internet.

1 機器制御システム
100 自車両
101 撮像ユニット
102 画像解析ユニット(「情報処理装置」の一例)
103 表示モニタ
104 車両走行制御ユニット(「制御部」の一例)
110a,110b 撮像部
120 処理ハードウェア部
132 視差画像生成部
134 Vマップ生成部(「取得部」の一例)
135 路面形状検出部
137 Uマップ生成部
138 リアルUマップ生成部
139 孤立領域検出部
140 視差画像の対応領域検出部
141 オブジェクト領域抽出部
142 オブジェクトタイプ分類部
143 3次元位置決定部(「算出部」の一例)
144 オブジェクトトラッキング部
1441 予測部
1442 抽出部
2 撮像装置
1 Equipment control system 100 Own vehicle 101 Imaging unit 102 Image analysis unit (an example of "information processing device")
103 Display monitor 104 Vehicle driving control unit (an example of "control unit")
110a, 110b Imaging unit 120 Processing hardware unit 132 Parallax image generation unit 134 V map generation unit (an example of "acquisition unit")
135 Road surface shape detection unit 137 U map generation unit 138 Real U map generation unit 139 Isolated area detection unit 140 Parallax image corresponding area detection unit 141 Object area extraction unit 142 Object type classification unit 143 Three-dimensional position determination unit (“calculation unit”) An example)
144 Object tracking unit 1441 Prediction unit 1442 Extraction unit 2 Imaging device

特開2009−122786号公報Japanese Unexamined Patent Publication No. 2009-122786

Claims (10)

複数の時点における、物体の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報を取得する取得部と、
前記取得部により以前に取得された前記情報における所定の物体の位置に基づき、前記取得部により今回取得された前記情報における前記所定の物体の位置を予測する予測部と、
今回の前記情報から、前記所定の物体の位置に応じた所定の条件を満たす複数の物体を抽出し、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、今回の前記情報における前記複数の物体のうち、以前の前記情報における前記所定の物体と同一の物体を抽出する抽出部と、を備え、
前記所定の物体の位置に応じた前記所定の条件を前記複数の物体が満たすことは、前記予測部により算出された前記所定の物体の位置から、前記所定の物体の種別に応じた所定の距離以内に前記複数の物体が位置することである、
情報処理装置。
An acquisition unit that acquires information in which the vertical position, the horizontal position, and the depth position of the object are associated with each other at a plurality of time points.
A prediction unit that predicts the position of the predetermined object in the information acquired this time by the acquisition unit based on the position of the predetermined object in the information previously acquired by the acquisition unit.
From the information this time, a plurality of objects satisfying a predetermined condition according to the position of the predetermined object are extracted, and based on the degree of similarity between each image of the plurality of objects and the image of the predetermined object, It is provided with an extraction unit for extracting the same object as the predetermined object in the previous information among the plurality of objects in the information this time.
Satisfaction of the predetermined condition according to the position of the predetermined object means that the plurality of objects satisfy the predetermined distance from the position of the predetermined object calculated by the prediction unit according to the type of the predetermined object. The plurality of objects are located within the range.
Information processing device.
複数の時点における、物体の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報を取得する取得部と、An acquisition unit that acquires information in which the vertical position, the horizontal position, and the depth position of the object are associated with each other at a plurality of time points.
前記取得部により以前に取得された前記情報における所定の物体の位置に基づき、前記取得部により今回取得された前記情報における前記所定の物体の位置を予測する予測部と、A prediction unit that predicts the position of the predetermined object in the information acquired this time by the acquisition unit based on the position of the predetermined object in the information previously acquired by the acquisition unit.
今回の前記情報から、前記所定の物体の位置に応じた所定の条件を満たす複数の物体を抽出し、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、今回の前記情報における前記複数の物体のうち、以前の前記情報における前記所定の物体と同一の物体を抽出する抽出部と、を備え、From the information this time, a plurality of objects satisfying a predetermined condition according to the position of the predetermined object are extracted, and based on the degree of similarity between each image of the plurality of objects and the image of the predetermined object, It is provided with an extraction unit for extracting the same object as the predetermined object in the previous information among the plurality of objects in the information this time.
前記所定の物体の位置に応じた前記所定の条件を前記複数の物体が満たすことは、今回の前記情報において、前記縦方向及び前記横方向で、前記所定の物体が存在する領域と、前記複数の物体の各々が存在する領域との重なり度が、所定の閾値以上であることである、The fact that the plurality of objects satisfy the predetermined conditions according to the position of the predetermined object means that, in the present information, the region in which the predetermined object exists and the plurality of objects in the vertical direction and the horizontal direction. The degree of overlap with the region where each of the objects is present is equal to or greater than a predetermined threshold value.
情報処理装置。Information processing device.
前記抽出部は、前記複数の物体のうち、前記所定の物体の画像との類似度が最も高い物体を、前記所定の物体と同一の物体として抽出する、
請求項1又は2に記載の情報処理装置。
The extraction unit extracts, among the plurality of objects, the object having the highest degree of similarity to the image of the predetermined object as the same object as the predetermined object.
The information processing apparatus according to claim 1 or 2.
前記抽出部は、前記類似度と、前記予測部により予測された所定の物体の位置から、今回の前記情報における前記複数の物体の各々の位置までの距離とに基づいて、前記複数の物体のうち、前記所定の物体と同一の物体を抽出する、
請求項1乃至のいずれか一項に記載の情報処理装置。
The extraction unit is based on the similarity and the distance from the position of a predetermined object predicted by the prediction unit to each position of the plurality of objects in the information this time. Of these, the same object as the predetermined object is extracted.
The information processing apparatus according to any one of claims 1 to 3.
前記抽出部は、前記取得部により以降に取得された前記情報において、今回の前記情報における前記複数の物体のうち、前記所定の物体と同一の物体でないと判定した物体の位置に応じた所定の条件を満たす物体の情報が存在する場合、前記所定の物体の画像と、当該物体の画像との類似度に基づいて、前記所定の物体と同一の物体を抽出する、
請求項1乃至のいずれか一項に記載の情報処理装置。
The extraction unit is a predetermined object according to the position of an object that is determined not to be the same object as the predetermined object among the plurality of objects in the information this time in the information acquired thereafter by the acquisition unit. When the information of the object satisfying the condition exists, the same object as the predetermined object is extracted based on the similarity between the image of the predetermined object and the image of the object.
The information processing apparatus according to any one of claims 1 to 4.
複数の撮像部と、
前記複数の撮像部で各々撮影された複数の画像に基づき、前記情報を生成する生成部と、
請求項1乃至5のいずれか一項に記載の情報処理装置と、
を備える撮像装置。
With multiple imaging units
A generation unit that generates the information based on a plurality of images taken by the plurality of imaging units, respectively.
The information processing apparatus according to any one of claims 1 to 5.
An image pickup device equipped with.
請求項に記載の撮像装置と、
前記抽出部により抽出された前記所定の物体のデータに基づいて、移動体の制御を行う制御部と、
を備え、
前記複数の撮像部は、前記移動体に搭載され、前記移動体の前方を撮像する、機器制御システム。
The image pickup apparatus according to claim 6 and
A control unit that controls a moving body based on the data of the predetermined object extracted by the extraction unit, and a control unit.
Equipped with
A device control system in which the plurality of image pickup units are mounted on the moving body and image the front of the moving body.
前記請求項に記載の機器制御システムを備え、
前記制御部により制御される移動体。
The device control system according to claim 7 is provided.
A moving body controlled by the control unit.
コンピュータが、
複数の時点における、物体の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報を取得するステップと、
以前に取得された前記情報における所定の物体の位置に基づき、今回取得された前記情報における前記所定の物体の位置を予測するステップと、
今回の前記情報から、前記所定の物体の位置に応じた所定の条件を満たす複数の物体を抽出し、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、今回の前記情報における前記複数の物体のうち、以前の前記情報における前記所定の物体と同一の物体を抽出するステップと、を実行し、
前記所定の物体の位置に応じた前記所定の条件を前記複数の物体が満たすことは、前記予測部により算出された前記所定の物体の位置から、前記所定の物体の種別に応じた所定の距離以内に前記複数の物体が位置することである、
情報処理方法。
The computer
A step to acquire information in which the vertical position, the horizontal position, and the depth position of an object are associated with each other at multiple time points.
A step of predicting the position of the predetermined object in the information acquired this time based on the position of the predetermined object in the previously acquired information.
From the information this time, a plurality of objects satisfying a predetermined condition according to the position of the predetermined object are extracted, and based on the degree of similarity between each image of the plurality of objects and the image of the predetermined object, Of the plurality of objects in the information this time, the step of extracting the same object as the predetermined object in the previous information is executed.
Satisfaction of the predetermined condition according to the position of the predetermined object means that the plurality of objects satisfy the predetermined distance from the position of the predetermined object calculated by the prediction unit according to the type of the predetermined object. The plurality of objects are located within the range.
Information processing method.
コンピュータに、
複数の時点における、物体の縦方向の位置と、横方向の位置と、奥行方向の位置とが対応づけられた情報を取得するステップと、
以前に取得された前記情報における所定の物体の位置に基づき、今回取得された前記情報における前記所定の物体の位置を予測するステップと、
今回の前記情報から、前記所定の物体の位置に応じた所定の条件を満たす複数の物体を抽出し、前記複数の物体の各画像と、前記所定の物体の画像との類似度に基づいて、今回の前記情報における前記複数の物体のうち、以前の前記情報における前記所定の物体と同一の物体を抽出するステップと、を実行させ、
前記所定の物体の位置に応じた前記所定の条件を前記複数の物体が満たすことは、前記予測部により算出された前記所定の物体の位置から、前記所定の物体の種別に応じた所定の距離以内に前記複数の物体が位置することである、
プログラム。
On the computer
A step to acquire information in which the vertical position, the horizontal position, and the depth position of an object are associated with each other at multiple time points.
A step of predicting the position of the predetermined object in the information acquired this time based on the position of the predetermined object in the previously acquired information.
From the information this time, a plurality of objects satisfying a predetermined condition according to the position of the predetermined object are extracted, and based on the degree of similarity between each image of the plurality of objects and the image of the predetermined object, Of the plurality of objects in the information this time, the step of extracting the same object as the predetermined object in the previous information is executed.
Satisfaction of the predetermined condition according to the position of the predetermined object means that the plurality of objects satisfy the predetermined distance from the position of the predetermined object calculated by the prediction unit according to the type of the predetermined object. The plurality of objects are located within the range.
program.
JP2017171531A 2016-11-24 2017-09-06 Information processing device, image pickup device, device control system, mobile body, information processing method, and program Active JP6972797B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/783,307 US10628960B2 (en) 2016-11-24 2017-10-13 Information processing apparatus, imaging apparatus, device control system, moving object, information processing method, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016228222 2016-11-24
JP2016228222 2016-11-24

Publications (2)

Publication Number Publication Date
JP2018088233A JP2018088233A (en) 2018-06-07
JP6972797B2 true JP6972797B2 (en) 2021-11-24

Family

ID=62494575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017171531A Active JP6972797B2 (en) 2016-11-24 2017-09-06 Information processing device, image pickup device, device control system, mobile body, information processing method, and program

Country Status (1)

Country Link
JP (1) JP6972797B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2019239471A1 (en) * 2018-06-11 2020-07-02 三菱電機株式会社 Driving support device, driving support system, and driving support method
EP3806447A4 (en) * 2018-06-11 2021-07-14 Panasonic Intellectual Property Management Co., Ltd. Imaging control device, imaging control method, and program
JP2020013332A (en) * 2018-07-18 2020-01-23 トヨタ自動車株式会社 Image recognition device
JP7224592B2 (en) * 2018-09-28 2023-02-20 日本コントロールシステム株式会社 Information processing device, information processing method, and program
JP7322576B2 (en) * 2019-07-31 2023-08-08 株式会社リコー Information processing device, imaging device, and moving object

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863602A (en) * 1994-08-19 1996-03-08 Fuji Electric Co Ltd Object tracking device
JP2004046647A (en) * 2002-07-12 2004-02-12 Univ Waseda Method and device for tracking moving object based on dynamic image data
JP4802112B2 (en) * 2007-02-08 2011-10-26 株式会社東芝 Tracking method and tracking device
JP5349367B2 (en) * 2010-02-26 2013-11-20 セコム株式会社 Moving object tracking device
CN104584097B (en) * 2012-08-09 2017-04-05 丰田自动车株式会社 Article detection device and drive assistance device
JP6186834B2 (en) * 2013-04-22 2017-08-30 富士通株式会社 Target tracking device and target tracking program

Also Published As

Publication number Publication date
JP2018088233A (en) 2018-06-07

Similar Documents

Publication Publication Date Title
JP6587000B2 (en) Image processing apparatus, imaging apparatus, mobile device control system, image processing method, and program
JP6705496B2 (en) Image processing device, imaging device, mobile device control system, mobile device, image processing method, and program
JP6657789B2 (en) Image processing device, imaging device, device control system, frequency distribution image generation method, and program
JP6662388B2 (en) Image processing device, imaging device, device control system, distribution data generation method, and program
JP6972797B2 (en) Information processing device, image pickup device, device control system, mobile body, information processing method, and program
EP3410416B1 (en) Image processing device, imaging device, mobile entity apparatus control system, image processing method, and program
JP6583527B2 (en) Image processing apparatus, imaging apparatus, mobile device control system, image processing method, and program
KR20190095592A (en) Method and Apparatus for Vehicle Detection Using Lidar Sensor and Camera
JP6705497B2 (en) Image processing device, imaging device, mobile device control system, image processing method, program, and mobile device
JP6769477B2 (en) Image processing device, imaging device, mobile device control system, image processing method, and program
JP2016029557A (en) Three-dimensional object detection device, three-dimensional object detection method, three-dimensional object detection program, and mobile device control system
US10628960B2 (en) Information processing apparatus, imaging apparatus, device control system, moving object, information processing method, and recording medium
JP6816401B2 (en) Image processing device, imaging device, mobile device control system, image processing method, and program
JP6972798B2 (en) Information processing device, image pickup device, device control system, mobile body, information processing method, and program
JP6763198B2 (en) Image processing equipment, imaging equipment, mobile device control systems, image processing methods, and programs
JP6812701B2 (en) Image processing equipment, mobile device control system, image processing method, and program
EP3327696B1 (en) Information processing apparatus, imaging device, device control system, mobile body, information processing method, and program
JP2018088237A (en) Information processing device, imaging device, apparatus control system, movable body, information processing method, and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200707

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R151 Written notification of patent or utility model registration

Ref document number: 6972797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151