JP2019074498A - 運転支援装置 - Google Patents
運転支援装置 Download PDFInfo
- Publication number
- JP2019074498A JP2019074498A JP2017202838A JP2017202838A JP2019074498A JP 2019074498 A JP2019074498 A JP 2019074498A JP 2017202838 A JP2017202838 A JP 2017202838A JP 2017202838 A JP2017202838 A JP 2017202838A JP 2019074498 A JP2019074498 A JP 2019074498A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- occupant
- output
- unit
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003384 imaging method Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 36
- 230000009471 action Effects 0.000 claims description 18
- 230000033001 locomotion Effects 0.000 claims description 18
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 239000000725 suspension Substances 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 208000008918 voyeurism Diseases 0.000 description 1
Images
Landscapes
- Navigation (AREA)
- Image Analysis (AREA)
Abstract
【課題】一例として、よりスムーズに乗員と対話可能な運転支援装置を提供する。【解決手段】実施形態にかかる運転支援装置は、乗員に対して音声を出力する音声出力部と、車内を撮像する撮像装置の撮像画像に含まれる乗員の画像を取得する取得部と、取得部の取得結果に含まれる乗員の動作や状態に基づいて、音声の出力を中断するか否かを判断する判断部と、を備える。音声出力部は、判断部が、音声の出力を中断すると判断した場合に、音声の出力を中断する。【選択図】図4
Description
本発明の実施形態は、運転支援装置に関する。
従来、音声ガイダンスを出力し、乗員(ユーザ)の応答を音声認識することによって、乗員との対話を行う運転支援装置が知られている。また、ユーザと対話を行うシステムにおいて、システムから音声ガイダンスが出力されている途中で、ユーザの音声によるバージイン(割り込み)を行うことが可能な技術が知られている。
しかしながら、従来技術においては、乗員と運転支援装置との対話を、よりスムーズに行うことが望まれていた。
本発明の実施形態にかかる運転支援装置は、一例として、乗員に対して音声を出力する音声出力部と、車内を撮像する撮像装置の撮像画像に含まれる乗員の画像を取得する取得部と、取得部の取得結果に含まれる乗員の動作や状態に基づいて、音声の出力を中断するか否かを判断する判断部と、を備える。音声出力部は、判断部が、音声の出力を中断すると判断した場合に、音声の出力を中断する。このため、実施形態の運転支援装置によれば、乗員の動作や状態に基づいて、音声の出力を中断するため、例えば、よりスムーズに乗員と対話することができる。
上記運転支援装置では、一例として、所定の動作は、発話の動作、承認の意思を表す動作、否定の意思を表す動作、保留の意思を表す動作、または、出力された音声が聞き取れないことを表す動作のいずれかである。このため、実施形態にかかる運転支援装置によれば、乗員の意思を踏まえて音声を中断することにより、例えば、乗員にとって不要な音声の出力を抑制できる。これにより、実施形態にかかる運転支援装置によれば、よりスムーズに乗員と対話することができる。
上記運転支援装置では、一例として、乗員が承認の意思を表す動作をしていると判断された場合、出力された音声の承認に対応する処理を実行する対話制御部、をさらに備える。よって、実施形態にかかる運転支援装置によれば、例えば、乗員の意思を確認した上で、乗員の意思に沿った後続の処理を、迅速に開始することができる。このため、実施形態にかかる運転支援装置によれば、例えば、対話に要する時間を短縮し、よりスムーズに乗員との対話を行うことができる。
上記運転支援装置では、一例として、乗員が否定の意思を表す動作をしていると判断された場合、出力された音声の否定に対応する処理を実行する対話制御部、をさらに備える。よって、実施形態にかかる運転支援装置によれば、例えば、乗員の意思を確認した上で、乗員の意思に沿った後続の処理を、迅速に開始することができる。このため、実施形態にかかる運転支援装置によれば、例えば、対話に要する時間を短縮し、よりスムーズに乗員との対話を行うことができる。
上記運転支援装置では、一例として、音声出力部が出力した音声に対して乗員が発話する音声を認識する音声認識部、をさらに備える。また、乗員が保留の意思を表す動作をしていると判断された場合、音声認識部は、乗員が発話する音声の認識時間を延長する。よって、実施形態にかかる運転支援装置によれば、乗員が意思決定を行うまで待つことができ、乗員が回答するペースに合わせて対話を行うことができる。
上記運転支援装置では、一例として、乗員が保留の意思を表す動作をしていると判断された場合、音声出力部は、乗員が保留の意思を表す動作をしていると判断された際に出力していた音声と異なる音声を出力する。よって、実施形態にかかる運転支援装置によれば、当初出力された音声の内容とは異なる選択肢を提示することによって、乗員の意思決定を支援することができる。
上記運転支援装置では、一例として、乗員が音声が聞き取れないことを表す動作をしていると判断された場合、音声出力部は、乗員が音声が聞き取れないことを表す動作をしていると判断された際に出力していた音声を再度出力する。よって、実施形態にかかる運転支援装置によれば、乗員が聞き取れなかった音声を再度出力することにより、乗員との対話を円滑に行うことができる。
本実施形態においては、乗員の動作に応じて運転支援装置が音声の出力を中断することにより、乗員と運転支援装置とがよりスムーズに対話することができる。以下、本実施形態の運転支援装置を車両に搭載した例を挙げて説明する。
図1は、本実施形態にかかる車両1の車室2aの一部が透視された状態が示された例示的な斜視図である。車両1は、例えば、内燃機関自動車であってもよいし、電気自動車や燃料電池自動車、ハイブリッド自動車等であってもよいし、他の駆動源を備えた自動車であってもよい。また、車両1は、種々の変速装置を搭載することができるし、内燃機関や電動機を駆動するのに必要な種々の装置、例えばシステムや部品等を搭載することができる。
また、図1に例示されるように、車両1は、例えば、四輪自動車であり、左右2つの前輪3Fと、左右2つの後輪3Rとを有する。これら4つの車輪3は、いずれも転舵可能に構成されうる。車両1における車輪3の駆動に関わる装置の方式や、数、レイアウト等は、種々に設定することができる。
図1に例示されるように、車体2は、不図示の乗員が乗車する車室2aを構成している。車室2a内には、乗員としての運転者の座席40a(運転席)に臨む状態で、操舵部4や、加速操作部5、制動操作部6、変速操作部7等が設けられている。
操舵部4は、例えば、ダッシュボード12から突出したステアリングホイール(ハンドル)である。また、加速操作部5は、例えば、運転者の足下に位置されたアクセルペダルである。また、制動操作部6は、例えば、運転者の足下に位置されたブレーキペダルである。また、変速操作部7は、例えば、センターコンソールから突出したシフトレバーである。なお、操舵部4や、加速操作部5、制動操作部6、変速操作部7は、これらに限定されるものではない。
また、車室2a内には、モニタ装置11が設けられている。モニタ装置11には、表示装置(図3に図示)や、音声出力装置(図3に図示)が設けられている。音声出力装置は、例えば、スピーカである。また、表示装置は、例えば、LCD(liquid crystal display)や、OELD(organic electroluminescent display)等である。また、表示装置は、例えば、タッチパネル等、透明な操作入力部(図3に図示)で覆われている。また、モニタ装置11とは異なる車室2a内の他の位置に、不図示の音声出力装置が設けられても良い。なお、モニタ装置11は、例えば、ナビゲーションシステムやオーディオシステムと兼用されうる。
また、車体2の天井には、音声入力部24が設けられている。音声入力部24は例えばマイクであり、車室2a内の乗員の音声を入力可能である。図1に示す音声入力部24の設置位置は一例であり、これに限定されるものではない。
また、操舵部4とダッシュボード12とを接続するハンドルコラム(図2に図示)には、車両1の車内を撮像する撮像装置15が設置されている。この撮像装置15は、例えば、CCD(Charge Coupled Device)カメラ等である。
図2は、本実施形態にかかる撮像装置15の配置の一例を示す図である。本実施形態においては、撮像装置15は、ハンドルコラム41に設置されている。撮像装置15は、座席40aに着座する乗員42の顔が、視野中心に位置するように、視野角及び姿勢が調整されている。この撮像装置15は、車両1の車内を撮像し、撮像により得た画像データである撮像画像を、後述するECUへ順次出力する。
図2に示す撮像装置15の設置位置は一例であり、これに限定されるものではない。例えば、撮像装置15は、ダッシュボード12の上や、モニタ装置11等に設けられた広角カメラであっても良い。
図3は、本実施形態にかかる運転支援システム10のハードウェア構成の一例を示す図である。図3に示すように、車両1に搭載された運転支援システム10では、ECU14や、モニタ装置11等の他、ブレーキシステム18、舵角センサ19(角度センサ)、アクセルセンサ20、シフトセンサ21、車輪速センサ22、操舵システム13、音声入力部24等が、電気通信回線としての車内ネットワーク23を介して電気的に接続されている。車内ネットワーク23は、例えば、CAN(controller area network)として構成される。なお、音声入力部24は車内ネットワーク23を介さずに、直接ECU14と接続する構成を採用しても良い。
ECU14は、各種の演算処理および運転支援システム10の各構成の制御を実行することができる。より詳細には、ECU14は、車内ネットワーク23を通じて制御信号を送ることで、操舵システム13、ブレーキシステム18等を制御する。また、ECU14は、モニタ装置11に含まれる表示装置8a、音声出力装置8bを制御する。また、ECU14は、車内ネットワーク23を介して、トルクセンサ13b、ブレーキセンサ18b、舵角センサ19、アクセルセンサ20、シフトセンサ21、車輪速センサ22、音声入力部24等の検出結果、ならびに、操作入力部8c等の指示信号(制御信号、操作信号、入力信号、データ)を受け取る。また、ECU14は、撮像装置15から撮像画像を取得する。ECU14は、本実施形態における運転支援装置の一例である。
ECU14は、例えば、CPU14a(central processing unit)や、ROM14b(read only memory)、RAM14c(random access memory)、表示制御部14d、SSD14f(solid state drive、フラッシュメモリ)等を有している。
CPU14aは、ROM14b等の不揮発性の記憶装置にインストールされ記憶されたプログラムを読み出し、当該プログラムにしたがって演算処理を実行する。また、表示制御部14dは、ECU14での演算処理のうち、主として、撮像装置15で得られた画像データを用いた画像処理や、表示装置8aで表示される画像データの合成等を実行する。
操舵システム13は、少なくとも2つの車輪3を操舵する。操舵システム13は、アクチュエータ13aと、トルクセンサ13bとを有する。また、ブレーキシステム18は、アクチュエータ18aと、ブレーキセンサ18bとを有する。ブレーキシステム18は、アクチュエータ18aを介して、車輪3ひいては車両1に制動力を与える。
上述した各種センサやアクチュエータの構成や、配置、電気的な接続形態等は、一例であって、種々に設定(変更)することができる。
図4は、本実施形態にかかるECU14が有する機能の一例を示すブロック図である。図4に示すように、ECU14は、記憶部140と、取得部141と、判断部142と、音声認識部143と、音声出力部144と、対話制御部145とを備える。
取得部141と、判断部142と、音声認識部143と、音声出力部144と、対話制御部145との各構成は、CPU14aが、ROM14b内に格納されたプログラムを実行することで実現される。なお、これらの構成をハードウェア回路で実現するように構成しても良い。
記憶部140は、後述の音声出力部144が出力する音声ガイダンスのテキスト等を記憶する。また、記憶部140は、例えば、SSD14f等の記憶装置によって構成される。
取得部141は、撮像装置15の撮像画像に含まれる乗員42の画像を取得する。より詳細には、取得部141は、撮像装置15から撮像画像を取得し、画像処理により当該撮像画像に含まれる乗員42の画像を抽出(取得)する。本実施形態においては、乗員42の画像を、取得部141の取得結果という。撮像画像から乗員42の画像を取得する手法は、公知の技術を採用することができる。
判断部142は、取得部141の取得結果に含まれる乗員42の動作や状態に基づいて、後述の音声出力部144による音声の出力を中断するか否かを判断する。
より詳細には、判断部142は、取得部141が取得した撮像画像に含まれる乗員42の画像から、乗員42の動作や状態を判断する。例えば、判断部142は、乗員42が、発話の動作、承認の意思を表す動作、否定の意思を表す動作、保留の意思を表す動作、または、出力された音声が聞き取れないことを表す動作のいずれかをしているか否かを判断する。以下、発話の動作を「発話動作」、承認の意思を表す動作を「承認動作」、否定の意思を表す動作を「否定動作」、保留の意思を表す動作を「保留動作」、出力された音声が聞き取れないことを表す動作を「聞き取れないことを表す動作」という。また、発話の動作、承認の意思を表す動作、否定の意思を表す動作、または、保留の意思を表す動作、出力された音声が聞き取れないことを表す動作、を総称して、所定の動作という。
発話動作は、例えば、口を開く動作である。一般に、車内にはラジオの音等の雑音が存在するが、判断部142は、撮像画像から乗員42の発話動作の有無を判断するため、雑音等を乗員42の発話として誤判断することを抑制できる。このため、本実施形態の判断部142は、乗員42の発話の有無を高精度に判断することができる。また、判断部142は、乗員42が音声を発しようとして口を動かした時点で発話動作をしたと判断するため、より早い段階で乗員42の発話を認識することができる。
承認動作は、例えば、首を縦に振って頷く動作であり、後述の音声出力部144が出力した音声の内容に対して乗員42が承認したことを示す動作である。
また、否定動作は、例えば、首を横に振る動作であり、後述の音声出力部144が出力した音声の内容に対して乗員42が否定したことを示す動作である。
保留動作は、例えば、首を傾げる動作である。また、顔をしかめる、眉を寄せる、といった顔の動きを、保留動作としても良い。保留動作とは、乗員42が、後述の音声出力部144が出力した音声に対して、承認か否定かの意思決定をまだしていないことを示す動作である。
聞き取れないことを表す動作は、例えば、目を見開く動作であり、乗員42が、後述の音声出力部144が出力した音声を聞き取れなかったことを示す動作である。
判断部142は、乗員42の画像から、乗員42が発話の動作、承認の意思を表す動作、否定の意思を表す動作、または、保留の意思を表す動作、聞き取れないことを表す動作、のいずれかをしていると判断した場合に、音声の出力を中断すると判断する。なお、発話動作、承認動作、否定動作、保留動作、聞き取れないことを表す動作の具体的な動作の内容は、上述の例に限定されるものではない。また、判断部142は、動作だけではなく、乗員42の姿勢等の状態に基づいて、乗員42の意思を判断して、音声の出力を中断するか否かを判断しても良い。
また、判断部142は、RNN(Recurrent Neural Network)等のディープラーニングの手法を用いて、入力された乗員42の画像から、音声の出力を中断するか否かを判断しても良い。判断部142が音声の出力を中断するか否かを判断する手法は、RNNに限定されるものではなく、他のディープラーニングや、ディープラーニング以外の手法を採用しても良い。
また、本実施形態においては取得部141が取得した乗員42の画像に基づいて、判断部142が、乗員42の動作や状態を判断するとしたが、取得部141が乗員42の動作や状態を検出する構成を採用しても良い。この場合、乗員42の画像から検出された乗員42の動作や状態を、取得部141の取得結果という。
音声認識部143は、音声入力部24に入力された音声に対して音声認識処理を行い、命令の内容を特定する。本実施形態においては、音声認識部143は、後述の音声出力部144が出力した音声に対して乗員42が発話する音声を認識する。より詳細には、音声認識部143は、乗員42の音声から、承認または否定の意思を示す単語を特定する。また、音声認識部143は、乗員42の音声から、車両1の行先を示す固有名詞や、車両1が実行する処理を示す動詞等を特定する。
本実施形態においては、音声認識部143は、音声出力部144が乗員42に対して質問等の音声を出力した後に設けられる、音声の認識時間において、乗員42の音声を認識する。音声認識部143が音声認識を行うタイミングはこれに限定されるものではなく、常時、音声認識処理を行っているものとしても良い。また、音声認識部143は、乗員42が操作入力部8c等によって音声認識の開始の操作をした場合にのみ音声認識を行うものとしても良い。また、音声認識部143が乗員42の音声を認識する手法は、公知の手法を採用することができる。また、音声認識部143は、判断部142が乗員42が保留動作をしていると判断した場合、音声の認識時間を延長する。音声の認識時間中は、音声出力部144による音声の出力の中断は継続される。音声の認識時間の延長は、本実施形態における保留に対応する処理の一例であり、判断部142が乗員42が保留動作をしていると判断した場合に行われる処理は、これに限定されるものではない。
音声出力部144は、乗員42に対して音声を出力する。一例として、音声出力部144は、音声出力装置8bを制御して、ナビゲーションシステムの操作の音声ガイダンスを出力する。また、音声出力部144は、判断部142が、音声の出力を中断すると判断した場合に、音声の出力を中断する。また、音声出力部144は、判断部142が、乗員42が聞き取れないことを表す動作をしていると判断した場合、乗員42が聞き取れないことを表す動作をしていると判断された際に出力していた音声を再度出力する。
対話制御部145は、乗員42と、ECU14との対話を制御する。また、対話制御部145は、音声出力部144から出力された音声に対する乗員42の反応に応じて、後続の処理を実行する。例えば、対話制御部145は、判断部142が、乗員42が承認動作をしていると判断した場合、出力された音声に対する承認に対応する処理を実行する。また、対話制御部145は、判断部142が、乗員42が否定動作をしていると判断した場合、出力された音声に対する否定に対応する処理を実行する。承認に対応する処理、および否定に対応する処理は、音声出力部144によって出力された音声の内容に応じて異なる。
また、対話制御部145は、音声認識部143が乗員42の音声から、承認の意思を特定した場合、承認に対応する処理を実行する。また、対話制御部145は、音声認識部143が乗員42の音声から、否定の意思を特定した場合、否定に対応する処理を実行する。
承認に対応する処理は、出力された音声に対して乗員42が承認をした場合に、実行されることが予め定められた処理である。また、否定に対応する処理は、出力された音声に対して乗員42が否定をした場合に、実行されることが予め定められた処理である。承認に対応する処理、および、否定に対応する処理の具体例については、後述する。
次に、以上のように構成された本実施形態のECU14における対話制御処理について図5〜10を用いて説明する。図5は、本実施形態にかかる対話制御処理の手順の一例を示すフローチャートである。
音声出力部144は、音声出力装置8bを制御して、乗員42に対する音声の出力を開始する(S1)。また、図6は、本実施形態にかかるECU14による音声ガイダンスと、乗員42との対話の一例を示す図である。図5に示すS1の処理では、図6に示す音声ガイダンスの中の、音声t2の出力が開始されたものとする。
また、図5のフローチャートに戻り、取得部141は、撮像装置15から撮像画像を取得する(S2)。また、取得部141は、撮像画像から、乗員42の画像を取得する。また、判断部142は、取得部141が取得した乗員42の画像から、乗員42の動作を判断する。
判断部142は、音声t2が出力されている途中で、乗員42が承認動作をしたと判断した場合(S3“Yes”)、音声の出力を中断すると判断する。この場合、音声出力部144は、音声t2の出力を中断する(S4)。そして、対話制御部145は、音声t2の承認に対応する処理を実行する(S5)。
図7は、本実施形態にかかる乗員42の承認動作の一例を示す図である。図7に示すように、音声t2の途中で乗員42が頷く等の承認動作をしたと判断部142が判断した場合、音声出力部144は音声t2の出力を中断する。また、対話制御部145は、音声t2の承認に対応する処理を実行する。
図7に示す例では、音声t2は、目的地に対する承認または否定を求める音声であるため、音声t2の承認に対応する処理は、音声t2に含まれる目的地を、乗員42が承認した場合に実行される処理である。音声t2の承認に対応する処理として、対話制御部145は、音声出力部144に、乗員42の承認に対して応答する音声t3を出力させる。また、対話制御部145は、音声t2で示した目的地を、ナビゲーションシステムの目的地として設定する。音声t2の承認に対応する処理は、これに限定されるものではなく、出力された音声t2の内容に応じて異なる。
一般に、乗員42が音声t2の内容を承認しているにも関わらず、音声t2が最後まで出力されると、乗員42は音声t2の終了を待たなければならず、対話をスムーズに行うことが困難になる場合がある。本実施形態の音声出力部144は、音声t2の途中で乗員42が承認動作をした場合に音声t2の出力を中断し、対話制御部145が後続の処理に移行することで、スムーズに乗員42と対話することができる。
また、一般に、人間同士での対話では、音声だけではなく、動作によっても承認等の意思を伝達し合うことでスムーズに対話を進めている。本実施形態の判断部142は、乗員42の承認等の意思を表す動作を判断することができるため、音声出力部144は、より自然なタイミングで音声t2の出力を中断することができる。また、音声出力部144は、乗員42が承認動作をした場合に音声t2の出力を中断することにより、対話に要する時間を短縮することができる。
図5のフローチャートに戻り、判断部142は、音声t2が出力されている途中で、乗員42が否定動作をしたと判断した場合(S3“No”、S6“Yes”)、音声の出力を中断すると判断する。この場合、音声出力部144は、音声t2の出力を中断する(S7)。そして、対話制御部145は、音声t2の否定に対応する処理を実行する(S8)。
図8は、本実施形態にかかる乗員42の否定動作の一例を示す図である。図8に示すように、音声t2の途中で乗員42が首を横に振る等の否定動作をしたと判断部142が判断した場合、音声出力部144は音声t2の出力を中断する。また、対話制御部145は、音声t2の否定に対応する処理を実行する。
音声t2の否定に対応する処理の一例として、対話制御部145は、音声出力部144に、乗員42の否定に対して応答する音声t4を出力させる。例えば、図8に示すように、音声出力部144が目的地がA牧場であることを音声で出力している間に、乗員42が否定動作をした場合は、対話制御部145は、音声出力部144に、目的地を質問する音声を出力させる。音声t2の否定に対応する処理は、これに限定されるものではなく、出力された音声t2の内容に応じて異なる。
乗員42が否定動作をしたと判断された場合に音声出力部144が、音声t2の出力を中断し、対話制御部145が後続の処理に移行することで、ECU14は、乗員42を待たせずにスムーズに対話をすることができる。また、音声出力部144は、乗員42が否定動作をした場合に音声t2の出力を中断することにより、対話に要する時間を短縮することができる。
図5のフローチャートに戻り、判断部142は、音声t2が出力されている途中で、乗員42が発話動作をしたと判断した場合(S6“No”、S9“Yes”)、音声の出力を中断すると判断する。この場合、音声出力部144は、音声t2の出力を中断する(S10)。
図9は、本実施形態にかかる乗員42の発話動作の一例を示す図である。図9に示すように、音声t2の途中で乗員42が口を開く等の発話動作をしたと判断部142が判断した場合、音声出力部144は音声t2の出力を中断する。
乗員42が発話動作をした場合に音声出力部144が音声t2の出力を中断することで、対話における話し手が、ECU14から乗員42に自然なタイミングで交代する。このため、乗員42は、音声t2に発話を妨げられずに、スムーズに発話を行うことができる。また、乗員42が発話した音声と、音声出力部144が出力した音声t2とが重複しないため、音声認識部143が乗員42が発話した音声をより高精度に認識することができる。
本実施形態においては、乗員42が発話動作をしたと判断された場合は音声t2の出力を中断して処理が終了するが、音声t2の出力が中断された後に、音声認識部143による音声認識待ちの状態となっても良い。また、音声t2の出力が中断されている間に、取得部141が撮像画像を繰り返し取得して判断の処理を繰り返し、乗員42が発話動作をしていないと判断された場合に、音声出力部144が音声t2の出力を再開しても良い。
図5のフローチャートに戻り、判断部142は、音声t2が出力されている途中で、乗員42が保留動作をしたと判断した場合(S9“No”、S11“Yes”)、音声の出力を中断すると判断する。この場合、音声出力部144は、音声t2の出力を中断する(S12)。そして、保留に対応する処理が開始される(S13)。本実施形態においては。保留に対応する処理は、音声の認識時間の延長である。音声の認識時間において、音声認識部143は、乗員42の音声が音声入力部24に入力されることを待つ、認識待ち状態となる。乗員42の音声が入力されると、音声認識部143は、当該音声を認識し、内容を特定する。
また、判断部142は、音声t2が出力されている途中で、乗員42が聞き取れないことを表す動作をしたと判断した場合(S11“No”、S14“Yes”)、音声の出力を中断すると判断する。この場合、音声出力部144は、音声t2の出力を中断する(S15)。そして、音声出力部144は、S1に戻り、乗員42が聞き取れないことを表す動作をしたと判断された際に出力していた音声t2を、再度出力する。
図10は、本実施形態にかかる聞き取れないことを表す動作の一例を示す図である。図10に示すように、音声t2の途中で乗員42が目を見開く等の、聞き取れないことを表す動作をしたと判断部142が判断した場合、音声出力部144は、音声t2を冒頭から再度出力する。
図5のフローチャートに戻り、判断部142が、乗員42が承認動作、否定動作、発話動作、保留動作、聞き取れないことを表す動作、のいずれもしていないと判断した場合であって(S14“No”)、音声出力部144が音声t2の出力を終了しない場合は(S16“No”)、S2〜S16の処理が繰り返される。
また、判断部142が、乗員42が承認動作、否定動作、発話動作、保留動作、聞き取れないことを表す動作、のいずれもしていないと判断した場合であって(S14“No”)、音声t2の出力が終了した場合(S16“Yes”)、当該フローチャートの処理は終了する。
判断部142が、乗員42が承認動作、否定動作、発話動作、保留動作、聞き取れないことを表す動作、のいずれもしていないと判断した場合であって、音声t2の出力が終了した場合は、図6に示すように、対話制御部145は、音声認識部143によって認識された乗員42が発話した音声による応答、または、動作による応答に応じて、後続の処理を行う。例えば、対話制御部145は、図6に示す音声t2に対して、乗員42が承認の応答をした場合、音声t2に対する承認に対応する処理を実行する。また、対話制御部145は、音声t2に対して、乗員42が否定の応答をした場合、音声t2に対する否定に対応する処理を実行する。
また、音声ガイダンスが継続しており、音声出力部144が次の音声を出力する場合は、図5のフローチャートの処理は繰り返し実行される。
図6〜10に示す音声出力部144が出力する音声t1〜t4および乗員42が発話する音声r1〜r3の内容は一例であり、これに限定されるものではない。
また、承認に対応する処理、および、否定に対応する処理は、図6〜10に示す内容に限定されるものではない。また、図6に示す音声t1のように、乗員42に対して承認または否定を求める内容ではない音声が出力されている間に乗員42が承認動作または否定動作をしたと判断された場合は、音声出力部144が単に音声の出力を中断するだけでも良い。
このように、本実施形態のECU14は、撮像画像に含まれる乗員42の画像から取得された乗員42の動作や状態に基づいて、音声の出力を中断するため、よりスムーズに乗員42と対話することができる。
また、本実施形態のECU14は、乗員42が発話動作、承認動作、否定動作、保留動作、聞き取れないことを表す動作、のいずれかの動作をしたと判断した場合に、音声の出力を中断する。このため、本実施形態のECU14によれば、乗員42にとって不要な音声の出力を抑制できる。
例えば、ECU14が、乗員42が発話動作をしたと判断した場合に音声の出力を中断することで、乗員42の発話を妨げることを抑制することができる。これにより、本実施形態のECU14によれば、乗員42がスムーズに発話を行うことができる。また、本実施形態のECU14によれば、乗員42が承認動作、または否定動作をしたと判断した場合に音声の出力を中断することで、乗員42にとって不要な音声の出力を抑制して対話に要する時間を削減すると共に、スムーズに対話を行うことができる。また、本実施形態のECU14によれば、乗員42が保留動作をしたと判断した場合に音声の出力を中断することで、乗員42が承認か否定かの意思決定をしていない状態のまま音声の出力が継続することを抑制することができる。また、本実施形態のECU14によれば、乗員42が聞き取れないことを表す動作をしたと判断した場合に音声の出力を中断することで、乗員42が音声を聞き取れていない状態で音声の出力が継続することを抑制することができる。
さらに、本実施形態のECU14によれば、乗員42が承認動作をしたと判断した場合、音声の出力を中断し、出力された音声の承認に対応する処理を実行するため、乗員42の承認の意思に沿った後続の処理を、乗員42を待たせずに、迅速に開始することができる。このため、本実施形態にかかるECU14によれば、よりスムーズに乗員42との対話を行うことができる。
さらに、本実施形態のECU14によれば、乗員42が否定動作をしたと判断した場合、音声の出力を中断し、出力された音声の否定に対応する処理を実行するため、乗員42の否定の意思に沿った後続の処理を、乗員42を待たせずに、迅速に開始することができる。このため、本実施形態にかかるECU14によれば、よりスムーズに乗員42との対話を行うことができる。
さらに、本実施形態のECU14は、乗員42が保留動作をしたと判断した場合、乗員42の音声の認識時間を延長する。このため、本実施形態のECU14によれば、乗員42が意思決定を行うまで待つことができ、乗員42が回答するペースに合わせて対話を行うことができる。
さらに、本実施形態のECU14は、乗員42が聞き取れないことを表す動作をしたと判断した場合、出力していた音声を再度出力する。本実施形態のECU14によれば、乗員42が聞き取れなかった音声を再度出力することにより、乗員42との対話を円滑に行うことができる。また、本実施形態のECU14によれば、乗員42が音声の再出力の操作をしたり、ECU14との対話を最初からやり直したり、といった手間が発生することを抑制することができる。
なお、本実施形態では、音声出力部144と対話制御部145とを異なる機能部としたが、音声出力部144と対話制御部145との機能は、1つの機能部が有する構成としても良い。また、判断部142と、対話制御部145との機能は、1つの機能部が有する構成としても良い。
(変形例1)
上述の実施形態では、乗員42が頷く動作をした場合に、当該動作を承認動作と判断し、音声の出力を中断していた。しかしながら、一般に、人間は、話し手に対して話を促す意図で、相槌として、連続して頷く動作をする場合がある。そこで、本変形例では、乗員42が相槌をした場合には、音声の出力を中断しない。
上述の実施形態では、乗員42が頷く動作をした場合に、当該動作を承認動作と判断し、音声の出力を中断していた。しかしながら、一般に、人間は、話し手に対して話を促す意図で、相槌として、連続して頷く動作をする場合がある。そこで、本変形例では、乗員42が相槌をした場合には、音声の出力を中断しない。
本変形例の判断部142は、取得部141が取得した撮像画像に含まれる乗員42の画像から、乗員42が相槌をしたか否かを判断する。より詳細には、判断部142は、複数フレームに渡る撮像画像を画像処理することにより、一定の時間における乗員42の連続する動作を判断する。判断部142は、乗員42が首を縦に1度振った場合は、当該動作を承認動作と判断する。また、判断部142は、乗員42が連続して複数回首を縦に振った場合は、当該動作を相槌と判断する。なお、承認動作と相槌とを区別する手法は、これに限定されるものではない。また、乗員42の連続する動作を検出する画像処理は、取得部141が行うものとしても良い。また、判断部142は、入力された乗員42の画像をRNN等のディープラーニングの手法を用いて処理することにより、乗員42が相槌したことを判断しても良い。
本変形例の判断部142は、乗員42が相槌をしたと判断した場合は、音声の出力を中断しないと判断する。そして、音声出力部144は、判断部142が音声の出力を中断しないと判断した場合には、音声の出力を継続する。
また、本変形例の対話制御部145は、音声出力部144が出力した音声と、当該音声の出力中に乗員42が相槌をしたと判断されたタイミングとを対応付けて、記憶部140に保存する。例えば、音声出力部144は、出力した音声を特定する識別情報と、出力開始時刻と、乗員42が相槌をしたと判断された時刻とを対応付けて、記憶部140に保存する。記憶部140に保存される内容は一例であり、これに限定されるものではない。
乗員42が相槌をしたと判断された時点においては、乗員42は、出力された音声の内容に対して同意している可能性が高い。このため、出力された音声と、相槌のタイミングとを対応付けて保存することにより、乗員42が相槌をしたと判断された時点までに出力された音声の内容に対しては、乗員42の同意を得ていたことについての信頼性を担保することができる。
(変形例2)
上述の実施形態では、乗員42の音声を音声認識する機能を有するECU14を例として説明したが、ECU14は、音声認識の機能を有さなくても良い。例えば、音声出力部144が出力した音声に対して、乗員42が承認や否定等の動作をしたと判断部142が判断することによって、ECU14は、音声認識の機能がなくとも、乗員42との対話を行うことができる。
上述の実施形態では、乗員42の音声を音声認識する機能を有するECU14を例として説明したが、ECU14は、音声認識の機能を有さなくても良い。例えば、音声出力部144が出力した音声に対して、乗員42が承認や否定等の動作をしたと判断部142が判断することによって、ECU14は、音声認識の機能がなくとも、乗員42との対話を行うことができる。
(変形例3)
上述の実施形態では、音声の出力を中断した後の処理(例えば、承認に対応する処理、および、否定に対応する処理)は、出力されていた音声の内容に応じて予め定められているものとしていたが、音声の出力を中断した後の処理は、これに限定されるものではない。
上述の実施形態では、音声の出力を中断した後の処理(例えば、承認に対応する処理、および、否定に対応する処理)は、出力されていた音声の内容に応じて予め定められているものとしていたが、音声の出力を中断した後の処理は、これに限定されるものではない。
例えば、対話制御部145は、RNN等のディープラーニングの手法を用いて、音声の出力を中断した後の処理を決定しても良い。より詳細には、対話制御部145は、ディープラーニングの入力データとして、撮像画像に含まれる乗員42の動作または状態を示す時系列のデータと、音声の出力内容の時系列のデータとを入力し、音声の中断後の後続処理を決定しても良い。また、ディープラーニングの入力データとして、撮像画像が用いられても良い。また、当該ディープラーニングの処理は、判断部142が実行するものとしても良い。
(変形例4)
上述の実施形態では、保留に対応する処理は音声の認識時間の延長としていたが、これに限定されるものではない。例えば、乗員42が保留動作をしていると判断された場合、本変形例の音声出力部144は、乗員42が保留動作をしていると判断された際に出力していた音声と異なる音声を出力する。より詳細には、乗員42が保留動作をしていると判断された際に出力していた音声と異なる音声は、乗員42に他の提案を行う音声である。
上述の実施形態では、保留に対応する処理は音声の認識時間の延長としていたが、これに限定されるものではない。例えば、乗員42が保留動作をしていると判断された場合、本変形例の音声出力部144は、乗員42が保留動作をしていると判断された際に出力していた音声と異なる音声を出力する。より詳細には、乗員42が保留動作をしていると判断された際に出力していた音声と異なる音声は、乗員42に他の提案を行う音声である。
図11は、本変形例にかかる保留に対応する処理の一例を示す図である。図11に示すように、音声入力によって目的地の入力を行う処理において、音声出力部144は、乗員42が発話した音声に対する音声認識部143の音声認識によって特定された第1の候補として、「A牧場」を示す音声t2を出力する。ここで、乗員42が保留動作をしたと判断された場合に、音声出力部144は、第2候補として「B牧場」を提案する音声t5を出力する。
第2の候補を決定する手法は、例えば、音声認識部143による音声認識結果から、乗員42が発話した可能性が高い順に、第1候補、第2候補の単語を特定しても良い。または、対話制御部145または判断部142が、第1候補である目的地(A牧場)から距離が近く、単語のカテゴリ(牧場等)が同じである地名や施設名等を、不図示の地図情報から検索しても良い。
このように、本変形例のECU14は、乗員42が保留動作をしていると判断された際に出力していた音声と異なる音声を出力するため、乗員42が当初出力された音声の内容を承認または否定しない場合、他の選択肢を提示することによって、乗員42が意思決定をすることを支援することができる。
以上、本発明の実施形態を例示したが、上記実施形態および変形例はあくまで一例であって、発明の範囲を限定することは意図していない。上記実施形態や変形例は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、組み合わせ、変更を行うことができる。また、各実施形態や各変形例の構成や形状は、部分的に入れ替えて実施することも可能である。
1…車両、8b…音声出力装置、10…運転支援システム、14…ECU、15…撮像装置、24…音声入力部、42…乗員、140…記憶部、141…取得部、142…判断部、143…音声認識部、144…音声出力部、145…対話制御部。
Claims (7)
- 乗員に対して音声を出力する音声出力部と、
車内を撮像する撮像装置の撮像画像に含まれる乗員の画像を取得する取得部と、
前記取得部の取得結果に含まれる前記乗員の動作や状態に基づいて、前記音声の出力を中断するか否かを判断する判断部と、を備え、
前記音声出力部は、前記判断部が、前記音声の出力を中断すると判断した場合に、前記音声の出力を中断する、
運転支援装置。 - 前記動作は、発話の動作、承認の意思を表す動作、否定の意思を表す動作、保留の意思を表す動作、または、出力された前記音声が聞き取れないことを表す動作のいずれかである、
請求項1に記載の運転支援装置。 - 前記乗員が前記承認の意思を表す動作をしていると判断された場合、前記出力された音声の承認に対応する処理を実行する対話制御部、をさらに備えた、
請求項2に記載の運転支援装置。 - 前記乗員が前記否定の意思を表す動作をしていると判断された場合、前記出力された音声の否定に対応する処理を実行する対話制御部、をさらに備えた、
請求項2または3に記載の運転支援装置。 - 前記音声出力部が出力した前記音声に対して前記乗員が発話する音声を認識する音声認識部、をさらに備え、
前記乗員が前記保留の意思を表す動作をしていると判断された場合、前記音声認識部は、前記乗員が発話する音声の認識時間を延長する、
請求項2から4のいずれか1項に記載の運転支援装置。 - 前記乗員が前記保留の意思を表す動作をしていると判断された場合、前記音声出力部は、前記乗員が前記保留の意思を表す動作をしていると判断された際に出力していた前記音声と異なる音声を出力する、
請求項2から4のいずれか1項に記載の運転支援装置。 - 前記乗員が前記音声が聞き取れないことを表す動作をしていると判断された場合、前記音声出力部は、前記乗員が前記音声が聞き取れないことを表す動作をしていると判断された際に出力していた前記音声を再度出力する、
請求項2から6のいずれか1項に記載の運転支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017202838A JP2019074498A (ja) | 2017-10-19 | 2017-10-19 | 運転支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017202838A JP2019074498A (ja) | 2017-10-19 | 2017-10-19 | 運転支援装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019074498A true JP2019074498A (ja) | 2019-05-16 |
Family
ID=66544069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017202838A Pending JP2019074498A (ja) | 2017-10-19 | 2017-10-19 | 運転支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019074498A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021071271A1 (en) * | 2019-10-10 | 2021-04-15 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN114312797A (zh) * | 2020-10-09 | 2022-04-12 | 丰田自动车株式会社 | 智能体装置、智能体方法以及记录介质 |
US20220272269A1 (en) * | 2021-02-24 | 2022-08-25 | Subaru Corporation | Occupant monitoring device for vehicle |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000028388A (ja) * | 1999-07-09 | 2000-01-28 | Denso Corp | 走行案内装置 |
JP2008046299A (ja) * | 2006-08-14 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2009032056A (ja) * | 2007-07-27 | 2009-02-12 | Mitsuba Corp | コミュニケーションシステム |
JP2017067849A (ja) * | 2015-09-28 | 2017-04-06 | 株式会社デンソー | 対話装置及び対話方法 |
-
2017
- 2017-10-19 JP JP2017202838A patent/JP2019074498A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000028388A (ja) * | 1999-07-09 | 2000-01-28 | Denso Corp | 走行案内装置 |
JP2008046299A (ja) * | 2006-08-14 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2009032056A (ja) * | 2007-07-27 | 2009-02-12 | Mitsuba Corp | コミュニケーションシステム |
JP2017067849A (ja) * | 2015-09-28 | 2017-04-06 | 株式会社デンソー | 対話装置及び対話方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021071271A1 (en) * | 2019-10-10 | 2021-04-15 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US12008988B2 (en) | 2019-10-10 | 2024-06-11 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN114312797A (zh) * | 2020-10-09 | 2022-04-12 | 丰田自动车株式会社 | 智能体装置、智能体方法以及记录介质 |
JP2022063121A (ja) * | 2020-10-09 | 2022-04-21 | トヨタ自動車株式会社 | エージェント装置、エージェント方法及びエージェントプログラム |
JP7314898B2 (ja) | 2020-10-09 | 2023-07-26 | トヨタ自動車株式会社 | エージェント装置、エージェント方法及びエージェントプログラム |
CN114312797B (zh) * | 2020-10-09 | 2024-09-20 | 丰田自动车株式会社 | 智能体装置、智能体方法以及记录介质 |
US20220272269A1 (en) * | 2021-02-24 | 2022-08-25 | Subaru Corporation | Occupant monitoring device for vehicle |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110166896B (zh) | 语音提供方法、语音提供系统和服务器 | |
JP6202041B2 (ja) | 車両用音声対話システム | |
WO2016006385A1 (ja) | 音声認識装置及び音声認識システム | |
US20180096699A1 (en) | Information-providing device | |
CN110194181B (zh) | 驾驶支持方法、车辆和驾驶支持系统 | |
JP2019074498A (ja) | 運転支援装置 | |
WO2018167949A1 (ja) | 車内通話制御装置、車内通話システムおよび車内通話制御方法 | |
CN110035339A (zh) | 对话装置 | |
JP2003108191A (ja) | 音声対話装置 | |
JP2020144260A (ja) | 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム | |
KR20230039799A (ko) | 차량 및 그 제어 방법 | |
JP2020060861A (ja) | エージェントシステム、エージェント方法、およびプログラム | |
JP7239359B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
KR102371513B1 (ko) | 대화 시스템 및 대화 처리 방법 | |
JP2015018146A (ja) | 機能管理システム及び機能管理方法 | |
JP2004301875A (ja) | 音声認識装置 | |
JP2020154994A (ja) | エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム | |
JP2020144264A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN113168833B (zh) | 用于运行车辆的交互信息系统的方法以及车辆 | |
JP6332072B2 (ja) | 対話装置 | |
JP7175221B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2021163236A (ja) | 情報提供装置 | |
EP4411730A1 (en) | System and method for description based question answering for vehicle feature usage | |
JP2020112733A (ja) | 情報処理装置および情報処理方法 | |
JP7192561B2 (ja) | 音声出力装置および音声出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220315 |