[go: up one dir, main page]

JP2001013994A - 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両 - Google Patents

複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両

Info

Publication number
JP2001013994A
JP2001013994A JP11185857A JP18585799A JP2001013994A JP 2001013994 A JP2001013994 A JP 2001013994A JP 11185857 A JP11185857 A JP 11185857A JP 18585799 A JP18585799 A JP 18585799A JP 2001013994 A JP2001013994 A JP 2001013994A
Authority
JP
Japan
Prior art keywords
voice
speaker
passenger
understanding
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11185857A
Other languages
English (en)
Inventor
Takehide Yano
武秀 屋野
Akinori Koshiba
亮典 小柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11185857A priority Critical patent/JP2001013994A/ja
Publication of JP2001013994A publication Critical patent/JP2001013994A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】安価な音声入力部で高精度な音声入力を得るこ
とができ、複数搭乗者による同時発話に対しても計算量
の増加を招かずに各々の発話を理解でき、装置側から誰
の発話であるかを認識し、詳細な制御が行えるようにす
る。 【解決手段】複数搭乗者機器に搭載される複数搭乗者機
器用音声制御装置10において、音声入力部1−1〜1
−nからの音声入力を発話者推定部11にて受理して音
声入力を行った発話者の位置を推定し、推定された発話
者位置情報を用いて発話者位置の近傍の音声を重点的に
取り込むように音声入力部1−1〜1−nを制御する。
音声理解部12は、発話者推定部11を通じて得られる
発話者の音声信号を解析し、発話内容を理解する。制御
部13は、音声理解部12での音声理解結果及び発話者
位置情報をもとに適切な制御を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声による各種指
示操作が可能な、車載用コンピュータに代表される複数
搭乗者機器用音声制御装置、複数搭乗者機器用音声制御
方法及び車両に関する。
【0002】
【従来の技術】近年、音声や自然言語入力などによる文
章を受け付けるインタフェースに関する研究が盛んであ
る。また、この種のインタフェースを持つコンピュータ
も多数開発され、音声やテキストなどによる入力を受理
する装置が一般向けにも利用可能となっている。また、
そのような装置が、乗用車など、複数名が搭乗し(乗り
込み)同時に扱える機器(複数搭乗者機器)に設置され
る機会が増加している。
【0003】さて、複数搭乗者機器に搭載される音声制
御装置(複数搭乗者機器用音声制御装置)の例として、
音声入力可能なカーナビゲーションシステムを始めとす
る車載用コンピュータが挙げられる。この種の車載用コ
ンピュータは利用者が運転中に音声で操作できる点が注
目され、急速に開発が拡大している。今後、車載用コン
ピュータはナビゲーションシステムだけにとどまらず、
車内の様々な機器を制御することが期待される。
【0004】従来、この種の車載用コンピュータ(に代
表される音声制御装置)の音声入力は、主として運転席
の近くにマイクロホンを設置することにより、運転手の
音声入力を受理するものとなっていた。つまり、運転
席、或いはある特定の席の搭乗者による音声入力の取り
込み精度を十分なものとし、音声認識精度を向上させて
いた。
【0005】ところが、乗用車を始めとする複数搭乗者
機器には複数名が搭乗するのが一般的である。また、複
数搭乗者機器用音声制御装置が、複数搭乗者機器内の様
々な機器を制御可能とする場合、音声入力を必要とする
場面は多岐に亘り、特定の人以外の搭乗者が音声入力を
必要とする状況も多数存在することが予想される。この
場合、音声入力取り込み精度が十分でない座席の搭乗者
からの音声入力も受理しなければならず、そのような音
声入力から得られる音声認識結果は信頼性が低く、認識
誤りも多数現れることが予想される。その結果、発話し
た搭乗者の意図した結果とは異なる動作をするため、搭
乗者に不快感を与えるという問題がある。
【0006】そこで、音声入力部の音声入力取り込み精
度の向上を図ることで、一つの音声入力機器で複数搭乗
者機器内の全ての音声を取り込むことも考えられるが、
非常に高価な機器を購入しなければならないという問題
がある。
【0007】また、複数名が搭乗する複数搭乗者機器内
では、それぞれの搭乗者の発話が同時に行われることも
少なくない。このように同時に複数の搭乗者の発話があ
る場合、従来では一つの音声入力部から複数の話者の入
力を取り込み、重なり合って得られる音声データから発
話者それぞれの発話内容を理解しなければならない。そ
のような処理を追加した場合、処理量の増加による反応
の遅さを招くだけでなく、得られる音声入力の精度はや
はり信頼性が低く、認識誤りも多数現れることが予想さ
れる。その結果、発話した搭乗者の意図した結果とは異
なる動作をするため、搭乗者に不快感を与えるという問
題がある。
【0008】また、音声入力を受理する複数搭乗者機器
用音声制御装置の側で、発話者を特定できないという問
題がある。ところが、複数搭乗者機器内の複数の制御対
象部分、例えば各座席毎に異なる設定が可能な機器を音
声制御装置で制御するには、どの座席の搭乗者が発話し
たかを当該音声制御装置が理解できなければならない。
そこで、その回避策として、誰の発話であるか音声制御
装置からの問い返しなどによって確認することが考えら
れる。しかし、この手法では、計算量の増加、プログラ
ミングコストの増加、認識語彙など音声対話知識を追加
する量の増加に加え、動作した場合でも利用者の意図を
直ちには反映できないという問題がある。
【0009】
【発明が解決しようとする課題】このように、従来は、
複数搭乗者機器内の音声入力取り込み精度が十分でない
場所の搭乗者からの音声入力も受理しなければならず、
そのような音声入力から得られる音声認識結果は信頼性
が低く、認識誤りも多数現れ、発話した搭乗者の意図し
た結果とは異なる動作をするため、搭乗者に不快感を与
えるという問題があった。また、音声入力部の向上を図
り、一つの音声入力機器で複数搭乗者機器内の全ての音
声を取り込むためには、非常に高価な機器を導入する必
要があるという問題があった。
【0010】また、複数の搭乗者からの同時発話がある
場合、重なり合って得られる音声データから発話者それ
ぞれの発話内容を理解しなければならず、そのような処
理を追加した場合、処理量の増加による反応の遅さを招
くだけでなく、得られる音声入力の精度はやはり信頼性
が低く、認識誤りも多数現われ、発話した搭乗者の意図
した結果とは異なる動作をするため、搭乗者に不快感を
与えるという問題もあった。
【0011】加えて、各座席毎に異なる設定が可能な機
器を複数搭乗者用音声制御装置で制御する場合には、ど
の座席の搭乗者が発話したかを当該音声制御装置が理解
できないと制御できないという問題、或いは、誰の発話
であるかを音声制御装置からの問い返しなどによって確
認するには、計算量の増加、プログラミングコストの増
加、認識語彙など音声対話知識を追加する量の増加を招
くだけでなく、動作した場合でも利用者の意図をすぐに
反映できないという問題もあった。
【0012】本発明は、上記事情を考慮してなされたも
ので、高価な音声入力部を必要とせず、高精度な音声入
力を得ることができ、複数の搭乗者による同時発話に対
しても、計算量を増加させることなくそれぞれの発話を
理解することができ、装置側で誰の発話であるかを認識
し、詳細な制御を行うことができる複数搭乗者用音声制
御装置、複数搭乗者機器用音声制御方法及び車両を提供
することを目的とする。
【0013】
【課題を解決するための手段】本発の第1の観点に係る
複数搭乗者機器用音声制御装置は、複数名が搭乗可能な
複数搭乗者機器に搭載して用いられ、各搭乗者が複数の
音声入力機器のいずれかを通して音声による操作を行う
ことが可能な複数搭乗者機器用音声制御装置であって、
上記複数の音声入力機器の音声入力状況から発話者の位
置を推定し、推定された発話者位置に基づいて当該発話
者位置の近傍の音声を選択的に取り込むように制御する
発話者位置推定手段と、この発話者位置推定手段の制御
により取り込まれた音声信号を解析して発話内容を理解
する音声理解手段と、この音声理解手段の音声理解結果
をもとに対応する制御を行う制御手段とを備えたことを
特徴とする。
【0014】本発明によれば、複数の音声入力機器の音
声入力状況から発話者の位置を推定することにより、高
価な音声入力部を必要とせず、高精度な音声入力を得る
ことが可能となる。また本発明によれば、推定された発
話者位置に基づいて当該発話者位置の近傍の音声を選択
的に取り込むように制御することにより、複数の搭乗者
による同時発話で生じる入力音声の混合を抑え、計算量
を増加させることなくそれぞれの発話を理解することが
可能となる。また装置側で、誰(どの位置の搭乗者)の
発話であるかが認識できるため、発話者に負担をかけず
に詳細な制御を行うことができる。
【0015】ここで、上記複数の音声入力機器の位置情
報を管理する音声入力機器位置情報管理手段を設け、発
話者位置推定手段では、各音声入力機器の音声入力状況
に基づいて発話開始を検出して、その発話開始検出時の
音声入力の入力レベルが最大となる音声入力機器を検出
し、その音声入力機器と上記位置情報とから発話者の位
置を推定する構成とするならば、高精度な位置推定が可
能となる。なお、上記音声入力機器位置情報管理手段を
発話者位置推定手段に持たせることも可能である。ま
た、上記位置情報には、各音声入力機器(の識別情報)
と複数搭乗者機器内の座席で決まる発話者位置との対応
情報を用いるとよい。また、各音声入力機器は、複数搭
乗者機器の所定位置に予め設置されているものであって
も、或いは、必要に応じて外部から持ち込まれるもので
あっても構わない。後者の場合には、上記位置情報を必
要に応じて適宜更新登録するとよい。
【0016】本発明の第2の観点に係る複数搭乗者機器
用音声制御装置は、複数搭乗者機器内の複数の座席に対
応して発話開始を通知するための複数の発話開始スイッ
チを設け、前記第1の観点に係る複数搭乗者機器用音声
制御装置の発話者位置推定手段と異なって音声入力機器
の音声入力状況から発話者の位置を推定するのではな
く、複数の発話開始スイッチのうちのいずれかから発話
開始が通知された場合に、該当するスイッチから発話者
の位置を推定するようにしたことを特徴とする。
【0017】本発明によれば、搭乗者のうちの発話開始
スイッチを操作した者の発話だけが取り込まれるため、
発話者位置をより高精度で取得することが可能となる。
【0018】ここで、上記複数の発話開始スイッチの位
置情報を管理する発話開始スイッチ位置情報管理手段を
設け、発話者位置推定手段では、音声入力待ち状態にお
いて上記複数の発話開始スイッチの状態を監視して最初
に発話開始を通知する発話開始スイッチを検出し、その
検出した発話開始スイッチと上記位置情報とから発話者
の位置を推定する構成とするならば、一層高精度な位置
推定が可能となる。なお、上記発話開始スイッチ位置情
報管理手段を発話者位置推定手段に持たせることも可能
である。また、上記位置情報には、各発話開始スイッチ
(の識別情報)と複数搭乗者機器内の座席で決まる発話
者位置との対応情報を用いるとよい。
【0019】更に、上記第1または第2の観点に係る複
数搭乗者機器用音声制御装置における上記音声理解手段
を、上記発話者位置推定手段の制御により取り込まれた
音声信号と発話者位置推定手段により推定された発話者
位置とから、発話者の位置を考慮した音声理解結果を生
成する構成とするとよい。また、上記制御手段を、音声
理解手段による音声理解結果と発話者位置推定手段によ
り推定された発話者位置とから、発話者の位置を考慮し
た制御動作を決定する構成としてもよい。
【0020】このように、発話者位置を音声理解手段、
または制御手段が把握することにより、発話者(搭乗
者)は複数搭乗者機器内の場所を発話内容で指定するこ
となく音声による操作が可能となり、加えて、そのため
の音声認識、理解のための語彙、知識などの量を軽減す
ることが可能となる。
【0021】本発明の第3の観点に係る複数搭乗者機器
用音声制御装置は、複数搭乗者機器内に複数の音声入力
機器と対応して設けられる複数の音声理解機器にて対応
する音声入力機器からの音声信号を解析して発話内容を
理解することで取得される音声理解結果を受け取るよう
に構成されたは発話者推定手段であって、各音声理解機
器の位置情報を管理して、音声理解結果入力待ち状態で
音声理解結果を通知した音声理解機器を検出した場合
に、その検出結果と上記位置情報とから発話者の位置を
推定する発話者位置推定手段を備えると共に、この発話
者位置推定手段により推定された発話者位置と上記検出
された音声理解機器からの音声理解結果をもとに対応す
る制御を行う制御手段を備えたことを特徴とする。ここ
で、上記位置情報には、各音声理解機器(の識別情報)
と複数搭乗者機器内の座席で決まる発話者位置との対応
情報を用いるとよい。また、上記複数の音声理解機器に
対して音声理解のために必要な知識を通知する音声理解
知識通知手段を更に備えるとよい。
【0022】本発明によれば、複数の音声入力機器に対
応して設けられた複数の音声理解機器のうち音声理解結
果入力待ち状態で音声理解結果を通知した音声理解機器
から発話者の位置を推定することにより、高価な音声入
力部を必要とせず、音声認識に十分な精度の音声情報に
基づく音声理解結果を取得することが可能となる。また
本発明によれば、推定された発話者位置と上記検出され
た音声理解機器からの音声理解結果をもとに対応する制
御が行われるため、複数搭乗者機器内において各搭乗者
が発話した内容を、再発話を要することなく、すべて実
行することが可能となる。
【0023】ここで、上記第1、第2または第3の観点
に係る複数搭乗者機器用音声制御装置で対象とする上記
音声入力機器の個数は、複数搭乗者機器の定員数(座席
数)に一致させるのが最も好ましいが、定員数未満とし
ても構わない。このことは、第2の観点に係る複数搭乗
者機器用音声制御装置における発話開始ボタンの個数に
ついても同様である。
【0024】また本発明は、上記第1、第2または第3
の観点に係る複数搭乗者機器用音声制御装置において、
推定された発話者位置の情報をもとに、いずれの搭乗者
からの入力が受け付けられているかを提示する提示手段
を更に備えたことを特徴とする。
【0025】このように、推定された発話者位置の情報
をもとに、いずれの搭乗者からの入力が受け付けられて
いるかを提示することにより、発話者はその提示内容か
ら自身の発話内容が有効か否かを自身で確認することが
可能となる。ここで、いずれの搭乗者からの入力が受け
付けられているかを提示するのに、予め定められた発話
者位置毎に対応する表示器(発話者明示マーカ)を用意
しても、幾つかの表示器(例えば車内に1つ、或いは前
部座席用と後部座席用の2つなど)を用い、当該表示器
上に、いずれの搭乗者からの入力が受け付けられている
かを示す情報を表示するようにしてもよい。この表示器
は、複数搭乗者機器用音声制御装置内または装置外のい
ずれに設けられるものであっても構わない。表示器を装
置外に設ける場合、上記提示手段の制御機能を装置内に
持たせればよい。
【0026】なお、以上の装置に係る本発明は方法(複
数搭乗者機器用音声制御方法)に係る発明としても成立
する。また、本発明は、コンピュータを当該発明に相当
する手段(例えば第1または第2の観点に係る複数搭乗
者機器用音声制御装置における発話者位置推定手段、音
声理解手段、制御手段、或いは第3の観点に係る複数搭
乗者機器用音声制御装置における発話者位置推定手段、
制御手段)として機能させるための(或いはコンピュー
タに当該発明に相当する機能を実現させるための、或い
はコンピュータに当該発明に相当する手順を実行させる
ための)プログラムを記録したコンピュータ読み取り可
能な記録媒体としても成立する。
【0027】また本発明は、以上の装置を搭載した複数
搭乗者機器、特に車両としても成立する。この車両内に
設置される音声入力機器の個数が定員数未満の場合で
も、少なくとも1つは運転席より後方に設置されること
が好ましい。このことは、発話開始スイッチについても
同様である。
【0028】
【発明の実施の形態】以下、本発明を、乗用車に代表さ
れる複数搭乗者機器内の搭乗者の中から発話者を判別す
る機能を持つ複数搭乗者機器用音声制御装置に適用した
実施の形態につき、図面を参照して説明する。
【0029】[第1の実施形態]図1は、本発明の第1
の実施形態に係る複数搭乗者機器用音声制御装置の概略
構成を示すブロック図である。図1に示す複数搭乗者機
器用音声制御装置10は、複数搭乗者機器に搭乗してい
る複数の搭乗者の中から発話者(発話者位置)を“推
定”し、音声入力精度を向上させると共に、発話者情報
(発話者位置情報)を利用してより細かな制御を容易と
するために、発話者推定部11と、音声理解部12と、
制御部13とを備えて構成されている。
【0030】発話者推定部11は、複数(n個)の音声
入力部1−1〜1−n及び音声理解部12と接続されて
おり、音声入力を検知すると搭乗者の中から発話者の場
所を推定し、その推定位置情報に基づき推定された発話
者の音声入力を重点的に取り出すように音声入力部を制
御する。また発話者推定部11は、推定された発話者位
置情報と、音声入力部1−1〜1−nから得られる入力
音声情報を音声理解部12に通知する。
【0031】音声理解部12は、発話者推定部11及び
制御部13と接続されており、発話者推定部11から得
られる音声情報をもとに入力音声を理解し、音声理解結
果と発話者位置情報を制御部13に通知する。音声理解
部12における音声理解方式は本発明の本質ではないの
で、その詳細は省略する。
【0032】制御部13は、音声理解部12及び制御機
器2−1〜2−mと接続されており、音声理解部12か
らの入力音声理解結果と、発話者位置情報をもとに、制
御機器2−1〜2−mのうちの適切な制御機器への制御
コマンドへの変換を行う。以上が図1の構成の複数搭乗
者機器用音声制御装置10の概略構成である。
【0033】次に、複数搭乗者機器用音声制御装置10
中の発話者推定部11の全体的な処理の流れについて、
図2のフローチャートを参照して説明する。まずステッ
プS21では、音声入力部1−1〜1−nからの入力に
より音声入力がなされたか否かを調べる。音声入力が検
出されたならばステップS22に進み、検出されなけれ
ば音声入力検出まで当該ステップS21を続ける。な
お、ステップS21での音声検出には従来から知られて
いる周知の検出方式を利用すればよく、その詳細は本発
明の本質ではないので省略する。
【0034】ステップS22では、全ての音声入力部1
−1〜1−nについて入力レベルの確認を実行したか調
べる。全ての音声入力部1−1〜1−nについて確認済
みならばステップS25へ、確認済みでないならばステ
ップS23へ進む。
【0035】ステップS23では、対象となる音声入力
部1−i(iは1〜nのいずれか)の入力レベルを確認
し、それまで確認した音声入力部の入力レベル中の最大
値かどうかを調べる。最大値であるならばステップS2
4へ進み、そうでなければステップS22に戻る。
【0036】ステップS24では、現時点で最大の入力
レベルであると確認した音声入力部1−iのID(識別
情報)とその入力レベルとを、それぞれ発話者入力部I
Dとそのレベルとして記憶する。ここでは、既に発話者
入力部IDとレベルが記憶されているならば、その記憶
情報が現時点で最大の入力レベルであると確認した音声
入力部1−iのID(音声入力部ID)とその入力レベ
ルに更新されることになる。その後ステップS22に戻
る。
【0037】ステップS25では、その時点において記
憶されている発話者入力部ID、つまり入力レベルが最
大であった音声入力部のIDを、複数搭乗者機器内での
発話者位置情報へと変換する。この変換には、例えば複
数搭乗者機器が図3に示す乗用車の場合であれば、図5
に示すような入力部ID(音声入力部ID)と車内の位
置情報との対応情報を発話者入力部IDにより参照し
て、その発話者入力部IDに一致する音声入力部IDか
ら発話者位置情報を検索する、などの方法が適用可能で
ある。変換終了後ステップS26へ進む。
【0038】ステップS26では、記憶されている発話
者入力部IDをもとに、そのIDの音声入力部からのみ
音声入力が可能なように設定する。なお、本実施形態で
は、初期状態において全ての音声入力部1−1〜1−i
がアクティブ状態に設定され、これにより全ての音声入
力部1−1〜1−iから音声が入力できる状態になって
いる。したがってステップS26では、発話者入力部I
Dに一致するIDの音声入力部のみアクティブな状態が
継続され、それ以外の音声入力部は非アクティブにされ
る。勿論、発話者入力部ID以外のIDの音声入力部か
らの音声入力を単に無視する(つまり受け取らない)構
成であっても構わない。
【0039】ステップS27では、音声入力が終了した
か否かを調べる。音声入力が終了したならばステップS
28へ、そうでなけれ当該ステップS27を続ける。ス
テップS28では、アクティブな音声入力部から入力さ
れた音声情報、及びステップS25で取得した発話者位
置情報を音声理解部12に通知し、全ての音声入力部1
−1〜1−nの動作状態を初期化、つまりアクティブに
する。初期化後、ステップS21に戻る。
【0040】以上が、複数搭乗者機器用音声制御装置1
0中の発話者推定部11の全体的な処理の流れである。
【0041】ここで、図1の構成の複数搭乗者機器用音
声制御装置10が普通乗用車における車載用コンピュー
タにより実現されている場合を例に、当該音声制御装置
10の動作を、図1乃至図5を適宜参照して更に詳しく
説明する。
【0042】図3に、図1の複数搭乗者機器用音声制御
装置10を実現する車載用コンピュータを搭載した乗用
車30の例を示す。乗用車30には、運転席、助手席、
右後部席、左後部席に対応して、それぞれ音声入力部1
−1、音声入力部1−2、音声入力部1−3、音声入力
部1−4が搭載されている。つまり図3は、図1におい
てn=4の例である。この音声入力部1−1,1−2,
1−3,1−4のID(入力部ID)はA,B,C,D
となっている。そこで以下の説明では、音声入力部1−
1,1−2,1−3,1−4を音声入力部A,B,C,
Dと表現する。この音声入力部A〜Dは、当該音声入力
部が設置されている各座席で(その座席の搭乗者から)
発声される音声に限り、高精度で取り込むことが可能な
ように設定されているものとする。
【0043】このような乗用車30の車内に、複数名の
搭乗者がおり、図4のような発話があった場合、即ち、
右後部席にいる搭乗者が時刻T1〜T3にかけて「オー
ディオのボリュームを小さくして」と発話し、それに少
し遅れて運転手が時刻T2に「大きいな、あの橋」と発
話した例を考える。このとき、発話者推定部11では以
下のような動作を行う。
【0044】<時刻T1> S21:音声入力が検知される。S22に進む。
【0045】S22:この段階では音声入力部A〜Dの
入力レベル確認はしていないので、S23へ進む。
【0046】S22−S24:(複数搭乗者機器用音声
制御装置10を実現する)車載用コンピュータに接続さ
れている音声入力部A〜Dそれぞれについて入力レベル
を確認する。その結果、音声入力部C(右後部席に設置
された音声入力部)からの入力が最も高いレベルで音声
が検出され、Cが発話者入力部IDとして記憶される。
【0047】S25:図5の入力部IDと車内位置との
対応情報をもとに、今回の入力対象者は右後部席にいる
と判定し、発話者位置情報を「右後部席」と判定する。
【0048】S26:最高レベルで音声が検出された音
声入力部Cのみアクティブ状態を継続し、それ以外の音
声入力部A,B,Dは非アクティブにする。
【0049】S27:音声入力部Cより入力される音声
から音声入力終了が検出されないので、音声入力終了を
待つ。
【0050】<時刻T2>運転手が発話するが、音声入
力部Aは非アクティブなので音声入力は検出されない。
【0051】<時刻T3> S27:右後方座席にいる発話者の音声が終了し、音声
終了を検出する。
【0052】S28:音声入力部Cからの音声情報と、
S25で取得した発話者位置情報を音声理解部12に伝
え、音声入力部A,B,C,Dの動作状態を初期化(ア
クティブ化)する。
【0053】音声理解部12は、発話者情報推定部11
のS28の動作により、当該発話者推定部11から「オ
ーディオのボリュームを小さくして」に相当する音声情
報と、発話者位置情報「右後部席」を取得する。音声理
解部12は、この発話内容を理解し、制御部13に対し
て「オーディオのボリュームを下げる」コマンドを通知
する。ここで、乗用車30に搭載されたオーディオシス
テムが各座席毎にボリュームを変更することが可能な場
合、音声理解部12が発話者位置情報を考慮して「右後
部席のオーディオのボリュームを下げる」コマンドを通
知することも可能である。
【0054】さて、音声理解部12からコマンドが通知
された制御部13は、当該コマンドに従い、車内搭載の
制御機器であるオーディオ機器を「(右後部席の)ボリ
ュームを下げる」ように制御する。
【0055】かくして、このように構成された本実施形
態の複数搭乗者機器用音声制御装置10(を実現する車
載用コンピュータ)によれば、複数搭乗者機器(乗用車
30)内における広範囲をカバーする高精度な音声入力
部を必要とすることなく、従来から存在するより安価な
音声入力部による構成で、音声認識に十分な精度の音声
情報を取得することが可能となる。また、本実施形態に
よれば、複数搭乗者がいる複数搭乗者機器内において、
複数搭乗者等の同時発話で生じる入力音声の混合を抑え
ることが可能となる。また、本実施形態によれば、複数
搭乗者のうちの誰が発話したかを発話者推定部11にて
推定できるため、その情報(発話者位置情報)を利用し
てより高精度な音声情報を取得することが可能となる。
また、本発明によれば、発話者位置情報を音声理解部1
2、更には制御部13が把握することにより、複数搭乗
者機器内の場所を発話内容で指定することなく音声によ
る操作が可能となり、加えて、そのための音声認識、理
解のための語彙、知識などの量を軽減することが可能と
なる。
【0056】なお、図3の例では、乗用車30内の各座
席(発話者位置)に対し、音声入力部が1対1で対応し
ているが、必ずしも1対1対応である必要はなく、音声
入力部が座席数(定員数)未満であっても構わない。例
えば、運転席と助手席の間と、右後部席と左後部席の間
で、それぞれ音声入力部を共有させるようにしてもよ
い。但し、搭乗者には、同じ音声入力部を共有する他の
搭乗者が発話中は発話しないなどの制約が必要となる。
【0057】[第2の実施形態]次に本発明の第2の実
施形態について説明する。
【0058】図6は、本発明の第2の実施形態に係る複
数搭乗者機器用音声制御装置の概略構成を示すブロック
図である。図6に示す複数搭乗者機器用音声制御装置6
0は、複数搭乗者機器に搭乗している複数の搭乗者の中
から発話者(発話者位置)を“決定”し、音声入力精度
を向上させると共に、発話者情報(発話者位置情報)を
利用してより細かな制御を容易とするために、発話者決
定部61と、音声理解部62と、制御部63と、(音声
入力部1−1〜1−nに対応して設けられる)発話開始
ボタン64−1〜64−nと、(同じく音声入力部1−
1〜1−nに対応して設けられる)発話者明示マーカ6
5−1〜65−nとを備えて構成されている。ここで
は、音声入力部1−1〜1−nは、前記第1の実施形態
と異なって初期状態において非アクティブ状態に設定さ
れる。
【0059】発話者決定部61は、音声理解部62、発
話開始ボタン64−1〜64−n、及び発話者明示マー
カ65−1〜65−nと接続されており、発話開始ボタ
ン−発話者位置対応情報、発話者位置情報−音声入力部
対応情報、発話者位置情報−発話者明示マーカ対応情報
を持つ。
【0060】発話者決定部61は、発話開始ボタン64
−iが押されたことが当該ボタン64−iから通知され
ると、そのボタン64−iに対応する音声入力部1−i
だけアクティブ状態にし、それ以外の音声入力部は非ア
クティブ状態のままとすることで、当該音声入力部1−
iからのみ音声取り込みを開始する。そして発話者決定
部61は、音声取り込み中は、ボタン64−iに対応す
る発話者明示マーカ65−iを点灯する。発話者決定部
61は、音声入力終了時には、全ての音声入力部1−1
〜1−nを初期化して非アクティブにし、発話開始ボタ
ン−発話者位置対応情報から生成される発話者位置情報
と、取り込まれた音声情報とを音声理解部62に通知す
る。音声入力終了の判定には従来から知られている周知
の検出方式を利用すればよく、本発明の本質ではないの
で詳細な説明は省略する。
【0061】図7は、発話開始ボタン−発話者位置対応
情報の一例を示す。この発話開始ボタン−発話者位置対
応情報は、発話開始ボタン64−1〜64−n(図はn
=4の例)のIDと、発話開始時にそのIDの発話開始
ボタンを操作可能な発話者(搭乗者)の位置(座席)の
集合を記述する情報である。ここでは、操作(押下)さ
れた発話開始ボタンのIDを用いて図7の発話開始ボタ
ン−発話者位置対応情報を参照することにより発話者位
置が決定できる。発話開始ボタンと発話者位置情報との
対応は1対1である必要はない。
【0062】図8は、発話者位置情報−音声入力部対応
情報の一例を示す。この発話者位置情報−音声入力部対
応情報は、発話者位置(座席)に対応する(アクティブ
にすべき)音声入力部のIDの集合を記述する情報であ
る。ここでは、決定された発話者位置情報を用いて図8
の発話者位置情報−音声入力部対応情報を参照すること
によりアクティブにする音声入力部(のID)が決定で
きる。発話者位置とアクティブにすべき音声入力部との
対応は1対1である必要はない。
【0063】図9は、発話者位置情報−発話者明示マー
カ対応情報の一例を示す。この発話者位置情報−発話者
明示マーカ対応情報は、発話者位置(座席)に対応する
(点灯すべき)発話者明示マーカのIDの集合を記述す
る情報である。ここでは、決定された発話者位置情報を
用いて発話者位置情報−発話者明示マーカ対応情報を参
照することによりに点灯すべき発話者明示マーカ(のI
D)を決定することができる。発話者位置情報と点灯す
べき発話者明示マーカとの対応は1対1である必要はな
い。
【0064】音声理解部62は、発話者決定部61及び
制御部63と接続されており、発話者決定部61から得
られる音声情報をもとに入力音声を理解し、音声理解結
果と発話者位置情報を制御部13に通知する。音声理解
部12で適用される音声理解方式は本発明の本質ではな
いので、その詳細は省略する。
【0065】制御部63は、音声理解部62及び制御機
器2−1〜2−mと接続されており、音声理解部62か
らの入力音声理解結果と発話者位置情報をもとに、制御
機器2−1〜2−mのうちの適切な制御機器への制御コ
マンドへの変換を行う。
【0066】発話開始ボタン64−1〜64−nは、発
話者決定部61と接続されており、押下されるとそのI
D(ボタンID)を発話者決定部61に通知する。発話
者明示マーカ65−1〜65−nは、発話者決定部61
と接続されている。音声取り込み中は、発話者明示マー
カ65−1〜65−nのうちの発話者位置情報に対応す
るマーカが発話者決定部61からの制御により点灯し
て、その場所の音声を取り込み中であることを明示す
る。以上が図6の構成の複数搭乗者機器用音声制御装置
60の概略構成である。
【0067】次に、複数搭乗者機器用音声制御装置60
中の発話者決定部61の全体的な処理の流れについて、
図10のフローチャートを参照して説明する。まずステ
ップS101では、発話開始ボタン64−1〜64−n
のうち、1つでも押下されたか否かを検出する。検出さ
れたならばステップS102へ進み、検出されなければ
検出されるまで当該ステップS101を続ける。
【0068】ステップS102では、押下された発話開
始ボタンのID(ボタンID)と、発話開始ボタン−発
話者位置対応情報(図7参照)とから、発話者位置情報
を生成する。
【0069】ステップS103では、ステップS102
で生成された発話者位置情報と、発話者位置情報−音声
入力部対応情報(図8参照)からアクティブにする音声
入力部のIDを検索し、該当する音声入力部のみアクテ
ィブにするように制御する。
【0070】ステップS104では、ステップS102
で生成された発話者位置情報と、発話者位置情報−発話
者明示マーカ対応情報(図9参照)から点灯する発話者
明示マーカを検索し、該当する発話者明示マーカを点灯
させるように制御する。
【0071】ステップS105では、アクティブにされ
ている音声入力部からの音声入力の終了が検出されたか
否かを調べる。音声入力終了を検出したならばステップ
S106へ進み、検出されなければ音声入力終了を検出
するまで当該ステップS105を続ける。
【0072】ステップS106では、取り込まれた入力
音声情報と、発話者位置情報を音声理解部62に通知
し、全ての音声入力部1−1〜1−nの動作状態を初期
化(ここでは非アクティブ化)すると共に、点灯された
発話者明示マーカを消灯し、ステップS101に戻る。
【0073】以上が、複数搭乗者機器用音声制御装置6
0中の発話者決定部61の全体的な処理の流れである。
【0074】ここで、図6の構成の複数搭乗者機器用音
声制御装置60が普通乗用車における車載用コンピュー
タにより実現されている場合を例に、当該音声制御装置
60の動作を、図4と図6乃至図11を適宜参照して更
に詳しく説明する。
【0075】図11に、図6の複数搭乗者機器用音声制
御装置60を実現する車載用コンピュータを搭載した乗
用車110の例を示す。乗用車110には、運転席、助
手席、右後部席、左後部席に対応して、それぞれ音声入
力部1−1、音声入力部1−2、音声入力部1−3、音
声入力部1−4が搭載されている。つまり図11は、図
6においてn=4の例である。この音声入力部1−1,
1−2,1−3,1−4のID(入力部ID)はV1,
V2,V3,V4となっている。そこで以下の説明で
は、音声入力部1−1,1−2,1−3,1−4を音声
入力部V1,V2,V3,V4と表現する。この音声入
力部V1〜V4は、設置されている各座席で(その座席
の搭乗者から)発声される音声に限り、高精度で取り込
むことが可能なように設定されているものとする。
【0076】また、車載用コンピュータ(により実現さ
れる複数搭乗者機器用音声制御装置60)には、ボタン
IDがB1,B2,B3,B4の4個の発話開始ボタン
64−1,64−2,64−3,64−4(以下、発話
開始ボタンB1,B2,B3,B4と称する)、マーカ
IDがM1,M2,M3,M4の4個の発話者明示マー
カ65−1,65−2,65−3,65−4(以下、発
話者明示マーカM1,M2,M3,M4と称する)が搭
載されているものとする。
【0077】車載用コンピュータ(により実現される複
数搭乗者機器用音声制御装置60)には更に、発話開始
ボタン−発話者位置対応情報、発話者位置情報−音声入
力部対応情報、発話者位置情報−発話者明示マーカ対応
情報が、それぞれ図7、図8、図9のように登録されて
いるものとする。
【0078】このような車載用コンピュータを搭載した
乗用車110の車内に、複数名の搭乗者がおり、図4の
ような発話があった場合、即ち、右後部席にいる搭乗者
が時刻T1に発話開始ボタンB3を押下して、時刻T1
〜T3にかけて「オーディオのボリュームを小さくし
て」と発話し、それに少し遅れて運転手が時刻T2に
「大きいな、あの橋」と発話した例を考える。このと
き、発話者決定部61では以下のような動作を行う。
【0079】<時刻T1> S101:発話開始ボタンB3が押下されたので、S1
02に進む。
【0080】S102:発話開始ボタンIDがB3であ
る情報と、図7の発話開始ボタン−発話者位置対応情報
をもとに、発話者位置を「右後部席」と判定する。
【0081】S103:発話者位置が「右後部席」であ
る発話者位置情報と、図8の発話者位置対応情報−音声
入力部対応情報をもとに、アクティブ化する音声入力部
をV3と定め、当該音声入力部V3のみアクティブ化
し、それ以外の音声入力部V1,V2,V4は非アクテ
ィブのままとする。
【0082】S104:発話者位置情報「右後部席」
と、図9の発話者位置情報−発話者明示マーカ対応情報
をもとに、点灯する発話者明示マーカをM3と定め、当
該マーカM3を点灯させ、右後部席の搭乗者に音声入力
可能であることを通知する。
【0083】S105:音声入力が終了していないた
め、発話終了まで待機する。
【0084】<時刻T2>運転手の発話がシステムに対
するものではないので、発話開始ボタンが押下されな
い。或いは、運転手が誤って発話開始ボタンB1を押下
した場合でも、発話者決定部61では音声入力終了待ち
状態なので、システム動作に影響は現れず、発話者明示
マーカM1も点灯しない。
【0085】<時刻T3> S105:音声入力終了が検知されたので、S106に
進む。
【0086】S106:取り込まれた入力音声情報「オ
ーディオのボリュームを小さくして」と、発話者位置情
報「右後部席」を、音声理解部62に通知する。そし
て、全ての音声入力部V1〜V4の動作状態を初期化
(非アクティブ化)し、点灯された発話者明示マーカM
3を消灯する。
【0087】音声理解部62は、発話者決定部61のS
106の動作により、当該発話者決定部61から「オー
ディオのボリュームを小さくして」に相当する音声情報
と、発話者位置情報「右後部席」を取得する。音声理解
部62は、この発話内容を理解し、制御部63に対して
「オーディオのボリュームを下げる」コマンドを通知す
る。ここで、乗用車110に搭載されたオーディオシス
テムが各座席毎にボリュームを変更することが可能な場
合、音声理解部62が発話者位置情報を考慮して「右後
部席のオーディオのボリュームを下げる」コマンドを通
知することも可能である。
【0088】音声理解部62からコマンドが通知された
制御部63は、当該コマンドに従い、車内搭載の制御機
器であるオーディオ機器を「(右後部席の)ボリューム
を下げる」ように制御する。
【0089】なお時刻T2における運転手の発話が、車
載コンピュータに対するコマンドを発生する発話であっ
た場合でも、前述のように時刻T2時点でのボタン押下
は受理されない。しかし、発話者明示マーカM1が点灯
しないため、運転手は音声入力不可状態であることを理
解することができ、右後部席搭乗者の発話終了後、改め
て音声入力を行うことができる。
【0090】かくして、このように構成された本実施形
態の複数搭乗者機器用音声制御装置60(を実現する車
載用コンピュータ)によれば、前記第1の実施形態と同
様の効果を得ることができる。加えて本実施形態におい
ては、搭乗者のうちの発話者ボタンを押下した者の発話
だけを抽出するため、発話者位置情報をより高精度で得
ることができる。また本実施形態においては、ボタン押
下後に音声取り込み可能な状態を意味する発話者明示マ
ーカが点灯するかどうかを見るだけで、その音声入力が
有効か否かを利用者(発話者)が確認することができ
る。
【0091】なお、図11の例では、乗用車110内の
各座席(発話者位置)に対し、音声入力部、発話開始ボ
タン、発話者明示マーカが1対1で対応しているが、必
ずしも1対1対応である必要はなく、音声入力部、発話
開始ボタン、発話者明示マーカが座席数(定員数)未満
であっても構わない。例えば、運転席と助手席の間と、
右後部席と左後部席の間で、それぞれ音声入力部、発話
開始ボタン、発話者明示マーカの少なくとも1つを共有
させるようにしてもよい。但し、例えば発話開始ボタン
を共有する例では、該当する搭乗者には、当該ボタンを
他の共有者が押したならば発話しないなどの制約が必要
となる。
【0092】[第3の実施形態]次に本発明の第3の実
施形態について説明する。
【0093】図12は、本発明の第3の実施形態に係る
複数搭乗者機器用音声制御装置の概略構成を示すブロッ
ク図である。図12に示す複数搭乗者機器用音声制御装
置120は、複数搭乗者機器に搭乗している複数の搭乗
者の発話をそれぞれ認識し、その認識結果と発話者位置
情報を利用してより詳細な制御を容易とするために、発
話者決定部121と、音声理解知識通知部122と、制
御部123とを備えて構成されている。
【0094】発話者決定部121は、音声入力部1−1
〜1−nに対応して設けられた複数の音声理解装置3−
1〜3−n及び制御部123と接続されており、音声理
解装置ID−発話者位置対応情報を持つ。
【0095】発話者決定部121は、音声理解装置3−
1〜3−nのいずれかから音声理解結果を受理すると、
その音声理解装置のIDにより音声理解装置−発話者位
置対応情報から対応する発話者位置情報を検索し、音声
理解結果と発話者位置情報を制御部123に通知する。
なお、音声理解装置−発話者位置対応情報は、図7の発
話開始ボタン−発話者位置情報とほぼ同様であり、発話
開始ボタンIDを音声理解装置IDとしたものと考えて
よい。
【0096】音声理解知識通知部122は、音声理解装
置3−1〜3−nと接続されており、例えば認識語彙な
どの音声理解のために必要な知識を各音声理解装置に通
知する。
【0097】制御部123は、発話者決定部121と制
御機器2−1〜2−mと接続されており、発話者決定部
121から通知される音声理解結果と発話者位置情報を
もとに、制御機器2−1〜2−mのうちの適切な制御機
器への制御コマンドへの変換を行う。以上が図12の構
成の複数搭乗者機器用音声制御装置120の概略構成で
ある。
【0098】ここで、図12の構成の複数搭乗者機器用
音声制御装置120が普通乗用車における車載用コンピ
ュータにより実現されている場合を例に、当該音声制御
装置120の動作を詳細に説明する。
【0099】例えば、運転手が「エアコンの温度を下げ
て」と発話すると同時に左後部席の搭乗者が「オーディ
オのボリュームを小さくして」と発話した場合を考え
る。ここで、音声入力部1−1及び音声理解装置3−1
が運転席に対応し、音声入力部1−3及び音声理解装置
3−3が左後部席に対応しているものとする。
【0100】この場合、運転席に対応する音声理解装置
3−1と、左後部席に対応する音声理解装置3−3がそ
れぞれの発話を理解し、発話者決定部121に通知す
る。
【0101】今、発話者決定部121には、運転手、左
後部席の搭乗者の順に音声理解結果が通知されたとす
る。すると発話者決定部121は、 1番目:「エアコンの温度を下げて」、運転席 2番目:「オーディオのボリュームを小さくして」、左
後部席 のように、音声理解結果とそれに対応する発話者位置情
報との組み合わせを、音声理解結果を受理した順に制御
部123に通知する。
【0102】制御部123では、 1番目:「エアコンの運転席の温度を下げる」 2番目:「オーディオの左後部席のボリュームを小さく
する」 のように、発話者位置情報を考慮したコマンドに変更し
て、制御機器2−1〜2−mのうちの適切な機器に通知
する。
【0103】かくして、このように構成された本実施形
態の複数搭乗者機器用音声制御装置120(を実現する
車載用コンピュータ)によれば、複数搭乗者機器(車
両)内における広範囲をカバーする音声入力部を必要と
することなく、従来から存在するより安価な音声入力部
による構成で、音声認識に十分な精度の音声情報による
音声理解結果を得ることが可能となる。また、本実施形
態によれば、搭乗者が複数いる複数搭乗者機器(車両)
内においてもそれぞれの搭乗者が発話した内容を、再発
話を要することなく、すべて実行することが可能とな
る。
【0104】以上、本発明の第1乃至第3の実施形態に
ついて説明したが、本発明は上述の実現形態に限定され
るものではない。例えば、以上の実施形態では、音声入
力はすべて本装置(複数搭乗者機器用音声制御装置)の
外に接続されている機器を操作するものとしたが、本装
置の内部情報の検索など本装置そのものに対する操作を
行う音声入力を受理しても構わない。更に、子供などに
よるいたずらを避けるために、予め音声入力を受理しな
い場所を設定し、そこに該当する音声入力部は非アクテ
ィブに制御するなどの機能を発話者推定部、発話者決定
部に与えてもよい。更に、各音声入力部1−1〜1−n
から本装置への音声入力にケーブルなどを用いずに、無
線による通信を用いるようにしてもよい。
【0105】また、前記第1(第2)の実施形態では、
音声入力の終了を発話者推定部11(発話者決定部6
1)で検知して、当該発話者推定部11(発話者決定部
61)から音声理解部12(62)に通知するものとし
たが、音声理解部12(62)で音声開始、終了を検知
して、発話者推定部11(発話者決定部61)に通知す
る形式でも構わない。また、発話検出後、音声入力部の
制御をアクティブ、非アクティブという形式で実行して
いるが、各音声入力部の取り込みレベルに動的に重み付
けする形式でも構わない。更に、音声入力を一人ずつ受
理するように制御したが、音声理解中に入力された別の
音声をバッファに保存してから順次処理してもよいし、
音声理解部12(62)が十分な精度で理解できる範囲
であれば、複数の音声を重畳した入力を受け付けてもよ
く、音声理解部12(62)を並列的に複数用意しても
構わない。
【0106】また、前記第1の実施形態では、音声入力
部1−1〜1−nが複数搭乗者機器(例えば車両)内の
該当する場所の音声のみを取り込むものとしているが、
複数の音声入力部への音声の入り具合から発話者の場所
を推定する形式でも構わない。更に、第2の実施形態で
適用されている発話者明示マーカを推定された発話者位
置情報をもとに点灯させてもよい。更に、音声入力部が
非アクティブ状態(音声入力不可状態)にある状態で発
話を検出したときは、音声入力不可状態であることを発
話者に通知してもよい。
【0107】また、前記第2の実施形態では、発話者明
示マーカを各座席に点灯させるようにしているが、どの
発話者の音声を受理しているかをグラフィカルに表示す
る形式でもよいし、音声入力不可状態であれば、音声出
力により入力できないことを伝える形式でもよい。更
に、発話開始ボタンのIDと発話者位置情報が一致する
場合は、特に発話者位置情報へと変換せずに、直接、ア
クティブ化する音声入力部を指す情報と、点灯する発話
者明示マーカを指す情報とに変更しても構わない。
【0108】また、前記第3の実施形態では、音声入力
部と音声理解装置が1対1で対応しているものとした
が、音声理解装置のIDにより場所が特定できるのであ
ればその限りではない。更に、音声理解知識通知部が認
識語彙を通知するものとしているが、本装置内に対話処
理部を配置し、そこから通知される認識語彙を動的に通
知してもよいし、更に高度な処理を音声理解装置がする
ための情報を通知してもよい。
【0109】また、以上の第1乃至第3の実施形態で
は、本発明に係る複数搭乗者機器用音声制御装置が普通
乗用車(車両)における車載用コンピュータにより実現
されている場合を例として説明しているが、列車、飛行
機、船舶などに搭載されるものであっても構わない。
【0110】更に、前記第1乃至第3の実施形態に係る
複数搭乗者機器用音声制御装置の処理手順(機能、手
段)は、ソフトウェアを使って実現することも可能であ
る。以下、複数搭乗者機器用音声制御装置における処理
をソフトウェアを使って実現する場合の装置構成につい
て図13を参照しながら説明する。
【0111】この場合、自然言語対話装置としての複数
搭乗者機器用音声制御装置のハードウェア部分は、CP
U21、プログラムや必要なデータを格納するためのR
AM22、ディスクドライブ装置24、記憶装置25、
及び入出力装置26を備えたコンピュータで実現され
る。
【0112】一方、図1の複数搭乗者機器用音声制御装
置10中の発話者推定部11、音声理解部12、制御部
13の各要素(または図6の複数搭乗者機器用音声制御
装置60中の発話者決定部61、音声理解部62、制御
部63の各要素、または図12の複数搭乗者機器用音声
制御装置120中の発話者決定部121、音声理解知識
通知部122、制御部123の各要素)は、それぞれの
処理手順を記述したプログラムを図13のコンピュータ
(内のCPU21)にて実行させることによって実現さ
れる。なお、図1の発話者推定部11などに格納される
情報は、プログラムと一体化されたものであってもよい
し、プログラムとは別に設定されるものであってもよ
い。
【0113】上述の処理手順を記述したプログラムは、
図13のコンピュータを制御するためのプログラムとし
てRAM22に格納され、CPU21にて実行される。
CPU21はRAM22に格納されたプログラムの手順
に従い、演算や、記憶装置25或いは入出力装置26の
制御などを行って、所望の機能を実現していく。
【0114】プログラムをRAM22にインストールす
るには種々の方法を用いることができる。例えば、上述
の処理手順を記述したプログラムであって、コンピュー
タシステムを制御するためのプログラムを、コンピュー
タで読み取り可能な記録媒体(例えばフロッピーディス
ク、或いはCD−ROM等のリムーバブル記録媒体)に
記憶させておく。そして図13に示すように記録媒体に
応じたディスクドライブ装置24を用いて当該プログラ
ムを読み取り、RAM22に格納する。この他に、一旦
ディスクドライブ装置24等にインストールしておき、
実行時に同装置からRAM22に格納するようにしても
よい。
【0115】また、プログラムを格納した記録媒体がI
Cカードである場合は、ICカードリーダを用いて該プ
ログラムを読み取ることができる。さらには、ネットワ
ークを介して所定のインタフェース装置からプログラム
を受け取ることもできる。
【0116】以上のように、本発明の実現形態には上述
の例に対して種々の変形が可能であり、それらも趣旨に
反しない限り本発明の実施形態の範囲内である。
【0117】
【発明の効果】以上説明したように、本発明によれば、
高価な音声入力部を必要とせず、高精度な音声入力を得
ることができ、複数の搭乗者による同時発話に対して
も、計算量を増加させることなくそれぞれの発話を理解
することができ、装置側から誰の発話であるかを認識
し、詳細な制御を行うことができる、等の実用上多大な
効果が奏せられる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る複数搭乗者機器
用音声制御装置の概略構成を示すブロック図。
【図2】図1中の発話者推定部11の全体的な処理の流
れを説明するためのフローチャート。
【図3】図1の複数搭乗者機器用音声制御装置10(を
実現する車載用コンピュータ)を搭載した乗用車におけ
る音声入力部の配置例を示す図。
【図4】車内での発話例を示す図。
【図5】音声入力部のIDと車内位置(発話者位置情
報)との対応情報の一例を示す図。
【図6】本発明の第2の実施形態に係る複数搭乗者機器
用音声制御装置の概略構成を示すブロック図。
【図7】発話開始ボタン−発話者位置対応情報の一例を
示す図。
【図8】発話者位置情報−音声入力部対応情報の一例を
示す図。
【図9】発話者位置情報−発話者明示マーカ対応情報の
一例を示す図。
【図10】図6中の発話者決定部61の全体的な処理の
流れを説明するためのフローチャート。
【図11】図6の複数搭乗者機器用音声制御装置60
(を実現する車載用コンピュータ)を搭載した乗用車に
おける音声入力部、発話開始ボタン、発話者明示マーカ
の配置例を示す図。
【図12】本発明の第3の実施形態に係る複数搭乗者機
器用音声制御装置の概略構成を示すブロック図。
【図13】前記第1乃至第3の実施形態に係る複数搭乗
者機器用音声制御装置の処理手順(機能、手段)をソフ
トウェアを使って実現する場合に用いられるコンピュー
タのハードウェア構成を示すブロック図。
【符号の説明】
1−1〜1−n…音声入力部(音声入力機器) 2−1〜2−m…制御機器 3−1〜3−n…音声理解装置 10,60,120…複数搭乗者機器用音声制御装置 11…発話者推定部(発話者位置推定手段、音声入力機
器位置情報管理手段) 12,62…音声理解部 13,63,123…制御部 30,110…乗用車(複数搭乗者機器) 61,121…発話者決定部(発話者位置推定手段、発
話開始スイッチ位置情報管理手段、提示手段) 64−1〜64−n…発話開始ボタン(発話開始スイッ
チ) 65−1〜65−n…発話者明示マーカ(提示手段) 122…音声理解知識通知部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/00 320 G10L 3/00 571C 571R 571K

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 複数名が搭乗可能な複数搭乗者機器に搭
    載して用いられ、各搭乗者が複数の音声入力機器のいず
    れかを通して音声による操作を行うことが可能な複数搭
    乗者機器用音声制御装置であって、 前記複数の音声入力機器の音声入力状況から発話者の位
    置を推定し、推定された発話者位置に基づいて当該発話
    者位置の近傍の音声を選択的に取り込むように制御する
    発話者位置推定手段と、 前記発話者位置推定手段の制御により取り込まれた音声
    信号を解析して発話内容を理解する音声理解手段と、 前記音声理解手段の音声理解結果をもとに対応する制御
    を行う制御手段とを具備することを特徴とする複数搭乗
    者機器用音声制御装置。
  2. 【請求項2】 複数名が搭乗可能な複数搭乗者機器に搭
    載して用いられ、各搭乗者が複数の音声入力機器のいず
    れかを通して音声による操作を行うことが可能な複数搭
    乗者機器用音声制御装置であって、 前記複数搭乗者機器内の複数の座席に対応して設けら
    れ、発話開始を通知するための複数の発話開始スイッチ
    と、 前記複数の発話開始スイッチのうちのいずれかから発話
    開始が通知された場合、該当するスイッチから発話者の
    位置を推定し、推定された発話者位置に基づいて当該発
    話者位置の近傍の音声を選択的に取り込むように制御す
    る発話者位置推定手段と、 前記発話者位置推定手段の制御により取り込まれた音声
    信号を解析して発話内容を理解する音声理解手段と、 前記音声理解手段の音声理解結果をもとに対応する制御
    を行う制御手段とを具備することを特徴とする複数搭乗
    者機器用音声制御装置。
  3. 【請求項3】 複数名が搭乗可能な複数搭乗者機器に搭
    載して用いられ、各搭乗者が複数の音声入力機器のいず
    れかを通して音声による操作を行うことが可能な複数搭
    乗者機器用音声制御装置であって、 前記複数の音声入力機器と対応して設けられる複数の音
    声理解機器であって、対応する音声入力機器からの音声
    信号を解析して発話内容を理解する複数の音声理解機器
    から音声理解結果を受け取るように構成されており、前
    記各音声理解機器の位置情報を管理して、音声理解結果
    入力待ち状態で音声理解結果を通知した音声理解機器を
    検出した場合に、その検出結果と前記各音声理解機器の
    位置情報とから発話者の位置を推定する発話者位置推定
    手段と、 前記発話者位置推定手段により推定された発話者位置と
    前記検出された音声理解機器からの音声理解結果をもと
    に対応する制御を行う制御手段とを具備することを特徴
    とする複数搭乗者機器用音声制御装置。
  4. 【請求項4】 前記音声理解手段は、前記音声信号と前
    記発話者位置推定手段により推定された発話者位置とか
    ら、発話者の位置を考慮した音声理解結果を生成するこ
    とを特徴とする請求項1または請求項2記載の複数搭乗
    者機器用音声制御装置。
  5. 【請求項5】 前記制御手段は、前記音声理解手段によ
    る音声理解結果と前記発話者位置推定手段により推定さ
    れた発話者位置とから、発話者の位置を考慮した制御動
    作を決定することを特徴とする請求項1または請求項2
    記載の複数搭乗者機器用音声制御装置。
  6. 【請求項6】 前記複数の音声入力機器の位置情報を管
    理する音声入力機器位置情報管理手段を更に具備し、 前記発話者位置推定手段は、前記各音声入力機器の音声
    入力状況に基づいて発話開始を検出して、その発話開始
    検出時の音声入力の入力レベルが最大となる音声入力機
    器を検出し、その音声入力機器検出結果と前記音声入力
    機器位置情報管理手段により管理されている前記位置情
    報とから発話者の位置を推定することを特徴とする請求
    項1記載の複数搭乗者機器用音声制御装置。
  7. 【請求項7】 前記複数の発話開始スイッチの位置情報
    を管理する発話開始スイッチ位置情報管理手段を更に具
    備し、 前記発話者位置推定手段は、音声入力待ち状態で前記複
    数の発話開始スイッチの状態を監視して最初に発話開始
    を通知する発話開始スイッチを検出し、検出した発話開
    始スイッチと前記発話開始スイッチ位置情報管理手段に
    より管理されている前記位置情報とから発話者の位置を
    推定することを特徴とする請求項2記載の複数搭乗者機
    器用音声制御装置。
  8. 【請求項8】 前記推定された発話者位置の情報をもと
    に、いずれの搭乗者からの入力が受け付けられているか
    を提示する提示手段を更に具備することを特徴とする請
    求項1乃至請求項3のいずれかに記載の複数搭乗者機器
    用音声制御装置。
  9. 【請求項9】 前記複数の音声理解機器に対して音声理
    解のために必要な知識を通知する音声理解知識通知手段
    を更に具備することを特徴とする請求3記載の複数搭乗
    者機器用音声制御装置。
  10. 【請求項10】 複数名が搭乗可能な複数搭乗者機器に
    搭載して用いられ、各搭乗者が複数の音声入力機器のい
    ずれかを通して音声による操作を行うことが可能な複数
    搭乗者機器用音声制御装置に適用される複数搭乗者機器
    用音声制御方法であって、 前記複数の音声入力機器の音声入力状況から発話者の位
    置を推定し、推定された発話者位置に基づいて当該発話
    者位置の近傍の音声を選択的に取り込むように制御する
    発話者位置推定ステップと、 前記発話者位置推定ステップを通じて得られる音声信号
    を解析して発話内容を理解する音声理解ステップと、 前記音声理解結果をもとに対応する制御を行う制御ステ
    ップとを具備することを特徴とする複数搭乗者機器用音
    声制御方法。
  11. 【請求項11】 複数名が搭乗可能な複数搭乗者機器に
    搭載して用いられ、各搭乗者が複数の音声入力機器のい
    ずれかを通して音声による操作を行うことが可能な複数
    搭乗者機器用音声制御装置に適用される複数搭乗者機器
    用音声制御方法であって、 前記複数搭乗者機器内の複数の座席に対応して設けられ
    た複数の発話開始スイッチの状態を音声入力待ち状態に
    おいて監視して、最初に発話開始を通知した発話開始ス
    イッチを検出する発話開始通知スイッチ検出ステップ
    と、 前記検出した発話開始スイッチから発話者の位置を推定
    して、推定された発話者位置に基づいて当該発話者位置
    の近傍の音声を選択的に取り込むように制御する発話者
    位置推定ステップと、 前記発話者位置推定ステップを通じて得られる音声信号
    を解析して発話内容を理解する音声理解ステップと、 前記音声理解結果をもとに対応する制御を行う制御ステ
    ップとを具備することを特徴とする複数搭乗者機器用音
    声制御方法。
  12. 【請求項12】 複数名が搭乗可能な複数搭乗者機器に
    搭載して用いられ、各搭乗者が複数の音声入力機器のい
    ずれかを通して音声による操作を行うことが可能な複数
    搭乗者機器用音声制御装置に適用される複数搭乗者機器
    用音声制御方法であって、 前記複数の音声入力機器と対応して設けられ、対応する
    音声入力機器からの音声信号を解析して発話内容を理解
    する複数の音声理解機器からの音声理解結果通知を音声
    理解結果入力待ち状態で監視して、音声理解結果を通知
    した音声理解機器を検出する音声理解結果通知音声理解
    装置検出ステップと、 前記検出した音声理解装置から発話者の位置を推定する
    発話者位置推定ステップと、 前記推定した発話者位置と前記検出した音声理解装置か
    らの音声理解結果をもとに対応する制御を行う制御ステ
    ップとを具備することを特徴とする複数搭乗者機器用音
    声制御方法。
  13. 【請求項13】 請求項1乃至請求項9のいずれかに記
    載の複数搭乗者機器用音声制御装置を搭載した車両。
JP11185857A 1999-06-30 1999-06-30 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両 Pending JP2001013994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11185857A JP2001013994A (ja) 1999-06-30 1999-06-30 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11185857A JP2001013994A (ja) 1999-06-30 1999-06-30 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両

Publications (1)

Publication Number Publication Date
JP2001013994A true JP2001013994A (ja) 2001-01-19

Family

ID=16178104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11185857A Pending JP2001013994A (ja) 1999-06-30 1999-06-30 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両

Country Status (1)

Country Link
JP (1) JP2001013994A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222291A (ja) * 2000-02-08 2001-08-17 Kenwood Corp 音声認識装置を用いた制御装置
JP2001236093A (ja) * 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
JP2002372991A (ja) * 2001-06-13 2002-12-26 Olympus Optical Co Ltd 音声制御装置
JP2003029777A (ja) * 2001-07-16 2003-01-31 Sharp Corp 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録した記録媒体
JP2003084795A (ja) * 2001-09-10 2003-03-19 Kenwood Corp 車載用音声認識システム
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
JP2003345389A (ja) * 2002-05-22 2003-12-03 Nissan Motor Co Ltd 音声認識装置
JP2004053581A (ja) * 2002-04-17 2004-02-19 Daimler Chrysler Ag マイクロホンによる視線方向の検出
JP2005350018A (ja) * 2004-06-14 2005-12-22 Honda Motor Co Ltd 車載用電子制御装置
KR100728620B1 (ko) 2005-02-07 2007-06-14 한국정보통신대학교 산학협력단 집합적 음성인식 시스템 및 그 시스템에서의 음성인식 방법
JP2009025714A (ja) * 2007-07-23 2009-02-05 Xanavi Informatics Corp 車載装置および音声認識方法
JP2010283506A (ja) * 2009-06-03 2010-12-16 Mitsubishi Electric Corp 車載用音響処理装置
JP2020016890A (ja) * 2015-09-21 2020-01-30 アマゾン テクノロジーズ インコーポレイテッド 応答を提供するための装置選択
US11133027B1 (en) 2017-08-15 2021-09-28 Amazon Technologies, Inc. Context driven device arbitration

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222291A (ja) * 2000-02-08 2001-08-17 Kenwood Corp 音声認識装置を用いた制御装置
JP2001236093A (ja) * 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
JP2002372991A (ja) * 2001-06-13 2002-12-26 Olympus Optical Co Ltd 音声制御装置
JP4675514B2 (ja) * 2001-07-16 2011-04-27 シャープ株式会社 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録したコンピュータにより読取り可能な記録媒体
JP2003029777A (ja) * 2001-07-16 2003-01-31 Sharp Corp 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録した記録媒体
JP2003084795A (ja) * 2001-09-10 2003-03-19 Kenwood Corp 車載用音声認識システム
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
JP2004053581A (ja) * 2002-04-17 2004-02-19 Daimler Chrysler Ag マイクロホンによる視線方向の検出
JP2003345389A (ja) * 2002-05-22 2003-12-03 Nissan Motor Co Ltd 音声認識装置
JP2005350018A (ja) * 2004-06-14 2005-12-22 Honda Motor Co Ltd 車載用電子制御装置
US7428454B2 (en) 2004-06-14 2008-09-23 Honda Motor Co., Ltd. Electronic control system built into vehicle
KR100728620B1 (ko) 2005-02-07 2007-06-14 한국정보통신대학교 산학협력단 집합적 음성인식 시스템 및 그 시스템에서의 음성인식 방법
JP2009025714A (ja) * 2007-07-23 2009-02-05 Xanavi Informatics Corp 車載装置および音声認識方法
JP2010283506A (ja) * 2009-06-03 2010-12-16 Mitsubishi Electric Corp 車載用音響処理装置
JP2020016890A (ja) * 2015-09-21 2020-01-30 アマゾン テクノロジーズ インコーポレイテッド 応答を提供するための装置選択
US11922095B2 (en) 2015-09-21 2024-03-05 Amazon Technologies, Inc. Device selection for providing a response
US11133027B1 (en) 2017-08-15 2021-09-28 Amazon Technologies, Inc. Context driven device arbitration
US11875820B1 (en) 2017-08-15 2024-01-16 Amazon Technologies, Inc. Context driven device arbitration

Similar Documents

Publication Publication Date Title
CN109545219A (zh) 车载语音交互方法、系统、设备及计算机可读存储介质
US8005681B2 (en) Speech dialog control module
US20180033429A1 (en) Extendable vehicle system
JP2001013994A (ja) 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両
JP2004506971A (ja) 音声入出力の制御方法
WO2005036530A1 (en) Speech recognizer using novel multiple microphone configurations
JP2009020423A (ja) 音声認識装置および音声認識方法
JP7186375B2 (ja) 音声処理装置、音声処理方法および音声処理システム
JP2006259164A (ja) 音声認識システム、音声認識方法、及びコンピュータプログラム
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
US20240212689A1 (en) Speaker-specific speech filtering for multiple users
JP2020086571A (ja) 車載装置及び音声認識方法
JP6281202B2 (ja) 応答制御システム、およびセンター
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
JP2018116130A (ja) 車内音声処理装置および車内音声処理方法
US11501775B2 (en) Voice signal control device, voice signal control system, and voice signal control program
JP2020154082A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2003509705A (ja) 音声認識方法および音声認識装置
JP7347244B2 (ja) エージェント装置、エージェントシステム及びプログラム
US20160314787A1 (en) Speech recognition apparatus and computer program product for speech recognition
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144275A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP3764302B2 (ja) 音声認識装置
WO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
JP2020160133A (ja) エージェントシステム、エージェントシステムの制御方法、およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050111