[go: up one dir, main page]

JP2015158573A - 車両用音声応答システム、及び音声応答プログラム - Google Patents

車両用音声応答システム、及び音声応答プログラム Download PDF

Info

Publication number
JP2015158573A
JP2015158573A JP2014032881A JP2014032881A JP2015158573A JP 2015158573 A JP2015158573 A JP 2015158573A JP 2014032881 A JP2014032881 A JP 2014032881A JP 2014032881 A JP2014032881 A JP 2014032881A JP 2015158573 A JP2015158573 A JP 2015158573A
Authority
JP
Japan
Prior art keywords
voice
response
vehicle
mode
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014032881A
Other languages
English (en)
Inventor
真人 大林
Masato Obayashi
真人 大林
顕 吉澤
Akira Yoshizawa
顕 吉澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2014032881A priority Critical patent/JP2015158573A/ja
Publication of JP2015158573A publication Critical patent/JP2015158573A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)

Abstract

【課題】自動車を運転するドライバに対して適切な口調の音声応答を与える音声応答システムを提供する。【解決手段】車両用音声応答システム100は、音声が入力され、入力された音声から入力音声信号を生成する音声入力部11と、音声入力部で生成された音声信号を分析する音声分析部21と、音声分析部で分析された結果に基づき外部機器を操作するための操作コマンドを生成する情報処理部22と、応答音声のモードを決定するモード決定部24と、操作コマンド及び応答音声のモードに基づき応答音声を生成する応答音声生成部23と、応答音声を出力する応答音声出力部30とを備えている。【選択図】図1

Description

本発明は、車両に搭載され、ユーザに応答音声を出力する車両用音声応答システム及び音声応答プログラムに関するものである。
ユーザの音声を認識して、所定の情報処理を行い、ユーザに音声で応答する音声応答システムにおいて、ユーザの親しみやすさを向上させるために、応答音声に間投詞や不要語といった語句を付加することが有効な手法の一つである。
ここで、間投詞とは、自立語で活用がなく、主語にも修飾語にもならず、他の文節とは比較的独立して用いられるものをいい、例えば、話し手の感動を表す「ああ」、「おお」、呼びかけを表す「おい」、「もしもし」、応答を表す「はい」、「いいえ」等がこれに含まれる。また、不要語とは、文書の解析を行う上で不要となる語であり、例えば、「えっとー」「あのー」等の言いよどみがこれに含まれる。
特許文献1には、音声で操作を行う音声操作インタフェースシステムにおいて、システムからユーザに応答音声を出力する場合に、間投詞や不要語を用いることが示されている。これにより、ユーザが親しみを感じるインタフェースを実現できる。また、非特許文献1には、自然言語による問いかけに対して、ユーザは、ユーザと同じ語尾を持つ回答に親しみを持つ傾向があることが述べられている。この知見に基づいて、ユーザの問いかけの特徴量を用いて、親しみのある応答音声を作ることが可能となる。
なお、本発明に関連する先行技術として、以下の先行技術文献がある。
特開平11−237971号公報 特開2001−125584号公報
西原陽子、松村真宏、谷内田正彦著、「QAサイトにおける質問に適した回答の判定」、NLP若手の会 第2回シンポジウム予稿、2007年9月28日
しかしながら、音声応答システムが、自動車を運転するドライバに対して音声で応答をする車両用音声応答システムとして応用される場合において、ドライバが急いでいるときに、応答音声に間投詞や不要語のような冗長性を付加すると、ドライバに苛立ちを発生させる原因となる。一方、即応的な応答音声のみでは、ドライバが親しみやすさを感じることができない。
本発明は、上記の問題に鑑みてなされたものであり、自動車を運転するドライバに対して適切な応答音声を与える音声応答システムを提供することを目的とする。
本発明の一つの態様は、車両用応答音声を出力する車両用音声応答システムであって、ユーザの音声を入力するための音声入力部と、前記音声入力部に入力された音声に基づいて外部機器を操作する情報処理部と、応答音声のモードを決定するモード決定部と、前記音声入力部に入力された音声及び前記モード決定部にて決定された応答音声のモードに基づいて応答音声を生成する応答音声生成部と、前記応答音声を出力する応答音声出力部とを備えた構成を有している。
この構成により、応答音声を生成する応答音声生成部は、入力された音声に基づいて応答音声を生成するが、同時に、この応答音声は、モード決定部が決定したモードに従って生成されるので、る応答音声の単調さを軽減することができる。
前記車両用音声応答システムにおいて、前記モード決定部は、口調モード、方言モード、及び発話速度モードのうちの少なくとも1つのモードを応答音声のモードとして決定してよい。
この構成により、モード決定部は、応答音声のモードとして、応答音声の口調モード(即応的/フレンドリー/丁寧)、方言モード(標準語/関西弁/東北弁)、発話速度モード(ゆっくり/ふつう/速い)のうちの少なくとも1つを応答音声のモードとして決定することができるので、ユーザの要求に適した様々な応答音声のモードを決定することができる。
前記車両用音声応答システムにおいて、前記モード決定部は、前記音声入力部に入力された音声の特徴、車両の走行状態、及び同乗者の有無のうちの少なくとも1つに基づいて応答音声のモードを決定してよい。
この構成により、任意の1つ又は複数の方法に基づき応答音声のモードを決定することができるので、ユーザの要求に適した様々な応答音声のモードを決定することができる。なお、複数の方法を用いて応答音声のモードを決定する場合には、各方法に優先度を設けてもよく、又は重みづけをしてもよい。
前記車両用音声応答システムにおいて、前記ユーザの音声の特徴は、間投詞の割合、不要語の割合、語尾、口調、発話速度及び周波数のうちの少なくとも1つであってよい。
この構成により、モード決定部は、入力音声信号における間投詞の割合、不要語の割合、語尾、口調、発話速度及び周波数といった複数の音声特徴のうちの少なくとも1つに基づき、ユーザ音声の特徴を判定することができるため、より適切にユーザ音声の特徴を把握することができる。
前記車両用音声応答システムにおいて、前記音声入力部に入力された音声を記憶する音声記憶部をさらに備え、前記モード決定部は、ユーザの音声の特徴と前記音声記憶部に記憶された音声との比較結果に基づいて応答音声のモードを決定してよい。
この構成により、モード決定部は、音声記憶部に記憶された過去の入力音声とユーザ音声の差分に基づいて応答音声のモードを決定することができるため、音声を入力するユーザの音声特徴の過去の傾向に即した応答音声のモードを決定することができる。
前記車両用音声応答システムにおいて、前記音声入力部に入力された音声を記憶する音声記憶部をさらに備え、前記モード決定部は、前記音声記憶部に記憶された入力音声信号を統計的に処理した結果に基づいて応答音声のモードを決定してよい。
この構成により、音声記憶部に蓄積された過去の入力音声を統計的に処理した結果に基づいて応答音声のモードを決定するので、音声を入力するユーザの音声特徴の傾向を的確に把握し、ユーザの状況を把握した上で、応答音声のモードを決定することができる。なお、音声記憶部の過去のユーザの入力音声の音声特徴を統計的に処理する方法は、所定期間の平均をとるなど任意の方法を用いてよい。
前記車両用音声応答システムにおいて、前記モード決定部は、応答音声を前記音声入力部に入力された音声に似せるように応答音声のモードを決定してよい。
この構成により、モード決定部は、ユーザによる入力音声に似た応答音声モードを決定するので、ユーザに親しみを持たせることができる応答音声を生成することができる。
前記車両用音声応答システムにおいて、地図情報が記憶されている地図記憶部と、車両の位置情報を取得する位置情報取得部と、車両の情報を取得する車両情報取得部とをさらに備え、前記モード決定部は、前記地図記憶部に記憶された地図情報、前記位置情報取得部にて取得した位置情報、及び前記車両情報取得部にて取得した車両情報に基づいて応答音声のモードを決定してよい。
この構成により、前記モード決定部は、車両の現在位置周辺の地図情報と走行状態等の車両情報との比較等を行うことにより適切な口調、方言、発話速度の応答音声モードを決定することができる。
前記車両用音声応答システムは、車両の位置情報を取得する位置情報取得部と、渋滞情報を取得する渋滞情報取得部とをさらに備えていてよく、前記モード決定部は、前記位置情報取得部にて取得した位置情報及び前記渋滞情報取得部にて取得した渋滞情報に基づいて応答音声のモードを決定してよい。
この構成により、前記モード決定部は、車両の現在位置から、車両が渋滞に巻き込まれていると判定される場合には、ドライバの苛立ちを助長させないために、「即応的」な口調による応答音声モードを決定するというように、適切な応答音声モードの決定をすることができる。
前記車両用音声応答システムは、車両の位置情報を取得する位置情報取得部と、 車両の移動履歴を記憶する移動履歴記憶部とをさらに備えていてよく、前記モード決定部は、前記位置情報取得部にて取得した位置情報及び前記移動履歴記憶部に記憶された移動履歴に基づいて応答音声のモードを決定してよい。
この構成により、前記モード決定部は、車両が現在走行している位置における移動履歴から、車両が現在走行している道路が常用されている道路か否か等を想定して、適切な応答音声モードの決定をすることができる。
前記車両用音声応答システムは、車両の情報を取得する車両情報取得部をさらに備えていてよく、前記モード決定部は、さらに、前記車両情報取得部にて取得した車両情報にも基づいて応答音声のモードを決定してよい。
この構成により、モード決定部は、車両が現在走行している位置における移動履歴と、車両の現在の走行状態とを比較することにより、車両の運転負荷等を考慮して適切な応答音声を生成することができる。
前記車両用音声応答システムは、同乗者を検知する同乗者センサをさらに備えていてよく、前記モード決定部は、前記同乗者センサの検知信号に基づいて応答音声のモードを決定してよい。
この構成により、モード決定部は、応答音声モードを、ドライバ以外の同乗者の有無に応じて切り替えることにより、車両内の状況に配慮した適切な応答音声モードを決定することができる。
前記車両用音声応答システムは、車両の情報を取得する車両情報取得部をさらに備えていてよく、前記応答音声生成部は、前記車両情報取得部にて取得した車両情報に基づいて前記応答音声出力部が応答音声を出力するタイミングを決定してよい。
この構成により、応答音声出力部は、車両情報に応じた適切なタイミングで応答音声を出力することができるので、運転負荷が大きい状態の時に応答音声が出力され、さらに運転負荷を増加させるという事態を避けることができる。なお、適切なタイミングで応答音声が出力されるまでに、間投詞を出力する等してもよい。
前記車両用音声応答システムは、前記音声入力部で生成された音声信号を分析する音声分析部をさらに備えていてよく、前記情報処理部は、前記音声分析部における分析結果に基づいて、外部機器を操作してよい。
この構成により、ユーザの音声によって外部機器を操作でき、応答音声として外部機器の操作に関する音声を出力できる。
本発明のさらに別の態様は、音声応答プログラムであって、この音声応答プロゴラムは、両用応答音声を出力するためのコンピュータに、ユーザの音声を入力する音声入力ステップと、前記音声入力ステップにて入力された音声に基づいて外部機器を操作する情報処理ステップと、応答音声のモードを決定するモード決定ステップと、前記音声入力ステップにて入力された音声及び前記モード決定ステップにて決定された応答音声のモードに基づいて応答音声を生成する応答音声生成ステップと、前記応答音声を出力する応答音声出力ステップとを実行させる。
この構成によっても、応答音声を生成する応答音声生成ステップが入力された音声に基づいて応答音声を生成するが、この応答音声は、モード決定ステップにて決定されたモードに従って生成されるので、応答音声の単調さを軽減することができる。
本発明によれば、応答音声のモードを切り替えることができるので、応答音声の単調さを軽減できる。
本発明の実施の形態の音声応答システムを含む音声操作システムの構成を示すブロック図 本発明の実施の形態の車両用音声応答システムの応答音声出力の一例を示すフローチャート
以下、本発明の実施の形態の音声応答システムについて、図面を参照しながら説明する。なお、以下に説明する実施の形態は、本発明を実施する場合の一例を示すものであって、本発明を以下に説明する具体的構成に限定するものではない。本発明の実施にあたっては、実施の形態に応じた具体的構成が適宜採用されてよい。
図1は、本発明の実施の形態の音声応答システムを含む音声操作システムの構成を示すブロック図である。この音声操作システムは、車両に搭載されて、車両の乗員が車両に搭載された機器を音声で操作するためのシステムである。本実施の形態の音声操作システムは、特に、車両の乗員であるドライバが音声操作を行うことを想定している。
音声操作システムは、操作の対象となる外部機器200と、ユーザの音声を入力して外部機器200に操作コマンドを出力するとともにユーザに対する応答音声を出力する音声応答システム100とからなる。音声応答システム100は、音声入力部11、音声記憶部12、車両情報取得部13、渋滞情報取得部14、位置情報取得部15、移動履歴記憶部16、地図記憶部17、同乗者センサ18、制御部20、及び音声出力部30を備えている。制御部20は、音声分析部21、情報処理部22、応答音声生成部23、及びモード決定部24を備えている。
音声入力部11は、マイクであり、ドライバの発話する音声を感知できるように車両内に設置されている。音声入力部11は、入力された音声から音声信号を生成して、音声信号を音声記憶部12及び音声識別部21に出力する。音声記憶部12は、音声入力部11にて生成された音声信号及び音声分析部21で得られた解析結果を記憶する記憶媒体である。
車両情報取得部13は、CAN(Control Area Network)によって車両の各種の機器の制御情報を取得する。車両情報取得部13は、例えば、アクセルの開度、ステアリングの舵角、走行速度等の車両情報を取得する。車両情報取得部13は、取得した車両情報を車モード決定部24に出力する。
渋滞情報取得部14は、VICS(登録商標)(Vehicle Information and Communication System)によって渋滞情報を取得する。渋滞情報取得部14は、取得した渋滞情報をモード決定部24に出力する。位置情報取得部15は、GPS(Global Positioning System)によって車両の現在位置の位置情報を取得する。位置情報取得部15は、取得した位置情報を移動履歴記憶部16及びモード決定部24に出力する。
移動履歴記憶部16は、位置情報取得部15から入力された位置情報によって車両の移動履歴を記憶する。地図記憶部17には、ナビゲーション装置で用いられる地図情報が記憶されている。この地図情報には、道路及び交差点に相当するリンク及びノードの情報、地図上の各種の建物等の情報、制限速度や一方通行等の交通規則情報が含まれる。
同乗者センサ18は、車両の運転席以外の座席に設けられたセンサであり、ドライバ以外の乗員があることを検知する。同乗者センサ18は、モード決定部24に検知信号を出力する。
制御部20は、マイコンが所定の音声応答プログラムを実行することにより実現される。その機能には、音声分析、情報処理、応答音声の生成、及びモードの決定があり、図1では、それぞれ、音声分析部21、情報処理部22、応答音声生成部23、及びモード決定部24として示されている。
音声分析部21は、音声入力部11から入力された音声信号(入力音声信号)について、音声分析を行って、入力音声信号を解読する。音声分析部21は、解読結果を音声記憶部12、情報処理部22、及びモード決定部24に出力する。例えば、入力音声が「エアコンの温度を上げる」である場合は、音声分析部21は、エアコンの温度を上げるという解読結果を出力する。
情報処理部22は、音声分析部21から入力した解読結果に従って、外部機器200を操作するための操作コマンドを生成して、外部機器200及び応答音声生成部23に出力する。例えば、音声分析部21からエアコンの温度を上げるという解読結果が入力されたときは、情報処理部22は、外部機器200であるエアコンに対して、エアコンの設定温度を所定のステップ幅だけ上げるための操作コマンドを生成して出力する。
モード決定部24は、各種の情報に基づいて、応答音声のモードを決定する。応答音声のモードとしては、口調モード(即応的/フレンドリー/丁寧)、方言モード(標準語/関西弁/東北弁)、発話速度モード(ゆっくり/ふつう/速い)がある。モード決定部24は、これらの各モードを決定して、応答音声生成部23に出力する。モードの決定方法については、後述する。
応答音声生成部23は、情報処理部22から操作コマンドを入力して、モード決定部24から決定された各モードを入力して、操作コマンド及びモードに基づいて、応答音声を生成して、応答音声出力部30に出力する。応答音声の内容は、操作コマンドに基づいて決定され、応答音声の口調、方言、発話速度は、各モードに従う。
応答音声生成部23は、口調モードに応じて応答音声の口調を変化させる。具体的には、応答音声生成部23は、口調モードが「即応的」であるときは、間投詞や不要語を少なくし、あるいはなくして、シンプルな文章ないしはフレーズで、断定の語尾を用い、端的な応答をする応答音声を生成する。応答音声生成部23は、口調モードが「フレンドリー」である場合は、間投詞や不要語を多くして親しみやすい応答音声を生成するとともに、応答音声に挨拶等の付加的な応答も含めることで、音声応答の単調さを低減し、使用者に親しみを持たせる。応答音声生成部23は、口調モードが「丁寧」である場合は、「です/ます調」を用いるなど丁寧な言葉遣いの応答音声を生成する。また、応答音声生成部23は、方言モードに応じて応答音声の訛りを変化させ、発話速度モードに応じて応答音声の発話速度を変化させる。
例えば、情報処理部22に与えられた操作コマンドがエアコンの設定温度を2度上げるコマンドである場合において、口調モードが「フレンドリー」であり、方言モードが「関西弁」であり、発話速度モードが「ふつう」であるときは、応答音声生成部23は、「エアコン、2度だけ上げといたで〜。暑なったらまた言いや〜。」という関西弁イントネーションの標準的なスピードの応答音声を生成する。同じく操作コマンドがエアコンの設定温度を2度上げるコマンドである場合において、口調モードが「丁寧」であり、方言モードが「標準語」であり、発話速度モードが「速い」であるときは、応答音声生成部23は、例えば、「設定温度を2度上げました」という標準語のイントネーションの高速の応答音声を生成する。
応答音声出力部30は、応答音声生成部23で生成された音声を出力するスピーカである。
外部機器200は、車両に搭載される機器であり、車両用音声応答システム100によって操作される対象である。外部機器200は、例えばエアコン、カーナビゲーションシステム、AV機器等の快適な運転・乗車のための機器であってよく、ヘッドライト、サイドミラー、ウインカー、アクセル、ブレーキ、ステアリング等の車両の運転に関わる機器であってもよい。
次に、モード決定部24におけるモードの決定方法について説明する。
(1)ユーザの音声の特徴に基づいてモードを決定する方法
モード決定部24は、音声分析部21から入力される入力音声信号の解読結果、及び音声入力部11から入力される入力音声信号に基づいて、入力音声信号の音声特徴を判定し、音声特徴に基づいてモードを決定する。モード決定部24は、音声分析部21からの入力音声信号の解読結果から間投詞や不要語、語尾、イントネーション、発話速度の音声特徴を判定し、音声入力部11からの入力音声信号から、周波数の音声特徴を判定する。以下に具体例を示す。
(例1−1)
モード決定部24は、入力音声信号における間投詞や不要語の割合が所定の閾値より多い場合には、口調モードを「フレンドリー」とし、入力音声信号における間投詞や不要語の割合が所定の閾値より少ない場合には、口調モードを「即応的」とし、入力音声信号における語尾が「です/ます調」である場合は、口調モードを「丁寧」とする。また、モード決定部24は、入力音声信号の発話速度又は周波数が所定の高側閾値よりも高い場合は、発話速度モードを「速い」とし、入力音声信号の発話速度又は周波数が所定の低側閾値よりも低い場合は、発話速度モードを「ゆっくり」とし、入力音声信号の発話速度又は周波数が高側閾値と低側閾値の中間である場合は、発話速度モードを「ふつう」とする。さらに、モード決定部24は、入力音声信号における語尾及びイントネーションに基づいて、方言モードを決定する。このように、モード決定部24は、口調モードや発話速度モードや方言モードを入力音声に似せるようにモードを決定する。
(例1−2)
モード決定部24は、例1−1に加えて、音声記憶部12からユーザの過去の音声特徴を読み出して、入力音声信号の音声特徴と比較し、その比較結果に基づいて、モードを決定する。具体的には、モード決定部24は、所定の音声特徴について、音声記憶部12に記憶された過去のものと、音声入力部11又は音声分析部21から入力されたものとの差分が所定の閾値より大きいか否かに応じてモードを決定する。
例えば、入力音声信号の発話速度が、音声記憶部12に記憶された過去の発話速度(一定量の音声信号の平均)よりも早く、その差分が所定の閾値を超えている場合には、モード決定部24は、発話速度モードを「速い」とする。
(例1−3)
例1−1では、入力音声信号の口調、方言、発話速度に似せるように各モードを決定したが、本例では、モード決定部24は、音声記憶部12を参照して、ユーザの過去の入力音声の音声特徴を統計的に処理して(例えば一定期間の平均をとって)、それに基づいて、モードを決定する。
即ち、モード決定部24は、過去の入力音声信号における間投詞や不要語の割合が所定の閾値より多い場合には、口調モードを「フレンドリー」とし、過去の入力音声信号における間投詞や不要語の割合が所定の閾値より少ない場合には、口調モードを「即応的」とし、過去の入力音声信号における語尾が「です/ます調」である場合は、口調モードを「丁寧」とする。また、モード決定部24は、過去の入力音声信号の発話速度又は周波数が所定の高側閾値よりも高い場合は、発話速度モードを「速い」とし、過去の入力音声信号の発話速度又は周波数が所定の低側閾値よりも低い場合は、発話速度モードを「ゆっくり」とし、過去の入力音声信号の発話速度又は周波数が高側閾値と低側閾値の中間である場合は、発話速度モードを「ふつう」とする。さらに、モード決定部24は、過去の入力音声信号における語尾及びイントネーションに基づいて、方言モードを決定する。このように、モード決定部24は、口調モードや発話速度モードや方言モードをユーザの過去の入力音声に似せるようにモードを決定する。
この方法によれば、例えば、ある同乗者が車両両音声応答システム100を利用して音声で外部機器200を操作することが多い場合には、音声記憶部12はその同乗者の入力音声信号及びその解析結果を多く記憶することになる。そうすると、ドライバが単独で乗車してこの車両音声応答システム100を利用する際には、モード決定部24は、過去に蓄積された同乗者の口調等に似るようにモードを決定するので、単独で乗車しているドライバは頻繁に同乗する同乗者と同様の口調、方言、発話速度の応答音声を聞くことができ、ドライバは、応答音声に対して親しみを感じることができる。
(2)車両の走行状態に基づいてモードを決定する方法
モード決定部24は、車両情報取得部13から入力される車両情報、渋滞情報取得部14から入力される渋滞情報、位置情報取得部15から入力される位置情報、移動履歴記憶部16から読み出した移動履歴、及び地図記憶部17から読み出した地図情報に基づいて、モードを決定する。
(例2−1)
モード決定部24は、位置情報取得部15から入力された車両の現在位置及び地図情報記憶部17から読み出した地図情報に基づいて、車両が走行している道路の制限速度を認識し、車両情報取得部13から入力される車速と制限速度とを比較して、その比較結果に基づいて、モードを決定する。具体的には、モード決定部24は、車速と制限速度との差分が所定の閾値より大きいか否かに応じてモードを決定する。
例えば、車速が制限速度より速く、その差分が所定の閾値を超えている場合には、ドライバは焦っており、速い応答が要求されるので、発話速度モードを「速い」とする。一方、車速が制限速度より遅く、その差分が所定の閾値を超えている場合には、道路が混雑してドライバが苛立ちを感じおり、早い応答が要求されるので、口調モードを「即応的」とする。
(例2−2)
モード決定部24は、位置情報取得部15から入力された車両の現在位置、及び渋滞情報取得部14から入力された渋滞情報に基づいて、車両が渋滞に巻き込まれているか否かを判定し、その判定結果に基づいて、モードを決定する。具体的には、車両が渋滞に巻き込まれている場合には、ドライバが苛立ちを感じているので、モード決定部24は、口調モードを「即応的」とする。
(例2−3)
モード決定部24は、位置情報取得部15から入力された車両の現在位置、及び移動履歴記憶部16から読み出した移動履歴に基づいて、現在走行している道路が、過去に走行した回数の多い道路(常用道路)であるか否かを判定し、判定結果に基づいて、モードを決定する。具体的には、モード決定部24は、現在走行している道路が常用道路である場合は、例えば通勤路であることを想定して、口調モードを「丁寧」とし、現在走行している常用道路でない、例えば週末のドライブであることを想定して、口調モードを「フレンドリー」として、より非日常的な効果を出す。
(例2−4)
さらに、現在走行している道路が常用道路である場合には、モード決定部24は、移動履歴記憶部16から読み出した移動履歴に基づいて過去の平均速度を求め、車両情報取得部13から取得した車速と比較し、その比較結果に基づいて、モードを決定する。具体的には、モード決定部24は、過去の平均速度と現在の車速との差分が所定の閾値より大きいか否かに応じてモードを決定する。
例えば、現在の車速が過去の平均速度より速く、その差分が所定の閾値を超えている場合には、ドライバは忙しいと判断して、モード決定部24は、口調モードを「即応的」とする。
(3)同乗者の有無に基づいてモードを決定する方法
モード決定部24は、同乗者センサ18から入力される検知信号に基づいて、モードを決定する。具体的には、モード決定部24は、休日に同乗者がある場合には、家族と一緒に乗車していると想定して、口調モードを「フレンドリー」とし、平日に同乗者がある場合には、仕事関係の人間を乗せていることを想定して、口調モードを「丁寧」とすることで、同乗者に奇異な印象をもたれることを回避する。
モード決定部24は、以上の方法(1)〜(3)の例のいずれか、又はそれらを適宜に組み合わせて、口調モード、方言モード、発話速度モードを決定する。上記の方法を組み合わせる場合には、各方法に優先度を設けてもよいし、又は重みづけをしてよい。以下、モード決定部24によるモード決定の具体例を説明する。
図2は、車両用音声応答システムの応答音声出力の一例を示すフローチャートである。車両用音声応答システム100は、ドライバからの音声入力があったか否かを判断する(ステップS21)。音声入力がない場合は(ステップS21にてNO)、そのまま音声入力を待つ。音声入力があると(ステップS21にてYES)、入力音声信号が音声分析部21に入力され、音声分析部21は音声分析を行う(ステップS22)。
情報処理部22は、音声分析の結果に従って、情報処理を行うことで、外部機器200を操作するための操作コマンドを生成して外部機器200に出力する(ステップS23)。これによって、外部機器200が操作される。応答音声生成部23は、情報処理部22で生成された操作コマンドに基づいて、応答音声を生成する(ステップS24)。口調モードは「丁寧」、方言モードは「標準語」、発話速度モードは「速い」として、応答音声を生成する。
次に、現在の車速が、現在走行している道路の制限速度よりも所定の閾値以上大きいか否かを判断する(ステップS25)。車速が制限速度に所定の閾値を加えた値よりも大きい場合には(ステップS25にてYES)、生成されている応答音声を出力する(ステップS26)。この場合は、例2−1に従って、車速が制限速度より所定の閾値以上に速い場合として発話速度モードとして「速い」を選択したことに相当する。
車速が制限速度に所定の閾値を加えた値よりも小さい場合には(ステップS25にてNO)、モード決定部24は、モードを変更するために、音声記憶部12からドライバの過去の音声を読み出して(ステップS27)、ドライバの過去の音声の音声特徴を分析し、例1−3に従って、ドライバの過去の入力音声の音声特徴の統計値に基づいて、モードを決定する(ステップS28)。そして、応答音声生成部23は、モード決定部24にて変更されたモードに従って、応答音声を修正し(ステップS29)、応答メッセージを出力する(ステップS26)。
以上のように、本発明の実施の形態の車両用音声応答システム100によれば、応答音声のモードを切り替えることができるので、音声特徴、走行状態、同乗者の有無等の種々の要因に応じて適切な口調、方言、発話速度で応答音声を出力できる。
なお、上記の実施の形態では、音声記憶部12には、音声入力部11で入力された音声、及びそれを音声分析した結果を記憶することで、ユーザの過去の音声を蓄積していたが、ユーザの過去の音声は、音声入力が行われる他の機器から取得してもよい。例えば、携帯端末に音声入力の機能がある場合には、その携帯端末において、入力されるユーザの音声を記憶しておき、音声記憶部12は、この携帯端末から過去に入力されて蓄積されたユーザの音声を取得してもよい。
また、車両情報取得部13にて取得された車両情報は、応答音声生成部23にも出力されてよい。この場合、応答音声生成部23は、車両情報取得部13から入力された車両情報に基づいて、生成した音声応答を応答音声出力部30に出力して、応答音声がスピーカ等から出力されるタイミングを決定することができる。
例えば、応答音声を出力しようとするときに、ステアリングの舵角の変化量が一定以上であり、かつ、車速が一定以上である場合には、運転負荷が一時的に大きい状態であるので、応答音声生成部23は、そのような状態が解消して落ち着いた状態となるのを待って、生成した応答音声を応答音声出力部30に出力する。この場合に、応答音声生成部23は、応答音声の出力を一時待機している間に、所定の間投詞(例えば、「えーっと」)の応答音声を先に応答音声出力部30から出力するようにしてよい。これにより、音声の入力による操作に対して何の応答も得られないことを、ユーザがシステムの故障等に起因する遅延であると誤解すること避けることができる。
本発明は、応答音声のモードを切り替えることができるので、音声特徴、走行状態、同乗者の有無等の種々の要因に応じて適切な口調、方言、発話速度で応答音声を出力できるという効果を有し、車両に搭載され、ユーザに応答音声を出力する音声応答システム等として有用である。
100 車両用音声応答システム
11 音声入力部
12 音声記憶部
13 車両情報取得部
14 渋滞情報取得部
15 位置情報取得部
16 移動履歴記憶部
17 地図記憶部
18 同乗者センサ
20 制御部
21 音声分析部
22 情報処理部
23 応答音声生成部
24 モード決定部
30 応答音声出力部
200 外部機器

Claims (15)

  1. 車両用応答音声を出力する車両用音声応答システムであって、
    ユーザの音声を入力するための音声入力部と、
    前記音声入力部に入力された音声に基づいて外部機器を操作する情報処理部と、
    応答音声のモードを決定するモード決定部と、
    前記音声入力部に入力された音声及び前記モード決定部にて決定された応答音声のモードに基づいて応答音声を生成する応答音声生成部と、
    前記応答音声を出力する応答音声出力部と、
    を備える車両用音声応答システム。
  2. 前記モード決定部は、口調モード、方言モード、及び発話速度モードのうちの少なくとも1つのモードを応答音声のモードとして決定することを特徴とする請求項1に記載の車両用音声応答システム。
  3. 前記モード決定部は、前記音声入力部に入力された音声の特徴、車両の走行状態、及び同乗者の有無のうちの少なくとも1つに基づいて応答音声のモードを決定することを特徴とする請求項1または2に記載の車両用音声応答システム。
  4. 前記ユーザの音声の特徴は、間投詞の割合、不要語の割合、語尾、口調、発話速度、及び周波数のうちの少なくとも1つであることを特徴とする請求項3に記載の車両用音声応答システム。
  5. 前記音声入力部に入力された音声を記憶する音声記憶部をさらに備え、
    前記モード決定部は、ユーザの音声の特徴と前記音声記憶部に記憶された音声との比較結果に基づいて応答音声のモードを決定することを特徴とする請求項1ないし4のいずれか一項に記載の車両用音声応答システム。
  6. 前記音声入力部に入力された音声を記憶する音声記憶部をさらに備え、
    前記モード決定部は、前記音声記憶部に記憶された入力音声信号を統計的に処理した結果に基づいて応答音声のモードを決定することを特徴とする請求項1ないし4のいずれか一項に記載の車両用音声応答システム。
  7. 前記モード決定部は、応答音声を前記音声入力部に入力された音声に似せるように応答音声のモードを決定することを特徴とする請求項1ないし6のいずれか一項に記載の車両用音声応答システム。
  8. 地図情報が記憶されている地図記憶部と、
    車両の位置情報を取得する位置情報取得部と、
    車両の情報を取得する車両情報取得部とをさらに備え、
    前記モード決定部は、前記地図記憶部に記憶された地図情報、前記位置情報取得部にて取得した位置情報、及び前記車両情報取得部にて取得した車両情報に基づいて応答音声のモードを決定することを特徴とする請求項1ないし7のいずれか一項に記載の車両用音声応答システム。
  9. 車両の位置情報を取得する位置情報取得部と、
    渋滞情報を取得する渋滞情報取得部と、をさらに備え、
    前記モード決定部は、前記位置情報取得部にて取得した位置情報及び前記渋滞情報取得部にて取得した渋滞情報に基づいて応答音声のモードを決定することを特徴とする請求項1ないし7のいずれか一項に記載の車両用音声応答システム。
  10. 車両の位置情報を取得する位置情報取得部と、
    車両の移動履歴を記憶する移動履歴記憶部とをさらに備え、
    前記モード決定部は、前記位置情報取得部にて取得した位置情報及び前記移動履歴記憶部に記憶された移動履歴に基づいて応答音声のモードを決定することを特徴とする請求項1ないし7のいずれか一項に記載の車両用音声応答システム。
  11. 車両の情報を取得する車両情報取得部をさらに備え、
    前記モード決定部は、さらに、前記車両情報取得部にて取得した車両情報にも基づいて応答音声のモードを決定することを特徴とする請求項10に記載の車両用音声応答システム。
  12. 同乗者を検知する同乗者センサをさらに備え、
    前記モード決定部は、前記同乗者センサの検知信号に基づいて応答音声のモードを決定することを特徴とする請求項1ないし11のいずれか一項に記載の車両用音声応答システム。
  13. 車両の情報を取得する車両情報取得部をさらに備え、
    前記応答音声生成部は、前記車両情報取得部にて取得した車両情報に基づいて前記応答音声出力部が応答音声を出力するタイミングを決定することを特徴とする請求項1ないし12のいずれか一項に記載の車両用音声応答システム。
  14. 前記音声入力部で生成された音声信号を分析する音声分析部をさらに備え、
    前記情報処理部は、前記音声分析部における分析結果に基づいて、外部機器を操作することを特徴とする請求項1ないし13のいずれか一項に記載の車両音声応答システム。
  15. 車両用応答音声を出力するためのコンピュータに、
    ユーザの音声を入力する音声入力ステップと、
    前記音声入力ステップにて入力された音声に基づいて外部機器を操作する情報処理ステップと、
    応答音声のモードを決定するモード決定ステップと、
    前記音声入力ステップにて入力された音声及び前記モード決定ステップにて決定された応答音声のモードに基づいて応答音声を生成する応答音声生成ステップと、
    前記応答音声を出力する応答音声出力ステップと、
    を実行させることを特徴とする音声応答プログラム。
JP2014032881A 2014-02-24 2014-02-24 車両用音声応答システム、及び音声応答プログラム Pending JP2015158573A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014032881A JP2015158573A (ja) 2014-02-24 2014-02-24 車両用音声応答システム、及び音声応答プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014032881A JP2015158573A (ja) 2014-02-24 2014-02-24 車両用音声応答システム、及び音声応答プログラム

Publications (1)

Publication Number Publication Date
JP2015158573A true JP2015158573A (ja) 2015-09-03

Family

ID=54182605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014032881A Pending JP2015158573A (ja) 2014-02-24 2014-02-24 車両用音声応答システム、及び音声応答プログラム

Country Status (1)

Country Link
JP (1) JP2015158573A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016176970A (ja) * 2015-03-18 2016-10-06 株式会社デンソー 音声通知装置および音声通知方法
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
KR20180116986A (ko) * 2017-04-18 2018-10-26 엘지전자 주식회사 차량 내 음성 제어 방법
US10403264B2 (en) 2015-09-25 2019-09-03 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for outputting voice information based on a geographical location having a maximum number of historical records
JP2020080110A (ja) * 2018-11-14 2020-05-28 本田技研工業株式会社 制御装置、エージェント装置及びプログラム
JP2021097764A (ja) * 2019-12-20 2021-07-01 株式会社東海理化電機製作所 制御装置およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0696389A (ja) * 1992-09-14 1994-04-08 Mazda Motor Corp 自動車の音声による経路誘導装置
JP2001272991A (ja) * 2000-03-24 2001-10-05 Sanyo Electric Co Ltd 音声対話方法及び音声対話装置
JP2001312290A (ja) * 2000-04-28 2001-11-09 Mitsubishi Electric Corp 音声合成装置
JP2004037721A (ja) * 2002-07-02 2004-02-05 Pioneer Electronic Corp 音声応答システム、音声応答プログラム及びそのための記憶媒体
JP2006350567A (ja) * 2005-06-14 2006-12-28 Toyota Motor Corp 対話システム
JP2007272773A (ja) * 2006-03-31 2007-10-18 Xing Inc 対話型インターフェイス制御システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0696389A (ja) * 1992-09-14 1994-04-08 Mazda Motor Corp 自動車の音声による経路誘導装置
JP2001272991A (ja) * 2000-03-24 2001-10-05 Sanyo Electric Co Ltd 音声対話方法及び音声対話装置
JP2001312290A (ja) * 2000-04-28 2001-11-09 Mitsubishi Electric Corp 音声合成装置
JP2004037721A (ja) * 2002-07-02 2004-02-05 Pioneer Electronic Corp 音声応答システム、音声応答プログラム及びそのための記憶媒体
JP2006350567A (ja) * 2005-06-14 2006-12-28 Toyota Motor Corp 対話システム
JP2007272773A (ja) * 2006-03-31 2007-10-18 Xing Inc 対話型インターフェイス制御システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016176970A (ja) * 2015-03-18 2016-10-06 株式会社デンソー 音声通知装置および音声通知方法
US10403264B2 (en) 2015-09-25 2019-09-03 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for outputting voice information based on a geographical location having a maximum number of historical records
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
KR20180116986A (ko) * 2017-04-18 2018-10-26 엘지전자 주식회사 차량 내 음성 제어 방법
KR102350306B1 (ko) 2017-04-18 2022-01-13 엘지전자 주식회사 차량 내 음성 제어 방법
JP2020080110A (ja) * 2018-11-14 2020-05-28 本田技研工業株式会社 制御装置、エージェント装置及びプログラム
JP7053432B2 (ja) 2018-11-14 2022-04-12 本田技研工業株式会社 制御装置、エージェント装置及びプログラム
US11468888B2 (en) 2018-11-14 2022-10-11 Honda Motor Co., Ltd. Control apparatus, control method agent apparatus, and computer readable storage medium
JP2021097764A (ja) * 2019-12-20 2021-07-01 株式会社東海理化電機製作所 制御装置およびプログラム

Similar Documents

Publication Publication Date Title
JP2015158573A (ja) 車両用音声応答システム、及び音声応答プログラム
JP4984708B2 (ja) 音声対話機能を有する情報処理装置
US20080235017A1 (en) Voice interaction device, voice interaction method, and voice interaction program
JP6466385B2 (ja) サービス提供装置、サービス提供方法およびサービス提供プログラム
JP2006267328A (ja) 音声案内装置および音声案内方法
JP6150077B2 (ja) 車両用音声対話装置
CN105895095A (zh) 自适应交互语音系统
JP2020144663A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2004506971A (ja) 音声入出力の制御方法
US11404075B1 (en) Vehicle voice user interface
JP7340943B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
KR20230126571A (ko) 자연어 처리 장치 및 자연어 처리 방법
US11273778B1 (en) Vehicle voice user interface
JP7002823B2 (ja) 案内音声出力制御システムおよび案内音声出力制御方法
JP2006308848A (ja) 車両機器制御装置
US11542744B2 (en) Agent device, agent device control method, and storage medium
JP2002528751A (ja) 情報および/またはメッセージを音声によって出力する方法および装置
JP2019053785A (ja) サービス提供装置
JP2019101805A (ja) 対話システム
CN118197311A (zh) 车内传话方法、电子设备、车内传话系统及车辆
JP2020154013A (ja) 車両用注意喚起装置、車両用注意喚起方法及びプログラム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
KR20230142243A (ko) 대화 처리 방법, 사용자 단말 및 대화 시스템
JP2018063338A (ja) 音声対話装置、音声対話方法および音声対話プログラム
US20250029610A1 (en) Method for operating a speech dialogue system

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180220