JPH10124085A - 音声認識装置及び認識方法 - Google Patents
音声認識装置及び認識方法Info
- Publication number
- JPH10124085A JPH10124085A JP8295897A JP29589796A JPH10124085A JP H10124085 A JPH10124085 A JP H10124085A JP 8295897 A JP8295897 A JP 8295897A JP 29589796 A JP29589796 A JP 29589796A JP H10124085 A JPH10124085 A JP H10124085A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- item
- recognition
- voice
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 1
Abstract
(57)【要約】
【課題】誤認識の場合、検索対象の辞書項目が入れ替え
られた後も、即座に前の辞書項目に対する単語を再度発
声して音声認識しうる音声認識装置を提供する。 【解決手段】音声を入力する音声入力手段11と、入力
された音声を認識する音声認識手段12と、音声認識に
用いられる辞書を格納する辞書格納手段15と、辞書選
択手段で選択された辞書項目を保持する辞書保持手段1
6と、複数の辞書項目を格納する辞書項目格納手段17
と、制御手段の命令により音声認識に必要な辞書項目を
辞書格納手段から選択し該選択された辞書項目を辞書保
持手段に保持させると共にその時まで辞書保持手段に保
持されていた辞書項目と該選択した辞書項目との両辞書
項目を音声認識手段へ供給する辞書選択手段14とから
なり、保持されていた前の辞書項目と現に選択された辞
書項目の両辞書項目を検索対象とすることを特徴とす
る。
られた後も、即座に前の辞書項目に対する単語を再度発
声して音声認識しうる音声認識装置を提供する。 【解決手段】音声を入力する音声入力手段11と、入力
された音声を認識する音声認識手段12と、音声認識に
用いられる辞書を格納する辞書格納手段15と、辞書選
択手段で選択された辞書項目を保持する辞書保持手段1
6と、複数の辞書項目を格納する辞書項目格納手段17
と、制御手段の命令により音声認識に必要な辞書項目を
辞書格納手段から選択し該選択された辞書項目を辞書保
持手段に保持させると共にその時まで辞書保持手段に保
持されていた辞書項目と該選択した辞書項目との両辞書
項目を音声認識手段へ供給する辞書選択手段14とから
なり、保持されていた前の辞書項目と現に選択された辞
書項目の両辞書項目を検索対象とすることを特徴とす
る。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識の際に用
いる辞書の構成及び操作により誤認識時において言い直
しを簡単に行い得るようにした音声認識装置及び認識方
法に関する。
いる辞書の構成及び操作により誤認識時において言い直
しを簡単に行い得るようにした音声認識装置及び認識方
法に関する。
【0002】
【従来の技術】従来、音声認識の認識結果によって音声
認識に用いる辞書を入れ替える場合の音声認識装置の辞
書の構成方法として、音声認識の対象となる単語の他
に、例えば、「戻る」等の音声認識操作上の単語、すな
わち、使用する辞書を既に入れ替える前に用いていた辞
書に戻すための単語を加えて構成するようにしていた。
このような構成による辞書を用いて音声認識を行う従来
の音声認識装置としては、図5及び図6に示すようなも
のがあった。図5は従来の音声認識装置の構成を示すブ
ロック図、図6は図5に示す音声認識装置における音声
認識動作及び対話の流れを示すフローチャートを示す図
である。
認識に用いる辞書を入れ替える場合の音声認識装置の辞
書の構成方法として、音声認識の対象となる単語の他
に、例えば、「戻る」等の音声認識操作上の単語、すな
わち、使用する辞書を既に入れ替える前に用いていた辞
書に戻すための単語を加えて構成するようにしていた。
このような構成による辞書を用いて音声認識を行う従来
の音声認識装置としては、図5及び図6に示すようなも
のがあった。図5は従来の音声認識装置の構成を示すブ
ロック図、図6は図5に示す音声認識装置における音声
認識動作及び対話の流れを示すフローチャートを示す図
である。
【0003】まず、図5を参照して、上記従来の音声認
識装置の構成を説明する。図5において、51は音声を
入力して音声信号(電気信号)に変換する、例えばマイ
クロホン等のような媒体変換手段を含む音声入力部、5
2は音声入力部51から出力した音声信号を認識する音
声認識部、53は音声認識部52における音声信号の認
識処理の結果を出力する、例えば認識結果をディスプレ
イする表示装置とかスピーカ等のような認識結果出力
部、54は外部、例えば音声認識装置全体を制御するC
PU、パソコンまたはコンピュータ等のような制御手段
からの命令により音声認識に用いる辞書を選択する辞書
選択部、55は音声認識に用いる辞書を格納する辞書格
納部、56は音声認識に用いる辞書項目が複数格納され
ている辞書項目格納部である。
識装置の構成を説明する。図5において、51は音声を
入力して音声信号(電気信号)に変換する、例えばマイ
クロホン等のような媒体変換手段を含む音声入力部、5
2は音声入力部51から出力した音声信号を認識する音
声認識部、53は音声認識部52における音声信号の認
識処理の結果を出力する、例えば認識結果をディスプレ
イする表示装置とかスピーカ等のような認識結果出力
部、54は外部、例えば音声認識装置全体を制御するC
PU、パソコンまたはコンピュータ等のような制御手段
からの命令により音声認識に用いる辞書を選択する辞書
選択部、55は音声認識に用いる辞書を格納する辞書格
納部、56は音声認識に用いる辞書項目が複数格納され
ている辞書項目格納部である。
【0004】次に、図5及び図6を参照して、上記従来
の音声認識装置の動作を説明する。音声認識装置で検索
する検索対象としては、例えば、地名、住所、氏名、電
話番号及びその他多数存在する。以下、音声認識による
検索動作の一例として、地名検索の場合について説明す
る。
の音声認識装置の動作を説明する。音声認識装置で検索
する検索対象としては、例えば、地名、住所、氏名、電
話番号及びその他多数存在する。以下、音声認識による
検索動作の一例として、地名検索の場合について説明す
る。
【0005】具体的には、ユーザが「都道府県名」→
「市町村名」→「町字名」と階層別に発声していき、地
名を検索するものであり、例としては、カーナビゲーシ
ョンシステムの音声認識などがある。また、辞書も階層
別に「都道府県名」の辞書、「市町村名」の辞書、「町
字名」等の辞書が辞書項目として用意されており、それ
ぞれの辞書項目は辞書項目格納部56に格納されてい
る。
「市町村名」→「町字名」と階層別に発声していき、地
名を検索するものであり、例としては、カーナビゲーシ
ョンシステムの音声認識などがある。また、辞書も階層
別に「都道府県名」の辞書、「市町村名」の辞書、「町
字名」等の辞書が辞書項目として用意されており、それ
ぞれの辞書項目は辞書項目格納部56に格納されてい
る。
【0006】次に、図6のフローチャートに従って、音
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置はスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により予め
検索対象を選択して予め音声認識部52に登録する検索
対象の選択動作を実行する。この例では、地名検索を行
う場合の例として、辞書格納部55に対し辞書項目「都
道府県名」の辞書を登録する。そして、ユーザの発声を
待つ。
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置はスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により予め
検索対象を選択して予め音声認識部52に登録する検索
対象の選択動作を実行する。この例では、地名検索を行
う場合の例として、辞書格納部55に対し辞書項目「都
道府県名」の辞書を登録する。そして、ユーザの発声を
待つ。
【0007】において、ユーザが「香川」と発声する
と、その音声は音声入力部51を通して音声認識部52
に入力される。音声認識部52は入力された音声に対し
て辞書格納部55に格納されている辞書を用いて認識処
理を行い、認識結果出力部53からディスプレイかまた
は音声により、その認識結果を出力する(図6の)。
認識結果は、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
と、その音声は音声入力部51を通して音声認識部52
に入力される。音声認識部52は入力された音声に対し
て辞書格納部55に格納されている辞書を用いて認識処
理を行い、認識結果出力部53からディスプレイかまた
は音声により、その認識結果を出力する(図6の)。
認識結果は、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
【0008】次に、において、辞書選択部54は、認
識結果1位候補にしたがって、次に音声認識に用いるで
あろう辞書として、辞書項目「神奈川県の市町村名」の
辞書を辞書項目格納部56から選択して辞書格納部55
に登録する。において、認識結果出力部53は、音声
によるトークバックとかディスプレイ表示等の何らかの
手段を使用して、ユーザに対し音声認識の結果を知らせ
ることにより応答を行う。において、ユーザは認識結
果出力部53から出力された認識結果から、この音声認
識は誤認識であることを知る。
識結果1位候補にしたがって、次に音声認識に用いるで
あろう辞書として、辞書項目「神奈川県の市町村名」の
辞書を辞書項目格納部56から選択して辞書格納部55
に登録する。において、認識結果出力部53は、音声
によるトークバックとかディスプレイ表示等の何らかの
手段を使用して、ユーザに対し音声認識の結果を知らせ
ることにより応答を行う。において、ユーザは認識結
果出力部53から出力された認識結果から、この音声認
識は誤認識であることを知る。
【0009】において、ユーザは、現在辞書格納部5
5に登録されている辞書項目と入れ替える前に登録され
ていた辞書項目、すなわち「都道府県名」の辞書を辞書
格納部55に戻するための単語「戻る」を発声する。
において、音声認識装置は、再度音声認識処理を行い、
その認識結果から、各辞書項目に含まれている単語「戻
る」を認識する。その結果、次に音声認識に用いる辞書
として、上記のように既に入れ替えられていた辞書項目
「神奈川県の市町村名」の辞書から、それと入れ替える
前に登録されていた辞書である辞書項目「都道府県名の
辞書」を辞書項目格納部56から選択して辞書格納部5
5に登録する(図6の(10)) 。
5に登録されている辞書項目と入れ替える前に登録され
ていた辞書項目、すなわち「都道府県名」の辞書を辞書
格納部55に戻するための単語「戻る」を発声する。
において、音声認識装置は、再度音声認識処理を行い、
その認識結果から、各辞書項目に含まれている単語「戻
る」を認識する。その結果、次に音声認識に用いる辞書
として、上記のように既に入れ替えられていた辞書項目
「神奈川県の市町村名」の辞書から、それと入れ替える
前に登録されていた辞書である辞書項目「都道府県名の
辞書」を辞書項目格納部56から選択して辞書格納部5
5に登録する(図6の(10)) 。
【0010】(11)において、音声認識部52は認識結果
出力部53からディスプレイによりその結果を出力する
ことにより応答を行う。そして、ユーザはやっと言い直
しが可能となったことを知る(図6の(12)) 。ここで、
ユーザは再び前の辞書項目「都道府県名」の辞書から正
しい単語を検索するため、「香川」を発声する(図6の
(13)) 。以下、この検索手順を繰り返して目的の地名を
取得する。
出力部53からディスプレイによりその結果を出力する
ことにより応答を行う。そして、ユーザはやっと言い直
しが可能となったことを知る(図6の(12)) 。ここで、
ユーザは再び前の辞書項目「都道府県名」の辞書から正
しい単語を検索するため、「香川」を発声する(図6の
(13)) 。以下、この検索手順を繰り返して目的の地名を
取得する。
【0011】
【発明が解決しようとする課題】しかしながら、上記従
来の音声認識装置においては、誤認識の場合、ユーザ
は、辞書項目から正しい単語を検索するために前の単語
を再度発声するまで、前の音声認識の後に既に入れ替え
られている後の音声認識のための辞書を、入れ替える前
の辞書に戻すための単語、例えば「戻る」等の単語を少
なくとも1回は発声する必要があった。
来の音声認識装置においては、誤認識の場合、ユーザ
は、辞書項目から正しい単語を検索するために前の単語
を再度発声するまで、前の音声認識の後に既に入れ替え
られている後の音声認識のための辞書を、入れ替える前
の辞書に戻すための単語、例えば「戻る」等の単語を少
なくとも1回は発声する必要があった。
【0012】特に、音声認識の結果に応じて辞書を入れ
替え、音声認識装置を入力とするシステムの状態が変化
するような場合(音声認識装置の途中経過に従い、シス
テムの状態を変える場合)においても、音声認識におい
て誤認識してしまうと、前の単語を再度言い返すまで
に、音声認識に用いる辞書を入れ替えて前の辞書に戻す
単語「戻る」等によって、音声認識に用いる辞書を前の
辞書に戻し、さらに、この音声認識装置を含むシステム
も変化する前の状態に戻す必要があった。このようにシ
ステムが変化する前の状態に戻すために時間がかかる
と、ユーザは再度発声するまでに長い待ち時間を必要と
するという問題があった。
替え、音声認識装置を入力とするシステムの状態が変化
するような場合(音声認識装置の途中経過に従い、シス
テムの状態を変える場合)においても、音声認識におい
て誤認識してしまうと、前の単語を再度言い返すまで
に、音声認識に用いる辞書を入れ替えて前の辞書に戻す
単語「戻る」等によって、音声認識に用いる辞書を前の
辞書に戻し、さらに、この音声認識装置を含むシステム
も変化する前の状態に戻す必要があった。このようにシ
ステムが変化する前の状態に戻すために時間がかかる
と、ユーザは再度発声するまでに長い待ち時間を必要と
するという問題があった。
【0013】本発明は、上記従来の問題を解決するため
になされたもので、前の認識処理の後に、誤認識と知っ
た場合、音声認識の対象となる辞書項目が入れ替えられ
てしまった後でも、辞書項目を前の辞書項目に戻すこと
を考慮することなく、即座に前の辞書項目に対する単語
を再度発声して音声認識することができる音声認識装置
及び認識方法を提供することを目的とする。
になされたもので、前の認識処理の後に、誤認識と知っ
た場合、音声認識の対象となる辞書項目が入れ替えられ
てしまった後でも、辞書項目を前の辞書項目に戻すこと
を考慮することなく、即座に前の辞書項目に対する単語
を再度発声して音声認識することができる音声認識装置
及び認識方法を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明による音声認識装
置は、上記の目的を達成するため、音声を入力する音声
入力手段と、入力された音声を認識する音声認識手段
と、辞書選択手段で選択された音声認識に用いられる辞
書を格納する辞書格納手段と、音声認識に用いられる複
数の辞書が格納されている辞書項目格納手段と、辞書選
択手段で選択された辞書項目を保持する辞書保持手段
と、制御手段の命令により音声認識に必要な辞書項目を
辞書項目格納手段から選択し該選択された辞書項目を辞
書保持手段に保持させると共にその時まで辞書保持手段
に保持されていた辞書項目と該選択した辞書項目との両
辞書項目を辞書格納手段へ供給する辞書選択手段とから
なり、保持されていた前の辞書項目と現に選択された辞
書項目の両辞書項目を検索対象とするようにしたもので
ある。
置は、上記の目的を達成するため、音声を入力する音声
入力手段と、入力された音声を認識する音声認識手段
と、辞書選択手段で選択された音声認識に用いられる辞
書を格納する辞書格納手段と、音声認識に用いられる複
数の辞書が格納されている辞書項目格納手段と、辞書選
択手段で選択された辞書項目を保持する辞書保持手段
と、制御手段の命令により音声認識に必要な辞書項目を
辞書項目格納手段から選択し該選択された辞書項目を辞
書保持手段に保持させると共にその時まで辞書保持手段
に保持されていた辞書項目と該選択した辞書項目との両
辞書項目を辞書格納手段へ供給する辞書選択手段とから
なり、保持されていた前の辞書項目と現に選択された辞
書項目の両辞書項目を検索対象とするようにしたもので
ある。
【0015】本発明によれば、前の認識処理の結果、誤
認識と知った場合、音声認識の対象となる辞書項目が入
れ替えられてしまった後でも、辞書項目を前の辞書項目
に戻すことを考慮することなく、即座に前の辞書項目に
対する単語を再度発声して音声認識することができる音
声認識装置及び認識方法が得られる。
認識と知った場合、音声認識の対象となる辞書項目が入
れ替えられてしまった後でも、辞書項目を前の辞書項目
に戻すことを考慮することなく、即座に前の辞書項目に
対する単語を再度発声して音声認識することができる音
声認識装置及び認識方法が得られる。
【0016】また、本発明による音声認識装置は、上記
の目的を達成するため、音声を入力する音声入力手段
と、入力された音声を認識する音声認識手段と、辞書選
択手段で選択された音声認識に用いられる辞書を格納す
る辞書格納手段と、音声認識に用いられる複数の辞書が
格納されている辞書項目格納手段と、音声認識手段にお
ける音声認識の結果の上位数候補を保持する認識結果格
納手段と、制御手段の命令により音声認識に必要な辞書
項目を辞書格納手段から選択し該選択した辞書項目とそ
の時まで認識結果格納手段に保持されていた音声認識の
結果の上位複数候補との和を辞書格納手段へ供給する辞
書選択手段とからなり、保持されていた音声認識の結果
の上位複数候補と現に選択された辞書項目の和を検索対
象とするようにしたものである。
の目的を達成するため、音声を入力する音声入力手段
と、入力された音声を認識する音声認識手段と、辞書選
択手段で選択された音声認識に用いられる辞書を格納す
る辞書格納手段と、音声認識に用いられる複数の辞書が
格納されている辞書項目格納手段と、音声認識手段にお
ける音声認識の結果の上位数候補を保持する認識結果格
納手段と、制御手段の命令により音声認識に必要な辞書
項目を辞書格納手段から選択し該選択した辞書項目とそ
の時まで認識結果格納手段に保持されていた音声認識の
結果の上位複数候補との和を辞書格納手段へ供給する辞
書選択手段とからなり、保持されていた音声認識の結果
の上位複数候補と現に選択された辞書項目の和を検索対
象とするようにしたものである。
【0017】本発明によれば、前の認識処理の結果、誤
認識と知った場合、音声認識の対象となる辞書項目が入
れ替えられてしまった後でも、辞書項目を前の辞書項目
に戻すことを考慮することなく、即座に前の辞書項目に
対する単語を再度発声して音声認識することができる
上、認識対象が前の認識結果の上位数候補に絞られるた
め、認識処理を更に迅速に行うことができる音声認識装
置及び認識方法が得られる。
認識と知った場合、音声認識の対象となる辞書項目が入
れ替えられてしまった後でも、辞書項目を前の辞書項目
に戻すことを考慮することなく、即座に前の辞書項目に
対する単語を再度発声して音声認識することができる
上、認識対象が前の認識結果の上位数候補に絞られるた
め、認識処理を更に迅速に行うことができる音声認識装
置及び認識方法が得られる。
【0018】
【発明の実施の形態】本発明の請求項1に記載の発明
は、音声を入力する音声入力手段と、音声認識に用いる
ための複数の辞書項目が格納されている辞書項目格納手
段と、辞書選択手段によって選択された認識対象となる
辞書を格納する辞書格納手段と、該辞書格納手段に格納
されている辞書を保持する辞書保持手段と、前記辞書格
納手段に格納されている辞書を検索対象として入力した
音声を認識する音声認識手段と、制御手段の命令により
音声認識に必要な辞書項目を前記辞書項目格納手段から
選択して前記辞書保持手段に保持させると共にその時ま
で辞書保持手段に保持されていた辞書項目と該選択した
辞書項目との両辞書項目を辞書格納手段へ供給する辞書
選択手段とからなり、その時まで辞書保持手段に保持さ
れていた辞書項目と現に選択された辞書項目との両辞書
項目を検索対象とするようにしたものであり、音声認識
装置が誤認識した場合、音声認識に用いる辞書を入れ替
える前の辞書に戻すための単語「戻る」等を発声するこ
となく、即座に再度前の辞書項目に対する単語を発声す
ることができるため、ユーザに煩わしさを感じさせるこ
となく言い直しが可能となる音声認識装置が得られると
いう作用を有する。
は、音声を入力する音声入力手段と、音声認識に用いる
ための複数の辞書項目が格納されている辞書項目格納手
段と、辞書選択手段によって選択された認識対象となる
辞書を格納する辞書格納手段と、該辞書格納手段に格納
されている辞書を保持する辞書保持手段と、前記辞書格
納手段に格納されている辞書を検索対象として入力した
音声を認識する音声認識手段と、制御手段の命令により
音声認識に必要な辞書項目を前記辞書項目格納手段から
選択して前記辞書保持手段に保持させると共にその時ま
で辞書保持手段に保持されていた辞書項目と該選択した
辞書項目との両辞書項目を辞書格納手段へ供給する辞書
選択手段とからなり、その時まで辞書保持手段に保持さ
れていた辞書項目と現に選択された辞書項目との両辞書
項目を検索対象とするようにしたものであり、音声認識
装置が誤認識した場合、音声認識に用いる辞書を入れ替
える前の辞書に戻すための単語「戻る」等を発声するこ
となく、即座に再度前の辞書項目に対する単語を発声す
ることができるため、ユーザに煩わしさを感じさせるこ
となく言い直しが可能となる音声認識装置が得られると
いう作用を有する。
【0019】本発明の請求項2に記載の発明は、音声を
入力する音声入力手段と、音声認識に用いるための複数
の辞書項目が格納されている辞書項目格納手段と、辞書
選択手段によって選択された認識対象となる辞書を格納
する辞書格納手段と、該辞書格納手段に格納されている
辞書を検索対象として入力した音声を認識する音声認識
手段と、前記音声認識手段における前回の音声認識の結
果得られた辞書項目の上位複数候補の単語を格納する認
識結果格納手段と、制御手段の命令により前記辞書項目
格納手段から辞書項目を選択し該選択した辞書項目と前
記認識結果格納手段に格納されていた前回の認識結果か
ら得られた辞書項目の上位複数候補の単語との和を辞書
格納手段へ供給する辞書選択手段とからなり、その時ま
で認識結果格納手段に保持されていた辞書項目の上位複
数候補の単語と現に選択された辞書項目との和を検索対
象とするようにしたものであり、音声認識装置が誤認識
した場合、音声認識に用いる辞書を入れ替える前の辞書
に戻すための単語「戻る」等を発声することなく、即座
に再度前の辞書項目に対する単語を発声することができ
るため、ユーザに煩わしさを感じさせることなく言い直
しが可能となる上、検索対象の単語数が少ないので、再
度の認識処理を迅速に行うことができる音声認識装置が
得られるという作用を有する。
入力する音声入力手段と、音声認識に用いるための複数
の辞書項目が格納されている辞書項目格納手段と、辞書
選択手段によって選択された認識対象となる辞書を格納
する辞書格納手段と、該辞書格納手段に格納されている
辞書を検索対象として入力した音声を認識する音声認識
手段と、前記音声認識手段における前回の音声認識の結
果得られた辞書項目の上位複数候補の単語を格納する認
識結果格納手段と、制御手段の命令により前記辞書項目
格納手段から辞書項目を選択し該選択した辞書項目と前
記認識結果格納手段に格納されていた前回の認識結果か
ら得られた辞書項目の上位複数候補の単語との和を辞書
格納手段へ供給する辞書選択手段とからなり、その時ま
で認識結果格納手段に保持されていた辞書項目の上位複
数候補の単語と現に選択された辞書項目との和を検索対
象とするようにしたものであり、音声認識装置が誤認識
した場合、音声認識に用いる辞書を入れ替える前の辞書
に戻すための単語「戻る」等を発声することなく、即座
に再度前の辞書項目に対する単語を発声することができ
るため、ユーザに煩わしさを感じさせることなく言い直
しが可能となる上、検索対象の単語数が少ないので、再
度の認識処理を迅速に行うことができる音声認識装置が
得られるという作用を有する。
【0020】本発明の請求項3に記載の発明は、発声し
て音声を入力し、格納されている辞書項目を選択し、該
選択された辞書項目を検索対象として前記入力した音声
を認識し、前記検索対象の辞書項目かまたは該辞書項目
に対する検索の結果得られた該辞書項目の上位複数候補
の単語を格納し、次の検索対象として格納されている辞
書項目を選択し、該選択された辞書項目と前記格納され
ていた前回検索対象の辞書項目かまたは検索結果の上位
複数候補の単語とを検索対象として次に入力した音声を
認識するようにしたものであり、音声認識誤認の場合、
音声認識に用いる辞書を入れ替える前の辞書に戻すため
の単語「戻る」等を発声することなく、即座に再度前の
辞書項目に対する単語を発声することができるため、ユ
ーザに煩わしさを感じさせることなく言い直しが可能と
なる上、検索対象の単語数が少ないので、再度の認識処
理を迅速に行うことができる音声認識方法が得られると
いう作用を有する。
て音声を入力し、格納されている辞書項目を選択し、該
選択された辞書項目を検索対象として前記入力した音声
を認識し、前記検索対象の辞書項目かまたは該辞書項目
に対する検索の結果得られた該辞書項目の上位複数候補
の単語を格納し、次の検索対象として格納されている辞
書項目を選択し、該選択された辞書項目と前記格納され
ていた前回検索対象の辞書項目かまたは検索結果の上位
複数候補の単語とを検索対象として次に入力した音声を
認識するようにしたものであり、音声認識誤認の場合、
音声認識に用いる辞書を入れ替える前の辞書に戻すため
の単語「戻る」等を発声することなく、即座に再度前の
辞書項目に対する単語を発声することができるため、ユ
ーザに煩わしさを感じさせることなく言い直しが可能と
なる上、検索対象の単語数が少ないので、再度の認識処
理を迅速に行うことができる音声認識方法が得られると
いう作用を有する。
【0021】以下、添付図面、図1乃至図4に基づき、
本発明の実施の形態を詳細に説明する。図1は本発明の
第1の実施の形態における音声認識装置の構成を示すブ
ロック図、図2は図1に示す音声認識装置における音声
認識動作及び対話の流れを示すフローチャートを示す
図、図3は本発明の第2の実施の形態における音声認識
装置の構成を示すブロック図、図4は図3に示す音声認
識装置における音声認識動作及び対話の流れを示すフロ
ーチャートを示す図である。
本発明の実施の形態を詳細に説明する。図1は本発明の
第1の実施の形態における音声認識装置の構成を示すブ
ロック図、図2は図1に示す音声認識装置における音声
認識動作及び対話の流れを示すフローチャートを示す
図、図3は本発明の第2の実施の形態における音声認識
装置の構成を示すブロック図、図4は図3に示す音声認
識装置における音声認識動作及び対話の流れを示すフロ
ーチャートを示す図である。
【0022】(実施の形態1)まず、図1を参照して、
本発明の第1の実施の形態における音声認識装置の構成
について説明する。図1において、11は音声を入力し
て音声信号(電気信号)に変換する、例えばマイクロホ
ン等のような媒体変換手段を含む音声入力部、12は辞
書格納部15に格納されている辞書を検索対象として音
声入力部11から出力した音声信号を認識する音声認識
部、13は音声認識部12における音声信号の認識処理
の結果を出力する、例えば認識結果をディスプレイする
表示装置とかスピーカ等のような認識結果出力部であ
る。
本発明の第1の実施の形態における音声認識装置の構成
について説明する。図1において、11は音声を入力し
て音声信号(電気信号)に変換する、例えばマイクロホ
ン等のような媒体変換手段を含む音声入力部、12は辞
書格納部15に格納されている辞書を検索対象として音
声入力部11から出力した音声信号を認識する音声認識
部、13は音声認識部12における音声信号の認識処理
の結果を出力する、例えば認識結果をディスプレイする
表示装置とかスピーカ等のような認識結果出力部であ
る。
【0023】また、14は外部からの、例えば音声認識
装置全体を制御するCPU、パソコンまたはコンピュー
タ等のような制御手段からの命令により音声認識に用い
る辞書を選択する辞書選択部、15は音声認識に用いる
辞書を格納する辞書格納部、16は辞書選択部14で選
択された辞書を保持する辞書保持部、17は音声認識に
用いる複数の辞書項目が格納されている辞書項目格納部
(システムメモリーの1部でもよい)である。尚、音声
入力部11、音声認識部12、認識結果出力部13、辞
書選択部14、辞書格納部15、辞書保持部16及び辞
書項目格納部17はそれぞれ音声入力手段、音声認識手
段、認識結果出力手段、辞書選択手段、辞書格納手段、
辞書保持手段及び辞書項目格納手段に対応する。
装置全体を制御するCPU、パソコンまたはコンピュー
タ等のような制御手段からの命令により音声認識に用い
る辞書を選択する辞書選択部、15は音声認識に用いる
辞書を格納する辞書格納部、16は辞書選択部14で選
択された辞書を保持する辞書保持部、17は音声認識に
用いる複数の辞書項目が格納されている辞書項目格納部
(システムメモリーの1部でもよい)である。尚、音声
入力部11、音声認識部12、認識結果出力部13、辞
書選択部14、辞書格納部15、辞書保持部16及び辞
書項目格納部17はそれぞれ音声入力手段、音声認識手
段、認識結果出力手段、辞書選択手段、辞書格納手段、
辞書保持手段及び辞書項目格納手段に対応する。
【0024】次に、図1及び図2を参照して、本発明の
第1の実施の形態における音声認識装置の動作について
説明する。音声認識装置で検索する検索対象としては、
例えば、地名、住所、氏名、電話番号及びその他多数存
在する。以下、音声認識による検索動作の一例として、
地名検索の場合について説明する。
第1の実施の形態における音声認識装置の動作について
説明する。音声認識装置で検索する検索対象としては、
例えば、地名、住所、氏名、電話番号及びその他多数存
在する。以下、音声認識による検索動作の一例として、
地名検索の場合について説明する。
【0025】検索対象を地名検索とした場合、具体的に
は、ユーザが「都道府県名」→「市町村名」→「町字
名」と階層別に発声していき、地名を検索するものであ
り、例としては、カーナビゲーションシステムの音声認
識などがある。また、辞書も階層別に「都道府県名」の
辞書、「市町村名」の辞書、「町字名」等の辞書が辞書
項目として用意されており、それぞれの辞書項目は辞書
項目格納部17に格納されている。
は、ユーザが「都道府県名」→「市町村名」→「町字
名」と階層別に発声していき、地名を検索するものであ
り、例としては、カーナビゲーションシステムの音声認
識などがある。また、辞書も階層別に「都道府県名」の
辞書、「市町村名」の辞書、「町字名」等の辞書が辞書
項目として用意されており、それぞれの辞書項目は辞書
項目格納部17に格納されている。
【0026】次に、図2のフローチャートに従って、音
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置がスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により検索
対象として予め地名検索を選択し、その最初の辞書項目
を予め辞書格納部15に登録する検索対象の選択動作を
実行する。この例では、地名検索を行う場合の例とし
て、辞書格納部15に対し辞書項目「都道府県名」の辞
書を登録する。そして、辞書選択部14により、辞書保
持部16にも「都道府県名」の辞書を保持させるように
する。この状態でユーザの発声を待つ。
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置がスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により検索
対象として予め地名検索を選択し、その最初の辞書項目
を予め辞書格納部15に登録する検索対象の選択動作を
実行する。この例では、地名検索を行う場合の例とし
て、辞書格納部15に対し辞書項目「都道府県名」の辞
書を登録する。そして、辞書選択部14により、辞書保
持部16にも「都道府県名」の辞書を保持させるように
する。この状態でユーザの発声を待つ。
【0027】において、ユーザが「香川(カガワ)」
と発声すると、その音声は音声入力部11を通して音声
認識部12に入力される。音声認識部12は入力された
音声に対して辞書格納部15に格納されている辞書を用
いて認識処理を行い、認識結果出力部13からディスプ
レイかまたは音声によりその認識結果を出力する(図2
の)。認識結果は、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
と発声すると、その音声は音声入力部11を通して音声
認識部12に入力される。音声認識部12は入力された
音声に対して辞書格納部15に格納されている辞書を用
いて認識処理を行い、認識結果出力部13からディスプ
レイかまたは音声によりその認識結果を出力する(図2
の)。認識結果は、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
【0028】次に、において、辞書選択部14は、認
識結果1位候補にしたがい、次に音声認識に用いるであ
ろう辞書として、辞書項目「神奈川県の市町村名」の辞
書を辞書項目格納部17から選択して、その辞書項目と
辞書保持部16に保持されている辞書項目「都道府県
名」の辞書との和(両辞書項目を一緒にしたもの)を辞
書格納部15に供給する。において、認識結果出力部
13は、音声によるトークバックとかディスプレイ表示
等の何らかの手段を使用して、ユーザに対し、音声認識
の結果を知らせることにより応答を行う。において、
ユーザは認識結果出力部13から出力された認識結果か
ら、この音声認識は誤認識であることを知る。
識結果1位候補にしたがい、次に音声認識に用いるであ
ろう辞書として、辞書項目「神奈川県の市町村名」の辞
書を辞書項目格納部17から選択して、その辞書項目と
辞書保持部16に保持されている辞書項目「都道府県
名」の辞書との和(両辞書項目を一緒にしたもの)を辞
書格納部15に供給する。において、認識結果出力部
13は、音声によるトークバックとかディスプレイ表示
等の何らかの手段を使用して、ユーザに対し、音声認識
の結果を知らせることにより応答を行う。において、
ユーザは認識結果出力部13から出力された認識結果か
ら、この音声認識は誤認識であることを知る。
【0029】そこで、ユーザは、前の辞書項目に戻ると
いうようなことは考える必要なく、単に、再度前の単語
を「香川(カガワ)」と発声すればよい(図2の)。
このとき、辞書格納部15に格納されている辞書は、辞
書項目「都道府県名」の辞書と辞書項目「神奈川県の市
町村名」の辞書との和(両辞書項目を一緒にしたもの)
が辞書項目として登録されているので、ユーザが発声し
た「香川」を受けつけること、すなわち、再度の発声に
よる音声認識が可能となる。
いうようなことは考える必要なく、単に、再度前の単語
を「香川(カガワ)」と発声すればよい(図2の)。
このとき、辞書格納部15に格納されている辞書は、辞
書項目「都道府県名」の辞書と辞書項目「神奈川県の市
町村名」の辞書との和(両辞書項目を一緒にしたもの)
が辞書項目として登録されているので、ユーザが発声し
た「香川」を受けつけること、すなわち、再度の発声に
よる音声認識が可能となる。
【0030】そのため、において、音声認識部12
は、再度入力された音声「香川(カガワ)」に対して辞
書格納部15に格納されている辞書を用いて認識処理を
行い、認識結果出力部13からディスプレイかまたは音
声によりその認識結果を出力する。以下、この検索手順
を繰り返して目的の地名を取得する。尚、本実施の形態
では、認識する対象を単語で説明したが、単語のみでな
く、例えば、熟語等を認識する対象にすることもでき
る。
は、再度入力された音声「香川(カガワ)」に対して辞
書格納部15に格納されている辞書を用いて認識処理を
行い、認識結果出力部13からディスプレイかまたは音
声によりその認識結果を出力する。以下、この検索手順
を繰り返して目的の地名を取得する。尚、本実施の形態
では、認識する対象を単語で説明したが、単語のみでな
く、例えば、熟語等を認識する対象にすることもでき
る。
【0031】本実施の形態によれば、前の認識処理の後
に音声認識の対象となる辞書が入れ替えられてしまった
後において、認識結果を誤認識と知った場合、音声認識
に用いる辞書項目を入れ替える前の辞書項目に戻すため
の単語「戻る」等を発声したり、前の辞書項目に戻すと
いうようにことは考慮する必要がなく、即座に再度前の
辞書項目に対する単語を発声して前の単語の音声認識を
繰り返すことができるため、ユーザに煩わしさを感じさ
せることなく迅速に音声認識処理を実行することができ
る。
に音声認識の対象となる辞書が入れ替えられてしまった
後において、認識結果を誤認識と知った場合、音声認識
に用いる辞書項目を入れ替える前の辞書項目に戻すため
の単語「戻る」等を発声したり、前の辞書項目に戻すと
いうようにことは考慮する必要がなく、即座に再度前の
辞書項目に対する単語を発声して前の単語の音声認識を
繰り返すことができるため、ユーザに煩わしさを感じさ
せることなく迅速に音声認識処理を実行することができ
る。
【0032】(実施の形態2)次に、図3を参照して、
本発明の第2の実施の形態における音声認識装置の構成
について説明する。図3において、31は音声を入力し
て音声信号(電気信号)に変換する、例えばマイクロホ
ン等のような媒体変換手段を含む音声入力部、32は辞
書格納部35に格納されている辞書を検索対象として音
声入力部31から出力した音声信号を認識する音声認識
部、33は音声認識部32における音声信号の認識処理
の結果を出力する、例えば認識結果をディスプレイする
表示装置とかスピーカ等のような認識結果出力部であ
る。
本発明の第2の実施の形態における音声認識装置の構成
について説明する。図3において、31は音声を入力し
て音声信号(電気信号)に変換する、例えばマイクロホ
ン等のような媒体変換手段を含む音声入力部、32は辞
書格納部35に格納されている辞書を検索対象として音
声入力部31から出力した音声信号を認識する音声認識
部、33は音声認識部32における音声信号の認識処理
の結果を出力する、例えば認識結果をディスプレイする
表示装置とかスピーカ等のような認識結果出力部であ
る。
【0033】また、34は外部からの、例えば音声認識
装置全体を制御するCPU、パソコンまたはコンピュー
タ等のような制御手段からの命令により音声認識に用い
る辞書を選択する辞書選択部、35は音声認識に用いる
辞書を格納する辞書格納部、36は音声認識部32の認
識結果(例えば、上位の数単語)を格納する認識結果格
納部、37は音声認識に用いる複数の辞書項目が格納さ
れている辞書項目格納部(システムメモリーの1部でも
よい)である。尚、音声入力部31、音声認識部32、
認識結果出力部33、辞書選択部34、辞書格納部3
5、認識結果格納部36及び辞書項目格納部37はそれ
ぞれ音声入力手段、音声認識手段、認識結果出力手段、
辞書選択手段、辞書格納手段、認識結果格納手段及び辞
書項目格納手段に対応する。
装置全体を制御するCPU、パソコンまたはコンピュー
タ等のような制御手段からの命令により音声認識に用い
る辞書を選択する辞書選択部、35は音声認識に用いる
辞書を格納する辞書格納部、36は音声認識部32の認
識結果(例えば、上位の数単語)を格納する認識結果格
納部、37は音声認識に用いる複数の辞書項目が格納さ
れている辞書項目格納部(システムメモリーの1部でも
よい)である。尚、音声入力部31、音声認識部32、
認識結果出力部33、辞書選択部34、辞書格納部3
5、認識結果格納部36及び辞書項目格納部37はそれ
ぞれ音声入力手段、音声認識手段、認識結果出力手段、
辞書選択手段、辞書格納手段、認識結果格納手段及び辞
書項目格納手段に対応する。
【0034】次に、図3及び図4を参照して、本発明の
第2の実施の形態における音声認識装置の動作について
説明する。本第2の実施の形態における場合も、上記第
1の実施の形態における場合と同様、この音声認識装置
で検索する検索対象の一例として、以下、地名検索の場
合について説明する。
第2の実施の形態における音声認識装置の動作について
説明する。本第2の実施の形態における場合も、上記第
1の実施の形態における場合と同様、この音声認識装置
で検索する検索対象の一例として、以下、地名検索の場
合について説明する。
【0035】検索対象を地名検索とした場合、具体的に
は、ユーザが「都道府県名」→「市町村名」→「町字
名」と階層別に発声していき、地名を検索するものであ
り、例としては、カーナビゲーションシステムの音声認
識などがある。また、辞書も階層別に「都道府県名」の
辞書、「市町村名」の辞書、「町字名」等の辞書が辞書
項目として用意されており、それぞれの辞書項目は辞書
格納部36に格納されている。
は、ユーザが「都道府県名」→「市町村名」→「町字
名」と階層別に発声していき、地名を検索するものであ
り、例としては、カーナビゲーションシステムの音声認
識などがある。また、辞書も階層別に「都道府県名」の
辞書、「市町村名」の辞書、「町字名」等の辞書が辞書
項目として用意されており、それぞれの辞書項目は辞書
格納部36に格納されている。
【0036】次に、図4のフローチャートに従って、音
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置がスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により検索
対象として予め地名検索を選択し、その最初の辞書項目
を予め音声認識部32に登録する検索対象の選択動作を
実行する。この例では、地名検索を行う場合の例とし
て、音声認識部32に対し辞書項目「都道府県名」の辞
書を登録する。この状態でユーザの発声を待つ。
声認識装置の動作を説明する。において、まず、ユー
ザが音声認識装置のスタートボタンを押すと、音声認識
装置がスタートする。次に、において、音声認識動作
に入る前に、検索対象選択手段(図示せず)により検索
対象として予め地名検索を選択し、その最初の辞書項目
を予め音声認識部32に登録する検索対象の選択動作を
実行する。この例では、地名検索を行う場合の例とし
て、音声認識部32に対し辞書項目「都道府県名」の辞
書を登録する。この状態でユーザの発声を待つ。
【0037】において、ユーザが「香川(カガワ)」
と発声すると、その音声は音声入力部31を通して音声
認識部32に入力される。音声認識部32は入力された
音声に対して辞書格納部35に格納されている辞書を用
いて認識処理を行い、認識結果出力部33からディスプ
レイかまたは音声によりその認識結果を出力する(図4
の)。そして、音声認識部32は認識結果格納部35
に対し、上位数個の認識結果、例えば、認識結果の1乃
至3位候補を送出して格納する(図4)。その認識結
果は 、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
と発声すると、その音声は音声入力部31を通して音声
認識部32に入力される。音声認識部32は入力された
音声に対して辞書格納部35に格納されている辞書を用
いて認識処理を行い、認識結果出力部33からディスプ
レイかまたは音声によりその認識結果を出力する(図4
の)。そして、音声認識部32は認識結果格納部35
に対し、上位数個の認識結果、例えば、認識結果の1乃
至3位候補を送出して格納する(図4)。その認識結
果は 、次のようになったものとする。 認識結果1位候補 神奈川(カナガワ) 認識結果2位候補 香川(カガワ) 認識結果3位候補 和歌山(ワカヤマ) …
【0038】次に、において、辞書選択部34は、認
識結果1位候補に従い、次に音声認識に用いるであろう
辞書として、辞書項目「神奈川県の市町村名」の辞書を
辞書格納部37から選択し、その辞書項目と認識結果格
納部35に保持されている辞書項目「都道府県名」の辞
書に対する認識結果の上位複数候補の単語との和(両辞
書項目を一緒にしたもの)を辞書格納部35に供給す
る。において、認識結果出力部33は、音声によるト
ークバックとかディスプレイ表示等の何らかの手段を使
用して、ユーザに対し音声認識の結果を知らせることに
より応答を行う。において、ユーザは認識結果出力部
33から出力された認識結果から、この音声認識は誤認
識であることを知る。
識結果1位候補に従い、次に音声認識に用いるであろう
辞書として、辞書項目「神奈川県の市町村名」の辞書を
辞書格納部37から選択し、その辞書項目と認識結果格
納部35に保持されている辞書項目「都道府県名」の辞
書に対する認識結果の上位複数候補の単語との和(両辞
書項目を一緒にしたもの)を辞書格納部35に供給す
る。において、認識結果出力部33は、音声によるト
ークバックとかディスプレイ表示等の何らかの手段を使
用して、ユーザに対し音声認識の結果を知らせることに
より応答を行う。において、ユーザは認識結果出力部
33から出力された認識結果から、この音声認識は誤認
識であることを知る。
【0039】そこで、ユーザは、前の辞書項目に戻ると
いうようにことは考える必要なく、単に、再度前の単語
を「香川(カガワ)」と発声すればよい(図4の)。
このとき、辞書格納部35に格納されている辞書は、辞
書項目「都道府県名」の辞書に対する認識結果の上位候
補の単語と辞書項目「神奈川県の市町村名」の辞書との
和(両辞書項目を一緒にしたもの)が辞書項目として登
録されているので、ユーザが発声した「香川」を受けつ
けること、すなわち、再度の発声による音声認識が可能
となる。
いうようにことは考える必要なく、単に、再度前の単語
を「香川(カガワ)」と発声すればよい(図4の)。
このとき、辞書格納部35に格納されている辞書は、辞
書項目「都道府県名」の辞書に対する認識結果の上位候
補の単語と辞書項目「神奈川県の市町村名」の辞書との
和(両辞書項目を一緒にしたもの)が辞書項目として登
録されているので、ユーザが発声した「香川」を受けつ
けること、すなわち、再度の発声による音声認識が可能
となる。
【0040】そのため、(10)において、音声認識部32
は、再度入力された音声「香川(カガワ)」に対し辞書
格納部35に格納されている辞書を用いて認識処理を行
い、認識結果出力部33からディスプレイかまたは音声
によりその認識結果を出力する。以下、この検索手順を
繰り返して目的の地名を取得する。尚、本実施の形態で
は、認識する対象を単語で説明したが、単語のみでな
く、例えば、熟語等を認識する対象にすることもでき
る。
は、再度入力された音声「香川(カガワ)」に対し辞書
格納部35に格納されている辞書を用いて認識処理を行
い、認識結果出力部33からディスプレイかまたは音声
によりその認識結果を出力する。以下、この検索手順を
繰り返して目的の地名を取得する。尚、本実施の形態で
は、認識する対象を単語で説明したが、単語のみでな
く、例えば、熟語等を認識する対象にすることもでき
る。
【0041】本実施の形態によれば、前の認識処理の後
に音声認識の対象となる辞書が入れ替えられてしまった
後において、認識結果を誤認識と知った場合、音声認識
に用いる辞書項目を入れ替える前の辞書項目に戻すため
の単語「戻る」等を発声したり、前の辞書項目に戻すと
いうようにことは考慮する必要がなく、即座に再度前の
辞書項目に対する単語を発声して前の単語の音声認識を
繰り返すことができるため、ユーザに煩わしさを感じさ
せることなく迅速に音声認識処理を実行することができ
る。その上、再度の発声における前の認識対象の辞書項
目を既に認識した上位数候補に絞っているため、ほとん
ど、目的の単語がそこに含まれている上、数が少ないの
で、認識処理を更に迅速に行うことができる。
に音声認識の対象となる辞書が入れ替えられてしまった
後において、認識結果を誤認識と知った場合、音声認識
に用いる辞書項目を入れ替える前の辞書項目に戻すため
の単語「戻る」等を発声したり、前の辞書項目に戻すと
いうようにことは考慮する必要がなく、即座に再度前の
辞書項目に対する単語を発声して前の単語の音声認識を
繰り返すことができるため、ユーザに煩わしさを感じさ
せることなく迅速に音声認識処理を実行することができ
る。その上、再度の発声における前の認識対象の辞書項
目を既に認識した上位数候補に絞っているため、ほとん
ど、目的の単語がそこに含まれている上、数が少ないの
で、認識処理を更に迅速に行うことができる。
【0042】
【発明の効果】本発明による音声認識装置及び認識方法
は、辞書保持部を設けて前の音声認識に用いた辞書項目
を保持し、誤認識の場合における再度の発声の際に使用
するようにしたことにより、前の辞書項目に戻すための
単語を発声して前の辞書項目に戻すことを考慮すること
なく、即座に再度前の辞書項目に対する単語を発声して
前の単語の音声認識を繰り返すことができるため、ユー
ザに煩わしさを感じさせることなく迅速に音声認識処理
を実行することができる。
は、辞書保持部を設けて前の音声認識に用いた辞書項目
を保持し、誤認識の場合における再度の発声の際に使用
するようにしたことにより、前の辞書項目に戻すための
単語を発声して前の辞書項目に戻すことを考慮すること
なく、即座に再度前の辞書項目に対する単語を発声して
前の単語の音声認識を繰り返すことができるため、ユー
ザに煩わしさを感じさせることなく迅速に音声認識処理
を実行することができる。
【0043】また、本発明による音声認識装置及び認識
方法は、認識結果格納部を設けて前の音声認識で認識し
た結果の上位数候補を保持し、誤認識の場合における再
度の発声の際に使用するようにしたことにより、前の辞
書項目に戻すための単語を発声して前の辞書項目に戻す
ことを考慮することなく、即座に再度前の単語を発声し
てその音声認識を繰り返すことができるため、ユーザに
煩わしさを感じさせることなく、又、前の辞書項目に含
まれている単語全てを検索対象とせず、認識結果の上位
数候補を検索対象とするため、ほとんど、目的の単語が
認識結果の上位数候補に含まれている上、数が少ないの
で、認識処理を更に迅速に行うことができる。
方法は、認識結果格納部を設けて前の音声認識で認識し
た結果の上位数候補を保持し、誤認識の場合における再
度の発声の際に使用するようにしたことにより、前の辞
書項目に戻すための単語を発声して前の辞書項目に戻す
ことを考慮することなく、即座に再度前の単語を発声し
てその音声認識を繰り返すことができるため、ユーザに
煩わしさを感じさせることなく、又、前の辞書項目に含
まれている単語全てを検索対象とせず、認識結果の上位
数候補を検索対象とするため、ほとんど、目的の単語が
認識結果の上位数候補に含まれている上、数が少ないの
で、認識処理を更に迅速に行うことができる。
【図1】本発明の第1の実施の形態における音声認識装
置の構成を示すブロック図
置の構成を示すブロック図
【図2】図1に示す音声認識装置における音声認識動作
及び対話の流れを示すフローチャートを示す図
及び対話の流れを示すフローチャートを示す図
【図3】本発明の第2の実施の形態における音声認識装
置の構成を示すブロック図
置の構成を示すブロック図
【図4】図3に示す音声認識装置における音声認識動作
及び対話の流れを示すフローチャートを示す図
及び対話の流れを示すフローチャートを示す図
【図5】従来の音声認識装置の構成を示すブロック図
【図6】図5に示す音声認識装置における音声認識動作
及び対話の流れを示すフローチャートを示す図
及び対話の流れを示すフローチャートを示す図
11 音声入力部 12 音声認識部 13 認識結果出力部 14 辞書選択部 15 辞書格納部 16 辞書保持部 17 辞書項目格納部 31 音声入力部 32 音声認識部 33 認識結果出力部 34 辞書選択部 35 辞書格納部 36 認識結果格納部 37 辞書項目格納部 51 音声入力部 52 音声認識部 53 認識結果出力部 54 辞書選択部 55 認識辞書格納部 56 辞書項目格納部
Claims (3)
- 【請求項1】音声を入力する音声入力手段と、音声認識
に用いるための複数の辞書項目が格納されている辞書項
目格納手段と、辞書選択手段によって選択された認識対
象となる辞書を格納する辞書格納手段と、該辞書格納手
段に格納されている辞書を保持する辞書保持手段と、前
記辞書格納手段に格納されている辞書を検索対象として
入力した音声を認識する音声認識手段と、制御手段の命
令により音声認識に必要な辞書項目を前記辞書項目格納
手段から選択して前記辞書保持手段に保持させると共に
その時まで辞書保持手段に保持されていた辞書項目と該
選択した辞書項目との両辞書項目を辞書格納手段へ供給
する辞書選択手段とからなり、その時まで辞書保持手段
に保持されていた辞書項目と現に選択された辞書項目と
の両辞書項目を検索対象とすることを特徴とする音声認
識装置。 - 【請求項2】音声を入力する音声入力手段と、音声認識
に用いるための複数の辞書項目が格納されている辞書項
目格納手段と、辞書選択手段によって選択された認識対
象となる辞書を格納する辞書格納手段と、該辞書格納手
段に格納されている辞書を検索対象として入力した音声
を認識する音声認識手段と、前記音声認識手段における
前回の音声認識の結果得られた辞書項目の上位複数候補
の単語を格納する認識結果格納手段と、制御手段の命令
により前記辞書項目格納手段から辞書項目を選択し該選
択した辞書項目と前記認識結果格納手段に格納されてい
た前回の認識結果から得られた辞書項目の上位複数候補
の単語との和を辞書格納手段へ供給する辞書選択手段と
からなり、その時まで認識結果格納手段に保持されてい
た辞書項目の上位複数候補の単語と現に選択された辞書
項目との和を検索対象とすることを特徴とする音声認識
装置。 - 【請求項3】発声して音声を入力し、格納されている辞
書項目を選択し、該選択された辞書項目を検索対象とし
て前記入力した音声を認識し、前記検索対象の辞書項目
かまたは該辞書項目に対する検索の結果得られた該辞書
項目の上位複数候補の単語を格納し、次の検索対象とし
て格納されている辞書項目を選択し、該選択された辞書
項目と前記格納されていた前回検索対象の辞書項目かま
たは検索結果の上位複数候補の単語とを検索対象として
次に入力した音声を認識する各工程からなることを特徴
とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8295897A JPH10124085A (ja) | 1996-10-18 | 1996-10-18 | 音声認識装置及び認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8295897A JPH10124085A (ja) | 1996-10-18 | 1996-10-18 | 音声認識装置及び認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10124085A true JPH10124085A (ja) | 1998-05-15 |
Family
ID=17826577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8295897A Pending JPH10124085A (ja) | 1996-10-18 | 1996-10-18 | 音声認識装置及び認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10124085A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006078791A (ja) * | 2004-09-09 | 2006-03-23 | Denso Corp | 音声認識装置 |
JP2006349954A (ja) * | 2005-06-15 | 2006-12-28 | Fujitsu Ltd | 対話システム |
-
1996
- 1996-10-18 JP JP8295897A patent/JPH10124085A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006078791A (ja) * | 2004-09-09 | 2006-03-23 | Denso Corp | 音声認識装置 |
JP2006349954A (ja) * | 2005-06-15 | 2006-12-28 | Fujitsu Ltd | 対話システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6570651B2 (ja) | 音声対話装置および音声対話方法 | |
CN100401375C (zh) | 语音处理系统及方法 | |
KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
JP3135233B2 (ja) | 音声認識を用いたロボットホテル従業員 | |
US20060206331A1 (en) | Multilingual speech recognition | |
EP0769184B1 (en) | Speech recognition methods and apparatus on the basis of the modelling of new words | |
JPH1115493A (ja) | 実時間動作において目標案内システムに目標アドレスを音声入力する方法及び装置 | |
JP2002006878A (ja) | 音声フレーズ認識方法及び音声認識装置 | |
EP1975923B1 (en) | Multilingual non-native speech recognition | |
JP2003022089A (ja) | オーディオ専用インターフェースにおけるボイス・スペリング | |
JP2000122691A (ja) | 綴り字読み式音声発話の自動認識方法 | |
JP2001005488A (ja) | 音声対話システム | |
JP3278222B2 (ja) | 情報処理方法及び装置 | |
JP2006048058A (ja) | 多言語による名称の音声認識のための方法とシステム | |
JP2007538278A (ja) | 音声認識システム | |
CN1416560A (zh) | 由有限的用户圈用语音控制启动可在设备内执行的动作的方法 | |
EP1213706A1 (en) | Method for online adaptation of pronunciation dictionaries | |
JPH08248987A (ja) | 音声認識方法 | |
JP2003029776A (ja) | 音声認識装置 | |
JP4498906B2 (ja) | 音声認識装置 | |
Seide et al. | Towards an automated directory information system. | |
JPH10124085A (ja) | 音声認識装置及び認識方法 | |
JP3830124B2 (ja) | 音声認識装置 | |
JP3340163B2 (ja) | 音声認識装置 | |
JP2004029354A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム |