JP2007286174A

JP2007286174A - 電子機器

Info

Publication number: JP2007286174A
Application number: JP2006110940A
Authority: JP
Inventors: Mayumi Kaneko; 真由美金子; Shusuke Narita; 修輔成田
Original assignee: Funai Electric Co Ltd
Current assignee: Funai Electric Co Ltd
Priority date: 2006-04-13
Filing date: 2006-04-13
Publication date: 2007-11-01

Abstract

【課題】各ユーザに最適な音響モデルを選択し、より確実に音声認識を行うことができる電子機器を提供することである。
【解決手段】ディジタルテレビ受像機１００において、音響モデルパターン取得手段（ＣＰＵ１２１、音響モデルパターン取得プログラム１２３ｄ）によって、識別情報抽出手段（ＣＰＵ１２１、識別情報抽出プログラム１２３ｃ）により抽出された識別情報に対応する音響モデルパターンを取得し、コマンド情報抽出手段（ＣＰＵ１２１、コマンド情報抽出プログラム１２３ｅ）によって、取得された音響モデルパターンを用いて、音声情報取得部１１により取得された音声情報の音声認識を行い、コマンド情報を抽出し、制御手段により、抽出したコマンド情報に基づいて制御を行う。
【選択図】図１

Description

本発明は、音声認識機能により各種制御を行うことができる電子機器に関する。

近年、テレビやビデオ等の電子機器の多機能化・高機能化が進むに伴い、様々な機能に対応し、かつ簡易な操作が可能なものが求められ、現在では、このような操作に音声認識技術を用いた電子機器が利用されている。

音声認識技術を用いた電子機器には、例えば、留守番電話機能付ファクシミリ装置があり、通常の操作補助として音声を入力する際には、予め定められた数の単語を基に音声認識を行い、ＩＤの照合など特定話者の音声認識を行う場合は、予め、使用するフレーズの音声データを登録しておき、音声認識を行う機器がある（特許文献１参照）。

また、機器番号及びそれに対応する発音表記を表形式で格納する音声標本−機器番号対応テーブルを備え、音声認識結果を用いて前記音声標本−機器番号対応テーブルを検索し、対応する機器番号を検出することで被制御機器の特定を行う装置がある（特許文献２参照）。

また、操作装置が、入力された音声と電子機器へのコマンドを多重化した多重化信号を生成して電子機器に送信し、電子機器が、受信した多重化信号より、音声とコマンドを分離し、分離した音声を認識し、認識した認識内容、および、分離されたコマンドに対応して、自らの動作を制御するようにした機器がある（特許文献３参照）。

また、音声認識機能を有する小型形状の携帯型リモートコントロール装置であって、音声によりコマンドを入力することにより、音声コマンドに対応するコマンドを無線で制御対象である機器に対して送信し、当該機器を制御する装置がある（特許文献４参照）。
なお、一般に、音声認識技術は、特定話者音声認識と不特定話者音声認識との２つに分けることができる。特定話者音声認識技術は、利用者がある特定の個人であるという前提に基づき、その利用者の個人の声から音響的モデルを作成して音声認識を行う技術である。このため、利用者に対してだけの精密な音響モデルを作成することができるので、高い認識率を得ることができる。一方、不特定話者音声認識技術は、利用者が不特定であるという前提に基づき、一般的な音響モデルを予め作成しておき、音声認識を行う技術である。このため、特定話者音声認識に比較して認識性能は劣るものの、誰でも使用可能な音声認識をはじめから提供できる特徴がある。
特開２００１−３０９０８０号公報特開２００３−３３０４８３号公報特開２００３−２５００６１号公報特開２００３−１１４６９４号公報

しかしながら、音響モデルは、子供・大人などの話者層、電話や自動車内などの使用環境に応じて大きく異なり、特許文献１〜４に開示された音声認識機能を用いた電子機器では、各ユーザに最適な音声信号の周波数パターンに関する音響モデルを選択する構成ではないので、音声認識が正しく行われない場合もあった。

本発明の課題は、各ユーザに最適な音響モデルを選択し、より確実に音声認識を行うことができる電子機器を提供することである。

上記課題を解決するため、請求項１に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。

請求項２に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、を備えることを特徴とする。

請求項３に記載の発明は、請求項２に記載の発明において、
前記音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする。

請求項４に記載の発明は、請求項３に記載の発明において、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする。

請求項５に記載の発明は、請求項２〜４の何れか一項に記載の発明において、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。

請求項１に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得して音声認識を行うことができることとなって、より確実に音声認識を行うことができる。
また、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御手段によって、指定手段により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。

請求項２に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、音響モデルパターン取得手段によって、識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを音響モデルパターン記憶手段から取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができ、制御手段により、コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行うことができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに適した音響モデルパターンを取得して、音声認識を行うことができることとなって、より確実に音声認識を行うことができる。

請求項３に記載の発明によれば、請求項２に記載の発明と同様の効果が得られることは無論のこと、音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、当該識別情報に対応付けられた一の音響モデルパターンを取得し、コマンド情報抽出手段により、音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することができる。
従って、ユーザは、複数の音響モデルパターンから任意の音響モデルパターンを選択して音声認識を行うことができるので、例えば、ユーザの体調の変化により周波数パターンが変化した場合、一の音響モデルパターンでの音声認識が失敗しても、別の音響モデルパターンを選択することができるので、好適に音声認識を行うことができる。

請求項４に記載の発明によれば、請求項３に記載の発明と同様の効果が得られることは無論のこと、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができる。
従って、音声認識率に基づいて、各ユーザに最適な音響モデルパターンを選択し、より確実に音声認識を行うことができる。

請求項５に記載の発明によれば、請求項２〜４の何れか一項に記載の発明と同様の効果が得られることは無論のこと、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、指定手段により、制御内容を実行すると指定された場合、制御手段によって、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。

以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
なお、本実施の形態では、電子機器として、ディジタルテレビ受像機を例に説明する。しかし、電子機器はこれに限られることなく、例えば、ビデオやエアコン等の家電機器であっても良い。

まず、図１を参照しながら、機器全体の構成及び要部構成について説明する。
本実施形態のディジタルテレビ受像機１００は、例えば、テレビジョン放送信号（以下、放送信号という。）を受信し、受信した放送信号を、所定の出力信号に変換し、映像／音声データを出力する機器本体部１と、ユーザが音声情報を機器本体部１に無線で出力することができる音声情報出力手段としてのマイク付きリモートコントロール装置（以下、マイク付きリモコンという。）２と、を備えて構成されている。

次に、ディジタルテレビ受像機１００の要部構成について説明する。
機器本体部１は、放送信号を受信するアンテナ３と、アンテナ３により受信された放送信号から所定の放送チャンネルの放送信号を選局するチューナ４と、チューナ４から出力された放送信号の復調及び誤り訂正処理を行う復調部５と、復調部５で復調された放送信号に付加されている不正視聴防止用のスクランブル信号を解除するデスクランブル６と、デスクランブル６で解除された放送信号から各データを分離抽出することで、映像／音声データを取得するデマルチクサ７と、デマルチクサ７で取得された映像／音声データに伸張処理を行うデコーダ８と、デコーダ８で伸張された映像データにＯＳＤデータを付加するＯＳＤ（On-Screen Character Display）処理部９と、デコーダ８、ＯＳＤ処理部９で処理された映像／音声データを出力する表示手段としての受像部１０と、音声情報を取得する音声情報取得部１１と、機器本体部１全体を統括制御する制御部１２と、各部を接続する制御バス１３と、を備えて構成されている。

音声情報取得部１１は、例えば、マイクロホンが用いられ、音声をそのまま音声情報として取得する。
なお、音声情報取得部１１は、音声をそのまま音声情報として取得する場合に限らず、音声が音声信号に変換された後に、当該音声信号を音声情報として取得する設計であっても良い。

制御部１２は、例えば、図１に示すように、ＣＰＵ（Central Processing Unit）１２１と、ＲＡＭ（Random Access Memory）１２２と、記憶部１２３と、などを備えている。

ＣＰＵ１２１は、記憶部１２３に記憶された音響モデルパターンテーブル、コマンドテーブル及び各種処理プログラムに従って各種の制御動作を行う。

ＲＡＭ１２２は、ＣＰＵ１２１によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。

記憶部１２３は、機器本体部１で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、ＣＰＵ１２１によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部１２３に記憶されている。
具体的には、記憶部１２３には、例えば、図１に示すように、音響モデルパターンテーブル１２３ａ、コマンドテーブル１２３ｂ、識別情報抽出プログラム１２３ｃ、音響モデルパターン取得プログラム１２３ｄ、コマンド情報抽出プログラム１２３ｅ、制御プログラム１２３ｆ、算出プログラム１２３ｇ、表示制御プログラム１２３ｈなどが記憶されている。

音響モデルパターンテーブル１２３ａは、ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、また、後述する算出プログラム１２３ｇにより算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶したテーブルである。
具体的には、音響モデルパターンテーブル１２３ａには、例えば、図２に示すように、ユーザＩＤ−１は、音声情報「一郎」からなる識別情報を有し、かかる識別情報に対して複数の音響モデルパターンＡ、Ｂ、Ｃと、かかる音響モデルパターン毎の音声認識率が対応付けられて記憶されている。
記憶部１２３は、かかる音響モデルパターンテーブル１２３ａを記憶することで、音響モデルパターン記憶手段及び音声認識率記憶手段として機能する。

コマンドテーブル１２３ｂは、機器本体部１を制御するための音声情報からなるコマンド情報を記憶したテーブルである。
記憶部１２３は、かかるコマンドテーブル１２３ｂを記憶することで、コマンド情報記憶手段として機能する。

識別情報抽出プログラム１２３ｃは、ＣＰＵ１２１に、音声情報取得部１１により取得された音声情報に基づき音声認識を行い、識別情報を抽出する機能を実現させるプログラムである。
ここで、音声認識は、例えば、Ｊｕｌｉｕｓという音声認識ソフトウェアが用いられ、膨大な音声パターンと言語パターンの統計データを集積することにより実現される。音声認識の基本原理は、音響モデル（音素（ローマ字１文字にほぼ相当）や音節（かな１文字に相当））の周波数パターンを保持し、単語辞書を参照しながら、入力された音声の音声波形信号から単音節部分を切出した音節列信号とマッチングを行い、音声の認識を行う。
具体的には、ＣＰＵ１２１は、識別情報抽出プログラム１２３ｃを実行することにより、音声情報取得部１１により取得された音声情報の音声認識を予め設定された音響モデルパターンを用いて行い、音響モデルパターンテーブル１２３ａに記憶された識別情報の中から一致する識別情報を抽出する。
ＣＰＵ１２１は、かかる識別情報抽出プログラム１２３ｃを実行することにより、識別情報抽出手段として機能する。

音響モデルパターン取得プログラム１２３ｄは、ＣＰＵ１２１に、識別情報抽出プログラム１２３ｃの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル１２３ａから取得する機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、音響モデルパターン取得プログラム１２３ｄを実行することにより、識別情報抽出プログラム１２３ｃの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル１２３ａから取得し、また、識別情報抽出プログラム１２３ｃにより抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル１２３ａに記憶されている場合、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。例えば、図２に示すように、「一郎」からなる識別情報が抽出された場合、ＣＰＵ１２１は、最初に、音声認識率の一番高い音響モデルパターンＡを取得し、次いで、音響モデルパターンＢ、音響モデルパターンＣの順で取得する。
ＣＰＵ１２１は、かかる音響モデルパターン取得プログラム１２３ｄを実行することにより、音響モデルパターン取得手段として機能する。

コマンド情報抽出プログラム１２３ｅは、ＣＰＵ１２１に、音声情報取得部１１により取得された音声情報の音声認識を行い、音声認識結果に基づくコマンド情報を抽出する機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、コマンド情報抽出プログラム１２３ｅを実行することにより、音響モデルパターン取得プログラム１２３ｄにより取得された音響モデルパターンを用いて音声情報の音声認識を行い、コマンドテーブル１２３ｂに記憶されたコマンド情報の中から一致するコマンド情報を抽出する。
ＣＰＵ１２１は、かかるコマンド情報抽出プログラム１２３ｅを実行することにより、コマンド情報抽出手段として機能する。

制御プログラム１２３ｆは、ＣＰＵ１２１に、制御プログラム１２３ｆの実行により、音声認識結果に基づくコマンド情報により、機器本体部１の制御を行う機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、後述する表示制御プログラム１２３ｈを実行することにより、コマンド情報抽出プログラム１２３ｅの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」が受像部１０に表示され、マイク付きリモコン２により、表示された制御内容の実行が指示された場合に、制御プログラム１２３ｆを実行することにより、コマンド情報に対応する制御を行う。
ＣＰＵ１２１は、かかる制御プログラム１２３ｆを実行することにより、制御手段として機能する。

算出プログラム１２３ｇは、ＣＰＵ１２１に、音声認識結果に基づく、音声認識率を算出する機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、算出プログラム１２３ｇを実行することにより、音響モデルパターンテーブル１２３ａに記憶された、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム１２３ｅの実行による音声認識率を算出する。また、算出方法は、例えば、コマンド情報抽出プログラム１２３ｅの実行により、抽出に成功した回数をコマンド情報抽出プログラム１２３ｅの実行回数で割った値などを用いる。
ＣＰＵ１２１は、かかる算出プログラム１２３ｇを実行することにより、算出手段として機能する。

表示制御プログラム１２３ｈは、ＣＰＵ１２１に、音声認識結果に基づくコマンド情報に対応する制御内容を受像部１０に表示させる機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、図３に示すように、表示制御プログラム１２３ｈを実行することによって、コマンド情報抽出プログラム１２３ｅの実行により抽出されたコマンド情報に対応する制御内容を表示手段としての受像部１０に表示させる。
ＣＰＵ１２１は、かかる表示制御プログラム１２３ｈを実行することにより、表示制御手段として機能する。

次に、本発明の機器本体部１の動作について、本発明の実施形態であるディジタルテレビ受像機を例に図４を用いて説明する。なお、ユーザである一郎が、チャンネルアップを行いたい場合を想定して、説明する。
まず、ステップS１において、音声情報取得部１１で音声情報である「一郎」と「チャンネルアップ」を取得する。次いで、ステップＳ２において、ＣＰＵ１２１は、識別情報抽出プログラム１２３ｃを実行することにより、音声情報取得部１１で取得された音声情報「一郎」の音声認識を行い、音響モデルパターンテーブル１２３ａに記憶された識別情報「一郎」を抽出する。

次いで、ステップＳ３において、識別情報を抽出できた場合には（ステップＳ３；Ｙｅｓ）、ステップＳ４へ進む。一方、ステップＳ３において、識別情報を抽出できなかった場合（ステップＳ３；Ｎｏ）、ステップＳ１へ戻る。

次いで、ステップＳ４において、ＣＰＵ１２１は、音響モデルパターン取得プログラム１２３ｄを実行することにより、識別情報に対応する音響モデルパターンを音響モデルパターンテーブル１２３ａから取得する。かかる場合、図２に示すように、識別情報「一郎」に対して、複数の音響モデルパターンＡ、Ｂ、Ｃが対応付けられ記憶されているが、音声認識率の一番高い音響モデルパターンＡを取得する。

次いで、ステップＳ５において、ＣＰＵ１２１は、コマンド情報抽出プログラム１２３ｅを実行することにより、取得された音響モデルパターンを用いて、音声情報取得部１１で取得された音声情報「チャンネルアップ」の音声認識を行い、コマンドテーブル１２３ｂに記憶されたコマンド情報を抽出する。

次いで、ステップＳ６において、コマンド情報抽出プログラム１２３ｅの実行により、コマンド情報を抽出できた場合（ステップＳ６；Ｙｅｓ）、ステップＳ７へ進む。一方、ステップＳ６において、コマンド情報を抽出できなかった場合（ステップＳ６；Ｎｏ）、ステップＳ４へ戻り、ＣＰＵ１２１は、音響モデルパターン取得プログラム１２３ｄを実行することにより、再度、音響モデルパターンの取得を行う。このとき、識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル１２３ａに記憶されている場合、ＣＰＵ１２１は、音響モデルパターン取得プログラム１２３ｄの実行により、音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。かかる場合、音響モデルパターンＡの次に音声認識率の高い音響モデルパターンＢを取得する。

次いで、ステップＳ７において、ＣＰＵ１２１は、表示制御プログラム１２３ｈを実行することにより、コマンド情報抽出プログラム１２３ｅの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」を受像部１０に表示する。

次いで、ステップＳ８において、受像部１０に表示された制御内容を実行する場合（ステップＳ８；Ｙｅｓ）、指定手段としてのマイク付きリモコン等により、図３に示すように、「Ｙｅｓ」の表示の選択指定を行い、ステップＳ９へ進む。一方、「Ｎｏ」の表示の選択指定を行った場合（ステップＳ８；Ｎｏ）、本処理を終了する。

次いで、ステップＳ９において、ＣＰＵ１２１は、制御プログラム１２３ｆを実行することにより、コマンド情報に対応する制御を行い、本処理を終了する。

以上説明した本発明にかかるディジタルテレビ受像機１００によれば、ＣＰＵ１２１が、識別情報抽出プログラム１２３ｃを実行することによって、音声情報取得部１１により取得された音声情報の音声認識を行い、音響モデルパターンテーブル１２３ａに記憶された識別情報を抽出することができ、算出プログラム１２３ｇを実行することによって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム１２３ｅの実行による音声認識率を算出することができ、音響モデルパターン取得プログラム１２３ｄの実行によって、識別情報抽出プログラム１２３ｃの実行により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル１２３ａに記憶されている場合、音響モデルパターンテーブル１２３ａに記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出プログラム１２３ｅの実行によって、音響モデルパターン取得プログラム１２３ｄの実行により取得された音響モデルパターンを用いて、音声情報取得部１１により取得された音声情報の音声認識を行い、コマンドテーブル１２３ｂに記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得し、音声認識を行うことができる。
また、ＣＰＵ１２１が、表示制御プログラム１２３ｈを実行することによって、コマンド情報抽出プログラム１２３ｅの実行により抽出されたコマンド情報に対応する制御内容を受像部１０に表示させることができ、マイク付きリモコン２により、表示制御プログラム１２３ｈを実行するにより受像部１０に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御プログラム１２３ｆの実行によって、マイク付きリモコン２により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。

なお、本発明は、上記実施の形態に限定されることなく、本発明の趣旨を逸脱しない範囲において、種々の改良並びに設計の変更を行っても良い。
例えば、指定手段は、本発明におけるマイク付きリモコンに限らず、機器本体部に設けられた操作パネルの操作キーなどによっても指定することができる設計であっても良い。
また、音響モデルパターン取得手段は、ユーザにより、手動で任意の音響モデルパターンを取得することができる設計であっても良い。
また、音声認識率の算出は、コマンド情報抽出手段によりコマンド情報が抽出されたか否かに限らず、コマンド情報が抽出され、表示手段に表示された当該コマンド情報に対応する制御内容を指定手段により、実行指定されたか否かを算出基準に加えることができる設計であっても良い。

本発明にかかるディジタルテレビ受像機の要部構成を示すブロック図である。本発明における音響モデルパターンテーブルの１例を示す図である。本発明における表示制御手段による表示例を示す図である。本発明における機器本体部の動作処理を示すフローチャートである。

符号の説明

１００ディジタルテレビ受像機（電子機器）
１機器本体部
２マイク付きリモコン（指定手段）
１０受像部（表示手段）
１１音声情報取得部（音声情報取得手段）
１２１ＣＰＵ（識別情報抽出手段、音響モデルパターン取得手段、コマンド情報抽出手段、制御手段、算出手段、表示制御手段）
１２３ａ音響モデルパターンテーブル（音響モデルパターン記憶手段、音声認識率記憶手段）
１２３ｂコマンドテーブル（コマンド情報記憶手段）
１２３ｃ識別情報抽出プログラム（識別情報抽出手段）
１２３ｄ音響モデルパターン取得プログラム（音響モデルパターン取得手段）
１２３ｅコマンド情報抽出プログラム（コマンド情報抽出手段）
１２３ｆ制御プログラム（制御手段）
１２３ｇ算出プログラム（算出手段）
１２３ｈ表示制御プログラム（表示制御手段）

Claims

外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする電子機器。
外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
を備えることを特徴とする電子機器。
前記音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする請求項２に記載の電子機器。
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする請求項３に記載の電子機器。
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする請求項２〜４の何れか一項に記載の電子機器。