[go: up one dir, main page]

JP2007286174A - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP2007286174A
JP2007286174A JP2006110940A JP2006110940A JP2007286174A JP 2007286174 A JP2007286174 A JP 2007286174A JP 2006110940 A JP2006110940 A JP 2006110940A JP 2006110940 A JP2006110940 A JP 2006110940A JP 2007286174 A JP2007286174 A JP 2007286174A
Authority
JP
Japan
Prior art keywords
acoustic model
model pattern
information
identification information
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006110940A
Other languages
English (en)
Inventor
Mayumi Kaneko
真由美 金子
Shusuke Narita
修輔 成田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2006110940A priority Critical patent/JP2007286174A/ja
Publication of JP2007286174A publication Critical patent/JP2007286174A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】各ユーザに最適な音響モデルを選択し、より確実に音声認識を行うことができる電子機器を提供することである。
【解決手段】ディジタルテレビ受像機100において、音響モデルパターン取得手段(CPU121、音響モデルパターン取得プログラム123d)によって、識別情報抽出手段(CPU121、識別情報抽出プログラム123c)により抽出された識別情報に対応する音響モデルパターンを取得し、コマンド情報抽出手段(CPU121、コマンド情報抽出プログラム123e)によって、取得された音響モデルパターンを用いて、音声情報取得部11により取得された音声情報の音声認識を行い、コマンド情報を抽出し、制御手段により、抽出したコマンド情報に基づいて制御を行う。
【選択図】図1

Description

本発明は、音声認識機能により各種制御を行うことができる電子機器に関する。
近年、テレビやビデオ等の電子機器の多機能化・高機能化が進むに伴い、様々な機能に対応し、かつ簡易な操作が可能なものが求められ、現在では、このような操作に音声認識技術を用いた電子機器が利用されている。
音声認識技術を用いた電子機器には、例えば、留守番電話機能付ファクシミリ装置があり、通常の操作補助として音声を入力する際には、予め定められた数の単語を基に音声認識を行い、IDの照合など特定話者の音声認識を行う場合は、予め、使用するフレーズの音声データを登録しておき、音声認識を行う機器がある(特許文献1参照)。
また、機器番号及びそれに対応する発音表記を表形式で格納する音声標本−機器番号対応テーブルを備え、音声認識結果を用いて前記音声標本−機器番号対応テーブルを検索し、対応する機器番号を検出することで被制御機器の特定を行う装置がある(特許文献2参照)。
また、操作装置が、入力された音声と電子機器へのコマンドを多重化した多重化信号を生成して電子機器に送信し、電子機器が、受信した多重化信号より、音声とコマンドを分離し、分離した音声を認識し、認識した認識内容、および、分離されたコマンドに対応して、自らの動作を制御するようにした機器がある(特許文献3参照)。
また、音声認識機能を有する小型形状の携帯型リモートコントロール装置であって、音声によりコマンドを入力することにより、音声コマンドに対応するコマンドを無線で制御対象である機器に対して送信し、当該機器を制御する装置がある(特許文献4参照)。
なお、一般に、音声認識技術は、特定話者音声認識と不特定話者音声認識との2つに分けることができる。特定話者音声認識技術は、利用者がある特定の個人であるという前提に基づき、その利用者の個人の声から音響的モデルを作成して音声認識を行う技術である。このため、利用者に対してだけの精密な音響モデルを作成することができるので、高い認識率を得ることができる。一方、不特定話者音声認識技術は、利用者が不特定であるという前提に基づき、一般的な音響モデルを予め作成しておき、音声認識を行う技術である。このため、特定話者音声認識に比較して認識性能は劣るものの、誰でも使用可能な音声認識をはじめから提供できる特徴がある。
特開2001−309080号公報 特開2003−330483号公報 特開2003−250061号公報 特開2003−114694号公報
しかしながら、音響モデルは、子供・大人などの話者層、電話や自動車内などの使用環境に応じて大きく異なり、特許文献1〜4に開示された音声認識機能を用いた電子機器では、各ユーザに最適な音声信号の周波数パターンに関する音響モデルを選択する構成ではないので、音声認識が正しく行われない場合もあった。
本発明の課題は、各ユーザに最適な音響モデルを選択し、より確実に音声認識を行うことができる電子機器を提供することである。
上記課題を解決するため、請求項1に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。
請求項2に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、を備えることを特徴とする。
請求項3に記載の発明は、請求項2に記載の発明において、
前記音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする。
請求項4に記載の発明は、請求項3に記載の発明において、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする。
請求項5に記載の発明は、請求項2〜4の何れか一項に記載の発明において、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。
請求項1に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得して音声認識を行うことができることとなって、より確実に音声認識を行うことができる。
また、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御手段によって、指定手段により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
請求項2に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、音響モデルパターン取得手段によって、識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを音響モデルパターン記憶手段から取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができ、制御手段により、コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行うことができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに適した音響モデルパターンを取得して、音声認識を行うことができることとなって、より確実に音声認識を行うことができる。
請求項3に記載の発明によれば、請求項2に記載の発明と同様の効果が得られることは無論のこと、音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、当該識別情報に対応付けられた一の音響モデルパターンを取得し、コマンド情報抽出手段により、音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することができる。
従って、ユーザは、複数の音響モデルパターンから任意の音響モデルパターンを選択して音声認識を行うことができるので、例えば、ユーザの体調の変化により周波数パターンが変化した場合、一の音響モデルパターンでの音声認識が失敗しても、別の音響モデルパターンを選択することができるので、好適に音声認識を行うことができる。
請求項4に記載の発明によれば、請求項3に記載の発明と同様の効果が得られることは無論のこと、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができる。
従って、音声認識率に基づいて、各ユーザに最適な音響モデルパターンを選択し、より確実に音声認識を行うことができる。
請求項5に記載の発明によれば、請求項2〜4の何れか一項に記載の発明と同様の効果が得られることは無論のこと、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、指定手段により、制御内容を実行すると指定された場合、制御手段によって、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
なお、本実施の形態では、電子機器として、ディジタルテレビ受像機を例に説明する。しかし、電子機器はこれに限られることなく、例えば、ビデオやエアコン等の家電機器であっても良い。
まず、図1を参照しながら、機器全体の構成及び要部構成について説明する。
本実施形態のディジタルテレビ受像機100は、例えば、テレビジョン放送信号(以下、放送信号という。)を受信し、受信した放送信号を、所定の出力信号に変換し、映像/音声データを出力する機器本体部1と、ユーザが音声情報を機器本体部1に無線で出力することができる音声情報出力手段としてのマイク付きリモートコントロール装置(以下、マイク付きリモコンという。)2と、を備えて構成されている。
次に、ディジタルテレビ受像機100の要部構成について説明する。
機器本体部1は、放送信号を受信するアンテナ3と、アンテナ3により受信された放送信号から所定の放送チャンネルの放送信号を選局するチューナ4と、チューナ4から出力された放送信号の復調及び誤り訂正処理を行う復調部5と、復調部5で復調された放送信号に付加されている不正視聴防止用のスクランブル信号を解除するデスクランブル6と、デスクランブル6で解除された放送信号から各データを分離抽出することで、映像/音声データを取得するデマルチクサ7と、デマルチクサ7で取得された映像/音声データに伸張処理を行うデコーダ8と、デコーダ8で伸張された映像データにOSDデータを付加するOSD(On-Screen Character Display)処理部9と、デコーダ8、OSD処理部9で処理された映像/音声データを出力する表示手段としての受像部10と、音声情報を取得する音声情報取得部11と、機器本体部1全体を統括制御する制御部12と、各部を接続する制御バス13と、を備えて構成されている。
音声情報取得部11は、例えば、マイクロホンが用いられ、音声をそのまま音声情報として取得する。
なお、音声情報取得部11は、音声をそのまま音声情報として取得する場合に限らず、音声が音声信号に変換された後に、当該音声信号を音声情報として取得する設計であっても良い。
制御部12は、例えば、図1に示すように、CPU(Central Processing Unit)121と、RAM(Random Access Memory)122と、記憶部123と、などを備えている。
CPU121は、記憶部123に記憶された音響モデルパターンテーブル、コマンドテーブル及び各種処理プログラムに従って各種の制御動作を行う。
RAM122は、CPU121によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部123は、機器本体部1で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU121によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部123に記憶されている。
具体的には、記憶部123には、例えば、図1に示すように、音響モデルパターンテーブル123a、コマンドテーブル123b、識別情報抽出プログラム123c、音響モデルパターン取得プログラム123d、コマンド情報抽出プログラム123e、制御プログラム123f、算出プログラム123g、表示制御プログラム123hなどが記憶されている。
音響モデルパターンテーブル123aは、ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、また、後述する算出プログラム123gにより算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶したテーブルである。
具体的には、音響モデルパターンテーブル123aには、例えば、図2に示すように、ユーザID−1は、音声情報「一郎」からなる識別情報を有し、かかる識別情報に対して複数の音響モデルパターンA、B、Cと、かかる音響モデルパターン毎の音声認識率が対応付けられて記憶されている。
記憶部123は、かかる音響モデルパターンテーブル123aを記憶することで、音響モデルパターン記憶手段及び音声認識率記憶手段として機能する。
コマンドテーブル123bは、機器本体部1を制御するための音声情報からなるコマンド情報を記憶したテーブルである。
記憶部123は、かかるコマンドテーブル123bを記憶することで、コマンド情報記憶手段として機能する。
識別情報抽出プログラム123cは、CPU121に、音声情報取得部11により取得された音声情報に基づき音声認識を行い、識別情報を抽出する機能を実現させるプログラムである。
ここで、音声認識は、例えば、Juliusという音声認識ソフトウェアが用いられ、膨大な音声パターンと言語パターンの統計データを集積することにより実現される。音声認識の基本原理は、音響モデル(音素(ローマ字1文字にほぼ相当)や音節(かな1文字に相当))の周波数パターンを保持し、単語辞書を参照しながら、入力された音声の音声波形信号から単音節部分を切出した音節列信号とマッチングを行い、音声の認識を行う。
具体的には、CPU121は、識別情報抽出プログラム123cを実行することにより、音声情報取得部11により取得された音声情報の音声認識を予め設定された音響モデルパターンを用いて行い、音響モデルパターンテーブル123aに記憶された識別情報の中から一致する識別情報を抽出する。
CPU121は、かかる識別情報抽出プログラム123cを実行することにより、識別情報抽出手段として機能する。
音響モデルパターン取得プログラム123dは、CPU121に、識別情報抽出プログラム123cの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得する機能を実現させるプログラムである。
具体的には、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、識別情報抽出プログラム123cの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得し、また、識別情報抽出プログラム123cにより抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。例えば、図2に示すように、「一郎」からなる識別情報が抽出された場合、CPU121は、最初に、音声認識率の一番高い音響モデルパターンAを取得し、次いで、音響モデルパターンB、音響モデルパターンCの順で取得する。
CPU121は、かかる音響モデルパターン取得プログラム123dを実行することにより、音響モデルパターン取得手段として機能する。
コマンド情報抽出プログラム123eは、CPU121に、音声情報取得部11により取得された音声情報の音声認識を行い、音声認識結果に基づくコマンド情報を抽出する機能を実現させるプログラムである。
具体的には、CPU121は、コマンド情報抽出プログラム123eを実行することにより、音響モデルパターン取得プログラム123dにより取得された音響モデルパターンを用いて音声情報の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報の中から一致するコマンド情報を抽出する。
CPU121は、かかるコマンド情報抽出プログラム123eを実行することにより、コマンド情報抽出手段として機能する。
制御プログラム123fは、CPU121に、制御プログラム123fの実行により、音声認識結果に基づくコマンド情報により、機器本体部1の制御を行う機能を実現させるプログラムである。
具体的には、CPU121は、後述する表示制御プログラム123hを実行することにより、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」が受像部10に表示され、マイク付きリモコン2により、表示された制御内容の実行が指示された場合に、制御プログラム123fを実行することにより、コマンド情報に対応する制御を行う。
CPU121は、かかる制御プログラム123fを実行することにより、制御手段として機能する。
算出プログラム123gは、CPU121に、音声認識結果に基づく、音声認識率を算出する機能を実現させるプログラムである。
具体的には、CPU121は、算出プログラム123gを実行することにより、音響モデルパターンテーブル123aに記憶された、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム123eの実行による音声認識率を算出する。また、算出方法は、例えば、コマンド情報抽出プログラム123eの実行により、抽出に成功した回数をコマンド情報抽出プログラム123eの実行回数で割った値などを用いる。
CPU121は、かかる算出プログラム123gを実行することにより、算出手段として機能する。
表示制御プログラム123hは、CPU121に、音声認識結果に基づくコマンド情報に対応する制御内容を受像部10に表示させる機能を実現させるプログラムである。
具体的には、CPU121は、図3に示すように、表示制御プログラム123hを実行することによって、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容を表示手段としての受像部10に表示させる。
CPU121は、かかる表示制御プログラム123hを実行することにより、表示制御手段として機能する。
次に、本発明の機器本体部1の動作について、本発明の実施形態であるディジタルテレビ受像機を例に図4を用いて説明する。なお、ユーザである一郎が、チャンネルアップを行いたい場合を想定して、説明する。
まず、ステップS1において、音声情報取得部11で音声情報である「一郎」と「チャンネルアップ」を取得する。次いで、ステップS2において、CPU121は、識別情報抽出プログラム123cを実行することにより、音声情報取得部11で取得された音声情報「一郎」の音声認識を行い、音響モデルパターンテーブル123aに記憶された識別情報「一郎」を抽出する。
次いで、ステップS3において、識別情報を抽出できた場合には(ステップS3;Yes)、ステップS4へ進む。一方、ステップS3において、識別情報を抽出できなかった場合(ステップS3;No)、ステップS1へ戻る。
次いで、ステップS4において、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得する。かかる場合、図2に示すように、識別情報「一郎」に対して、複数の音響モデルパターンA、B、Cが対応付けられ記憶されているが、音声認識率の一番高い音響モデルパターンAを取得する。
次いで、ステップS5において、CPU121は、コマンド情報抽出プログラム123eを実行することにより、取得された音響モデルパターンを用いて、音声情報取得部11で取得された音声情報「チャンネルアップ」の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報を抽出する。
次いで、ステップS6において、コマンド情報抽出プログラム123eの実行により、コマンド情報を抽出できた場合(ステップS6;Yes)、ステップS7へ進む。一方、ステップS6において、コマンド情報を抽出できなかった場合(ステップS6;No)、ステップS4へ戻り、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、再度、音響モデルパターンの取得を行う。このとき、識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、CPU121は、音響モデルパターン取得プログラム123dの実行により、音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。かかる場合、音響モデルパターンAの次に音声認識率の高い音響モデルパターンBを取得する。
次いで、ステップS7において、CPU121は、表示制御プログラム123hを実行することにより、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」を受像部10に表示する。
次いで、ステップS8において、受像部10に表示された制御内容を実行する場合(ステップS8;Yes)、指定手段としてのマイク付きリモコン等により、図3に示すように、「Yes」の表示の選択指定を行い、ステップS9へ進む。一方、「No」の表示の選択指定を行った場合(ステップS8;No)、本処理を終了する。
次いで、ステップS9において、CPU121は、制御プログラム123fを実行することにより、コマンド情報に対応する制御を行い、本処理を終了する。
以上説明した本発明にかかるディジタルテレビ受像機100によれば、CPU121が、識別情報抽出プログラム123cを実行することによって、音声情報取得部11により取得された音声情報の音声認識を行い、音響モデルパターンテーブル123aに記憶された識別情報を抽出することができ、算出プログラム123gを実行することによって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム123eの実行による音声認識率を算出することができ、音響モデルパターン取得プログラム123dの実行によって、識別情報抽出プログラム123cの実行により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、音響モデルパターンテーブル123aに記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出プログラム123eの実行によって、音響モデルパターン取得プログラム123dの実行により取得された音響モデルパターンを用いて、音声情報取得部11により取得された音声情報の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得し、音声認識を行うことができる。
また、CPU121が、表示制御プログラム123hを実行することによって、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容を受像部10に表示させることができ、マイク付きリモコン2により、表示制御プログラム123hを実行するにより受像部10に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御プログラム123fの実行によって、マイク付きリモコン2により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
なお、本発明は、上記実施の形態に限定されることなく、本発明の趣旨を逸脱しない範囲において、種々の改良並びに設計の変更を行っても良い。
例えば、指定手段は、本発明におけるマイク付きリモコンに限らず、機器本体部に設けられた操作パネルの操作キーなどによっても指定することができる設計であっても良い。
また、音響モデルパターン取得手段は、ユーザにより、手動で任意の音響モデルパターンを取得することができる設計であっても良い。
また、音声認識率の算出は、コマンド情報抽出手段によりコマンド情報が抽出されたか否かに限らず、コマンド情報が抽出され、表示手段に表示された当該コマンド情報に対応する制御内容を指定手段により、実行指定されたか否かを算出基準に加えることができる設計であっても良い。
本発明にかかるディジタルテレビ受像機の要部構成を示すブロック図である。 本発明における音響モデルパターンテーブルの1例を示す図である。 本発明における表示制御手段による表示例を示す図である。 本発明における機器本体部の動作処理を示すフローチャートである。
符号の説明
100 ディジタルテレビ受像機(電子機器)
1 機器本体部
2 マイク付きリモコン(指定手段)
10 受像部(表示手段)
11 音声情報取得部(音声情報取得手段)
121 CPU(識別情報抽出手段、音響モデルパターン取得手段、コマンド情報抽出手段、制御手段、算出手段、表示制御手段)
123a 音響モデルパターンテーブル(音響モデルパターン記憶手段、音声認識率記憶手段)
123b コマンドテーブル(コマンド情報記憶手段)
123c 識別情報抽出プログラム(識別情報抽出手段)
123d 音響モデルパターン取得プログラム(音響モデルパターン取得手段)
123e コマンド情報抽出プログラム(コマンド情報抽出手段)
123f 制御プログラム(制御手段)
123g 算出プログラム(算出手段)
123h 表示制御プログラム(表示制御手段)

Claims (5)

  1. 外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
    ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
    当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
    音声情報を取得する音声情報取得手段と、
    前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
    前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
    前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
    前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
    識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
    前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
    前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
    前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
    前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
    前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする電子機器。
  2. 外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
    ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
    当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
    音声情報を取得する音声情報取得手段と、
    前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
    前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
    前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
    前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
    を備えることを特徴とする電子機器。
  3. 前記音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、
    前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする請求項2に記載の電子機器。
  4. 識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
    前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
    前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする請求項3に記載の電子機器。
  5. 前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
    前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
    前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする請求項2〜4の何れか一項に記載の電子機器。
JP2006110940A 2006-04-13 2006-04-13 電子機器 Pending JP2007286174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006110940A JP2007286174A (ja) 2006-04-13 2006-04-13 電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006110940A JP2007286174A (ja) 2006-04-13 2006-04-13 電子機器

Publications (1)

Publication Number Publication Date
JP2007286174A true JP2007286174A (ja) 2007-11-01

Family

ID=38758025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006110940A Pending JP2007286174A (ja) 2006-04-13 2006-04-13 電子機器

Country Status (1)

Country Link
JP (1) JP2007286174A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018043137A1 (ja) * 2016-08-31 2018-03-08 ソニー株式会社 情報処理装置及び情報処理方法
US10403267B2 (en) 2015-01-16 2019-09-03 Samsung Electronics Co., Ltd Method and device for performing voice recognition using grammar model
US10607597B2 (en) 2017-09-18 2020-03-31 Samsung Electronics Co., Ltd. Speech signal recognition system and method
WO2022003822A1 (ja) 2020-06-30 2022-01-06 日産自動車株式会社 情報処理装置及び情報処理方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63116199A (ja) * 1986-11-05 1988-05-20 富士通株式会社 音声入力装置の音声辞書格納方式
JPH0713591A (ja) * 1993-06-22 1995-01-17 Hitachi Ltd 音声認識装置および音声認識方法
JPH0844387A (ja) * 1994-08-04 1996-02-16 Aqueous Res:Kk 音声認識装置
JPH08123461A (ja) * 1994-10-20 1996-05-17 Hitachi Ltd 個人情報カードを用いた音声インタフェースシステム
JP2000089781A (ja) * 1998-09-08 2000-03-31 Seiko Epson Corp 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP2000112492A (ja) * 1998-10-02 2000-04-21 Canon Inc 音声認識方法及び装置と通信装置及びその制御方法
JP2002108386A (ja) * 2000-09-29 2002-04-10 Matsushita Electric Ind Co Ltd 音声認識方法および装置と車載ナビゲーション装置
JP2005070092A (ja) * 2003-08-22 2005-03-17 Canon Inc ネットワークシステム、データ処理装置、方法、及びコンピュータ読み取り可能な記憶媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63116199A (ja) * 1986-11-05 1988-05-20 富士通株式会社 音声入力装置の音声辞書格納方式
JPH0713591A (ja) * 1993-06-22 1995-01-17 Hitachi Ltd 音声認識装置および音声認識方法
JPH0844387A (ja) * 1994-08-04 1996-02-16 Aqueous Res:Kk 音声認識装置
JPH08123461A (ja) * 1994-10-20 1996-05-17 Hitachi Ltd 個人情報カードを用いた音声インタフェースシステム
JP2000089781A (ja) * 1998-09-08 2000-03-31 Seiko Epson Corp 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP2000112492A (ja) * 1998-10-02 2000-04-21 Canon Inc 音声認識方法及び装置と通信装置及びその制御方法
JP2002108386A (ja) * 2000-09-29 2002-04-10 Matsushita Electric Ind Co Ltd 音声認識方法および装置と車載ナビゲーション装置
JP2005070092A (ja) * 2003-08-22 2005-03-17 Canon Inc ネットワークシステム、データ処理装置、方法、及びコンピュータ読み取り可能な記憶媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10403267B2 (en) 2015-01-16 2019-09-03 Samsung Electronics Co., Ltd Method and device for performing voice recognition using grammar model
US10706838B2 (en) 2015-01-16 2020-07-07 Samsung Electronics Co., Ltd. Method and device for performing voice recognition using grammar model
US10964310B2 (en) 2015-01-16 2021-03-30 Samsung Electronics Co., Ltd. Method and device for performing voice recognition using grammar model
USRE49762E1 (en) 2015-01-16 2023-12-19 Samsung Electronics Co., Ltd. Method and device for performing voice recognition using grammar model
WO2018043137A1 (ja) * 2016-08-31 2018-03-08 ソニー株式会社 情報処理装置及び情報処理方法
CN109643545A (zh) * 2016-08-31 2019-04-16 索尼公司 信息处理设备和信息处理方法
US10607597B2 (en) 2017-09-18 2020-03-31 Samsung Electronics Co., Ltd. Speech signal recognition system and method
WO2022003822A1 (ja) 2020-06-30 2022-01-06 日産自動車株式会社 情報処理装置及び情報処理方法
JP7589789B2 (ja) 2020-06-30 2024-11-26 日産自動車株式会社 情報処理装置及び情報処理方法
US12283268B2 (en) 2020-06-30 2025-04-22 Nissan Motor Co., Ltd. Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
JP4887911B2 (ja) 電子機器
JP3844431B2 (ja) 発話認識に基づいたキャプションシステム
KR102246900B1 (ko) 전자 장치 및 이의 음성 인식 방법
US8706502B2 (en) Electronic equipment and television receiver utilizing multimodal multifunction voice commands
CN102866824B (zh) 执行链接的显示设备和方法及其识别语音的方法
JPWO2014083669A1 (ja) 映像表示装置、及びその設定変更方法、設定変更プログラム
EP2557565A1 (en) Voice recognition method and apparatus
JP2007286174A (ja) 電子機器
JP2007286356A (ja) 電子機器
JP2007010971A (ja) 音声認識方法及び音声認識装置
JP2008003474A (ja) 電子機器
US20160277698A1 (en) Method for vocally controlling a television and television thereof
JP5002283B2 (ja) 情報処理装置および情報処理方法
JP2007323296A (ja) 電子機器
EP3010016B1 (en) Input information support apparatus, method for supporting input information, and input information support program
JP2009130849A (ja) シーン認識装置及び映像処理装置
JP4807145B2 (ja) 電子機器
JP4670716B2 (ja) 音声認識機能付き電子機器
JP4679463B2 (ja) 静止画像表示システム
JP6112239B2 (ja) 入力情報支援装置、入力情報支援方法および入力情報支援プログラム
JP2005004032A (ja) 音声認識装置及び音声認識方法
CN103297579A (zh) 语音辅助键区输入
EP4425936A1 (en) System comprising tv and remote control, and control method therefor
JP2008035226A (ja) 静止画像表示切替システム
JP2016021065A (ja) 映像表示装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110301