JP2002073081A - 音声認識方法と電子装置 - Google Patents
音声認識方法と電子装置Info
- Publication number
- JP2002073081A JP2002073081A JP2000256653A JP2000256653A JP2002073081A JP 2002073081 A JP2002073081 A JP 2002073081A JP 2000256653 A JP2000256653 A JP 2000256653A JP 2000256653 A JP2000256653 A JP 2000256653A JP 2002073081 A JP2002073081 A JP 2002073081A
- Authority
- JP
- Japan
- Prior art keywords
- input
- alphabet
- recognition method
- audio signal
- languages
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 9
- 235000014121 butter Nutrition 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009291 secondary effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Telephone Function (AREA)
Abstract
(57)【要約】
【課題】 簡単な構成で英単語の識別率の大幅な改善を
図った英語音声認識方法と音声認識技術を用いて使い勝
手の改善を図った電子装置を提供する。 【解決手段】 英語音声認識方法において、英単語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記英語のアルファベットの字母単位で行う。そ
の音声認識方法を電子装置に搭載する。
図った英語音声認識方法と音声認識技術を用いて使い勝
手の改善を図った電子装置を提供する。 【解決手段】 英語音声認識方法において、英単語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記英語のアルファベットの字母単位で行う。そ
の音声認識方法を電子装置に搭載する。
Description
【0001】
【発明の属する技術分野】この発明は、音声認識方法と
電子装置に関し、特に、音声入力を行うようにした携帯
電話機等の電子装置に利用して有効な技術に関するもの
である。
電子装置に関し、特に、音声入力を行うようにした携帯
電話機等の電子装置に利用して有効な技術に関するもの
である。
【0002】
【従来の技術】音声認識技術は人が話す言葉や文章をコ
ンピュータに直接認識させる技術であり、現在入力手段
として用いられているキーボード入力、ペン入力などに
替わる簡便な入力手段として注目されている。音声認識
に関する文献の例として、Y.Obuchi, A.Koizumi, Y.Kit
ahara, J.Matsuda, and T.Tsukada, Proc. EUROSPEECH'
99, pp.2023-2026, 1999があり、口述ソフトウェアの例
として、 ViaVoice(IBM社)、 NaturallySpeaking
(Dragon 社) 、音声認識ソフトウェアの例としてAS
R1600(L&H社)がある。上記IBM社の“ViaV
oice" やDragon 社の“Naturally Speaking" は主とし
てWintel PC向けのいわば重装備の口述ソフトウェア
である。
ンピュータに直接認識させる技術であり、現在入力手段
として用いられているキーボード入力、ペン入力などに
替わる簡便な入力手段として注目されている。音声認識
に関する文献の例として、Y.Obuchi, A.Koizumi, Y.Kit
ahara, J.Matsuda, and T.Tsukada, Proc. EUROSPEECH'
99, pp.2023-2026, 1999があり、口述ソフトウェアの例
として、 ViaVoice(IBM社)、 NaturallySpeaking
(Dragon 社) 、音声認識ソフトウェアの例としてAS
R1600(L&H社)がある。上記IBM社の“ViaV
oice" やDragon 社の“Naturally Speaking" は主とし
てWintel PC向けのいわば重装備の口述ソフトウェア
である。
【0003】
【発明が解決しようとする課題】携帯電話機等のデジタ
ル電子機器では、その小型化のためにパーソナルコンピ
ータのような多数のキーを持つキーボードを搭載するこ
とが難しいし、仮に多数のキーを実装できたとしても1
つの大きさが小さく、かつ密集して配置されることなる
ために使い勝手の悪いものとなり現実的でない。そこ
で、入力手段として注目されている上記音声認識技術を
用いることが考えられるが、上記の口述ソフトウェアは
膨大な音声データを駆使することによりその認識率を高
めたもので、コンテクスト(文脈)などの利用により文
章入力についてはかなり高度の性能を有するものとなっ
ているが、反面では大容量のメモリと高性能のCPUを
必要とする。したがって、このような口述ソフトウェア
を携帯電話機等のような小型で低消費電力であることが
必要なデジタル電子機器に搭載することもやはり現実的
ではない。
ル電子機器では、その小型化のためにパーソナルコンピ
ータのような多数のキーを持つキーボードを搭載するこ
とが難しいし、仮に多数のキーを実装できたとしても1
つの大きさが小さく、かつ密集して配置されることなる
ために使い勝手の悪いものとなり現実的でない。そこ
で、入力手段として注目されている上記音声認識技術を
用いることが考えられるが、上記の口述ソフトウェアは
膨大な音声データを駆使することによりその認識率を高
めたもので、コンテクスト(文脈)などの利用により文
章入力についてはかなり高度の性能を有するものとなっ
ているが、反面では大容量のメモリと高性能のCPUを
必要とする。したがって、このような口述ソフトウェア
を携帯電話機等のような小型で低消費電力であることが
必要なデジタル電子機器に搭載することもやはり現実的
ではない。
【0004】この発明の目的は、簡単な構成で英単語の
識別率の大幅な改善を図った音声認識方法を提供するこ
とある。この発明の他の目的は、音声認識技術を用いて
使い勝手の改善を図った電子装置を提供することある。
この発明の前記ならびにそのほかの目的と新規な特徴
は、本明細書の記述および添付図面から明らかになるで
あろう。
識別率の大幅な改善を図った音声認識方法を提供するこ
とある。この発明の他の目的は、音声認識技術を用いて
使い勝手の改善を図った電子装置を提供することある。
この発明の前記ならびにそのほかの目的と新規な特徴
は、本明細書の記述および添付図面から明らかになるで
あろう。
【0005】
【課題を解決するための手段】本願において開示される
発明のうち代表的なものの概要を簡単に説明すれば、下
記の通りである。音声認識方法において、特定言語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記アルファベットの字母単位の組み合わせで行
う。
発明のうち代表的なものの概要を簡単に説明すれば、下
記の通りである。音声認識方法において、特定言語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記アルファベットの字母単位の組み合わせで行
う。
【0006】本願において開示される発明のうち他の代
表的なものの概要を簡単に説明すれば、下記の通りであ
る。入力部で音声信号を取り込んでデジタル化し、信号
分析部で入力された音声信号の特徴抽出を行なって予め
用意された音響モデルと照合して字母判別を行う電子装
置において、特定言語の入力をそれを構成するアルファ
ベットに置き換えて音声入力するとともに、かかるアル
ファベットを複数言語の字母の発声の組み合わせに置き
換えて入力するとともに、上記音声認識部での音声認識
では上記アルファベットの字母単位の組み合わせで行
う。
表的なものの概要を簡単に説明すれば、下記の通りであ
る。入力部で音声信号を取り込んでデジタル化し、信号
分析部で入力された音声信号の特徴抽出を行なって予め
用意された音響モデルと照合して字母判別を行う電子装
置において、特定言語の入力をそれを構成するアルファ
ベットに置き換えて音声入力するとともに、かかるアル
ファベットを複数言語の字母の発声の組み合わせに置き
換えて入力するとともに、上記音声認識部での音声認識
では上記アルファベットの字母単位の組み合わせで行
う。
【0007】
【発明の実施の形態】図1には、この発明に係る音声認
識方法を説明するための一実施例のブロック図が示され
ている。この実施例の英語音声認識の方法は、図1の各
ブロックでの信号処理に沿って行われる。発声音はまず
音声入力部においてディジタル信号化される。この実施
例では、簡単な構成での高い音声識別率を実現するため
に、音声入力を特定言語の単語等ではなく、そのスペル
に対応したアルファベットの字母の単位で行うようにす
ることに1つの特徴としている。
識方法を説明するための一実施例のブロック図が示され
ている。この実施例の英語音声認識の方法は、図1の各
ブロックでの信号処理に沿って行われる。発声音はまず
音声入力部においてディジタル信号化される。この実施
例では、簡単な構成での高い音声識別率を実現するため
に、音声入力を特定言語の単語等ではなく、そのスペル
に対応したアルファベットの字母の単位で行うようにす
ることに1つの特徴としている。
【0008】ここで、「字母」とは、国語辞典によれ
ば、「かな」、「アルファベット」、「梵字」等のよう
に発音を示すつづり字のひとつひとつのことをいい、英
語では「phoneme 」(フォニーム)に相当する。このフ
ォニーム(phoneme )は、音素のことをいい、ある言語
の音声学上の最小単位を意味するものである。
ば、「かな」、「アルファベット」、「梵字」等のよう
に発音を示すつづり字のひとつひとつのことをいい、英
語では「phoneme 」(フォニーム)に相当する。このフ
ォニーム(phoneme )は、音素のことをいい、ある言語
の音声学上の最小単位を意味するものである。
【0009】上記のような字母単位でのスペル音声入力
には、字母毎に一定の無音期間を挿入するか、あるいは
字母の区切りを意味するキー入力信号を挿入すること等
により行われる。使い勝手を考慮すれば、字母毎に無音
期間を挿入することが有益であると考えられが、より確
実な字母の区切りを行うなら、キー信号を用いることが
有益である。
には、字母毎に一定の無音期間を挿入するか、あるいは
字母の区切りを意味するキー入力信号を挿入すること等
により行われる。使い勝手を考慮すれば、字母毎に無音
期間を挿入することが有益であると考えられが、より確
実な字母の区切りを行うなら、キー信号を用いることが
有益である。
【0010】上記音声入力部から字母単位で入力された
音声信号は、音声分析部に送られ、そこで特徴抽出処理
が行われる。具体的には短時間周波数分析である。分析
結果は照合部において予め用意された音響モデルと照合
され、判定処理を行う。最も高いスコアを得たものが認
識結果として表示される。
音声信号は、音声分析部に送られ、そこで特徴抽出処理
が行われる。具体的には短時間周波数分析である。分析
結果は照合部において予め用意された音響モデルと照合
され、判定処理を行う。最も高いスコアを得たものが認
識結果として表示される。
【0011】照合部において用いられる音響モデルは、
一般的にはHMMと単語辞書とコンテキスト辞書を連結
したものである。ここで、HMMとは、隠れマルコフモ
デル(Hidden Markov Model)と呼ばれるもので認識の基
となる参照モデルである。このHMMに単語辞書や文脈
データなどを組込んだコンテキスト辞書を組み合わせた
ものが音響モデルとなる。
一般的にはHMMと単語辞書とコンテキスト辞書を連結
したものである。ここで、HMMとは、隠れマルコフモ
デル(Hidden Markov Model)と呼ばれるもので認識の基
となる参照モデルである。このHMMに単語辞書や文脈
データなどを組込んだコンテキスト辞書を組み合わせた
ものが音響モデルとなる。
【0012】上記音声認識の基本となるHMMは比較的
軽いソフトウェアであるが、従来のように口述に対応し
た特定言語の音声識別を行うようにするには、その言語
の単語辞書やコンテキスト辞書を設けることが必須とな
り、そのアプリケーションによっては重くなりやすい。
長文読み上げを実時間で認識することが求められる口述
ソフトファアなどでは、単語辞書は無論のこと文脈や文
例などのデータを大量に設けることが必要になるため、
データを高速で処理する高性能のCPUおよび大容量の
メモリが必要になる。
軽いソフトウェアであるが、従来のように口述に対応し
た特定言語の音声識別を行うようにするには、その言語
の単語辞書やコンテキスト辞書を設けることが必須とな
り、そのアプリケーションによっては重くなりやすい。
長文読み上げを実時間で認識することが求められる口述
ソフトファアなどでは、単語辞書は無論のこと文脈や文
例などのデータを大量に設けることが必要になるため、
データを高速で処理する高性能のCPUおよび大容量の
メモリが必要になる。
【0013】携帯型電子装置においては長時間動作を可
能にするため、部品点数を減らし消費電力を押さえる必
要がある。メモリの容量はできるだけ少なくし、CPU
のパワーも制限される。すなわち辞書を始めとするデー
タ量はなるべく軽いものが求められる。そこで、この発
明に係る英語音声認識方法では、英単語を字母単位で入
力し、それを字母単位で音声識別を行うようにすること
により、基本的には同図で点線で示したように単語辞書
やコンテスト辞書を大幅に簡略化するものである。
能にするため、部品点数を減らし消費電力を押さえる必
要がある。メモリの容量はできるだけ少なくし、CPU
のパワーも制限される。すなわち辞書を始めとするデー
タ量はなるべく軽いものが求められる。そこで、この発
明に係る英語音声認識方法では、英単語を字母単位で入
力し、それを字母単位で音声識別を行うようにすること
により、基本的には同図で点線で示したように単語辞書
やコンテスト辞書を大幅に簡略化するものである。
【0014】この実施例では、英語の音声による入力能
率を極限まで高めるためにスペル発声による音声入力が
採用される。例えば“butter" は“bi: ju: ti: ti: i:
a:r" と発声する。これは単に“b*t*r"(ハ゛ター) と発声
するよりも情報量が多いためにその認識率は格段に改善
される。発声するのはアルファベットの26文字だけな
ので、あらゆる単語の発音記号とそれに付随した音声デ
ータを駆使する重装備のソフトウェアを必要とするもの
に比較して、はるかに軽量のソフトウェアであらゆる単
語を入力することができかつ正確に認識される。
率を極限まで高めるためにスペル発声による音声入力が
採用される。例えば“butter" は“bi: ju: ti: ti: i:
a:r" と発声する。これは単に“b*t*r"(ハ゛ター) と発声
するよりも情報量が多いためにその認識率は格段に改善
される。発声するのはアルファベットの26文字だけな
ので、あらゆる単語の発音記号とそれに付随した音声デ
ータを駆使する重装備のソフトウェアを必要とするもの
に比較して、はるかに軽量のソフトウェアであらゆる単
語を入力することができかつ正確に認識される。
【0015】単語の入力が正確にできれば文章の入力も
同様に入力できる。これはいわばワードプロセッサの音
声版とみなすことができる。英語のワードプロセッサが
行っていることはまさにこのことであって“butter" を
入力するにあたっては“b"“u"“t"“t"“e"“r"とキー
ボードのキーを叩くのである。
同様に入力できる。これはいわばワードプロセッサの音
声版とみなすことができる。英語のワードプロセッサが
行っていることはまさにこのことであって“butter" を
入力するにあたっては“b"“u"“t"“t"“e"“r"とキー
ボードのキーを叩くのである。
【0016】本発明のもうひとつの特徴は、上記に加え
てギリシャ語のアルファベットを併用することである。
先の“butter" の例でいうと“b"、“u"、“t"、“e"、
“r"等の代わりに、β(beita:ヘ゛ータ)、υ(ju:psilan:イフ
゜シロン) 、τ(tau:タウ)、ε(eps*lan:エフ゜シロン) 、ρ(rou:ロ
ー)等を併用することである。“butter" を“bi: ju: t
i: ti: i: a:r" と発声したときその出力が“gutter"
となったとする。つまり、“b"と“g"が混線したわけで
ある。このとき続けて“β" と発声すれば出力は自動的
に正しい“butter" となる。このような混線が予め予想
されるときには最初から“beita ju: ti: ti: i: a:r"
と発声することで混線をなくすることもできる。β(b)
だけでなく、δ(d) 、γ(g) 、π(p) 、τ(t) 等も利用
する。この他にもα(a) 、κ(k) 、ν(n) 、μ(m) 、ω
(o) 、ρ(r) 、σ(s) 等も適宜利用することが可能であ
る。
てギリシャ語のアルファベットを併用することである。
先の“butter" の例でいうと“b"、“u"、“t"、“e"、
“r"等の代わりに、β(beita:ヘ゛ータ)、υ(ju:psilan:イフ
゜シロン) 、τ(tau:タウ)、ε(eps*lan:エフ゜シロン) 、ρ(rou:ロ
ー)等を併用することである。“butter" を“bi: ju: t
i: ti: i: a:r" と発声したときその出力が“gutter"
となったとする。つまり、“b"と“g"が混線したわけで
ある。このとき続けて“β" と発声すれば出力は自動的
に正しい“butter" となる。このような混線が予め予想
されるときには最初から“beita ju: ti: ti: i: a:r"
と発声することで混線をなくすることもできる。β(b)
だけでなく、δ(d) 、γ(g) 、π(p) 、τ(t) 等も利用
する。この他にもα(a) 、κ(k) 、ν(n) 、μ(m) 、ω
(o) 、ρ(r) 、σ(s) 等も適宜利用することが可能であ
る。
【0017】上記のような認識方法を採ることにより、
英語などの単語認識率を極限にまで高めることができ
る。すなわちスペリングによる入力においては認識すべ
き音節が基本的にはアルファベットに限定されるため認
識率が高まる。さらに、単語に該当しないアルファベッ
トの組み合わせが除外されることも認識率を高めるのに
効果がある。例えば、“butter" を“bi: ju: ti: ti:
i: a:r" と発声したとき、最初の“b"を通常混同しやす
い“d"と間違えることはない。なぜなら“dutter" とい
う単語がないからである。
英語などの単語認識率を極限にまで高めることができ
る。すなわちスペリングによる入力においては認識すべ
き音節が基本的にはアルファベットに限定されるため認
識率が高まる。さらに、単語に該当しないアルファベッ
トの組み合わせが除外されることも認識率を高めるのに
効果がある。例えば、“butter" を“bi: ju: ti: ti:
i: a:r" と発声したとき、最初の“b"を通常混同しやす
い“d"と間違えることはない。なぜなら“dutter" とい
う単語がないからである。
【0018】スペリング入力はそれだけでも効果がある
が、さらにこれを効果的にするためにギリシャ語のアル
ファベットを併用するものである。これはアルファベッ
ト間の違いをさらに高めるのに効果的である。英語を例
にとればいわゆる「e問題」を避けることができる。す
なわち、“b"、“d"、“e"、“g"、“p"、“t"等のまぎ
らわしさを“β" 、“δ" 、“ε" 、“γ" 、“π" 、
“τ" 等の併用により避けることができる。英語とギリ
シャ語のアルファベットの中からお互いに距離の離れた
すなわち類似性の少ないものを選ぶことができるからで
ある。ギリシャ語のアルファベットは英語ほどには知ら
れていないが、それでも比較的なじみがあり記憶しやす
い。
が、さらにこれを効果的にするためにギリシャ語のアル
ファベットを併用するものである。これはアルファベッ
ト間の違いをさらに高めるのに効果的である。英語を例
にとればいわゆる「e問題」を避けることができる。す
なわち、“b"、“d"、“e"、“g"、“p"、“t"等のまぎ
らわしさを“β" 、“δ" 、“ε" 、“γ" 、“π" 、
“τ" 等の併用により避けることができる。英語とギリ
シャ語のアルファベットの中からお互いに距離の離れた
すなわち類似性の少ないものを選ぶことができるからで
ある。ギリシャ語のアルファベットは英語ほどには知ら
れていないが、それでも比較的なじみがあり記憶しやす
い。
【0019】なお、本発明は英語に限らず、仏語、独
語、ロシア語等の欧米系言語に適用可能であるという普
遍性を持つ。 すなわちたとえば仏語とギリシャ語のアル
ファベットを組み合わせて使うことにより、仏語の単語
認識率を究極まで高めることができる。
語、ロシア語等の欧米系言語に適用可能であるという普
遍性を持つ。 すなわちたとえば仏語とギリシャ語のアル
ファベットを組み合わせて使うことにより、仏語の単語
認識率を究極まで高めることができる。
【0020】本発明に係る音声認識方法に対応したソフ
トウェア等を携帯型電子装置に搭載した場合、単語の認
識率が改善されることによる音声入力の能率向上効果が
大きいことは無論であるが、それ以上に大きいのは必ず
入力できるという安心感である。これは製品を使用する
立場からすると非常に大きなことで、何度発声しても正
しい入力ができないのでは使ってもらえない。このこと
は本発明の適用製品が何であっても言えることである。
トウェア等を携帯型電子装置に搭載した場合、単語の認
識率が改善されることによる音声入力の能率向上効果が
大きいことは無論であるが、それ以上に大きいのは必ず
入力できるという安心感である。これは製品を使用する
立場からすると非常に大きなことで、何度発声しても正
しい入力ができないのでは使ってもらえない。このこと
は本発明の適用製品が何であっても言えることである。
【0021】本発明に関わる音声認識方法では、前記の
ようなスペリング入力にいくつかのコマンド、例えば
“Capital letter" (大文字)、“hyphen" (ハイフ
ン)、“comma"(コンマ)、“period" (ピリオド)、
“colon"(コロン)、“space"(スペース)、“new pa
ragraph"(改行)等を付加するようにしてもよい。この
ようなコマンドを設けることにより、文章入力も容易に
できる訳でありその効果は極めて大きい。更に従来の手
段では入力すべき単語のデータを予め入力する必要があ
り、その認識率は単語の数が1000語、10000語
と増えるにしたがって顕著に減少していった。本発明を
用いれば単語数が増大しても認識率は変化せず必ず入力
できる。
ようなスペリング入力にいくつかのコマンド、例えば
“Capital letter" (大文字)、“hyphen" (ハイフ
ン)、“comma"(コンマ)、“period" (ピリオド)、
“colon"(コロン)、“space"(スペース)、“new pa
ragraph"(改行)等を付加するようにしてもよい。この
ようなコマンドを設けることにより、文章入力も容易に
できる訳でありその効果は極めて大きい。更に従来の手
段では入力すべき単語のデータを予め入力する必要があ
り、その認識率は単語の数が1000語、10000語
と増えるにしたがって顕著に減少していった。本発明を
用いれば単語数が増大しても認識率は変化せず必ず入力
できる。
【0022】この実施例の音声認識方法では、基本的に
は英語やギャシャ語のアルファベット等のように少ない
数の音声識別を基本としているので、音響モデルのデー
タ量を極力少なくできる上に、かかるアルファベットの
字母結果を組み合わせることで、結果的にあらゆる種類
の単語や文章も入力することができる。このように音声
認識でのデータ量を少なくすることができるので、それ
を処理する中央処理装置CPUも低消費電力のRISC
(Reduced instruction set computer)タイプのものを用
いることができ、しかもメモリ容量も少なくてよい。こ
の結果、この発明に係る音声認識方法は、携帯用電子装
置に最適な入力方法である。使い勝手を良くするため
に、特定の制御信号や動作命令を音声で行うようにした
場合でも、単語辞書やコンテキスト辞書は小規模で済
む。
は英語やギャシャ語のアルファベット等のように少ない
数の音声識別を基本としているので、音響モデルのデー
タ量を極力少なくできる上に、かかるアルファベットの
字母結果を組み合わせることで、結果的にあらゆる種類
の単語や文章も入力することができる。このように音声
認識でのデータ量を少なくすることができるので、それ
を処理する中央処理装置CPUも低消費電力のRISC
(Reduced instruction set computer)タイプのものを用
いることができ、しかもメモリ容量も少なくてよい。こ
の結果、この発明に係る音声認識方法は、携帯用電子装
置に最適な入力方法である。使い勝手を良くするため
に、特定の制御信号や動作命令を音声で行うようにした
場合でも、単語辞書やコンテキスト辞書は小規模で済
む。
【0023】図2には、この発明を携帯型通訳機に適用
した場合の一実施例の外観図が示されている。この実施
例の携帯型通訳機は、英語−日本語通訳に向けられてい
る。この実施例の携帯型通訳機の使用方法は次の通りで
ある。発声釦1を押してマイク2に向かって発声する
と、認識結果が表示装置3に表示される。正しい結果が
得られたらOK釦4を押して文例検索に移行する。スク
ロール釦5により検索し所望の文が見つかるとOK釦4
を押して訳文表示をする。さらに発声釦1を押すと訳文
の音声がスピーカ6を通して流れる。
した場合の一実施例の外観図が示されている。この実施
例の携帯型通訳機は、英語−日本語通訳に向けられてい
る。この実施例の携帯型通訳機の使用方法は次の通りで
ある。発声釦1を押してマイク2に向かって発声する
と、認識結果が表示装置3に表示される。正しい結果が
得られたらOK釦4を押して文例検索に移行する。スク
ロール釦5により検索し所望の文が見つかるとOK釦4
を押して訳文表示をする。さらに発声釦1を押すと訳文
の音声がスピーカ6を通して流れる。
【0024】この携帯型通訳機に本発明に係る音声認識
方法を適用した例を“Thank"を例にして示す。発声釦1
を押してマイク2に口を近づけて“ti: eit* ei en ke
i"(ティー エイチ 、アイ、イー、エヌ、ケイ) と発声する。認識結果
が“Thank"と表示装置3に表示される。認識時には自動
的にスペルチェックが行われ、辞書にない単語は除外さ
れる。これは認識率を高めるのに効果がある。認識結果
を表示装置3でチェックしたらOK釦4を押すと文例が
表示される。
方法を適用した例を“Thank"を例にして示す。発声釦1
を押してマイク2に口を近づけて“ti: eit* ei en ke
i"(ティー エイチ 、アイ、イー、エヌ、ケイ) と発声する。認識結果
が“Thank"と表示装置3に表示される。認識時には自動
的にスペルチェックが行われ、辞書にない単語は除外さ
れる。これは認識率を高めるのに効果がある。認識結果
を表示装置3でチェックしたらOK釦4を押すと文例が
表示される。
【0025】“Thank you for your help." を選んでO
K釦4を押すと「ありがとう。助かりました。」と訳文
が表示される。そこで発声釦1を押すと音声がスピーカ
6から流れる。文例検索による選択例について述べたが
短い文であれば“ti: eit* ei en kei, space, wai ou
ju:"といった具合に入力することもできる。表示装置3
には“Thank you"と表示される。音声出力は「ありがと
う」となる。ここで、アルファベットhに対応した発音
eit*において、発音記号の部分が* で置き換えている。
このことは、前記のギリシャ語アルファベットの発音記
号も同様である。以下同じ。
K釦4を押すと「ありがとう。助かりました。」と訳文
が表示される。そこで発声釦1を押すと音声がスピーカ
6から流れる。文例検索による選択例について述べたが
短い文であれば“ti: eit* ei en kei, space, wai ou
ju:"といった具合に入力することもできる。表示装置3
には“Thank you"と表示される。音声出力は「ありがと
う」となる。ここで、アルファベットhに対応した発音
eit*において、発音記号の部分が* で置き換えている。
このことは、前記のギリシャ語アルファベットの発音記
号も同様である。以下同じ。
【0026】基本的にはスペル入力で入力はできるが、
周囲の雑音などの関係で入力しづらい場合もある。この
ようなときにはギリシャ語のアルファベットを併用する
のが有効である。先の“thank"を例にとれば“th" 、
“a"、“n"、“k"の代わりにθ「しーた」、α「あるふ
ぁ」、ν「にゅー」、κ「かっぱ」を用いる、等であ
る。また、修正時に用いるのも有効である。同じ例で結
果の表示が“think"になった時に“a"の部分をαに置き
換えて入力し直すことにより正しい結果“thank"が容易
に得られる。
周囲の雑音などの関係で入力しづらい場合もある。この
ようなときにはギリシャ語のアルファベットを併用する
のが有効である。先の“thank"を例にとれば“th" 、
“a"、“n"、“k"の代わりにθ「しーた」、α「あるふ
ぁ」、ν「にゅー」、κ「かっぱ」を用いる、等であ
る。また、修正時に用いるのも有効である。同じ例で結
果の表示が“think"になった時に“a"の部分をαに置き
換えて入力し直すことにより正しい結果“thank"が容易
に得られる。
【0027】英語のアルファベットに対応するギリシャ
語のアルファベットが必ずしもある訳ではないので併用
が基本となる。英語とギリシャ語のアルファベットの組
み合わせにより「e問題」を避けることができるばかり
でなく、アルファベット間の距離を増大することができ
結果として認識率が究極まで高められる。ここで、「e
問題」とは、b、d、e、g、p、t 等の発声の類似性
が認識率を妨げるという問題のことである。
語のアルファベットが必ずしもある訳ではないので併用
が基本となる。英語とギリシャ語のアルファベットの組
み合わせにより「e問題」を避けることができるばかり
でなく、アルファベット間の距離を増大することができ
結果として認識率が究極まで高められる。ここで、「e
問題」とは、b、d、e、g、p、t 等の発声の類似性
が認識率を妨げるという問題のことである。
【0028】前記図2の携帯型通訳機をそのまま携帯型
のワードプロセッサとして用いるようにすることもでき
る。その使用方法は、次の通りである。まずコマンドと
して“Word Processor" と発声し、続いて“File" そし
て“New"と発声する。 新規入力画面が表示される。“Ti
tle of the invention" と発声する。 その結果が“Idol
of a convention" と表示されたとする。スクロール釦
によりポインターを“Idol" の“I"に合わせ、“ti: ai
ti: el i:"(ティー アイ ティー エル イー) もしくは “tau iota
tau lambda epsilon"(タウ イオタ タウ ラムタ゛ エフ゜シロン) 等と発
声する。
のワードプロセッサとして用いるようにすることもでき
る。その使用方法は、次の通りである。まずコマンドと
して“Word Processor" と発声し、続いて“File" そし
て“New"と発声する。 新規入力画面が表示される。“Ti
tle of the invention" と発声する。 その結果が“Idol
of a convention" と表示されたとする。スクロール釦
によりポインターを“Idol" の“I"に合わせ、“ti: ai
ti: el i:"(ティー アイ ティー エル イー) もしくは “tau iota
tau lambda epsilon"(タウ イオタ タウ ラムタ゛ エフ゜シロン) 等と発
声する。
【0029】あるいは、英語とギリシャ語のアルファベ
ットの組み合わせ発声でもいい。“tau ai tau el i"(タ
ウ アイ タウ エル イー)となる。これにより“Title of a conve
ntion"が表示される。次にポインターを“a"に合わせ
“θ eit* i:"(シータ エイチ イー) 等と発声する。“a"が“th
e"に代わる。以下同様にして正しい入力“Title of the
invention" が得られる。続いて本文の入力に入り、文
章入力、適宜修正過程を経て入力を完成する。途中ある
いは最初からスペル入力を用いることもある。辞書には
ない技術用語や人名、地名の入力時等にはとくに便利で
ある。全文が完成したら“Store"(ストア) と発声し、入力
した文面を保存し作業を終了する。
ットの組み合わせ発声でもいい。“tau ai tau el i"(タ
ウ アイ タウ エル イー)となる。これにより“Title of a conve
ntion"が表示される。次にポインターを“a"に合わせ
“θ eit* i:"(シータ エイチ イー) 等と発声する。“a"が“th
e"に代わる。以下同様にして正しい入力“Title of the
invention" が得られる。続いて本文の入力に入り、文
章入力、適宜修正過程を経て入力を完成する。途中ある
いは最初からスペル入力を用いることもある。辞書には
ない技術用語や人名、地名の入力時等にはとくに便利で
ある。全文が完成したら“Store"(ストア) と発声し、入力
した文面を保存し作業を終了する。
【0030】このような携帯型ワードプロセッサでは、
文章読み上げ入力とスペル入力とを併用しているので、
入力効率が改善されるという効果がある。また、スペル
入力を随時採用すれば周囲を気にすることなく入力作業
を行うことができる。ギリシャ語のアルファベットを頻
繁に使えばこの効果を更に高めることができる。
文章読み上げ入力とスペル入力とを併用しているので、
入力効率が改善されるという効果がある。また、スペル
入力を随時採用すれば周囲を気にすることなく入力作業
を行うことができる。ギリシャ語のアルファベットを頻
繁に使えばこの効果を更に高めることができる。
【0031】上記図2の携帯型通訳機は、そのまま携帯
電話機能もったパームトップ型パーソナルコンピュータ
に置き換えることができる。例えば、電子メール(e-ma
il)テキスト文の入力に本発明を適用した例をもうひと
つの使用方法を以下に説明する。
電話機能もったパームトップ型パーソナルコンピュータ
に置き換えることができる。例えば、電子メール(e-ma
il)テキスト文の入力に本発明を適用した例をもうひと
つの使用方法を以下に説明する。
【0032】まずe-mailのコマンドとして “e-mail"
と発声する。画面がメール新規作成に切り替わる。表示
画面に表示されたアドレス帖からアドレスを選択する。
本文の入力に入る。“How are you"“Question mark"と
発声する。“How are you?"と表記される。もしも、修
正する必要があるときは随時本発明に係るグレコロマン
式スペル入力により修正する。以下同様にしてメールの
文章を入力する。最後にコマンドとして“Send mail"と
発声するとメールが送信される。
と発声する。画面がメール新規作成に切り替わる。表示
画面に表示されたアドレス帖からアドレスを選択する。
本文の入力に入る。“How are you"“Question mark"と
発声する。“How are you?"と表記される。もしも、修
正する必要があるときは随時本発明に係るグレコロマン
式スペル入力により修正する。以下同様にしてメールの
文章を入力する。最後にコマンドとして“Send mail"と
発声するとメールが送信される。
【0033】上記のパームトップ型パーソナルコンピュ
ータは、携帯電話機であってもいいし、ネットワーク接
続されたノート型パーソナルコンピュータ等であっても
いい。また、本発明を用いる副次的効果としては入力を
スペル方式に適宜変更することにより、側で聞いている
人がいても気にすることなく使用することができる。
ータは、携帯電話機であってもいいし、ネットワーク接
続されたノート型パーソナルコンピュータ等であっても
いい。また、本発明を用いる副次的効果としては入力を
スペル方式に適宜変更することにより、側で聞いている
人がいても気にすることなく使用することができる。
【0034】上記の実施例から得られる作用効果は、下
記の通りである。 (1) 音声認識方法において、特定言語をそれを構成
するアルファベットに置き換えて音声入力するととも
に、かかるアルファベットを複数言語の字母の発声の組
み合わせに置き換えて入力するとともに、音声認識では
上記アルファベットの字母単位の組み合わせで行うこと
により、簡単な構成で識別率の大幅な改善を図ることが
できるという効果が得られる。
記の通りである。 (1) 音声認識方法において、特定言語をそれを構成
するアルファベットに置き換えて音声入力するととも
に、かかるアルファベットを複数言語の字母の発声の組
み合わせに置き換えて入力するとともに、音声認識では
上記アルファベットの字母単位の組み合わせで行うこと
により、簡単な構成で識別率の大幅な改善を図ることが
できるという効果が得られる。
【0035】(2) 上記に加えて、上記複数言語での
字母の入力は、英語のアルファベットの一部がギリシャ
語のアルファベットに置き換えることによる類似性の高
い字母の識別が簡単となり、1回の認識での識別率の大
幅な改善につながるという効果が得られる。
字母の入力は、英語のアルファベットの一部がギリシャ
語のアルファベットに置き換えることによる類似性の高
い字母の識別が簡単となり、1回の認識での識別率の大
幅な改善につながるという効果が得られる。
【0036】(3) 上記に加えて、上記音声信号の信
号処理は入力部においてデジタル信号化し、音声分析部
において特徴抽出処理を行ない、照合部において予め用
意された隠れマルコフモデルを含む音響モデルと照合す
ることにより簡単な信号処理での認識が可能となり、メ
モリやCPUに安価なものを用い、簡易なソフトウェア
での認識が可能になるという効果が得られる。
号処理は入力部においてデジタル信号化し、音声分析部
において特徴抽出処理を行ない、照合部において予め用
意された隠れマルコフモデルを含む音響モデルと照合す
ることにより簡単な信号処理での認識が可能となり、メ
モリやCPUに安価なものを用い、簡易なソフトウェア
での認識が可能になるという効果が得られる。
【0037】(4) 音声信号を取り込んでデジタル化
する音声入力部と、上記デジタル化された音声信号の特
徴抽出を行ない、予め用意された音響モデルと照合して
字母判別を行う音声信号処理部を備え、特定言語の入力
をそれを構成するアルファベットに置き換えて音声入力
するとともに、かかるアルファベットを複数言語の字母
の発声の組み合わせに置き換えて入力するとともに、上
記音声認識部での音声認識では上記アルファベットの字
母単位の組み合わせで行うようにすることにより、キー
操作が簡単で文字や単語入力を簡単に行える電子装置を
得ることができるという効果が得られる。
する音声入力部と、上記デジタル化された音声信号の特
徴抽出を行ない、予め用意された音響モデルと照合して
字母判別を行う音声信号処理部を備え、特定言語の入力
をそれを構成するアルファベットに置き換えて音声入力
するとともに、かかるアルファベットを複数言語の字母
の発声の組み合わせに置き換えて入力するとともに、上
記音声認識部での音声認識では上記アルファベットの字
母単位の組み合わせで行うようにすることにより、キー
操作が簡単で文字や単語入力を簡単に行える電子装置を
得ることができるという効果が得られる。
【0038】(5) 上記に加えて、上記複数言語での
字母の入力は、英語のアルファベットの一部がギリシャ
語のアルファベットに置き換えられて発声することによ
り、簡単な信号処理により識別率の大幅な改善につなが
るという効果が得られる。
字母の入力は、英語のアルファベットの一部がギリシャ
語のアルファベットに置き換えられて発声することによ
り、簡単な信号処理により識別率の大幅な改善につなが
るという効果が得られる。
【0039】以上本発明者よりなされた発明を実施例に
基づき具体的に説明したが、本願発明は前記実施例に限
定されるものではなく、その要旨を逸脱しない範囲で種
々変更可能であることはいうまでもない。例えば、前記
のような英語、仏語、独語、ロシア語等の欧米系言語に
適用可能であるという普遍性を持つものである。 すなわ
ち、たとえば仏語とギリシャ語のアルファベットを組み
合わせて使うことにより、仏語の単語認識率を究極まで
高めることができる。この発明に係る音声認識方法を用
いた音声認識機能が搭載される電子装置は、前記の実施
例の他にカーナビゲーションシステム等にも同様に適用
できる。
基づき具体的に説明したが、本願発明は前記実施例に限
定されるものではなく、その要旨を逸脱しない範囲で種
々変更可能であることはいうまでもない。例えば、前記
のような英語、仏語、独語、ロシア語等の欧米系言語に
適用可能であるという普遍性を持つものである。 すなわ
ち、たとえば仏語とギリシャ語のアルファベットを組み
合わせて使うことにより、仏語の単語認識率を究極まで
高めることができる。この発明に係る音声認識方法を用
いた音声認識機能が搭載される電子装置は、前記の実施
例の他にカーナビゲーションシステム等にも同様に適用
できる。
【0040】
【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、下
記の通りである。音声認識方法において、特定言語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記アルファベットの字母単位の組み合わせで行
うことにより、簡単な構成で識別率の大幅な改善を図る
ことができる。
的なものによって得られる効果を簡単に説明すれば、下
記の通りである。音声認識方法において、特定言語をそ
れを構成するアルファベットに置き換えて音声入力する
とともに、かかるアルファベットを複数言語の字母の発
声の組み合わせに置き換えて入力するとともに、音声認
識では上記アルファベットの字母単位の組み合わせで行
うことにより、簡単な構成で識別率の大幅な改善を図る
ことができる。
【0041】音声信号を取り込んでデジタル化する音声
入力部と、上記デジタル化された音声信号の特徴抽出を
行ない、予め用意された音響モデルと照合して字母判別
を行う音声信号処理部を備え、特定言語の入力をそれを
構成するアルファベットに置き換えて音声入力するとと
もに、かかるアルファベットを複数言語の字母の発声の
組み合わせに置き換えて入力するとともに、上記音声認
識部での音声認識では上記アルファベットの字母単位の
組み合わせで行うようにすることにより、キー操作が簡
単で文字や単語入力を簡単に行える電子装置を得ること
ができる。
入力部と、上記デジタル化された音声信号の特徴抽出を
行ない、予め用意された音響モデルと照合して字母判別
を行う音声信号処理部を備え、特定言語の入力をそれを
構成するアルファベットに置き換えて音声入力するとと
もに、かかるアルファベットを複数言語の字母の発声の
組み合わせに置き換えて入力するとともに、上記音声認
識部での音声認識では上記アルファベットの字母単位の
組み合わせで行うようにすることにより、キー操作が簡
単で文字や単語入力を簡単に行える電子装置を得ること
ができる。
【図1】この発明に係る音声認識方法を説明するための
一実施例を示すブロック図である。
一実施例を示すブロック図である。
【図2】この発明を携帯型通訳機に適用した場合の一実
施例を示す外観図である。
施例を示す外観図である。
1…発声釦、2…表示装置、3…表示画面、4…OK
釦、5…スクロール釦、6…スピーカー。
釦、5…スクロール釦、6…スピーカー。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 1/00 G10L 3/00 537H 1/725 551A 551B (72)発明者 田中 誠 東京都小平市上水本町5丁目22番1号 日 立超エル・エス・アイ・システムズ内 (72)発明者 内館 秀樹 東京都小平市上水本町5丁目22番1号 日 立超エル・エス・アイ・システムズ内 Fターム(参考) 5D015 AA05 BB02 HH23 KK02 5K027 AA11 BB01 HH20
Claims (5)
- 【請求項1】 音声認識方法において、特定言語をそれ
を構成するアルファベットに置き換えて音声入力すると
ともに、かかるアルファベットを複数言語の字母の発声
の組み合わせに置き換えて入力するとともに、音声認識
では上記アルファベットの字母単位の組み合わせで行う
ようにしてなることを特徴とする音声認識方法。 - 【請求項2】 請求項1において、 上記複数言語での字母の入力は、英語のアルファベット
の一部がギリシャ語のアルファベットに置き換えられて
発声されるものであることを特徴とする音声認識方法。 - 【請求項3】 請求項1又は2において、 上記音声信号の信号処理は、入力部においてデジタル信
号化し、音声分析部において特徴抽出処理を行ない、照
合部において予め用意された隠れマルコフモデルを含む
音響モデルと照合することにより字母判定を行うものを
含むことを特徴とする音声認識方法。 - 【請求項4】 音声信号を取り込む音声入力部と、 上記入力された音声信号をデジタル化し、その特徴抽出
を行ない、予め用意された音響モデルと照合して字母判
別を行う音声信号処理部を備え、 特定言語の入力をそれを構成するアルファベットに置き
換えて音声入力するとともに、かかるアルファベットを
複数言語の字母の発声の組み合わせに置き換えて入力す
るとともに、上記音声認識部での音声認識では上記アル
ファベットの字母単位の組み合わせで行うようにしてな
ることを特徴とする電子装置。 - 【請求項5】 請求項4において、 上記複数言語での字母の入力は、英語のアルファベット
の一部がギリシャ語のアルファベットに置き換えられて
発声されるものであることを特徴とする電子装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256653A JP2002073081A (ja) | 2000-08-28 | 2000-08-28 | 音声認識方法と電子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256653A JP2002073081A (ja) | 2000-08-28 | 2000-08-28 | 音声認識方法と電子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002073081A true JP2002073081A (ja) | 2002-03-12 |
Family
ID=18745232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000256653A Pending JP2002073081A (ja) | 2000-08-28 | 2000-08-28 | 音声認識方法と電子装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002073081A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005029815A3 (en) * | 2003-09-24 | 2005-05-06 | Honda Motor Co Ltd | System and method for formatting and displaying numbers |
US7393239B2 (en) | 2002-08-01 | 2008-07-01 | Ddk Ltd. | Electrical connector for flexible printed circuit boards |
US7435122B2 (en) | 2004-10-18 | 2008-10-14 | Ddk Ltd. | Connector |
JP2011039468A (ja) * | 2009-08-14 | 2011-02-24 | Korea Electronics Telecommun | 電子辞書で音声認識を用いた単語探索装置及びその方法 |
-
2000
- 2000-08-28 JP JP2000256653A patent/JP2002073081A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7393239B2 (en) | 2002-08-01 | 2008-07-01 | Ddk Ltd. | Electrical connector for flexible printed circuit boards |
US7491088B2 (en) | 2002-08-01 | 2009-02-17 | Ddk Ltd. | Connector |
US7494366B2 (en) | 2002-08-01 | 2009-02-24 | Ddk Ltd. | Connector |
US7648386B2 (en) | 2002-08-01 | 2010-01-19 | Ddk, Ltd. | Miniaturized connector for flexible printed circuit board |
WO2005029815A3 (en) * | 2003-09-24 | 2005-05-06 | Honda Motor Co Ltd | System and method for formatting and displaying numbers |
US7555316B2 (en) | 2003-09-24 | 2009-06-30 | Honda Motor Co., Ltd. | System and method for formatting and displaying numbers |
US7435122B2 (en) | 2004-10-18 | 2008-10-14 | Ddk Ltd. | Connector |
JP2011039468A (ja) * | 2009-08-14 | 2011-02-24 | Korea Electronics Telecommun | 電子辞書で音声認識を用いた単語探索装置及びその方法 |
KR101250897B1 (ko) | 2009-08-14 | 2013-04-04 | 한국전자통신연구원 | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8311829B2 (en) | Multimodal disambiguation of speech recognition | |
TWI266280B (en) | Multimodal disambiguation of speech recognition | |
CN103578464B (zh) | 语言模型的建立方法、语音辨识方法及电子装置 | |
JP4468264B2 (ja) | 多言語による名称の音声認識のための方法とシステム | |
JP2003015803A (ja) | 小型キーパッド用日本語入力メカニズム | |
JP2012063536A (ja) | 端末装置、音声認識方法および音声認識プログラム | |
CN101415259A (zh) | 嵌入式设备上基于双语语音查询的信息检索系统及方法 | |
WO2013134641A2 (en) | Recognizing speech in multiple languages | |
JP3476007B2 (ja) | 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体 | |
JP2016521383A (ja) | 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体 | |
CA2613154A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
US20020069058A1 (en) | Multimodal data input device | |
JP2002073081A (ja) | 音声認識方法と電子装置 | |
JP4230142B2 (ja) | 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術 | |
JP2004170466A (ja) | 音声認識方法と電子装置 | |
JP2011039468A (ja) | 電子辞書で音声認識を用いた単語探索装置及びその方法 | |
Mittal et al. | Speaker-independent automatic speech recognition system for mobile phone applications in Punjabi | |
JPH05119793A (ja) | 音声認識方法及び装置 | |
JP4622861B2 (ja) | 音声入力システム、音声入力方法、および、音声入力用プログラム | |
KR100777569B1 (ko) | 멀티모달을 이용한 음성 인식 방법 및 그 장치 | |
KR20090000858A (ko) | 멀티모달 기반의 정보 검색 장치 및 방법 | |
JP2001067097A (ja) | 文書作成装置および文書作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061122 |