JP2001188556A

JP2001188556A - 音声認識方法及び装置

Info

Publication number: JP2001188556A
Application number: JP37140599A
Authority: JP
Inventors: Takatoshi Sanehiro; 貴敏實廣; Takeshi Kawabata; 豪川端; Akihiro Imamura; 明弘今村
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1999-12-27
Filing date: 1999-12-27
Publication date: 2001-07-10
Anticipated expiration: 2019-12-27
Also published as: JP3378547B2

Abstract

(57)【要約】【課題】認識対象言語の母国語話者だけでなく、母国
語でない話者の音声も高精度に認識できるようにする。【解決手段】母国語話者による音声モデル１６、２
１、母国語話者が他言語を発声したときの音声モデル２
３、認識対象言語の母国語話者による音声モデルを用い
た照合パターンと、他言語の母国語話者による認識対象
言語の音声モデルを用いた照合パターンと、他言語の母
国語話者による他言語音声モデルを用いて認識対象を識
別できるよう作成した照合パターンとにより、それぞれ
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算する手段１４、１９、２２、２４、高いス
コアを示す照合パターンが表現する認識対象を出力する
手段１７を設ける。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、言語的な各カテゴ
リの音声特徴量をモデル化しておき、入力音声特徴量系
列に対する各モデルの照合スコアを求めて入力音声の認
識を行う音声認識方法及び装置に関する。

【０００２】

【従来の技術】確率、統計論に基づいた確率モデルによ
る認識方法は、音声、文字、図形などのパターン認識に
おいて有用な技術である。以下では、音声認識におい
て、現在主流になっている、隠れマルコフモデル（Ｈid
den Ｍarkov Ｍodel、以下ＨＭＭと記す）による従来技
術について説明する。隠れマルコフモデルについては、
例えば、中川聖一「確率モデルによる音声認識」電磁情
報通信学会編（１９８８）に詳述されている。

【０００３】従来の音声認識装置において、音素ごとに
ＨＭＭを用いてモデル化しておく方法は、性能が高く、
現在の主流になっている。図４に、従来のこの種の音声
認識装置のブロック図を示す。音声信号入力端子１１か
ら入力された音声をＡ／Ｄ変換部１２においてデジタル
化し、そのデジタル音声信号を音声特徴パラメータ分析
部１３において分析し、音声特徴パラメータを抽出す
る。この音声特徴パラメータを用いて、照合部１４にお
いて、あらかじめ用意された単語リスト（単語等の表記
と読みのリスト）１６と音声モデル１６により生成され
る音声認識候補パターン（照合パターン）と入力音声と
の照合を行う。このときの各認識候補に対する照合スコ
アを候補選択部２５において比較し、最も高いスコアを
示す認識候補を選択する。ここで選ばれた候補が認識結
果出力部２６によって出力される。

【０００４】

【発明が解決しようとする課題】これまでの音声認識技
術では、一般にある特定の言語に対し、音声モデルを用
意することで、その言語の音声認識を可能にしてきた。
複数の言語に対しては、それぞれの言語の音声モデルを
用意することで、各言語音声を認識できる。母国語でな
い話者に対しては、そういった話者の発声を集めること
で、母国語でない話者の音声モデルを構築できる。だ
が、それだけでは、母国語ではない話者の発声には対応
できない。発話者のその言語に対する習熟度により、発
話様式が大きく異なる。また、外国語に熟練した話者で
あっても、状況により、必ずしもその言語の発声ではな
く、母国語で外来語として扱っているような発声をする
場合もある。一方、複数言語の母国語話者による音声モ
デルを用いるだけの音声認識システムでは、発話者側で
は、母国語でない言語に対して、発声する度に、発声す
べき言語を意識する必要があり、大変不便で、また、認
識精度も高くなかった。

【０００５】なお、例えば特開平１０−２５４３５０号
公報には、母国語話者による音声モデルを、他言語の母
国語話者による発声との類似性によって入れ替えること
により、母国語でない話者の認識精度を向上させる技術
が記載されているが、発音の個人差により認識性能が変
化する等、汎用性の点で問題がある。

【０００６】本発明の目的は、認識対象言語の母国語話
者だけでなく、認識対象言語の母国語でない話者の音声
も、高精度で認識することができ、かつ、発音の個人差
による影響の少ない汎用性の高い音声認識方法及び装置
を提供することにある。

【０００７】

【課題を解決するための手段】本発明では、利用する話
者の母国語でない言語に対して、母国語による読みや発
音で表現される照合パターンを与え、認識対象言語の母
国語話者による音声モデルだけでなく、利用話者の母国
語に対する音声モデルを同時に入力音声の照合に使うこ
とで、母国語話者だけでなく、母国語でない話者の音声
を認識できるようにする。また、母国語でない話者によ
る認識対象言語の音声モデルも用いることで、より一
層、幅広い発話様式を覆うことができるようにする。

【０００８】本発明によれば、認識対象言語の母国語で
ない話者による母国語話者に近い発音であっても、母国
語話者発声による音声モデル、または、母国語でない話
者で、母国語話者に近い発声による音声モデルにより認
識することができる。また、認識対象言語に対して母国
語でない話者の母国語で外来語的な発音をする場合に
は、母国語による発音、読みを与え、母国語音声モデル
をあてはめた照合パターンを用いて認識することができ
る。

【０００９】

【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面により詳述する。図１に、本発明を適用した音
声認識装置の一実施例の全体的構成図を示す。本実施例
は、言語１と言語２の２種類の言語を認識でき、さら
に、言語２の言語については、他言語の言語１の母国語
話者による音声も認識できる音声認識装置を示してい
る。Ａ／Ｄ変換部１２、音声特徴パラメータ分析部１
３、照合スコア比較候補選択部１７、認識結果出力部１
８は、図４の従来の場合と同様である。ただし、照合ス
コア比較候補選択部１７は、後述の照合部１９、２２、
２４の各照合結果を入力して、それらの中から最も高い
スコアを示す認識候補を選択するように構成される。

【００１０】図１において、言語１、言語２とも、母国
語話者による専用の音声モデル１６、２１を持ち、それ
ぞれの言語に応じた表記と読み発音を明記した単語リス
ト１５、２０を用意する。図２の（ａ）、（ｂ）に単語
リスト１５、２０の一例を示す。言語１の言語に対し
て、その母国語話者による音声を認識する場合、単語リ
スト１５と音声モデル１６を用い、照合部１４におい
て、言語１の音声認識候補パターン（照合パターン）と
入力音声との照合を行う。同様に言語２の言語に対し
て、その母国語話者による音声を認識する場合には、単
語リスト２０と音声モデル２１を用い、照合部１９にお
いて、言語２の音声認識候補パターンと入力音声との照
合を行う。これは従来方法と同様である。図１では、別
々に照合部１４、１９を表現しているが、言語的な特性
は音声モデル、単語リストで吸収できるため、照合部自
体は共通のものが使える。照合部１４や１９で得られる
音声認識候補に対する照合スコアを候補選択部１７で比
較し、スコアのよいものを最終的な候補とし、認識結果
として出力部１８から出力する。これにより、複数の言
語音声（ここでは言語１と２の音声）に対し、同時に音
声認識を行うことができる。

【００１１】ただし、各言語に対し、母国語話者による
音声モデルだけでは、母国語でない言語を認識する場合
には認識精度が低下する。例として、言語１を日本語、
言語２を英語とし、日本語を母国語とする日本人が発声
した英語を認識する場合を考える。日本人の場合、英語
を発声したつもりでも、実際には、アメリカ人などが話
すような英語とはかけ離れている場合が多い。日本語に
はないような音素［ｒ］、［ｌ］、［ｆ］などの発声
は、多くの日本人が苦手としている。このような日本人
の英語を、英語を母国語とするイギリス人やアメリカ人
の発声により作成した音声モデルで認識するのはたいて
い困難である。

【００１２】また、別の問題として、英語の上手な日本
人であっても、英語を必ず英語的な発音で発声するとは
限らず、状況によっては、日本語的な発声をする。例え
ば、「ｃｏｍｐｕｔｅｒ」という英単語を英語として発
声することもあるだろうし、「こんぴゅーた」と日本語
的に読むこともありえる。この同じ単語に対する２種類
の発声は、音声としては全く異なるものになる。したが
って、英単語であっても、日本人英語、母国語でない話
者の発声を、英語音声モデルだけで認識するのは困難で
ある。

【００１３】本発明では、これら２つの問題に対する対
策を大きく２つ行う。一つは、母国語でない話者による
発声から音声モデルを作成すること、もう一つは、母国
語の音声モデルを用いて、他言語単語の発音を母国語で
の発音で置き換えたものを用意し、認識時に、母国語音
声モデルによる照合パターンとして用いる。

【００１４】前者は、図１において、言語１母国語話者
による言語２用の音声モデル２３と言語２用単語リスト
２０を用い、言語２用（言語１母国語話者）照合部２２
で照合を行う。これは、例で言うと、日本人英語の音声
を収集し、その音声モデルを作成して用いることにあた
る。単語リストは英語用のリストを使う。ここで得られ
れる認識候補の照合パターンは、日本人が英語らしく発
声した時の音声パターンに相当する。

【００１５】後者は、図１において、言語１用の音声モ
デル１６と言語１から言語２へ発音を対応させた単語リ
スト２７を用い、言語１→言語２用の照合部２４で照合
を行う。ここで、単語リスト２７は、単語リスト生成部
２５において、言語１から言語２へ発音を対応させるた
めの発音変換モデル（発音変換辞書、規則等）２６を参
照して、言語２用単語リスト２０から作成する。例で
は、英単語に片仮名で書くような日本語読みを与え、日
本語音声モデルで音声認識することにあたる。これは、
日本人が英語を片仮名読みした発声や、英語発声のつも
りであっても、日本語音声の特徴のほうが多く存在する
ような発声に対して対応できる。図２の（ｃ）に、言語
１→２用単語リスト２７の一例を示す。

【００１６】以下に、単語リスト生成部２５および発音
変換モデル２６により、言語２用単語リスト２０から言
語１→２用単語リスト２７を作成するいくつかの実施例
を示す。

【００１７】（１）発声変換モデル２６として、あらか
じめ言語２の単語に対し、言語１の発音を明記した辞書
を作成して用意し、単語リスト生成部２６において、辞
書引きで、言語２用単語リスト２０の英単語等に日本語
読みをつけ、言語→２用単語リスト２７とする。ここ
で、外来語として浸透しているものは、使われていそう
な読みをつける。そうでないものは、仮名に置き換える
とこうなるだろうと思われるものを読みとしてつける。

【００１８】（２）発声変換モデル２６として、あらか
じめ単語表記あるいは発音記号から読みへの変換規則に
よる変換部分的な表記や発音記号列から仮名への変換規
則を用意しておき、単語リスト生成部２５において、言
語２用単語リスト２０内の単語にそれをあてはめ、自動
で読みを生成し、言語−２用単語リスト２７を得る。

【００１９】（３）統計的手法による単語表記あるい
は発音記号からの変換を利用する。発声変換モデル２６
として、上記（１）で作成した辞書や、多くの人に多数
の単語について読みを付加してもらったものを用いて、
言語２用単語リスト２０の英語の単語表記、あるいは発
音表記と日本語読みを対応づけるような確率モデルを作
成する。そのモデルを用いて、単語リスト生成部２５に
おいて、言語２用単語リスト２０の英単語に対し、日本
語読みを自動生成し、言語１−２用単語リスト２７を得
る。

【００２０】ここで、（１）〜（３）に示したような技
術には、機械翻訳技術の分野で使われている音訳技術が
ある。これは英単語を日本語の片仮名表記に翻訳する技
術であり、ここで適用しようとしている音声認識にも利
用できる。例えば、塚田・増田，「英単語に対する日本
語読み付与方法の検討」（情報処理学会、第５３回全国
大会、２−３５９、平成８年後期）には、変換規則の生
成、その音声合成への適用が記載されており、（２）の
方法に利用できる。また、Ｋnight and Ｇraehl，「Ｍa
chine Ｔransliteration」(Ｃomputational Ｌinguisti
cs，Ｖol.２４，ＮＯ.４，ｐ.５９９，１９９８）に
は、機械翻訳において、統計的手法により英語の発音記
号から日本語の発音記号へ変換する技術が記載されてお
り、（３）の方法に利用できる。

【００２１】さらに、（３）の手法には、本出願人の先
願にかかる特願平１１−３２４８９２号で提案した英単
語の表記からカタカナ表記を生成する方法を利用するこ
ともできる。先願の方法は次のような内容のものであ
る。まず、基本単位となる英文字とカタカナとの対応を
設定しておく。「ｓ／ス」「ｔａ／テー」「ｔｉｏ／シ
ョ」「ｎ／ン］などのように、子音と母音の組み合わせ
やアルファベット１文字に対する仮名を設定する。ま
た、英単語とカタカナ表記を単語単位で対応付けたリス
トを用意しておく。このリストを用いて、基本単位をも
とに、対応付けを動的計画法により行う。対応付けられ
たリストから、基本単位の連鎖統計（ｎｇｒａｍ）を取
っておく。この統計量を用いて、英単語表記からカタカ
ナ文字列が確率スコアとともに生成できる。

【００２２】（４）音節あるいは音素モデルの対応付
けによる変換を利用する。上記の方法では、日本語の音
節構造（子音＋母音の構造など）が必ず含まれる。英語
では、日本語にない構造も取るため（子音連鎖、子音で
終わる、など）、上記の方法だけでは不十分である。そ
こで、発声変換モデル２６に、あらかじめ音節あるいは
音素のレベルで、英語と日本語で近い、あるいは、置き
換わりやすいものを対応づけておき、単語リスト生成部
２５において、この対応表にしたがって、言語２用単語
リスト２０の単語等の発音を置き換えることで言語１→
２用単語リスト２７を得る。

【数１】この２つ目の例で、「すとり」と仮名で書くと、子音＋
母音の構造が存在するため、子音［ｓ］、［ｔ］、
［ｒ］の間に母音［ｕ］、［ｏ］、［ｉ］が挿入され
る。この音素列がそのまま認識候補のパターンになるた
め、発声が英語的で、母音を含まない場合には、うまく
マッチングが取れないことになる。

【００２３】音声認識装置を構築する場合、上記（１）
〜（４）の方法の一つあるいは二つ以上を組み合わせて
利用することができる。

【００２４】次に、図１の実施例における認識処理の全
体的流れを図３により簡単に説明する。入力端子１１か
ら入力された音声信号をＡ／Ｄ変換部１２にてデジタル
信号に変換した後（ステップ１０１）、音声特徴パラメ
ータ分析部１３において、ある長さの分析フレーム単位
で音声分析を行い、音声特徴パラメータを得る（ステッ
プ１０２）。実施例では、このフレーム単位で、以下の
処理を繰り返し行う。

【００２５】単語リストに応じた音声認識候補が存在す
る場合（ステップ１０３でＹＥＳ）、言語１用照合部１
４、言語２用照合部１９、言語１母国語話者に対する言
語２用照合部２２、言語１から言語２への発音変換によ
る照合部２４のそれぞれへ、音声特徴パラメータを送る
（ステップ１０４〜１０７）。一方、音声終端を待た
ず、候補がない場合は（ステップ１０３でＮＯ）、結果
を得ないまま、認識処理を終える。各照合部１４、１
９、２２、２４では、それぞれ、対応の単語リストと音
声モデルとを用いて音声認識パターン（照合パターン）
を作成して入力音声特徴パラメータとの照合を行い（ス
テップ１０８〜１１１）、その照合スコアを元に、各認
識候補のスコアを計算する（ステップ１１２〜１１
５）。即ち、照合部１４では、言語１単語リスト１５と
言語１用音声モデル１６を用いて、言語１の母国語話者
に対する言語１用の照合パターンを得、入力音声特徴パ
ラメータとの照合計算を行う。照合部１９では、言語２
用単語リスト２０と言語２用音声モデル２１を用いて、
言語２の母国語話者に対する言語２用の照合パターンを
得、入力音声特徴パラメータとの照合計算を行う。照合
部２２では、言語２用単語リスト２０と言語２用（言語
１母国語話者）音声モデル２３を用いて、言語１の母国
語話者に対する言語２用の照合パターンを得、入力音声
パラメータとの照合を行う。照合部２４では、言語１→
２用単語リスト２７と言語１用音声モデル１６を用い
て、言語２用として言語１の母国語話者の照合パターン
を得も入力音声パラメータとの照合を行う。照合スコア
比較候補選択部１７では、各照合部１４、１９，２２、
２４からの照合スコアを用いて、照合スコア比較および
候補選択を行う（ステップ１１６）。

【００２６】以下、現在のフレームが音声終端でなけれ
ば（ステップ１１７でＮＯ）、次のフレームに対し、ス
テップ１０２からの処理を繰り返す。音声終端であれば
（ステップ１１７でＹＥＳ）、照合処理を終了し、残っ
ている認識候補を結果として認識結果出力部１８から出
力する。

【００２７】このように、本実施例によれば母国語話者
の音声モデルによる候補、母国語でない話者の音声モデ
ルによる候補、母国語の音声モデルを用いて、他言語単
語の発音を母国語での発音で置き換えた候補、等を用意
することにより、複数言語の音声認識、さらに、母国
語、母国語でない話者の発声に対して、言語を選択する
ことなく、同時に音声認識が可能になる。

【００２８】なお、図１では、２つの言語、言語１の母
国語話者についてのみの実施例を示したが、同様な手法
により、言語１から２への対応もでき、また、３つ以上
の言語への応用も可能である。

【００２９】

【発明の効果】以上述べたように、本発明によれば、複
数の言語に対する音声モデル、単語リストだけでなく、
母国語でない話者の音声モデル、他言語単語に対する母
国語への発音変換等を用いることで、母国語以外の話者
による発音の個人差によらない、汎用性のある高い精度
の音声認識が可能になる。また、複数言語において、母
国語話者、および母国語でない話者の発声を、言語を選
択することなく、同時に音声認識を可能にすることがで
きる。

【図面の簡単な説明】

【図１】本発明の音声認識方法を適用した音声認識装置
の一実施例を示すブロック図である。

【図２】図１の単語リストの具体例を示す図である。

【図３】図１の実施例における音声認識処理手順の一例
を示す流れ図である。

【図４】従来の音声認識装置の機能構成を示すブロック
図である。

【符号の説明】

１１音声信号入力端子１２Ａ／Ｄ変換部１３音声特徴パラメータ分析部１４言語１用照合部１５言語１用単語リスト１６言語１用音声モデル１７照合スコア比較候補選択部１８認識結果出力部１９言語２用照合部２０言語２用単語リスト２１言語２用音声モデル２２言語２用（言語１母国語話者）照合部２３言語２用音声モデル（言語１母国語話者）２４言語１→２用照合部２５単語リスト生成部２６言語１→２に対する発音変換モデル２７言語１→２用単語リスト

───────────────────────────────────────────────────── フロントページの続き (72)発明者今村明弘東京都千代田区大手町二丁目３番１号日本電信電話株式会社内Ｆターム(参考） 5D015 BB02 HH06 HH11 HH15

Claims

【特許請求の範囲】

【請求項１】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる音声認識候補パター
ン（以下、照合パターンという）と前記入力音声信号か
ら抽出した音声特徴パラメータとの照合スコアを計算
し、高いスコアが示す照合パターンが表現する認識対象
を出力する音声認識方法において、母国語話者による音声モデル、母国語話者が他言語を発
声したときの音声モデルを用意し、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと、他言語の母国語話者による認識対象言語
の音声モデルを用いた照合パターンとにより、それぞれ
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算し、高いスコアが示す照合パターンが表現
する認識対象を出力することを特徴とする音声認識方
法。
【請求項２】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる照合パターンと前記
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算し、高いスコアが示す照合パターンが表現
する認識対象を出力する音声認識方法において、複数言語に対し、それぞれ母国語話者による音声モデル
を用意し、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと、他言語の母国語話者による他言語音声モ
デルを用いて認識対象を識別できるように作成した照合
パターンとにより、それぞれ入力音声信号から抽出した
音声特徴パラメータとの照合スコアを計算し、高いスコ
アが示す照合パターンが表現する認識対象を出力するこ
とを特徴とする音声認識方法。
【請求項３】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる照合パターンと前記
入力音声から抽出した音声特徴パラメータとの照合スコ
アを計算し、高いスコアを示す照合パターンが表現する
認識対象を出力する音声認識方法において、複数言語に対し、母国語話者による音声モデル、母国語
話者が他言語を発声したときの音声モデルを用意し、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと、他言語の母国語話者による認識対象言語
の音声モデルを用いた照合パターンと、他言語の母国語
話者による他言語音声モデルを用いて認識対象を識別で
きるよう作成した照合パターンとにより、それぞれ入力
音声信号から抽出した音声特徴パラメータとの照合スコ
アを計算し、高いスコアを示す照合パターンが表現する
認識対象を出力することを特徴とする音声認識方法。
【請求項４】請求項２，３に記載の音声認識方法にお
いて、認識対象とする言語と他言語の表記、あるいは発
音記号から、部分的な記号連鎖を元に、認識対象とする
言語と他言語との発音の対応をあらかじめ取っておき、
他言語の母国語話者による他言語音声モデルを用いた照
合パターンを生成することを特徴とする音声認識方法。
【請求項５】請求項２，３に記載の音声認識方法にお
いて、認識対象とする言語と他言語との間で、音節ある
いは音素の単位で対応づけをし、その対応にしたがっ
て、他言語の母国語話者による他言語音声モデルを用い
た照合パターンを生成することを特徴とする音声認識方
法。
【請求項６】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる照合パターンと前記
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算し、高いスコアが示す照合パターンが表現
する認識対象を出力する音声認識装置において、母国語話者による音声モデルと、母国語話者が他言語を
発声したときの音声モデルと、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと入力音声信号から抽出した音声特徴パラメ
ータとの照合スコアを計算する第１照合手段と、他言語の母国語話者による認識対象言語の音声モデルを
用いた照合パターンと入力音声信号から抽出した音声特
徴パラメータとの照合スコアを計算する第２照合手段
と、前記第１および第２照合手段による照合スコアを比較
し、高いスコアを示す照合パターンが表現する認識対象
を出力する手段と、を有することを特徴とする音声認識装置。
【請求項７】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる照合パターンと前記
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算し、高いスコアが示す照合パターンが表現
する認識対象を出力する音声認識装置において、複数言語に対応したそれぞれの母国語話者による音声モ
デルと、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと入力音声信号から抽出した音声特徴パラメ
ータとの照合スコアを計算する第１照合手段と、他言語の母国語話者による他言語音声モデルを用いて認
識対象を識別できるように作成した照合パターンと、入
力音声信号から抽出した音声特徴パラメータとの照合ス
コアを計算する第２照合手段と、前記第１および第２照合手段による照合スコアを比較
し、高いスコアを示す照合パターンが表現する認識対象
を出力する手段と、を有することを特徴とする音声認識装置。
【請求項８】入力音声信号から音声特徴パラメータを
抽出し、あらかじめ用意された言語的単位の各カテゴリ
の特徴を表現した音声モデルによる照合パターンと前記
入力音声信号から抽出した音声特徴パラメータとの照合
スコアを計算し、高いスコアが示す照合パターンが表現
する認識対象を出力する音声認識装置において、複数言語に対し、母国語話者による音声モデルと、母国
語話者が他言語を発声したときの音声モデルと、認識対象言語の母国語話者による音声モデルを用いた照
合パターンと入力音声信号から抽出した音声特徴パラメ
ータとの照合スコアを計算する第１照合手段と、他言語の母国語話者による認識対象言語の音声モデルを
用いた照合パターンと入力音声信号から抽出した音声特
徴パラメータとの照合スコアを計算する第２照合手段
と、他言語の母国語話者による他言語音声モデルを用いて認
識対象を識別できるように作成した照合パターンと、入
力音声信号から抽出した音声特徴パラメータとの照合ス
コアを計算する第３照合手段と、前記第１、第２および第３照合手段による照合スコアを
比較し、高いスコアを示す照合パターンが表現する認識
対象を出力する手段と、を有することを特徴とする音声認識装置。