JPH07239696A

JPH07239696A - 音声認識装置

Info

Publication number: JPH07239696A
Application number: JP6029283A
Authority: JP
Inventors: Hiroaki Kokubo; 浩明小窪; Nobuo Hataoka; 信夫畑岡; Akio Amano; 明雄天野
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1994-02-28
Filing date: 1994-02-28
Publication date: 1995-09-12

Abstract

(57)【要約】【構成】音声入力部と、有声／無声判定部と、音声信
号に対して逆フィルタリングをおこなう適応一次逆フィ
ルタ部と、音声信号の特徴ベクトルを計算する分析部
と、予め登録しておいた標準パタンと分析部で求めた特
徴ベクトルとの類似度を求めることで入力音声の認識を
おこなう照合部とを有する音声認識装置。【効果】騒音環境下で発声した発声変形を伴う音声の
認識性能を向上させることが可能となる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声認識装置に係り、特
に騒音下でも安定に動作する耐騒音型音声認識装置に関
する。

【０００２】

【従来の技術】音声認識装置を実用化するためには、騒
音下で発声した音声でも正しく認識するような耐騒音化
技術が必要不可欠である。

【０００３】騒音下音声認識における認識性能の劣化要
因として、音声に重畳した雑音に対する影響が挙げられ
る。この重畳雑音に対する影響を低減させる方法につい
て、音声認識の分野では、スペクトルサブトラクション
法が非常に有効な手法として知られている。この手法は
入力音声の短時間スペクトルから推定騒音スペクトルを
差し引くことで騒音成分の除去をおこなう。

【０００４】しかし、重畳雑音の影響以外にも、騒音環
境下で発声することによるストレスによって発声様式に
変動が生じ（発声変形）、認識に悪影響を与えることが
知られている。発声変形に対する対策としては、発声変
形音声を異話者の音声とみなして話者適応を行う方法、
発声変形音声の特徴量を正規化をする方法なとが提案さ
れている。

【０００５】発声変形の現象の一つに音声の高域成分が
強調されスペクトルの傾きが変化することがあげられ
る。このスペクトルの傾きを正規化する方法として、適
応一次逆フィルタリングの適用が考えられる。この方法
は、スペクトルの傾きに相当する一次の線形予測係数を
用いて適応的に逆フィルタリングすることで周波数特性
を平坦化する。

【０００６】

【発明が解決しようとする課題】適応一次逆フィルタは
雑音が混入していない発声変形音声に対しては、スペク
トルの傾き変化を補正することで、認識性能の改善に有
効である。しかし、実際の環境で発声した音声には雑音
が重畳しているために、ポーズなどの無音声区間や子音
など音声のレベルが小さい区間では、雑音成分に対して
逆フィルタをかけることになり、認識に悪影響を与え
る。たとえば、自動車の走行ノイズなど多くの雑音は低
周波数帯域にパワが集中している。このような雑音に対
して周波数特性を平坦化する逆フィルタをかけると、高
域の雑音成分が強調されてしまう。従って、騒音下で発
声された音声に適用する適応一次逆フィルタリングは、
雑音成分に影響を与えずにおこなう必要がある。

【０００７】

【課題を解決するための手段】上記目的を達成するため
に、本発明の音声認識装置は、認識対象となる音声を入
力する音声入力部と、該音声入力部に入力した音声信号
より求めた一次パーコール係数を用いて音声信号に対し
て逆フィルタリングをおこなう適応一次逆フィルタ部
と、逆フィルタリングされた該音声信号の特徴ベクトル
を計算する分析部と、予め登録しておいた標準パタンと
前記分析部で求めた特徴ベクトルとの類似度を求めるこ
とで前記入力音声の認識を行う照合部と、入力信号の特
性を判定する判定部とを設け、入力信号が前記判定部の
条件と一致した場合にのみ前記適応一次逆フィルタ部で
逆フィルタリングをおこなう手段を持つ。

【０００８】

【作用】本発明には数々の変形が考えられるが、その中
で代表的な手段についてその作用を説明する。

【０００９】周波数特性を平坦化する逆フィルタリング
をおこなう適応一次逆フィルタ部をもつ音声認識装置に
おいて、入力音声の有声または無声を判定する有声／無
声判定部を設け、適応一次逆フィルタ部では有声音と判
定された音声区間のみ逆フィルタリングをおこなうよう
にする。この処理により、比較的音声のパワが大きく、
発声変形の影響が生じやすい有声音の区間は、発声変形
によるスペクトルの傾き変化を逆フィルタリングで補正
することができる。一方、比較的音声パワが小さく、騒
音の影響を受けやすい無声音の区間は逆フィルタリング
を省くことで、フィルタリングによって雑音成分を強調
する等の悪影響を避けることができる。

【００１０】したがって、本発明によれば、騒音環境下
で発声した発声変形を伴う音声の認識性能を向上させる
ことが可能となる。

【００１１】

【実施例】以下、本発明の実施例を示す。

【００１２】図１は本発明の一実施例を説明するための
音声認識システムのブロック図である。図１において、
１０１は音声入力部、１０２は有声／無声判定部、１０
３は適応一次逆フィルタ部、１０４は分析部、１０５は
照合部、１０６は標準パタン格納部、１０７はスイッチ
部である。図１では本実施例の概要のみを説明し、各部
分の詳細な説明は図２以降で述べる。音声入力部１０１
に入力した音声はＡ／Ｄ変換によってディジタル信号に
変換された後、一定間隔(通常は数十ms)毎に分割される
(分析フレーム)。分析フレーム毎に分割された音声デー
タは有声／無声判定部１０２に入力し、有声音であるか
否かが判定される。ここで、入力した音声フレームデー
タが有声音であると判定されたときには、適応一次逆フ
ィルタ部１０３では適応一次逆フィルタリングをおこな
い音声データの周波数特性を平坦にする。適応一次逆フ
ィルタについてはあとで詳細な説明をおこなう。また、
入力した音声フレームデータが有声音ではないと判定さ
れた場合、適応一次逆フィルタ部１０３の処理は省く。
つぎに分析部１０４ではフレーム毎に分割した入力音声
から特徴パラメータを計算する。標準パタン格納部１０
６にはあらかじめ計算しておいた認識対象語彙の標準パ
タン(特徴ベクトル系列)が格納してある。もちろん、こ
こに格納されている標準パタンは本システムの分析系と
同一の分析系で特徴ベクトルを計算している。照合部１
０５は、標準パタン格納部１０６に格納されている標準
パタンと、音声分析部１０４で分析された入力音声の特
徴ベクトルとの間で距離計算をおこなう。このとき照合
部１０５で照合した標準パタンのうち距離が一番小さい
単語が入力した音声の認識単語であると判定され、認識
結果として出力される。

【００１３】次に、図１で簡単に述べた各処理部につい
て詳細に説明する。

【００１４】はじめに、有声／無声判定部１０２につい
て述べる。図２は有声／無声判定部１０２の一実施例を
説明する図である。図２において、２０１は自己相関関
数計算部、２０２はピーク検出部、２０３は判定部であ
る。有声音の判定は入力した音声データの周期性によっ
ておこなう。一定間隔毎に分割された音声データは自己
相関関数計算部２０１に入力する。自己相関関数計算部
２０１では数１に示す処理によって入力音声x(i)の自
己相関関数を計算する。

【００１５】

【数１】

【００１６】図３に実際の音声データから計算した自己
相関関数の一例を示す。もし、入力音声が有声音であれ
ば、自己相関関数において繰り返し周期（ピッチ）に相
当する部分に大きなピークが存在するはずである。そこ
で、ピーク検出部２０２において、0次のピークを除く
自己相関関数のピークの中から最大値を検出する（図３
の例では68サンプルめの値）。判定部２０３ではピーク
検出部２０２で求めたピークの最大値と予め用意してお
いたしきい値とを比較して、ピークの最大値がしきい値
を上回った場合に入力した音声が有声音であると判定す
る。

【００１７】図４は有声／無声判定部１０２の第二の実
施例を説明するための図である。図２で説明した実施例
では、有声／無声の判定に入力音声の自己相関関数のピ
ーク値を使ったのに対して、図４の実施例では入力音声
の変形相関関数（線形予測分析の予測残差の自己相関係
数）のピーク値を使う。図４において、４０１は線形予
測分析部、４０２は線形予測逆フィルタ部、４０３は自
己相関関数計算部、４０４はピーク検出部、４０５は判
定部である。一定間隔毎に分割された音声データは線形
予測分析部４０１に入力する。線形予測分析部４０１で
は入力した音声データに対して線形予測分析をおこな
い、線形予測係数を出力する。線形予測分析に関しては
音声信号処理の分野では非常に一般的な分析手法であ
り、古井の「ディジタル音声処理」など詳しく解説され
ている良書は多い。線形予測係数の計算法にはいくつも
のアルゴリズムが提案されているが、一例としてLevins
on-Durbinのアルゴリズムの処理フローを図５に示し
た。線形予測逆フィルタ部４０２では、入力音声に対し
て、線形予測分析部４０１で求めた線形予測係数 a(i)
を用いて逆フィルタをかける。逆フィルタは数２に示す
処理によっておこなわる。

【００１８】

【数２】

【００１９】フィルタリングの出力ε(n)は線形予測分
析の予測誤差に相当し残差と呼ばれる。線形予測逆フィ
ルタ部４０２で計算した残差は自己相関関数計算部４０
３に入力する。自己相関関数計算部４０３では予測残差
の自己相関関数を計算する。ここで計算した相関関数は
入力音声の変形相関関数と呼ばれる。変形相関関数が計
算されると、ピーク検出部４０４において、0次のピー
クを除く変形相関関数のピークの中から最大値を検出す
る。判定部４０５ではピーク検出部４０４で求めたピー
クの最大値と予め用意しておいたしきい値とを比較し
て、ピークの最大値がしきい値を上回った場合に入力し
た音声が有声音であると判定する。

【００２０】図６は有声／無声判定部１０２の第三の実
施例を説明するための図である。本実施例も第一、第二
の実施例と同様、データの周期性に基づき有声／無声を
判定する手法である。ここでは周期性の判定にケプスト
ラムの高ケフレンシー成分のピーク値を使う。図６にお
いて、６０１はケプストラム計算部、６０２はピーク検
出部、６０３は判定部である。一定間隔毎に分割された
音声データはケプストラム計算部６０１に入力する。ケ
プストラム計算部６０１は入力した音声データに対して
FFTをおこなって周波数領域に変換し対数をとった後、I
FFTによって再び時間領域に変換することでケプストラ
ムを計算する。図７に実際の音声データから計算したケ
プストラムの一例を示す。ケプストラムの横軸はケフレ
ンシーと呼ばれ、低ケフレンシー部にはスペクトル包絡
の成分が集中し、高ケフレンシー部のピークにより基本
周波数が求まる。ピーク検出部６０２では求めたケプス
トラムからこの高ケフレンシー部のピーク値を検出す
る。判定部６０３ではピーク検出部６０４で求めたピー
クの値と予め用意しておいたしきい値とを比較して、ピ
ークの値がしきい値を上回った場合に入力した音声が有
声音であると判定する。

【００２１】これ以外にも、有声または無声を判定する
方法は数多く存在し、それらの方法も本実施例に適用で
きることはいうまでもない。

【００２２】つぎに、適応一次逆フィルタ部１０３につ
いて説明する。図８は適応一次逆フィルタ部１０３の一
実施例を説明するための図である。図８において、８０
１は一次パーコール係数計算部、８０２は逆フィルタ部
である。一次パーコール係数計算部８０１は、入力した
音声データの一次パーコール係数k1を数３より計算す
る。

【００２３】

【数３】

【００２４】ここで、r0、r1はそれぞれ自己相関関数の
０次の項と１次の項である。逆フィルタ部８０２は、一
次パーコール係数計算部８０１で計算した一次パーコー
ル係数を用いて入力音声データのフィルタリングをおこ
なう。一次パーコール係数を用いた逆フィルタリングに
はスペクトルを平坦化する働きがあり、音声認識の分野
では、電話回線の高域損失や個人差によるスペクトル傾
斜の補償に効果があることが過去に報告されている。適
応一次逆フィルタは入力信号をx(n)、一次パーコール係
数をk1とすると、以下の式で定式化される。

【００２５】

【数４】

【００２６】ところで、数４と数１とから、数５が求ま
る。

【００２７】

【数５】

【００２８】数５を用いると、自己相関関数を直接フィ
ルタリングすることが可能となり、波形信号を直接フィ
ルタリングする場合に比べて必要とする処理量を少なく
する事ができる。

【００２９】図９を用いて適応一次逆フィルタの効果に
ついて説明する。図９において、９０１は通常に発声し
た音声のスペクトル、９０２は発声変形を起こした音声
のスペクトルである。また、９０３は通常に発声した音
声を適応一次逆フィルタリング処理した後のスペクト
ル、９０４は発声変形を起こした音声を適応一次逆フィ
ルタリング処理した後のスペクトルである。９０１と９
０２とを比較すると、９０２は９０１に比べてスペクト
ルの高域成分のパワが上昇しており、２つのスペクトル
間に大きな差異が見られる。一方、適応一次逆フィルタ
処理を施した音声のスペクトル９０３と９０４では、両
者の差異が小さくなっていることがわかる。つまり、適
応一次逆フィルタを用いることで発声変形の影響を補正
することが可能となる。

【００３０】次に分析部１０４について説明する。分析
部１０４は入力音声から照合部１０５で距離計算をおこ
なう際に使用する音声の特徴パラメータを計算する。音
声認識で用いられる特徴パラメータには、LPCケプスト
ラム、メルケプストラム、帯域フィルタの出力、FFTス
ペクトルなど数多く存在する。本実施例ではもっとも一
般的に用いられているLPCケプストラムを用いる場合に
ついて説明する。図１０は分析部１０４の一実施例を説
明するためのプロック図である。図１０において、１０
０１は線形予測分析部、１００２はケプストラム計算部
である。線形予測分析部１００１に入力した音声データ
は図５に示した分析処理フローに従い、線形予測係数
（ＬＰＣ係数）が求められる。ケプストラム計算部１０
０２はＬＰＣ係数（a1,...,an）から数６に示す再帰式
によって、ＬＰＣケプストラム（c1,...,cn）を計算す
る。

【００３１】

【数６】

【００３２】最後に、照合部１０５について説明する。
図１１は照合部１０５を説明するための図である。図１
１で、１１０１はＤＰマッチング部、１１０２は最小距
離判定部である。ＤＰマッチング部１１０１は、分析部
１０４で求めた入力音声フレーム毎の特徴パラメータ
（本実施例ではｎ次ＬＰＣケプストラム）系列と標準パ
タン格納部１０６に格納されている標準パタン（登録音
声の特徴ベクトル系列）との距離計算をおこなう。もち
ろん、標準パタンの作成において、入力音声と同様に有
声区間のみ一次適応逆フィルタ処理したのち、分析パラ
メータを求めた。ＤＰマッチングはＤＴＷ（Dynamic Ti
me Warping）とも呼ばれ、音声パタンの発声時間長の変
動に対する正規化を動的計画法（Dynamic Programmin
g）を用いておこなう手法で、孤立単語の認識に古くか
ら用いられている。ＤＰマッチングの詳細については古
井；「ディジタル音声処理」(東海大学出版)の説明が詳
しい。ＤＰマッチング部１１０１においてすべての標準
パタンとの距離計算が終了すると、最小距離判定部１１
０２は距離計算の値がもっとも小さかった標準パタンを
見つけだす。音声認識システムでは最小距離判定部１１
０２で得られた距離最小の標準パタンの登録単語を認識
結果とする。

【００３３】以上説明したように、本実施例によれば、
比較的音声のパワが大きく、発声変形の影響が生じやす
い有声音の区間は、発声変形によるスペクトルの傾き変
化を逆フィルタリングで補正することができる。一方、
比較的音声パワが小さく、騒音の影響を受けやすい無声
音の区間は逆フィルタリングを省くことで、フィルタリ
ングによって雑音成分を強調する等の悪影響を避けるこ
とができる。

【００３４】したがって、本発明によれば、騒音環境下
で発声した発声変形を伴う音声の認識性能を向上させる
ことが可能となる。

【００３５】ここで、本発明の第二の実施例として、有
声／無声を判定して逆フィルタ処理の有無を切り替える
かわりに、入力した音声フレームが母音であるかどうか
を判定してフィルタ処理の有無を切り替えることを考え
る。図１２は本発明の第二の実施例を説明するためのシ
ステムブロック図である。図１２において、１２０１は
音声入力部、１２０２は母音判定部、１２０３は適応一
次逆フィルタ部、１２０４は分析部、１２０５は照合
部、１２０６は標準パタン格納部、１２０７はスイッチ
部である。第１の実施例と同じく、音声入力部１２０１
に入力した音声はＡ／Ｄ変換によってディジタル信号に
変換された後、一定間隔毎に分割される。分析フレーム
毎に分割された音声データは母音判定部１２０２に入力
し、母音であるか否かが判定される。ここで、入力した
音声フレームデータが母音であると判定されたときに
は、適応一次逆フィルタ部１２０３では適応一次逆フィ
ルタリングをおこない音声データの周波数特性を平坦に
する。また、入力した音声フレームデータが母音ではな
いと判定された場合、適応一次逆フィルタ部１２０３の
処理は省く。つぎに分析部１２０４では入力音声から特
徴パラメータを計算する。標準パタン格納部１２０６に
はあらかじめ計算しておいた認識対象語彙の標準パタン
が格納してある。照合部１２０５は、標準パタン格納部
１２０６に格納されている標準パタンと、音声分析部１
２０４で分析された入力音声の特徴ベクトルとの間で距
離計算をおこなう。このとき照合部１２０５で照合した
標準パタンのうち距離が一番小さい単語が入力した音声
の認識単語であると判定され、認識結果して出力され
る。

【００３６】次に、各処理部について詳細に述べる。と
ころで、音声入力部１２０１、適応一次逆フィルタ部１
２０３、分析部１２０４、照合部１２０５、標準パタン
格納部１２０６については、第一の実施例における説明
と重複する。そこでそれらの説明は省き、母音判定部１
２０２のみを説明する。

【００３７】母音区間は、ピッチを有し、比較的大きな
パワをもつフレームが一定時間(60ms程度)継続するとい
った特徴がある。本実施例では、パワの大きさに基づい
た母音判定法を例にとって説明する。図１３は母音判定
部１２０２の一実施例を示す図である。図１３におい
て、１３０１はパワ計算部、１３０２は判定部である。
パワ計算部１３０１は入力した音声の分析フレームの短
時間パワを計算する。本実施例では、短時間パワとして
自己相関関数の０次の項を用いる。ここで、自己相関関
数を計算しておけば、適応一次逆フィルタ部１２０３お
よび分析部１２０４で再び自己相関関数を計算する必要
はなくなる。判定部１３０２ではあらかじめ音声パワに
対するしきい値を用意しておき、入力した音声のパワが
一定フレーム連続してこのしきい値を上回った時に、そ
の区間が母音区間であると判定する。

【００３８】もちろんこれ以外にも、母音区間を判定す
る方法は数多く存在し、それらの方法も本実施例に適用
できることはいうまでもない。

【００３９】以上説明したように、第二の実施例によれ
ば、比較的音声のパワが大きく、発声変形の影響が生じ
やすい母音区間について、発声変形によるスペクトルの
傾き変化を逆フィルタリングで補正することができる。
一方、比較的音声パワが小さく、騒音の影響を受けやす
い母音以外の区間（子音区間、無音区間）は逆フィルタ
処理を省くことで、フィルタリングによって雑音成分を
強調する等の悪影響を避けることができる。

【００４０】したがって、本発明によれば、騒音環境下
で発声した発声変形を伴う音声の認識性能を向上させる
ことが可能となる。

【００４１】ここまでの説明は入力音声として発声変形
をおこした音声が入力すると想定して説明した。発声変
形は、高騒音環境で発声した場合にのみ問題となる現象
であり、静かな環境では発声変形はおこらない。そこ
で、第三の実施例として、測定した周囲の騒音レベルの
大きさによって適応逆フィルタ処理の有無を切り替える
方法について説明する。図１４は本発明の第三の実施例
を説明するためのシステムブロック図である。図１４に
おいて、１４０１は音声入力部、１４０２は雑音レベル
測定部、１４０３は騒音判定部、１４０４はスイッチ
部、１４０５は適応一次逆フィルタ部、１４０６は分析
部、１４０７は標準パタン格納部、１４０８は標準パタ
ン選択部、１４０９は照合部である。音声入力部１４０
１から入力した音声信号はＡ／Ｄ変換によってディジタ
ル信号に変換された後、一定間隔（通常は数十ms）毎に
分割される（分析フレーム）。分析フレーム毎に分割さ
れた入力データは雑音レベル測定部１４０２において雑
音レベルが測定される。雑音レベル測定部１４０２につ
いてはあとで説明する。騒音判定部１４０３は雑音レベ
ル測定部１４０２で求められた雑音レベルから入力信号
の騒音の大小を判定する。つまり、雑音レベル測定部１
４０２で求められた雑音レベルがしきい値よりも大きい
場合に騒音が大であると判定する。スイッチ部１４０４
は騒音の大小によって処理を切り替える。もし騒音が大
であるときには適応一次逆フィルタ部１４０５に処理を
移す。逆に騒音が小である場合は分析部１４０６に処理
を移す。適応一次逆フィルタ部１４０５では適応一次逆
フィルタリングをおこない音声データの周波数特性を平
坦にする。また、分析部１４０６ではフレーム毎に分割
した入力音声から特徴パラメータを計算する。適応一次
逆フィルタ部、分析部の詳細についてはすでに説明し
た。標準パタン格納部１４０７には認識対象単語の標準
パタンが格納してある。本実施例の場合には適応一次逆
フィルタ処理を経由して分析した標準パタンと適応一次
逆フィルタ処理をおこなわずに分析した標準パタンの二
種類が格納されている。標準パタン選択部１４０８は騒
音判定部１４０３で判定された騒音の大小によって標準
パタンを選択する。つまり、騒音が大であるときは適応
一次逆フィルタ処理を経由して分析した標準パタンを用
い、騒音が小であるときには適応一次逆フィルタ処理を
おこなわずに分析した標準パタンを用いる。照合部１４
０９は、標準パタン選択部１４０８で選択された標準パ
タンと、分析部１４０６で分析された入力音声の特徴ベ
クトルとの間で距離計算をおこなう。このとき照合部１
４０９で照合した標準パタンのうち距離が一番小さい単
語が入力音声の認識単語であると判定される。

【００４２】ここで、雑音レベル測定部１４０２につい
てくわしく説明する。図１５は雑音レベル測定部１４０
２を説明するための図である。図１５において、１５０
１は音声区間検出部、１５０２は雑音パワ計算部であ
る。音声区間検出部１５０１は入力信号から音声区間を
検出する。音声区間検出については古井の「ディジタル
音声処理」など詳しく解説されている。一般的な例とし
ては、一定しきい値以上の短時間パワが一定時間以上継
続した区間を基準に音声区間を決定する。雑音パワ計算
部１５０２はフレーム毎に計算される短時間パワの平均
をとる。この平均処理は音声区間検出部１５０１で音声
区間が検出されるまで継続する。この処理によって、音
声区間が検出されたときには騒音レベルの測定が完了し
ている。

【００４３】以上説明したように、第三の実施例によれ
ば、発声変形がおこりやすい高騒音環境で発声した場合
にのみ、発声変形によるスペクトルの傾き変化を逆フィ
ルタリングで補正することができる。一方、発声変形の
おこらない静かな環境では逆フィルタリング処理を省く
ことで、逆フィルタリング処理の悪影響を避けることが
できる。

【００４４】したがって、本発明によれば、静かな環境
での使用時における性能劣化を生じることなく、騒音環
境下で発声した発声変形を伴う音声の認識性能を向上さ
せることが可能となる。

【００４５】また、この第三の実施例の実施例と第一、
第二の実施例との併用も可能である。たとえば、図１６
で示す第四の実施例では、第三の実施例に有声／無声判
定部１６１０を追加した。この実施例によれば、比較的
音声のパワが大きく、発声変形の影響が生じやすい有声
音の区間は、発声変形によるスペクトルの傾き変化を逆
フィルタリングで補正することができる。一方、比較的
音声パワが小さく、騒音の影響を受けやすい無声音の区
間は逆フィルタリングを省くことで、フィルタリングに
よって雑音成分を強調する等の悪影響を避けることがで
きる。また、発声変形のおこらない静かな環境では全区
間において、逆フィルタリング処理を省くことで、逆フ
ィルタリング処理の悪影響を避けることができる。

【００４６】したがって、本発明によれば、静かな環境
での使用時における性能劣化を生じることなく、騒音環
境下で発声した発声変形を伴う音声の認識性能を向上さ
せることが可能となる。

【００４７】もちろん、第三の実施例と母音判定部との
併用も同様に有効であることは言うまでもない。

【００４８】

【発明の効果】以上述べてきたように、本発明によれ
ば、比較的音声のパワが大きく、発声変形の影響が生じ
やすい有声音の区間は、発声変形によるスペクトルの傾
き変化を逆フィルタリングで補正することができる。一
方、比較的音声パワが小さく、騒音の影響を受けやすい
無声音の区間は逆フィルタリングを省くことで、フィル
タリングによって雑音成分を強調する等の悪影響を避け
ることができる。

【００４９】したがって、本発明によって騒音環境下で
発声した発声変形を伴う音声の認識性能を向上させるこ
とが可能となる。

【図面の簡単な説明】

【図１】本発明の第一の実施例を説明するためのブロッ
ク図である。

【図２】有声／無声判定部の一実施例を説明するための
ブロック図である。

【図３】音声データの自己相関関数の一例を示す図であ
る。

【図４】有声／無声判定部の第二の実施例を説明するた
めのブロック図である。

【図５】線形予測分析部の一実施例を説明するための処
理フローである。

【図６】有声／無声判定部の第三の実施例を説明するた
めのブロック図である。

【図７】音声データから計算したケプストラムの一例を
示す図である。

【図８】適応一次逆フィルタ部の一実施例を説明するた
めの図である。

【図９】適応一次逆フィルタの効果を説明するための図
である。

【図１０】分析部の一実施例を説明するための図であ
る。

【図１１】照合部の一実施例を説明するための図であ
る。

【図１２】本発明の第二の実施例を説明するための図で
ある。

【図１３】母音判定部の一実施例を説明するための図で
ある。

【図１４】本発明の第三の実施例を説明するための図で
ある。

【図１５】雑音レベル測定部を説明するための図であ
る。

【図１６】本発明の第四の実施例を説明するための図で
ある。

【符号の説明】

１０１…音声入力部、１０２…有声／無声判定部、１０
３…適応一次逆フィルタ部、１０４…分析部、１０５…
照合部、１０６…標準パタン格納部、１０７…スイッチ
部。

Claims

【特許請求の範囲】

【請求項１】認識対象となる音声を入力する音声入力部
と、該音声入力部に入力した音声信号より求めた一次パ
ーコール係数を用いて前記音声信号に対して逆フィルタ
リングをおこなう適応一次逆フィルタ部と、逆フィルタ
リングされた音声信号の特徴ベクトルを計算する分析部
と、予め登録しておいた標準パタンと前記分析部で求め
た特徴ベクトルとの類似度を求めることで前記入力音声
の認識を行う照合部とを有する音声認識装置において、
入力信号の特性を判定する判定部を設け、入力信号が前
記判定部の条件と一致した場合にのみ前記適応一次逆フ
ィルタ部で逆フィルタリングをおこなうことを特長とす
る音声認識装置。
【請求項２】入力した音声信号に混入する雑音の大きさ
を測定する雑音レベル測定部を設け、前記判定部におい
て該雑音レベルがしきい値を越えたと判定された場合の
み、前記適応一次逆フィルタ部で逆フィルタリングをお
こなうことを特長とする請求項１記載の音声認識装置。
【請求項３】前記判定部として、入力音声の有声または
無声を判定する有声／無声判定部を設け、前記適応一次
逆フィルタ部では有声音と判定された音声区間のみ逆フ
ィルタリングをおこなうことを特長とする請求項１記載
の音声認識装置。
【請求項４】前記有声／無声判定部は、前記入力信号よ
り計算された自己相関関数のピークを用いて音声の有声
または無声を判定することを特長とする請求項３記載の
音声認識装置。
【請求項５】前記有声／無声判定部は、前記入力信号よ
り計算された変形相関関数（線形予測分析の予測残差の
自己相関係数）のピークを用いて音声の有声または無声
を判定することを特長とする請求項３記載の音声認識装
置。
【請求項６】前記有声／無声判定部は、前記入力信号よ
り計算されたケプストラムの高ケフレンシー部を用いて
音声の有声／無声を判定することを特長とする請求項３
記載の音声認識装置。
【請求項７】前記判定部として、前記入力音声を母音区
間とそれ以外の区間とに判別する母音判定部を設け、前
記適応一次逆フィルタ部では母音と判定された音声区間
のみ逆フィルタリングをおこなうことを特長とする請求
項１記載の音声認識装置。
【請求項８】前記母音判別部における母音区間の判別
は、前記入力信号より計算された短時間パワの値を用い
ることを特長とする請求項７記載の音声認識装置。
【請求項９】入力した音声信号の自己相関関数を計算す
る自己相関計算部を設け、前記適応一次逆フィルタ部
は、該自己相関計算部で計算した自己相関関数に対して
逆フィルタリングをおこなうことを特長とする請求項１
から８記載の音声認識装置。