[go: up one dir, main page]

JPS62105199A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62105199A
JPS62105199A JP60244863A JP24486385A JPS62105199A JP S62105199 A JPS62105199 A JP S62105199A JP 60244863 A JP60244863 A JP 60244863A JP 24486385 A JP24486385 A JP 24486385A JP S62105199 A JPS62105199 A JP S62105199A
Authority
JP
Japan
Prior art keywords
frame
distance
feature data
data block
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60244863A
Other languages
English (en)
Inventor
納田 重利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP60244863A priority Critical patent/JPS62105199A/ja
Publication of JPS62105199A publication Critical patent/JPS62105199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 C産業上の利用分野〕 この発明は、例えば特定話者の音声を単語単位で認識す
るのに1m用される音声認1識″A置に関する。
C発明の(既要〕 この発明は、例えば749敗的な1ml彼数スペクトル
により表現される多次元ベクトルの軌跡の長さに略々比
例する適応な分割数によって時間軸の正規化処理を行っ
て特Ii&データを抽出する手段をイ「する音声認識装
置のパターンマツチング判定器において、スイングサー
チを行って最小となるフレーム間距離を選択し、選択さ
れたフレーム間距離の(’* i13に応してサーチ幅
の中心値をシフトしながら入力パターンと標準パターン
との距離計算処理を行うことにより、入力パターン及び
標串パターンを構成するフレーム数がやや大きく異なる
場合や音声の時間軸変動が大きく時間軸正規化後のパタ
ーンに時間軸変動の影響が残されている場合においても
、正確にマツチングがなされるようにするものである。
〔従来の技術〕
従来の音声認識WiFは、音声入力部としてのマイクロ
ホン、前処理回路、音響分析器、特徴データ抽出器、登
録パターンメモリ及びパターンマツチング判定器等によ
り構成されている。
マイクロホンから入力される音声信号が前処理回路に8
いて、音声認識に必要とされる帯域に制限され、ノ\/
D変換器によりディジタル音声信号とされる。このディ
ジクル音声信号が音響分析器に供給される。
音響分析器において、音声信号が周波数スペクトルに変
換され、例えば対数軸上で一定間隔となるように周波数
スペクトルのレヘルが正規化され、離散的な周波数スペ
クトルデータが発生される。
この周波数スペクトルデータ列が単位時間(フレーム周
汀月)毎に1つのフレームデータとして出力される。即
ち、フレーム1’qI K月毎の1フレームのデータが
Xチャンネルの周波数スペクトルデータとされ、N次元
ベクトルにより表現されるパラメータとして切り出され
、特徴データ抽出Haこ供給される。
特徴データ抽出器において、隣り合うフレームデータの
距離が計算される。対応するチャンヱルのスペクトルデ
ータの差の絶対値が夫々求めツれ、その総和がフレーム
間距離とされる。
更に、夫々のフレーム間距離の総和が求めらn、音声信
叶の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そして最も語数が多く長い音
声の場合に特徴を抽出するのに必要な所定の分割数でも
って軌跡長が等分割され、その分割点に対応したフレー
ムデータのみが特徴データとして抽出され、話者の音声
の発生速度変動に影響されることがないように時間軸が
正規化されて出力される。
この特徴データが登録時においては、登録パターンメモ
リに登録特徴データブロツク(標準パターン)として記
憶される。認識時においては、入力音声信号が前述した
処理を経て、入力待(牧データブロック(入力パターン
)とされ、パターンマツチング判定器に供給され、入力
特徴データブロックと登録特徴データブロックとの間の
パターンマツチングが行われる。
パターンマツチング判定器において、入力特徴データブ
ロックと登録特徴データブロフクの間のマツチング距離
が算出される。例えば、特徴データ抽出器において1個
のフレームデータが抽出され、0フレーム〜N−1)フ
レームにより特徴データプロ、りが構成される。登録時
1改データプロ/りを構成するフレームデータと入力特
徴データブロックを構成するフレームデータとの間で、
スイングサーチが行われながら対応するフレーム間の距
離が計算される。
例えば、i番目のフレーム問罪^1tsDiをnをチャ
ンネル番号とし、入力待1″5!i、データブロックの
スペクトルデータを81.とじ、登録特徴データプロ、
りのスペクトルデータR1,,とし、サーチ幅を1とし
てスイングサーチを用いて絶対値距離により算出すると で求められろ。即ち、入力待iクデータブロノクの1番
目のフレームと登録特徴データブロックの(i−1)番
目のフレーム、入力待i放データブロックのi番目のフ
レームとe lTh特i孜データフロックの1番目のフ
レーム、入力待(1シデータブロノクのi番目のフレー
ムとe ff&特徴データブロックの(i+1)番目フ
レームの夫々の間の対応するチャン♀ルの差の絶対値の
総和が求められ、得られた3つの値のうちで最小となる
値がフレーム間距離SD、  とされる。
そして、入力特徴データブロックの全てのフレ−ムに関
して、スイングサーチされなから登1.を特ftデータ
ブロックのフレームとの間のフレーム間距離SD、が求
められ、このフレーム間距離SD、の(i=I−1)ま
での総和、即ち、マツチング距離が求められる。池の登
録特徴データブロックに関しても、同様にマツチング距
離が求められ、マツチング距離が最小で十分に距離が近
いものと判断される登録特徴データブロックに対応する
華語が認識結果として出力される。
また、パターンマツチング判定器において、スイングサ
ーチを行いながら、サーチ幅に略々比例し、かつ入力特
徴データブロックを構成するフレーム数に略々反比例す
る重み係数を求めて、スイングサーチにより得られるフ
レーム間距離にこの重み係数を乗して距離計算処理を行
う音声認識装置として特願昭60−150697号が本
願出願人により提案されている。
〔発明が解決しようとする問題点〕
従来のパターンマツチング判定器におけるスイングサー
チを用い7こフレーム間距離は、前述しfこいずれの音
声認識装置に8いてもサーチ幅(\r−m)に応して入
力待t”slデータブロックの1番目のフレームに登録
特徴データブロックの(i −m)フレーム〜(i+m
)フレームまでのフレームを対応させて求めるものであ
る。
しかし、例えば特tThデータ抽出器において離数的な
周波数スペクトルにより表現される多次元ヘクトルの軌
跡の長さに応して分割数が可変とされ、音声の語長に応
して特徴データが抽出さ昶、て時間軸が正規化される方
式においては、登録″+!F敬データブロックのフレー
ム数が様々なものとされて登録される。
このため、入力待i攻データブロックのフレーム数とや
や大きく異なり、サーチ幅以上にフレーム数が違う登録
特徴データブロックと入力待ifiデークプロ、りとの
間においで従来のスイングサーチを用いてパターンマツ
チングが行われると、正確なマツチングが行えすL’7
141j率が低下する問題点があった。
また、音声の時間軸変動が大きく特徴データ抽出器にお
いて時間軸正規化された後においても特徴データブロッ
クに時間軸変動の影響が残されている場合には、同様に
正確にマツチングが行えず認、識率が低下する問題点が
あった。
従って、この発明の目的は、大力特徴データブロックと
登録特徴データブロックのフレーム数がやや大きく異な
る場合や、特徴データブロック中に時間@変動の影響が
残されている場合においても正確にマツチングすること
ができる手段を有した音声認、爪装置を堤供することに
ある。
〔問題点を解決するための手段〕
この発明は、入力音声信号をスペクトル変)Q等音声認
識に必要とされる前処理を行う音響分析手段5と、 音響分析手段5の出力データが供給され、適応な分割数
によって時間軸の正規化処理を行い、特徴データを抽出
する特徴データ抽出手段6と、特IThデータが1票小
パターンとして六己憶されるメモリ8と、 特徴データ抽出手段6からの入力パターンとメモリ8か
ら3売み出された標Y廿パターンとが供給され、入力パ
ターン及び種化パターンの一方を構成するフレームとサ
ーチ幅に応した+111 Ftの入力パターン及び標情
パターンの他方を構成する複数個のフレームとを対応さ
せて夫々のフレーム間距離を求め、最小となるフレーム
間距離のin報に応してサーチ幅の中心1直をシフトし
なが5入力パターンと標嘔パターンとの距離計算処理を
行い、距離計算処理の結果に基づいてマツチング判定す
るパターンマツチング判定手段9と、 からなることを特i牧とする音声認識装置である。
〔作用〕
パターンマツチング判定器9において、入力特徴データ
ブロックのフレームに対してサーチ幅に応じて登録特徴
データブロックのフレームが句数個対応させら丸、夫々
のフレーム間に関してフレーム間距離が求められ、最小
となるフレーム間距剤が選択されると共に、最小となる
フレーム間距離が登録特徴データブロックのどのフレー
ムにより算出さ着、たちのであるかが判断され、登録時
(攻データブロックの半方向のフレームから最小となる
フレーム間距離が算出される傾向にある場合には、中方
向にサーチ幅の中心値がシフトされ、また、一方向のフ
レームから最小となるフレーム間距離が算出される傾向
にある場合には、一方向にサーチ幅の中心値がシフトさ
れて、順次、フレーム間距離が算出されて、最小となる
フレーム間距離が累算されることによりマンアンプ距離
が算出される。
〔実施例〕
以下、この発明の一実施例を図面を参照して説明する。
第1図は、この発明の一実施例を示すもので、第1図に
おいて、1が音声入力部としてのマイクロホンを示して
いる。
マイクロホン1からのアナログ音声信号がフィルタ2に
供給される。フィルタ2は、例えば力。
トオフ周波数7..5 KN、、のローパスフィルタで
あり、音声信−ぢがフィルタ2において、音声認識に必
要とされる7、5にH2以下の帯域に制限され、この音
声信号がアンプ3を介してA/D変換器4に供給される
A/D変換器4は、例えば、サンプリング周波数12.
5K)I2の8ビツトA/D変換器であり、音声信号が
A/D変換器4において、アナログ−ディジタル変換さ
れて、8ビツトのディジタル信号とされ、音響分析器5
に供給される。
音響分析器5は、音声信号を1?i1波数スペクトルに
変換じて、例え;よ、Nチャンスルのスペクトルデータ
列を発生するものである。音響分析器5において、音声
信号が演算処理により周波数スペクトルに変換され、例
えば対数軸上で一定間隔となるN個の周波数を代表値と
するスペクトルデータ列が得られる。従って、音声信号
がXチャンネルの離散的な周波数スペクトルの大きさに
よって表現される。そして、単位時間(フレーム周!t
JI)毎にNチャンネルのスペクトルデータ列が一つの
フレームデータとして出力される。即ち、フレーム周朋
毎に音声信号がN次元ベクトルにより表現されるパラメ
ータとして切り出され、特徴データ抽出器6に供給され
る。
特徴データ抽出器6において、隣り合うフレームデータ
の距離が計算される。対応するチャンぶルのスペクトル
データの差の絶対値が夫々求められ、その総和がフレー
ム間距離とされる。
更に、夫々のフレーム間距離の総和が求められ、音声信
号の始端フレームから終端フレームまでのN次元ベクト
ルの軌跡長が求められる。そしてこの軌跡長に略々比例
した分割数でもって軌跡長が分再すされ、その分割点に
対応したフレームデータのみが特徴データとして抽出さ
れる。即ち、話者の音声の発生速度変動に影響されるこ
とがないように時間軸が正規化され、強い独自の特徴を
示すフレームデータが音声の語長に応した数だけ抽出さ
れて出力される。
この特徴データが登録時においては、モード切替回路7
を介して登録パターンメモリ8に供給され、登録特徴デ
ータプロ、りとして記憶される。
認識時においては、入力音声信号がi′i′i述じた処
理を経て、特徴データとされ、パターンマツチング判定
器9に供給され、入力待i枚データブロックとされる。
パターンマツチング判定器9において、入力待FJデー
タブロックのフレーム数と大きく異ならないフレーム数
の62+= #* ffiデータブロックのみが比較の
対象とされ、入力待i政データブロックと登録特徴デー
タブロックの間において、パターンマツチングが行われ
る。
第2図は、パターンマツチング判定器9の一例を示し、
第2図に示すようにサーチ幅内フレーム距離計算回路1
0.最小値抽出回路11.サーチ幅区間可変計算回路1
2.マ、チング距湘計算回路13.加算回路14.終端
側フレーム距離計算回路15.終端側マツチング距鮨計
算回路16及び最小距離判定回路17によりパターンマ
ツチング判定器8が構成される。
サーチ幅内フレーム距^■計算回路10及び終端側フレ
ーム距離計算回路15の夫々に特徴データ抽出器6から
の特徴データが供給され、例えば、音声区間の終端に対
応するフレームを(Q−1)とした場合、各々がチャン
ネルO〜チャンネルN−1のデータにより構成されるフ
レームデータが0フレーム〜Q−1フレームまで供給さ
れ入力特徴データブロックとされる。また、それと共に
、登録パターンメモリ8から比較の対象とされる入力特
徴データブロックのフレーム数と大きく異ならない、例
えばOフレーム幅即−1フレームにより構成される登録
特徴データブロックがサーチ幅内フレーム距離計算回路
10及び終端側フレーム距離計算回路15に供給される
サーチ幅内フレーム距離計算回路10において、入力特
徴データブロック側から登録特徴データブロック側にサ
ーチを行う場合には、入力特徴データブロック側のqフ
レームに登録特数データブロック側のjフレーム及びj
フレームに近接した複数のフレームが対応され、その夫
々の間のフレーム間距離の計算が行われる。
例えば、対応させるフレーム幅即ち、サーチ幅が1とさ
れた場合には、第3図Sこ示すように入力特徴データブ
ロックのqフレームに、登録特徴データブロックの(j
−1)フレーム、Jフレーム及び(j+1>フレームが
対応され、夫々の間のフレーム間距離が算出される。ま
た、サーチ幅が2とされた場合には、入力特徴データブ
ロックのqフレームに登録特徴データブロックの(j 
−2)フレーム〜(j+2)フレームが対応され、その
夫々の間のフレーム間距離が算出される。更にサーチ幅
がmとされた場合には、入力特徴データブロックのqフ
レームに登録特徴データブロックの(j−m)フレーム
〜(j十m)フレーム力く対応され、(2m=1)個の
フレーム間距離が夫々算出される。
計算処理により得られた(2m+1)個のフレーム間距
離データが最小値抽出回路11に供給される。
最小値抽出回路11において、(2m=1)個のフレー
ム間距離データの夫々が比較され、最小値となるフレー
ム間距離データが入力特徴データブロックのqフレーム
に対するフレーム間距離とされ、選択されたフレーム間
距離データがマツチング距離計算回路13に供給される
。また、それと共に、選択されたフレーム間距離データ
が登録特徴データブロック中のどのフレームに関して求
められたものであるかを示すフレーム番号データがサー
チ幅区間可変計算回路12に供給される。
サーチ幅区間可変計算回路12において、フレーム番号
データに基づいてサーチ幅区間のシフト方向が判断され
、シフト操作データが発生される。
例えば、入力特徴データブロックのqフレームに対応す
るサーチ幅区間の中心となる登録時1攻データブロック
のjフレームを基準として、jフレーム−(j+m)フ
レームの間のフレームが選択すれる傾向にあると判断さ
れる場合には、十方向皿ちjフレーム−(j”m)フレ
ーム(則にサーチ幅区間をシフトするシフト操作データ
が発生される。
また、(j−m)フレーム番号デ−タの間のフレームが
選択される傾向にあると判断される場合には、一方向、
即ち(j−m)フレーム〜jフレーム側にサーチ幅区間
をシフトするシフト操作データが発生される。
このシフト操作データがサーチ幅内フレーム距離計算回
路ioに供給され、順次、人力特徴データブロックの各
フレームに関してのフレーム間距離の計算が、シフト操
作データにより設定される登録時i攻データブロックl
jl、+1のサーチ幅区間内のフレームとの間において
なされる。つまり、最小となるであろうフレーム間距離
が常に登録特徴データブロックのサーチ幅区間内のフレ
ームから算出されるように、サーチ幅区間がシフトされ
、(2m+1)個のフレーム間距離が算出され、最小値
抽出回路11において最小値として選択されたフレーム
間距離データがマツチング距離計算回路13に供給され
る。
マツチング距離計算回路13において、順次供給される
最小値として選択されたフレーム間距離データの累算処
理がなされ、入力特徴データブロックの最大フレーム(
Q−1)までフレーム間距離データが累算されると、こ
の累算イ直がマツチング距離データとされ、マツチング
距^■データが加算回路14に供給される。
また、終端側フレーム距離計算回路15において、入力
特徴データブロックの所定の終端側フレームと登録特徴
データブロックの所定の終端側フレームとに関して、フ
レーム間距離の計算がなされる。例えば、直接マツチン
グによりフレーム間距離が算出される場合には、Cを定
数フレーム数とすると、入力特徴データブロックの所定
フレーム(Q−C)から最大フレーム(Q−1)までの
各フレームに登録特徴データブロックの所定フレーム(
J−C”)から最大フレーム(J−1)までの夫々が1
対1に対応され、順次、フレーム間距離が求められ、フ
レーム間距離データが終端側マツチング距離計算回路1
6に供給される。
終端側マツチング距離計算回路16において、順次供給
されるフレーム間距離データの累算処理がなされ、入力
特徴データブロックの最大フレーム(Q−1)までフレ
ーム間距離データが累算されると、この累算値が終端側
フレームに関して求められたマツチング距離データとさ
れ、マツチング距離データが加算回路14に供給される
加算回路14において、マツチング距離計算回路13か
ら供給されるマツチング距離データと終端側マツチング
距離計算回路16から供給されるマツチング距離データ
とが加算されて判定用距離データとされ、この判定用距
離データが最小距離判定回路17に供給される。また、
同様に、フレーム数が太き(異ならない他の登録特徴デ
ータブロックとの間においても判定用距離が算出され、
判定用距離データが最小距離判定回路17に供給される
最小距離判定回路17は、判定用距離が最小で十分に距
離が近いものと判断される登録特徴データブロックに対
応する単語を認識結果として出力する。
第4図は、例えばサーチ幅を1として、フレーム間距離
の最小値抽出の際に二度以上続けて登録特徴データブロ
ックの+1方向又は−1方向のフレームが選択された時
にサーチ幅区間の可変操作が行われて、判定用距離が算
出される過程の一例を示すものである。
第4図において、縦軸が登録特徴データブロックのフレ
ーム番号を示し、横軸が入力特徴チータブロックのフレ
ーム番号を示している。第4図中の細線上の各点が可変
操作されたサーチ幅区間に対応するフレーム番号を示し
、第4図中の破線上の各点がサーチ幅区間が可変操作さ
れない場合のフレーム番号を示し、第4図中の実線上の
各点が判定用距離に採用されたフレーム番号を示してい
る。
第4図に示すように、二度続けて登録特徴データブロッ
クの+1方向又は−1方向が選択された場合においての
み、サーチ幅区間がシフトされ、フレーム間距離が算出
され、入力待flデータブロックと登録特徴データブロ
ックとに関するマツチング距離が求められる。また、入
力特徴データブロック及び登録特徴データブロックの所
定の終端側フレームに関してのみ、フレーム間距離が算
出され、V!端測フレームに関するマツチング距離が求
められる。
そして、全体にわたって求められたマツチング距離と終
端側フレームに関してのみ求められたマツチング距離と
が加算されて判定用距離とされ、この判定用距離が用い
られて単語認、識の判定がなされる。
上述のこの発明の一実施例におけるパターンマツチング
判定器9のサーチ幅内フレーム距離計算回路10.最小
値抽出回路11.サーチ幅区間可変計算回路12及びマ
ツチング距離計算回路13の動作を、例えばサーチ幅を
1止して第5図に示すフローチャートを参照して説明す
る。また、第5図のフローチャートは、フレーム間距離
の最小値抽出の際に二度以上続けて登録特徴データブロ
ックのフレームの4−1方向または一1方向が選択され
た時にサーチ幅区間の可変操作が行われる場合のもので
ある。
サーチ幅内フレーム距離計算回路10において、入力特
徴データブロックと登録特徴データプロソりとの間でス
テップ■及び■の処理が行われる。
まず、登録特徴データブロックのフレームの士1方向の
選択回数K及び登録特徴データブロックのフレームの一
1方向の選択回数Pが0に初期設定されると共に、登録
特徴データブロックのフレーム番号を示す変数j及び入
力特徴データブロックのフレーム番号を示す変数qが0
に初期設定される。また、スイングサーチにより求めら
れるフレーム間距離の累積距離りがOに初期設定される
と共に、登録特徴データブロックの最大フレーム番号り
がJ−1に設定され、入力特徴データブロックの最大フ
レーム番号IがQ−1に設定され、サーチ幅区間に対す
る制限値Δが所定の値に設定される(ステップ■)。
そして、ステップ■において、入力特徴データブロック
のqフレームに登録特徴データブロックの(j+1)フ
レーム、jフレーム及び(j −1)フレームが対応さ
れ、その夫々の間のフレーム間距離D I+ D z、
 D :lがnをチャンネル番号とし、S Qnを入カ
スベクトルデータ+Rjnを登録スペクトルデータとし
て で求められる。即ち、対応するチャンネルのスペクトル
データの差の絶対値のチャンネルO〜チャンネル(N−
1)までの総和がフレーム間距離D+、 D z、 D
 1とされる。また、このステップ■の処理に8いては
、入力特徴データブロックのCj=O)とされる場合に
は、(j −N フレームが登録時i攻データブロック
側に存在しないため(j −1−〇)とされる。また、
(j+1)フレームが登録特徴データブロックの最大フ
レーム番号り以上となる場合には、登録特徴データブロ
ック側に(j+1)フレームが存在しないため(j十1
=L)とされる。
最小値抽出回路11.マツチング距離計算回路13及び
サーチ幅区間可変計算回路12において、ステップ■〜
Oの処理がなされる。ステップ■において、入力特徴デ
ータブロックのqフレームに(j↓1)フレームを対応
させて求められたフレーム間距AID、、入力特徴デー
タブロックのqフレームにjフレームを対応させて求め
られたフレーム闇路^ID2及び入力特徴データブロッ
クのqフレームに(j−1)フレームを対応させて求め
られたフレーム闇路Ai D zの比較がなされ、最小
となるものが入力特徴データブロックのqフレームに対
するフレーム間距離とされる。このフレーム間距離が累
算され累積距離りとされる。
また、ステップ■及びステップ■において、最小として
選択されたフレーム間距離が登録時(攻データ側の(j
+1)フレーム、jフレーム及び(j−1)フレームの
いずれかのうちから算出されたものであるかが判断され
る。
ステップ■において、フレーム間距離り、が選択された
かどうかが判断され、DIが選択された場合には、十1
方向の選択回数Kがインクリメントされると共に、−1
方向の選択回数Pが0とされる(ステップ■)。また、
DIが選択されない場合には、ステップ■にaいて、フ
レーム間距離D3が選択されたかどうかが判断され、D
3が選択された場合には、−1方向の選択回数Pがイン
クリメントされると共に、−1方向の選択回数Kが0と
される(ステップ0)。また、Dl及びD3が選択され
ない場合、即ちD2が選択された場合には、ステップ■
において、+1方向の選択回数K及び−1方向の選択回
数Pが共に0とされる。
ステップ■及びステップ■において、サーチ幅区間を可
変操作すべきかどうかが判断される。
ステップ■において、+1方向の選択回数にと2とが比
較されることにより、二度以上続けて+1方向のフレー
ムが選択されたかどうかが判断され、(K≧2)の場合
には、登録特徴データブロックのフレーム番号を示す変
数jと入力特赦チータブロックのフレーム番号を示す変
数qとの差(j−q)が制限値Δ以下かどうかが判断さ
れる(ステップ0)。そして、1rll l(旧直Δ以
下の場合には、jがインクリメントされ1士1とされ(
ステノブ・D)、制限値Δを越える場合には、jはその
ままとされ、次のステップに移行する。
また、(K<2)の場合には、ステップ■において、−
1方向の選択口数Pと2とが比較されることにより、二
度以上続けて一1方向のフレームが選択されたかどうか
が判断され、(P≧2)の場合には、入力待1敢データ
ブロックのフレーム番号を示す変数qと登録特徴データ
ブロックのフレーム番号を示す変数jとの差(q−j)
が制限値Δ以下かどうかが判断される(ステップ@)。
そして、制限値Δ以下の場合には、jがデクリメントさ
れj−1とされ(ステップO)、制限値Δを越える場合
には、jはそのままとされ次のステップに移行する。
ステップ■において、入力特徴データブロックのフレー
ム番号を示す変数qと入力特徴データブロックの最大フ
レーム番号■とが比較され、(q<1)の場合には、登
録特徴データブロックのフレーム番号を示す変数jがイ
ンクリメントされj↑1とされる(ステップ[相])と
共に、qがインクリメントされq”1とされ、再びステ
ップ■及び■の処理が行われる。つまり′、+1方向の
フレーム又は−1方間のフレームが制御@値Δを越えな
い範囲で二度以上続けて選択される場合を除いて、入力
特徴データブロックのフレーム番号を示す変数q及び登
録特徴データブロックのフレーム番号を示す変数jが両
者ともに士1インクリメントされ、次のフレームに関す
る計算処理に移行する。
また、士1方向のフレームが二度以上続けて選択される
場合にはqが+1インクリメントされると共に、jが±
2インクリメントされるため、+1方向にサーチ幅区間
がシフトされ、次のフレームに関する計算処理に移行す
る。−1方向のフレームが二度以上続けて選択される場
合には、qのみが十lインクリメントされるため、−1
方向にサーチ幅区間がシフトされ、次のフレームに関す
る計算処理に移行する。
上述した処理が繰り返し行われることにより、サーチ幅
区間がシフトされながら各フレームに関してフレーム間
距離が算出され、最小とされるフレーム間距離が累算さ
れ、入力特徴データブロックのフレーム番号を示す変数
qが最大フレーム番号■とされ、終端フレームに関して
計算処理がなされると、一つの登録特徴データブロック
に関する計算が終了される。この時のフレーム間距離の
累積距AIDがマツチング距離とされる。そして、他の
登録時(攻データブロックとの間においても同様にマツ
チング距離が算出される。
尚、この発明の一実施例においては、入力特徴データブ
ロック側から登録特徴データブロック側にサーチを行う
場合について説明したが、登録特徴データブロック側か
ら入力特徴データブロック側にサーチを行う構成として
も良い。また、この発明の一実施例においては、終端側
のフレーム間距離を求める際に、直接マツチングにより
フレーム間距離を丁める場合について説明したが、従来
の固定サーチのマツチングにより終端側フレームに関す
るマツチング距離を算出する構成としても良い。また、
この発明の一実施例においては、二度以上続けて、登録
待機データブロックの+1方向又は−1方向のフレーム
が選択された時にサーチ幅区間の可変操作が行われる場
合について説明したが、二度以上に限定するものでなく
、また、確率的な判断に基づいて可変操作を行う構成と
しても良い。
また、この発明は、ハードワイヤードの構成に限らず、
マイクロコンピュータ又はマイクロプログラム方式を用
いてソフトウェアにより処理を行うようにしても良い。
〔発明の効果〕
この発明では、パターンマツチング判定器において、入
力待1攻データブロックのフレームに対してサーチ幅に
応じて登録特徴データブロックのフレームが複数個対応
させらゎ1、夫々のフレーム間に関してフレーム間距離
が求められ、最小となるフレーム間距離が選択されると
共に、最小となるフレーム間距離が登録特徴データプロ
、りのどのフレームにより算出されたものであるがが判
断され、登録特徴データブロックの十方向のフレームか
ら最小となるフレーム間距離が算出される傾向にある場
合には、士方向にサーチ幅の中心値がシフトされ、また
、一方向のフレームから最小となるフレーム間距離が算
出される傾向にある場合には、一方向にサーチ幅の中心
値がシフトされて、サーチ幅内において常に最小となる
フレーム間距離が算出されるようになされ、順次、フレ
ーム間距離が算出され、最小となるフレーム間距離が累
算されることによりマツチング距離が算出される。
従って、この発明に依れば、入力特徴データブロックと
登録特徴データブロックのフレーム数がやや大きくこと
なる場合や、特徴データブロック中に時間軸変動の音響
が残されている場合においても対応することができ、正
確にマツチングが行え、認識率を向上させることができ
る。
また、この発明の一実施例においては、入力特徴データ
ブロックの所定の終端側フレームと登録特徴データブロ
ックの所定の終端側フレームとの部分的なマツチング距
離が算出され、このマツチング距離が入力待1攻データ
ブロックと登録特徴データブロックとの間においてサー
チ幅をシフトさせながら求められた全体的なマツチング
距離に加算されて判定用距離とされるため、相方の語尾
の差異を強めることができ、更に認識率を向上させるこ
とができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の全体の構成のブロック図
、第2図はこの発明の一実施例におけるパターンマツチ
ング判定器のブロック図、第3図及び第4図はこの発明
の一実施例におけるパターンマツチング判定器の動作説
明に用いる路線図、第5図はこの発明の一実施例におけ
るパターンマツチング判定器の動作説明に用いるフロー
チャートである。 図面における主要な符号の説明 l:マイクロホン、  5:音響分析器。 6:特徴データ抽出器、  7:モード切替回路。 8:登録パターンメモリ、  9:パターンマッチング
判定器、  10:サーチ幅内フレーム距離計算回路、
  11:最小値抽出回路、  12:サーチ幅区間可
変計算回路、  13:マソチング距離計算回路、  
14:加算回路、  15:終端側フレーム距離計算回
路、  16:終端側マツチング距離計算回路、  1
7:最小距離判定回路。 代理人   弁理士 杉 浦 正 知 会1体のaへ゛ 第1図 第2図

Claims (1)

  1. 【特許請求の範囲】 入力音声信号をスペクトル変換等音声認識に必要とされ
    る前処理を行う音響分析手段と、 上記音響分析手段の出力データが供給され、適応な分割
    数によって時間軸の正規化処理を行い、特徴データを抽
    出する特徴データ抽出手段と、上記特徴データが標準パ
    ターンとして記憶されるメモリと、 上記特徴データ抽出手段からの入力パターンと上記メモ
    リから読み出された上記標準パターンとが供給され、上
    記入力パターン及び上記標準パターンの一方を構成する
    フレームとサーチ幅に応じた個数の上記入力パターン及
    び上記標準パターンの他方を構成する複数個のフレーム
    とを対応させて夫々のフレーム間距離を求め、最小とな
    るフレーム間距離の情報に応じてサーチ幅の中心値をシ
    フトしながら上記入力パターンと上記標準パターンとの
    距離計算処理を行い、上記距離計算処理の結果に基づい
    てマッチング判定するパターンマッチング判定手段と、 からなることを特徴とする音声認識装置。
JP60244863A 1985-10-31 1985-10-31 音声認識装置 Pending JPS62105199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60244863A JPS62105199A (ja) 1985-10-31 1985-10-31 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60244863A JPS62105199A (ja) 1985-10-31 1985-10-31 音声認識装置

Publications (1)

Publication Number Publication Date
JPS62105199A true JPS62105199A (ja) 1987-05-15

Family

ID=17125109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60244863A Pending JPS62105199A (ja) 1985-10-31 1985-10-31 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62105199A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561722A (en) * 1992-03-04 1996-10-01 Sony Corporation Pattern matching method and pattern recognition apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561722A (en) * 1992-03-04 1996-10-01 Sony Corporation Pattern matching method and pattern recognition apparatus

Similar Documents

Publication Publication Date Title
US4426551A (en) Speech recognition method and device
JPS5844500A (ja) 音声認識方式
US4989249A (en) Method of feature determination and extraction and recognition of voice and apparatus therefore
US5295190A (en) Method and apparatus for speech recognition using both low-order and high-order parameter analyzation
JPS62105199A (ja) 音声認識装置
JPS6114520B2 (ja)
JPS625298A (ja) 音声認識装置
JP2712856B2 (ja) 音声認識装置
JPS6210697A (ja) 音声認識装置
JPS625299A (ja) 音声認識装置
JPS61292695A (ja) 音声認識装置
JPS62113197A (ja) 音声認識装置
JPS61290496A (ja) 音声認識装置
JP3002200B2 (ja) 音声認識
JPS6152478B2 (ja)
JPS63121100A (ja) 音声認識装置における特徴パタ−ン抽出方法
JPS6346496A (ja) 音声認識装置
JP3083855B2 (ja) 音声認識方法及び装置
JPS6225798A (ja) 音声認識装置
JPH0454960B2 (ja)
JPS60166993A (ja) 単語音声認識装置
JPH0554678B2 (ja)
JPS63104099A (ja) 音声認識装置
JPS6172299A (ja) 音声認識装置
JPS59124390A (ja) 候補削減音声認識方式