[go: up one dir, main page]

JPS5979300A - 認識装置 - Google Patents

認識装置

Info

Publication number
JPS5979300A
JPS5979300A JP57190600A JP19060082A JPS5979300A JP S5979300 A JPS5979300 A JP S5979300A JP 57190600 A JP57190600 A JP 57190600A JP 19060082 A JP19060082 A JP 19060082A JP S5979300 A JPS5979300 A JP S5979300A
Authority
JP
Japan
Prior art keywords
value
output
feature parameter
present
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57190600A
Other languages
English (en)
Other versions
JPS6334477B2 (ja
Inventor
徹 上田
西岡 芳樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57190600A priority Critical patent/JPS5979300A/ja
Priority to US06/543,497 priority patent/US4833711A/en
Publication of JPS5979300A publication Critical patent/JPS5979300A/ja
Publication of JPS6334477B2 publication Critical patent/JPS6334477B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野ン 本発明は音声認識装置等の認識装置の改良に関し、川に
詳細には特徴パラメータとしてフィルタバンク出力のよ
うに対数値を必要とする認識装置における特徴パラメー
タの作成に改良を加えたものである。
〈従来技術〉 従来、例えば音声の特徴パラメータとしてフィルタパン
ク出力のような対数値を用いる場合、次式(+)によっ
て対数変換されている。
W i= A logPl + B       ・=
−・−−t+i但し、A、B:定数 Pi:対数値をとるmJの特徴パラ メータ W2:文号数をとった後のq青黴パラ メータ このような、従来の変換方法を用いた認識装置fff”
によれば、対数曲線の性質によって、特徴パラメータの
値の小さな所では小さなP2  の変動でも対数出力の
変化が大きく出ることになる。
したがって、特徴パラメータのうち植が零に近いチャン
ネルでは内部の電気的雑音や外部ノイズの影響を強く受
ける問題点があった。
またマツチング部において、例えば特開昭56−133
801音声認識方式」に示されているようなカルマンフ
ィルタ等の係数変化を用いる方式の場合には、最小値が
零に近いと、変化率が非常に大きくなる可能性があり、
演算に多くのビット数を必要とする等の問題点かあった
<1]的〉 本発明は−1−記従来の問題点を除去した、特徴パラメ
ータのあるチャンネルか零付近の値を取っても電気的ノ
イズの影響が受けにくいように特徴パラメータの値を変
換する手段を備えた認識装置を4是供することを目的と
して成きれたものである。
〈実施例〉 以下、本発明の一実施例を詳細に説明する。
後述する本発明の実施例によれば、音声の特徴パラメー
タの値の対数をとる際、次式(2)によって変換される
ように構成されている。
上記式(2)に従って特徴パラメータI)、を対数変換
してW2を得るようにすることにより、特徴パラメータ
P、のあるチャンネルか零付近の値をとっても電気的ノ
イズ等の影響を受けにくくなり、また認識部にカルマン
フィルタ等のように前のフレームとの特徴量の変化率を
用いる場合にも、最低レベルを上記式(2)によって一
定値■くに持ち上けることにより、最大の変化率かおさ
えられるため、ビット数の少lよい演算か+1J能とI
ぼる。
次に図面を用いて一実施例を詳細に説明する。
第1図は本発明を採用したに声1τ、り識装置の一例を
示すフロック図である。
第1図において発声された入力音声はマイクロホン等の
検出器1により電気信5jに変換される。
この検出器1は、人の可聴周波数である20数Ll z
〜I 5 k Hz程度の周波数を検出することか出来
、特に人の会話音声領域の周波数を歪なく検出し得るも
のか好ましい。この検出器1の出力側には増幅器2か接
続される。この増幅器2は前記の8声周波数を歪なく増
幅し得るものが好ましい。この増幅器2の出力側に音声
区間抽出部3か接続され、この音声区間抽出部3により
音声の識別開始タイミングと識別終了タイミンクか与え
られ、この音声区間内の音声信邪が次段の特徴パラメー
タ抽出部4幌与えられる。
Ll’=j徴バラノータ抽出部4は第2図に示すように
rjい1こ通過帯域を異ならせた複数個の帯域フィルタ
/111〜/IIrJ  と各帯域フィルタ/Ill〜
/I IHの出力をポール1−するサンプルホールド回
路421〜42Nと、このサンプルホールド回路421
〜/12Nの出力を順次10ミリ秒程度の間隔て→ノー
ンプリンクするアナログスイッチ43と、このアナログ
スイッチ/13の出力を例えは12ビットのテジクルイ
11ツに変換し、11+i徴パラメータPi  を出力
するΔ/]) ′I¥換器/l/Iから構成されている
上記4’、lr徴パラメータ抽出部4により抽出された
特徴パラメータP、は対数化部5により対数変換され、
この対数変換された特徴パラメータW、か次段のパワー
IF規化部6及び時間軸正規化部7を通って1「現代さ
れ、このiE規化された特徴パラ7−クと標べBパター
ンメモリ8に記憶された標阜特徴パラメータとがマソヂ
ング部9により比−(て人力音声が認識され、その結果
が出力部10に出力されるように構成されている。
まり、上記対数化部5は第2図に示すように対数変換用
ROM51により構成されており、第3図に実線で示す
ように人力I)、を出力W、に変換するように固定1i
c−’l:lJされている。即ぢROM 5 Iはf1
4’+2ビットの人カイ言りを受けて、−この人力値を
」−記した式(2)に従って変換した8ヒツトの出力値
W7 として出力するように構成されている。
」−記の/J11き4’l’l成において帯域フィルタ
411〜/1.INの出力は順次A/I) C換器44
により12ヒソI・のテンクル信じに変換され、このΔ
D 19換された特徴パラメータP、の値か式(2)に
従って対数変換される。この式(2)に従った変換動作
により。
人力値))、か小さい部/))において1APz  の
値がノイズ等によって斐動しても、出力は一定値Iくと
ljす、ノイズの影響を受(Jにくくなる。また次フレ
ーノ・との変化率の最大も従来のC/Bに比してC/1
(と小さくなり、マッチンク部9に〕Jルマンフィルタ
等の塵化n]を用いたものにおいて、その演算の効率化
が図れることになる。
次に本発明と従来技術とを人力値づだけの場合と、周波
数軸」−で加算的に10のノイズが重畳した場合を例に
して比較する。
ハお月1・は特徴パラメータとして帯持フィルタ出力を
用いI2ヒツトでl\A)変換を行ない対数変換て8ヒ
ツトにする場合の数値例を示している。
従来の対数変換式〜V、−八JoへP7十B及O・本発
明による対数変換式 %式% 13とした場合(イυしO< P)’< 4095 )
 、ノイズのlSい哨のフィルタパンク出力(P、)と
ノイズの中畳した時の出力(P i + I O)の間
のユークリッド置割は次のように表わされる。
即ちノイズかない時は 1し一フΔlogP7−+−B となり、ノイズのある時は W7.−AI!og17+]o)+B となる。従ってユークリッド距離d、はd、=(W、−
〜■、°) となる。
」1記(3)式で表わされるニークリソl’距+’Hl
l (1(か従来法によるものであり、上式(号)を図
示すると?[+J4図の々1]<表わされる。
一方、本発明によれは 0<P7く4.0のとき J=W7=Alog50+B となり、d7−0となる。
また40<J〕、≦50のとき 〜■、=AI!og50+B 〜l/7’−Alog(P7+I O) 十Bとなり、
ユークリッド距離diは となる。
更に50<Pj のときは、従来と同じ式従って本発明
におけるニークリ・ソド距!n1ldi と人勾1゛、
の関係を図ボすると第5図の如く表わされろ。
・−のように第4図及び第5図からも明らかISように
従来l)、ではフィルタパンク出力か小さし)時(1,
4(19(’=段階のうぢ10変動するだけでユークI
J、71・) j、II 蛎11か、II常に大きくな
ることかあり、ノイズに列して弱いという欠点かあった
が、不発明番こよれ(、L)、イルク/・/り出力か小
さい時には一定レベルに持ちl−けることにより上記の
欠点か除か1Lる。
ghた、時間tにおける1番目のフイ)レタノくンク出
力をIゝ、]とした時、次のフレームとの特徴量の変化
:I:は、最悪の場合I)i t ””I 、Py[−
+−+=4095のときてあり、この時の変化量αは 従来t)3の場合 本発明の場合 ・−Aj’og4095−1−B 、、8. )lぐ となり、A l Og I −l−B <Kであるため
変化:1;か本発明の場合、おさえられることI−なる
(なおツノ・ノニj内の数値は上記数(ii’j例の場
合〕値を示している)。
また、変化量を用いない場合はI3−にとすることによ
り、クイナミックレンンを1りろことか出来るようにな
る。
〈効果〉 以」二の如く、本発明によれは特徴パラメータとして対
数値を用いた認識装置において、特徴/ぐラメークのレ
ベルの低い部分の値を一定性に1’、’J”) 1げて
特徴パラメータの変化率を制限するように成しているた
め、特徴パラメータのあるチャイ、ルか零付近の値を取
っても、電気的ノイズ等の影響か受けにくくなる。また
認識部にカルマンフィルタ等の前のフレームとの特徴量
の鯰化率を用いる場合、最低レベルを本発明により持ち
−1−けることにより最%z”変化量が押さえられ、ビ
、7ト数の少な演1’/’;” Z ”認識処111を
行うことが可能となる。
【図面の簡単な説明】
第1図は本発明の採用された音声認識装置の構成を示す
フτ」ツク図、第2図はその要部構成フロ・ツク図、第
3図は本発明による対数変換の入出力関係を示す図゛、
第4図は従来法におけるノイズの影p1Sを説明する図
、第5図は本発明におけるノ・イズの影響を説明する図
である。 4・・特徴パラメータ抽出部、5・対数化部、411〜
/IIN・・シ1)域フィルタ、44・・A4変換器、
51・log変換R〇八( へZ  ・′1IJ(値をとる1)IIの特徴パラメー
タW、 −列数をとった後の特徴パラメータ■く 一定
値。 代理人 弁理士 福 士 愛 彦(他2名)7    
人方P。 第3図 第μ図

Claims (1)

  1. 【特許請求の範囲】 1 特徴パラメータとして対数値を用いた認識装置にお
    いて、 1−記牛へ徴パラメータのレベルの低い部分の値を一定
    値に持ぢ」二けるように変換する変換手段をイ111“
    Iえ、 1記特徴パラメータの変化率を制限せしめるように成し
    たことを特徴とする認識装置。
JP57190600A 1982-10-28 1982-10-28 認識装置 Granted JPS5979300A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP57190600A JPS5979300A (ja) 1982-10-28 1982-10-28 認識装置
US06/543,497 US4833711A (en) 1982-10-28 1983-10-19 Speech recognition system with generation of logarithmic values of feature parameters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57190600A JPS5979300A (ja) 1982-10-28 1982-10-28 認識装置

Publications (2)

Publication Number Publication Date
JPS5979300A true JPS5979300A (ja) 1984-05-08
JPS6334477B2 JPS6334477B2 (ja) 1988-07-11

Family

ID=16260760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57190600A Granted JPS5979300A (ja) 1982-10-28 1982-10-28 認識装置

Country Status (2)

Country Link
US (1) US4833711A (ja)
JP (1) JPS5979300A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5216748A (en) * 1988-11-30 1993-06-01 Bull, S.A. Integrated dynamic programming circuit
US5025471A (en) * 1989-08-04 1991-06-18 Scott Instruments Corporation Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
US12244448B2 (en) * 2023-07-31 2025-03-04 James Kain Enhanced communication system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5688199A (en) * 1979-12-21 1981-07-17 Hitachi Ltd Pattern pretreatment method in voice identifier

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3327058A (en) * 1963-11-08 1967-06-20 Bell Telephone Labor Inc Speech wave analyzer
US3832491A (en) * 1973-02-13 1974-08-27 Communications Satellite Corp Digital voice switch with an adaptive digitally-controlled threshold
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US4008375A (en) * 1975-08-21 1977-02-15 Communications Satellite Corporation (Comsat) Digital voice switch for single or multiple channel applications
GB1569450A (en) * 1976-05-27 1980-06-18 Nippon Electric Co Speech recognition system
FR2410923A1 (fr) * 1977-08-18 1979-06-29 Dassault Electronique Installation de transmission telephonique de la parole entre des interlocuteurs places dans une ambiance bruyante
JPS5569880A (en) * 1978-11-22 1980-05-26 Nec Corp Pattern recognition unit
US4370521A (en) * 1980-12-19 1983-01-25 Bell Telephone Laboratories, Incorporated Endpoint detector
US4520500A (en) * 1981-05-07 1985-05-28 Oki Electric Industry Co., Ltd. Speech recognition system
US4509186A (en) * 1981-12-31 1985-04-02 Matsushita Electric Works, Ltd. Method and apparatus for speech message recognition
CA1204855A (en) * 1982-03-23 1986-05-20 Phillip J. Bloom Method and apparatus for use in processing signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5688199A (en) * 1979-12-21 1981-07-17 Hitachi Ltd Pattern pretreatment method in voice identifier

Also Published As

Publication number Publication date
US4833711A (en) 1989-05-23
JPS6334477B2 (ja) 1988-07-11

Similar Documents

Publication Publication Date Title
JP2561850B2 (ja) 音声処理装置
US7428488B2 (en) Received voice processing apparatus
US20100250242A1 (en) Method and apparatus for processing audio and speech signals
WO2002013572A3 (en) Method and apparatus for filtering and compressing sound signals
JPH0270134A (ja) 電気音響システム用雑音低減装置
JPS634200B2 (ja)
JPS5979300A (ja) 認識装置
US5001761A (en) Device for normalizing a speech spectrum
CN100440317C (zh) 数字助听器语音频率压缩方法
CN114449394A (zh) 听力辅助装置及调整听力辅助装置输出声音的方法
JPS6315298A (ja) パタ−ン作成方式
JPS62270999A (ja) 潜水マイクロフオンにおける呼吸気雑音除去装置
JPH0146080B2 (ja)
EP0774750A3 (en) Determination of line spectrum frequencies for use in a radiotelephone
Kiukaanniemi et al. Long-term speech spectra: A computerized method of measurement and a comparative study of Finnish and English data
JPH04367899A (ja) 音声認識装置のagc制御方式
JPH03122699A (ja) 雑音除去装置及び該装置を用いた音声認識装置
JPS62121500A (ja) 音声認識方式
JPS61281300A (ja) 音声認識装置
KR890002878Y1 (ko) 음성 합성시스템의 잡음제거 회로
JP3033158B2 (ja) デイジタル信号符号化装置
JPS6129900A (ja) 音声認識装置
JPS63163494A (ja) インテンシテイ検出装置
SU110566A1 (ru) Способ определени натуральности звучани и разборчивости речи, передаваемой по телефонному каналу
JPS59195290A (ja) 音声認識装置