JPH0748695B2

JPH0748695B2 - 音声符号化方式

Info

Publication number: JPH0748695B2
Application number: JP61117416A
Authority: JP
Inventors: 隆二郎村松; 宜則宮本; 和弘近藤; 俊郎鈴木
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1986-05-23
Filing date: 1986-05-23
Publication date: 1995-05-24
Anticipated expiration: 2010-05-24
Also published as: US4918734A; JPS62274941A; CA1326912C

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声の高能率符号化に係り、特に、電話通信に
おいて音声信号を圧縮したディジタル情報として伝送し
受信側で音声を再生する音声符号化方式に関するもの
で、音声休止区間における周囲雑音を処理することを図
ったものである。

〔従来の技術〕

従来の装置は、特願昭60-137721号に記載のように、入
力音声信号をフレーム（音声のパラメータを抽出する時
間間隔）毎に順次分析して伝送パラメータを算出し再び
合成する方式をとっていた。

しかし、周囲雑音のある環境下における音声の休止区間
の合成音については、配慮されていなかった。

〔発明が解決しようとする問題点〕

上記従来技術では、冷暖房装置のファン等が発生する雑
音が周囲雑音として存在している環境下での会話につい
ては配慮されておらず、これらの雑音が会話の休止期間
に入力されると、従来の音声分析合成方式では、これら
の雑音も人間が発する音声と同等に扱われることにな
り、その結果、合成出力は入力とはかなり異なった音に
聞こえ、耳ざわりな感じを与えるという問題があった。

本発明の目的は、従来技術での上記した問題点を解決
し、周囲雑音存在下の音声入力に対し、音声入力区間に
ついては従来と同じ処理を実行して音声品質を確保する
一方、音声休止区間については雑音処理を実行させ、雑
音の合成出力が感覚的に奇異な感じを与えないよう自然
音に近づけることのできる音声符号化方式を提供するこ
とにある。

〔問題点を解決するための手段〕

上記目的は、音声信号のある一定時間間隔毎のパワーを
算出する手段と、該パワーを上記一定時間間隔単位に積
分する手段と、該積分値を一定の割合で減衰した値を求
める手段と、前記時間間隔毎に求められた上記減衰値と
その直前の時間間隔での減衰値を一定の割合で減衰した
値とを比較して大きい値の方をしきい値として出力する
手段と、該しきい値と前記積分値との比較結果により音
声の有無を判定する手段とを備えた構成とすることによ
り、達成される。

すなわち、本発明の前記した目的を達成するためには、
まず、音声入力区間と音声休止区間とを判別することが
必要である。そのために、音声のパワーあるいはエネル
ギーを求めて、あるしきい値との比較結果により上記区
間を判別する。その際、入力音声レベルの大小に拘ら
ず、区間の判定がほぼ一定に保たれることが必要である
ため、上記しきい値は入力信号に応じて変化する可変し
きい値とする必要がある。

さらに、話者、送話器、回線が定まれば、その間の音声
入力区間毎のパワーは、ほぼ一定と考えられるため、同
一話者が会話をする平均的な時間内では、上記しきい値
は、ほぼ一定とするよう考慮する。次に、雑音のみ入力
した場合、白色雑音に近い雑音でも特定な周波数成分が
多いと分析時には、有声化されやすくなる。これらの音
が合成出力では奇異な感じを与えることになる。そこ
で、雑音に対し、常時無声化すれば、感覚的に不快感は
少なくなることを考慮し、音声休止区間では、入力に拘
らず無声判定とすることにより、上記目的は達成され
る。

〔作用〕

最初、前記した可変しきい値は最小値に設定しておく。
次に、音声が入力されると音声のパワーが大きくなるた
め、それに伴って可変しきい値も増大する。しかし、音
声入力中は、音声パワーがしきい値を上まわるために、
音声入力区間と判定される。音声が途切れると、音声パ
ワーは急速に減少する。ここで、しきい値を、音声パワ
ーが減少方向である時は徐々に減少するようにしておけ
ば、音声パワーがしきい値を下まわったことを検出する
ことで音声休止区間に入ったと判定され、この音声休止
区間に入力される雑音がしきい値以下であれば、これら
の雑音はすべて無声化され、奇異な合成音とはならな
い。

次に再び音声が入力して音声パワーが可変しきい値を上
まわると、音声入力区間に入ったことが判定され、通常
の分析合成処理が行なわれる。そしてこの入力音声によ
り、しきい値が新たな値に設定される。会話が終了する
と、しきい値は徐々に減少し、やがて元の最小値に落ち
着く。

〔実施例〕

以下、本発明の一実施例を第１図に示すブロック構成図
により説明する。第１図は符号器のみを示し、音声を合
成する復号器は前記した特願昭60-137721号に記載の合
成部と同一であるため省略している。入力された音声信
号１は音声分析器２で分析される一方パワー演算器３に
も入力され、ここで音声のパラメータを抽出する一定時
間間隔（以下、フレームという）毎に音声パワーが演算
される。フレーム毎に出力される音声パワーは漏洩積分
器４で積分され、減衰器５で一定レベル減衰される。実
施例では減衰器５は、漏洩積分器４から出力されるディ
ジタル値に一定値、例えば1/2、を乗算する掛算器であ
り、入力レベルをその1/2のレベルに減衰している。６
は可変しきい値を出力する比較選択器である。７は選択
器６の出力を入力に受けて１フレームだけ遅延させて出
力する、バッファメモリで構成される、１フレーム遅延
器であり、８はこの１フレーム遅延器７の出力を入力に
受けて、入力レベルを一定レベル減衰させて出力する減
衰器である。減衰器８におけるレベル減衰率は減衰器５
におけるそれとは異なるように設定され、実施例では入
力レベルを9/10に減衰させて出力するように設定され
る。減衰器５の出力と減衰器８の出力とが選択器６に入
力される。選択器６には、さらに大小比較器９の出力も
入力される。大小比較器９では減衰器５の出力と１フレ
ーム遅延器７の出力とが比較され、この比較結果により
選択器６を制御し、減衰器５の出力の方が大きい場合に
は減衰器５の出力が、また１フレーム遅延器７の出力の
方が減衰器５の出力より大きい場合には減衰器８の出力
が、しきい値として選択器６より出力される。選択器６
より出力されるしきい値と、漏洩積分器４より出力され
る積分値との大小比較を判別器10において行ない、積分
値がしきい値より大なる場合は音声入力区間と判定し、
小なる場合は音声休止区間と判定する。この判定結果は
有声無声処理器11に入力され、音声入力区間の場合は従
来技術と同じ処理を行い、音声休止区間の場合は入力信
号に拘らず無声として処理されて符号器出力12となる。

次に本実施例における各部信号の時間変化例を第２図、
第３図により説明する。第２図は入力される音声信号を
表わし、第３図は各部信号のレベル値を示している。し
きい値は音声入力前は設定された最小値にあり、音声入
力により漏洩積分値が増大すると減衰器５の出力（破線
曲線）の方がしきい値より大となり、しきい値としては
減衰器５の出力が選択されて比較選択器６の出力とな
る。漏洩積分値がしきい値より大きくなったことで音声
入力区間に入ったと判定される。漏洩積分値がピークよ
り下がると比較選択器６からは、前回フレームのしきい
値を一定の割合で、実施例では9/10のレベルに、減少さ
せた値がしきい値として出力される。そして、このしき
い値と漏洩積分値とが判定器10で比較され、判定され
る。漏洩積分値が低下してしきい値に達する時点までは
音声入力区間と判定され、漏洩積分値がしきい値を下ま
わり次にしきい値を上まわるまでの区間は音声休止区間
となり、この区間内にある小レベルの雑音は第１図の有
声無声処理器において無声として処理される。

以上、本実施例によれば、音声入力区間では従来技術と
同等の通常処理が実行され、音声休止区間では、小レベ
ル雑音はすべて無声として処理されるので周囲雑音が奇
異な合成音となって出力されることはなく、従来技術で
の問題点が解決される。

〔発明の効果〕

以上説明したように、本発明によれば、周囲雑音存在下
での会話に際し、音声入力区間においては従来技術にお
ける音声品質を確保し、音声休止区間においては従来技
術において奇異な感じを与えていた合成音を耳ざわりの
ないものとすることができる効果がある。

【図面の簡単な説明】

第１図は本発明の一実施例のブロック構成図、第２図は
実施例における入力音声信号の一例を示す図、第３図は
第１図中の各部信号の時間変化を示す図である。〈符号の説明〉１……音声信号入力、２……音声分析器３……パワー演算器、４……漏洩積分器 5,8……減衰器、６……比較選択器７……１フレーム遅延器９……大小比較器、10……判定器 11……有声無声処理器、12……符号器出力

───────────────────────────────────────────────────── フロントページの続き (72)発明者鈴木俊郎東京都国分寺市東恋ヶ窪１丁目280番地株式会社日立製作所中央研究所内 (56)参考文献特開昭56−134857（ＪＰ，Ａ) 特開昭60−107933（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】音声信号をディジタル符号に符号化し、該
ディジタル符号を復号して音声信号を再生する音声符号
化方式において、音声信号の一定時間間隔毎のパワーを
算出する手段と、該パワーを上記一定時間間隔単位に積
分する手段と、該積分値を一定の割合で減衰した値を求
める第１の減衰器と、この減衰値を一方の入力としてし
きい値を選択出力するしきい値選択器と、この出力しき
い値を前記一定時間間隔だけ遅らせて出力する遅延器
と、この遅延器出力を前記とは異なる一定の割合で減衰
した値を求めて上記しきい値選択器に他方の入力として
与える第２の減衰器と、上記第１の減衰器出力と上記遅
延器出力との大小比較により上記しきい値選択器を制御
してその２入力中の大きい値の方をしきい値として出力
させる手段と、該しきい値と前記積分値との比較結果に
より音声の有無を判定する手段とを備えたことを特徴と
する音声符号化方式。
【請求項２】前記一定時間間隔は、入力音声信号のパラ
メータをフレーム毎に抽出して有声、無声の判定を行っ
て音声を分析合成する音声分析合成器のフレームであ
り、前記判定手段は、前記しきい値と前記積分値との比
較結果に基づき音声が無いと判定されたフレームにおい
ては入力信号にかかわらず無声と判定することを特徴と
する特許請求の範囲第１項記載の音声符号化方式。