[go: up one dir, main page]

JPH0748695B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH0748695B2
JPH0748695B2 JP61117416A JP11741686A JPH0748695B2 JP H0748695 B2 JPH0748695 B2 JP H0748695B2 JP 61117416 A JP61117416 A JP 61117416A JP 11741686 A JP11741686 A JP 11741686A JP H0748695 B2 JPH0748695 B2 JP H0748695B2
Authority
JP
Japan
Prior art keywords
voice
value
threshold value
output
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61117416A
Other languages
English (en)
Other versions
JPS62274941A (ja
Inventor
隆二郎 村松
宜則 宮本
和弘 近藤
俊郎 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61117416A priority Critical patent/JPH0748695B2/ja
Priority to US07/052,395 priority patent/US4918734A/en
Priority to CA000537601A priority patent/CA1326912C/en
Publication of JPS62274941A publication Critical patent/JPS62274941A/ja
Publication of JPH0748695B2 publication Critical patent/JPH0748695B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声の高能率符号化に係り、特に、電話通信に
おいて音声信号を圧縮したディジタル情報として伝送し
受信側で音声を再生する音声符号化方式に関するもの
で、音声休止区間における周囲雑音を処理することを図
ったものである。
〔従来の技術〕
従来の装置は、特願昭60-137721号に記載のように、入
力音声信号をフレーム(音声のパラメータを抽出する時
間間隔)毎に順次分析して伝送パラメータを算出し再び
合成する方式をとっていた。
しかし、周囲雑音のある環境下における音声の休止区間
の合成音については、配慮されていなかった。
〔発明が解決しようとする問題点〕
上記従来技術では、冷暖房装置のファン等が発生する雑
音が周囲雑音として存在している環境下での会話につい
ては配慮されておらず、これらの雑音が会話の休止期間
に入力されると、従来の音声分析合成方式では、これら
の雑音も人間が発する音声と同等に扱われることにな
り、その結果、合成出力は入力とはかなり異なった音に
聞こえ、耳ざわりな感じを与えるという問題があった。
本発明の目的は、従来技術での上記した問題点を解決
し、周囲雑音存在下の音声入力に対し、音声入力区間に
ついては従来と同じ処理を実行して音声品質を確保する
一方、音声休止区間については雑音処理を実行させ、雑
音の合成出力が感覚的に奇異な感じを与えないよう自然
音に近づけることのできる音声符号化方式を提供するこ
とにある。
〔問題点を解決するための手段〕
上記目的は、音声信号のある一定時間間隔毎のパワーを
算出する手段と、該パワーを上記一定時間間隔単位に積
分する手段と、該積分値を一定の割合で減衰した値を求
める手段と、前記時間間隔毎に求められた上記減衰値と
その直前の時間間隔での減衰値を一定の割合で減衰した
値とを比較して大きい値の方をしきい値として出力する
手段と、該しきい値と前記積分値との比較結果により音
声の有無を判定する手段とを備えた構成とすることによ
り、達成される。
すなわち、本発明の前記した目的を達成するためには、
まず、音声入力区間と音声休止区間とを判別することが
必要である。そのために、音声のパワーあるいはエネル
ギーを求めて、あるしきい値との比較結果により上記区
間を判別する。その際、入力音声レベルの大小に拘ら
ず、区間の判定がほぼ一定に保たれることが必要である
ため、上記しきい値は入力信号に応じて変化する可変し
きい値とする必要がある。
さらに、話者、送話器、回線が定まれば、その間の音声
入力区間毎のパワーは、ほぼ一定と考えられるため、同
一話者が会話をする平均的な時間内では、上記しきい値
は、ほぼ一定とするよう考慮する。次に、雑音のみ入力
した場合、白色雑音に近い雑音でも特定な周波数成分が
多いと分析時には、有声化されやすくなる。これらの音
が合成出力では奇異な感じを与えることになる。そこ
で、雑音に対し、常時無声化すれば、感覚的に不快感は
少なくなることを考慮し、音声休止区間では、入力に拘
らず無声判定とすることにより、上記目的は達成され
る。
〔作用〕
最初、前記した可変しきい値は最小値に設定しておく。
次に、音声が入力されると音声のパワーが大きくなるた
め、それに伴って可変しきい値も増大する。しかし、音
声入力中は、音声パワーがしきい値を上まわるために、
音声入力区間と判定される。音声が途切れると、音声パ
ワーは急速に減少する。ここで、しきい値を、音声パワ
ーが減少方向である時は徐々に減少するようにしておけ
ば、音声パワーがしきい値を下まわったことを検出する
ことで音声休止区間に入ったと判定され、この音声休止
区間に入力される雑音がしきい値以下であれば、これら
の雑音はすべて無声化され、奇異な合成音とはならな
い。
次に再び音声が入力して音声パワーが可変しきい値を上
まわると、音声入力区間に入ったことが判定され、通常
の分析合成処理が行なわれる。そしてこの入力音声によ
り、しきい値が新たな値に設定される。会話が終了する
と、しきい値は徐々に減少し、やがて元の最小値に落ち
着く。
〔実施例〕
以下、本発明の一実施例を第1図に示すブロック構成図
により説明する。第1図は符号器のみを示し、音声を合
成する復号器は前記した特願昭60-137721号に記載の合
成部と同一であるため省略している。入力された音声信
号1は音声分析器2で分析される一方パワー演算器3に
も入力され、ここで音声のパラメータを抽出する一定時
間間隔(以下、フレームという)毎に音声パワーが演算
される。フレーム毎に出力される音声パワーは漏洩積分
器4で積分され、減衰器5で一定レベル減衰される。実
施例では減衰器5は、漏洩積分器4から出力されるディ
ジタル値に一定値、例えば1/2、を乗算する掛算器であ
り、入力レベルをその1/2のレベルに減衰している。6
は可変しきい値を出力する比較選択器である。7は選択
器6の出力を入力に受けて1フレームだけ遅延させて出
力する、バッファメモリで構成される、1フレーム遅延
器であり、8はこの1フレーム遅延器7の出力を入力に
受けて、入力レベルを一定レベル減衰させて出力する減
衰器である。減衰器8におけるレベル減衰率は減衰器5
におけるそれとは異なるように設定され、実施例では入
力レベルを9/10に減衰させて出力するように設定され
る。減衰器5の出力と減衰器8の出力とが選択器6に入
力される。選択器6には、さらに大小比較器9の出力も
入力される。大小比較器9では減衰器5の出力と1フレ
ーム遅延器7の出力とが比較され、この比較結果により
選択器6を制御し、減衰器5の出力の方が大きい場合に
は減衰器5の出力が、また1フレーム遅延器7の出力の
方が減衰器5の出力より大きい場合には減衰器8の出力
が、しきい値として選択器6より出力される。選択器6
より出力されるしきい値と、漏洩積分器4より出力され
る積分値との大小比較を判別器10において行ない、積分
値がしきい値より大なる場合は音声入力区間と判定し、
小なる場合は音声休止区間と判定する。この判定結果は
有声無声処理器11に入力され、音声入力区間の場合は従
来技術と同じ処理を行い、音声休止区間の場合は入力信
号に拘らず無声として処理されて符号器出力12となる。
次に本実施例における各部信号の時間変化例を第2図、
第3図により説明する。第2図は入力される音声信号を
表わし、第3図は各部信号のレベル値を示している。し
きい値は音声入力前は設定された最小値にあり、音声入
力により漏洩積分値が増大すると減衰器5の出力(破線
曲線)の方がしきい値より大となり、しきい値としては
減衰器5の出力が選択されて比較選択器6の出力とな
る。漏洩積分値がしきい値より大きくなったことで音声
入力区間に入ったと判定される。漏洩積分値がピークよ
り下がると比較選択器6からは、前回フレームのしきい
値を一定の割合で、実施例では9/10のレベルに、減少さ
せた値がしきい値として出力される。そして、このしき
い値と漏洩積分値とが判定器10で比較され、判定され
る。漏洩積分値が低下してしきい値に達する時点までは
音声入力区間と判定され、漏洩積分値がしきい値を下ま
わり次にしきい値を上まわるまでの区間は音声休止区間
となり、この区間内にある小レベルの雑音は第1図の有
声無声処理器において無声として処理される。
以上、本実施例によれば、音声入力区間では従来技術と
同等の通常処理が実行され、音声休止区間では、小レベ
ル雑音はすべて無声として処理されるので周囲雑音が奇
異な合成音となって出力されることはなく、従来技術で
の問題点が解決される。
〔発明の効果〕
以上説明したように、本発明によれば、周囲雑音存在下
での会話に際し、音声入力区間においては従来技術にお
ける音声品質を確保し、音声休止区間においては従来技
術において奇異な感じを与えていた合成音を耳ざわりの
ないものとすることができる効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック構成図、第2図は
実施例における入力音声信号の一例を示す図、第3図は
第1図中の各部信号の時間変化を示す図である。 〈符号の説明〉 1……音声信号入力、2……音声分析器 3……パワー演算器、4……漏洩積分器 5,8……減衰器、6……比較選択器 7……1フレーム遅延器 9……大小比較器、10……判定器 11……有声無声処理器、12……符号器出力
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 俊郎 東京都国分寺市東恋ヶ窪1丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 昭56−134857(JP,A) 特開 昭60−107933(JP,A)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】音声信号をディジタル符号に符号化し、該
    ディジタル符号を復号して音声信号を再生する音声符号
    化方式において、音声信号の一定時間間隔毎のパワーを
    算出する手段と、該パワーを上記一定時間間隔単位に積
    分する手段と、該積分値を一定の割合で減衰した値を求
    める第1の減衰器と、この減衰値を一方の入力としてし
    きい値を選択出力するしきい値選択器と、この出力しき
    い値を前記一定時間間隔だけ遅らせて出力する遅延器
    と、この遅延器出力を前記とは異なる一定の割合で減衰
    した値を求めて上記しきい値選択器に他方の入力として
    与える第2の減衰器と、上記第1の減衰器出力と上記遅
    延器出力との大小比較により上記しきい値選択器を制御
    してその2入力中の大きい値の方をしきい値として出力
    させる手段と、該しきい値と前記積分値との比較結果に
    より音声の有無を判定する手段とを備えたことを特徴と
    する音声符号化方式。
  2. 【請求項2】前記一定時間間隔は、入力音声信号のパラ
    メータをフレーム毎に抽出して有声、無声の判定を行っ
    て音声を分析合成する音声分析合成器のフレームであ
    り、前記判定手段は、前記しきい値と前記積分値との比
    較結果に基づき音声が無いと判定されたフレームにおい
    ては入力信号にかかわらず無声と判定することを特徴と
    する特許請求の範囲第1項記載の音声符号化方式。
JP61117416A 1986-05-23 1986-05-23 音声符号化方式 Expired - Lifetime JPH0748695B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61117416A JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式
US07/052,395 US4918734A (en) 1986-05-23 1987-05-21 Speech coding system using variable threshold values for noise reduction
CA000537601A CA1326912C (en) 1986-05-23 1987-05-21 Speech coding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61117416A JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式

Publications (2)

Publication Number Publication Date
JPS62274941A JPS62274941A (ja) 1987-11-28
JPH0748695B2 true JPH0748695B2 (ja) 1995-05-24

Family

ID=14711102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61117416A Expired - Lifetime JPH0748695B2 (ja) 1986-05-23 1986-05-23 音声符号化方式

Country Status (3)

Country Link
US (1) US4918734A (ja)
JP (1) JPH0748695B2 (ja)
CA (1) CA1326912C (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5036540A (en) * 1989-09-28 1991-07-30 Motorola, Inc. Speech operated noise attenuation device
JPH03132700A (ja) * 1989-10-18 1991-06-06 Victor Co Of Japan Ltd 音声の適応直交変換符号化方法
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US6411928B2 (en) * 1990-02-09 2002-06-25 Sanyo Electric Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
EP0747879B1 (en) * 1990-05-28 2002-08-07 Matsushita Electric Industrial Co., Ltd. Voice signal coding system
US5134658A (en) * 1990-09-27 1992-07-28 Advanced Micro Devices, Inc. Apparatus for discriminating information signals from noise signals in a communication signal
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
CA2110090C (en) * 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
JP2586827B2 (ja) * 1994-07-20 1997-03-05 日本電気株式会社 受信装置
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6115589A (en) * 1997-04-29 2000-09-05 Motorola, Inc. Speech-operated noise attenuation device (SONAD) control system method and apparatus
US5970441A (en) * 1997-08-25 1999-10-19 Telefonaktiebolaget Lm Ericsson Detection of periodicity information from an audio signal
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6282430B1 (en) * 1999-01-01 2001-08-28 Motorola, Inc. Method for obtaining control information during a communication session in a radio communication system
US6321194B1 (en) * 1999-04-27 2001-11-20 Brooktrout Technology, Inc. Voice detection in audio signals
WO2001084724A2 (en) 2000-04-28 2001-11-08 Broadcom Corporation Methods and systems for adaptive receiver equalization

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4219695A (en) * 1975-07-07 1980-08-26 International Communication Sciences Noise estimation system for use in speech analysis
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
FR2466825A1 (fr) * 1979-09-28 1981-04-10 Thomson Csf Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif
US4449190A (en) * 1982-01-27 1984-05-15 Bell Telephone Laboratories, Incorporated Silence editing speech processor
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen

Also Published As

Publication number Publication date
US4918734A (en) 1990-04-17
JPS62274941A (ja) 1987-11-28
CA1326912C (en) 1994-02-08

Similar Documents

Publication Publication Date Title
JPH0748695B2 (ja) 音声符号化方式
RU2146394C1 (ru) Способ и устройство вокодирования переменной скорости при пониженной скорости кодирования
JP4222951B2 (ja) 紛失フレームを取扱うための音声通信システムおよび方法
JP4585855B2 (ja) 音声その他のオーディオ素材を有する信号中の音声の大きさの制御
KR100302370B1 (ko) 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
EP0993670B1 (en) Method and apparatus for speech enhancement in a speech communication system
US7379866B2 (en) Simple noise suppression model
JPH07193548A (ja) 雑音低減処理方法
KR20040005860A (ko) 음성 통신에서의 위로 잡음 생성 방법 및 시스템
JP2002237785A (ja) 人間の聴覚補償によりsidフレームを検出する方法
US5890109A (en) Re-initializing adaptive parameters for encoding audio signals
EP2743923B1 (en) Voice processing device, voice processing method
US6424942B1 (en) Methods and arrangements in a telecommunications system
JPH0644195B2 (ja) エネルギ正規化および無声フレーム抑制機能を有する音声分析合成システムおよびその方法
CN1044293C (zh) 背景音的编码/译码方法和设备
CN103812462B (zh) 响度控制方法及装置
CN113571072B (zh) 一种语音编码方法、装置、设备、存储介质及产品
JP3270922B2 (ja) 符号化,復号化方法及び符号化,復号化装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JP2905112B2 (ja) 環境音分析装置
GB2343822A (en) Using LSP to alter frequency characteristics of speech
JP2022547860A (ja) コンテキスト適応の音声了解度を向上させる方法
JPH0832526A (ja) 音声検出器
HK40054504B (en) Speech coding method, device and apparatus, storage medium and product
HK40054504A (en) Speech coding method, device and apparatus, storage medium and product