JP2616549B2 - 音声復号装置 - Google Patents
音声復号装置Info
- Publication number
- JP2616549B2 JP2616549B2 JP5310521A JP31052193A JP2616549B2 JP 2616549 B2 JP2616549 B2 JP 2616549B2 JP 5310521 A JP5310521 A JP 5310521A JP 31052193 A JP31052193 A JP 31052193A JP 2616549 B2 JP2616549 B2 JP 2616549B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- random number
- section
- unit
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【0001】
【産業上の利用分野】本発明は音声信号に重畳した背景
雑音を良好に符号化再生する方式に関し、特に、背景雑
音に関する補助情報を送信側から伝送することなしに、
受信側のみの処理で背景雑音の再現性を向上させ音質を
向上させる音声復号化装置に関する。
雑音を良好に符号化再生する方式に関し、特に、背景雑
音に関する補助情報を送信側から伝送することなしに、
受信側のみの処理で背景雑音の再現性を向上させ音質を
向上させる音声復号化装置に関する。
【0002】
【従来の技術】音声信号を低いビットレートで伝送する
音声符号化、復号化方式として、M.Schroede
r and B.Atal氏による”Code−exc
ited linear predicition:H
igh−quality speech at ver
y low bit rate”と題した論文(Pro
c ICASSP,pp.937−940,1985)
(文献1)等に記載されたCELP方式が知られてい
る。また、CELP方式の低ビットレートにおける音質
を改良した方式として、特開平3−243999号公報
(文献2)等に示された方式が知られている。
音声符号化、復号化方式として、M.Schroede
r and B.Atal氏による”Code−exc
ited linear predicition:H
igh−quality speech at ver
y low bit rate”と題した論文(Pro
c ICASSP,pp.937−940,1985)
(文献1)等に記載されたCELP方式が知られてい
る。また、CELP方式の低ビットレートにおける音質
を改良した方式として、特開平3−243999号公報
(文献2)等に示された方式が知られている。
【0003】
【発明が解決しようとする課題】上述した文献1、2の
従来方法では、音声に背景雑音が重畳した場合、特に
4.8kb/s以下の低ビットレートでは、非音声区間
における背景雑音を良好に表わすことが困難で、音質が
大幅に劣化するという問題点があった。
従来方法では、音声に背景雑音が重畳した場合、特に
4.8kb/s以下の低ビットレートでは、非音声区間
における背景雑音を良好に表わすことが困難で、音質が
大幅に劣化するという問題点があった。
【0004】本発明の目的は、上述した問題点を解決
し、音声符号化の部分には何等変更を加えることなく、
また、符号化側から何等補助情報を追加して伝送する必
要なく、音声復号化のみの処理で、背景雑音信号を良好
に再現することのできる音声復号装置を提供することに
ある。
し、音声符号化の部分には何等変更を加えることなく、
また、符号化側から何等補助情報を追加して伝送する必
要なく、音声復号化のみの処理で、背景雑音信号を良好
に再現することのできる音声復号装置を提供することに
ある。
【0005】
【課題を解決するための手段】第1の発明によれば、ス
ペクトルパラメータと平均振幅とピッチ周期と音源信号
に関するインデックスを受信して復号する復号部と、前
記スペクトルパラメータと前記平均振幅と前記ピッチ周
期の少なくとも一つを用いて非音声区間と音声区間を検
出する音声検出部と、前記復号部の出力を用いて信号を
再生する第1の信号再生部と、前記非音声区間において
あらかじめ定められた乱数符号帳を探索し、乱数符号帳
にあらかじめ格納された乱数コードベクトルのうち再生
されたときの再生信号が前記信号再生部の出力信号に近
くなるような乱数コードベクトルを選択する探索部と、
選択された乱数コードベクトルによる再生信号を出力す
る第2の信号再生部とを有することを特徴とする音声復
号装置が得られる。
ペクトルパラメータと平均振幅とピッチ周期と音源信号
に関するインデックスを受信して復号する復号部と、前
記スペクトルパラメータと前記平均振幅と前記ピッチ周
期の少なくとも一つを用いて非音声区間と音声区間を検
出する音声検出部と、前記復号部の出力を用いて信号を
再生する第1の信号再生部と、前記非音声区間において
あらかじめ定められた乱数符号帳を探索し、乱数符号帳
にあらかじめ格納された乱数コードベクトルのうち再生
されたときの再生信号が前記信号再生部の出力信号に近
くなるような乱数コードベクトルを選択する探索部と、
選択された乱数コードベクトルによる再生信号を出力す
る第2の信号再生部とを有することを特徴とする音声復
号装置が得られる。
【0006】また、第2の発明によれば、スペクトルパ
ラメータと平均振幅とピッチ周期と音源信号に関するイ
ンデクスを受信して復号する復号部と、前記スペクトル
パラメータと前記平均振幅と前記ピッチ周期の少なくと
も一つを用いて非音声区間と音声区間を検出する音声検
出部と、前記復号部の出力を用いて駆動信号を作成する
駆動信号構成部と、前記非音声区間において、あらかじ
め定められた乱数符号帳を探索し、乱数符号帳にあらか
じめ格納された乱数コードベクトルのうち前記駆動信号
に近いような乱数コードベクトルを選択する探索部と、
選択された乱数コードベクトルによる再生信号を出力す
る信号再生部とを有することを特徴とする音声復号装置
が得られる。
ラメータと平均振幅とピッチ周期と音源信号に関するイ
ンデクスを受信して復号する復号部と、前記スペクトル
パラメータと前記平均振幅と前記ピッチ周期の少なくと
も一つを用いて非音声区間と音声区間を検出する音声検
出部と、前記復号部の出力を用いて駆動信号を作成する
駆動信号構成部と、前記非音声区間において、あらかじ
め定められた乱数符号帳を探索し、乱数符号帳にあらか
じめ格納された乱数コードベクトルのうち前記駆動信号
に近いような乱数コードベクトルを選択する探索部と、
選択された乱数コードベクトルによる再生信号を出力す
る信号再生部とを有することを特徴とする音声復号装置
が得られる。
【0007】また、第3の発明によれば、第1の発明に
おける信号再生部において、非音声区間においては、平
均振幅をあらかじめ抑圧させて信号を再生する第1の信
号再生部を有することを特徴とする音声復号装置が得ら
れる。
おける信号再生部において、非音声区間においては、平
均振幅をあらかじめ抑圧させて信号を再生する第1の信
号再生部を有することを特徴とする音声復号装置が得ら
れる。
【0008】また、第4の発明によれば、第2の発明に
おける信号再生部において、非音声区間においては、平
均振幅をあらかじめ抑圧させて信号を再生する信号再生
部を有することを特徴とする音声復号装置が得られる。
おける信号再生部において、非音声区間においては、平
均振幅をあらかじめ抑圧させて信号を再生する信号再生
部を有することを特徴とする音声復号装置が得られる。
【0009】また、第5の発明によれば、第1または第
3の発明における探索部において、乱数符号帳をあらか
じめ定められた時間区間毎に更新することを特徴とする
音声復号化装置が得られる。
3の発明における探索部において、乱数符号帳をあらか
じめ定められた時間区間毎に更新することを特徴とする
音声復号化装置が得られる。
【0010】さらに第6の発明によれば、第2または第
4の発明における探索部において、乱数符号帳をあらか
じめ定められた時間区間毎に更新することを特徴とする
音声復号化装置が得られる。
4の発明における探索部において、乱数符号帳をあらか
じめ定められた時間区間毎に更新することを特徴とする
音声復号化装置が得られる。
【0011】
【作用】本発明による音声復号化装置の作用を示す。
【0012】第1の発明では、あらかじめ定められた時
間間隔(フレーム)毎にスペクトルパラメータと平均振
幅とピッチ周期と音源信号に関するインデクスを符号化
側から受信して復号し、前記スペクトルパラメータと前
記平均振幅と前記ピッチ周期の少なくとも一つを例えば
平均振幅にしきい値をあてはめて判別する方法や、J.
Lynch,Jr.氏らによる”Speech/sil
ence segmentation for rea
l−time coding via rule ba
sed adaptive endpoint det
ection”と題した論文(Proc.ICASS
P,pp.1348−1351,1987)(文献3)
に記載の方法等を用いることができる。
間間隔(フレーム)毎にスペクトルパラメータと平均振
幅とピッチ周期と音源信号に関するインデクスを符号化
側から受信して復号し、前記スペクトルパラメータと前
記平均振幅と前記ピッチ周期の少なくとも一つを例えば
平均振幅にしきい値をあてはめて判別する方法や、J.
Lynch,Jr.氏らによる”Speech/sil
ence segmentation for rea
l−time coding via rule ba
sed adaptive endpoint det
ection”と題した論文(Proc.ICASS
P,pp.1348−1351,1987)(文献3)
に記載の方法等を用いることができる。
【0013】信号再生部では、前記受信した音源信号、
ピッチ周期、平均振幅を用いて駆動信号を計算し、さら
にスペクトルパラメータを用いて構成されるフィルタを
駆動して信号s(n)を再生する。探索部では、あらか
じめ定められたビット数の乱数信号コードベクトルcj
(n)の集合をコードブックとして蓄積しておき、下式
Dj を最大化するコードベクトルcj (n)を探索す
る。
ピッチ周期、平均振幅を用いて駆動信号を計算し、さら
にスペクトルパラメータを用いて構成されるフィルタを
駆動して信号s(n)を再生する。探索部では、あらか
じめ定められたビット数の乱数信号コードベクトルcj
(n)の集合をコードブックとして蓄積しておき、下式
Dj を最大化するコードベクトルcj (n)を探索す
る。
【0014】
【数1】
【0015】ここで、s(n)は信号再生部で得られる
再生信号、h(n)はフィルタに使用するスペクトルパ
ラメータから求めたインパルス応答である。
再生信号、h(n)はフィルタに使用するスペクトルパ
ラメータから求めたインパルス応答である。
【0016】第2の発明の作用で第1の発明と異なる点
は、乱数信号コードベクトルを探索するときに、
(1)、(2)式のかわりに、下式を使用する点であ
る。
は、乱数信号コードベクトルを探索するときに、
(1)、(2)式のかわりに、下式を使用する点であ
る。
【0017】
【数2】
【0018】ただし、v(n)は第1の発明の作用で述
べた駆動信号である。
べた駆動信号である。
【0019】第3の発明の作用では、第1の発明の作用
において、信号再生部で信号を再生するときに、非音声
区間における平均振幅をあらかじめ定められた量だけ抑
圧して信号を再生することを特徴とする。
において、信号再生部で信号を再生するときに、非音声
区間における平均振幅をあらかじめ定められた量だけ抑
圧して信号を再生することを特徴とする。
【0020】第4の発明では、第2の発明の作用におい
て、信号再生部で信号を再生するときに、非音声区間に
おける平均振幅をあらかじめ定められた量だけ抑圧して
信号を再生することを特徴とする。
て、信号再生部で信号を再生するときに、非音声区間に
おける平均振幅をあらかじめ定められた量だけ抑圧して
信号を再生することを特徴とする。
【0021】第5の発明の作用では、第1、あるいは、
第3の発明において、乱数信号コードブックにおけるコ
ードベクトルの内容を、あらかじめ定められた規則によ
り、あらかじめ定められた時間間隔毎に更新することを
特徴とする。
第3の発明において、乱数信号コードブックにおけるコ
ードベクトルの内容を、あらかじめ定められた規則によ
り、あらかじめ定められた時間間隔毎に更新することを
特徴とする。
【0022】第6の発明の作用では、第2、あるいは、
第4の発明において、乱数信号コードブックにおけるコ
ードベクトルの内容を、あらかじめ定められた規則によ
り、あらかじめ定められた時間間隔毎に更新することを
特徴とする。
第4の発明において、乱数信号コードブックにおけるコ
ードベクトルの内容を、あらかじめ定められた規則によ
り、あらかじめ定められた時間間隔毎に更新することを
特徴とする。
【0023】
【実施例】図1は、第1の発明の一実施例を示すブロッ
ク図である。
ク図である。
【0024】図1において、あらかじめ定められた時間
間隔(以下、フレームと呼ぶ。時間長は例えば20ms
とする)で、入力端子100からスペクトルパラメータ
(以下では、例えばLSP係数を使用するものとする)
と平均振幅とピッチ周期と音源信号に関するインデクス
を入力し、復号回路110は、これらを復号化し出力す
る。音声検出回路120は、復号化された前記スペクト
ルパラメータ、前記平均振幅、前記ピッチ周期、前記音
源信号のうち、少なくとも一つのパラメータを用いて音
声区間と非音声区間の判別をフレーム毎に行い、音声区
間か非音声区間かを示す情報を出力する。音声区間と非
音声区間の判別には、作用に示した方法や、前記文献3
や、他の周知な方法を用いることができる。
間隔(以下、フレームと呼ぶ。時間長は例えば20ms
とする)で、入力端子100からスペクトルパラメータ
(以下では、例えばLSP係数を使用するものとする)
と平均振幅とピッチ周期と音源信号に関するインデクス
を入力し、復号回路110は、これらを復号化し出力す
る。音声検出回路120は、復号化された前記スペクト
ルパラメータ、前記平均振幅、前記ピッチ周期、前記音
源信号のうち、少なくとも一つのパラメータを用いて音
声区間と非音声区間の判別をフレーム毎に行い、音声区
間か非音声区間かを示す情報を出力する。音声区間と非
音声区間の判別には、作用に示した方法や、前記文献3
や、他の周知な方法を用いることができる。
【0025】駆動信号構成回路140には、前記復号化
パラメータのうち、音源信号c(n)、平均振幅r、ピ
ッチ周期Tを用いて、駆動信号v(n)を計算する。こ
こで、v(n)の計算には、例えば前記文献2に記載さ
れた方法を参照することができる。
パラメータのうち、音源信号c(n)、平均振幅r、ピ
ッチ周期Tを用いて、駆動信号v(n)を計算する。こ
こで、v(n)の計算には、例えば前記文献2に記載さ
れた方法を参照することができる。
【0026】第1の信号再生回路160は、前記復号化
されたスペクトルパラメータ(例えばLSP係数)l
(i)を入力し、線形予測係数α(i)に変換する。こ
こで、LSP係数から線形予測係数への変換は、例え
ば、Sugamura他による“Quantizer
design in LSP speech anal
ysissynthesis”と題した論文(IEEE
J.Sel.AreasCommun.,pp.42
5−431、1988)(文献4)等を参照できる。さ
らに、次式に従い、駆動信号をフィルタリングして再生
信号を求める。
されたスペクトルパラメータ(例えばLSP係数)l
(i)を入力し、線形予測係数α(i)に変換する。こ
こで、LSP係数から線形予測係数への変換は、例え
ば、Sugamura他による“Quantizer
design in LSP speech anal
ysissynthesis”と題した論文(IEEE
J.Sel.AreasCommun.,pp.42
5−431、1988)(文献4)等を参照できる。さ
らに、次式に従い、駆動信号をフィルタリングして再生
信号を求める。
【0027】
【数3】
【0028】ここで、s(n)は再生信号、pは線形予
測係数の次数である。
測係数の次数である。
【0029】探索回路180は、音声検出回路120の
出力が非音声区間を示すフレームでは、コードブック2
00に格納された乱数コードベクトルを探索し、s
(n)を良好に表す乱数コードベクトルを選択する。こ
こで、探索は作用の項の(1)、(2)式を用い、
(1)式を最大化するコードベクトルを選択する。ただ
し、(2)式のインパルス応答h(n)は、線形予測係
数から変換して求めておく。線形予測係数からインパス
ル応答への変換は,例えば前記文献2等を参照できる。
コードブック200に格納する乱数コードベクトルとし
ては、例えばガウス乱数を使用することができる。ガウ
ス乱数の発生法は例えば前記文献1等を参照できる。
出力が非音声区間を示すフレームでは、コードブック2
00に格納された乱数コードベクトルを探索し、s
(n)を良好に表す乱数コードベクトルを選択する。こ
こで、探索は作用の項の(1)、(2)式を用い、
(1)式を最大化するコードベクトルを選択する。ただ
し、(2)式のインパルス応答h(n)は、線形予測係
数から変換して求めておく。線形予測係数からインパス
ル応答への変換は,例えば前記文献2等を参照できる。
コードブック200に格納する乱数コードベクトルとし
ては、例えばガウス乱数を使用することができる。ガウ
ス乱数の発生法は例えば前記文献1等を参照できる。
【0030】さらに、探索回路180は、次式によりゲ
インgj を計算する。
インgj を計算する。
【0031】
【数4】
【0032】探索回路180は、選択された乱数コード
ベクトルとゲインを用いて、次式により駆動信号v’
(n)を計算しなおし、信号再生回路210へ出力す
る。
ベクトルとゲインを用いて、次式により駆動信号v’
(n)を計算しなおし、信号再生回路210へ出力す
る。
【0033】 v’(n)=gj (n)cj (n) (7) 信号再生回路210は、v’(n)を入力して、次式を
用いて信号x(n)を再生しなおす。
用いて信号x(n)を再生しなおす。
【0034】
【数5】
【0035】スイッチ220では、音声区間では、第1
の信号再生回路160の出力であるs(n)を出力し、
非音声区間では信号再生回路210の出力であるx
(n)を端子230を通して出力する。
の信号再生回路160の出力であるs(n)を出力し、
非音声区間では信号再生回路210の出力であるx
(n)を端子230を通して出力する。
【0036】以上で、第1の発明の実施例の説明を終え
る。
る。
【0037】図2は、第2の発明の一実施例を示すブロ
ック図である。図において、図1と同一の番号を付した
構成要素は、図1と同一の動作を行うので、説明は省略
する。
ック図である。図において、図1と同一の番号を付した
構成要素は、図1と同一の動作を行うので、説明は省略
する。
【0038】図において、探索回路250は、作用の項
の(3)式を最大化するコードベクトルcj (n)をコ
ードブック200から探索する。さらに、下式を用いて
ゲインgj (n)を計算する。
の(3)式を最大化するコードベクトルcj (n)をコ
ードブック200から探索する。さらに、下式を用いて
ゲインgj (n)を計算する。
【0039】
【数6】
【0040】ここで、v(n)は駆動信号構成回路14
0の出力である。
0の出力である。
【0041】さらに、次式に従い、音源信号v’(n)
を求めて探索回路240へ出力する。
を求めて探索回路240へ出力する。
【0042】 v’(n)=gj ・cj (n) (10) スイッチ240は、音声区間のときは、駆動信号構成回
路140の出力であるv(n)を出力し、非音声区間で
は、探索回路250の出力であるv’(n)を信号再生
回路210へ出力する。
路140の出力であるv(n)を出力し、非音声区間で
は、探索回路250の出力であるv’(n)を信号再生
回路210へ出力する。
【0043】以上で、第2の発明の実施例の説明を終え
る。
る。
【0044】図3は、第3の発明の一実施例を示すブロ
ック図である。図においては、図1と同一の番号を付し
た構成要素は、図1と同一の動作を行うので、説明は省
略する。
ック図である。図においては、図1と同一の番号を付し
た構成要素は、図1と同一の動作を行うので、説明は省
略する。
【0045】抑圧回路300は、音声検出回路120の
出力を入力し、非音声区間では、復号回路100の出力
の平均振幅rをあらかじめ定められた量(例えば6d
B)だけ抑圧した後に、駆動信号構成回路140に出力
する。このような構成とすることにより、非音声区間に
おいて、背景雑音などが重畳している場合、背景雑音の
抑圧を行うことができる。
出力を入力し、非音声区間では、復号回路100の出力
の平均振幅rをあらかじめ定められた量(例えば6d
B)だけ抑圧した後に、駆動信号構成回路140に出力
する。このような構成とすることにより、非音声区間に
おいて、背景雑音などが重畳している場合、背景雑音の
抑圧を行うことができる。
【0046】図4は、第4の発明の一実施例を示すブロ
ック図である。図において、図1、図3と同一の番号を
付した構成要素は,図1,図3と同一の動作を行うの
で、説明は省略する。以上で第4の発明の実施例の説明
を終える。
ック図である。図において、図1、図3と同一の番号を
付した構成要素は,図1,図3と同一の動作を行うの
で、説明は省略する。以上で第4の発明の実施例の説明
を終える。
【0047】図5は第5の発明の一実施例を示すブロッ
ク図である。図においては、図1と同一の番号を付した
構成要素は、図1と同一の動作を行うので、説明は省略
する。
ク図である。図においては、図1と同一の番号を付した
構成要素は、図1と同一の動作を行うので、説明は省略
する。
【0048】図において、更新回路320は、コードブ
ック200に格納された乱数コードベクトルを、あらか
じめ定められた時間間隔(例えばフレーム間隔)毎に、
あらかじめ定められた規則に従い、更新する。この規則
は、例えば、乱数を発生させるときの基準値をかえると
いうものが考えられる。更新するときは、コードブック
200の全てのコードベクトルを一度に更新してもよい
し、あらかじめ定めておいた一部のコードベクトルにつ
いて更新してもよい。また、更新は、非音声区間が連続
するときに行ってもよいし、そうでなくてもよい。
ック200に格納された乱数コードベクトルを、あらか
じめ定められた時間間隔(例えばフレーム間隔)毎に、
あらかじめ定められた規則に従い、更新する。この規則
は、例えば、乱数を発生させるときの基準値をかえると
いうものが考えられる。更新するときは、コードブック
200の全てのコードベクトルを一度に更新してもよい
し、あらかじめ定めておいた一部のコードベクトルにつ
いて更新してもよい。また、更新は、非音声区間が連続
するときに行ってもよいし、そうでなくてもよい。
【0049】このような構成とすることにより、乱数コ
ードブックのコードベクトルの種類を増やし、よりラン
ダム化させることが可能となるために、非音声区間にお
ける背景雑音信号をより良好に表すことができる。特
に,乱数コードブックのビット数が少ないときに有効と
なる。
ードブックのコードベクトルの種類を増やし、よりラン
ダム化させることが可能となるために、非音声区間にお
ける背景雑音信号をより良好に表すことができる。特
に,乱数コードブックのビット数が少ないときに有効と
なる。
【0050】以上で第5の発明の実施例の説明を終え
る。
る。
【0051】図6は、第6の発明の一実施例を示すブロ
ック図である。図において、図2、図5と同一の番号を
付した構成要素は、図2、図5と同一の動作を行うの
で、説明は省略する。以上で第6の発明の実施例の説明
を終える。
ック図である。図において、図2、図5と同一の番号を
付した構成要素は、図2、図5と同一の動作を行うの
で、説明は省略する。以上で第6の発明の実施例の説明
を終える。
【0052】図6は、第6の発明の一実施例を示すブロ
ック図である。図において、図2、図5と同一の番号を
付した構成要素は、図2、図5と同一の動作を行うの
で、説明は省略する。以上で第6の発明の実施例の説明
を終える。
ック図である。図において、図2、図5と同一の番号を
付した構成要素は、図2、図5と同一の動作を行うの
で、説明は省略する。以上で第6の発明の実施例の説明
を終える。
【0053】以上述べた実施例において、本発明の意図
を変更することなく、種々の変形が可能である。
を変更することなく、種々の変形が可能である。
【0054】例えば,コードブック回路200に格納す
るコードベクトルは、他の周知な統計的性質を有するコ
ードベクトルを用いることができる。
るコードベクトルは、他の周知な統計的性質を有するコ
ードベクトルを用いることができる。
【0055】また、スペクトルパラメータは、LSP以
外の他のパラメータでもよい。
外の他のパラメータでもよい。
【0056】
【発明の効果】以上述べたように、本発明によれば、音
声に背景雑音が重畳したときに、低ビットレートでも、
音声復号化部のみの処理で、背景雑音を良好に表すこと
ができるという大きな効果がある。さらに、背景雑音を
抑圧できるとう効果もある。
声に背景雑音が重畳したときに、低ビットレートでも、
音声復号化部のみの処理で、背景雑音を良好に表すこと
ができるという大きな効果がある。さらに、背景雑音を
抑圧できるとう効果もある。
【図1】第1の発明の一実施例を示す図。
【図2】第2の発明の一実施例を示す図。
【図3】第3の発明の一実施例を示す図。
【図4】第4の発明の一実施例を示す図。
【図5】第5の発明の一実施例を示す図。
【図6】第6の発明の一実施例を示す図。
110 復号回路 120 音声検出回路 140 駆動信号構成回路 160,210 信号再生回路 180,250 探索回路 200 コードブック 220,240 スイッチ 300 抑圧回路 320 更新回路
Claims (6)
- 【請求項1】 スペクトルパラメータと平均振幅とピッ
チ周期と音源信号に関するインデックスを受信して復号
する復号部と、前記スペクトルパラメータと前記平均振
幅と前記ピッチ周期の少なくとも一つを用いて非音声区
間と音声区間を検出する音声検出部と、前記復号部の出
力を用いて信号を再生する第1の信号再生部と、前記非
音声区間においてあらかじめ定められた乱数符号帳を探
索し、乱数符号帳にあらかじめ格納された乱数コードベ
クトルのうち再生されたときの再生信号が前記信号再生
部の出力信号に近くなるような乱数コードベクトルを選
択する探索部と、選択された乱数コードベクトルによる
再生信号を出力する第2の信号再生部とを有することを
特徴とする音声復号装置。 - 【請求項2】 スペクトルパラメータと平均振幅とピッ
チ周期と音源信号に関するインデクスを受信して復号す
る復号部と、前記スペクトルパラメータと前記平均振幅
と前記ピッチ周期の少なくとも一つを用いて非音声区間
と音声区間を検出する音声検出部と、前記復号部の出力
を用いて駆動信号を作成する駆動信号構成部と、前記非
音声区間において、あらかじめ定められた乱数符号帳を
探索し、乱数符号帳にあらかじめ格納された乱数コード
ベクトルのうち前記駆動信号に近いような乱数コードベ
クトルを選択する探索部と、選択された乱数コードベク
トルによる再生信号を出力する信号再生部とを有するこ
とを特徴とする音声復号装置。 - 【請求項3】 非音声区間においては、平均振幅をあら
かじめ抑圧させて信号を再生する第1の信号再生部を有
することを特徴とする請求項1記載の音声復号装置。 - 【請求項4】 非音声区間においては、平均振幅をあら
かじめ抑圧させて信号を再生する信号再生部を有するこ
とを特徴とする請求項2記載の音声復号装置。 - 【請求項5】 前記探索部において、乱数符号帳をあら
かじめ定められた時間区間毎に更新することを特徴とす
る請求項1又は3記載の音声復号化装置。 - 【請求項6】 前記探索部において、乱数符号帳をあら
かじめ定められた時間区間毎に更新することを特徴とす
る請求項2又は4記載の音声復号化装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5310521A JP2616549B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
CA002137416A CA2137416C (en) | 1993-12-10 | 1994-12-06 | Speech decoder capable of reproducing well background noise |
DE69425226T DE69425226T2 (de) | 1993-12-10 | 1994-12-07 | Sprachdekoder zur Erzeugung von Hintergrundgeräuschen |
US08/350,889 US5677985A (en) | 1993-12-10 | 1994-12-07 | Speech decoder capable of reproducing well background noise |
EP94119343A EP0657872B1 (en) | 1993-12-10 | 1994-12-07 | Speech decoder capable of reproducing background noise |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5310521A JP2616549B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07160294A JPH07160294A (ja) | 1995-06-23 |
JP2616549B2 true JP2616549B2 (ja) | 1997-06-04 |
Family
ID=18006236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5310521A Expired - Fee Related JP2616549B2 (ja) | 1993-12-10 | 1993-12-10 | 音声復号装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5677985A (ja) |
EP (1) | EP0657872B1 (ja) |
JP (1) | JP2616549B2 (ja) |
CA (1) | CA2137416C (ja) |
DE (1) | DE69425226T2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3157116B2 (ja) * | 1996-03-29 | 2001-04-16 | 三菱電機株式会社 | 音声符号化伝送システム |
GB2312360B (en) * | 1996-04-12 | 2001-01-24 | Olympus Optical Co | Voice signal coding apparatus |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
GB2338630B (en) * | 1998-06-20 | 2000-07-26 | Motorola Ltd | Speech decoder and method of operation |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP3566197B2 (ja) | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
JP4282520B2 (ja) * | 2004-03-24 | 2009-06-24 | シャープ株式会社 | 信号処理方法、信号出力装置、信号処理装置、画像処理装置、及び画像形成装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58171095A (ja) * | 1982-03-31 | 1983-10-07 | 富士通株式会社 | 雑音抑圧方式 |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP3256215B2 (ja) * | 1990-02-22 | 2002-02-12 | 日本電気株式会社 | 音声符号化装置 |
EP0443548B1 (en) * | 1990-02-22 | 2003-07-23 | Nec Corporation | Speech coder |
JP2518765B2 (ja) * | 1991-05-31 | 1996-07-31 | 国際電気株式会社 | 音声符号化通信方式及びその装置 |
JP3167385B2 (ja) * | 1991-10-28 | 2001-05-21 | 日本電信電話株式会社 | 音声信号伝送方法 |
-
1993
- 1993-12-10 JP JP5310521A patent/JP2616549B2/ja not_active Expired - Fee Related
-
1994
- 1994-12-06 CA CA002137416A patent/CA2137416C/en not_active Expired - Fee Related
- 1994-12-07 US US08/350,889 patent/US5677985A/en not_active Expired - Lifetime
- 1994-12-07 EP EP94119343A patent/EP0657872B1/en not_active Expired - Lifetime
- 1994-12-07 DE DE69425226T patent/DE69425226T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0657872B1 (en) | 2000-07-12 |
CA2137416C (en) | 1998-11-24 |
EP0657872A2 (en) | 1995-06-14 |
JPH07160294A (ja) | 1995-06-23 |
DE69425226D1 (de) | 2000-08-17 |
DE69425226T2 (de) | 2001-03-01 |
US5677985A (en) | 1997-10-14 |
CA2137416A1 (en) | 1995-06-11 |
EP0657872A3 (en) | 1997-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP2616549B2 (ja) | 音声復号装置 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP2001134296A (ja) | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 | |
JPH07129195A (ja) | 音声復号化装置 | |
JPH10177398A (ja) | 音声符号化装置 | |
JP2002140099A (ja) | 音声復号化装置 | |
JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
JPH0782360B2 (ja) | 音声分析合成方法 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3798433B2 (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
JPH08185199A (ja) | 音声符号化装置 | |
JP3471542B2 (ja) | 音声符号化装置 | |
JP3515216B2 (ja) | 音声符号化装置 | |
JPH09179593A (ja) | 音声符号化装置 | |
JP2008090311A (ja) | 音声符号化方法 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3101430B2 (ja) | 音声伝送方式 | |
JPH07271397A (ja) | 音声符号化装置 | |
JP2004061558A (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 | |
JP2775533B2 (ja) | 音声の長期予測装置 | |
JP3332132B2 (ja) | 音声符号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19970114 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080311 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090311 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090311 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100311 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |