JPH0398318A - 音声符号化方式 - Google Patents
音声符号化方式Info
- Publication number
- JPH0398318A JPH0398318A JP1235274A JP23527489A JPH0398318A JP H0398318 A JPH0398318 A JP H0398318A JP 1235274 A JP1235274 A JP 1235274A JP 23527489 A JP23527489 A JP 23527489A JP H0398318 A JPH0398318 A JP H0398318A
- Authority
- JP
- Japan
- Prior art keywords
- error correction
- encoder
- error
- voice
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 10
- 238000012937 correction Methods 0.000 claims abstract description 90
- 230000005540 biological transmission Effects 0.000 claims abstract description 62
- 238000011156 evaluation Methods 0.000 claims abstract description 24
- 230000006866 deterioration Effects 0.000 claims abstract description 10
- 230000036039 immunity Effects 0.000 abstract 1
- 230000001172 regenerating effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/20—Arrangements for detecting or preventing errors in the information received using signal quality detector
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
音声信号の情報圧縮伝送を行うための音声符号化方式に
関し、 誤り訂正符号化を併用した音声符号化方式において、音
声符号化と誤り訂正符号化の双方の機能を最適に活かす
ことが出来るようにすることを目的とし、 音声人力信号を符号化する複数の符号器であって伝送速
度が異なるものと、各符号器に対応して設けられ、各符
号化出力から再生信号を発生する復号器と、該符号器の
符号化出力の誤り訂正符号化を行って訂正符号を出力す
る誤り訂正符号器と、該音声入力信号及び各復号器の再
生信号から伝送路エラーが無い状態での再生音声品質の
評価関数をそれぞれ発生する評価部と、伝送路の現在の
エラーレートとこのエラーレートにおける各誤り訂正符
号器の訂正能力に基づいて決定された劣化量を該評価部
からの評価関数にそれぞれ加味して最も歪が小さい再生
信号を与える符号器の番号出力を発生ずる比較・判定部
と、該符号器番号に対応した符号化出力及びその訂正符
号化出力を選択するセレクタと、該符号化出力及びその
訂正符号化出力並びに該符号器番号を多重化する多重化
部と、を備え、該符号化出力の伝送速度とその訂正符号
化出力の伝送速度との和が一定であるように構威する。
関し、 誤り訂正符号化を併用した音声符号化方式において、音
声符号化と誤り訂正符号化の双方の機能を最適に活かす
ことが出来るようにすることを目的とし、 音声人力信号を符号化する複数の符号器であって伝送速
度が異なるものと、各符号器に対応して設けられ、各符
号化出力から再生信号を発生する復号器と、該符号器の
符号化出力の誤り訂正符号化を行って訂正符号を出力す
る誤り訂正符号器と、該音声入力信号及び各復号器の再
生信号から伝送路エラーが無い状態での再生音声品質の
評価関数をそれぞれ発生する評価部と、伝送路の現在の
エラーレートとこのエラーレートにおける各誤り訂正符
号器の訂正能力に基づいて決定された劣化量を該評価部
からの評価関数にそれぞれ加味して最も歪が小さい再生
信号を与える符号器の番号出力を発生ずる比較・判定部
と、該符号器番号に対応した符号化出力及びその訂正符
号化出力を選択するセレクタと、該符号化出力及びその
訂正符号化出力並びに該符号器番号を多重化する多重化
部と、を備え、該符号化出力の伝送速度とその訂正符号
化出力の伝送速度との和が一定であるように構威する。
本発明は、音声符号化方式に関し、特に音声信号の情報
圧縮伝送を行うための音声符号化方式に関するものであ
る。
圧縮伝送を行うための音声符号化方式に関するものであ
る。
近年、企業内通信システム、ディジタル移動無線システ
ム、音声蓄積システム等においては、情報の高能率な圧
縮を行う音声符号化方式が要求されているが、特にディ
ジタル移動無線システム等の回線状態が悪いシステムに
おいては、伝送路エラーに強い音声符号化方式が求めら
れている。
ム、音声蓄積システム等においては、情報の高能率な圧
縮を行う音声符号化方式が要求されているが、特にディ
ジタル移動無線システム等の回線状態が悪いシステムに
おいては、伝送路エラーに強い音声符号化方式が求めら
れている。
音声を符号化する場合には、第7図に示すように、送信
側の音声符号器10において、入力音声フレーム毎に線
形予測分析部1lで線形予測分析を行って抽出された予
測パラメータ(予測係数)に基づいて前音声フレームに
予測器12で予測を施し、入力音声信号との予測残差信
号(これは逆量子化器l4により前音声フレームとして
再生される)を量子化器13で量子化しその予測パラメ
ータと共に多重化部■5で多重化して伝送する予測符号
化方式が一般的に用いられている。
側の音声符号器10において、入力音声フレーム毎に線
形予測分析部1lで線形予測分析を行って抽出された予
測パラメータ(予測係数)に基づいて前音声フレームに
予測器12で予測を施し、入力音声信号との予測残差信
号(これは逆量子化器l4により前音声フレームとして
再生される)を量子化器13で量子化しその予測パラメ
ータと共に多重化部■5で多重化して伝送する予測符号
化方式が一般的に用いられている。
このような音声符号化に際して伝送路エラーの3
4
多い環境下で使用する場合には、エラー耐力を強化する
ために第7図に示すように残差信号と予測係数に対して
誤り訂正符号器3番こよる誤り訂正符号化が併せて行わ
れ、多重化部15では更に誤り訂正符号も多重化されて
伝送される。
ために第7図に示すように残差信号と予測係数に対して
誤り訂正符号器3番こよる誤り訂正符号化が併せて行わ
れ、多重化部15では更に誤り訂正符号も多重化されて
伝送される。
そして、受信側では、送られて来た残差信号と予測係数
と誤り訂正符号とを多重分離部16で分離した後、この
誤り訂正符号ムこ基づいて誤り訂正復号器30で残差信
号と予測係数とを誤り訂正し、音声復号器20で再生音
声信号を出力する。
と誤り訂正符号とを多重分離部16で分離した後、この
誤り訂正符号ムこ基づいて誤り訂正復号器30で残差信
号と予測係数とを誤り訂正し、音声復号器20で再生音
声信号を出力する。
このように誤り訂正符号化を併用した従来の音声符号化
方式では、誤り訂正符号の伝送量は音声の符号化情報(
残差信号十予測係数)の伝送量に対して一定の比率であ
ったため、伝送路の状態に関わらず一定の割合で誤り訂
正符号化が施される。
方式では、誤り訂正符号の伝送量は音声の符号化情報(
残差信号十予測係数)の伝送量に対して一定の比率であ
ったため、伝送路の状態に関わらず一定の割合で誤り訂
正符号化が施される。
一方、音声符号化の本来の目的は音声信号から冗長度を
除いて情報圧縮を行うことであり、冗長度を付加するこ
とになる誤り訂正符号化の併用は情報圧縮の観点からは
望ましくない。
除いて情報圧縮を行うことであり、冗長度を付加するこ
とになる誤り訂正符号化の併用は情報圧縮の観点からは
望ましくない。
即ち、伝送路の状態が良くエラーが少ない場合にも伝送
路状態が悪い時と同しような伝送量の誤り訂正符号化を
施すことは、肝心な音声符号化の情報圧縮の効率を下げ
ることになる。
路状態が悪い時と同しような伝送量の誤り訂正符号化を
施すことは、肝心な音声符号化の情報圧縮の効率を下げ
ることになる。
逆に、誤り訂正符号化の伝送量を少なく割り当てた場合
には、冗長度の増加は抑えられ音声符号化の効率は高く
保たれるが、今度は伝送路状態が悪い場合、十分な誤り
訂正が行えず再生音声品質に致命的な劣化を与えかねな
い。
には、冗長度の増加は抑えられ音声符号化の効率は高く
保たれるが、今度は伝送路状態が悪い場合、十分な誤り
訂正が行えず再生音声品質に致命的な劣化を与えかねな
い。
このように従来方式では、音声符号化と誤り訂正符号化
の伝送量の比率が伝送路の状態に関わらずに一定である
ため、音声符号化+誤り訂正符号化の双方の機能を十分
に活かし切れないという問題点があった。
の伝送量の比率が伝送路の状態に関わらずに一定である
ため、音声符号化+誤り訂正符号化の双方の機能を十分
に活かし切れないという問題点があった。
従って、本発明は、誤り訂正符号化を併用した音声符号
化方式において、音声符号化と誤り訂正符号化の双方の
機能を最適に活かすことが出来るようにすることを目的
とする。
化方式において、音声符号化と誤り訂正符号化の双方の
機能を最適に活かすことが出来るようにすることを目的
とする。
?課題を解決するための手段〕
上記の目的を達或するため、本発明に係る音声符号化方
式では、第1図に原理的に示すように、音声入力信号を
符号化する複数の符号器11〜1mであって伝送速度が
異なるものと、各符号器1,〜1oに対応して設けられ
、各符号化出力から再生信号を発生する復号器2I〜2
mと、該符号器1m〜1いの符号化出力の誤り訂正符号
化を行って訂正符号を出力する誤り訂正符号器3,〜3
,と、該音声入力信号及び各復号器2I〜2■の再生信
号から伝送路エラーが無い状態での再生音声品質の評価
関数をそれぞれ発生する評価部4と、伝送路の現在のエ
ラーレートとこのエラーレートにおける各誤り訂正符号
器の訂正能力に基づいて決定された劣化量を該評価部4
からの評価関.数にそれぞれ加味して最も歪が小さい再
生信号を与える符号器の番号出力を発生する比較・判定
部5と、該符号器番号に対応した符号化出力及びその訂
正符号化出力を選択するセレクタ6と、該符号化出力及
びその訂正符号化出力並びに該符号器番号を多重化する
多重化部7とを備え、該符号化出力の伝送速度とその訂
正符号化出力の伝送速度との和が一定であるものである
。
式では、第1図に原理的に示すように、音声入力信号を
符号化する複数の符号器11〜1mであって伝送速度が
異なるものと、各符号器1,〜1oに対応して設けられ
、各符号化出力から再生信号を発生する復号器2I〜2
mと、該符号器1m〜1いの符号化出力の誤り訂正符号
化を行って訂正符号を出力する誤り訂正符号器3,〜3
,と、該音声入力信号及び各復号器2I〜2■の再生信
号から伝送路エラーが無い状態での再生音声品質の評価
関数をそれぞれ発生する評価部4と、伝送路の現在のエ
ラーレートとこのエラーレートにおける各誤り訂正符号
器の訂正能力に基づいて決定された劣化量を該評価部4
からの評価関.数にそれぞれ加味して最も歪が小さい再
生信号を与える符号器の番号出力を発生する比較・判定
部5と、該符号器番号に対応した符号化出力及びその訂
正符号化出力を選択するセレクタ6と、該符号化出力及
びその訂正符号化出力並びに該符号器番号を多重化する
多重化部7とを備え、該符号化出力の伝送速度とその訂
正符号化出力の伝送速度との和が一定であるものである
。
本発明では、音声符号化と誤り訂正符号化の情報伝送量
の比率が異なる複数の音声符号器・誤り訂正符号器の組
を動作させ、伝送路のエラーレートに応して設定される
闇値により、フレーム毎に最適な音声符号器・誤り訂正
符号器の組を選定しようにとするものである。
の比率が異なる複数の音声符号器・誤り訂正符号器の組
を動作させ、伝送路のエラーレートに応して設定される
闇値により、フレーム毎に最適な音声符号器・誤り訂正
符号器の組を選定しようにとするものである。
また、各符号器・誤り訂正符号器の組において、音声符
号化出力a、(i・1・・・…)の伝送量と誤り訂正符
号b8の伝送量との和は、伝送路の許容伝送量Cに等し
く一定である。
号化出力a、(i・1・・・…)の伝送量と誤り訂正符
号b8の伝送量との和は、伝送路の許容伝送量Cに等し
く一定である。
第1図において、H(m>1)個の符号器1m〜1,の
各符号化出力を復号器2l〜2。で再生した信号は評価
部4でフレーム毎に入力信号と比較評価され、伝送路エ
ラーが無い状態での各符号器h〜1、の再生音声の品質
がそれぞれ求められる。
各符号化出力を復号器2l〜2。で再生した信号は評価
部4でフレーム毎に入力信号と比較評価され、伝送路エ
ラーが無い状態での各符号器h〜1、の再生音声の品質
がそれぞれ求められる。
7
8
一方、比較・判定部5では、各誤り訂正符号器3l〜3
1の訂正能力と現在の伝送路のエラーレートに応して各
符号器出力の劣化量を評価部4から出力される評価関数
に加味すると共に、この中から最も歪が小さい再生信号
を与える音声符号器と誤り訂正符号器の組を決定してそ
の音声符号器(及び誤り訂正符号器)の番号k(1≦k
≦m)をセレクク7に与える。
1の訂正能力と現在の伝送路のエラーレートに応して各
符号器出力の劣化量を評価部4から出力される評価関数
に加味すると共に、この中から最も歪が小さい再生信号
を与える音声符号器と誤り訂正符号器の組を決定してそ
の音声符号器(及び誤り訂正符号器)の番号k(1≦k
≦m)をセレクク7に与える。
即ち、伝送路エラーが無いとした時には、訂正符号b,
に大きな伝送情報量を割り当てている場合にはその再生
音声品質は悪くなるが、これに伝送路エラーが加わると
、訂正符号b8に大きな伝送情報量を割り当てている符
号化出力a1の方がエラーに強く逆に再生音声品質は良
くなることがある。
に大きな伝送情報量を割り当てている場合にはその再生
音声品質は悪くなるが、これに伝送路エラーが加わると
、訂正符号b8に大きな伝送情報量を割り当てている符
号化出力a1の方がエラーに強く逆に再生音声品質は良
くなることがある。
そして、セレクタ6では受けた符号器番号kの符号化出
力akと訂正符号bkとの組を多重化部7に送り、多重
化部7ではこれらの符号化出力ak及び訂正符号bkに
加えて符号器番号kを多重化して伝送路に送出する。
力akと訂正符号bkとの組を多重化部7に送り、多重
化部7ではこれらの符号化出力ak及び訂正符号bkに
加えて符号器番号kを多重化して伝送路に送出する。
このようにして、フレーム毎に音声符号化情報と誤り訂
正符号の伝送量の比率を最適化しながら符号化が行われ
、受信側では、第6図の場合と同様に、受信された符号
器番号kに従って誤り訂正復号器及び音声復号器を切り
替えながら再生が行われる。従って、並列に動作させる
符号器・誤り訂正符号器の組の数が増える程、伝送情報
の割当が最適化され、伝送路エラーに対する耐力および
再生音声の品質が改善する。
正符号の伝送量の比率を最適化しながら符号化が行われ
、受信側では、第6図の場合と同様に、受信された符号
器番号kに従って誤り訂正復号器及び音声復号器を切り
替えながら再生が行われる。従って、並列に動作させる
符号器・誤り訂正符号器の組の数が増える程、伝送情報
の割当が最適化され、伝送路エラーに対する耐力および
再生音声の品質が改善する。
第2図は本発明に係る音声符号化方式の実施例を示す図
であり、この実施例では、第1図の符号器11〜l1と
して、それぞれが符号帳(位相)21、振幅器(ゲイン
)22、ピッチ予測器23、及び線形予測器24から威
るCELP (Code Excited Linea
r Predictive Coding)弐符号器1
1〜13を用いた場合の例である。尚、このCELP方
式は次の文献を始めとして既に周知のものとなっている
。
であり、この実施例では、第1図の符号器11〜l1と
して、それぞれが符号帳(位相)21、振幅器(ゲイン
)22、ピッチ予測器23、及び線形予測器24から威
るCELP (Code Excited Linea
r Predictive Coding)弐符号器1
1〜13を用いた場合の例である。尚、このCELP方
式は次の文献を始めとして既に周知のものとなっている
。
B.S.Atal and M.R.Schroede
r ”Stochasticcoding of
speech .at very Ioiy bi
t rate”(エイタル、シュローダによる「非常に
低いビット・レートでの音声の予測符号化J L Pr
oc. ICASSP 84, 1610−1613
1984また、第1図の符号器選択の際に用いる品質
評価関数としては次のものが考えられる。
r ”Stochasticcoding of
speech .at very Ioiy bi
t rate”(エイタル、シュローダによる「非常に
低いビット・レートでの音声の予測符号化J L Pr
oc. ICASSP 84, 1610−1613
1984また、第1図の符号器選択の際に用いる品質
評価関数としては次のものが考えられる。
■フレーム内のS/N 等の波形歪
■LPCケプストラム距離等のスペクトル歪(線形予測
係数) ■両者併用 そこで、この実施例では、■を用いるものとし、評価部
4には線形予測分析部25とスペクトル歪演算部26と
の組み合わせを用いている。従って、この実施例では、
特に第1図に示した復号器2m〜2Ilは省略した形と
なる。
係数) ■両者併用 そこで、この実施例では、■を用いるものとし、評価部
4には線形予測分析部25とスペクトル歪演算部26と
の組み合わせを用いている。従って、この実施例では、
特に第1図に示した復号器2m〜2Ilは省略した形と
なる。
更に、この実施例では、上述のように音声符号器と誤り
訂正符号器との組み合わせ(モード)として3通りの場
合を採用しているが、それぞれの組について、ここでは
図示の如くAモード、B1モード、B2モードと呼ぶこ
とにする。各動作モード?おいてビット割当は第4図に
示す如く、それぞれ異なっているが、伝送速度はいずれ
も4.8 kb/s(144ビット)で一定である。
訂正符号器との組み合わせ(モード)として3通りの場
合を採用しているが、それぞれの組について、ここでは
図示の如くAモード、B1モード、B2モードと呼ぶこ
とにする。各動作モード?おいてビット割当は第4図に
示す如く、それぞれ異なっているが、伝送速度はいずれ
も4.8 kb/s(144ビット)で一定である。
即ち、各モードに共通にフレーム同期ビット、モード選
択ビット、モード選択のための誤り訂正符号ビット(
F E C=Forward Error Corre
cting:0)、ピッチ予測(周期、係数)ビット、
及び符号帳(位相、振幅)ビン}(112ビット)が設
けられているが、Aモードは伝送音声情報の全てを音声
符号化に割り当てるものであり従って、誤り訂正符号器
は用いず、この為これを実行する符号器hは従来通り毎
フレーム線形予測分析を行ってその線形予測係数を伝送
するが、Bモード(BI B2〉では線形予測係数の伝
送を行わず、その分の情報量を誤り訂正符号の伝送に用
いている(第4図に示す誤り訂正機能FECI−FEC
4が誤り訂正符号器3■.33を構威している)。尚、
この実施例では、各音声符号化情報及び/又は誤り訂正
符号情報を先に多重化部71〜73で多重化してからセ
レクタ6で選択するようにしている。
択ビット、モード選択のための誤り訂正符号ビット(
F E C=Forward Error Corre
cting:0)、ピッチ予測(周期、係数)ビット、
及び符号帳(位相、振幅)ビン}(112ビット)が設
けられているが、Aモードは伝送音声情報の全てを音声
符号化に割り当てるものであり従って、誤り訂正符号器
は用いず、この為これを実行する符号器hは従来通り毎
フレーム線形予測分析を行ってその線形予測係数を伝送
するが、Bモード(BI B2〉では線形予測係数の伝
送を行わず、その分の情報量を誤り訂正符号の伝送に用
いている(第4図に示す誤り訂正機能FECI−FEC
4が誤り訂正符号器3■.33を構威している)。尚、
この実施例では、各音声符号化情報及び/又は誤り訂正
符号情報を先に多重化部71〜73で多重化してからセ
レクタ6で選択するようにしている。
1l
l2
従って、Bモードでは線形予測係数を記憶ずるためのメ
モリ27を用いており、このメモリ27はBモードの時
にはその値が保持されAモードが発生する度に更新され
るように比較・判定部5によって制御される切替スイッ
チ28で選択するようになっている。従って、メモリ2
7の中には常に復号器側へ伝送された最も新しい予測係
数が保持されることになる。
モリ27を用いており、このメモリ27はBモードの時
にはその値が保持されAモードが発生する度に更新され
るように比較・判定部5によって制御される切替スイッ
チ28で選択するようになっている。従って、メモリ2
7の中には常に復号器側へ伝送された最も新しい予測係
数が保持されることになる。
このようにBモードでは線形予測係数が更新されないた
め、フレーム間で線形予測係数の変化量が大きい場合に
は再生音声にスペクトル歪みを生しることになる。
め、フレーム間で線形予測係数の変化量が大きい場合に
は再生音声にスペクトル歪みを生しることになる。
そこで、スペクトル歪演算部26において再生音声品質
の評価関数を求めるため、新旧の線形予測係数から次式
に示すSNLAI1という尺度を用いてスペクトル歪み
の量を測る。
の評価関数を求めるため、新旧の線形予測係数から次式
に示すSNLAI1という尺度を用いてスペクトル歪み
の量を測る。
ここで、yATitはAモードの予測係数(LAR)、
y1“ゝはBモードの予測係数(LAR)である。
y1“ゝはBモードの予測係数(LAR)である。
そして、比較・判定部5では、受信側から送ら?て来る
伝送路の現在エラーレー} (BER)に応して設定さ
れる閾値Th(後述する第6図参照)を求め、この闇値
Thと上記のスペクトル歪SNLANとを比較すること
で、動作モードの判定を行う。
伝送路の現在エラーレー} (BER)に応して設定さ
れる閾値Th(後述する第6図参照)を求め、この闇値
Thと上記のスペクトル歪SNLANとを比較すること
で、動作モードの判定を行う。
即ち、このスペクトル歪SNLARと閾値Thとの比較
・判定は、再生音声品質の評価■関数に、現在の伝送エ
ラーレートにおける各訂正符号器の訂正能力に応した劣
化量を加味した判定に相当しており、第3図(a)に示
すように、SNLAR≦ThのときにはAモードが選択
され、SNLAR >Thのときには、Bモードが選択
されるように切替スイッチ28を制御して切り替える。
・判定は、再生音声品質の評価■関数に、現在の伝送エ
ラーレートにおける各訂正符号器の訂正能力に応した劣
化量を加味した判定に相当しており、第3図(a)に示
すように、SNLAR≦ThのときにはAモードが選択
され、SNLAR >Thのときには、Bモードが選択
されるように切替スイッチ28を制御して切り替える。
Aモードの時はメモリ27の内容(線形予測係数)はフ
レーム毎に書き替えられるが、Bモードの時は固定され
たままとなる。ABモードのいずれにおいても誤り訂正
機能FECOは切替スイッチ28のモード切替のための
ビットに対して誤り訂正を掛けてセレクク6に送ってい
る。
レーム毎に書き替えられるが、Bモードの時は固定され
たままとなる。ABモードのいずれにおいても誤り訂正
機能FECOは切替スイッチ28のモード切替のための
ビットに対して誤り訂正を掛けてセレクク6に送ってい
る。
この場合、Bモードは、更に二通りの動作モード(81
. 82)に別れるが、これは第2図及び第5図に示
すように、共にピッチ周期、ピッチ予測係数、及び符号
帳振幅の計60ビットが誤り訂正符号器FBCI,FE
C2によって保護されるが、異なるのは、B1モードで
は前フレームで伝送された線形予測係数(32ビット)
が誤り訂正機能FEC3で保護されるのに対し、B2モ
ードでは符号帳の位相情報(48ビット)が誤り訂正機
能FEC4で保護される点である。
. 82)に別れるが、これは第2図及び第5図に示
すように、共にピッチ周期、ピッチ予測係数、及び符号
帳振幅の計60ビットが誤り訂正符号器FBCI,FE
C2によって保護されるが、異なるのは、B1モードで
は前フレームで伝送された線形予測係数(32ビット)
が誤り訂正機能FEC3で保護されるのに対し、B2モ
ードでは符号帳の位相情報(48ビット)が誤り訂正機
能FEC4で保護される点である。
従って、第3図(a), (b)に示すように、B1モ
ードは動作モードがAからBに変化する場合にのみ用い
られるが、これは、線形予測係数の伝送が行われるのが
Aモードの場合のみであり、この場合にのみ線形予測係
数に対する誤り訂正FEC3を行っておかないとBモー
ドが続いたときには誤った線形予測係数が使用され続け
てしまうためである。
ードは動作モードがAからBに変化する場合にのみ用い
られるが、これは、線形予測係数の伝送が行われるのが
Aモードの場合のみであり、この場合にのみ線形予測係
数に対する誤り訂正FEC3を行っておかないとBモー
ドが続いたときには誤った線形予測係数が使用され続け
てしまうためである。
一方、B2モードはBモード状態が維持されるときに用
いられることになる。また、B2モードからAモードに
戻るときは、上記のようにSNLAR≦Thの状態にな
ったときである。
いられることになる。また、B2モードからAモードに
戻るときは、上記のようにSNLAR≦Thの状態にな
ったときである。
第6図は、伝送路エラー存在下でのセグメンタルSNR
特性(SNRseg)を示し、ここで用いたのは、第2
図に示した実施例において、伝送路のエラーレート(横
軸)が変化した時の比較・判定部5における闇値Thを
0. 5, 10, 15, 20. 30 dBにそ
れぞれ設定した特性である。
特性(SNRseg)を示し、ここで用いたのは、第2
図に示した実施例において、伝送路のエラーレート(横
軸)が変化した時の比較・判定部5における闇値Thを
0. 5, 10, 15, 20. 30 dBにそ
れぞれ設定した特性である。
図中、闇値30dBの場合が従来の誤り訂正を伴わない
場合のCELP符号器の特性に相当し、この場合、エラ
ーレートの低い状態での特性は良いが、エラーレートが
lO−3より高くなるとセグメンタルSNRが急激に劣
化する。一力、闇値をOd[l或いは5dBと低く設定
した場合には、Bモードが選ばれる頻度が高くなるので
誤り訂正符号の伝送に多くの情報量が割かれるため、エ
ラーレートが3X10−3程度に高くなってもセグメン
タルSNRの劣化は少ない。但し、これらの場合には線
形予測係数の伝送量が極端に少ないため、再生音声のス
ペクトル歪が大きく再生音声品質上好ましくない。
場合のCELP符号器の特性に相当し、この場合、エラ
ーレートの低い状態での特性は良いが、エラーレートが
lO−3より高くなるとセグメンタルSNRが急激に劣
化する。一力、闇値をOd[l或いは5dBと低く設定
した場合には、Bモードが選ばれる頻度が高くなるので
誤り訂正符号の伝送に多くの情報量が割かれるため、エ
ラーレートが3X10−3程度に高くなってもセグメン
タルSNRの劣化は少ない。但し、これらの場合には線
形予測係数の伝送量が極端に少ないため、再生音声のス
ペクトル歪が大きく再生音声品質上好ましくない。
そこで、エラーレートが10−5以下の場合はrh=3
0dB, 10−5〜10−4ではTh=20dB,
10−’〜3X10−’ではTh=+5dB、3X10
−3以上ではTh=10dBに、伝l5 16 送路のエラーレートに応してそれぞれ闇値を比較・判定
部5において設定して動作させることで、伝送路エラー
による音質劣化も救済され、各エラーレートにおける最
高の再生音声品質が得られる。
0dB, 10−5〜10−4ではTh=20dB,
10−’〜3X10−’ではTh=+5dB、3X10
−3以上ではTh=10dBに、伝l5 16 送路のエラーレートに応してそれぞれ闇値を比較・判定
部5において設定して動作させることで、伝送路エラー
による音質劣化も救済され、各エラーレートにおける最
高の再生音声品質が得られる。
〔発明の効果〕
以上説明したように、本発明に係る音声符号化方式によ
れば、情報源符号化と誤り訂正符号化の各伝送速度が異
なる符号器を複数有し、伝送路のエラー・レートに応し
た誤り訂正符号化が行えるように、フレーム毎に最適な
符号器の出力を選択・伝送するように構威したので、伝
送路の状態に応して音声符号化情報と誤り訂正符号の伝
送量の比率を制御することができ、伝送路状態の悪い場
合には誤り訂正を有効に働かせ、また、伝送路状態が良
い場合には音声符号化に情報量を集中的に割り当てるこ
とにより、いかなる伝送路状態においても、その環境下
における最高の再生音声品質を供することが可能になる
。
れば、情報源符号化と誤り訂正符号化の各伝送速度が異
なる符号器を複数有し、伝送路のエラー・レートに応し
た誤り訂正符号化が行えるように、フレーム毎に最適な
符号器の出力を選択・伝送するように構威したので、伝
送路の状態に応して音声符号化情報と誤り訂正符号の伝
送量の比率を制御することができ、伝送路状態の悪い場
合には誤り訂正を有効に働かせ、また、伝送路状態が良
い場合には音声符号化に情報量を集中的に割り当てるこ
とにより、いかなる伝送路状態においても、その環境下
における最高の再生音声品質を供することが可能になる
。
第1図は、本発明に係る音声符号化方式の原理ブロック
図、 第2図は、本発明に係る音声符号化方式の実施例を示す
ブロック図、 第3図は、本発明実施例による動作モードを説明するた
めの図、 第4図は、本発明実施例による伝送情報のビット割当を
示す図、 第5図は、本発明実施例による誤り訂正符号と被保護ビ
ットを示す図、 第6図は、伝送路エラーレートに対する種々の闇値にお
けるスペクトル歪を示ずセグメンタルSNRの特性を示
すグラフ図、 第7図は、従来方式を示すブロック図、である。 第1図において、 l1〜l,・・・符号器、 2m〜2m・・・復号器、 3I〜3m・・・誤り訂正符号器、 4・・・評価部、 5・・・比較・判定部、 6・・・セレクタ、 7・・・多重化部。 図中、同一符号は同一又は相当部分を示す。
図、 第2図は、本発明に係る音声符号化方式の実施例を示す
ブロック図、 第3図は、本発明実施例による動作モードを説明するた
めの図、 第4図は、本発明実施例による伝送情報のビット割当を
示す図、 第5図は、本発明実施例による誤り訂正符号と被保護ビ
ットを示す図、 第6図は、伝送路エラーレートに対する種々の闇値にお
けるスペクトル歪を示ずセグメンタルSNRの特性を示
すグラフ図、 第7図は、従来方式を示すブロック図、である。 第1図において、 l1〜l,・・・符号器、 2m〜2m・・・復号器、 3I〜3m・・・誤り訂正符号器、 4・・・評価部、 5・・・比較・判定部、 6・・・セレクタ、 7・・・多重化部。 図中、同一符号は同一又は相当部分を示す。
Claims (1)
- 【特許請求の範囲】 音声入力信号を符号化する複数の符号器(1_1〜1_
m)であって伝送速度が異なるものと、 各符号器(1_1〜1_m)に対応して設けられ、各符
号化出力から再生信号を発生する復号器(2_1〜2_
m)と、該符号器(1_1〜1_m)の符号化出力の誤
り訂正符号化を行って訂正符号を出力する誤り訂正符号
器(3_1〜3_m)と、 該音声入力信号及び各復号器(2_1〜2_m)の再生
信号から伝送路エラーが無い状態での再生音声品質の評
価関数をそれぞれ発生する評価部(4)と、伝送路の現
在のエラーレートとこのエラーレートにおける各誤り訂
正符号器の訂正能力に基づいて決定された劣化量を該評
価部(4)からの評価関数にそれぞれ加味して最も歪が
小さい再生信号を与える符号器の番号出力を発生する比
較・判定部(5)と、 該符号器番号に対応した符号化出力及びその訂正符号化
出力を選択するセレクタ(6)と、該符号化出力及びそ
の訂正符号化出力並びに該符号器番号を多重化する多重
化部(7)と、を備え、該符号化出力の伝送速度とその
訂正符号化出力の伝送速度との和が一定であることを特
徴とした音声符号化方式。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1235274A JPH0398318A (ja) | 1989-09-11 | 1989-09-11 | 音声符号化方式 |
CA002024742A CA2024742C (en) | 1989-09-11 | 1990-09-06 | Speech coding apparatus using multimode coding |
DE69020269T DE69020269T2 (de) | 1989-09-11 | 1990-09-11 | Sprachkodierungsgerät mit mehreren Kodierungsverfahren. |
EP90117502A EP0417739B1 (en) | 1989-09-11 | 1990-09-11 | Speech coding apparatus using multimode coding |
US07/580,669 US5224167A (en) | 1989-09-11 | 1990-09-11 | Speech coding apparatus using multimode coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1235274A JPH0398318A (ja) | 1989-09-11 | 1989-09-11 | 音声符号化方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0398318A true JPH0398318A (ja) | 1991-04-23 |
Family
ID=16983672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1235274A Pending JPH0398318A (ja) | 1989-09-11 | 1989-09-11 | 音声符号化方式 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5224167A (ja) |
EP (1) | EP0417739B1 (ja) |
JP (1) | JPH0398318A (ja) |
CA (1) | CA2024742C (ja) |
DE (1) | DE69020269T2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04276922A (ja) * | 1991-03-04 | 1992-10-02 | Mitsubishi Electric Corp | 無線通信機 |
US5513297A (en) * | 1992-07-10 | 1996-04-30 | At&T Corp. | Selective application of speech coding techniques to input signal segments |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
FI96248C (fi) * | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
JPH09506182A (ja) * | 1993-08-27 | 1997-06-17 | パシフィック・コミュニケーション・サイエンシーズ・インコーポレイテッド | 符号駆動線形予測を備える適応音声符号化器 |
FI98164C (fi) * | 1994-01-24 | 1997-04-25 | Nokia Mobile Phones Ltd | Puhekooderin parametrien käsittely tietoliikennejärjestelmän vastaanottimessa |
US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
US5512939A (en) * | 1994-04-06 | 1996-04-30 | At&T Corp. | Low bit rate audio-visual communication system having integrated perceptual speech and video coding |
FI96650C (fi) * | 1994-07-11 | 1996-07-25 | Nokia Telecommunications Oy | Menetelmä ja laitteisto puheen välittämiseksi tietoliikennejärjestelmässä |
JP3557255B2 (ja) * | 1994-10-18 | 2004-08-25 | 松下電器産業株式会社 | Lspパラメータ復号化装置及び復号化方法 |
DE69615870T2 (de) * | 1995-01-17 | 2002-04-04 | Nec Corp., Tokio/Tokyo | Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen |
NL9500512A (nl) * | 1995-03-15 | 1996-10-01 | Nederland Ptt | Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal. |
JP2944489B2 (ja) * | 1995-10-14 | 1999-09-06 | 日本電気株式会社 | 無線伝送システムにおける誤り訂正方式 |
JPH09261640A (ja) * | 1996-03-22 | 1997-10-03 | Oki Electric Ind Co Ltd | 画像符号化装置 |
DE69614829T2 (de) * | 1996-05-21 | 2002-04-04 | Koninklijke Kpn N.V., Groningen | Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll |
EP0945045B1 (en) | 1996-12-13 | 2000-05-10 | Koninklijke KPN N.V. | Device and method for signal quality determination |
CN1158807C (zh) | 1997-02-27 | 2004-07-21 | 西门子公司 | 尤其在gsm传输中的用于错误掩蔽的帧错误检测的方法和设备 |
US5956351A (en) * | 1997-04-07 | 1999-09-21 | International Business Machines Corporation | Dual error correction code |
US5987405A (en) * | 1997-06-24 | 1999-11-16 | International Business Machines Corporation | Speech compression by speech recognition |
DE19727938B4 (de) * | 1997-07-01 | 2006-12-14 | Mayah Communications Gmbh | Verfahren und Vorrichtung zum Codieren von Signalen |
US6169970B1 (en) | 1998-01-08 | 2001-01-02 | Lucent Technologies Inc. | Generalized analysis-by-synthesis speech coding method and apparatus |
DE19821273B4 (de) * | 1998-05-13 | 2006-10-05 | Deutsche Telekom Ag | Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen |
DE69922582T2 (de) * | 1998-05-26 | 2005-10-06 | Koninklijke Philips Electronics N.V. | Sende- und Empfangsvorrichtung zur Auswahl eines Quellenkodierers und Verfahren dazu |
US6141638A (en) * | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
EP1129451A1 (en) * | 1998-11-13 | 2001-09-05 | QUALCOMM Incorporated | Closed-loop variable-rate multimode predictive speech coder |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
FR2792150B1 (fr) * | 1999-04-08 | 2003-02-28 | Canon Kk | Procedes et dispositis de codage et de decodage de signaux numeriques, et systemes les mettant en oeuvre |
JP3467469B2 (ja) * | 2000-10-31 | 2003-11-17 | Necエレクトロニクス株式会社 | 音声復号装置および音声復号プログラムを記録した記録媒体 |
CN100393085C (zh) * | 2000-12-29 | 2008-06-04 | 诺基亚公司 | 数字网络中的音频信号质量增强 |
JP4022111B2 (ja) * | 2002-08-23 | 2007-12-12 | 株式会社エヌ・ティ・ティ・ドコモ | 信号符号化装置及び信号符号化方法 |
US8352248B2 (en) | 2003-01-03 | 2013-01-08 | Marvell International Ltd. | Speech compression method and apparatus |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
KR100695127B1 (ko) * | 2004-10-08 | 2007-03-14 | 삼성전자주식회사 | 다 단계 음성 인식 장치 및 방법 |
US7581696B2 (en) * | 2005-11-09 | 2009-09-01 | Morgan Aircraft, Llc | Aircraft attitude control configuration |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
EP3252763A1 (en) * | 2016-05-30 | 2017-12-06 | Nokia Technologies Oy | Low-delay audio coding |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2102254B (en) * | 1981-05-11 | 1985-08-07 | Kokusai Denshin Denwa Co Ltd | A speech analysis-synthesis system |
JPS60116000A (ja) * | 1983-11-28 | 1985-06-22 | ケイディディ株式会社 | 音声符号化装置 |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
US4831636A (en) * | 1985-06-28 | 1989-05-16 | Fujitsu Limited | Coding transmission equipment for carrying out coding with adaptive quantization |
US4802171A (en) * | 1987-06-04 | 1989-01-31 | Motorola, Inc. | Method for error correction in digitally encoded speech |
JPH084257B2 (ja) * | 1987-10-02 | 1996-01-17 | 日本電気株式会社 | (1+n)ヒットレス回線切替装置 |
-
1989
- 1989-09-11 JP JP1235274A patent/JPH0398318A/ja active Pending
-
1990
- 1990-09-06 CA CA002024742A patent/CA2024742C/en not_active Expired - Lifetime
- 1990-09-11 DE DE69020269T patent/DE69020269T2/de not_active Expired - Lifetime
- 1990-09-11 US US07/580,669 patent/US5224167A/en not_active Expired - Lifetime
- 1990-09-11 EP EP90117502A patent/EP0417739B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69020269D1 (de) | 1995-07-27 |
EP0417739A3 (en) | 1992-07-29 |
CA2024742C (en) | 1994-01-11 |
US5224167A (en) | 1993-06-29 |
EP0417739B1 (en) | 1995-06-21 |
DE69020269T2 (de) | 1996-01-25 |
CA2024742A1 (en) | 1991-03-12 |
EP0417739A2 (en) | 1991-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0398318A (ja) | 音声符号化方式 | |
US7406411B2 (en) | Bit error concealment methods for speech coding | |
KR100563293B1 (ko) | 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템 | |
CA1207906A (en) | Speech-adaptive predictive coding system having reflected binary encoder/decoder | |
CA2258695C (en) | Method and device for coding an audio signal by "forward" and "backward" lpc analysis | |
US4805193A (en) | Protection of energy information in sub-band coding | |
JP3676815B2 (ja) | テレコミュニケーションシステムにおけるスピーチコード化パラメータの処理方法 | |
US9704501B2 (en) | Signal codec device and method in communication system | |
JP2000308167A (ja) | 音声符号化装置 | |
JPH02288739A (ja) | 音声符号復号化伝送方式 | |
JPH09219649A (ja) | 可変レート符号化方式 | |
KR0144935B1 (ko) | 비트율 조정이 가능한 부호화 및 복호화장치 | |
US20040019480A1 (en) | Speech encoding device having TFO function and method | |
Taniguchi et al. | Combined source and channel coding based on multimode coding | |
KR960003455B1 (ko) | 적응적으로 각 채널에 비트 할당하여 부호화 및 복호화하는 엠 에스 스테레오 디지탈 오디오 부호화 및 복호화 장치 | |
JPH0335300A (ja) | 音声符号・復号化伝送方式 | |
JPH04157817A (ja) | 可変レート符号化装置 | |
Ikeda et al. | A design of Twin VQ audio-codec for personal communication systems | |
Clüver et al. | Multiple-description coding of logarithmic PCM | |
JPH01152826A (ja) | 可変ビットレート式適応予測符号化方式 | |
JPS62175021A (ja) | 符号化伝送装置 | |
JPH0851367A (ja) | ベクトル量子化による符号化復号化方式 | |
JP2000047693A (ja) | 音声信号符号化制御装置 | |
JPH02199925A (ja) | オーディオ信号の蓄積再生方法及び装置 | |
JPH01257998A (ja) | 音声符号化方式 |