JP3189401B2 - 音声データ符号化方法及び音声データ符号化装置 - Google Patents
音声データ符号化方法及び音声データ符号化装置Info
- Publication number
- JP3189401B2 JP3189401B2 JP20261492A JP20261492A JP3189401B2 JP 3189401 B2 JP3189401 B2 JP 3189401B2 JP 20261492 A JP20261492 A JP 20261492A JP 20261492 A JP20261492 A JP 20261492A JP 3189401 B2 JP3189401 B2 JP 3189401B2
- Authority
- JP
- Japan
- Prior art keywords
- correction value
- audio data
- level correction
- quantization error
- data encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013139 quantization Methods 0.000 claims abstract description 64
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 description 14
- 230000003044 adaptive effect Effects 0.000 description 10
- 230000001629 suppression Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 241000282412 Homo Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 101100409194 Rattus norvegicus Ppargc1b gene Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009982 effect on human Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10046—Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
- G11B20/10203—Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter baseline correction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
Description
によって入力ディジタルデータの符号化を行ない、これ
を伝送,記録,再生し、復号化して再生信号を得るディ
ジタル音声データ符号化方法及び符号化装置に関するも
のである。
符号化の手法には種々あるが、例えば「ICASSP 1980 Th
e critical band coder digital encoding of the perc
eptualrequirements of the auditory system M.A.Kran
sner MIT 」では、聴覚マスキングを利用することで、
各帯域毎に必要な信号対雑音比を得て固定的なビット割
当を行なう手法が述べられている。しかしこの手法で
は、サイン波入力で特性を測定する場合にビット割当が
固定的であるため、特性値がそれほど良い値とならな
い。
当に使用できる全ビットを、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行なう分とに分
割使用し、その分割比を入力信号に関係する信号に依存
させ、前記信号のスペクトルが滑らかなほど前記固定ビ
ット割当パターン分への分割比率を大きくするような高
能率符号化装置が提案されている。
ように、特定のスペクトルにエネルギーが集中する場合
には、そのスペクトルを含むブロックに多くのビットを
割り当てる事により、全体の信号対雑音特性を著しく改
善することができる。一般に、急峻なスペクトル成分を
もつ信号に対して人間の聴覚は極めて敏感であるため、
このような方法を用いる事によって信号対雑音特性を改
善することは、単に測定上の数値を向上させるばかりで
なく、聴感上の音質を改善するのに有効である。
当てを、単に信号対雑音特性を改善させるという事を基
準にして行なうと、例えばトライアングルの音のよう
に、急峻なスペクトル成分を多数含む信号を低いビット
レートで圧縮しようとした場合には、各スペクトルに対
応するブロックに十分なビットが割り当てられず、聴感
上、十分な音質を得ることができない。
に使用できる全ビットを、どの短時間に対しても予め定
められた固定ビット割当パターン分と、各ブロックの信
号の大きさに依存したビット配分を行なう分とに分割使
用し、固定ビット割当パターンに加えて、各ブロックの
信号の大きさに依存したビット配分についても、そのブ
ロックの対応する帯域に応じて重み付けする事により、
上述の課題を解決する手法を提案している。
雑音は人間の耳の感度のために低域側の雑音より耳につ
きにくく、また、低域側の信号にマスクされやすいとい
う事実を踏まえて、低域側のブロックにより多くのビッ
トが割り付けられるようにすると効果的である。
に大振幅(0dB付近)の信号が入力されると、量子化
誤差の影響により伸張装置の出力部において有限の語長
に変換した際にオーバーフローを生じ、クリッピングに
よる高調波が発生するようになる。この高調波は、アナ
ログの信号に変換した際に折り返しによって圧縮装置に
入力された信号よりも低い周波数となり、人間に雑音と
して認識されることになる。この問題に対しては、圧縮
装置において量子化誤差の分をあらかじめ補正すること
によって容易に解決できる。
したように音声データの圧縮において非常に有効なもの
である。しかしながら、前述の提案のような手法を用い
ると量子化誤差は入力の信号によって変化し、より効果
的な手法では低域側の量子化誤差は比較的小さくなる
が、高域側の量子化誤差はそれに比べ大きくなる傾向が
生じる。従って量子化誤差の大きい部分に合わせて補正
を行うと量子化誤差の小さい部分のレベル変動が無視で
きなくなる虞れがある。また、量子化誤差の小さい部分
のレベル変動が無視できる程度の補正では量子化誤差の
大きい部分でのオーバーフローを防ぐことが出来なくな
る虞れがある。
なされたものであり、量子化誤差の小さい部分のレベル
変動を押さえつつ、量子化誤差の大きい部分のレベル変
動を補正することによって大振幅(0dB付近)の入力
に対する伸張装置でのオーバフローを防ぎ、可聴帯域で
の雑音の増加を抑えて聴感上良好な音質を得られるレベ
ル補整手法を用いた音声データ符号化方法及び符号化装
置の提供を目的とするものである。
化方法は、上述の目的を達成するために提案されたもの
であり、ディジタル音声データを所定時間毎にブロック
に分割して再量子化する音声データ符号化方法におい
て、ブロック毎に再量子化の量子化誤差を求め、その量
子化誤差及び当該ブロックの音声データのレベルに応じ
たレベル補正値を求め、このレベル補正値に応じて当該
ブロックの音声データのレベル補正を行うようにしたも
のである。
誤差を固定的に補正する固定補正値を発生し、この固定
補正値と量子化誤差とに応じたレベル補正を行うように
する。
め設定した値を越えた場合に行い、予め決められた音声
データの圧縮率に応じて行うようにする。
ディジタル音声データを所定時間毎にブロックに分割し
て再量子化する音声データ符号化装置において、ブロッ
ク毎に再量子化の量子化誤差を求める手段と、上記量子
化誤差及び当該ブロックの音声データのレベルに応じた
レベル補正値を算出するレベル補正値算出手段と、上記
レベル補正値に応じて当該ブロックの音声データのレベ
ル補正を行う手段とを有してなるものである。
誤差を固定的に補正する固定補正値を発生する固定補正
値発生手段を有し、上記固定補正値と量子化誤差とに応
じたレベル補正を行うようにする。
は符号化装置での符号化の際には、音声データを所定時
間で分割されたブロックに対して予め定められた所定ビ
ット数のビットを、固定ビットと割当ビットとに分割使
用すると共に、入力信号のスペクトルに応じて上記固定
ビットと割当ビットの分割比を可変する。
用するようにしている。
方法及び音声データ符号化装置によれば、上記レベル補
正の際に符号化にともなう量子化誤差の量を判断し、量
子化誤差の大きい部分ではより大きなレベル補正を行
い、量子化誤差の小さい部分では小さいレベル補正を行
うことによって、上述の問題を解決する。
るレベルの補正値は、周波数軸上で可変とするととも
に、時間軸上でも可変とするとより効果的である。
決めるのではなく、入力信号の振幅情報と加味し、補正
の変換率、例えば振幅圧縮の特性を切り替える手法でも
良好な結果が得られる。
な変化は人間の聴感上悪い作用を及ぼすので、急激な変
化を抑制するような手法、例えばヒステリシス特性を持
たせる等の手法を併用するとより効果的である。
ら求めたレベル補正値に応じて音声データのレベル補正
を行うようにしているため、聴感にあった効率の良いビ
ット割当を実現する際に、量子化誤差の影響による伸張
装置でのオーバーフローから生じる低域の雑音の発生を
抑制できる。しかも、その際の比較的量子化誤差の少な
い部分のレベル変動も容易に押さえることが出来る。し
たがって、より低いビットレートで高音質の音楽信号を
符号化することが可能となる。
の方法が適用される音声データ符号化装置の実施例を図
面を参照しながら説明する。
に示すような人間の聴覚特性に応じてディジタル音声デ
ータを再量子化する音声データ符号化装置であって、こ
の図1のレベル補正回路22,23,24には、図3に
示すような、量子化誤差を求める量子化誤差算出部30
3と、上記量子化誤差と入力レベルとからレベル補正値
を求めるレベル補正値算出部304と、上記レベル補正
値に応じてディジタル音声データのレベル補正を行うレ
ベル補正部308とを有してなるものである。
23,24には、図3に示すように、量子化誤差と無関
係でかつ一定な、誤差を固定的に補正する固定補正値を
発生する固定補正値発生部(固定補正値表)306を有
しており、図1の本実施例の音声データ符号化装置では
上記固定補正値と量子化誤差とに応じたレベル補正を行
うようにしている。
化方法及び符号化装置について詳細に説明する。なお、
本発明には、オーディオPCM信号等の入力ディジタル
信号を、いわゆる帯域分割符号化(SBC)、適応変換
符号化(ATC)及び適応ビット割当て(APC−A
B)等の各技術を用いる高能率符号化技術を適用するこ
とができる。
号化装置(高能率符号化装置)では、入力ディジタル信
号をフィルタ等により複数の周波数帯域に分割すると共
に、各周波数帯域毎に直交変換を行って、得られた周波
数軸のスペクトルデータを、後述する人間の聴覚特性を
考慮したいわゆる臨界帯域幅(クリティカルバンド)毎
に適応的にビット割当して符号化している。もちろんフ
ィルタ等による非ブロッキングの周波数分割幅は等分割
幅としてもよい。
交変換の前に入力信号に応じて適応的にブロックサイズ
(ブロック長)を変化させると共に、クリティカルバン
ド単位もしくは高域では臨界帯域幅(クリティカルバン
ド)を更に細分化したブロックでフローティング処理を
行っている。
の聴覚特性を考慮して分割された周波数帯域であり、あ
る純音の周波数近傍の同じ強さの狭帯域バンドノイズに
よって当該純音がマスクされるときのそのノイズの持つ
帯域のことである。このクリティカルバンドは、高域ほ
ど帯域幅が広くなっており、0〜20kHzの全周波数帯
域が例えば25のクリティカルバンドに分割される。
は例えば0〜20kHzのオーディオPCM信号が供給さ
れている。この入力信号は、例えばいわゆるQMFフィ
ルタ等の帯域分割フィルタ11により0〜10kHz帯域
と10kHz〜20kHz帯域とに分割され、0〜10kHz
帯域の信号は同じくいわゆるQMFフィルタ等の帯域分
割フィルタ12により0〜5kHz帯域と5kHz〜10k
Hz帯域とに分割される。
76 R.E.Crochiere Digital codingof speech in subba
ndsBell Syst.Tech. J. Vol.55,No.8 1976 に述べられ
ている。さらに、例えば、ICASSP 83,BOSTON Polyphase
Quadrature filters-A newsubband coding techniqueJ
oseph H. Rothweilerには、等バンド幅のフィルタ分割
手法が述べられている。
〜20kHz帯域の信号は直交変換回路の一例であるModi
fied Discrete Cosine Transform(MDCT)回路13に送
られ、上記帯域分割フィルタ12からの5kHz〜10k
Hz帯域の信号はMDCT回路14に送られ、上記帯域分
割フィルタ12からの0〜5kHz帯域の信号はMDCT
回路15に送られることにより、それぞれMDCT処理
される。
987 Subband/Transform CodingUsing Filter Bank De
signs Based on Time Domain Aliasing CancellationJ.
P.Princen A.B.Bradley Univ. of Surrey Royal Melb
ourne Inst.of Tech. に述べられている。また、上述し
た直交変換としては、例えば、入力オーディオ信号を所
定単位時間(フレーム)でブロック化し、当該ブロック
毎に高速フーリエ変換(FFT),コサイン変換(DC
T)等も考えられる。
の際には、音声データを所定時間で分割したブロックに
対して予め定められた所定ビット数のビットを、固定ビ
ットと割当ビットとに分割使用すると共に、入力信号の
スペクトルに応じて上記固定ビットと割当ビットの分割
比を可変するようにしている。
12の各出力は、上記MDCT回路13,14,15で
の直交変換の前に、入力信号に応じて適応的にブロック
サイズ(ブロック長)を変化させると共にクリティカル
バンド単位もしくは高域では臨界帯域幅(クリティカル
バンド)を更に細分化したブロックBでフローティング
処理を行うためのブロックBを決定するブロック決定回
路19,20,21にも送られる。
よる各MDCT回路13,14,15へのブロックサイ
ズの具体例を図2に示す。この図2の具体例において、
本実施例では、高域側ほど周波数帯域を広げると共に時
間分解能を高め(ブロック長を短くし)ている。すなわ
ち、低域側の0〜5kHz帯域の信号でのブロックbL及
び中域の5kHz〜10kHz帯域の信号でのブロックbM
に対して、高域側の10kHz〜20kHz帯域の信号に
は、図中bH1,bH2のブロックで合計2回のMDC
Tが施される。
交変換ブロックサンプル数を同じにして装置の簡易化を
図りながら、クリティカルバンド幅の狭い低域側では周
波数分解能を高め、過渡的な信号に対して優勢な成分を
多く含む高域側では時間分解能を高めるようにしてい
る。また、各々の帯域は、信号の時間的変化が大きい場
合を想定して更に1/2、1/4の適応的なブロック分
割とすることも可能である。
14,15にてMDCT処理されて得られた周波数軸上
のスペクトルデータあるいはMDCT係数データは、上
記臨界帯域(クリティカルバンド)又は高域では更にク
リティカルバンドを分割した帯域毎にまとめられて適応
ビット割当回路16,17,18及びレベル補正回路2
2,23,24に送られている。
は、臨界帯域(クリティカルバンド)又は高域では更に
クリティカルバンドを分割した帯域毎に必要なビットレ
ートとなるように割り当てビット数を決定し、当該ビッ
ト数の割り当てを示す情報(ビット長情報)を、それぞ
れ対応する上記レベル補正回路22,23,24及び符
号化回路25,26,27へと送る。
は、上記適応ビット割当回路16,17,18によって
割り当てられたビット数から、量子化で発生する量子化
誤差を求め、上記周波数軸上のスペクトルデータ或いは
MDCT係数データに対して、上記量子化誤差に応じた
レベル補正を施して、上記符号化回路25,26,27
へ送る。なおこの時のレベル補正の方法としては、入力
信号の大きさに応じて補正をかける方法でも良く、ま
た、入力信号の大きさによらず一定値としてもかまわな
い。
記レベル補正が施された周波数軸上のスペクトルデータ
或いはMDCT係数データを、上記対応する適応ビット
割当回路16,17,18で割り当てられたビット数に
応じて再量子化している。
力端子28,29,30を介して取り出される。また、
このとき、どのような信号の大きさに関する正規化がな
されたかを示す、フローティング情報と、どのようなビ
ット長で量子化がされたかを示すビット長情報(これら
情報は上記ブロック決定回路19,20,21から得ら
れる)も出力端子31,32,33を介して後段の構成
に同時に送られる。
23,24の具体的構成及び動作について説明する。
DCT回路13,14,15の出力は、図3の入力端子
302に供給される。この各MDCT回路13,14,
15からの出力は、上記レベル補正部308、レベル補
正値算出部305及び量子化誤差算出部303に送られ
る。
16,17,18の出力は、図3の入力端子301を介
して量子化誤差算出部303に送られる。当該量子化誤
差算出部303では、上記適応ビット割当回路16,1
7,18の出力と先のMDCT回路13,14,15の
出力とから量子化誤差を求める。すなわち、当該量子化
誤差算出部303では、スペクトラムの大きさに対する
ビットの割当数から量子化誤差を求める。
のMDCT回路13,14,15の出力と共に、レベル
補正値算出部304へと送られ、ここでスペクトラムの
大きさと量子化誤差から各スペクトラム毎のレベル補正
値が求められる。なお、この時、上記レベル補正値は何
本かのスペクトラムをまとめたバンド毎に求めるように
してもよい。
を補正するための情報が予め用意されている固定補正値
発生部(固定補正値表)306からの当該固定的誤差を
補正するための情報が、上記レベル補正値算出部304
に送られる。なお、この固定の補正値はゼロであっても
かまわない。
は、変化量抑制部305へ送られる。この変化量抑制部
305では、急激なレベル補正によって発生する人間の
聴感上の違和感を低減するようなレベル変化の抑制処理
を行う。すなわち、当該変化量抑制部305では、過去
の補正値を保持する過去の補正値発生部(過去の補正値
表)307から供給される当該過去の補正値と、上記レ
ベル補正値算出部304の出力とが比較され、上記過去
の補正値と上記レベル補正値算出部304の出力との変
化が一定以上ある場合はレベル補正値を修正する。な
お、この時の修正法は一定率で行っても良いし、特定の
特性、あるいは近似式によって行っても良い。上記変化
量抑制部305によって修正を受けたレベル補正値は、
レベル補正部308へ入力され、当該レベル補正部30
8で図1におけるMDCT回路13,14,15の出力
のレベルが補正され、出力端子309から図1における
符号化回路25,26,27へ送られる。
正回路22,23,24並びに符号化回路25,26,
27を別回路としているが、同一の回路として実施して
も容易に構成できる。
化方法及び符号化装置における効果について説明する。
聞こえやすい低域での量子化誤差を小さく、聞こえにく
い高域での量子化誤差を大きく量子化した場合におい
て、周波数に関係なく固定のレベル補正を行うと、図4
の(b) に示すように量子化誤差の小さい低域のレベル変
化Lが無視できなくなる。
いて、例えば図4の(c) のように、量子化誤差に応じた
レベル補正を行うと、低域におけるレベル変動は無視で
きる程度となる。なお、このとき、低域と高域でのレベ
ルに差が生じる結果となるが、もともとの量子化誤差量
が人間の聴感特性を応用して決定した結果であるから、
このレベル差も聴感上の大きな問題とはならない。
化方法においては、レベル補正の際に符号化に伴う量子
化誤差の量を判断し、量子化誤差の大きい部分ではより
大きなレベル補正を行い、量子化誤差の小さい部分では
小さいレベル補正を行うことによって、大振幅入力時の
クリッピングによるノイズの発生を効率良く抑制するだ
けでなく抑制の際のレベル変動も人間の聴感上好ましい
ものとすることができ、したがって、小規模で音質のよ
い音声データ符号化装置を実現することができる。
すブロック回路図である。
割を示す図である。
すブロック回路図である。
である。
グ情報の出力端子
Claims (7)
- 【請求項1】 ディジタル音声データを所定時間毎にブ
ロックに分割して再量子化する音声データ符号化方法に
おいて、上記ブロック毎に上記再量子化の 量子化誤差を求め、 上記量子化誤差及び当該ブロックの音声データのレベル
に応じたレベル補正値を求め、 上記レベル補正値に応じて当該ブロックの音声データの
レベル補正を行うことを特徴とする音声データ符号化方
法。 - 【請求項2】 さらに過去のレベル補正値を保持し、 上記過去のレベル補正値に応じて上記レベル補正値を修
正することを特徴とする請求項1記載の音声データ符号
化方法。 - 【請求項3】 さらに量子化誤差を固定的に補正する固
定補正値を生成し、 上記固定補正値と上記量子化誤差とに応じて上記レベル
補正値を求めることを特徴とする請求項1記載の音声デ
ータ符号化方法。 - 【請求項4】 上記レベル補正は、音声データの所定の
圧縮率に応じて行うことを特徴とする請求項1記載の音
声データ符号化方法。 - 【請求項5】 ディジタル音声データを所定時間毎にブ
ロックに分割して再量子化する音声データ符号化装置に
おいて、上記ブロック毎に上記再量子化の 量子化誤差を求める手
段と、 上記量子化誤差及び当該ブロックの音声データのレベル
に応じたレベル補正値を算出するレベル補正値算出手段
と、 上記レベル補正値に応じて当該ブロックの音声データの
レベル補正を行う手段とを有してなることを特徴とする
音声データ符号化装置。 - 【請求項6】 過去のレベル補正値を保持する手段をさ
らに有し、 上記レベル補正値算出手段は、上記量子化誤差と上記過
去のレベル補正値によりレベル補正値を算出することを
特徴とする請求項5記載の音声データ符号化装置。 - 【請求項7】 量子化誤差を固定的に補正する固定補正
値を生成する手段をさらに有し、 上記レベル補正値算出手段は、上記量子化誤差と上記固
定補正値によりレベル補正値を算出することを特徴とす
る請求項5記載の音声データ符号化装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20261492A JP3189401B2 (ja) | 1992-07-29 | 1992-07-29 | 音声データ符号化方法及び音声データ符号化装置 |
EP93304865A EP0581435A3 (en) | 1992-07-29 | 1993-06-22 | Audio data coding methods and apparatus |
KR1019930014498A KR940003232A (ko) | 1992-07-29 | 1993-07-29 | 음성 데이타 부호화 방법 |
US08/684,329 US5642383A (en) | 1992-07-29 | 1996-07-19 | Audio data coding method and audio data coding apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20261492A JP3189401B2 (ja) | 1992-07-29 | 1992-07-29 | 音声データ符号化方法及び音声データ符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0653911A JPH0653911A (ja) | 1994-02-25 |
JP3189401B2 true JP3189401B2 (ja) | 2001-07-16 |
Family
ID=16460313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20261492A Expired - Fee Related JP3189401B2 (ja) | 1992-07-29 | 1992-07-29 | 音声データ符号化方法及び音声データ符号化装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5642383A (ja) |
EP (1) | EP0581435A3 (ja) |
JP (1) | JP3189401B2 (ja) |
KR (1) | KR940003232A (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3186307B2 (ja) * | 1993-03-09 | 2001-07-11 | ソニー株式会社 | 圧縮データ記録装置及び方法 |
EP0772925B1 (en) * | 1995-05-03 | 2004-07-14 | Sony Corporation | Non-linearly quantizing an information signal |
US6047035A (en) * | 1998-06-15 | 2000-04-04 | Dspc Israel Ltd. | Method and device for quantizing the input to soft decoders |
EP0989559A1 (en) * | 1998-09-23 | 2000-03-29 | Deutsche Thomson-Brandt Gmbh | Disturbance detection in a data signal |
US6937912B1 (en) * | 1999-04-16 | 2005-08-30 | Orban, Inc. | Anti-aliased clipping by band-limited modulation with step functions |
US7010491B1 (en) * | 1999-12-09 | 2006-03-07 | Roland Corporation | Method and system for waveform compression and expansion with time axis |
US6678656B2 (en) * | 2002-01-30 | 2004-01-13 | Motorola, Inc. | Noise reduced speech recognition parameters |
KR100456693B1 (ko) * | 2002-03-28 | 2004-11-10 | 삼성전자주식회사 | 다중채널 통신 시스템의 비트 할당을 최적화하여 셋업시간을 최소화하는 방법 |
US7156612B2 (en) * | 2005-04-05 | 2007-01-02 | Pratt & Whitney Canada Corp. | Spigot arrangement for a split impeller |
US7418394B2 (en) * | 2005-04-28 | 2008-08-26 | Dolby Laboratories Licensing Corporation | Method and system for operating audio encoders utilizing data from overlapping audio segments |
JP5125797B2 (ja) * | 2008-06-19 | 2013-01-23 | 富士通株式会社 | 振幅抑圧装置および信号送信装置 |
JP2012103395A (ja) | 2010-11-09 | 2012-05-31 | Sony Corp | 符号化装置、符号化方法、およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU564770B2 (en) * | 1981-07-17 | 1987-08-27 | Nippon Electric Co. Ltd. | Forward and inverse quantization by varying a reference step size |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
IL80103A0 (en) * | 1986-09-21 | 1987-01-30 | Eci Telecom Limited | Adaptive differential pulse code modulation(adpcm)system |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
JPH03117919A (ja) * | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
JPH04127747A (ja) * | 1990-09-19 | 1992-04-28 | Toshiba Corp | 可変レート符号化方式 |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
JP3134337B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル信号符号化方法 |
KR930009436B1 (ko) * | 1991-12-27 | 1993-10-04 | 삼성전자 주식회사 | 파형부호화/복호화 장치 및 방법 |
JP3134455B2 (ja) * | 1992-01-29 | 2001-02-13 | ソニー株式会社 | 高能率符号化装置及び方法 |
-
1992
- 1992-07-29 JP JP20261492A patent/JP3189401B2/ja not_active Expired - Fee Related
-
1993
- 1993-06-22 EP EP93304865A patent/EP0581435A3/en not_active Withdrawn
- 1993-07-29 KR KR1019930014498A patent/KR940003232A/ko not_active Application Discontinuation
-
1996
- 1996-07-19 US US08/684,329 patent/US5642383A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0653911A (ja) | 1994-02-25 |
KR940003232A (ko) | 1994-02-21 |
EP0581435A3 (en) | 1996-09-04 |
US5642383A (en) | 1997-06-24 |
EP0581435A2 (en) | 1994-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3134455B2 (ja) | 高能率符号化装置及び方法 | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
KR100420891B1 (ko) | 디지탈신호엔코딩/디코딩방법및장치와기록매체 | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
US6415251B1 (en) | Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
WO1994028633A1 (fr) | Appareil et procede de codage ou decodage de signaux, et support d'enregistrement | |
CA2075156A1 (en) | Digital encoder with dynamic quantization bit allocation | |
US5581654A (en) | Method and apparatus for information encoding and decoding | |
US6604069B1 (en) | Signals having quantized values and variable length codes | |
KR100512208B1 (ko) | 디지탈신호처리방법,디지탈신호처리장치,디지탈신호기록방법,디지탈신호기록장치,기록매체,디지탈신호전송방법,및디지탈신호전송장치 | |
US5781586A (en) | Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium | |
JP3189401B2 (ja) | 音声データ符号化方法及び音声データ符号化装置 | |
US5754127A (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
KR100330290B1 (ko) | 신호부호화장치,신호복호화장치,및신호부호화방법 | |
US5832426A (en) | High efficiency audio encoding method and apparatus | |
JPH09101799A (ja) | 信号符号化方法及び装置 | |
US6064698A (en) | Method and apparatus for coding | |
JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JP3879249B2 (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
JPH07221650A (ja) | 情報符号化方法及び装置並びに情報復号化方法及び装置 | |
KR100351772B1 (ko) | 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법 | |
JP3134384B2 (ja) | 符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010417 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090518 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |