JP2005004119A - 音響信号符号化装置及び音響信号復号化装置 - Google Patents
音響信号符号化装置及び音響信号復号化装置 Download PDFInfo
- Publication number
- JP2005004119A JP2005004119A JP2003170201A JP2003170201A JP2005004119A JP 2005004119 A JP2005004119 A JP 2005004119A JP 2003170201 A JP2003170201 A JP 2003170201A JP 2003170201 A JP2003170201 A JP 2003170201A JP 2005004119 A JP2005004119 A JP 2005004119A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- encoded
- frequency domain
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 33
- 238000013139 quantization Methods 0.000 claims abstract description 43
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 238000012937 correction Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】従来の音響信号符号化装置では符号化及び復号化に関わる回路構成を共用することが可能であるが、その時間または処理量は差分信号を符号化する回数に従い増加する。また、符号化された差分信号を精度良く復元できない。
【解決手段】差分算出器5は量子化器3による量子化前後における周波数サンプル間の差分値である周波数領域差分信号が求められる。量子化前周波数サンプルは周波数変換部1から、逆量子化後の周波数サンプルは逆量子化器4からそれぞれ差分算出器5に送られてくる。周波数領域差分信号は、差分情報符号化部6において周波数領域差分信号符号化信号とされて、量子化器3からの第一階層の音響信号符号化信号と共に伝送される。復号化時には音響信号符号化信号と周波数領域差分信号を用いて、周波数逆変換前に周波数領域にて補正を行う事で、極めて高い精度で原音響信号に匹敵する音響信号を得る。
【選択図】 図1
【解決手段】差分算出器5は量子化器3による量子化前後における周波数サンプル間の差分値である周波数領域差分信号が求められる。量子化前周波数サンプルは周波数変換部1から、逆量子化後の周波数サンプルは逆量子化器4からそれぞれ差分算出器5に送られてくる。周波数領域差分信号は、差分情報符号化部6において周波数領域差分信号符号化信号とされて、量子化器3からの第一階層の音響信号符号化信号と共に伝送される。復号化時には音響信号符号化信号と周波数領域差分信号を用いて、周波数逆変換前に周波数領域にて補正を行う事で、極めて高い精度で原音響信号に匹敵する音響信号を得る。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は音響信号符号化装置及び音響信号復号化装置に係り、特に音響信号を複数の周波数領域に分割し、各分割周波数領域毎の重み付けに基づき決定された量子化精度に従って量子化を行い情報圧縮した音響信号符号化信号を生成する音響信号符号化装置及び音響信号復号化装置に関する。
【0002】
【従来の技術】
音響信号を周波数領域に変換した後、周波数領域にて情報圧縮を行う符号化装置または符号化方法には、ビデオCD(compact disk)等で用いられるMPEG−1 AUDIO Layer 2、インターネット等のデータ配信で利用されているMPEG−1 AUDIO Layer 3(略称MP3)、BSディジタル放送や地上波ディジタル放送で採用されているMPEG−2 AUDIO NBC(略称AAC)、DVD(digital versatile disk)の音声フォーマットであるドルビーディジタル(Dolby Digital)、MD(mini disk)で採用されている圧縮方式ATRAC(adaptive transform acoustic coding)またはATRAC3などがある。
【0003】
これらは時間領域の音響信号を周波数領域に変換し、特定の周波数帯に偏りを持つ音響信号の特徴と、人間の聴覚の特性を考慮した聴覚の感度に応じた周波数帯毎の重み付けに従い、聴感的に重要とされない周波数帯の情報を削減または減少することによって情報圧縮を行っている。
【0004】
これら情報圧縮を行った音響信号符号化信号を復号した再生信号には、聴感特性上、劣化は分かり難いものの、元の音響信号と比較した場合、相当量を有する量子化ノイズが含まれており、CD等の非圧縮のリニアPCMで符号化された音響信号符号化信号を復号した再生信号に対し明らかに劣化している。
【0005】
ところで、近年、オーディオの嗜好形態は多様化しており、手軽に持ち運びが可能な携帯再生装置や、伝送路の帯域や蓄積媒体の容量の不足を補うために便利な高能率符号化技術を用いた上記のような圧縮オーディオが重宝される一方、CDも含めDVD−AudioやSACD(Super Audio CD)に代表される高品位な非圧縮オーディオに対しても注目が集まっている。
【0006】
そのような要求に応える方法として、圧縮オーディオの品質をより原音に近づける、または原音と変わらない可逆符号化を提供する音響信号符号化装置及び復号化システムが従来より知られている(例えば、特許文献1参照)。この特許文献1記載の従来の音響信号符号化装置は、圧縮された音響信号を復号化し再び時間領域の信号に戻した後、原音響信号と復号化後音響信号との差分信号を再圧縮し、一次符号化の際に欠落した音響信号の信号成分を、差分信号である二次符号化信号若しくは高次符号化信号によって補うものである。
【0007】
この従来装置の特徴として、既に存在する符号化装置及び復号装置を再利用する事で、安価な構成で圧縮された音響信号の高音質化を達成できることにあり、差分信号の情報量を増加する事によって可逆符号化をも実現することができる点にある。
【0008】
【特許文献1】
特開平8−46517号公報
【0009】
【発明が解決しようとする課題】
しかしながら、上記の特許文献1記載の従来装置は、入力音響信号を符号化回路により符号化処理して得た第1の符号化信号を、復号化回路により復号化処理し、その復号音響信号と上記の入力音響信号との差分信号を差分算出回路により算出し、その差分信号を符号化回路により更に符号化処理して得た第2の符号化信号を、上記の第1の符号化信号と共に出力する構成であり、符号化及び復号化に関わる回路構成を共用することが可能であるが、その時間または処理量は約2倍、3倍と差分信号を符号化する回数に従い増加する。
【0010】
また、音響信号を符号化する符号化回路は音響特性(聴感特性)を利用して情報圧縮するため、必ずしも音響信号とはいえない差分信号に適用した場合、差分信号を補正しようとする従来装置の目的を達成するには適当ではない。
【0011】
更に、上記の一般的な音響信号符号化方式は、人間の聴感特性の一つである、周波数帯によって決まる、あるレベル以下の信号は聴こえないとされる最小可聴限特性を情報削減の指標に用いている。この最小可聴限特性は図10に示すように、低域周波数帯や高域周波数帯の音響信号は知覚され難いことが知られており、これら周波数帯の信号は常に情報削減の対象となる部分であり、複数回差分信号の符号化を繰り返しても、符号化された差分信号を精度良く復元する事は非常に困難である。
【0012】
加えて、音響信号符号化信号には補助情報と呼ばれる、音響信号への復元に必要な情報が含まれているが、このような情報を繰り返し伝送する事は、符号化情報量の増大をもたらし、伝送情報量によって得られる信号品質の向上効果は、情報量の割には希薄であることが推測される。
【0013】
本発明は以上の点に鑑みなされたもので、音響信号符号化信号の音質向上を図るべく、符号化過程で生じる周波数スペクトルの量子化前後における差分値を求め、周波数領域差分情報として、符号化信号と多重化または別々に伝送し、復号時には音響信号符号化信号と周波数領域差分信号を用いて、周波数逆変換前に周波数領域にて補正を行う事で、極めて高い精度で原音響信号に匹敵する音響信号を、または蓄積媒体若しくは伝送路の状況に応じたより高い品質の音響信号を得る音響信号符号化装置及び音響信号復号化装置を提供することを目的とする。
【0014】
【課題を解決するための手段】
上記の目的を達成するため、第1の発明の音響信号符号化装置は、音響信号の複数の周波数領域毎の周波数サンプルの量子化を行って得られた第一階層を成す音響信号符号化信号と、自身よりも上位階層に含まれる量子化誤差を補正するための信号を符号化して得た第二階層以下の階層を成す符号化信号とを出力する音響信号符号化装置であって、供給された音響信号を複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、音響信号の各周波数領域毎の周波数サンプルの量子化を行うことにより、情報圧縮した第一階層を成す音響信号符号化信号を生成する符号化器と、符号化器において生成された音響信号符号化信号を逆量子化して得られた、各周波数領域毎の周波数サンプルの逆量子化値と、符号化器に供給された量子化前の音響信号の各周波数領域毎の周波数サンプルとの差分値を符号化して、第二階層以下のの符号化信号である周波数領域差分信号符号化信号を生成する周波数領域差分信号符号化器とを有する構成としたものである。
【0015】
また、上記の目的を達成するため、第2の発明の音響信号符号化装置は、第1の発明の符号化器によって生成された音響信号符号化信号と、周波数領域差分信号符号化器によって生成された周波数領域差分信号符号化信号とを、時系列を揃えた状態で多重化して出力する第1の機能と、音響信号符号化信号との時系列を一致させるための時系列情報を周波数領域差分信号符号化信号に付加して、時系列情報を付加した周波数領域差分信号符号化信号と音響信号符号化信号とを各別に出力する第2の機能との少なくとも一方の機能を具備する多重化装置を有することを特徴とする。
【0016】
第1及び第2の発明では、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を第二階層以下の符号化信号として、第一階層の音響信号符号化信号と組み合わせることにより、階層構造をなす符号化信号を生成することができる。
【0017】
また、上記の目的を達成するため、第3の発明の音響信号復号化装置は、音響信号を複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、音響信号の各周波数領域毎の周波数サンプルの量子化を行うことにより生成された第一階層を成す音響信号符号化信号と、音響信号符号化信号を逆量子化して得られた、各周波数領域毎の周波数サンプルの逆量子化値と、量子化前の音響信号の各周波数領域毎の周波数サンプルとの差分値を符号化することにより生成された、第二階層以下の周波数領域差分信号符号化信号とが供給され、音響信号符号化信号と周波数領域差分信号符号化信号とを時系列を一致させた状態で各別に出力する分離手段と、分離手段により出力された音響信号符号化信号を逆量子化して、周波数サンプル逆量子化値を取得する逆量子化手段と、分離手段により出力された周波数領域差分信号符号化信号を復号して周波数領域差分信号を得る周波数領域差分信号復号手段と、周波数サンプル逆量子化値と周波数領域差分信号を加算する周波数サンプル加算手段と、周波数サンプル加算手段から出力された周波数サンプルを時間信号に変換する周波数逆変換手段とを有する構成としたものである。
【0018】
第3の発明では、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を、第一階層の音響信号符号化信号と組み合わせた階層構造をなす符号化信号を復号化するようにしたため、復号過程で、第一階層である音響信号符号化信号中の周波数スペクトルをより正確な信号に補正し、原信号に近い、または同等の再生音を提供する事ができる。
【0019】
【発明の実施の形態】
次に、本発明の一実施の形態について図面と共に説明する。図1は本発明になる音響信号符号化装置の一実施の形態のブロック図を示す。同図において、符号化されるべきディジタル音響信号は周波数変換部1に送られ、ここで時間領域の信号から周波数領域の信号へと変換される。ここで用いる周波数変換法は、第一階層を形成する音響圧縮方式に従う。
【0020】
例えば、音響圧縮方式がMPEG−1 Audioであれば周波数変換部1はポリフェイズフィルタで構成され、音響圧縮方式がMPEG−1 Layer 3であれば、周波数変換部1はポリフェィズフィルタとMDCTフィルタを組み合わせたハイブリッドフィルタで構成され、音響圧縮方式がAAC、ATRAC、ドルビーディジタル等であれば、周波数変換部1はMDCTフィルタで構成される。また、周波数変換長も各方式で異なるが、どの方式であっても符号化処理は周波数変換部1で採用した変換長を単位として以降の処理が実行される。
【0021】
また、符号化されるべきディジタル音響信号は周波数変換部1に供給されると共に、聴覚心理モデル2へも供給される。この聴覚心理モデル2は人間の聴感特性を考慮し周波数帯域毎に重み付けを行い、符号化方式によって定められたサブバンド(周波数帯)毎に量子化の精度を決定する部分である。
【0022】
周波数変換部1を経て周波数領域上の信号に変換された周波数サンプルは、量子化器3に供給され、ここで聴覚心理モデル2にて算定された複数の周波数領域に分割されて各周波数領域毎の重み付けに基づき決定された量子化精度に従って、各周波数領域毎に量子化されて、量子化後周波数サンプルとされる。この時点で聴覚心理モデル2において聴感上検知されないと判断された量子化誤差が量子化後周波数サンプルに含まれる事になる。
【0023】
量子化器3から取り出された量子化後周波数サンプルは逆量子化器4に供給され、ここで逆量子化されて、元の周波数スペクトルと同様の振幅値を持つ周波数信号へと復元される。ここで用いる周波数逆変換部は後述の復号化装置に含まれる周波数逆変換部に等しい。逆量子化で必要な量子化精度情報などは、聴覚心理モデル2から供給される。
【0024】
続いて、差分算出器5において量子化前後における周波数サンプル間の差分値である周波数領域差分信号が求められる。ここで、量子化前周波数サンプルは周波数変換部1から、逆量子化後の周波数サンプルは逆量子化器4からそれぞれ差分算出器5に送られてくる。
【0025】
次に、差分算出器5において算出された周波数領域差分信号は、差分情報符号化部6において符号化される。ここで差分情報符号化部6は、周波数領域差分信号の全ビットを同一部分として符号化してもよいし、周波数領域差分信号のビット列を揃え、それを情報の重要度に応じて、1ビットないしは複数ビットを単位として分割し、それぞれ別のグループとして(別の階層として)符号化してもよい。1または複数の部分にまとめられた周波数領域差分信号は、差分値の振幅や周波数帯毎の区分値などの補助情報と共に差分情報符号化部6において符号化され、周波数領域差分信号符号化信号とされて多重化/符号化情報形成部7へ供給される。差分情報符号化部6については後に更に詳しく説明する。
【0026】
多重化/符号化情報形成部7は少なくとも第一階層をなす単体で復元可能な音響信号符号化信号を、聴覚心理モデル2からの補助情報と量子化器3からの量子化後周波数サンプルを用いて形成する。このまま一つの符号化信号として伝送してもよいし、更に周波数領域差分信号符号化信号と共に多重化し伝送してもよい。多重化して伝送する場合は、例えば図2で示したような各階層の符号化信号が時系列的に合成されたビット列として伝送する。
【0027】
図2において、第一階層に含まれる周波数サンプルと周波数領域の差分情報として付加された第二階層以下の周波数サンプルは、時系列が一致した状態で符号化及び多重化されるため、復号化器ではこれら両者の情報を復号化することによって、直ちに品質の高い復号後信号を得る事ができる。なお、第二階層以下の周波数領域差分信号符号化信号の情報は、第一階層符号化部において欠落した情報であり、原信号と第一階層を符号化する際に発生した周波数領域上の差分信号をビットの重要度や必要であれば時間情報、階層番号などの補助情報と周波数領域の差分信号そのものを符号化した情報である。なお、図2において、「SYNC」は同期情報である。
【0028】
また、単体で復元可能な第一階層の音響信号符号化信号とは別に、周波数領域差分情報を符号化し伝送する場合は、第一階層とのフレーム単位での時系列一致を図るため、識別信号を付加して伝送する。フレーム毎に異なる識別信号であることが望ましいため、例えば、図3に示すように、第一階層の音響信号符号化信号が持つフレーム番号を第二階層以下の周波数領域差分信号符号化信号の識別信号として付加する方式がとれる。
【0029】
なお、第一階層の音響信号符号化信号の先頭フレームと第二階層以下の周波数領域差分信号符号化信号の先頭のフレーム番号が一致し、かつ、周波数領域差分信号符号化信号が常に存在する場合は、時系列一致を示す識別信号を付加する必要はない。
【0030】
更に第一階層をなす音響信号符号化信号には、エラー検出コードが含まれている場合が多い。このエラー検出コードは、同一のコードが出現する確率は、音響信号が無音の場合を除いて極めて低いため、時系列の一致を示す識別信号として利用する事ができる。このような方式をとる場合には、図4に示すように、第二階層以下の符号化信号には第一階層で作成されたエラー検出コードを付加すればよい。図4は一般的な16ビットのCRCエラー検出コードを識別信号とした例であり、図中の識別信号は16進の数値で表示してある。
【0031】
また、第一階層の音響信号符号化信号においてフレーム毎の変化が期待される部分に、サンプル符号化部分が挙げられる。図5に示すように、ある特定の周波数帯におけるサンプル群(ビット列)、またはフレーム内の特定可能なサンプル符号化部のビット列を時系列一致用の識別信号として採用し、第二階層以下の周波数領域差分信号符号化信号に付加する事で、周波数サンプルの補正を行う事ができる。
【0032】
上記の特定部分は、例えばフレーム先頭から決められたジャンプ先から数ビット、または特定の周波数帯サンプルの位置を占めるビット列数ビットを用いる。
図5は第一階層の量子化後の周波数サンプルの部分に位置するフレーム先端から100ビット目以降16ビットを時間軸一致を示す識別番号に用いた例である。
【0033】
時間一致を示す識別信号はフレームが時間の流れと共に更新していくため、常にフレーム内に付加される必要はなく、ある間隔を置いて挿入する事も可能である。また、無音区間や第一階層の音響信号符号化信号の品質が良好の場合は、第二階層以下の周波数領域差分信号符号化信号を伝送せずに済ます事もできる。このような状況に対応するため、伝送しない間隔の前後のフレームに時系列一致を示す識別信号を付加しておけば、第一階層の音響信号符号化信号との整合性が維持される。
【0034】
以上のような手段を用いて、図1の多重化/符号化情報形成部7では一又は二以上の符号化信号を形成し出力する。
【0035】
次に、図1に示した音響信号符号化装置に含まれる差分情報符号化部6について詳しく説明する。音響信号を高精度に復元する場合、すなわち原音に匹敵する演算精度を持たせた可逆符号化信号を作成するには、差分算出器5で求められた周波数領域差分信号を全て符号化し伝送すればよい。
【0036】
しかしながら、段階を追って階層的に復号化後の音響信号の品質の向上を図るには、ビットの重要度別に複数の階層に分割し伝送する方が適当である。また、CD品質のみならず、量子化ビット長が16ビットを超えるDVD Audioや一部のDVD Video等の品質を持つ音響信号を符号化する場合は、特に複数の階層に分割することで、様々な形態の蓄積メディアや伝送路への適応性を持たせる事ができる。
【0037】
差分算出器5において算出された周波数領域差分信号は、符号化されなかった音楽的な成分が残されているものの、基本的には量子化雑音であり、ランダムノイズ(白色雑音)として扱う事ができる。但し、雑音のパワーには周波数帯域毎のばらつきがある。これは第一階層の音響信号符号化処理にて行われた周波数帯域毎に個別に設定された量子化精度の違いによるものである。
【0038】
図6は周波数領域差分信号の一例の周波数対エネルギー変化量(パワー)特性図を示す。この特性図は音響信号符号化処理における周波数変換後の信号と量子化・逆量子化を経た後の周波数信号との差分のパワーを周波数軸上に図示したものである。図6に示すように量子化雑音であるこの差分信号は、周波数帯域毎に異なり一様ではない。
【0039】
周波数領域差分信号を符号化するには、この周波数帯域毎に異なる振幅情報を補助情報として、周波数領域差分信号と共に符号化する事によって符号化効率を向上する事が可能である。また、図7に示すように、周波数領域差分信号を所定の周波数帯域毎に区切り、その各周波数帯域内(バンド1〜バンドn)の最大振幅値を持つ信号を再量子化するに足りるビット長でもって、帯域内差分信号を符号化してもよい。図7の例では周波数領域差分信号は全て正の数として扱っているが、別に正の数に限定したものではない。負の信号には符号ビットと絶対値で表現した振幅値で対応する事ができる。
【0040】
また、別の方法として、フレーム内の周波数領域差分信号最大振幅値を基準に、フレーム内再量子化値を求め、全差分信号に渡りビットの重要度別にグループ化し符号化する方法もある。このときグループ化されるビット列は1ビット単位でもよいし、複数ビットをグループ化して符号化してもよい。この場合、上位ビットは多分に冗長性を持つため、ハフマン符号化や算術符号化のようなエントロピー符号化を利用すると効果的である。
【0041】
図8の例では1ビットを単位にグループ化し符号化した場合を示している。負の差分信号は符号ビットを除きビット反転する事でビットが「0」となる確率が増え、エントロピー符号化の効果が期待される。エントロピー符号化器によりビット列グループ別に符号化することによって容易に階層構造を持つ事ができる。
【0042】
ここで、周波数領域差分信号を符号化する際どちらか一方の符号化方式に限定されるものではなく、例えば上位ビット群を前者の周波数帯による再量子化情報を含むバンド別符号化方式を採用し、下位ビット群をフレーム全体でビットの重要度別にグループ化し符号化する方式を採用してもよく、組み合わせて使う事ができる。
【0043】
次に、本発明の音響信号復号化装置について図9と共に説明する。図9は本発明になる音響信号復号化装置の一実施の形態のブロック図を示す。同図において、DeMUX/符号化情報分類部8は、図1の音響信号符号化装置から出力された1又は複数の符号化信号を入力として受け、分離化して時系列が一致する音響信号符号化信号と周波数領域差分情報符号化信号とに分類する。
【0044】
すなわち、DeMUX/符号化情報分類部8は、単独で復元可能な音響信号符号化信号の第一階層部と多重化された状態で第二階層以下の周波数領域差分信号符号化信号が入力されるとき、直ちに符号化信号を分離し、第一階層に含まれる量子化された音響信号符号化信号は逆量子化器9へ供給すると共に、周波数領域差分情報符号化信号は差分情報復号化部10へ供給する。
【0045】
一方、DeMUX/符号化情報分類部8は、階層別に別々に符号化信号が入力されるときは、時系列一致を図るため、前述の時系列一致を示す識別信号を検索し、第一階層に第二階層以下の符号化信号を揃えなければならないため、フレーム同期機能を有しており、時系列が一致した状態で分類された第一階層の符号化信号はそれぞれの音響信号符号化方式に従った逆量子化器9に供給して逆量子化させて、本来の振幅値を持つ周波数サンプルへと変換させる。
【0046】
一方、第二階層以下の周波数領域差分信号符号化信号は差分情報復号化部10に供給され、同様に本来の振幅値を持つ周波数領域の差分信号として復元される。第二階層以下の周波数領域差分信号符号化信号が複数存在する場合は複数回処理を繰り返すか多段構成をとる事で周波数領域差分信号を取得できる。ここで、音響信号符号化器における差分情報符号化部6でエントロピー符号化が施された場合、この差分情報復号化部10でエントロピー符号化信号を復号する。
【0047】
逆量子化器9で音響信号符号化信号を逆量子化して得られた複数の周波数領域の周波数サンプル(周波数スペクトル逆量子化値)は、周波数サンプル加算部11に供給され、ここで差分情報復号化部10で復号化された周波数領域差分情報と加算され、量子化誤差を多分に含んでいた第一階層の音響信号符号化信号の周波数サンプルをより正確な周波数サンプルへと補正される。
【0048】
最後に、周波数サンプル加算部11から取り出された周波数サンプルは、周波数逆変換部12に供給され、ここで周波数領域の信号が時間領域の信号に変換されて音響信号として出力される。ここで用いる周波数逆変換法は第一階層の音響符号化方式で用いる周波数変換法と同一のものである。
【0049】
以上のように、本実施の形態では周波数帯域の量子化誤差を補正する符号化信号を生成する周波数領域差分信号符号化器を備えることで、従来の音響符号化方式にて生成された符号化信号に比較して、より良い品質の再生音を提供する事が可能であり、また、蓄積媒体の容量や伝送の帯域の状況に応じて一定の品質を維持しつつ、柔軟な情報伝達を行う事ができる。
【0050】
なお、本発明は上記の実施の形態に限定されるものではなく、音響信号符号化装置には、複数ビットを有する周波数領域差分信号を符号化する際のビットの並びを、振幅値を示す通常のビット列として符号化するか、ビット重要度を揃えた状態で複数の差分サンプルのある1ビットを用いたビット列として符号化するかを選択するビット列生成部及びビット列識別情報を有するようにしてもよい。
【0051】
【発明の効果】
以上説明したように、本発明の音響信号符号化装置によれば、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を第二階層以下の符号化信号として、第一階層の音響信号符号化信号と組み合わせることにより、階層構造をなす符号化信号を生成するようにしたため、狭帯域伝送路や低容量蓄積メディアから広帯域、大容量な媒体にも対応でき、柔軟な情報伝達を実現する事ができる。
【0052】
また、本発明の音響信号復号化装置によれば、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を、音響信号符号化信号と組み合わせた階層構造をなす符号化信号を復号化するようにしたため、復号過程で、第一階層である音響信号符号化信号中の周波数スペクトルをより正確な信号に補正し、原信号に近い、または同等の再生音を提供する事ができる。
【図面の簡単な説明】
【図1】本発明になる音響信号符号化装置の一実施の形態のブロック図である。
【図2】本発明により生成される音響信号符号化信号のビット列の一例を示す図である。
【図3】第一階層のフレーム番号を用いた時系列一致用識別信号の付加方法を示す図である。
【図4】第一階層のエラー検出コードを用いた時系列一致用識別信号の付加方法を示す図である。
【図5】第一階層の特定のサンプル領域部分を用いた時系列一致用識別信号の付加方法を示す図である。
【図6】周波数領域差分信号の一例のパワー対周波数特性図である。
【図7】周波数領域差分信号を帯域毎にグループ化して符号化した例を示す図である。
【図8】周波数領域差分信号をビットの重要度別にグループ化して符号化した例を示す図である。
【図9】本発明になる音響信号復号化装置の一実施の形態のブロック図である。
【図10】人間の聴感特性の一種である最小可聴限特性を示す図である。
【符号の説明】
1 周波数変換部
2 聴覚心理モデル
3 量子化器
4、9 逆量子化器
5 差分算出器
6 差分情報符号化部
7 多重化/符号化情報形成部
8 DeMUX/符号化情報分類部
10 差分情報復号化器
11 周波数サンプル加算部
12 周波数逆変換部
【発明の属する技術分野】
本発明は音響信号符号化装置及び音響信号復号化装置に係り、特に音響信号を複数の周波数領域に分割し、各分割周波数領域毎の重み付けに基づき決定された量子化精度に従って量子化を行い情報圧縮した音響信号符号化信号を生成する音響信号符号化装置及び音響信号復号化装置に関する。
【0002】
【従来の技術】
音響信号を周波数領域に変換した後、周波数領域にて情報圧縮を行う符号化装置または符号化方法には、ビデオCD(compact disk)等で用いられるMPEG−1 AUDIO Layer 2、インターネット等のデータ配信で利用されているMPEG−1 AUDIO Layer 3(略称MP3)、BSディジタル放送や地上波ディジタル放送で採用されているMPEG−2 AUDIO NBC(略称AAC)、DVD(digital versatile disk)の音声フォーマットであるドルビーディジタル(Dolby Digital)、MD(mini disk)で採用されている圧縮方式ATRAC(adaptive transform acoustic coding)またはATRAC3などがある。
【0003】
これらは時間領域の音響信号を周波数領域に変換し、特定の周波数帯に偏りを持つ音響信号の特徴と、人間の聴覚の特性を考慮した聴覚の感度に応じた周波数帯毎の重み付けに従い、聴感的に重要とされない周波数帯の情報を削減または減少することによって情報圧縮を行っている。
【0004】
これら情報圧縮を行った音響信号符号化信号を復号した再生信号には、聴感特性上、劣化は分かり難いものの、元の音響信号と比較した場合、相当量を有する量子化ノイズが含まれており、CD等の非圧縮のリニアPCMで符号化された音響信号符号化信号を復号した再生信号に対し明らかに劣化している。
【0005】
ところで、近年、オーディオの嗜好形態は多様化しており、手軽に持ち運びが可能な携帯再生装置や、伝送路の帯域や蓄積媒体の容量の不足を補うために便利な高能率符号化技術を用いた上記のような圧縮オーディオが重宝される一方、CDも含めDVD−AudioやSACD(Super Audio CD)に代表される高品位な非圧縮オーディオに対しても注目が集まっている。
【0006】
そのような要求に応える方法として、圧縮オーディオの品質をより原音に近づける、または原音と変わらない可逆符号化を提供する音響信号符号化装置及び復号化システムが従来より知られている(例えば、特許文献1参照)。この特許文献1記載の従来の音響信号符号化装置は、圧縮された音響信号を復号化し再び時間領域の信号に戻した後、原音響信号と復号化後音響信号との差分信号を再圧縮し、一次符号化の際に欠落した音響信号の信号成分を、差分信号である二次符号化信号若しくは高次符号化信号によって補うものである。
【0007】
この従来装置の特徴として、既に存在する符号化装置及び復号装置を再利用する事で、安価な構成で圧縮された音響信号の高音質化を達成できることにあり、差分信号の情報量を増加する事によって可逆符号化をも実現することができる点にある。
【0008】
【特許文献1】
特開平8−46517号公報
【0009】
【発明が解決しようとする課題】
しかしながら、上記の特許文献1記載の従来装置は、入力音響信号を符号化回路により符号化処理して得た第1の符号化信号を、復号化回路により復号化処理し、その復号音響信号と上記の入力音響信号との差分信号を差分算出回路により算出し、その差分信号を符号化回路により更に符号化処理して得た第2の符号化信号を、上記の第1の符号化信号と共に出力する構成であり、符号化及び復号化に関わる回路構成を共用することが可能であるが、その時間または処理量は約2倍、3倍と差分信号を符号化する回数に従い増加する。
【0010】
また、音響信号を符号化する符号化回路は音響特性(聴感特性)を利用して情報圧縮するため、必ずしも音響信号とはいえない差分信号に適用した場合、差分信号を補正しようとする従来装置の目的を達成するには適当ではない。
【0011】
更に、上記の一般的な音響信号符号化方式は、人間の聴感特性の一つである、周波数帯によって決まる、あるレベル以下の信号は聴こえないとされる最小可聴限特性を情報削減の指標に用いている。この最小可聴限特性は図10に示すように、低域周波数帯や高域周波数帯の音響信号は知覚され難いことが知られており、これら周波数帯の信号は常に情報削減の対象となる部分であり、複数回差分信号の符号化を繰り返しても、符号化された差分信号を精度良く復元する事は非常に困難である。
【0012】
加えて、音響信号符号化信号には補助情報と呼ばれる、音響信号への復元に必要な情報が含まれているが、このような情報を繰り返し伝送する事は、符号化情報量の増大をもたらし、伝送情報量によって得られる信号品質の向上効果は、情報量の割には希薄であることが推測される。
【0013】
本発明は以上の点に鑑みなされたもので、音響信号符号化信号の音質向上を図るべく、符号化過程で生じる周波数スペクトルの量子化前後における差分値を求め、周波数領域差分情報として、符号化信号と多重化または別々に伝送し、復号時には音響信号符号化信号と周波数領域差分信号を用いて、周波数逆変換前に周波数領域にて補正を行う事で、極めて高い精度で原音響信号に匹敵する音響信号を、または蓄積媒体若しくは伝送路の状況に応じたより高い品質の音響信号を得る音響信号符号化装置及び音響信号復号化装置を提供することを目的とする。
【0014】
【課題を解決するための手段】
上記の目的を達成するため、第1の発明の音響信号符号化装置は、音響信号の複数の周波数領域毎の周波数サンプルの量子化を行って得られた第一階層を成す音響信号符号化信号と、自身よりも上位階層に含まれる量子化誤差を補正するための信号を符号化して得た第二階層以下の階層を成す符号化信号とを出力する音響信号符号化装置であって、供給された音響信号を複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、音響信号の各周波数領域毎の周波数サンプルの量子化を行うことにより、情報圧縮した第一階層を成す音響信号符号化信号を生成する符号化器と、符号化器において生成された音響信号符号化信号を逆量子化して得られた、各周波数領域毎の周波数サンプルの逆量子化値と、符号化器に供給された量子化前の音響信号の各周波数領域毎の周波数サンプルとの差分値を符号化して、第二階層以下のの符号化信号である周波数領域差分信号符号化信号を生成する周波数領域差分信号符号化器とを有する構成としたものである。
【0015】
また、上記の目的を達成するため、第2の発明の音響信号符号化装置は、第1の発明の符号化器によって生成された音響信号符号化信号と、周波数領域差分信号符号化器によって生成された周波数領域差分信号符号化信号とを、時系列を揃えた状態で多重化して出力する第1の機能と、音響信号符号化信号との時系列を一致させるための時系列情報を周波数領域差分信号符号化信号に付加して、時系列情報を付加した周波数領域差分信号符号化信号と音響信号符号化信号とを各別に出力する第2の機能との少なくとも一方の機能を具備する多重化装置を有することを特徴とする。
【0016】
第1及び第2の発明では、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を第二階層以下の符号化信号として、第一階層の音響信号符号化信号と組み合わせることにより、階層構造をなす符号化信号を生成することができる。
【0017】
また、上記の目的を達成するため、第3の発明の音響信号復号化装置は、音響信号を複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、音響信号の各周波数領域毎の周波数サンプルの量子化を行うことにより生成された第一階層を成す音響信号符号化信号と、音響信号符号化信号を逆量子化して得られた、各周波数領域毎の周波数サンプルの逆量子化値と、量子化前の音響信号の各周波数領域毎の周波数サンプルとの差分値を符号化することにより生成された、第二階層以下の周波数領域差分信号符号化信号とが供給され、音響信号符号化信号と周波数領域差分信号符号化信号とを時系列を一致させた状態で各別に出力する分離手段と、分離手段により出力された音響信号符号化信号を逆量子化して、周波数サンプル逆量子化値を取得する逆量子化手段と、分離手段により出力された周波数領域差分信号符号化信号を復号して周波数領域差分信号を得る周波数領域差分信号復号手段と、周波数サンプル逆量子化値と周波数領域差分信号を加算する周波数サンプル加算手段と、周波数サンプル加算手段から出力された周波数サンプルを時間信号に変換する周波数逆変換手段とを有する構成としたものである。
【0018】
第3の発明では、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を、第一階層の音響信号符号化信号と組み合わせた階層構造をなす符号化信号を復号化するようにしたため、復号過程で、第一階層である音響信号符号化信号中の周波数スペクトルをより正確な信号に補正し、原信号に近い、または同等の再生音を提供する事ができる。
【0019】
【発明の実施の形態】
次に、本発明の一実施の形態について図面と共に説明する。図1は本発明になる音響信号符号化装置の一実施の形態のブロック図を示す。同図において、符号化されるべきディジタル音響信号は周波数変換部1に送られ、ここで時間領域の信号から周波数領域の信号へと変換される。ここで用いる周波数変換法は、第一階層を形成する音響圧縮方式に従う。
【0020】
例えば、音響圧縮方式がMPEG−1 Audioであれば周波数変換部1はポリフェイズフィルタで構成され、音響圧縮方式がMPEG−1 Layer 3であれば、周波数変換部1はポリフェィズフィルタとMDCTフィルタを組み合わせたハイブリッドフィルタで構成され、音響圧縮方式がAAC、ATRAC、ドルビーディジタル等であれば、周波数変換部1はMDCTフィルタで構成される。また、周波数変換長も各方式で異なるが、どの方式であっても符号化処理は周波数変換部1で採用した変換長を単位として以降の処理が実行される。
【0021】
また、符号化されるべきディジタル音響信号は周波数変換部1に供給されると共に、聴覚心理モデル2へも供給される。この聴覚心理モデル2は人間の聴感特性を考慮し周波数帯域毎に重み付けを行い、符号化方式によって定められたサブバンド(周波数帯)毎に量子化の精度を決定する部分である。
【0022】
周波数変換部1を経て周波数領域上の信号に変換された周波数サンプルは、量子化器3に供給され、ここで聴覚心理モデル2にて算定された複数の周波数領域に分割されて各周波数領域毎の重み付けに基づき決定された量子化精度に従って、各周波数領域毎に量子化されて、量子化後周波数サンプルとされる。この時点で聴覚心理モデル2において聴感上検知されないと判断された量子化誤差が量子化後周波数サンプルに含まれる事になる。
【0023】
量子化器3から取り出された量子化後周波数サンプルは逆量子化器4に供給され、ここで逆量子化されて、元の周波数スペクトルと同様の振幅値を持つ周波数信号へと復元される。ここで用いる周波数逆変換部は後述の復号化装置に含まれる周波数逆変換部に等しい。逆量子化で必要な量子化精度情報などは、聴覚心理モデル2から供給される。
【0024】
続いて、差分算出器5において量子化前後における周波数サンプル間の差分値である周波数領域差分信号が求められる。ここで、量子化前周波数サンプルは周波数変換部1から、逆量子化後の周波数サンプルは逆量子化器4からそれぞれ差分算出器5に送られてくる。
【0025】
次に、差分算出器5において算出された周波数領域差分信号は、差分情報符号化部6において符号化される。ここで差分情報符号化部6は、周波数領域差分信号の全ビットを同一部分として符号化してもよいし、周波数領域差分信号のビット列を揃え、それを情報の重要度に応じて、1ビットないしは複数ビットを単位として分割し、それぞれ別のグループとして(別の階層として)符号化してもよい。1または複数の部分にまとめられた周波数領域差分信号は、差分値の振幅や周波数帯毎の区分値などの補助情報と共に差分情報符号化部6において符号化され、周波数領域差分信号符号化信号とされて多重化/符号化情報形成部7へ供給される。差分情報符号化部6については後に更に詳しく説明する。
【0026】
多重化/符号化情報形成部7は少なくとも第一階層をなす単体で復元可能な音響信号符号化信号を、聴覚心理モデル2からの補助情報と量子化器3からの量子化後周波数サンプルを用いて形成する。このまま一つの符号化信号として伝送してもよいし、更に周波数領域差分信号符号化信号と共に多重化し伝送してもよい。多重化して伝送する場合は、例えば図2で示したような各階層の符号化信号が時系列的に合成されたビット列として伝送する。
【0027】
図2において、第一階層に含まれる周波数サンプルと周波数領域の差分情報として付加された第二階層以下の周波数サンプルは、時系列が一致した状態で符号化及び多重化されるため、復号化器ではこれら両者の情報を復号化することによって、直ちに品質の高い復号後信号を得る事ができる。なお、第二階層以下の周波数領域差分信号符号化信号の情報は、第一階層符号化部において欠落した情報であり、原信号と第一階層を符号化する際に発生した周波数領域上の差分信号をビットの重要度や必要であれば時間情報、階層番号などの補助情報と周波数領域の差分信号そのものを符号化した情報である。なお、図2において、「SYNC」は同期情報である。
【0028】
また、単体で復元可能な第一階層の音響信号符号化信号とは別に、周波数領域差分情報を符号化し伝送する場合は、第一階層とのフレーム単位での時系列一致を図るため、識別信号を付加して伝送する。フレーム毎に異なる識別信号であることが望ましいため、例えば、図3に示すように、第一階層の音響信号符号化信号が持つフレーム番号を第二階層以下の周波数領域差分信号符号化信号の識別信号として付加する方式がとれる。
【0029】
なお、第一階層の音響信号符号化信号の先頭フレームと第二階層以下の周波数領域差分信号符号化信号の先頭のフレーム番号が一致し、かつ、周波数領域差分信号符号化信号が常に存在する場合は、時系列一致を示す識別信号を付加する必要はない。
【0030】
更に第一階層をなす音響信号符号化信号には、エラー検出コードが含まれている場合が多い。このエラー検出コードは、同一のコードが出現する確率は、音響信号が無音の場合を除いて極めて低いため、時系列の一致を示す識別信号として利用する事ができる。このような方式をとる場合には、図4に示すように、第二階層以下の符号化信号には第一階層で作成されたエラー検出コードを付加すればよい。図4は一般的な16ビットのCRCエラー検出コードを識別信号とした例であり、図中の識別信号は16進の数値で表示してある。
【0031】
また、第一階層の音響信号符号化信号においてフレーム毎の変化が期待される部分に、サンプル符号化部分が挙げられる。図5に示すように、ある特定の周波数帯におけるサンプル群(ビット列)、またはフレーム内の特定可能なサンプル符号化部のビット列を時系列一致用の識別信号として採用し、第二階層以下の周波数領域差分信号符号化信号に付加する事で、周波数サンプルの補正を行う事ができる。
【0032】
上記の特定部分は、例えばフレーム先頭から決められたジャンプ先から数ビット、または特定の周波数帯サンプルの位置を占めるビット列数ビットを用いる。
図5は第一階層の量子化後の周波数サンプルの部分に位置するフレーム先端から100ビット目以降16ビットを時間軸一致を示す識別番号に用いた例である。
【0033】
時間一致を示す識別信号はフレームが時間の流れと共に更新していくため、常にフレーム内に付加される必要はなく、ある間隔を置いて挿入する事も可能である。また、無音区間や第一階層の音響信号符号化信号の品質が良好の場合は、第二階層以下の周波数領域差分信号符号化信号を伝送せずに済ます事もできる。このような状況に対応するため、伝送しない間隔の前後のフレームに時系列一致を示す識別信号を付加しておけば、第一階層の音響信号符号化信号との整合性が維持される。
【0034】
以上のような手段を用いて、図1の多重化/符号化情報形成部7では一又は二以上の符号化信号を形成し出力する。
【0035】
次に、図1に示した音響信号符号化装置に含まれる差分情報符号化部6について詳しく説明する。音響信号を高精度に復元する場合、すなわち原音に匹敵する演算精度を持たせた可逆符号化信号を作成するには、差分算出器5で求められた周波数領域差分信号を全て符号化し伝送すればよい。
【0036】
しかしながら、段階を追って階層的に復号化後の音響信号の品質の向上を図るには、ビットの重要度別に複数の階層に分割し伝送する方が適当である。また、CD品質のみならず、量子化ビット長が16ビットを超えるDVD Audioや一部のDVD Video等の品質を持つ音響信号を符号化する場合は、特に複数の階層に分割することで、様々な形態の蓄積メディアや伝送路への適応性を持たせる事ができる。
【0037】
差分算出器5において算出された周波数領域差分信号は、符号化されなかった音楽的な成分が残されているものの、基本的には量子化雑音であり、ランダムノイズ(白色雑音)として扱う事ができる。但し、雑音のパワーには周波数帯域毎のばらつきがある。これは第一階層の音響信号符号化処理にて行われた周波数帯域毎に個別に設定された量子化精度の違いによるものである。
【0038】
図6は周波数領域差分信号の一例の周波数対エネルギー変化量(パワー)特性図を示す。この特性図は音響信号符号化処理における周波数変換後の信号と量子化・逆量子化を経た後の周波数信号との差分のパワーを周波数軸上に図示したものである。図6に示すように量子化雑音であるこの差分信号は、周波数帯域毎に異なり一様ではない。
【0039】
周波数領域差分信号を符号化するには、この周波数帯域毎に異なる振幅情報を補助情報として、周波数領域差分信号と共に符号化する事によって符号化効率を向上する事が可能である。また、図7に示すように、周波数領域差分信号を所定の周波数帯域毎に区切り、その各周波数帯域内(バンド1〜バンドn)の最大振幅値を持つ信号を再量子化するに足りるビット長でもって、帯域内差分信号を符号化してもよい。図7の例では周波数領域差分信号は全て正の数として扱っているが、別に正の数に限定したものではない。負の信号には符号ビットと絶対値で表現した振幅値で対応する事ができる。
【0040】
また、別の方法として、フレーム内の周波数領域差分信号最大振幅値を基準に、フレーム内再量子化値を求め、全差分信号に渡りビットの重要度別にグループ化し符号化する方法もある。このときグループ化されるビット列は1ビット単位でもよいし、複数ビットをグループ化して符号化してもよい。この場合、上位ビットは多分に冗長性を持つため、ハフマン符号化や算術符号化のようなエントロピー符号化を利用すると効果的である。
【0041】
図8の例では1ビットを単位にグループ化し符号化した場合を示している。負の差分信号は符号ビットを除きビット反転する事でビットが「0」となる確率が増え、エントロピー符号化の効果が期待される。エントロピー符号化器によりビット列グループ別に符号化することによって容易に階層構造を持つ事ができる。
【0042】
ここで、周波数領域差分信号を符号化する際どちらか一方の符号化方式に限定されるものではなく、例えば上位ビット群を前者の周波数帯による再量子化情報を含むバンド別符号化方式を採用し、下位ビット群をフレーム全体でビットの重要度別にグループ化し符号化する方式を採用してもよく、組み合わせて使う事ができる。
【0043】
次に、本発明の音響信号復号化装置について図9と共に説明する。図9は本発明になる音響信号復号化装置の一実施の形態のブロック図を示す。同図において、DeMUX/符号化情報分類部8は、図1の音響信号符号化装置から出力された1又は複数の符号化信号を入力として受け、分離化して時系列が一致する音響信号符号化信号と周波数領域差分情報符号化信号とに分類する。
【0044】
すなわち、DeMUX/符号化情報分類部8は、単独で復元可能な音響信号符号化信号の第一階層部と多重化された状態で第二階層以下の周波数領域差分信号符号化信号が入力されるとき、直ちに符号化信号を分離し、第一階層に含まれる量子化された音響信号符号化信号は逆量子化器9へ供給すると共に、周波数領域差分情報符号化信号は差分情報復号化部10へ供給する。
【0045】
一方、DeMUX/符号化情報分類部8は、階層別に別々に符号化信号が入力されるときは、時系列一致を図るため、前述の時系列一致を示す識別信号を検索し、第一階層に第二階層以下の符号化信号を揃えなければならないため、フレーム同期機能を有しており、時系列が一致した状態で分類された第一階層の符号化信号はそれぞれの音響信号符号化方式に従った逆量子化器9に供給して逆量子化させて、本来の振幅値を持つ周波数サンプルへと変換させる。
【0046】
一方、第二階層以下の周波数領域差分信号符号化信号は差分情報復号化部10に供給され、同様に本来の振幅値を持つ周波数領域の差分信号として復元される。第二階層以下の周波数領域差分信号符号化信号が複数存在する場合は複数回処理を繰り返すか多段構成をとる事で周波数領域差分信号を取得できる。ここで、音響信号符号化器における差分情報符号化部6でエントロピー符号化が施された場合、この差分情報復号化部10でエントロピー符号化信号を復号する。
【0047】
逆量子化器9で音響信号符号化信号を逆量子化して得られた複数の周波数領域の周波数サンプル(周波数スペクトル逆量子化値)は、周波数サンプル加算部11に供給され、ここで差分情報復号化部10で復号化された周波数領域差分情報と加算され、量子化誤差を多分に含んでいた第一階層の音響信号符号化信号の周波数サンプルをより正確な周波数サンプルへと補正される。
【0048】
最後に、周波数サンプル加算部11から取り出された周波数サンプルは、周波数逆変換部12に供給され、ここで周波数領域の信号が時間領域の信号に変換されて音響信号として出力される。ここで用いる周波数逆変換法は第一階層の音響符号化方式で用いる周波数変換法と同一のものである。
【0049】
以上のように、本実施の形態では周波数帯域の量子化誤差を補正する符号化信号を生成する周波数領域差分信号符号化器を備えることで、従来の音響符号化方式にて生成された符号化信号に比較して、より良い品質の再生音を提供する事が可能であり、また、蓄積媒体の容量や伝送の帯域の状況に応じて一定の品質を維持しつつ、柔軟な情報伝達を行う事ができる。
【0050】
なお、本発明は上記の実施の形態に限定されるものではなく、音響信号符号化装置には、複数ビットを有する周波数領域差分信号を符号化する際のビットの並びを、振幅値を示す通常のビット列として符号化するか、ビット重要度を揃えた状態で複数の差分サンプルのある1ビットを用いたビット列として符号化するかを選択するビット列生成部及びビット列識別情報を有するようにしてもよい。
【0051】
【発明の効果】
以上説明したように、本発明の音響信号符号化装置によれば、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を第二階層以下の符号化信号として、第一階層の音響信号符号化信号と組み合わせることにより、階層構造をなす符号化信号を生成するようにしたため、狭帯域伝送路や低容量蓄積メディアから広帯域、大容量な媒体にも対応でき、柔軟な情報伝達を実現する事ができる。
【0052】
また、本発明の音響信号復号化装置によれば、従来の音響信号符号化装置に含まれていた量子化誤差を周波数領域の差分信号として符号化した周波数領域差分信号符号化信号を、音響信号符号化信号と組み合わせた階層構造をなす符号化信号を復号化するようにしたため、復号過程で、第一階層である音響信号符号化信号中の周波数スペクトルをより正確な信号に補正し、原信号に近い、または同等の再生音を提供する事ができる。
【図面の簡単な説明】
【図1】本発明になる音響信号符号化装置の一実施の形態のブロック図である。
【図2】本発明により生成される音響信号符号化信号のビット列の一例を示す図である。
【図3】第一階層のフレーム番号を用いた時系列一致用識別信号の付加方法を示す図である。
【図4】第一階層のエラー検出コードを用いた時系列一致用識別信号の付加方法を示す図である。
【図5】第一階層の特定のサンプル領域部分を用いた時系列一致用識別信号の付加方法を示す図である。
【図6】周波数領域差分信号の一例のパワー対周波数特性図である。
【図7】周波数領域差分信号を帯域毎にグループ化して符号化した例を示す図である。
【図8】周波数領域差分信号をビットの重要度別にグループ化して符号化した例を示す図である。
【図9】本発明になる音響信号復号化装置の一実施の形態のブロック図である。
【図10】人間の聴感特性の一種である最小可聴限特性を示す図である。
【符号の説明】
1 周波数変換部
2 聴覚心理モデル
3 量子化器
4、9 逆量子化器
5 差分算出器
6 差分情報符号化部
7 多重化/符号化情報形成部
8 DeMUX/符号化情報分類部
10 差分情報復号化器
11 周波数サンプル加算部
12 周波数逆変換部
Claims (3)
- 音響信号の複数の周波数領域毎の周波数サンプルの量子化を行って得られた第一階層を成す音響信号符号化信号と、自身よりも上位階層に含まれる量子化誤差を補正するための信号を符号化して得た第二階層以下の階層を成す符号化信号とを出力する音響信号符号化装置であって、
供給された前記音響信号を前記複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、前記音響信号の前記各周波数領域毎の周波数サンプルの量子化を行うことにより、情報圧縮した前記第一階層を成す音響信号符号化信号を生成する符号化器と、
前記符号化器において生成された前記音響信号符号化信号を逆量子化して得られた、前記各周波数領域毎の周波数サンプルの逆量子化値と、前記符号化器に供給された量子化前の前記音響信号の前記各周波数領域毎の周波数サンプルとの差分値を符号化して、前記第二階層以下の符号化信号である周波数領域差分信号符号化信号を生成する周波数領域差分信号符号化器とを有することを特徴とする音響信号符号化装置。 - 前記符号化器によって生成された前記音響信号符号化信号と、前記周波数領域差分信号符号化器によって生成された前記周波数領域差分信号符号化信号とを、時系列を揃えた状態で多重化して出力する第1の機能と、前記音響信号符号化信号との時系列を一致させるための時系列情報を前記周波数領域差分信号符号化信号に付加して、前記時系列情報を付加した前記周波数領域差分信号符号化信号と前記音響信号符号化信号とを各別に出力する第2の機能との少なくとも一方の機能を具備する多重化装置を有することを特徴とする請求項1記載の音響信号符号化装置。
- 音響信号を複数の周波数領域に分割し、聴感特性を用いた各周波数領域毎の重み付けに基づき決定された量子化精度に従って、前記音響信号の前記各周波数領域毎の周波数サンプルの量子化を行うことにより生成された第一階層を成す音響信号符号化信号と、前記音響信号符号化信号を逆量子化して得られた、前記各周波数領域毎の周波数サンプルの逆量子化値と、量子化前の前記音響信号の前記各周波数領域毎の周波数サンプルとの差分値を符号化することにより生成された、第二階層以下の周波数領域差分信号符号化信号とが供給され、前記音響信号符号化信号と前記周波数領域差分信号符号化信号とを時系列を一致させた状態で各別に出力する分離手段と、
前記分離手段により出力された前記音響信号符号化信号を逆量子化して、周波数サンプル逆量子化値を取得する逆量子化手段と、
前記分離手段により出力された前記周波数領域差分信号符号化信号を復号して周波数領域差分信号を得る周波数領域差分信号復号手段と、
前記周波数サンプル逆量子化値と前記周波数領域差分信号を加算する周波数サンプル加算手段と、
前記周波数サンプル加算手段から出力された周波数サンプルを時間信号に変換する周波数逆変換手段とを有することを特徴とする音響信号復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003170201A JP2005004119A (ja) | 2003-06-16 | 2003-06-16 | 音響信号符号化装置及び音響信号復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003170201A JP2005004119A (ja) | 2003-06-16 | 2003-06-16 | 音響信号符号化装置及び音響信号復号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005004119A true JP2005004119A (ja) | 2005-01-06 |
Family
ID=34095070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003170201A Pending JP2005004119A (ja) | 2003-06-16 | 2003-06-16 | 音響信号符号化装置及び音響信号復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005004119A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005112001A1 (ja) * | 2004-05-19 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
JP2010507943A (ja) * | 2006-10-24 | 2010-03-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム |
JP2013524273A (ja) * | 2010-03-31 | 2013-06-17 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 符号化方法および装置、そして、復号化方法および装置 |
JP2022127601A (ja) * | 2019-06-17 | 2022-08-31 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 信号依存的な数および精度制御を伴うオーディオエンコーダ、オーディオデコーダ、ならびに関連する方法およびコンピュータプログラム |
-
2003
- 2003-06-16 JP JP2003170201A patent/JP2005004119A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005112001A1 (ja) * | 2004-05-19 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
JP5013863B2 (ja) * | 2004-05-19 | 2012-08-29 | パナソニック株式会社 | 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法 |
US8463602B2 (en) | 2004-05-19 | 2013-06-11 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
US8688440B2 (en) | 2004-05-19 | 2014-04-01 | Panasonic Corporation | Coding apparatus, decoding apparatus, coding method and decoding method |
JP2010507943A (ja) * | 2006-10-24 | 2010-03-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム |
JP2013524273A (ja) * | 2010-03-31 | 2013-06-17 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 符号化方法および装置、そして、復号化方法および装置 |
CN104392726A (zh) * | 2010-03-31 | 2015-03-04 | 韩国电子通信研究院 | 编码设备和解码设备 |
US9424857B2 (en) | 2010-03-31 | 2016-08-23 | Electronics And Telecommunications Research Institute | Encoding method and apparatus, and decoding method and apparatus |
JP2022127601A (ja) * | 2019-06-17 | 2022-08-31 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 信号依存的な数および精度制御を伴うオーディオエンコーダ、オーディオデコーダ、ならびに関連する方法およびコンピュータプログラム |
JP7422966B2 (ja) | 2019-06-17 | 2024-01-29 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 信号依存的な数および精度制御を伴うオーディオエンコーダ、オーディオデコーダ、ならびに関連する方法およびコンピュータプログラム |
US12159641B2 (en) | 2019-06-17 | 2024-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
US12175991B2 (en) | 2019-06-17 | 2024-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3336617B2 (ja) | 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体 | |
KR101967122B1 (ko) | 신호 처리 장치 및 방법, 및 프로그램 | |
JP4740548B2 (ja) | 帯域幅拡張技術を利用して符号化及び復号化を行う方法及び装置 | |
JP3203657B2 (ja) | 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体 | |
JP4899359B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
US20020049586A1 (en) | Audio encoder, audio decoder, and broadcasting system | |
JP2009116371A (ja) | 符号化装置および復号化装置 | |
KR20140022813A (ko) | 허프만 부호화를 실행하기 위한 장치 및 방법 | |
JPWO2006003891A1 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
JP4800379B2 (ja) | 最大ビットレートを保証する情報の無損失符号化 | |
JP2011059714A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP4063508B2 (ja) | ビットレート変換装置およびビットレート変換方法 | |
JP4308229B2 (ja) | 符号化装置および復号化装置 | |
JP4736812B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP3964860B2 (ja) | ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体 | |
JP3923783B2 (ja) | 符号化装置及び復号化装置 | |
KR100378796B1 (ko) | 디지탈 오디오 부호화기 및 복호화 방법 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR20040044389A (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
JP2005004119A (ja) | 音響信号符号化装置及び音響信号復号化装置 | |
JP4369140B2 (ja) | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
JP2004252068A (ja) | デジタルオーディオ信号の符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050929 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090407 |