JP2011507013A - オーディオ信号処理方法及び装置 - Google Patents
オーディオ信号処理方法及び装置 Download PDFInfo
- Publication number
- JP2011507013A JP2011507013A JP2010536827A JP2010536827A JP2011507013A JP 2011507013 A JP2011507013 A JP 2011507013A JP 2010536827 A JP2010536827 A JP 2010536827A JP 2010536827 A JP2010536827 A JP 2010536827A JP 2011507013 A JP2011507013 A JP 2011507013A
- Authority
- JP
- Japan
- Prior art keywords
- level
- blocks
- audio signal
- block
- size information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本発明のオーディオ信号処理方法は、オーディオ信号を受信し、受信されたオーディオ信号を処理することを含み、このオーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報とA+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報とを比較し、A+1レベルの少なくとも2つのブロックのサイズ情報がAレベルのブロックのサイズ情報よりも小さい場合には、A+1レベルのブロックを最適なブロックと決定する方式によって処理し、または、Aレベルのブロックのサイズ情報とA+1レベルの少なくとも2つのブロックのサイズ情報とを比較し、Aレベルのブロックのサイズ情報がA+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、Aレベルのブロックを最適なブロックと決定する方式によって処理することを特徴とする。
【選択図】図7
【選択図】図7
Description
本発明は、オーディオ信号処理方法及び装置に係り、特に、オーディオ信号のエンコーディング方法及び装置に関する。
従来、オーディオ信号の保存と再生は異なる方法によって行われてきた。例えば、音楽及び音声は、蓄音技術(例:レコードプレーヤ)、磁気的技術(例:カセットテープ)及びデジタル技術(例:コンパクトディスク)によって録音し保存されてきた。オーディオ保存技術の進歩につれて、オーディオ信号のクォリティ及び保存能力を最適化するために多くの課題を克服しなければならない。
音楽信号の広帯域送信及び保存のために、知覚的手段による圧縮では、無損失再構成が、高効率よりも重要な特徴とされつつあり、コンテンツ所有者と放送局の間には、開放され且つ一般的な圧縮方式が要求されている。このような要求に応じて、新しい無損失コーディング方式が考慮されてきた。無損失オーディオコーディングは、原信号の完璧な復元によって、質的にいかなる損失もないデジタルオーディオデータの圧縮を可能にする。
しかしながら、無損失オーディオコーディング方法において、エンコーディングには多くの時間がかかり、多量のリソースが要求され、複雑性が非常に増加する。
したがって、本発明は、従来技術の限界及び欠点に起因する1つまたはそれ以上の問題点を実質的に解消するオーディオ信号処理方法及び装置を対象とする。本発明の目的は、原信号の完璧な復元によって、質的にいかなる損失もないデジタルオーディオデータの圧縮を可能にする無損失オーディオコーディングのための方法及び装置を提供することにある。
本発明の他の目的は、エンコーディング時間、リソース及び複雑性を減らすことができる無損失オーディオコーディングのための方法及び装置を提供することにある。
本発明の付加的な利点、目的及び特徴は、下記の説明で部分的に記述される、部分的には後述する実施例から通常の知識を有する者に明白になる、または、本発明の記述から学習することができる。本発明の目的及びその他の利点は、添付の図面の他に、記述された説明及び請求項で特別に指摘された構造によって具現及び達成される。
本発明は、下記の効果及び利点を提供する。
第一に、本発明は、エンコーディング時間、リソース計算及び複雑性を減少させる無損失オーディオコーディングのための方法及び装置を提供することができる。
第二に、本発明は、無損失オーディオコーディングのブロックスイッチングプロセス速度を高めることができる。
第三に、本発明は、無損失オーディオコーディングの長期予測過程で複雑性及びリソース計算を減らすことができる。
添付の図面は、本発明の理解を助けるために含まれ、本明細書の一部を構成するもので、発明の原理を説明するために提供される明細書と共に本発明の実施例を図示する。
本発明の目的による上記課題及びその他の利点を達成するために、本明細書に例示され且つ広く説明されるように、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する段階と、上記A+1レベルの少なくとも2つのブロックのサイズ情報がAレベルのブロックのサイズ情報よりも小さい場合には、A+1レベルの少なくとも2つのブロックを最適なブロックと定める段階と、を含む方式によって処理され、上記オーディオ信号は、階層構造を形成するように複数個のレベルを持つブロックに区分可能であることを特徴とする。
本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報とオーディオ信号の1つのフレーム内のAレベルのブロックのサイズ情報とを比較する段階と、A+1レベルの少なくとも2つのブロックの全てのサイズ情報が、上記フレームに含まれたA+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてA+1レベルの少なくとも2つのブロックを定める段階と、を含む方法によって処理される。
本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報とAレベルの1つのブロックのサイズ情報とを比較する段階と、A+2レベルの少なくとも2つのブロックのサイズ情報とA+1レベルのブロックのサイズ情報とを比較する段階と、Aレベルのブロックのサイズ情報が、A+1レベルの少なくとも2つのブロックのサイズ情報及びA+2レベルの少なくとも4つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてAレベルのブロックを定める段階と、を含む方法によって処理される。
本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Aレベルの1つのブロックのサイズ情報とA+1レベルの少なくとも2つのブロックのサイズ情報とを比較する段階と、Aレベルのブロックのサイズ情報がA+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてAレベルのブロックを定める段階と、を含む方法によって処理される。
本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、オーディオ信号の1つのフレーム内のAレベルのブロックに対応するA+1レベルの少なくとも2つのブロックのサイズ情報とAレベルの1つのブロックのサイズ情報とを比較する段階と、Aレベルのブロックの全てのサイズ情報が、上記フレーム内に含まれるAレベルのブロックに対応するA+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてAレベルのブロックを定める段階と、を含む方法によって処理される。
本発明の他の側面によれば、オーディオ信号処理装置は、A+1レベルの少なくとも2つのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する初期比較部と、A+1レベルの少なくとも2つのブロックのサイズ情報がAレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとして上記A+1レベルの少なくとも2つのブロックを定める条件比較部と、を含む。上記オーディオ信号は、数個のレベルを持つブロックに分けられて階層的構造となることができる。
本発明の他の側面によれば、オーディオ信号処理装置は、オーディオ信号を受信し、該受信されたオーディオ信号を処理する。上記オーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報と1つのAレベルのブロックのサイズ情報とを比較する初期比較部と、Aレベルのブロックのサイズ情報がA+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてAレベルのブロックを定める条件比較部と、を含む装置により処理される。
本発明の他の側面として、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、A+1レベルの少なくとも2つのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する段階と、A+1レベルの少なくとも2つのブロックのサイズ情報がAレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてA+1レベルの少なくとも2つのブロックを定める段階と、上記最適なブロックを含むオーディオ信号の自己相関関数値に基づいてラグ情報を決める段階と、上記ラグ情報に基づいて長期予測フィルタ情報を推定する段階と、を含む方法によって処理される。
本発明の他の側面では、オーディオ信号処理装置は、A+1レベルの少なくとも2つのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する初期比較部と、A+1レベルの少なくとも2つのブロックのサイズ情報がAレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてA+1レベルの少なくとも2つのブロックを定める条件比較部と、上記最適なブロックを含むオーディオ信号の自己相関関数値に基づいてラグ情報を定めるラグ情報決定部と、上記ラグ情報に基づいて長期予測フィルタ情報を推定するフィルタ情報推定部と、を含む。
上記の一般的な説明及び下記の本発明の詳細な説明はいずれも例示的で説明的であり、特許請求の範囲に記載された発明のさらなる説明を提供するためのものであることが理解できる。
以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。図面中、同一または類似の構成要素には可能な限り同一の参照番号を付する。
本発明を説明するに先立ち、本発明で使用する大部分の用語は、その技術分野によく知られた一般的な用語としたが、一部の用語は必要に応じて出願人により選択され、本発明の後述する明細書で使用されることに留意されたい。したがって、出願人によって定義された用語は、本発明における意味に基づいて理解されることが好ましい。
無損失オーディオコーディング方法では、エンコーディング過程がデータの損失なしに完全に可逆的でなければならないため、エンコーダ及びデコーダの様々な部分は、定められた方法で具現されなければならない。
[コーデックの構造]
図1は、本発明による第1エンコーダの例示図である。図1を参照すると、ブロックスイッチング部110は、入力されたオーディオ信号をフレームに分割することができる。該入力されたオーディオ信号は、放送信号としてまたはデジタル媒体で受信することができる。1つのフレーム内には、複数本のチャネルが存在することができる。各チャネルは、追加的な処理のためにオーディオサンプルのブロック内でさらに分割することができる。
図1は、本発明による第1エンコーダの例示図である。図1を参照すると、ブロックスイッチング部110は、入力されたオーディオ信号をフレームに分割することができる。該入力されたオーディオ信号は、放送信号としてまたはデジタル媒体で受信することができる。1つのフレーム内には、複数本のチャネルが存在することができる。各チャネルは、追加的な処理のためにオーディオサンプルのブロック内でさらに分割することができる。
バッファ120は、ブロックスイッチング部110によって分割されたブロック及び/またはフレームサンプルを保存することができる。係数推定部130は、各ブロックに対する係数値の最適なセットを推定することができる。係数の個数、すなわち、予測変数の順序は、適応的に選択することができる。演算において、係数推定部130は、デジタルオーディオデータの上記ブロックのための偏自己相関方式(Partial Autocorrelation;PARCOR、以下「パーコール」という)値の1つのセットを計算する。パーコール値は、予測変数係数のパーコール代表値を表す。続いて、量子化部140は、係数推定部130で獲得されたパーコール値を量子化することができる。
第1エントロピーコーディング部150は、当該パーコール値からオフセット値を減算することによってパーコールレジデュアル値を計算することができ、エントロピーパラメータによって定められたエントロピーコードを用いて上記パーコールレジデュアル値をエンコーディングすることができる。ここで、オフセット値とエントロピーパラメータは、デジタルオーディオデータのブロックのサンプリング率に基づいて複数のテーブルから選択された最適なテーブルから選択される。これら複数のテーブルは、送信のためのデジタルオーディオデータの最適な圧縮のために複数のサンプリング率の範囲に対して予め定めておくことができる。
係数変換部160は、量子化されたパーコール値を線形予測コーディング(Linear Predictive Coding;LPC)係数に変換することができる。また、短期予測器170は、線形予測コーディング係数を用いて、バッファ120に保存された以前のオリジナルサンプルから現在の予測値を推定することができる。
第2エントロピーコーディング部210は、異なるエントロピーコードを用いて予測レジデュアルをエンコーディングし、コードインデックスを生成することができる。選択されたコードインデックスは、付加(または付加的な)情報として送信しなければならない。
上記予測レジデュアルの第2エントロピーコーディング部210は、異なる複雑性を持つ2つの代案的コーディング技術を提供する。その1つは、ゴロム−ライスコーディング(以下、「ライスコード」という)法であり、もう1つは、ブロックギルバート−ムーアコーディング(Block Gilbert-Moore Codes;BGMC)法である。ライスコードは、低い複雑性を有し、BGMC算術コーディング方式は、複雑性はやや増加するが、より良い圧縮を提供する。
最後に、マルチプレクシング部220は、圧縮されたビットストリームを形成するためにコーディングされた予測レジデュアル、コードインデックス、コーディングされたパーコールレジデュアル値、及び他の追加的な情報をマルチプレクシングすることができる。また、第1エンコーダは、デコーディングされたデータの確認のためにデコーダに主に提供される巡回冗長検査(Cyclic redundancy check;CRC)の検査合計も提供する。エンコーダ側では、巡回冗長検査を、圧縮されたデータが損失なしにデコーディングされうるか否かを確認するために用いることができる。すなわち、巡回冗長検査を、損失なしに圧縮されたデータをデコーディングするために用いることができる。
追加的なエンコーディングオプションは、柔軟なブロックスイッチング方式、ラングムアクセス、及びジョイントチャネルコーディングを含む。第1エンコーダは、異なる複雑性を持つ複数の圧縮レベルを提供するために上記のオプションを用いることができる。上記ジョイントチャネルコーディングは、ステレオチャネルやマルチチャネル信号間の依存度を活用するために用いられる。これは、差値がオリジナルチャネルの1つに比べてより効率的にコーディングされうるセグメント中の2つのチャネル間の差値をコーディングすることによって達成することができる。
図2は、本発明によるデコーダ3の例示図である。特に、図2は、適応が実行される必要がないため、エンコーダよりも遥かに複雑でない無損失のオーディオ信号デコーダを示す。
マルチプレクシング部310は、放送やデジタル媒体を通じてオーディオ信号を受信し、デジタルオーディオデータのブロックのコーディングされた予測レジデュアル、コードインデックス、コーディングされたパーコールレジデュアル値及び他の追加的な情報をマルチプレクシングするように構成することができる。
第1エントロピーデコーディング部320は、エントロピーパラメータによって指定されたエントロピーコードを用いてパーコールレジデュアル値をデコーディングし、デコーディングされたパーコールレジデュアル値とオフセット値とを加算することによってパーコール値の1セットを計算するように構成することができる。ここで、オフセット値とエントロピーパラメータは、デジタルオーディオデータのブロックのサンプリング率に基づいて、多数のテーブルの中からエンコーダによって選択されたテーブルから選択される。
係数変換部360は、エントロピーデコーディングされたパーコール値をLPC係数に変換するように構成することができる。なお、短期予測部370は、LPC係数を用いてデジタルオーディオデータブロックの予測レジデュアルを推定するように構成することができる。第2合算部380は、短期LPCレジデュアルe(n)と短期予測因子を用いてデジタルオーディオデータの予測を計算するように構成することができる。最後に、組立部390は、デコーディングされたブロックデータを、フレームデータに組み立てるように構成することができる。
上記のように、デコーダ3は、コーディングされた予測レジデュアル及びパーコールレジデュアル値をデコーディングし、パーコールレジデュアル値をLPC係数に変換し、逆予測フィルタを適用して無損失再生信号を計算するように構成することができる。デコーダ3の計算量は、エンコーダ1によって選択された予測手順による。大部分の場合、実時間デコーディングは、ローエンドシステムでも可能である。
図3は、本発明による複数のチャネル(例:Mチャネル)を含む圧縮されたオーディオ信号のビットストリーム構造を例示する図である。
ビットストリームは、複数のチャネル(例:Mチャネル)を含む少なくとも1つのオーディオフレームを構成する。各チャネルについては詳細に後述され、本発明によるブロックスイッチング方法によって複数のブロックに分けられる。それぞれの分けられたブロックは異なるサイズを有し、図1によるコーディングデータを含む。例えば、分けられたブロック中のコーディングデータは、コードインデックス、予測順序K、予測係数及びコーディングされたレジデュアル値を含む。チャネル間のジョイントコーディングが用いられると、ブロック分割は、両チャネルに対して同一であり、ブロックは、インターリービング方式で保存される。そうでなければ、各チャネルに対するブロック分割は独立している。
以下、ブロックスイッチング及び長期予測を、添付の図面を参照しつつ詳細に説明する。
[ブロックスイッチング]
図4は、本発明の一実施例によるオーディオ信号処理のためのブロックスイッチング装置を示すブロック図である。図4に示すように、オーディオ処理装置は、ブロックスイッチング部110及びバッファ120を含む。好ましくは、ブロックスイッチング部110は、分割部110a、初期比較部110b、及び条件比較部110cを含む。分割部110aは、1つのフレームの各チャネルを複数のブロックに分けることができ、図1を参照して説明したブロックスイッチング部110と同一にすることができる。また、バッファ120は、ブロックスイッチング部110で選択されたブロック分割を保存することができ、図1を参照して説明したバッファ120と同様にすることができる。
図4は、本発明の一実施例によるオーディオ信号処理のためのブロックスイッチング装置を示すブロック図である。図4に示すように、オーディオ処理装置は、ブロックスイッチング部110及びバッファ120を含む。好ましくは、ブロックスイッチング部110は、分割部110a、初期比較部110b、及び条件比較部110cを含む。分割部110aは、1つのフレームの各チャネルを複数のブロックに分けることができ、図1を参照して説明したブロックスイッチング部110と同一にすることができる。また、バッファ120は、ブロックスイッチング部110で選択されたブロック分割を保存することができ、図1を参照して説明したバッファ120と同様にすることができる。
分割部110a、初期比較部110b及び条件比較部110cの詳細事項及びプロセスは「ボトムアップ法」及び/または「トップダウン法」と称する場合がある。
まず、分割部110aは、各チャネルを複数個のブロックに階層的に分割するように構成することができる。図5は、本発明による階層的なブロック分割方法の概念図の例示図である。
図5は、1つのフレームを2乃至32ブロック(例:2、4、8、16、32)に階層的に分ける方法を示す。複数個のチャネルが単一のフレームで提供されるとき、各チャネルは、32個以上のブロックに分割することができる。図示のように、各チャネルに対して分割されたブロックは、1つのフレームを構成する。例えば、レベル=5を参照すると、1つのフレームは32ブロックに分けられる。また、前述したように、予測及びエントロピーコーディングは、分割されたブロック単位で行うことができる。
図6は、本発明による分割されたブロックの様々な組み合わせを示す図である。図6に示すように、NB=N、N/2、N/4、N/8、N/16及びN/32を有するブロックの任意の組み合わせの分割は、各ブロックが2倍長の上位ブロックのサブ分割から生成される限り、1つのフレーム内で可能である。すなわち、最上位レベルのブロック長は、最下位レベルのブロック長の32倍と同一である。
例えば、図5に示すように、1つのフレームがN/4+N/2+N/4(例:図6の(e)及び(f))に分けられない場合には、1つのフレームはN/4+N/4+N/2に分けることができる。上記ブロックスイッチング方法は、適当なブロック分割を選択する過程と関連している。以下では、本発明によるブロックスイッチング方法を、「ボトムアップ法」及び/または「トップダウン法」と称する。
[ボトムアップ法]
図7は、本発明の一実施例によるオーディオ信号の処理のためのブロックスイッチング方法の概念を説明するための図である。図8は、本発明の一実施例によるオーディオ信号を処理するためのブロックスイッチング方法を示すフローチャートである。
図7は、本発明の一実施例によるオーディオ信号の処理のためのブロックスイッチング方法の概念を説明するための図である。図8は、本発明の一実施例によるオーディオ信号を処理するためのブロックスイッチング方法を示すフローチャートである。
図7を参照すると、a=0...5のそれぞれの6個のレベルのためにNサンプルの1つのオーディオフレームは、長さがNB=N/B=N/2aのB=2a個のブロックに分けられる。ここで、a=0レベルは、最上位または最高レベルと見なされ、a=5レベルは、最下位または最低レベルと見なされる。なお、「ボトムアップ法」に関して、1番目のブロックは最下位レベルに対応し、2番目のブロックは最下位レベルの上のレベル(a=4)に対応し、3番目のブロックは、2番目のブロックの上のレベル(a=3)に対応する。場合によっては、1番目のブロック、2番目のブロック、3番目のブロックは、a=4レベルからa=2レベル、a=3レベルからa=1レベル、または、a=2レベルからa=0レベルのようにしてブロックに適用することができる。
1つのレベル(または同一のレベル)に対する全てのブロックは全てエンコーディングされ、コーディングされたブロックは一時的にそれらの個別的なサイズS(ビット)とともに保存される。このサイズSは、コーディング結果、ビットサイズ及びコーディングされたデータブロックのいずれか1つに対応する。上記エンコーディングは各レベルに対して行われ、結果としてそれぞれのレベルの各ブロックに対して値S(a,b)、b=0...B−1が得られる。場合によっては、スキップされるブロックはエンコーディングする必要がない場合もありうる。
その後、a=5の最下位レベルから、2つの連続したブロックを上位のa=4レベルの少なくとも1つのブロックと比較することができる。すなわち、a=5レベルの2つの連続したブロックのビットサイズは、どのブロックがビットを少なく要求するかを判定するために、対応ブロックのビットサイズと比較される。ここで、対応ブロックは、分割された長さ/期間の側面からブロックサイズと称することができる。例えば、a=5の最下位レベルの初期の2つの連続したブロック(左側から始めて)は、2番目の下位レベルa=4の初期ブロックに対応する。
図4及び図8を参照すると、初期比較部110bは、2つの1番目のブロック(最下位レベルで)のビットサイズを、2番目のブロックのビットサイズと比較する(S110)。2つの1番目のブロックのビットサイズは、1つの1番目のブロックのサイズともう1つの1番目のブロックのサイズとの和と同一になりうる。最下位レベルがa=5の場合に、上記ステップS110での比較は、下記の式1で示される。
[式1]
S(5,2b)+S(5,2b+1)>=S(4,b)
S(5,2b)+S(5,2b+1)>=S(4,b)
2つの1番目のブロックのビットサイズが、2番目のブロックのビットサイズよりも小さいと(S110で「No」)、初期比較部110bは、最下位レベルの2つの1番目のブロックを選択する(S120)。換言すると、2つの1番目のブロックは、バッファ120に保存され、ビット率の側面で2番目のブロックと比較して改善がないので、ステップS120で2番目のブロックはバッファ120に保存されず、一時的に動作するバッファで削除される。ステップS120の後に、比較及び選択は中断され、次のレベルではそれ以上対応するブロックに対して行われない。
選択的に、2つの1番目のブロックのビットサイズが、2番目のブロックのビットサイズと等しいか、または大きい場合(ステップS110で「yes」)に、条件比較部110cは、3番目のブロックのビットサイズと2つの2番目のブロックのビットサイズとを比較する(S130)。場合によっては、ステップS110で2つの1番目のブロックのビットサイズのうちの少なくとも1つが、1つのレベルの全てのブロック(b=0...B)のうち、上記2つの1番目のブロックに対応する2番目のブロックのビットサイズよりも小さい場合には、ステップS130を実行する。この修正条件は、続くステップのS150及びS170に適用することができる。2つの2番目のブロックのビットサイズが、3番目のブロックのビットサイズよりも小さいと(ステップS130で「no」)、条件比較部110cは、2つの2番目のブロックを選択する(S140)。ステップS140では、レベル5からの2つの短いブロックは、レベル4における長いブロックに置換される。ステップS140の後に、比較及び選択の過程は中断される。
ステップS130及びS140と同様に、a=3レベルの3番目のブロックとa=2レベルの4番目のブロックとの比較が行われ(S150)、選択は比較結果に基づいて行われる(S160)。一般に、レベルaでの2個のi番目のブロックのビットサイズがレベルa+1でのi+1番目のブロックのビットサイズと等しいか、または大きい場合、条件比較部110cが2つのi番目のブロックのビットサイズとi+1番目のブロックのビットサイズとを比較し(S170)、適当なブロックを選択する、または、比較結果によって次のレベルに関して比較する(S180)。上記ステップS170は、下記の式2で表現される。上記ステップS170は、最上位レベル(a=0)に到逹するまで繰り返すことができる。
[式2]
S(a+1, 2b) + S(a+1, 2b+1) >= S(a, b)
ここで、
a=0...5, b=0...B-1
S(a+1, 2b) + S(a+1, 2b+1) >= S(a, b)
ここで、
a=0...5, b=0...B-1
「a+1」は、i番目のブロックのレベルに対応し、「a」は、i+1番目のブロックのレベルに対応する。図7を参照すると、適当なブロックとして選択されたブロックは、濃い灰色で表示した部分であり、さらに併合しても利得が得られないブロックは、薄い灰色で表示され、処理されるべきブロックは白色で表示される。また、不要のまたは使用されないブロックは、上記の比較過程が省略されることを示す灰色(または半透明)で表示される。
レベルa=3からレベルa=1までは、改善がないため、上位レベルインa=1及びa=0は処理される必要がない。最後に、a=3レベルのブロックはb=0...7で選択され、a=4レベルのブロックはb=8...15,...で選択され、a=5レベルのブロックはb=20−21で選択され、残りは省略されてもよい。
ステップS110乃至S180は、次のCスタイル擬似コード1(pseudo code 1)によって行われるが、本発明がこれに制限されるわけではない。特に、擬似コード1は、上述の変形条件によって行われる。
[トップダウン法]
図9は、本発明の他の実施例によってオーディオ信号処理のためのブロックスイッチング方法の概念を説明するための図である。図10は、本発明の他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートである。図9を参照すると、ボトムアップ法と同様に、a=0,...,5の6個のレベルのそれぞれに対するNサンプルのオーディオフレームは、長さNB=N/B=N/2aのB=2aブロックに分けられる。ボトムアップ法と逆に、トップダウン法では、1番目のブロックは最上位のレベル(a=0)に対応し、2番目のブロックは、最上位レベルの下のレベル(a=1)に対応し、3番目のブロックは、2番目のブロックの下のレベル(a=2)に対応する。ただし、本発明がこれに限定されるわけではない。場合によっては、1番目のブロック、2番目のブロック及び3番目のブロックは、a=1レベルからa=3レベル、a=2レベルからa=4レベル、または、a=3レベルからa=5レベルのようにしてブロックに適用することもできる。
図9は、本発明の他の実施例によってオーディオ信号処理のためのブロックスイッチング方法の概念を説明するための図である。図10は、本発明の他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートである。図9を参照すると、ボトムアップ法と同様に、a=0,...,5の6個のレベルのそれぞれに対するNサンプルのオーディオフレームは、長さNB=N/B=N/2aのB=2aブロックに分けられる。ボトムアップ法と逆に、トップダウン法では、1番目のブロックは最上位のレベル(a=0)に対応し、2番目のブロックは、最上位レベルの下のレベル(a=1)に対応し、3番目のブロックは、2番目のブロックの下のレベル(a=2)に対応する。ただし、本発明がこれに限定されるわけではない。場合によっては、1番目のブロック、2番目のブロック及び3番目のブロックは、a=1レベルからa=3レベル、a=2レベルからa=4レベル、または、a=3レベルからa=5レベルのようにしてブロックに適用することもできる。
トップダウン法は、最上位レベル(a=0)から始まって下位レベルの方向に進行する点で異なるだけで、次のレベルが向上した結果を有しない地点でサーチを中止する点でボトムアップ法と一致する。各レベル「a」で、1つのブロックサイズは、下のレベルa+1の2個の対応ブロックと比較される。このような2つの短いブロックが少ないビットを必要とすると、レベルaの長いブロックは置換され(すなわち、事実上分離され)、上記アルゴリズムはa+1レベルに進行する。逆に、長いブロックが少ないビットを必要とすると、下位レベルでの適用は終了する。
図4及び図10を参照すると、初期比較部110bは、1番目のブロックのビットサイズ(最上位レベルで)と2つの2番目のブロックのビットサイズとを比較する(S210)。2番目のブロックのビットサイズは、1つの2番目のブロックのサイズともう1つの2番目のブロックのサイズとの和と同一になりうる。最上位レベルがa=0の場合、ステップS210での比較は、下記の式3で表現される。
[式3]
S(0, b/2) >= S(1, b) + S(1, b+1)
S(0, b/2) >= S(1, b) + S(1, b+1)
上記のステップS120のように、1番目のブロックのビットサイズが2つの2番目のブロックのビットサイズよりも小さいと(ステップS110で「no」)、初期比較部110bは、最上位レベルの2つの1番目のブロックを選択する(S220)。逆に、1番目のブロックのビットサイズが2つの2番目のブロックのビットサイズと等しいか、または大きい場合(ステップS210で「yes」)は、条件比較部110cは、2番目のブロックのビットサイズと2つの3番目のブロックのビットサイズとを比較する(S230)。場合によっては、ステップS210で、1番目のブロックのビットサイズのうち少なくとも1つが、1つのレベルの全てのブロック(b=0...B)のうち、1番目のブロックに対応する2つの2番目のブロックのビットサイズよりも小さい場合には、上記ステップS230を行うこともできる。この変形条件は、続くステップS250及びS270にも適用可能である。ステップS140からS180のように、ステップS240からS280が行われる。ステップS270は、下記の式4で示される。このステップS270は、最下位レベル(a=5)に到逹するまで繰り返すことができる。
[式4]
S(a-1, b/2) >= S(a, b) + S(a, b+1)
ここで、
a=0...5, b=0...B-1
S(a-1, b/2) >= S(a, b) + S(a, b+1)
ここで、
a=0...5, b=0...B-1
「a−1」は、i番目のブロックのレベルに対応し、「a」は、i+1番目のブロックのレベルに対応する。ステップS210からS280は、下記のCスタイルの擬似コード2(pseudo code 2)によって行われる。ただし、本発明はこれに限定されない。
図11は、本発明の変形された他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートであり、図12は、図11の概念を説明するための図である。特に、この変形された他の実施例は、1つのブロックが、1つのレベルではなく2つのレベルを向上させない場合にのみ停止する、拡張されたトップダウン法に該当する。これが、1つのブロックが単に1つのレベルに対して向上しない場合に停止する、図10を参照して説明したトップダウン法との主な相違点である。
図4及び図11を参照すると、初期比較部110bは、ステップS210のように、(最上位レベルで)1番目のブロックのビットサイズと2番目のブロックのビットサイズとを比較する(S310)。このステップS310の比較結果によらず、初期比較部110bは、2番目のブロックのビットサイズと3番目のブロックのビットサイズとを比較する(S320及びS370)。1番目のブロックのビットサイズが2番目のブロックのビットサイズよりも小さく(ステップS310で「no」)、2番目のブロックのビットサイズが2つの3番目のブロックのビットサイズよりも小さいと(ステップS320で「no」)(図12で、「ケースE」と「ケースF」)、すなわち、1番目のブロックが2番目のブロック及び3番目ブロックに比べてより効率的であると、初期比較部110bは、最適なブロックとして1番目のブロックを選択し、次のレベルで比較は終了する(図12で「Fの場合」、特に、角が5つある星を参照されたい)。そうでなければ、すなわち、2番目のブロックのビットサイズが3番目のブロックのビットサイズと等しいか、または大きいと(S320で「yes」)、初期比較部110bは、1番目のブロックを選択するか、それとも、1番目のブロックと3番目のブロックとの比較結果に基づいて次のレベルで比較するかを決定する。特に、1番目のブロックが3番目のブロックよりも効率的であれば(ステップS340で「no」)、初期比較部110bは、1番目のブロックを選択する(S350)(図12で「ケースE」、特に、角が5つある星を参照されたい)。そうでなければ(ステップS340で「yes」)、条件比較部110cは、3番目のブロックと4番目のブロックとを比較し、4番目のブロックと5番目のブロックとを比較した後、3番目のブロック、4番目のブロック及び5番目のブロックのうち、最も効率的なブロックを選択する(S360)(図12で、「ケースD」を参照)。
一方、2番目のブロックのビットサイズが2つの3番目のブロックのビットサイズと等しいか、または大きいと(ステップS320で「yes」)、1番目のブロックのビットサイズが2番目のブロックのビットサイズと等しいか、または大きいと(ステップS310で「yes」)、2番目のブロックのビットサイズが3番目のブロックよりも小さいと(ステップS370で「no」)(図12で、「ケースB」及び「ケースC」を参照)、条件比較部110cは、一時的に2番目のブロックを選択し(「ケースB」及び「ケースC」で角が4つある星を参照されたい。)、次のレベルを比較する(S380)。そうでなければ、すなわち、3番目のブロックが1番目のブロックと2番目のブロックよりも小さいと(S370で「yes」)(図12で「ケースA」を参照)、条件比較部110cは、一時的に3番目のブロックを選択し(「ケースA」で角が4つある星を参照。)、4番目のブロックと3番目のブロックとを比較し、4番目のブロックと5番目のブロックとを比較する。
[長期予測(Long-Term Prediction;LTP)]
大部分のオーディオ信号は、基本周波数または楽器のピッチから発生する高調波成分または周期的な成分を持っている。非常に高い次数が要求されるから、このような遠い距離のサンプル相関は、短期前方適応予測器を用いては除去しにくく、あまりに多くの付加情報量を必要とする。遠い距離におけるサンプル間の相関性をより効率的に使用するために、長期予測を行うことができる。
大部分のオーディオ信号は、基本周波数または楽器のピッチから発生する高調波成分または周期的な成分を持っている。非常に高い次数が要求されるから、このような遠い距離のサンプル相関は、短期前方適応予測器を用いては除去しにくく、あまりに多くの付加情報量を必要とする。遠い距離におけるサンプル間の相関性をより効率的に使用するために、長期予測を行うことができる。
図13及び図14を参照すると、長期予測器190は、続く入力信号の標準化をスキップする(S410)。
その後、ラグ情報決定部190aは、自己相関関数を用いてラグ情報τを決定する(S420)。自己相関関数(ACF)は、下記の式7で計算される。
その後、フィルタ情報推定部190bは、定常性に基づくウイーナ・ホッフ(Wiener-Hopf)関数を用いてフィルタ情報γjを測定する(S430)。ウイーナ・ホッフ関数の非定常性バージョンが式8である。
したがって、j、k=-2…2でACF値ree(τ+j,0)及びree(τ+j,τ+k)を計算しなければならない。行列が対称であるため、右上位の三角部分のみ計算すればよい(15個の値)。しかし、非定常性のバージョンが仮定されるので、最適なラグサーチをする間に既に計算された定常性のree(τ)値は、再び使用しなくてもよい。
一方、定常性、すなわち、r(j,k)=r(j−k)であれば、ウイーナ・ホッフ関数の定常的なバージョンを適用することができる。
直接的な自己相関関数が最適なラグの決定に使用されると、ree(K+1...K+τmax)のみ計算される。これに対し、上記FFTを用いる高速ACFは常にree(0...N−1)を計算する。したがって、定常のイーナ・ホッフ関数で要求される、r(0...4)とr(τ−2...τ+2)値は、再計算されるのではなく、簡単に上記ステップS420でラグサーチを既に行ったACFの結果を採択することができる。
決定部190cは、上記ステップS450で計算されたビット率に基づいて長期予測が効率的であるか否かを決定する(S460)。このステップS460で、長期予測が効率的でないと決定されると(ステップS460で「no」)、長期予測は行われず、上記の処理は終了する。一方、長期予測が効率的であると(ステップS460で「yes」)、決定部190cは、長期予測を使用すると決定し、長期予測因子を出力する(S470)。また、決定部190cは、ラグ情報τとフィルタ情報γjを付加情報としてエンコーディングすることができ、長期予測が行われるか否かを示すフラグ情報をセットすることができる。
当該発明が属する技術分野における通常の知識を有する者であれば、本発明の精神と範囲を逸脱せずに様々な修正及び変更が可能である。したがって、本発明は、添付の請求項及びその均等範囲内で様々な修正及び変更が可能であることは勿論である。
したがって、本発明は、オーディオ無損失(Audio Lossless;ALS)エンコーディング及びデコーディングに適用することができる。
Claims (34)
- オーディオ信号を受信する段階と、
前記受信したオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する段階と、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が、前記Aレベルのブロックのサイズ情報よりも小さい場合、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する段階と、
を含む方式によって処理されることを特徴とするオーディオ信号処理方法。 - 前記サイズ情報は、コーディング結果、ビットサイズ、コーディングされたデータブロックのうちの1つに対応する、請求項1に記載のオーディオ信号処理方法。
- 前記Aレベルのブロックは、前記A+1レベルの少なくとも2つのブロックの組み合わせに対応する、請求項1に記載のオーディオ信号処理方法。
- 階層的構造は、少なくとも2つのレベルを有し、
最上位レベルのブロック長は、最下位レベルのブロック長の整数倍に相当する、請求項3に記載のオーディオ信号処理方法。 - 前記階層的構造は、6個のレベルを有し、
前記最上位レベルのブロック長は、前記最下位レベルのブロック長の32倍に相当する、請求項4に記載のオーディオ信号処理方法。 - 前記A+1レベルの少なくとも2つのブロックのサイズ情報は、A+1レベルの1つのブロックのサイズとA+1レベルの次のブロックのサイズとの和に相当する、請求項1に記載のオーディオ信号処理方法。
- 前記A+1レベルの少なくとも2つのブロックのサイズ情報が、前記Aレベルのブロックのサイズ情報より大きい場合には、Aレベルの少なくとも2つのブロックのサイズ情報と、A−1レベルのブロックのサイズ情報と、を比較する段階をさらに含む、請求項1に記載のオーディオ信号処理方法。
- 前記Aレベルの少なくとも2つのブロックのサイズ情報が、前記A−1レベルのブロックのサイズ情報よりも小さい場合には、前記Aレベルの少なくとも2つのブロックを最適なブロックと決定する段階をさらに含む、請求項7に記載のオーディオ信号処理方法。
- 前記オーディオ信号は、放送信号として受信される、請求項1に記載のオーディオ信号処理方法。
- 前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項1に記載のオーディオ信号処理方法。
- オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Aレベルのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックのサイズ情報と、を比較する段階と、
前記Aレベルのブロックのサイズ情報が前記A+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する段階と、
を含む方式によって処理されることを特徴とするオーディオ信号処理方法。 - 前記Aレベルのブロックは、前記A+1レベルの少なくとも2つのブロックの組み合わせに対応する、請求項11に記載のオーディオ信号処理方法。
- 前記オーディオ信号は、放送信号として受信される、請求項11に記載のオーディオ信号処理方法。
- 前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項11に記載のオーディオ信号処理方法。
- オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Aレベルのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックのサイズ情報と、を比較する段階と、
前記A+1レベルのブロックのサイズ情報と、A+2レベルの少なくとも2つのブロックのサイズ情報と、を比較する段階と、
前記Aレベルのブロックのサイズ情報が、前記A+1レベルの少なくとも2つのブロックのサイズ情報及び前記A+2レベルの少なくとも4つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する段階と、
を含む方法によって処理されることを特徴とするオーディオ信号処理方法。 - オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Aレベルのブロックのサイズ情報と、前記オーディオ信号の1つのフレーム内のAレベルのブロックに対応するA+1レベルの少なくとも2つのブロックのサイズ情報と、を比較する段階と、
前記Aレベルのブロックの全てのサイズ情報が、前記フレームに含まれるAレベルのブロックに対応する前記A+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する段階と、
を含む方法によって処理されることを特徴とするオーディオ信号処理方法。 - A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する段階と、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する段階と、
を含む動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。 - Aレベルのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックのサイズ情報と、を比較し、
前記Aレベルのブロックのサイズ情報が前記A+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する、
動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。 - A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する初期比較部と、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する条件比較部と、
を有することを特徴とするオーディオ信号処理装置。 - Aレベルのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックのサイズ情報と、を比較する初期比較部と、
前記Aレベルのブロックのサイズ情報が前記A+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する条件比較部と、
を有することを特徴とするオーディオ信号処理装置。 - A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較し、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する、
ことを特徴とするオーディオ信号処理方法。 - Aレベルのブロックのサイズ情報と、A+1レベルの少なくとも2つのブロックのサイズ情報と、を比較し、
前記Aレベルのブロックのサイズ情報が前記A+1レベルの少なくとも2つのブロックのサイズ情報よりも小さい場合には、前記Aレベルのブロックを最適なブロックと決定する、
ことを特徴とするオーディオ信号処理方法。 - オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する段階と、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する段階と、
前記最適なブロックを含む前記オーディオ信号の自己相関関数に基づいてラグ情報を決定する段階と、
前記ラグ情報に基づいて長期予測フィルタ情報を推定する段階と、
を含むことを特徴とするオーディオ信号処理方法。 - 前記オーディオ信号のエンコーディングの前に前記オーディオ信号のビット率を推定する段階をさらに含む、請求項23に記載のオーディオ信号処理方法。
- 前記推定されたビット率に基づいて付加情報として前記ラグ情報及び前記長期予測フィルタ情報をエンコーディングする段階をさらに含む、請求項24に記載のオーディオ信号処理方法。
- 周波数ドメインで前記オーディオ信号の自己相関関数を計算する段階をさらに含む、請求項23に記載のオーディオ信号処理方法。
- 前記長期予測フィルタ情報を推定する段階は、定常性に基づいて行われる、請求項23に記載のオーディオ信号処理方法。
- 前記長期予測フィルタ情報を推定する段階は、前記自己相関関数を用いて行われる、請求項27に記載のオーディオ信号処理方法。
- 前記オーディオ信号は、標準化以前のオーディオ信号に対応する、請求項23に記載のオーディオ信号処理方法。
- 前記オーディオ信号は、放送信号として受信される、請求項23に記載のオーディオ信号処理方法。
- 前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項23に記載のオーディオ信号処理方法。
- A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較し、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックのサイズ情報を最適なブロックと決定し、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定し、
前記ラグ情報に基づいて長期予測フィルタ情報を推定する、
過程を含む動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。 - A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較する初期比較部と、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定する条件比較部と、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定するラグ情報決定部と、
前記ラグ情報に基づいて長期予測フィルタ情報を予測するフィルタ情報推定部と、
を含むことを特徴とするオーディオ信号処理装置。 - A+1レベルの少なくとも2つのブロックのサイズ情報と、前記A+1レベルの少なくとも2つのブロックに対応するAレベルのブロックのサイズ情報と、を比較し、
前記A+1レベルの少なくとも2つのブロックのサイズ情報が前記Aレベルのブロックのサイズ情報よりも小さい場合には、前記A+1レベルの少なくとも2つのブロックを最適なブロックと決定し、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定し、
前記ラグ情報に基づいて長期予測フィルタ情報を予測することを特徴とするオーディオ信号処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2007/006307 WO2009072685A1 (en) | 2007-12-06 | 2007-12-06 | A method and an apparatus for processing an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011507013A true JP2011507013A (ja) | 2011-03-03 |
Family
ID=40717854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010536827A Pending JP2011507013A (ja) | 2007-12-06 | 2007-12-06 | オーディオ信号処理方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8577485B2 (ja) |
EP (1) | EP2215630B1 (ja) |
JP (1) | JP2011507013A (ja) |
CN (1) | CN101809653A (ja) |
WO (1) | WO2009072685A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392725A (zh) * | 2014-12-02 | 2015-03-04 | 中科开元信息技术(北京)有限公司 | 多声道无损音频混合编解码方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007007999A2 (en) * | 2005-07-11 | 2007-01-18 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP2007286200A (ja) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
JP2007286146A (ja) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
EP1072036B1 (en) * | 1998-04-15 | 2004-09-22 | STMicroelectronics Asia Pacific Pte Ltd. | Fast frame optimisation in an audio encoder |
JP2005352396A (ja) | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
JP4794448B2 (ja) | 2004-08-27 | 2011-10-19 | パナソニック株式会社 | オーディオエンコーダ |
CN101233568B (zh) * | 2005-07-29 | 2010-10-27 | Lg电子株式会社 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
-
2007
- 2007-12-06 US US12/734,018 patent/US8577485B2/en active Active
- 2007-12-06 EP EP07851278.7A patent/EP2215630B1/en not_active Not-in-force
- 2007-12-06 CN CN200780100852A patent/CN101809653A/zh active Pending
- 2007-12-06 WO PCT/KR2007/006307 patent/WO2009072685A1/en active Application Filing
- 2007-12-06 JP JP2010536827A patent/JP2011507013A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007007999A2 (en) * | 2005-07-11 | 2007-01-18 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP2007286200A (ja) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
JP2007286146A (ja) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
Non-Patent Citations (1)
Title |
---|
JPN7010004156; Tilman Liebchen, Takehiro Moriya, Noboru Harada, Yutaka Kamamoto, Yuriy A. Reznik: 'The MPEG-4 Audio Lossless Coding (ALS) Standard Technology and Applications' Audio Engineering Society Convention Paper , 200510, p.1-14 * |
Also Published As
Publication number | Publication date |
---|---|
WO2009072685A1 (en) | 2009-06-11 |
EP2215630A4 (en) | 2010-11-17 |
EP2215630B1 (en) | 2016-03-02 |
CN101809653A (zh) | 2010-08-18 |
US20100235172A1 (en) | 2010-09-16 |
US8577485B2 (en) | 2013-11-05 |
EP2215630A1 (en) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8510120B2 (en) | Apparatus and method of processing an audio signal, utilizing unique offsets associated with coded-coefficients | |
US8639519B2 (en) | Method and apparatus for selective signal coding based on core encoder performance | |
US20070078646A1 (en) | Method and apparatus to encode/decode audio signal | |
US20110274165A1 (en) | Parameter selection method, parameter selection apparatus, program, and recording medium | |
JP2011507013A (ja) | オーディオ信号処理方法及び装置 | |
WO2007040328A1 (en) | Method and device to provide arithmetic decoding of scalable bsac audio data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121127 |