JP2011507013A

JP2011507013A - オーディオ信号処理方法及び装置

Info

Publication number: JP2011507013A
Application number: JP2010536827A
Authority: JP
Inventors: リーブヘン，ティルマン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2007-12-06
Filing date: 2007-12-06
Publication date: 2011-03-03
Also published as: WO2009072685A1; EP2215630A4; EP2215630B1; CN101809653A; US20100235172A1; US8577485B2; EP2215630A1

Abstract

本発明のオーディオ信号処理方法は、オーディオ信号を受信し、受信されたオーディオ信号を処理することを含み、このオーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報とＡ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報とを比較し、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報がＡレベルのブロックのサイズ情報よりも小さい場合には、Ａ＋１レベルのブロックを最適なブロックと決定する方式によって処理し、または、Ａレベルのブロックのサイズ情報とＡ＋１レベルの少なくとも２つのブロックのサイズ情報とを比較し、Ａレベルのブロックのサイズ情報がＡ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、Ａレベルのブロックを最適なブロックと決定する方式によって処理することを特徴とする。
【選択図】図７

Description

本発明は、オーディオ信号処理方法及び装置に係り、特に、オーディオ信号のエンコーディング方法及び装置に関する。

従来、オーディオ信号の保存と再生は異なる方法によって行われてきた。例えば、音楽及び音声は、蓄音技術（例：レコードプレーヤ）、磁気的技術（例：カセットテープ）及びデジタル技術（例：コンパクトディスク）によって録音し保存されてきた。オーディオ保存技術の進歩につれて、オーディオ信号のクォリティ及び保存能力を最適化するために多くの課題を克服しなければならない。

音楽信号の広帯域送信及び保存のために、知覚的手段による圧縮では、無損失再構成が、高効率よりも重要な特徴とされつつあり、コンテンツ所有者と放送局の間には、開放され且つ一般的な圧縮方式が要求されている。このような要求に応じて、新しい無損失コーディング方式が考慮されてきた。無損失オーディオコーディングは、原信号の完璧な復元によって、質的にいかなる損失もないデジタルオーディオデータの圧縮を可能にする。

しかしながら、無損失オーディオコーディング方法において、エンコーディングには多くの時間がかかり、多量のリソースが要求され、複雑性が非常に増加する。

したがって、本発明は、従来技術の限界及び欠点に起因する１つまたはそれ以上の問題点を実質的に解消するオーディオ信号処理方法及び装置を対象とする。本発明の目的は、原信号の完璧な復元によって、質的にいかなる損失もないデジタルオーディオデータの圧縮を可能にする無損失オーディオコーディングのための方法及び装置を提供することにある。

本発明の他の目的は、エンコーディング時間、リソース及び複雑性を減らすことができる無損失オーディオコーディングのための方法及び装置を提供することにある。

本発明の付加的な利点、目的及び特徴は、下記の説明で部分的に記述される、部分的には後述する実施例から通常の知識を有する者に明白になる、または、本発明の記述から学習することができる。本発明の目的及びその他の利点は、添付の図面の他に、記述された説明及び請求項で特別に指摘された構造によって具現及び達成される。

本発明は、下記の効果及び利点を提供する。

第一に、本発明は、エンコーディング時間、リソース計算及び複雑性を減少させる無損失オーディオコーディングのための方法及び装置を提供することができる。

第二に、本発明は、無損失オーディオコーディングのブロックスイッチングプロセス速度を高めることができる。

第三に、本発明は、無損失オーディオコーディングの長期予測過程で複雑性及びリソース計算を減らすことができる。

添付の図面は、本発明の理解を助けるために含まれ、本明細書の一部を構成するもので、発明の原理を説明するために提供される明細書と共に本発明の実施例を図示する。

本発明によるエンコーダを示す図である。本発明によるデコーダを示す図である。本発明による複数本のチャネル（例えば、Ｍチャネル）を含む、圧縮されたオーディオ信号のビットストリーム構造を示す図である。本発明の第１の実施例によるオーディオ信号を処理するためのブロックスイッチング装置を示すブロック図である。本発明による階層的なブロック分割方法を示す概念図である。本発明によるブロック分割の様々な組み合わせを示す図である。本発明の一実施例によるオーディオ信号の処理のためのブロックスイッチング方法の概念を説明するための図である。本発明の一実施例によるオーディオ信号の処理のためのブロックスイッチング方法を示すフローチャートである。本発明の他の実施例によるオーディオ信号処理方法の概念を説明するための図である。本発明の他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートである。本発明の変形された他の実施例によるオーディオ信号の処理のためのブロックスイッチング方法を示すフローチャートである。図１１の概念を説明するための図である。本発明の一実施例によるオーディオ信号の処理のための長期予測装置を示すブロック図である。本発明の一実施例によるオーディオ信号の処理のための長期予測方法を示すフローチャートである。

本発明の目的による上記課題及びその他の利点を達成するために、本明細書に例示され且つ広く説明されるように、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する段階と、上記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報がＡレベルのブロックのサイズ情報よりも小さい場合には、Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと定める段階と、を含む方式によって処理され、上記オーディオ信号は、階層構造を形成するように複数個のレベルを持つブロックに区分可能であることを特徴とする。

本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報とオーディオ信号の１つのフレーム内のＡレベルのブロックのサイズ情報とを比較する段階と、Ａ＋１レベルの少なくとも２つのブロックの全てのサイズ情報が、上記フレームに含まれたＡ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡ＋１レベルの少なくとも２つのブロックを定める段階と、を含む方法によって処理される。

本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報とＡレベルの１つのブロックのサイズ情報とを比較する段階と、Ａ＋２レベルの少なくとも２つのブロックのサイズ情報とＡ＋１レベルのブロックのサイズ情報とを比較する段階と、Ａレベルのブロックのサイズ情報が、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報及びＡ＋２レベルの少なくとも４つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡレベルのブロックを定める段階と、を含む方法によって処理される。

本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Ａレベルの１つのブロックのサイズ情報とＡ＋１レベルの少なくとも２つのブロックのサイズ情報とを比較する段階と、Ａレベルのブロックのサイズ情報がＡ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡレベルのブロックを定める段階と、を含む方法によって処理される。

本発明の他の側面によれば、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、オーディオ信号の１つのフレーム内のＡレベルのブロックに対応するＡ＋１レベルの少なくとも２つのブロックのサイズ情報とＡレベルの１つのブロックのサイズ情報とを比較する段階と、Ａレベルのブロックの全てのサイズ情報が、上記フレーム内に含まれるＡレベルのブロックに対応するＡ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡレベルのブロックを定める段階と、を含む方法によって処理される。

本発明の他の側面によれば、オーディオ信号処理装置は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する初期比較部と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報がＡレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとして上記Ａ＋１レベルの少なくとも２つのブロックを定める条件比較部と、を含む。上記オーディオ信号は、数個のレベルを持つブロックに分けられて階層的構造となることができる。

本発明の他の側面によれば、オーディオ信号処理装置は、オーディオ信号を受信し、該受信されたオーディオ信号を処理する。上記オーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と１つのＡレベルのブロックのサイズ情報とを比較する初期比較部と、Ａレベルのブロックのサイズ情報がＡ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡレベルのブロックを定める条件比較部と、を含む装置により処理される。

本発明の他の側面として、オーディオ信号処理方法は、オーディオ信号を受信する段階と、該受信されたオーディオ信号を処理する段階と、を含み、上記オーディオ信号は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する段階と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報がＡレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡ＋１レベルの少なくとも２つのブロックを定める段階と、上記最適なブロックを含むオーディオ信号の自己相関関数値に基づいてラグ情報を決める段階と、上記ラグ情報に基づいて長期予測フィルタ情報を推定する段階と、を含む方法によって処理される。

本発明の他の側面では、オーディオ信号処理装置は、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する初期比較部と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報がＡレベルのブロックのサイズ情報よりも小さい場合には、最適なブロックとしてＡ＋１レベルの少なくとも２つのブロックを定める条件比較部と、上記最適なブロックを含むオーディオ信号の自己相関関数値に基づいてラグ情報を定めるラグ情報決定部と、上記ラグ情報に基づいて長期予測フィルタ情報を推定するフィルタ情報推定部と、を含む。

上記の一般的な説明及び下記の本発明の詳細な説明はいずれも例示的で説明的であり、特許請求の範囲に記載された発明のさらなる説明を提供するためのものであることが理解できる。

以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。図面中、同一または類似の構成要素には可能な限り同一の参照番号を付する。

本発明を説明するに先立ち、本発明で使用する大部分の用語は、その技術分野によく知られた一般的な用語としたが、一部の用語は必要に応じて出願人により選択され、本発明の後述する明細書で使用されることに留意されたい。したがって、出願人によって定義された用語は、本発明における意味に基づいて理解されることが好ましい。

無損失オーディオコーディング方法では、エンコーディング過程がデータの損失なしに完全に可逆的でなければならないため、エンコーダ及びデコーダの様々な部分は、定められた方法で具現されなければならない。

［コーデックの構造］
図１は、本発明による第１エンコーダの例示図である。図１を参照すると、ブロックスイッチング部１１０は、入力されたオーディオ信号をフレームに分割することができる。該入力されたオーディオ信号は、放送信号としてまたはデジタル媒体で受信することができる。１つのフレーム内には、複数本のチャネルが存在することができる。各チャネルは、追加的な処理のためにオーディオサンプルのブロック内でさらに分割することができる。

バッファ１２０は、ブロックスイッチング部１１０によって分割されたブロック及び／またはフレームサンプルを保存することができる。係数推定部１３０は、各ブロックに対する係数値の最適なセットを推定することができる。係数の個数、すなわち、予測変数の順序は、適応的に選択することができる。演算において、係数推定部１３０は、デジタルオーディオデータの上記ブロックのための偏自己相関方式（Partial Autocorrelation;ＰＡＲＣＯＲ、以下「パーコール」という）値の１つのセットを計算する。パーコール値は、予測変数係数のパーコール代表値を表す。続いて、量子化部１４０は、係数推定部１３０で獲得されたパーコール値を量子化することができる。

第１エントロピーコーディング部１５０は、当該パーコール値からオフセット値を減算することによってパーコールレジデュアル値を計算することができ、エントロピーパラメータによって定められたエントロピーコードを用いて上記パーコールレジデュアル値をエンコーディングすることができる。ここで、オフセット値とエントロピーパラメータは、デジタルオーディオデータのブロックのサンプリング率に基づいて複数のテーブルから選択された最適なテーブルから選択される。これら複数のテーブルは、送信のためのデジタルオーディオデータの最適な圧縮のために複数のサンプリング率の範囲に対して予め定めておくことができる。

係数変換部１６０は、量子化されたパーコール値を線形予測コーディング（Linear Predictive Coding；ＬＰＣ）係数に変換することができる。また、短期予測器１７０は、線形予測コーディング係数を用いて、バッファ１２０に保存された以前のオリジナルサンプルから現在の予測値を推定することができる。

第２エントロピーコーディング部２１０は、異なるエントロピーコードを用いて予測レジデュアルをエンコーディングし、コードインデックスを生成することができる。選択されたコードインデックスは、付加（または付加的な）情報として送信しなければならない。

上記予測レジデュアルの第２エントロピーコーディング部２１０は、異なる複雑性を持つ２つの代案的コーディング技術を提供する。その１つは、ゴロム−ライスコーディング（以下、「ライスコード」という）法であり、もう１つは、ブロックギルバート−ムーアコーディング（Block Gilbert-Moore Codes；ＢＧＭＣ）法である。ライスコードは、低い複雑性を有し、ＢＧＭＣ算術コーディング方式は、複雑性はやや増加するが、より良い圧縮を提供する。

最後に、マルチプレクシング部２２０は、圧縮されたビットストリームを形成するためにコーディングされた予測レジデュアル、コードインデックス、コーディングされたパーコールレジデュアル値、及び他の追加的な情報をマルチプレクシングすることができる。また、第１エンコーダは、デコーディングされたデータの確認のためにデコーダに主に提供される巡回冗長検査（Cyclic redundancy check；ＣＲＣ）の検査合計も提供する。エンコーダ側では、巡回冗長検査を、圧縮されたデータが損失なしにデコーディングされうるか否かを確認するために用いることができる。すなわち、巡回冗長検査を、損失なしに圧縮されたデータをデコーディングするために用いることができる。

追加的なエンコーディングオプションは、柔軟なブロックスイッチング方式、ラングムアクセス、及びジョイントチャネルコーディングを含む。第１エンコーダは、異なる複雑性を持つ複数の圧縮レベルを提供するために上記のオプションを用いることができる。上記ジョイントチャネルコーディングは、ステレオチャネルやマルチチャネル信号間の依存度を活用するために用いられる。これは、差値がオリジナルチャネルの１つに比べてより効率的にコーディングされうるセグメント中の２つのチャネル間の差値をコーディングすることによって達成することができる。

図２は、本発明によるデコーダ３の例示図である。特に、図２は、適応が実行される必要がないため、エンコーダよりも遥かに複雑でない無損失のオーディオ信号デコーダを示す。

マルチプレクシング部３１０は、放送やデジタル媒体を通じてオーディオ信号を受信し、デジタルオーディオデータのブロックのコーディングされた予測レジデュアル、コードインデックス、コーディングされたパーコールレジデュアル値及び他の追加的な情報をマルチプレクシングするように構成することができる。

第１エントロピーデコーディング部３２０は、エントロピーパラメータによって指定されたエントロピーコードを用いてパーコールレジデュアル値をデコーディングし、デコーディングされたパーコールレジデュアル値とオフセット値とを加算することによってパーコール値の１セットを計算するように構成することができる。ここで、オフセット値とエントロピーパラメータは、デジタルオーディオデータのブロックのサンプリング率に基づいて、多数のテーブルの中からエンコーダによって選択されたテーブルから選択される。

係数変換部３６０は、エントロピーデコーディングされたパーコール値をＬＰＣ係数に変換するように構成することができる。なお、短期予測部３７０は、ＬＰＣ係数を用いてデジタルオーディオデータブロックの予測レジデュアルを推定するように構成することができる。第２合算部３８０は、短期ＬＰＣレジデュアルe(n)と短期予測因子を用いてデジタルオーディオデータの予測を計算するように構成することができる。最後に、組立部３９０は、デコーディングされたブロックデータを、フレームデータに組み立てるように構成することができる。

上記のように、デコーダ３は、コーディングされた予測レジデュアル及びパーコールレジデュアル値をデコーディングし、パーコールレジデュアル値をＬＰＣ係数に変換し、逆予測フィルタを適用して無損失再生信号を計算するように構成することができる。デコーダ３の計算量は、エンコーダ１によって選択された予測手順による。大部分の場合、実時間デコーディングは、ローエンドシステムでも可能である。

図３は、本発明による複数のチャネル（例：Ｍチャネル）を含む圧縮されたオーディオ信号のビットストリーム構造を例示する図である。

ビットストリームは、複数のチャネル（例：Ｍチャネル）を含む少なくとも１つのオーディオフレームを構成する。各チャネルについては詳細に後述され、本発明によるブロックスイッチング方法によって複数のブロックに分けられる。それぞれの分けられたブロックは異なるサイズを有し、図１によるコーディングデータを含む。例えば、分けられたブロック中のコーディングデータは、コードインデックス、予測順序Ｋ、予測係数及びコーディングされたレジデュアル値を含む。チャネル間のジョイントコーディングが用いられると、ブロック分割は、両チャネルに対して同一であり、ブロックは、インターリービング方式で保存される。そうでなければ、各チャネルに対するブロック分割は独立している。

以下、ブロックスイッチング及び長期予測を、添付の図面を参照しつつ詳細に説明する。

［ブロックスイッチング］
図４は、本発明の一実施例によるオーディオ信号処理のためのブロックスイッチング装置を示すブロック図である。図４に示すように、オーディオ処理装置は、ブロックスイッチング部１１０及びバッファ１２０を含む。好ましくは、ブロックスイッチング部１１０は、分割部１１０ａ、初期比較部１１０ｂ、及び条件比較部１１０ｃを含む。分割部１１０ａは、１つのフレームの各チャネルを複数のブロックに分けることができ、図１を参照して説明したブロックスイッチング部１１０と同一にすることができる。また、バッファ１２０は、ブロックスイッチング部１１０で選択されたブロック分割を保存することができ、図１を参照して説明したバッファ１２０と同様にすることができる。

分割部１１０ａ、初期比較部１１０ｂ及び条件比較部１１０ｃの詳細事項及びプロセスは「ボトムアップ法」及び／または「トップダウン法」と称する場合がある。

まず、分割部１１０ａは、各チャネルを複数個のブロックに階層的に分割するように構成することができる。図５は、本発明による階層的なブロック分割方法の概念図の例示図である。

図５は、１つのフレームを２乃至３２ブロック（例：２、４、８、１６、３２）に階層的に分ける方法を示す。複数個のチャネルが単一のフレームで提供されるとき、各チャネルは、３２個以上のブロックに分割することができる。図示のように、各チャネルに対して分割されたブロックは、１つのフレームを構成する。例えば、レベル＝５を参照すると、１つのフレームは３２ブロックに分けられる。また、前述したように、予測及びエントロピーコーディングは、分割されたブロック単位で行うことができる。

図６は、本発明による分割されたブロックの様々な組み合わせを示す図である。図６に示すように、Ｎ_B＝Ｎ、Ｎ／２、Ｎ／４、Ｎ／８、Ｎ／１６及びＮ／３２を有するブロックの任意の組み合わせの分割は、各ブロックが２倍長の上位ブロックのサブ分割から生成される限り、１つのフレーム内で可能である。すなわち、最上位レベルのブロック長は、最下位レベルのブロック長の３２倍と同一である。

例えば、図５に示すように、１つのフレームがＮ／４＋Ｎ／２＋Ｎ／４（例：図６の（ｅ）及び（ｆ））に分けられない場合には、１つのフレームはＮ／４＋Ｎ／４＋Ｎ／２に分けることができる。上記ブロックスイッチング方法は、適当なブロック分割を選択する過程と関連している。以下では、本発明によるブロックスイッチング方法を、「ボトムアップ法」及び／または「トップダウン法」と称する。

［ボトムアップ法］
図７は、本発明の一実施例によるオーディオ信号の処理のためのブロックスイッチング方法の概念を説明するための図である。図８は、本発明の一実施例によるオーディオ信号を処理するためのブロックスイッチング方法を示すフローチャートである。

図７を参照すると、ａ＝０...５のそれぞれの６個のレベルのためにＮサンプルの１つのオーディオフレームは、長さがＮ_B＝Ｎ／Ｂ＝Ｎ／２^aのＢ＝２^a個のブロックに分けられる。ここで、ａ＝０レベルは、最上位または最高レベルと見なされ、ａ＝５レベルは、最下位または最低レベルと見なされる。なお、「ボトムアップ法」に関して、１番目のブロックは最下位レベルに対応し、２番目のブロックは最下位レベルの上のレベル（ａ＝４）に対応し、３番目のブロックは、２番目のブロックの上のレベル（ａ＝３）に対応する。場合によっては、１番目のブロック、２番目のブロック、３番目のブロックは、ａ＝４レベルからａ＝２レベル、ａ＝３レベルからａ＝１レベル、または、ａ＝２レベルからａ＝０レベルのようにしてブロックに適用することができる。

１つのレベル（または同一のレベル）に対する全てのブロックは全てエンコーディングされ、コーディングされたブロックは一時的にそれらの個別的なサイズＳ（ビット）とともに保存される。このサイズＳは、コーディング結果、ビットサイズ及びコーディングされたデータブロックのいずれか１つに対応する。上記エンコーディングは各レベルに対して行われ、結果としてそれぞれのレベルの各ブロックに対して値Ｓ(ａ，ｂ)、ｂ＝０...Ｂ−１が得られる。場合によっては、スキップされるブロックはエンコーディングする必要がない場合もありうる。

その後、ａ＝５の最下位レベルから、２つの連続したブロックを上位のａ＝４レベルの少なくとも１つのブロックと比較することができる。すなわち、ａ＝５レベルの２つの連続したブロックのビットサイズは、どのブロックがビットを少なく要求するかを判定するために、対応ブロックのビットサイズと比較される。ここで、対応ブロックは、分割された長さ／期間の側面からブロックサイズと称することができる。例えば、ａ＝５の最下位レベルの初期の２つの連続したブロック（左側から始めて）は、２番目の下位レベルａ＝４の初期ブロックに対応する。

図４及び図８を参照すると、初期比較部１１０ｂは、２つの１番目のブロック（最下位レベルで）のビットサイズを、２番目のブロックのビットサイズと比較する（Ｓ１１０）。２つの１番目のブロックのビットサイズは、１つの１番目のブロックのサイズともう１つの１番目のブロックのサイズとの和と同一になりうる。最下位レベルがａ＝５の場合に、上記ステップＳ１１０での比較は、下記の式１で示される。

［式１］
S(5,2b)+S(5,2b+1)>=S(4,b)

２つの１番目のブロックのビットサイズが、２番目のブロックのビットサイズよりも小さいと（Ｓ１１０で「Ｎｏ」）、初期比較部１１０ｂは、最下位レベルの２つの１番目のブロックを選択する（Ｓ１２０）。換言すると、２つの１番目のブロックは、バッファ１２０に保存され、ビット率の側面で２番目のブロックと比較して改善がないので、ステップＳ１２０で２番目のブロックはバッファ１２０に保存されず、一時的に動作するバッファで削除される。ステップＳ１２０の後に、比較及び選択は中断され、次のレベルではそれ以上対応するブロックに対して行われない。

選択的に、２つの１番目のブロックのビットサイズが、２番目のブロックのビットサイズと等しいか、または大きい場合（ステップＳ１１０で「ｙｅｓ」）に、条件比較部１１０ｃは、３番目のブロックのビットサイズと２つの２番目のブロックのビットサイズとを比較する（Ｓ１３０）。場合によっては、ステップＳ１１０で２つの１番目のブロックのビットサイズのうちの少なくとも１つが、１つのレベルの全てのブロック（ｂ＝０...Ｂ）のうち、上記２つの１番目のブロックに対応する２番目のブロックのビットサイズよりも小さい場合には、ステップＳ１３０を実行する。この修正条件は、続くステップのＳ１５０及びＳ１７０に適用することができる。２つの２番目のブロックのビットサイズが、３番目のブロックのビットサイズよりも小さいと（ステップＳ１３０で「ｎｏ」）、条件比較部１１０ｃは、２つの２番目のブロックを選択する（Ｓ１４０）。ステップＳ１４０では、レベル５からの２つの短いブロックは、レベル４における長いブロックに置換される。ステップＳ１４０の後に、比較及び選択の過程は中断される。

ステップＳ１３０及びＳ１４０と同様に、ａ＝３レベルの３番目のブロックとａ＝２レベルの４番目のブロックとの比較が行われ（Ｓ１５０）、選択は比較結果に基づいて行われる（Ｓ１６０）。一般に、レベルａでの２個のｉ番目のブロックのビットサイズがレベルａ＋１でのｉ＋１番目のブロックのビットサイズと等しいか、または大きい場合、条件比較部１１０ｃが２つのｉ番目のブロックのビットサイズとｉ＋１番目のブロックのビットサイズとを比較し（Ｓ１７０）、適当なブロックを選択する、または、比較結果によって次のレベルに関して比較する（Ｓ１８０）。上記ステップＳ１７０は、下記の式２で表現される。上記ステップＳ１７０は、最上位レベル（ａ＝０）に到逹するまで繰り返すことができる。

［式２］
S(a+1, 2b) + S(a+1, 2b+1) >= S(a, b)
ここで、
a=0...5, b=0...B-1

「ａ＋１」は、ｉ番目のブロックのレベルに対応し、「ａ」は、ｉ＋１番目のブロックのレベルに対応する。図７を参照すると、適当なブロックとして選択されたブロックは、濃い灰色で表示した部分であり、さらに併合しても利得が得られないブロックは、薄い灰色で表示され、処理されるべきブロックは白色で表示される。また、不要のまたは使用されないブロックは、上記の比較過程が省略されることを示す灰色（または半透明）で表示される。

レベルａ＝３からレベルａ＝１までは、改善がないため、上位レベルインａ＝１及びａ＝０は処理される必要がない。最後に、ａ＝３レベルのブロックはｂ＝０...７で選択され、ａ＝４レベルのブロックはｂ＝８...１５,...で選択され、ａ＝５レベルのブロックはｂ＝２０−２１で選択され、残りは省略されてもよい。

ステップＳ１１０乃至Ｓ１８０は、次のＣスタイル擬似コード１（pseudo code 1）によって行われるが、本発明がこれに制限されるわけではない。特に、擬似コード１は、上述の変形条件によって行われる。

［トップダウン法］
図９は、本発明の他の実施例によってオーディオ信号処理のためのブロックスイッチング方法の概念を説明するための図である。図１０は、本発明の他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートである。図９を参照すると、ボトムアップ法と同様に、ａ＝０,...,５の６個のレベルのそれぞれに対するＮサンプルのオーディオフレームは、長さＮ_B＝Ｎ／Ｂ＝Ｎ／２^aのＢ＝２^aブロックに分けられる。ボトムアップ法と逆に、トップダウン法では、１番目のブロックは最上位のレベル（ａ＝０）に対応し、２番目のブロックは、最上位レベルの下のレベル（ａ＝１）に対応し、３番目のブロックは、２番目のブロックの下のレベル（ａ＝２）に対応する。ただし、本発明がこれに限定されるわけではない。場合によっては、１番目のブロック、２番目のブロック及び３番目のブロックは、ａ＝１レベルからａ＝３レベル、ａ＝２レベルからａ＝４レベル、または、ａ＝３レベルからａ＝５レベルのようにしてブロックに適用することもできる。

トップダウン法は、最上位レベル（ａ＝０）から始まって下位レベルの方向に進行する点で異なるだけで、次のレベルが向上した結果を有しない地点でサーチを中止する点でボトムアップ法と一致する。各レベル「ａ」で、１つのブロックサイズは、下のレベルａ＋１の２個の対応ブロックと比較される。このような２つの短いブロックが少ないビットを必要とすると、レベルａの長いブロックは置換され（すなわち、事実上分離され）、上記アルゴリズムはａ＋１レベルに進行する。逆に、長いブロックが少ないビットを必要とすると、下位レベルでの適用は終了する。

図４及び図１０を参照すると、初期比較部１１０ｂは、１番目のブロックのビットサイズ（最上位レベルで）と２つの２番目のブロックのビットサイズとを比較する（Ｓ２１０）。２番目のブロックのビットサイズは、１つの２番目のブロックのサイズともう１つの２番目のブロックのサイズとの和と同一になりうる。最上位レベルがａ＝０の場合、ステップＳ２１０での比較は、下記の式３で表現される。

［式３］
S(0, b/2) >= S(1, b) + S(1, b+1)

上記のステップＳ１２０のように、１番目のブロックのビットサイズが２つの２番目のブロックのビットサイズよりも小さいと（ステップＳ１１０で「ｎｏ」）、初期比較部１１０ｂは、最上位レベルの２つの１番目のブロックを選択する（Ｓ２２０）。逆に、１番目のブロックのビットサイズが２つの２番目のブロックのビットサイズと等しいか、または大きい場合（ステップＳ２１０で「ｙｅｓ」）は、条件比較部１１０ｃは、２番目のブロックのビットサイズと２つの３番目のブロックのビットサイズとを比較する（Ｓ２３０）。場合によっては、ステップＳ２１０で、１番目のブロックのビットサイズのうち少なくとも１つが、１つのレベルの全てのブロック（ｂ＝０...Ｂ）のうち、１番目のブロックに対応する２つの２番目のブロックのビットサイズよりも小さい場合には、上記ステップＳ２３０を行うこともできる。この変形条件は、続くステップＳ２５０及びＳ２７０にも適用可能である。ステップＳ１４０からＳ１８０のように、ステップＳ２４０からＳ２８０が行われる。ステップＳ２７０は、下記の式４で示される。このステップＳ２７０は、最下位レベル（ａ＝５）に到逹するまで繰り返すことができる。

［式４］
S(a-1, b/2) >= S(a, b) + S(a, b+1)
ここで、
a=0...5, b=0...B-1

「ａ−１」は、ｉ番目のブロックのレベルに対応し、「ａ」は、ｉ＋１番目のブロックのレベルに対応する。ステップＳ２１０からＳ２８０は、下記のＣスタイルの擬似コード２（pseudo code 2）によって行われる。ただし、本発明はこれに限定されない。

図１１は、本発明の変形された他の実施例によるオーディオ信号処理のためのブロックスイッチング方法を示すフローチャートであり、図１２は、図１１の概念を説明するための図である。特に、この変形された他の実施例は、１つのブロックが、１つのレベルではなく２つのレベルを向上させない場合にのみ停止する、拡張されたトップダウン法に該当する。これが、１つのブロックが単に１つのレベルに対して向上しない場合に停止する、図１０を参照して説明したトップダウン法との主な相違点である。

図４及び図１１を参照すると、初期比較部１１０ｂは、ステップＳ２１０のように、（最上位レベルで）１番目のブロックのビットサイズと２番目のブロックのビットサイズとを比較する（Ｓ３１０）。このステップＳ３１０の比較結果によらず、初期比較部１１０ｂは、２番目のブロックのビットサイズと３番目のブロックのビットサイズとを比較する（Ｓ３２０及びＳ３７０）。１番目のブロックのビットサイズが２番目のブロックのビットサイズよりも小さく（ステップＳ３１０で「ｎｏ」）、２番目のブロックのビットサイズが２つの３番目のブロックのビットサイズよりも小さいと（ステップＳ３２０で「ｎｏ」）（図１２で、「ケースＥ」と「ケースＦ」）、すなわち、１番目のブロックが２番目のブロック及び３番目ブロックに比べてより効率的であると、初期比較部１１０ｂは、最適なブロックとして１番目のブロックを選択し、次のレベルで比較は終了する（図１２で「Ｆの場合」、特に、角が５つある星を参照されたい）。そうでなければ、すなわち、２番目のブロックのビットサイズが３番目のブロックのビットサイズと等しいか、または大きいと（Ｓ３２０で「ｙｅｓ」）、初期比較部１１０ｂは、１番目のブロックを選択するか、それとも、１番目のブロックと３番目のブロックとの比較結果に基づいて次のレベルで比較するかを決定する。特に、１番目のブロックが３番目のブロックよりも効率的であれば（ステップＳ３４０で「ｎｏ」）、初期比較部１１０ｂは、１番目のブロックを選択する（Ｓ３５０）（図１２で「ケースＥ」、特に、角が５つある星を参照されたい）。そうでなければ（ステップＳ３４０で「ｙｅｓ」）、条件比較部１１０ｃは、３番目のブロックと４番目のブロックとを比較し、４番目のブロックと５番目のブロックとを比較した後、３番目のブロック、４番目のブロック及び５番目のブロックのうち、最も効率的なブロックを選択する（Ｓ３６０）（図１２で、「ケースＤ」を参照）。

一方、２番目のブロックのビットサイズが２つの３番目のブロックのビットサイズと等しいか、または大きいと（ステップＳ３２０で「ｙｅｓ」）、１番目のブロックのビットサイズが２番目のブロックのビットサイズと等しいか、または大きいと（ステップＳ３１０で「ｙｅｓ」）、２番目のブロックのビットサイズが３番目のブロックよりも小さいと（ステップＳ３７０で「ｎｏ」）（図１２で、「ケースＢ」及び「ケースＣ」を参照）、条件比較部１１０ｃは、一時的に２番目のブロックを選択し（「ケースＢ」及び「ケースＣ」で角が４つある星を参照されたい。）、次のレベルを比較する（Ｓ３８０）。そうでなければ、すなわち、３番目のブロックが１番目のブロックと２番目のブロックよりも小さいと（Ｓ３７０で「ｙｅｓ」）（図１２で「ケースＡ」を参照）、条件比較部１１０ｃは、一時的に３番目のブロックを選択し（「ケースＡ」で角が４つある星を参照。）、４番目のブロックと３番目のブロックとを比較し、４番目のブロックと５番目のブロックとを比較する。

［長期予測（Long-Term Prediction；ＬＴＰ）］
大部分のオーディオ信号は、基本周波数または楽器のピッチから発生する高調波成分または周期的な成分を持っている。非常に高い次数が要求されるから、このような遠い距離のサンプル相関は、短期前方適応予測器を用いては除去しにくく、あまりに多くの付加情報量を必要とする。遠い距離におけるサンプル間の相関性をより効率的に使用するために、長期予測を行うことができる。

図１３及び図１４を参照すると、長期予測器１９０は、続く入力信号の標準化をスキップする（Ｓ４１０）。

その後、ラグ情報決定部１９０ａは、自己相関関数を用いてラグ情報τを決定する（Ｓ４２０）。自己相関関数（ＡＣＦ）は、下記の式７で計算される。

その後、フィルタ情報推定部１９０ｂは、定常性に基づくウイーナ・ホッフ（Wiener-Hopf）関数を用いてフィルタ情報γ_jを測定する（Ｓ４３０）。ウイーナ・ホッフ関数の非定常性バージョンが式８である。

したがって、ｊ、ｋ＝-２…２でＡＣＦ値ｒ_ee(τ＋ｊ，０)及びｒ_ee(τ＋ｊ，τ＋ｋ)を計算しなければならない。行列が対称であるため、右上位の三角部分のみ計算すればよい（１５個の値）。しかし、非定常性のバージョンが仮定されるので、最適なラグサーチをする間に既に計算された定常性のｒ_ee(τ)値は、再び使用しなくてもよい。

一方、定常性、すなわち、ｒ(ｊ，ｋ)＝ｒ(ｊ−ｋ）であれば、ウイーナ・ホッフ関数の定常的なバージョンを適用することができる。

直接的な自己相関関数が最適なラグの決定に使用されると、ｒ_ee(Ｋ＋１...Ｋ＋τ_max)のみ計算される。これに対し、上記ＦＦＴを用いる高速ＡＣＦは常にｒ_ee(０...Ｎ−１)を計算する。したがって、定常のイーナ・ホッフ関数で要求される、ｒ(０...４)とｒ(τ−２...τ＋２)値は、再計算されるのではなく、簡単に上記ステップＳ４２０でラグサーチを既に行ったＡＣＦの結果を採択することができる。

決定部１９０ｃは、上記ステップＳ４５０で計算されたビット率に基づいて長期予測が効率的であるか否かを決定する（Ｓ４６０）。このステップＳ４６０で、長期予測が効率的でないと決定されると（ステップＳ４６０で「ｎｏ」）、長期予測は行われず、上記の処理は終了する。一方、長期予測が効率的であると（ステップＳ４６０で「ｙｅｓ」）、決定部１９０ｃは、長期予測を使用すると決定し、長期予測因子を出力する（Ｓ４７０）。また、決定部１９０ｃは、ラグ情報τとフィルタ情報γ_jを付加情報としてエンコーディングすることができ、長期予測が行われるか否かを示すフラグ情報をセットすることができる。

当該発明が属する技術分野における通常の知識を有する者であれば、本発明の精神と範囲を逸脱せずに様々な修正及び変更が可能である。したがって、本発明は、添付の請求項及びその均等範囲内で様々な修正及び変更が可能であることは勿論である。

したがって、本発明は、オーディオ無損失（Audio Lossless；ＡＬＳ）エンコーディング及びデコーディングに適用することができる。

Claims

オーディオ信号を受信する段階と、
前記受信したオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する段階と、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が、前記Ａレベルのブロックのサイズ情報よりも小さい場合、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する段階と、
を含む方式によって処理されることを特徴とするオーディオ信号処理方法。
前記サイズ情報は、コーディング結果、ビットサイズ、コーディングされたデータブロックのうちの１つに対応する、請求項１に記載のオーディオ信号処理方法。
前記Ａレベルのブロックは、前記Ａ＋１レベルの少なくとも２つのブロックの組み合わせに対応する、請求項１に記載のオーディオ信号処理方法。
階層的構造は、少なくとも２つのレベルを有し、
最上位レベルのブロック長は、最下位レベルのブロック長の整数倍に相当する、請求項３に記載のオーディオ信号処理方法。
前記階層的構造は、６個のレベルを有し、
前記最上位レベルのブロック長は、前記最下位レベルのブロック長の３２倍に相当する、請求項４に記載のオーディオ信号処理方法。
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報は、Ａ＋１レベルの１つのブロックのサイズとＡ＋１レベルの次のブロックのサイズとの和に相当する、請求項１に記載のオーディオ信号処理方法。
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が、前記Ａレベルのブロックのサイズ情報より大きい場合には、Ａレベルの少なくとも２つのブロックのサイズ情報と、Ａ−１レベルのブロックのサイズ情報と、を比較する段階をさらに含む、請求項１に記載のオーディオ信号処理方法。
前記Ａレベルの少なくとも２つのブロックのサイズ情報が、前記Ａ−１レベルのブロックのサイズ情報よりも小さい場合には、前記Ａレベルの少なくとも２つのブロックを最適なブロックと決定する段階をさらに含む、請求項７に記載のオーディオ信号処理方法。
前記オーディオ信号は、放送信号として受信される、請求項１に記載のオーディオ信号処理方法。
前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項１に記載のオーディオ信号処理方法。
オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Ａレベルのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較する段階と、
前記Ａレベルのブロックのサイズ情報が前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する段階と、
を含む方式によって処理されることを特徴とするオーディオ信号処理方法。
前記Ａレベルのブロックは、前記Ａ＋１レベルの少なくとも２つのブロックの組み合わせに対応する、請求項１１に記載のオーディオ信号処理方法。
前記オーディオ信号は、放送信号として受信される、請求項１１に記載のオーディオ信号処理方法。
前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項１１に記載のオーディオ信号処理方法。
オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Ａレベルのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較する段階と、
前記Ａ＋１レベルのブロックのサイズ情報と、Ａ＋２レベルの少なくとも２つのブロックのサイズ情報と、を比較する段階と、
前記Ａレベルのブロックのサイズ情報が、前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報及び前記Ａ＋２レベルの少なくとも４つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する段階と、
を含む方法によって処理されることを特徴とするオーディオ信号処理方法。
オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Ａレベルのブロックのサイズ情報と、前記オーディオ信号の１つのフレーム内のＡレベルのブロックに対応するＡ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較する段階と、
前記Ａレベルのブロックの全てのサイズ情報が、前記フレームに含まれるＡレベルのブロックに対応する前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する段階と、
を含む方法によって処理されることを特徴とするオーディオ信号処理方法。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する段階と、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する段階と、
を含む動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。
Ａレベルのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較し、
前記Ａレベルのブロックのサイズ情報が前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する、
動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する初期比較部と、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する条件比較部と、
を有することを特徴とするオーディオ信号処理装置。
Ａレベルのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較する初期比較部と、
前記Ａレベルのブロックのサイズ情報が前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する条件比較部と、
を有することを特徴とするオーディオ信号処理装置。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較し、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する、
ことを特徴とするオーディオ信号処理方法。
Ａレベルのブロックのサイズ情報と、Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、を比較し、
前記Ａレベルのブロックのサイズ情報が前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報よりも小さい場合には、前記Ａレベルのブロックを最適なブロックと決定する、
ことを特徴とするオーディオ信号処理方法。
オーディオ信号を受信する段階と、
前記受信されたオーディオ信号を処理する段階と、を含み、
前記オーディオ信号は、
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する段階と、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する段階と、
前記最適なブロックを含む前記オーディオ信号の自己相関関数に基づいてラグ情報を決定する段階と、
前記ラグ情報に基づいて長期予測フィルタ情報を推定する段階と、
を含むことを特徴とするオーディオ信号処理方法。
前記オーディオ信号のエンコーディングの前に前記オーディオ信号のビット率を推定する段階をさらに含む、請求項２３に記載のオーディオ信号処理方法。
前記推定されたビット率に基づいて付加情報として前記ラグ情報及び前記長期予測フィルタ情報をエンコーディングする段階をさらに含む、請求項２４に記載のオーディオ信号処理方法。
周波数ドメインで前記オーディオ信号の自己相関関数を計算する段階をさらに含む、請求項２３に記載のオーディオ信号処理方法。
前記長期予測フィルタ情報を推定する段階は、定常性に基づいて行われる、請求項２３に記載のオーディオ信号処理方法。
前記長期予測フィルタ情報を推定する段階は、前記自己相関関数を用いて行われる、請求項２７に記載のオーディオ信号処理方法。
前記オーディオ信号は、標準化以前のオーディオ信号に対応する、請求項２３に記載のオーディオ信号処理方法。
前記オーディオ信号は、放送信号として受信される、請求項２３に記載のオーディオ信号処理方法。
前記オーディオ信号をデジタル媒体で受信する段階をさらに含む、請求項２３に記載のオーディオ信号処理方法。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較し、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報を最適なブロックと決定し、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定し、
前記ラグ情報に基づいて長期予測フィルタ情報を推定する、
過程を含む動作をプロセッサに実行させる命令が格納されていることを特徴とするコンピュータ読み取り可能媒体。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較する初期比較部と、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定する条件比較部と、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定するラグ情報決定部と、
前記ラグ情報に基づいて長期予測フィルタ情報を予測するフィルタ情報推定部と、
を含むことを特徴とするオーディオ信号処理装置。
Ａ＋１レベルの少なくとも２つのブロックのサイズ情報と、前記Ａ＋１レベルの少なくとも２つのブロックに対応するＡレベルのブロックのサイズ情報と、を比較し、
前記Ａ＋１レベルの少なくとも２つのブロックのサイズ情報が前記Ａレベルのブロックのサイズ情報よりも小さい場合には、前記Ａ＋１レベルの少なくとも２つのブロックを最適なブロックと決定し、
前記最適なブロックを含むオーディオ信号の自己相関関数に基づいてラグ情報を決定し、
前記ラグ情報に基づいて長期予測フィルタ情報を予測することを特徴とするオーディオ信号処理方法。