[go: up one dir, main page]

JP2008532064A - マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 - Google Patents

マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 Download PDF

Info

Publication number
JP2008532064A
JP2008532064A JP2007556114A JP2007556114A JP2008532064A JP 2008532064 A JP2008532064 A JP 2008532064A JP 2007556114 A JP2007556114 A JP 2007556114A JP 2007556114 A JP2007556114 A JP 2007556114A JP 2008532064 A JP2008532064 A JP 2008532064A
Authority
JP
Japan
Prior art keywords
encoding
subframe
signal
frame
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007556114A
Other languages
English (en)
Other versions
JP5171269B2 (ja
Inventor
アニセ タレブ,
ステファン アンデルソン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority claimed from PCT/SE2006/000235 external-priority patent/WO2006091151A1/en
Publication of JP2008532064A publication Critical patent/JP2008532064A/ja
Application granted granted Critical
Publication of JP5171269B2 publication Critical patent/JP5171269B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

本発明は、マルチチャネルオーディオ信号を符号化する効率的な技術を提供する。本発明は、第1の符号化処理において1つ以上のマルチチャネルの信号を符号化し(S1)、フィルタに基づく第2の符号化処理において1つ以上のチャネルの別の信号を符号化することを原理とする。本発明による基本概念は、第2の符号化処理のために、i)符号化フレーム全体のサブフレームのセットへのフレーム分割構成と、ii)各サブフレームのフィルタ長との組合せを、所定の条件に従って選択すること(S2)である。第2の信号は、選択された組合せに従って符号化フレーム全体の各サブフレームにおいて符号化される(S3)。フレーム分割構成を選択すると共に各サブフレームのフィルタ長を調整することができることで追加の自由度が提供され、性能は向上する。

Description

本発明は、オーディオ符号化及び復号化技術に関し、特に、ステレオ符号化等のマルチチャネルオーディオ符号化に関する。
高い音声品質を維持しながら音声信号を低ビットレートで伝送し保存することへの市場の要求は大きい。特に、伝送リソース又は記憶装置が限られている場合、低ビットレートでの動作が重要なコスト要素である。このことが典型的に当てはまるのは、例えば、GSM、UMTS又はCDMAなどのモバイル通信システムでのストリーミング及びメッセージングのアプリケーションの場合である。
図1を用いて、マルチチャネル符号化/復号化を使用する音声伝送システムの一般的な例を概略的に説明する。全体のシステムは基本的に、送信側にマルチチャネル・オーディオエンコーダ100と送信モジュール10を備え、受信側に受信モジュール20とマルチチャネル・オーディオデコーダ200を備える。
音声信号のステレオ符号化又はマルチチャネル符号化の最も単純な方法は、図2に示すように、異なるチャネルの信号を個別に独立の信号として別々に符号化することである。しかしこれでは、複数のチャネル間の冗長性は取り除かれず、ビットレートはチャネル数に比例することになる。
もう1つの基本的な方法で、ステレオFMラジオ放送で使用され、昔からあるモノラル・ラジオ受信機と互換性を確保する方法は、関与する2つのチャネルの和と差の信号を送信することである。
MPEG−1/2レイヤIII及びMPEG−2/4AACなどの最先端のオーディオコーデックは、いわゆるジョイントステレオ符号化を使用する。この技術によれば、異なるチャネルの信号は別々に個別に処理されるのではなく、一緒に処理される。最も広く使用されているジョイントステレオ符号化 (joint stereo coding) は、「Mid/Side」(M/S)ステレオ符号化及びインテンシティステレオ符号化 (intensity stereo coding) として知られる2つの符号化であり、それらは普通、符号化されるステレオ信号又はマルチチャネル信号のサブバンドに適用される。
M/Sステレオ符号化は、チャネルのサブバンドの和と差の信号を符号化して送信し、それによりチャネルのサブバンド間の冗長性を利用する点において、前述のステレオFMラジオの手順と類似している。M/Sステレオ符号化に基づくコーダの構成と動作については、例えば文献[1](特許文献1)に記載されている。
他方、インテンシティステレオは、ステレオの無関係さを使用することができる。インテンシティステレオでは、(異なるサブバンドの)チャネルの連結強度(joint intensity)を、チャネル間に信号の強度がどのように分布しているかを示す位置情報と共に送信する。インテンシティステレオでは、チャネルのスペクトル振幅情報だけを出力し、位相情報は伝達しない。このため及び、チャネル間時間情報(より具体的にはチャネル間時間差)は特に低周波数においては心理音響関連性が大きいことから、インテンシティステレオは、例えば2kHzを超える高い周波数でのみの使用とすることができる。インテンシティステレオ符号化方法は、例えば文献[2](特許文献2)に記載されている。
バイノーラルキュー符号化(BCC)と呼ばれる最近開発されたステレオ符号化方法が、文献[3](非特許文献1)に記載されている。この方法はパラメトリック・マルチチャネル音声符号化方法である。この種のパラメトリック符号化技術の基本原理は、符号化側においてN個のチャネルからの入力信号を1つのモノラル信号に合成することである。モノラル信号は、従来のどのモノラルのオーディオコーデックを使用しても符号化できる。並行して、パラメータはマルチチャネル音像を表すチャネル信号から引き出せる。パラメータは符号化され、音声ビット・ストリームと一緒にデコーダに送信される。デコーダはまずモノラル信号を復号し、次にマルチチャネル音像のパラメトリック表現に基づきチャネル信号を再生する。
バイノーラルキュー符号化(BCC)法の原理は、符号化モノラル信号及びいわゆるBCCパラメータを送信することである。BCCパラメータは、元のマルチチャネル入力信号のサブバンドに関する符号化されたチャネル間レベル差及び符号化されたチャネル間時間差を含む。デコーダは、BCCパラメータに基づき、モノラル信号のサブバンドに関するレベルならびに位相及び/又は遅延の補正を活用することにより、異なるチャネルの信号を再生する。例えばM/Sステレオ又はインテンシティステレオに対する利点は、チャネル間時間情報を備えるステレオ情報がはるかに低いビットレートで送信されることである。しかし、BCCは演算量の要求が厳しく、また、一般には聴感上の最適化ができない。
文献[4](特許文献3)に記載される別の技術は、モノラル信号及びいわゆるサイド情報 (side information) を符号化する同じ原理を使用する。この場合、サイド情報は予測フィルタ (predictor signal) 及び状況に応じて残差信号 (residual signal) で構成される。予測フィルタは、LMSアルゴリズムで推定され、モノラル信号に適用されると、マルチチャネル音声信号の予測を与える。この技術を使用して、マルチチャネル音源を非常に低いビットレートで符号化することができるが、品質低下という犠牲を伴う。
図3に、そのパラメトリック・ステレオ符号化の基本原理を示す。図3は、ダウンミキシング・モジュール120、中核のモノラルコーデック130、230、及びパラメトリック・ステレオ・サイド情報エンコーダ/デコーダ140、240を備えるステレオコーデックの構成を示している。ダウンミキシングは、マルチチャネル(この場合はステレオ)信号をモノラル信号に変換する。パラメトリック・ステレオコーデックの目的は、復元されたモノラル信号と付加的なステレオ・パラメータを与えて、デコーダでステレオ信号を再生することである。
最後に、すべてを網羅するために、3D音声で使用される技術にも触れておく。この技術は、いわゆる頭部関連フィルタで音源信号をフィルタリングして左右のチャネル信号を合成する。しかし、この技術は、分離される異なる音源信号を必要とし、それ故、一般にステレオ又はマルチチャネルの符号化に適用されることはない。
[1] 米国特許第5,285,498号 [2] 欧州特許第0,497,413号 [4] 米国特許第5,434,948号 [3] C. Faller et al., "Binaural cue coding applied to stereo and multi-channel audio compression", 112th AES convention, May 2002, Munich, Germany. [5] S-S. Kuo, J. D. Johnston, "A study why cross channel prediction is not applicable to perceptual audio coding", IEEE Signal Processing Lett, vol. 8, pp. 245-247. [6] B. Edler, C. Faller and G. Schuller, "Perceptual audio coding using a time- varying linear pre- and post-filter", in AES Convention, Los Angeles, CA, Sept. 2000. [7] Bernd Edler and Gerald Schuller, "Audio coding using a psychoacoustical pre- and post-filter", ICASSP-2000 Conference Record, 2000. [8] Dieter Bauer and Dieter Seitzer, "Statistical properties of high-quality stereo signals in the time domain", IEEE International Conf. on Acoustics, Speech, and Signal Processing, vol. 3, pp. 2045-2048, May 1989. [9] Gene H. Golub and Charles F. van Loan, "Matrix Computations", second edition, chapter 4, pages 137-138, The John Hopkins University Press, 1989.
本発明は先行技術による装置の上記及び他の欠点を克服する。
本発明の全体的な目的は、低ビットレートで高品質のマルチチャネルオーディオを提供することである。
特に、なるべく少ない符号化ビット数を使用して、ステレオ又はマルチチャネルの情報を正確に表す能力のある効率的な符号化処理を提供することが望まれる。ステレオ符号化に関しては、例えば、ステレオ音像の躍動感がよく表現され、ステレオ信号の再生品質が高められることが重要である。
利用可能なビット割り当て量の効率的な使用、及び、必要な信号伝送量の最適化を実現することも、本発明の目的である。
マルチチャネルオーディオ信号を符号化する方法及び装置を提供することも、本発明の特定の目的である。
本発明の別の特定の目的は、符号化されたマルチチャネルオーディオ信号を復号化する方法及び装置を提供することである。
本発明のまた別の目的は、改良されたオーディオ伝送システムを提供することである。
上記及び他の目的は、特許請求の範囲で定義される本発明により達成される。
現在のところ、例えばモバイル通信システムでも使用するのに経済的に魅力的なビットレートで、高品質のステレオ又はマルチチャネルのオーディオを提供する標準化されたコーデックは入手できない。入手可能なコーデックで可能なことは、オーディオ信号のモノラルでの伝送及び/又は保存である。ある程度までは、ステレオでの伝送や保存も可能ではあるが、多くの場合、ビットレートの制約によってステレオ表現を極めて大幅に制限されることになる。
本発明は、オーディオ信号からのステレオ又はマルチチャネルの情報を分離することを可能にし、かつ最適な可能な方法でそれを正確に表すことを可能にする解決策を提案することにより、上記の問題を克服する。本発明は、第1の符号化処理において1つ以上のマルチチャネルの第1の信号を符号化し、フィルタに基づく第2の符号化処理において1つ以上のマルチチャネルの第2の信号を符号化することを基本原理とする。本発明による基本概念は、第2の符号化処理のために、i)符号化フレーム全体のサブフレームのセットへのフレーム分割構成と、ii)各サブフレームのフィルタ長との組合せを、所定の条件に従って選択することである。第2の信号は、選択された組合せに従って、選択されたサブフレームのセットの各サブフレームにおいて符号化される。
可変フレーム長の場合、符号化フレームは、種々のフレーム分割構成に従って複数のサブフレームに分割される。サブフレームは相異なるサイズであってもよいが、通常、任意の所定のフレーム分割構成のサブフレームの長さの合計は符号化フレーム全体の長さと等しい。フレーム分割構成を選択すると同時に各サブフレームに対するフィルタ長を調整するという可能性により、追加的な自由度が得られ、一般に性能は向上する。所定の条件は、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づくものであることが好ましい。
第2の符号化処理又はそれに関連するコントローラは、選択されたフレーム分割構成及び選択されたフレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成する。符号化情報の正確な復号化を可能にするために、この出力データは、符号化側から復号化側へ送信される必要がある。フレーム分割構成とフィルタ長との適切な組合せの選択により、全体の性能は大幅に向上するが、オーディオ送信システムにおける符号化側から復号化側への送信に必要とされる信号伝送量はその分増加することは明らかである。したがって、本発明の特定の例示的な実施形態においては、ある特定の長さの各サブフレームを事前定義済みフィルタ長と関連付けるのが望ましい。通常、長いフィルタは長いフレームに割り当てられ、短いフィルタは短いフレームに割り当てられる。
換言すると、所定の条件は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含む。これにより、必要とする復号化側への信号伝送量を低減することができる。
本発明の好適な実施形態において、所定の条件は、各サブフレームのフィルタ長がサブフレームの長さに応じて制御されるという必要条件に従う符号化フレーム全体にわたる前記第2の符号化処理の性能を表す尺度の最適化に基づくものである。
復号化側においては、デコーダは、対応する第2の符号化処理で使用されたサブフレームのセットへの符号化フレーム全体のフレーム分割構成及び各サブフレームのフィルタ長を表す情報を受信する。この情報は、第2の信号を正確に復号化する目的で、第2の復号化処理において第2の信号復元データを解釈するために使用される。上述のように、この情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含むことが好ましい。
第1の符号化処理が符号化フレーム全体のサブフレームのセットへのフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、第2の符号化処理に対しても同一のフレーム分割構成を使用するのが有用である。その場合、1つの符号化処理に対するフレーム分割構成を表す情報を信号で伝送することで十分である。
符号化と、それに関連するフレーム分割構成及びフィルタ長の制御は、フレーム毎に実行されることが好ましい。更に、制御システムは、マルチチャネルオーディオ信号のチャネル間相関特性に基づいて動作することが好ましい。
例えば、第1の符号化処理を主符号化処理とし、第1の信号を主信号とすることができる。また例えば、第2の符号化処理を補助/副信号処理とし、第2の信号をステレオ副信号等の副信号とすることができる。そのような場合、通常、第2の符号化処理は、調整可能な適応チャネル間予測(ICP)フィルタ長と組み合わせて可変フレーム長処理を使用して、第1及び第2の信号に基づいて第2の信号を予測するためのICPを含む。そのような方式を使用する利点は、ステレオ又はマルチチャネルイメージのダイナミクスが適切に表現されることである。フレーム分割構成及び関連するフィルタ長の選択は、一般に第2の符号化処理の推定性能に基づくことが好ましく、特にICPフィルタに基づくことが好ましい。
本発明は、主に、第1の符号化処理が主符号化処理であり、第2の符号化処理が補助符号化処理である場合に関するが、第1の符号化処理が補助符号化処理であり、第2の符号化処理が主符号化処理である場合にも適用可能であることを理解すべきである。また、フレーム分割構成及び関連するフィルタ長の制御が第1の符号化処理及び第2の符号化処理の双方に対して実行されることも可能である。
本発明は、以下の利点を提供する。
・マルチチャネルオーディオ符号化/復号化の改良。
・オーディオ送信システムの改良。
・マルチチャネルオーディオ再生品質の向上。
・比較的低いビットレートでの高品質のマルチチャネルオーディオ。
・最適化された信号伝送量での高忠実度化。
・ステレオ音像のダイナミクスの適切な表現。
・ステレオ信号再生品質の向上。
本発明が提供する他の利点は、以下の本発明の実施形態の詳細な説明を読めば理解されるであろう。
添付の図面及び以下の説明によって、本発明は、その他の目的及び利点とともに、最もよく理解されるであろう。
全図面を通して同じ参照番号は同一又は類似の要素に用いられるものとする。
本発明は、音声アプリケーションのマルチチャネル符号化/復号化技術に関し、特にオーディオ伝送システム及び/又はオーディオストレージ用のステレオ符号化/復号化に関する。音声アプリケーションとしてふさわしい例としては、電話会議システム、モバイル通信システムにおけるステレオ音声伝送、音声サービスを提供する様々なシステム、及びマルチチャネル・ホーム・シネマ・システム等が挙げられる。
本発明の理解を助けるために、既存技術の問題について簡潔な概観と分析から始めるのが役に立つと思われる。前述のように、現在のところ、例えばモバイル通信システムでも経済的負担が少なく使用する気を起こさせるビットレートで高品質のステレオ又はマルチチャネル音声を提供する標準化されたコーデックは入手できない。入手できるコーデックで可能なことは、音声信号のモノラルでの伝送及び/又は保存である。ある程度までは、ステレオ伝送や保存も可能であるが、多くの場合、ビットレートの制約により極めて大きくステレオ表現が制限される。
最先端のマルチチャネル符号化技術の問題は、優れた品質を提供するためには高ビットレートが必要となることである。インテンシティステレオは、例えばたった2、3kbpsほどの低ビットレートで利用される場合には、チャネル間時間情報をほとんど提供できないので上手くいかない。この情報は例えば2kHz未満の低周波数に対して聴感上重要なので、そのような低周波数でステレオ効果を提供することはできない。
他方BCCは、チャネル間時間情報も伝送するので、例えば3kbpsの低ビットレートで、低周波数でもステレオ音像又はマルチチャネル音像を再生することができる。しかし、この技術は、エンコーダとデコーダの両方でチャネルのそれぞれについて、演算量の多い時間/周波数変換を必要とする。さらに、BCCは、元のチャネル信号との知覚差を最小にする意味では、伝送されたモノラル信号からチャネル信号へのマッピングを行おうとはしない。
チャネル間予測(Inter-channel prediction : ICP)とも呼ばれる、マルチチャネル符号化用のLMS技術(文献[4](特許文献3)参照)は、残差信号の伝送を省略することにより低ビットレートを可能にしている。チャネル復元フィルタを得るために、条件なしの誤差最小化手順を用い、その出力信号が対象信号に最も一致するようにフィルタを計算する。フィルタを計算するために、幾つかの誤差測定値を使用できる。平均二乗誤差あるいは加重平均二乗誤差が周知であり、少ない演算量で済む。
一般的に、最先端の方法の大部分がハイファイのオーディオ信号又は単なる音声の符号化のために開発されたと言うことができる。信号エネルギが低周波数領域に集中している音声符号化 (speech coding) では、サブバンド符号化は滅多に使用されない。BCCのような方法は、低ビットレートでステレオ音声の符号化を可能にするけれども、サブバンド変換符号化処理では演算量も遅延も多くなる。
研究の結論によれば、ICP符号化技術は、低い周波数にエネルギが集中しているステレオ信号に対しては、高品質のステレオ信号を得ることはできないが、冗長性の削減は可能である[5](非特許文献2)。ICPフィルタリングの白色化効果により、高周波数領域のエネルギが増加し、知覚変換符号化器にとっては正味の符号化損失になる。これらの結果は、文献[6](非特許文献3)及び[7](非特許文献4)で確認され、品質の向上は音声信号に対してだけ報告された。
ICP復元信号の精度は、存在するチャネル間相関により決定される。Bauer等による文献[8](非特許文献5)は、音声信号の左チャネルと右チャネルとの間に線形関係を見出せなかった。しかし、図4のモノラル信号と副信号とのクロススペクトルから見ることができるように、音声信号の低周波数領域(0〜2000Hz)で強いチャネル間相関が見られる。ステレオ符号化手段としてのICPフィルタでは、チャネル間相関が弱い場合には、対象信号の予測値の精度が劣化する。
図5は、本発明の好適な実施形態におけるマルチチャネルエンコーダを示す概略ブロック図である。マルチチャネルエンコーダは、基本的に、オプションの前処理部110、オプションの(線形)結合部120、複数のエンコーダ130、140、コントローラ150及びオプションのマルチプレクサ(MUX)160を具備する。エンコーダの数Nは2以上であり、第1エンコーダ130及び第2エンコーダ140を含むが、更なるエンコーダを有してもよい。
一般に、本発明は、マルチチャネル又はポリフォニック信号 (polyphonic signal) を取り扱う。最初のマルチチャネル入力信号は、オーディオ信号記憶装置(不図示)から供給されてもよいし、例えばマイクロフォンのセット(不図示)から「生で」提供されてもよい。通常、オーディオ信号は、デジタル形式でない場合、マルチチャネル符号器に入力される前にデジタル化される。マルチチャネル信号は、例えば主信号及び副信号、並びに可能性として更なる信号表現等のN個の信号表現を生成するオプションの信号結合部120及びオプションの前処理部110に供給されうる。
オプションの前処理部110にはマルチチャネル信号又はポリフォニック信号が入力されうる。
(任意で前処理された)信号は、任意の信号結合部120に出力される。信号結合部120は、入力信号の線形結合などの様々な信号結合手順を実行して少なくとも第1の信号と第2の信号を作り出す複数の結合モジュールを有する。例えば、第1の符号化処理を主符号化処理とし、第1の信号を主信号とすることができる。第2の符号化処理は、例えば補助(副 (side) )信号処理とすることができ、その場合、第2の信号は、ステレオ副信号 (stereo side signal) などの補助(副)信号とすることができる。従来のステレオ符号化では、例えば、LチャネルとRチャネルの信号を足しその和信号を2で割って、第1の信号(主信号)として従来のモノラル信号を出力する。LチャネルとRチャネルを引き算しその差信号を2で割って、第2の信号として従来の副信号を出力することもできる。本発明によれば、信号結合部において、異なるチャネルの少なくとも一部からの信号の寄与を重み付けして、さまざまな種類の線形結合や他の種類の信号結合を実行することができる。本発明が使用する信号結合は2つのチャネルに限定されるわけではなく、多数のチャネルを含みうることはいうまでもない。図5に示されるように、2以上の信号を生成することも可能である。入力チャネルの1つを直接第1の信号として、もう1つの入力チャネルを第2の信号として使用することも可能である。ステレオ符号化に関しては、例えば、Lチャネルを主信号として使用し、Rチャネルを副信号として使用してもよいし、あるいはその逆でもよい。この他にも変形例は多数存在する。
第1エンコーダ130に第1の信号が入力されると、エンコーダ130は適切な符号化原理に従って第1の信号を符号化する。第2の信号は、第2エンコーダ140に供給され、そこで第2の信号が符号化される。3つ以上のエンコーダを使用する場合は通常、追加の各信号は各エンコーダにおいて符号化されることになる。
例えば第1エンコーダを主エンコーダとし、第2エンコーダを副エンコーダとしてもよい。その場合、例えば副エンコーダである第2エンコーダ140は、第1の信号及び第2の信号に基づいて信号再生データを生成する適応チャネル間予測(ICP)ステージを含むことができる。第1エンコーダからの破線で示されるように、第1の(主)信号は、第1エンコーダ130により生成される信号符号化パラメータから同等に推定してもよい。
マルチチャネルエンコーダは、コントローラ150を更に具備する。コントローラ150は、符号化性能を最適化するために追加の自由度を提供するように構成される。本発明の好適な実施形態によれば、制御システムは、考慮するエンコーダに対して、符号化フレーム全体のサブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長との組合せを、所定の条件に従って選択するように構成される。対応する信号は、選択された組合せに従って、選択されたサブフレームのセットの各サブフレームにおいて符号化される。別個のコントローラ150として又は考慮するエンコーダに内蔵されるものとして実現されてもよい制御システムは、適切な制御コマンドをエンコーダに供給する。
フレーム分割構成を選択すると同時に各サブフレームのフィルタ長を調整するという可能性により追加の自由度が得られ、一般に性能は向上する。所定の条件は、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づくものであることが好ましい。
各エンコーダの出力信号、並びにコントローラからのフレーム分割及びフィルタ長の情報は、マルチプレクサ160の単一の送信(又は格納)信号に多重化されるのが好ましい。もっとも、出力信号は別個に送信(又は格納)されてもよい。
可変サイズのサブフレームを使用するいわゆる信号適応最適化フレーム処理 (signal-adaptive optimized frame processing) により、性能尺度を最適化するためにより高い自由度が得られる。シミュレーションによれば、いくつかのオーディオフレームでは、より長いフィルタの使用によって良い性能が得られたが、他のフレームに対しては、使用するフィルタ係数の数に比例して性能が向上するわけではないことがわかった。
可変フレーム長に対して、符号化フレームは、一般に種々のフレーム分割構成に従って複数のサブフレームに分割される。サブフレームは異なるサイズを有してもよいが、任意の所定のフレーム分割構成のサブフレームの長さの合計は、通常、符号化フレーム全体の長さに等しい。
例として引用することで本明細書に組み込まれる同時係属の米国特許出願第11/011765号及び対応国際出願PCT/SE2004/001867に記載されるように、複数の符号化スキームが提供されている。ここで、各符号化スキームは、それぞれのサブフレームを全部合わせると全体の符号化フレーム(マスタフレームとも呼ばれる)を構成するサブフレームセットを特徴とするか、又はそれに関連する。好ましくは、符号化される信号の信号コンテンツに少なくとも一部依存して、特定の符号化スキームが選択され、次いで信号は、選択されたサブフレームセットの各サブフレームでそれぞれ符号化される。
一般に符号化は、通常1度に1フレーム実施され、各フレームは通常所定の時間枠内の音声サンプルを備える。サンプルをフレームに分割すると、フレームの境界に切れ目が生じることが避けられない。音の変化に応じて符号化パラメータが変化するのだが、符号化パラメータは基本的に各フレーム境界で変化することになる。これが、知覚されてしまうような誤差となりうる。これを少しでも補償する一方法は、符号化されるサンプルだけでなく、フレームの絶対的に近いサンプルも基にして符号化することである。その方法で、異なるフレーム間の遷移が滑らかになるだろう。その代わりにあるいは追加的に、フレーム境界で生じる知覚歪みを減少させるために補間法も使用される。しかし、そのような手順はいずれも、大量の追加的な演算リソースが必要となり、そのような符号化技術に対してリソースを配分することは困難となる可能性もある。
この観点から考えると、フレームの境界数が少なくなるように、なるべく長いフレームを使用するほうが都合がよい。また、符号化効率も高くなり、必要な伝送ビットレートも低くできる。しかし、フレームが長いと、プリエコーやゴーストのような音の問題を引き起こす。
逆に短いフレームを利用すると、符号化効率は減少して伝送ビットレートは高くなり、フレーム境界の歪みの問題が増加しうることは、当業者なら誰でも理解するであろう。しかし、フレームが短くなると、例えばゴーストのような音やプリエコーなどの知覚歪みの影響であまり困ることはなくなる。符号化誤差をなるべく少なくするためには、できるだけ短いフレーム長を使用すべきである。
したがって、フレーム長については相反する要件が有るように見える。それ故、音声知覚のためには、符号化する信号に存在する信号特性に基づいたフレーム長を使用するのが好ましい。音声知覚に関するフレーム長の影響は符号化する音の性質に依存して異なるだろうから、信号自体の性質を使用するフレーム長に関係させることで改善が見込める。特に、この手順は、副信号符号化に好都合であるとわかっている。
小さな一時的変動のために、例えば場合によっては、比較的長いフレームを使用して副信号を符号化するほうがよいこともある。これに相当するのは、コンサートの録音などの拡散音場が大きい録音のこともある。ステレオ音声会話などのそれ以外の場合には、短いフレームが好ましい。
例えば、使用されるサブフレーム長は、次式により選ぶことができる。
Figure 2008532064
ここで、lsfはサブフレーム長であり、lfは全体の符号化フレーム長であり、nは整数である。しかし、これが単なる例にすぎないことは理解されるべきである。サブフレームセットの合計長が一定に維持される限り、どのフレーム長も使用可能である。
どのフレーム長を使用するかの決定方法としては一般に、閉ループ決定又は開ループ決定の2つの基本的方法がある。
閉ループ決定を使用する場合、入力信号は通常すべての利用可能符号化スキームで符号化される。好ましくは、フレーム長のすべての可能な組み合わせがテストされ、目的の品質、例えば信号対雑音比や重み付き信号対雑音比について、最良の結果となる関連サブフレームセットを有する符号化スキームが選択される。
もう一方の手法は、信号の統計に基づく開ループ決定によるフレーム長の決定である。すなわち、この手法では、(副)信号のスペクトル特性が、どの符号化スキームを使用しようとしているかを決定する基礎として使用される。前述のように、様々なサブフレームセットを特徴とする様々な符号化スキームが利用可能である。しかし、この実施形態では、入力(副)信号がまず分析され、次に適切な符号化スキームが選択され利用される。
開ループ決定の利点は、実際にはただ1つの符号化しか実行しなくてもよいことである。反対に不利な点は、信号特性の分析が極めて複雑になることがあり、前もって起こりうる行動を予測することが難しいことである。
閉ループ選択を使用すると、符号化スキームは実装に何らの変更を起こすことなく、交換することが可能である。他方、多くの符号化スキームが調査される場合、計算上の要件が厳しくなる。
入力(副)信号に対するそのような可変フレーム長符号化の利点は、一方で精細な時間解像度と粗い周波数解像度との間で選択してもよく、他方で粗い時間解像度と精細な周波数解像度との間で選択してもよいことである。上記の実施形態は、マルチチャネル音像又はステレオ音像を可能な最善の方法で維持するであろう。
異なる符号化スキームで利用される実際の符号化については、幾つかの要件もある。特に、閉ループ選択を使用する場合、相当数のほぼ同時の符号化を実施するために、演算リソースが多くなくてはならない。符号化処理が複雑になればなるほど演算能力が必要となる。さらに、伝送の点で低ビットレートであることも望まれる。
本発明の例示の実施形態による可変長最適化フレーム処理 (Variable Length Optimized Frame Processing) は、入力として大きな「マスタフレーム」を必要とし、ある数のフレーム分割構成を与えられ、MSEや重み付きMSEなどの歪み測定値に基づいて最適なフレーム分割構成を選択する。
フレーム分割は様々なサイズでもよいが、分割されたフレームの全部の合計はマスタフレームの全長となる。長さLmsのマスタフレームについて可能なフレーム分割の一例を図6に示し、可能なフレーム構成の一例を図7に示す。
上述のように、概念としては、符号化フレーム(マスタフレーム)全体にわたる考慮する符号化処理又は符号化方式の性能を表す忠実度尺度を最適化するように、関連するフレーム分割構成及び各サブフレームのフィルタ長/次元数による符号化方式の組合せを選択することである。
全ての可能な組合せがテストされ、最適な信号対雑音比又は重み付き信号対雑音比等の品質評価値が最良となるサブフレームのセット及びフィルタ長による符号化方式を選択するとよい。
各サブフレームのフィルタ長を調整することができることで追加の自由度が提供され、一般に性能は向上する。この方式を使用する利点は、ステレオ又はマルチチャネル音像のダイナミクスが適切に表されることである。
自由度が高ければ最適な選択を見つけられる。しかし、復号化側に転送される制御情報量は増加してしまう。符号化側から復号化側への送信に必要とされる信号伝送量を低減するという特定の課題に対しては、ある特定の長さの各サブフレームが事前定義済みのフィルタ長と関連付けられるのが好ましい。通常、長いフィルタは長いフレームに割り当てられ、短いフィルタは短いフレームに割り当てられる。いずれにしても、所定の条件は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含む。これにより、必要とされる復号化側への信号伝送量が低減される。
本発明の好適な実施形態においては、所定の条件は、各サブフレームのフィルタ長がサブフレームの長さに応じて制御されるという条件に従う、符号化フレーム全体にわたる第2の符号化処理の性能を表す尺度の最適化に基づく。
第1の符号化処理がサブフレームのセットへの符号化フレーム全体のフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、第2の符号化処理に対しても同一のフレーム分割構成を使用するのが有用である。このように、1つの符号化処理のみに対するフレーム分割構成を表す情報を信号で伝送することで十分である。
図6及び図7の特定の例を参照して、可能なフレーム構成を以下に示す。
Figure 2008532064
(m1,m2,m3,m4)の形をしており、ここでmkは、マスタフレーム内のL/4ミリ秒の長さのk番目の(サブ)フレームに対して選択されるフレームタイプを表す。例えば次の如くである。
k=0は、フィルタ長をPとしてL/4ミリ秒のフレーム。
k=1は、フィルタ長を2×PとしてL/2ミリ秒のフレーム。
k=2は、フィルタ長を4×PとしてLミリ秒の最大フレーム。
例えば、構成(0,0,1,1)は、Lミリ秒のマスタフレームが、フィルタ長をPとするL/4ミリ秒の2つの(サブ)フレームと、これに続く、フィルタ長を2×PとするL/2ミリ秒の1つの(サブ)フレームとに分割されることを示す。また、構成(2,2,2,2)は、フィルタ長を4×PとするLミリ秒のフレームが使用されることを示す。このように、(m1,m2,m3,m4)の情報は、フレーム分割の構成のみならずフィルタ長の情報も同時に示すことがわかる。
最適構成は、例えばMSE又は同等に最大SNRに基づき選択される。例えば、構成(0,0,1,1)が使用される場合、長さPのフィルタ2つと長さ2×Pのフィルタ1つで、フィルタの合計数は3である。
その対応するフィルタとそれぞれの長さで、(SNR又はMSEで測定して)最良の性能となるフレーム構成が選択される。
フレーム選択前のフィルタの計算は、フィルタの量子化ステージを含むことで、開ループか又は閉ループのどちらでもよい。
この手法を使用する利点は、この手順ではステレオ音像又はマルチチャネル音像の躍動感がよく表現されることである。
可変フレーム長処理に伴って、エンコーダの分析窓同士のオーバーラップ長を異ならせるようにしてもよい。それ故デコーダでは、それに対応してチャネル信号の窓への合成や異なる信号長のオーバーラップ加算が不可欠である。
定常信号に関してはステレオ音像が非常に安定していて、推定チャネル・フィルタがまったく変動がないことはよくある。
図8は、本発明の好適な実施形態における基本的なマルチチャネル符号化手順を示す概略的なフローチャートである。ステップS1において、1つ以上のオーディオチャネルの第1の信号が、第1の符号化処理において符号化される。ステップS2において、フレーム分割構成と各サブフレームに対するフィルタ長との組合せが、フィルタに基づく第2の符号化処理に対して選択される。この選択手順は、性能尺度の最適化に基づいてもよい所定の条件に従って実行される。ステップS3において、第2の信号が、選択された組合せに従って符号化フレーム全体の各サブフレームにおいて符号化される。
復号化処理は周知のものであり、基本的には、着信データストリームの読み取り、データの変換、逆量子化、マルチチャネル音声信号の復元を含む。詳細には、第1の信号の復元データに応答して、前記複数チャネルのうち少なくとも1つの符号化された第1の信号が、第1の復号化処理において復号化される。また、第2の信号の復元データに応答して、前記複数チャネルのうち少なくとも1つの符号化された第2の信号が、第2の復号化処理において復号化される。少なくとも後者の場合、対応する第2の符号化処理において使用された、符号化フレーム全体のサブフレームのセットへのフレーム分割構成及び各サブフレームに対するフィルタ長を表す情報が、復号化側において受信される。この制御情報に基づいて、第2の復号化処理において第2の信号復元データを解釈する方法が判定される。
特に好適な実施形態において、制御情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含む。
より詳細な理解のために、主にステレオ(2チャネル)符号化及び復号化の例示的な実施形態を参照して本発明を説明する。なお、本発明は、一般に複数チャネルに適用可能である。例としては、5.1(左前方、中央前方、右前方、左後方、右後方、サブウーファー)又は2.1(左、右、及び中央のサブウーファー)マルチチャネルサウンドの符号化/復号化を含むが、それらに限定されない。
本発明は、副エンコーダ、主エンコーダ、あるいは副エンコーダ及び主エンコーダの双方に適用可能である。実際には、マルチチャネルエンコーダ全体においてN個のエンコーダの任意のサブセットに本発明を適用できる。
図9は、本発明の好適な実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。エンコーダは、典型的なモノラル信号等の第1の(主)信号を符号化する第1(主)エンコーダ130、(補助/副)信号符号化に対する第2(補助/副)エンコーダ140、コントローラ150及びオプションのマルチプレクサ160を基本的に具備する。コントローラ150は、主信号及び副信号を受信でき、符号化フレーム全体のフレーム分割構成と各サブフレームのフィルタ長との組合せを最適に又は少なくとも次善に(所定の制約の下で)選択するために必要な計算を実行するように構成される。コントローラ150は、「別個の」コントローラであってもよく、あるいは副エンコーダ140に内蔵されてもよい。フレーム分割及びフィルタ長を表す符号化パラメータ及び情報は、マルチプレクサ160において単一の送信又は格納信号に多重化されるのが好ましい。
図10は、本発明の別の例示的な実施形態によるエンコーダの関連する部分を示す概略ブロック図である。この特定の実現例において、ステレオ又はマルチチャネル符号器全体の各副エンコーダは、それぞれ内蔵されたコントローラを有する。副エンコーダ内のコントローラは、副符号化処理に対してフレーム分割構成及びフィルタ長を選択するように構成されることが好ましい。この選択は、エンコーダ性能の最適化及び/又は各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという条件に基づくとよい。
例えば、主エンコーダが符号化フレーム全体のサブフレームのセットへのフレーム分割構成によるいわゆる可変フレーム長処理を使用する場合、副エンコーダに対しても同一のフレーム分割構成を使用するのが有用である。これにより、1つのエンコーダのみに対するフレーム分割構成を表す情報を復号化側に送信することで十分である。通常、主エンコーダのコントローラは、符号化フレーム全体に対して使用するフレーム分割構成を副エンコーダのコントローラに信号で伝送し、副エンコーダのコントローラは、同一のフレーム分割を使用する。副符号化処理に対して2つの別の方法が存在する。すなわち、1)判定したフレーム分割がフィルタ長を直接制御するようにすること、あるいは、2)判定したフレーム分割に対してフィルタ長を自由に選択することである。当然、後者の方法の方が高い自由度を与えるが、多くの信号伝送量が必要になる可能性がある。前者の方法は、追加的な信号伝送量を必要としない。主エンコーダのコントローラが選択されたフレーム分割構成に関する情報を復号化側に送信し、復号化側がその情報を使用して送信された信号復元データを解釈し、符号化されたマルチチャネルオーディオ情報を正確に復号化することで十分である。しかし、フィルタ長の選択がある程度制限されるため、前者の方法は次善となる可能性はある。
図11は、本発明の好適な実施形態におけるデコーダの関連する部分を示す概略ブロック図である。デコーダは、オプションのデマルチプレクサ210、第1(主)デコーダ230、第2(補助/副)デコーダ240、コントローラ250、オプションの信号結合部260及びオプションの後処理部270を基本的に具備する。デマルチプレクサ210は、第1の(主)信号の復元データ、第2の(補助/副)信号の復元データ、並びにフレーム分割構成及びフィルタ長に関する情報等の制御情報等の入力された復元情報を分離する。第1(主)デコーダ230は、符号化パラメータを表す第1の(主)信号の形式で通常提供される第1の(主)信号復元データに応答して、第1の(主)信号を復元する。第2(補助/副)デコーダ240は、量子化フィルタ係数及び復元された第1の信号に応答して、第2の(副)信号を復元する。第2(副)デコーダ240はコントローラ250により制御され、コントローラ250は副デコーダに内蔵されてもされなくてもよい。コントローラは、フレーム分割構成及びフィルタ長に関する情報を符号化側から受信し、それに従って副デコーダ240を制御する。
主エンコーダがフレーム分割構成によるいわゆる可変フレーム長処理を使用し、かつ、主エンコーダのコントローラが選択されたフレーム分割構成に関する情報を復号化側に送信する場合、副デコーダ240を制御する際に使用するために、主デコーダ230はオプションとしてコントローラ250にその情報を信号で伝送することが可能である(破線で示す)。
以下では、本発明の十分な理解に資するために、チャネル間予測などのパラメトリック符号化原理に基づく様々な例示の実施形態を参照して、本発明を詳細に説明する。
(チャネル間予測を使用するパラメトリック符号化)
一般に、チャネル間予測(ICP)技術は、チャネル間に内在するチャネル間相関を利用する。ステレオ符号化では、チャネルは普通、左信号l(n)と右信号r(n)により表される。それと等価の表現は、モノラル信号m(n)(主信号の特殊な場合)及び副信号s(n)である。両方の表現は同等であり、通常は従来の行列演算で関連付けられる。
Figure 2008532064
ICP技術では予測値^S(n)で副信号s(n)を表すことを狙いとしている。予測値^S(n)は、モノラル信号m(n)を次式で表されるN個のフィルタ係数ht(i)を有する時変FIRフィルタH(z)でフィルタリングすることで取得される。
Figure 2008532064
同じ方法が、左チャネルと右チャネルにも直接適用できることに注意すべきである。
エンコーダで推定されるICPフィルタは、副信号予測誤差e(n)の例えば平均二乗誤差(MSE)又は関連する性能測定値、例えば心理音響的に重み付けした平均二乗誤差を最小化することで推定されうる。MSEは、通常次式で求められる。
Figure 2008532064
上式で、Lはフレームサイズ、NはICPフィルタの長さ(length)/次数(order)/次元(dimension)である。簡単に言うと、ICPフィルタの性能ひいてはMSEの大きさは、最終的にステレオ分離を決定する主要因である。副信号は左チャネルと右チャネルとの間の差を表現するので、正確な副信号の再現は十分な広がりのあるステレオ音像を確実にするのに必要不可欠である。
最適なフィルタ係数は、全サンプルにわたる予測誤差のMSEを最小化することで見つけられ、次式で求められる。
Figure 2008532064
式(4)の相関ベクトルr及び共分散行列Rは、以下により定義される。
Figure 2008532064
ただし、
Figure 2008532064
式(5)を式(3)に代入することにより、(量子化されていない)ICPフィルタの最小MSE(MMSE)に関する単純化した代数式が得られる。
Figure 2008532064
ただし、Pssは副信号の電力であり、sTsとも表される。
r=Rhoptを式(7)に代入すると、次式が得られる。
Figure 2008532064
RをLDLT因数分解(文献[9](非特許文献6)参照)すると、次の等式が得られる。
Figure 2008532064
ここでまず、反復的な方法でzを解く。
Figure 2008532064
これから新しいベクトルq=LThを導入する。行列Dは対角成分だけ0でない値をとるので、qを見つけるのは容易である。
Figure 2008532064
求めるフィルタ・ベクトルhは、式(10)と同じ方法で反復的に計算できる。
Figure 2008532064
正則行列反転に比べて計算量が節約できることのほかに、この解決策は異なる次元数n(フィルタ長)に相当するフィルタ係数を効率的に計算する可能性を提供する。
Figure 2008532064
最適ICP(FIR)フィルタ係数hoptが推定され、量子化され、フレームごとにデコーダに送信されうる。
一般に、フィルタ係数はベクトルとして取り扱われ、そのベクトルはベクトル量子化(VQ)を使用して効率的に量子化される。フィルタ係数の量子化は、ICP符号化手順の最も重要な面の1つである。当然のことながら、フィルタ係数に関して持ち込まれる量子化雑音は、MSEの減少に直接関連することがある。
MMSEは、前記したとおり、以下のように定義されている。
Figure 2008532064
optの量子化は、次式で表される量子化誤差eを生じる。
Figure 2008532064
新しいMSEは、次式のように表される。
Figure 2008532064
Rhopt=rなので、式(15)の最後の2項は打ち消され、量子化フィルタのMSEは次式のようになる。
Figure 2008532064
この意味することは、少しでも予測利得を得るためには、量子化誤差項の値は予測項の値未満、すなわち、
Figure 2008532064
である必要があるということである。
一般に、長いベクトルの量子化は、大きな量子化誤差を生じる。なお、量子化ICPフィルタのMSEは以下のように定義される。
Figure 2008532064
取得されるMSEは、選択したフィルタ次元数nと生じる量子化誤差とのトレードオフである。固定のビット数を仮定して、式(17)が常に最小となるように、各フレームに対するフィルタ次元数を選択する方式を考える。
Figure 2008532064
本発明の例示的な実施形態によれば、次式に従ってフレーム分割構成及びそのフィルタ長を選択するのが望ましい。
Figure 2008532064
ただし、
Figure 2008532064
上式において、Nは可能なフィルタ次元数ベクトルの集合、Mは可能なフレーム長構成の集合である。式(20)は単なる例にすぎず、さまざまな変形例が存在することは理解すべきである。
上述した実施形態は単なる例示にすぎず、本発明が実施形態に限定されるものではない。本明細書の開示と特許請求の範囲に記載される基礎をなす原理を維持しつつ更に行う修正、変更、改善は、本発明の範疇に含まれる。
マルチチャネル符号化/復号化を使用する音声伝送システムの一般的な例を示すブロック図である。 異なるチャネルの信号が個別で無関係な信号として、それぞれどのように符号化されるかを説明する図である。 パラメトリック・ステレオ符号化の基本原理を示すブロック図である。 モノラル信号と副信号とのクロススペクトルを示す図である。 本発明の好適な実施形態におけるマルチチャネルエンコーダを示す概略ブロック図である。 マスタフレームの異なるフレーム分割を示す概略的なタイミングチャートである。 本発明の実施形態における異なるフレーム構成を示す図である。 本発明の好適な実施形態におけ基本的なマルチチャネル符号化手順を示す概略的なフローチャートである。 本発明の好適な実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。 本発明の別の実施形態におけるエンコーダの関連する部分を示す概略ブロック図である。 本発明の好適な実施形態におけるデコーダを示す図である。

Claims (31)

  1. 第1符号化処理において、マルチチャネルのうち少なくとも1つのチャネルの第1の信号を符号化するステップと、
    フィルタに基づく第2の符号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの第2の信号を符号化するステップと、
    を有する、マルチチャネルのオーディオ信号を符号化する符号化方法であって、
    符号化フレーム全体にわたる前記第2の符号化処理の性能を表す忠実度尺度を最適化するように規定された所定の条件に従って、前記第2の符号化処理のために、i)符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と、ii)各サブフレームのフィルタ長との組合せを選択する選択ステップと、
    フレーム全体に対して、選択された前記組合せに従って、選択された前記サブフレームのセットの各サブフレームにおいて前記第2の信号を符号化する符号化ステップと、
    を有することを特徴とする符号化方法。
  2. 各サブフレームのフィルタ長は、サブフレームの長さに依存して選択されることを特徴とする請求項1記載の符号化方法。
  3. 前記所定の条件は、符号化フレームのサブフレームのセットへのフレーム分割構成が各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件を含むことを特徴とする請求項1記載の符号化方法。
  4. 前記所定の条件は、各サブフレームのフィルタ長がサブフレームの長さにより制御される符号化フレーム全体にわたる前記第2の符号化処理の性能を表す尺度の最適化に基づいたものであることを特徴とする請求項3記載の符号化方法。
  5. 前記第1の符号化処理も、符号化フレーム全体のサブフレームのセットへのフレーム分割構成に基づき行われ、
    前記所定の条件は、前記第2の符号化処理のための符号化フレーム全体のサブフレームのセットへの前記フレーム分割構成が前記第1の符号化処理の前記フレーム分割構成と同一となるように選択されるという必要条件を含む
    ことを特徴とする請求項1記載の符号化方法。
  6. 選択された前記フレーム分割構成及び選択された前記フレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成するステップを有することを特徴とする請求項1記載の符号化方法。
  7. 前記選択ステップと前記符号化ステップは、フレーム毎に実行されることを特徴とする請求項1記載の符号化方法。
  8. 前記選択ステップは、マルチチャネルのオーディオ信号のチャネル間相関特性に基づいて実行されることを特徴とする請求項1記載の符号化方法。
  9. 前記第2の符号化処理は、前記第1及び第2の信号に基づく前記第2の信号の予測のために調整可能なフィルタ長を有するチャネル間予測フィルタによる適応チャネル間予測を含むことを特徴とする請求項1記載の符号化方法。
  10. 前記選択ステップは前記第2の符号化処理の推定性能に基づいて実行されることを特徴とする請求項9記載の符号化方法。
  11. 前記選択ステップは補助符号化処理に対して実行されるステップであって、前記第2の符号化処理は補助符号化処理であり、前記第1の符号化処理は主符号化処理であることを特徴とする請求項1記載の符号化方法。
  12. 前記選択ステップは主符号化処理に対して実行されるステップであって、前記第2の符号化処理は主符号化処理であり、前記第1の符号化処理は補助符号化処理であることを特徴とする請求項1記載の符号化方法。
  13. 前記選択ステップは前記第1の符号化処理及び前記第2の符号化処理の双方に対して実行されることを特徴とする請求項1記載の符号化方法。
  14. マルチチャネルのうち少なくとも1つのチャネルの第1の信号を符号化する第1エンコーダと、
    前記マルチチャネルのうち少なくとも1つのチャネルの第2の信号を符号化する、フィルタに基づく第2エンコーダと、
    を備える、マルチチャネルのオーディオ信号を符号化する符号化装置であって、
    符号化フレーム全体にわたる前記第2の符号化処理の性能を表す忠実度尺度を最適化するように規定された所定の条件に従って、前記第2エンコーダのために、i)符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と、ii)各サブフレームのフィルタ長との組合せを選択する選択手段と、
    フレーム全体に対して、選択された前記組合せに従って、選択された前記サブフレームのセットの各サブフレームにおいて前記第2の信号を符号化する符号化手段と、
    を備えることを特徴とする符号化装置。
  15. 前記選択手段は、前記サブフレームの長さに従って依存して各サブフレームのフィルタ長を選択することを特徴とする請求項14記載の符号化装置。
  16. 前記選択手段は、符号化フレームのサブフレームのセットへのフレーム分割構成が各サブフレームに対して選択されるフィルタ次元数を示すように、各サブフレームのフィルタ長がサブフレームの長さに依存して選択されるという必要条件に基づいて動作することを特徴とする請求項14記載の符号化装置。
  17. 前記選択手段は、各サブフレームのフィルタ長がサブフレームの長さにより制御される符号化フレーム全体にわたる前記第2の符号化処理の性能を表す尺度の最適化に基づいて動作することを特徴とする請求項16記載の符号化装置。
  18. 前記第1エンコーダも、符号化フレーム全体のサブフレームのセットへのフレーム分割構成に基づいて動作し、
    前記選択手段は、前記第2の符号化処理のための符号化フレーム全体のサブフレームのセットへの前記フレーム分割構成が前記第1の符号化処理の前記フレーム分割構成と同一となるように選択されるという必要条件の下で動作することを特徴とする請求項14記載の符号化装置。
  19. 選択された前記フレーム分割構成及び選択された前記フレーム分割構成の各サブフレームのフィルタ長を表す出力データを生成する生成手段を備えることを特徴とする請求項14記載の符号化装置。
  20. 前記選択手段及び前記符号化手段は、フレーム毎に動作可能であることを特徴とする請求項14記載の符号化装置。
  21. 前記選択手段は、マルチチャネルのオーディオ信号のチャネル間相関特性に応じて動作することを特徴とする請求項14記載の符号化装置。
  22. 前記第2エンコーダは、前記第1及び第2の信号に基づく前記第2の信号の予測のための適応チャネル間予測フィルタを含み、各サブフレームに対して選択されるフィルタ長は、前記チャネル間予測フィルタのフィルタ長に関連することを特徴とする請求項14記載の符号化装置。
  23. 前記選択手段は前記第2の符号化処理の推定性能に応じて動作することを特徴とする請求項22記載の符号化装置。
  24. 前記選択手段は、フレーム分割構成と補助エンコーダのための各サブフレームのフィルタ長との組合せを選択するように構成され、前記第2エンコーダは補助エンコーダであり、前記第1エンコーダは主エンコーダであることを特徴とする請求項14記載の符号化装置。
  25. 前記選択手段は、フレーム分割構成と主エンコーダのための各サブフレームのフィルタ長との組合せを選択するように構成され、前記第2エンコーダは主エンコーダであり、前記第1エンコーダは補助エンコーダであることを特徴とする請求項14記載の符号化装置。
  26. 前記選択手段は、フレーム分割構成と前記第1エンコーダ及び前記第2エンコーダの双方に対する各サブフレームのフィルタ長との組合せを選択するように構成されることを特徴とする請求項14記載の符号化装置。
  27. 第1の信号復元データに応答して、第1の復号化処理において、マルチチャネルのうち少なくとも1つのチャネルの符号化された第1の信号を復号化するステップと、
    第2の信号復元データに応答して、第2の復号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの符号化された第2の信号を復号化するステップと、
    を有する、符号化されたマルチチャネルのオーディオ信号を復号化する復号化方法であって、
    対応する第2の符号化処理において使用された符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長とを表す情報を受信する受信ステップと、
    前記第2の復号化処理において前記第2の信号復元データを解釈する方法を前記情報に基づいて決定する決定ステップと、
    を有することを特徴とする復号化方法。
  28. 各サブフレームのフィルタ長はサブフレームの長さに依存して選択され、前記情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含むことを特徴とする請求項27記載の復号化方法。
  29. 第1の信号復元データに応答して、第1の復号化処理において、マルチチャネルのうち少なくとも1つのチャネルの符号化された第1の信号を復号化する手段と、
    第2の信号復元データに応答して、第2の復号化処理において、前記マルチチャネルのうち少なくとも1つのチャネルの符号化された第2の信号を復号化する手段と、
    を有する、符号化されたマルチチャネルのオーディオ信号を復号化する復号化装置であって、
    対応する第2の符号化処理において使用された符号化フレーム全体の可変長サブフレームのセットへのフレーム分割構成と各サブフレームのフィルタ長とを表す情報を受信する受信手段と、
    前記第2の復号化処理において前記第2の信号復元データを解釈する方法を前記情報に基づいて決定する決定手段と、
    を有することを特徴とする復号化装置。
  30. 各サブフレームのフィルタ長はサブフレームの長さに依存して選択され、前記情報は、符号化フレームのサブフレームのセットへのフレーム分割構成を示すと共に各サブフレームに対して選択されたフィルタ次元数を示すデータを含むことを特徴とする請求項29記載の復号化装置。
  31. 請求項14記載の符号化装置と、請求項29記載の復号化装置とを備えることを特徴とするオーディオ送信システム。
JP2007556114A 2005-02-23 2006-02-22 マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減 Expired - Fee Related JP5171269B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US65495605P 2005-02-23 2005-02-23
US60/654956 2005-02-23
SEPCT/SE2005/002033 2005-12-22
PCT/SE2005/002033 WO2006091139A1 (en) 2005-02-23 2005-12-22 Adaptive bit allocation for multi-channel audio encoding
PCT/SE2006/000235 WO2006091151A1 (en) 2005-02-23 2006-02-22 Optimized fidelity and reduced signaling in multi-channel audio encoding

Publications (2)

Publication Number Publication Date
JP2008532064A true JP2008532064A (ja) 2008-08-14
JP5171269B2 JP5171269B2 (ja) 2013-03-27

Family

ID=36927684

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007552087A Expired - Fee Related JP4809370B2 (ja) 2005-02-23 2005-12-22 マルチチャネル音声符号化における適応ビット割り当て
JP2007556114A Expired - Fee Related JP5171269B2 (ja) 2005-02-23 2006-02-22 マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007552087A Expired - Fee Related JP4809370B2 (ja) 2005-02-23 2005-12-22 マルチチャネル音声符号化における適応ビット割り当て

Country Status (7)

Country Link
US (2) US7822617B2 (ja)
EP (1) EP1851866B1 (ja)
JP (2) JP4809370B2 (ja)
CN (3) CN101124740B (ja)
AT (2) ATE521143T1 (ja)
ES (1) ES2389499T3 (ja)
WO (1) WO2006091139A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500681A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2014149552A (ja) * 2009-07-31 2014-08-21 Panasonic Corp 符号化装置および復号装置
JP2018063457A (ja) * 2014-05-01 2018-04-19 日本電信電話株式会社 復号装置、及びその方法、プログラム、記録媒体

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US20070133819A1 (en) * 2005-12-12 2007-06-14 Laurent Benaroya Method for establishing the separation signals relating to sources based on a signal from the mix of those signals
BRPI0806346B1 (pt) * 2007-01-10 2020-09-29 Koninklijke Philips N.V. Decodificador de áudio, método para decodificar sinais de áudio, receptor para receber sinais de áudio, sistema de comunicação para comunicar sinais de áudio, métodos para receber sinais de áudio e para transmitir e receber sinais de áudio, e dispositivo de reprodução de áudio
WO2008126382A1 (ja) * 2007-03-30 2008-10-23 Panasonic Corporation 符号化装置および符号化方法
EP2201566B1 (en) 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
WO2009057329A1 (ja) * 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2009144953A1 (ja) * 2008-05-30 2009-12-03 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
EP2345027B1 (en) * 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8504184B2 (en) 2009-02-04 2013-08-06 Panasonic Corporation Combination device, telecommunication system, and combining method
MX2011009660A (es) 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US9111527B2 (en) 2009-05-20 2015-08-18 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and methods therefor
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
WO2011013983A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011034374A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
MX2012009785A (es) * 2010-02-24 2012-11-23 Fraunhofer Ges Forschung Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora.
US9378745B2 (en) 2010-04-09 2016-06-28 Dolby International Ab MDCT-based complex prediction stereo coding
SG184537A1 (en) * 2010-04-13 2012-11-29 Fraunhofer Ges Forschung Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
CA2929090C (en) * 2010-07-02 2017-03-14 Dolby International Ab Selective bass post filter
WO2012025431A2 (en) * 2010-08-24 2012-03-01 Dolby International Ab Concealment of intermittent mono reception of fm stereo radio receivers
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
PL2625688T3 (pl) * 2010-10-06 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio i do dostarczania wyższej granulacji czasowej dla połączonego kodeka mowy i audio (USAC)
TW202509914A (zh) 2010-12-03 2025-03-01 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP5680391B2 (ja) * 2010-12-07 2015-03-04 日本放送協会 音響符号化装置及びプログラム
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
US9424852B2 (en) 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
ES2617958T3 (es) * 2011-04-05 2017-06-20 Nippon Telegraph And Telephone Corporation Codificación de una señal acústica
JP5825353B2 (ja) * 2011-09-28 2015-12-02 富士通株式会社 無線信号送信方法、無線信号送信装置及び無線信号受信装置
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US10100501B2 (en) 2012-08-24 2018-10-16 Bradley Fixtures Corporation Multi-purpose hand washing station
MX348506B (es) 2013-02-20 2017-06-14 Fraunhofer Ges Forschung Aparato y metodo para codificar o decodificar una señal de audio utilizando una superposicion dependiente de la ubicacion de un transitorio.
CN109410964B (zh) 2013-05-24 2023-04-14 杜比国际公司 包括音频对象的音频场景的高效编码
KR102654275B1 (ko) * 2014-06-27 2024-04-04 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 장치
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
CN104157293B (zh) * 2014-08-28 2017-04-05 福建师范大学福清分校 一种增强声环境中目标语音信号拾取的信号处理方法
CN104347077B (zh) * 2014-10-23 2018-01-16 清华大学 一种立体声编解码方法
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
RU2728535C2 (ru) 2015-09-25 2020-07-30 Войсэйдж Корпорейшн Способ и система с использованием разности долговременных корреляций между левым и правым каналами для понижающего микширования во временной области стереофонического звукового сигнала в первичный и вторичный каналы
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
JP6721977B2 (ja) * 2015-12-15 2020-07-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
CN113782039A (zh) * 2017-08-10 2021-12-10 华为技术有限公司 时域立体声编解码方法和相关产品
KR20250016479A (ko) * 2017-09-20 2025-02-03 보이세지 코포레이션 씨이엘피 코덱에 있어서 비트-예산을 효율적으로 분배하는 방법 및 디바이스
JP7092049B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
WO2021086965A1 (en) 2019-10-30 2021-05-06 Dolby Laboratories Licensing Corporation Bitrate distribution in immersive voice and audio services
AU2021357364B2 (en) * 2020-10-09 2024-06-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing
AU2021358432B2 (en) * 2020-10-09 2024-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion
JP7521596B2 (ja) * 2020-11-05 2024-07-24 日本電信電話株式会社 音信号精製方法、音信号復号方法、これらの装置、プログラム及び記録媒体

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05506345A (ja) * 1990-04-12 1993-09-16 ドルビー・ラボラトリーズ・ランセンシング・コーポレーション 高品質オーディオ用符号器・復号器
JPH05289700A (ja) * 1992-04-09 1993-11-05 Olympus Optical Co Ltd 音声符号化装置
JPH0683395A (ja) * 1992-07-31 1994-03-25 Sip Soc It Per Esercizio Delle Telecommun Pa 合成による分析技術を利用する低遅延オーディオ信号コーダ
JPH0736493A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd 可変レート音声符号化装置
JPH07334195A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd サブフレーム長可変音声符号化装置
JP2004088255A (ja) * 2002-08-23 2004-03-18 Ntt Docomo Inc 信号符号化装置、信号復号装置、信号符号化方法及び信号復号方法

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2637090B2 (ja) * 1987-01-26 1997-08-06 株式会社日立製作所 音響信号処理回路
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
JPH1132399A (ja) 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6012031A (en) 1997-09-24 2000-01-04 Sony Corporation Variable-length moving-average filter
US6591241B1 (en) 1997-12-27 2003-07-08 Stmicroelectronics Asia Pacific Pte Limited Selecting a coupling scheme for each subband for estimation of coupling parameters in a transform coder for high quality audio
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
JP3606458B2 (ja) * 1998-10-13 2005-01-05 日本ビクター株式会社 音声信号伝送方法及び音声復号方法
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP2001184090A (ja) 1999-12-27 2001-07-06 Fuji Techno Enterprise:Kk 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
JP3894722B2 (ja) 2000-10-27 2007-03-22 松下電器産業株式会社 ステレオオーディオ信号高能率符号化装置
JP3846194B2 (ja) 2001-01-18 2006-11-15 日本ビクター株式会社 音声符号化方法,音声復号化方法,音声受信装置及び音声信号伝送方法
DE60209888T2 (de) 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
US7460993B2 (en) 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
DE60311794C5 (de) 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
EP1500083B1 (en) * 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP4062971B2 (ja) 2002-05-27 2008-03-19 松下電器産業株式会社 オーディオ信号符号化方法
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
CN100477531C (zh) * 2002-08-21 2009-04-08 广州广晟数码技术有限公司 用于对多声道数字音频信号进行压缩编码的编码方法
JP4373693B2 (ja) * 2003-03-28 2009-11-25 パナソニック株式会社 音響信号の階層符号化方法および階層復号化方法
AU2003222397A1 (en) 2003-04-30 2004-11-23 Nokia Corporation Support of a multichannel audio extension
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN1212608C (zh) * 2003-09-12 2005-07-27 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05506345A (ja) * 1990-04-12 1993-09-16 ドルビー・ラボラトリーズ・ランセンシング・コーポレーション 高品質オーディオ用符号器・復号器
JPH05289700A (ja) * 1992-04-09 1993-11-05 Olympus Optical Co Ltd 音声符号化装置
JPH0683395A (ja) * 1992-07-31 1994-03-25 Sip Soc It Per Esercizio Delle Telecommun Pa 合成による分析技術を利用する低遅延オーディオ信号コーダ
JPH0736493A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd 可変レート音声符号化装置
JPH07334195A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd サブフレーム長可変音声符号化装置
JP2004088255A (ja) * 2002-08-23 2004-03-18 Ntt Docomo Inc 信号符号化装置、信号復号装置、信号符号化方法及び信号復号方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500681A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2009500685A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2009500689A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理装置及び方法
JP2009500684A (ja) * 2005-07-11 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号を処理する方法、オーディオ信号のエンコーディング及びデコーディング装置及び方法
US8149878B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8149877B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8149876B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8155153B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8155144B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8155152B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8180631B2 (en) 2005-07-11 2012-05-15 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing a unique offset associated with each coded-coefficient
US8255227B2 (en) 2005-07-11 2012-08-28 Lg Electronics, Inc. Scalable encoding and decoding of multichannel audio with up to five levels in subdivision hierarchy
US8275476B2 (en) 2005-07-11 2012-09-25 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals
US8326132B2 (en) 2005-07-11 2012-12-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8417100B2 (en) 2005-07-11 2013-04-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8510120B2 (en) 2005-07-11 2013-08-13 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with coded-coefficients
US8510119B2 (en) 2005-07-11 2013-08-13 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with coded-coefficients
US8554568B2 (en) 2005-07-11 2013-10-08 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with each coded-coefficients
JP2014149552A (ja) * 2009-07-31 2014-08-21 Panasonic Corp 符号化装置および復号装置
JP2018063457A (ja) * 2014-05-01 2018-04-19 日本電信電話株式会社 復号装置、及びその方法、プログラム、記録媒体

Also Published As

Publication number Publication date
CN101124740A (zh) 2008-02-13
US20060246868A1 (en) 2006-11-02
EP1851866A4 (en) 2010-05-19
EP1851866A1 (en) 2007-11-07
JP2008529056A (ja) 2008-07-31
CN101128867A (zh) 2008-02-20
WO2006091139A1 (en) 2006-08-31
ATE521143T1 (de) 2011-09-15
ES2389499T3 (es) 2012-10-26
JP4809370B2 (ja) 2011-11-09
CN101128867B (zh) 2012-06-20
CN101128866A (zh) 2008-02-20
US7945055B2 (en) 2011-05-17
EP1851866B1 (en) 2011-08-17
US20060195314A1 (en) 2006-08-31
JP5171269B2 (ja) 2013-03-27
US7822617B2 (en) 2010-10-26
CN101128866B (zh) 2011-09-21
ATE518313T1 (de) 2011-08-15
CN101124740B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
JP5171269B2 (ja) マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減
EP1856688B1 (en) Optimized fidelity and reduced signaling in multi-channel audio encoding
RU2698154C1 (ru) Стереофоническое кодирование на основе mdct с комплексным предсказанием
CN100559465C (zh) 保真度优化的可变帧长编码
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
KR101717006B1 (ko) 오디오 프로세싱 시스템
JP5455647B2 (ja) オーディオデコーダ
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding
HK1091585B (en) Fidelity-optimised variable frame length encoding
HK1115665B (en) Fidelity-optimised pre-echo suppressing encoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121225

R150 Certificate of patent or registration of utility model

Ref document number: 5171269

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees