[go: up one dir, main page]

JP2009526467A - オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置 - Google Patents

オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置 Download PDF

Info

Publication number
JP2009526467A
JP2009526467A JP2008554147A JP2008554147A JP2009526467A JP 2009526467 A JP2009526467 A JP 2009526467A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2009526467 A JP2009526467 A JP 2009526467A
Authority
JP
Japan
Prior art keywords
information
audio signal
channel
parameter information
decoding apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008554147A
Other languages
English (en)
Inventor
ヨン ユーン,スン
スク パン,ヒー
クーク リー,ヒュン
スー キム,ドン
ヒュン リム,ジェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009526467A publication Critical patent/JP2009526467A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置を提供する。
【解決手段】このオーディオ信号復号化方法は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出し、オブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。そして、インデックスデータに対応して3D情報をオブジェクトオーディオ信号に適用して3D効果の適用されたオブジェクトオーディオ信号を生成する。これにより、オブジェクトオーディオ信号別に音像を定位でき、オブジェクトオーディオ信号の再生の際により精巧な現実感を提供することができる。

Description

本発明は、オーディオ信号の符号化及び復号化方法とその装置に関し、より詳細には、オブジェクトオーディオ信号別に音像を所望の空間位置に定位させることができるように符号化及び復号化するオーディオ信号の符号化及び復号化方法とその装置に関する。
一般に、オブジェクトベースオーディオ符号化方法において、オブジェクトエンコーダは、複数のオブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成し、オブジェクトオーディオ信号から抽出した複数の情報を含むパラメータ情報を生成する。典型的なオブジェクトベースオーディオ復号化方法において、オブジェクトデコーダは、受信したダウンミックス信号をオブジェクトベースパラメータ情報を用いて復号化することによって複数のオブジェクトオーディオ信号を復元し、レンダラーは、復元されたオブジェクト信号の位置を指定するのに必要な制御データに基づいて、オブジェクトオーディオ信号を2チャンネル信号又はマルチチャンネル信号に合成する。
しかしながら、制御データは単なるレベル間情報であり、レベル情報を用いて単なる音像正位を行うことによって3D効果を具現するのに限界があった。
したがって、本発明の目的は、オブジェクトオーディオ信号別に音像を所望の空間位置に定位できるようにオーディオ信号を符号化及び復号化するオーディオ信号符号化及び復号化方法とその装置を提供することにある。
上記の目的を達成するための本発明によるオーディオ信号復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、3次元(3D)効果の適用されたオブジェクトオーディオ信号を、前記オブジェクトオーディオ信号に3D情報を用いて生成する段階と、を含む。
また、上記の目的を達成するための本発明によるオーディオ信号の復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、を含む。
一方、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、を含む。
また、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含む。
本発明によれば、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報を抽出するデマルチプレクサと、入力インデックスデータを用いて3D情報を引き出すとともに3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含むオーディオ信号復号化装置が提供される。
また、上記目的を達成するための本発明によるオーディオ信号符号化方法は、オブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成する段階と、前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、前記オブジェクトオーディオ信号に対する3D効果具現時に用いられる3D情報の検索のためのインデックスデータを、前記オブジェクトベースパラメータ情報に挿入する段階と、を含む。
前記目的を達成するために本発明では、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体を提供する。
以上説明の如く、本発明によれば、オブジェクトベースオーディオ信号の符号化及び復号化の長所を最大限に活用しながら、各オブジェクトオーディオ信号に音像を定位できるので、オブジェクトオーディオ信号の再生時により生き生きとした現実感を提供することが可能になる。また、本発明は、ゲームプレーヤーによりネットワークを通じて操作されるゲームキャラクターの位置情報が頻繁に変化するインタラクティブゲームに有用となり、精巧な現実感を提供することができる。
以下、添付の図面を参照しつつ本発明についてより詳細に説明する。
本発明によるオーディオ信号の符号化及び復号化方法とその装置は、基本的に、オブジェクトベースオーディオ信号の符号化及び復号化過程に適用されるが、必ずしもこれに限定されるわけではなく、本発明による条件を満たす他の信号の処理過程にも適用可能である。また、本発明によるオーディオ信号の符号化及び復号化方法とその装置は、オブジェクトオーディオ信号に頭部伝達関数(HRTF)などの3D情報を適用するもので、これにより、それぞれのオブジェクトオーディオ信号の音像を所望の空間位置に定位させることができる。
図1は、一般的なオブジェクトベースオーディオ符号化装置を示すブロック図である。図1を参照すると、オブジェクトベースオーディオ信号符号化装置は、オブジェクトエンコーダ110及びビットストリーム生成部120を含む。
オブジェクトエンコーダ110は、N個のオブジェクトオーディオ信号を受信し、オブジェクトベースダウンミックス信号と、N個のオブジェクトオーディオ信号から抽出した情報が含まれるオブジェクトベースパラメータ情報と、を生成する。この時、各オブジェクトオーディオ信号から抽出した情報は、エネルギー差の値及び相関値などに基づくものである。
ビットストリーム生成部120は、オブジェクトエンコーダ110で生成したオブジェクトベースダウンミックス信号とパラメータ情報とを結合したビットストリームを生成する。ここで、ビットストリーム生成部120で生成したビットストリームには、復号化装置のデフォルト設定のためにデフォルトミキシングパラメータを含めることができ、デフォルトミキシングパラメータには、3D効果具現時に適用されるHRTFのような3D情報の検索に使われるインデックスデータを含めることができる。
図2は、本発明の第1実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例によるオーディオ信号復号化装置は、一般的なオブジェクトベース符号化方法にHRTFベース3Dバイノーラル定位(binaural localisation)概念を加えたものである。HRTFは、任意の位置を持つ音源から出る音波と耳の鼓膜に到達する音波間の伝達関数を意味し、前記音源の方位と高度によってその値が異なる。指向性のない信号をHRTFでフィルタリングすると、人にとってはあたかも特定方向から音が聞こえるかのよう感じられる。
図2を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ130、オブジェクトデコーダ140、レンダラー150、及び3D情報データベース160を含む。
デマルチプレクサ130は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報を抽出する。オブジェクトデコーダ140は、ダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。3D情報データベース160は、HRTFなどのような3D情報を保存するデータベースであり、入力インデックスデータに対応する3D情報を検索して出力する。そして、レンダラー150は、オブジェクトデコーダ140によって生成されたオブジェクトオーディオ信号と、3D情報データベース160から出力された3D情報とを用いて、3D信号を生成する。
図3は、本発明の第1実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図2及び図3を参照すると、オーディオ信号復号化装置は、符号化装置などから伝達されるビットストリームを受信すると(S170)、デマルチプレクサ130が、ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S172)。オブジェクトデコーダ140は、デマルチプレクサ130で抽出されたダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する(S174)。
レンダラー150は、オブジェクトオーディオ信号の位置を指定するのに必要な制御データに含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出す(S176)。続いて、レンダラー150は、オブジェクトデコーダ110から出力されるオブジェクトオーディオ信号と3D情報データベース160から引き出した3D情報とを用いて3Dレンダリングを行うことによって、3D効果を奏する3Dベースの信号を生成する(S178)。
レンダラー150によって生成された3D信号は、3以上の指向性を持つ2チャンネルの信号とすることができ、ヘッドホンのような2チャンネルスピーカーを通じて3次元立体音響として再生できる。すなわち、レンダラー150によって生成された3D信号を2チャンネルのスピーカーを通じて再生すると、3Dダウンミックス信号は3チャンネル以上の音源から再生されるかのようにユーザーが感じることができる。音源の方向は、両耳に入ってくる音の強度差、二つの音の間の時間差、二つの音の位相差のうち少なくとも一つによって決定されるので、レンダラー150は、人間が聴覚で音源の3次元上の位置を把握するメカニズムを用いて3D信号を生成できる。
オーディオ信号符号化装置は、デフォルト設定のためにデフォルトミキシングパラメータ情報に3D情報引出しに必要なインデックスデータを含むことができる。この場合、レンダラー150は、デフォルトミキシングパラメータ情報に含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出すことができる。
オーディオ信号符号化装置は、オブジェクト信号に対して3D効果具現時に適用されるHRTFのような3D情報の検索に必要なインデックスデータを制御データに含むことができる。すなわち、本実施例によるオーディオ信号の符号化装置に使われる制御データに含まれるミキシングパラメータは、レベル情報の外に、3D情報の検索のためのインデックスデータをさらに含むことができる。そして、制御データに含まれるミキシングパラメータには、レベル情報とインデックスデータの外に、チャンネル間の時間差情報のような時間情報、位置情報、及びレベル情報と時間情報との組合せとすることができる。
複数のオブジェクトオーディオ信号及び複数のオブジェクトオーディオ信号の一つ以上に加えることを必要とする3D効果が存在する場合、所定のインデックス情報に対応する3D情報が、検索され、3D効果を加えるオブジェクトオーディオ信号のターゲット位置を特定する3D情報を格納する3D情報データベース160から引き出される。レンダラー150は、引き出された3D情報を用いて3Dレンダリング処理を行い、3D効果を奏することができる。全てのオブジェクト信号に関する3D情報を、ミキシングパラメータ情報として使用することができる。3D情報を少数のオブジェクト信号のみに適用する場合、少数のオブジェクト信号以外のオブジェクト信号に関するレベル情報及び時間情報を、ミキシングパラメータ情報として使用することができる。
図4は、本発明の第2実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例では、オブジェクトデコーダの代わりにマルチチャンネルデコーダ270を使用する。
図4を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ230、トランスコーダ240、レンダラー250、3D情報データベース260、及びマルチチャンネルデコーダ270を含む。
デマルチプレクサ230は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する。レンダラー250は、制御データに含まれたインデックスデータに対応する3D情報を用いて、各オブジェクト信号に対して3D位置を指定する。トランスコーダ230は、オブジェクトベースパラメータ情報と、レンダラー240によって3D情報が適用された各オブジェクトオーディオ信号に対する3D位置情報とを合成し、チャンネルベースパラメータ情報を生成する。マルチチャンネルデコーダ270は、ダウンミックス信号とチャンネルベースパラメータ情報とを用いて、3D信号を生成する。
図5は、本発明の第2実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図4及び図5を参照すると、オーディオ信号復号化装置がビットストリームを受信すると(S280)、デマルチプレクサ230は、受信したビットストリームからオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S282)。
レンダラー250は、オブジェクトオーディオ信号の位置を指定するのに使用する制御データに含まれたインデックスデータを抽出し、抽出したインデックスデータを用いて3D情報データベース260から3D情報を引き出す(S284)。一次的にデフォルトミキシングパラメータにより指定されたオブジェクトオーディオ信号の位置は、ミキシング制御データを用いてオブジェクトオーディオ信号の所望の位置に対応する3D情報を指定することによって変更することができる。
トランスコーダ230は、オーディオ信号符号化装置によって転送されたN個のオブジェクト信号に関するオブジェクトベースパラメータ情報と、レンダラー250によりHRTFのような3D情報を用いて得られた各オブジェクト信号に関する3D位置情報とを合成し、M個チャンネルに対するチャンネルベースパラメータ情報を生成する(S286)。
マルチチャンネルデコーダ270は、デマルチプレクサ230から供給されるダウンミックス信号とトランスコーダ230から供給されるチャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、チャンネルベースパラメータ情報に含まれた3D情報を用いて3Dレンダリングを行い、3Dベースのマルチチャンネル信号を生成する(S290)。
図6は、本発明の第3実施例によるオーディオ信号復号化装置を示すブロック図である。図6を参照すると、本実施例によるオーディオ信号の復号化装置は、トランスコーダ440がマルチチャンネルデコーダ470にチャンネルベースパラメータ情報及び3D情報を個別に転送するという点が、前述した実施例と異なる。すなわち、第2実施例によるトランスコーダのように、3D情報を含むチャンネルベースパラメータ情報を転送するのではなく、本実施例ではトランスコーダ440が、N個のオブジェクト信号に対するオブジェクトベースパラメータ情報を用いることによって得られたM個チャンネルに対するチャンネルベースパラメータ情報をマルチチャンネルデコーダ470に転送する。
図7に示すように、チャンネルベースパラメータ情報と3D情報は、それ自体のフレームインデックスを含む。したがって、マルチチャンネルデコーダ470は、チャンネルベースパラメータ情報と3D情報のフレームインデックスを用いてチャンネルベースパラメータ情報と3D情報との同期をとることによって、ビットストリームの特定フレームに3D情報を適用することができる。例えば、図7を参照すると、インデックス2に対応する3D情報を、インデックス2を持つフレーム2の始点に適用される。
3D情報が時間の経過につれて更新される場合でも、チャンネルベースパラメータ情報において3D情報をどの位置に適用する必要があるかを3D情報のフレームインデックスを参照することによって決定することができる。すなわち、マルチチャンネルデコーダ470がチャンネルベースパラメータ情報と3D情報とを一時的に同期をとるために、トランスコーダ440は、チャンネルベースパラメータ情報と3D情報にフレームインデックス情報を挿入することができる。
図8は、本発明の第4実施例によるオーディオ信号復号化装置を示すブロック図である。図8を参照すると、本実施例によるオーディオ信号復号化装置は、プリプロセッサ543とエフェクトプロセッサ580とをさらに含み、レンダラー550内に3D情報データベース560が備えられるという点が、前述した実施例と異なる。
すなわち、デマルチプレクサ530、トランスコーダ547、レンダラー560、3D情報データベース560、及びマルチチャンネルデコーダ570の機能及び構成は、図6に示す実施例におけると同様である。図8を参照すると、エフェクトプロセッサ580がダウンミックス信号に所定の効果を加えることができる。プリプロセッサ543は、例えばステレオダウンミックス信号に前処理過程を行うことができ、その結果、ステレオダウンミックス信号の位置を調整することができる。レンダラー550内に3D情報データベース560を含むことができる。
図9は、本発明の第5実施例によるオーディオ信号復号化装置を示すブロック図である。図9を参照すると、本実施例によるオーディオ信号復号化装置は、3D信号を生成する部分680がマルチチャンネルデコーダ670とメモリー675とから構成されるという点が、前述した実施例と異なる。この場合、マルチチャンネルデコーダ670は、マルチチャンネルデコーダ670の使用されていないメモリーに保存された3D情報をメモリー675に複写し、メモリー675に複写された3D情報を用いて3Dレンダリングを行う。したがって、トランスコーダ647から出力される3D情報が、メモリー675に保存された3D情報を直接更新するように構成すると、マルチチャネルデコーダ670の構成変更なしで所望の3D情報を用いて3Dベースの信号を生成することができる。
一方、本発明は、コンピュータが読取りできる記録媒体にコンピュータが読取りできるコードとして具現することが可能である。コンピュータが読取りできる記録媒体は、コンピュータにより読み取られうるデータが保存される全ての種類の記録装置を含む。コンピュータが読取りできる記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フレキシブルディスク、光データ記憶装置などがあり、また、インターネットを介した転送などのような搬送波の形態で具現されるものも含む。また、コンピュータが読取りできる記録媒体を、ネットワークで連結されたシステムに分散し、分散方式でコンピュータが読取りできるコードが保存し、実行することができる。本発明を実現するのに必要な機能プログラム、コード及びコードセグメントを、当業者によって容易に構成することができる。
また、以上では本発明を好適な実施例に挙げて説明してきたが、本発明は、上記した特定の実施例に限定されず、特許請求の範囲で請求する本発明の要旨を逸脱しない限度内で、当該技術分野における通常の知識を持つ者によって様々な変形実施が可能であることは勿論であり、それらの変形実施も本発明の技術的思想に含まれるものとして理解されるべきである。
本発明は、オブジェクトベースのオーディオ信号の復号化過程などに適用され、オブジェクトオーディオ信号別に音像を定位し、より精巧な現実感を提供することができる。
一般的なオブジェクトベースのオーディオ信号符号化装置を示すブロック図である。 本発明の第1実施例によるオーディオ信号復号化装置を示すブロック図である。 本発明の第1実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。 本発明の第2実施例によるオーディオ信号復号化装置を示すブロック図である。 本発明の第2実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。 本発明の第3実施例によるオーディオ信号復号化装置を示すブロック図である。 図6に示すオーディオ信号復号化装置によりフレームに3D情報を適用する例を示す図である。 本発明の第4実施例によるオーディオ信号復号化装置を示すブロック図である。 本発明の第5実施例によるオーディオ信号復号化装置を示すブロック図である。

Claims (35)

  1. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、
    前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、
    前記オブジェクトオーディオ信号に3D情報を用いて、3D効果の適用されたオブジェクトオーディオ信号を生成する段階と、
    を含むことを特徴とするオーディオ信号復号化方法。
  2. 前記3D情報は、頭部伝達関数(HRTF)情報であることを特徴とする、請求項1に記載のオーディオ信号復号化方法。
  3. 前記3D情報がデータベース化して保存される段階をさらに含むことを特徴とする、請求項1に記載のオーディオ信号復号化方法。
  4. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれたインデックスデータに対応する情報であることを特徴とする、請求項1に記載のオーディオ信号復号化方法。
  5. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項4に記載のオーディオ信号復号化方法。
  6. 前記制御データに基づいて前記オブジェクトオーディオ信号をレンダリングする段階をさらに含むことを特徴とする、請求項4に記載のオーディオ信号復号化方法。
  7. 前記インデックスデータは、前記オブジェクトベースパラメータ情報に含まれたデフォルトミキシングパラメータに含まれることを特徴とする、請求項1に記載のオーディオ信号復号化方法。
  8. 入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、
    前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、
    前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、
    を含むことを特徴とするオーディオ信号復号化装置。
  9. 前記3D情報がデータベース化して保存される3D情報データベースをさらに含むことを特徴とする、請求項8に記載のオーディオ信号の復号化装置。
  10. 前記3D情報は、頭部伝達関数(HRTF)情報であることを特徴とする、請求項8に記載のオーディオ信号復号化装置。
  11. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれたインデックスデータに対応する情報であることを特徴とする、請求項8に記載のオーディオ信号復号化装置。
  12. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項11に記載のオーディオ信号復号化装置。
  13. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、
    前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、
    前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、
    を含むことを特徴とするオーディオ信号復号化方法。
  14. 前記3D情報がデータベース化して保存される段階をさらに含むことを特徴とする、請求項13に記載のオーディオ信号の復号化方法。
  15. 前記3D情報は、HRTF情報であることを特徴とする、請求項13に記載のオーディオ信号復号化方法。
  16. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられるミキシング制御データに含まれることを特徴とする、請求項13に記載のオーディオ信号復号化方法。
  17. 前記ミキシング制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項16に記載のオーディオ信号復号化方法。
  18. 前記制御データに基づいて前記オブジェクトオーディオ信号をレンダリングする段階をさらに含むことを特徴とする、請求項16に記載のオーディオ信号復号化方法。
  19. 前記ダウンミックス信号に予め決定された効果を加える段階をさらに含むことを特徴とする、請求項13に記載のオーディオ信号復号化方法。
  20. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、
    インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
    前記オブジェクトベースパラメータ情報と前記3D情報とを用いてチャンネルベースパラメータ情報を生成するトランスコーダと、
    前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベースパラメータ情報に含まれた3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
    を含むことを特徴とするオーディオ信号復号化装置。
  21. 前記インデックスデータに対応する3D情報がデータベース化して保存される3D情報データベースをさらに含むことを特徴とする、請求項20に記載のオーディオ信号復号化装置。
  22. 前記3D情報データベースは、前記レンダラーに備えられることを特徴とする、請求項20に記載のオーディオ信号復号化装置。
  23. 前記ダウンミックス信号に予め決定された効果を加えるエフェクトプロセッサをさらに含むことを特徴とする、請求項20に記載のオーディオ信号復号化装置。
  24. 前記インデックスデータは、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれることを特徴とする、請求項20に記載のオーディオ信号復号化装置。
  25. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項24に記載のオーディオ信号復号化装置。
  26. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報を抽出するデマルチプレクサと、
    入力インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
    前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、
    前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
    を含むことを特徴とするオーディオ信号復号化装置。
  27. 前記マルチチャンネルデコーダは、前記3D効果を奏するオーディオ信号の生成に常用される3D情報が保存されるメモリーを含むことを特徴とする、請求項26に記載のオーディオ信号復号化装置。
  28. 前記メモリーに保存された3D情報は、前記トランスコーダから出力される前記チャンネルベース3D情報によって更新されることを特徴とする、請求項27に記載のオーディオ信号復号化装置。
  29. 前記インデックスデータは、前記オブジェクトオーディオ信号のレンダリングに用いられるミキシング制御データに含まれることを特徴とする、請求項26に記載のオーディオ信号復号化装置。
  30. 前記チャンネルベースパラメータ情報と前記チャンネルベース3D情報は、前記チャンネルベースパラメータ情報が前記チャンネルベース3D情報に同期化をとるためのインデックス情報を含むことを特徴とする、請求項26に記載のオーディオ信号復号化装置。
  31. オブジェクトオーディオ信号をダウンミックスしたダウンミックス信号を生成する段階と、
    前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、
    前記オブジェクトオーディオ信号に対する3D効果の具現時に用いられる3D情報の検索のためのインデックスデータを前記オブジェクトベースパラメータ情報に挿入する段階と、
    含むことを特徴とするオーディオ信号符号化方法。
  32. 前記オブジェクトベースダウンミックス信号と、前記インデックスデータの挿入されたオブジェクトベースパラメータ情報とを結合することによって、ビットストリームを生成する段階をさらに含むことを特徴とする、請求項31に記載のオーディオ信号符号化方法。
  33. 前記3D情報は、HRTF情報であることを特徴とする、請求項31に記載のオーディオ信号符号化方法。
  34. 請求項1〜7のいずれか1項による方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読取り可能な記録媒体。
  35. 請求項1〜7のいずれか1項による方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読取り可能な記録媒体。
JP2008554147A 2006-02-09 2007-02-09 オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置 Pending JP2009526467A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77147106P 2006-02-09 2006-02-09
US77333706P 2006-02-15 2006-02-15
US88071407P 2007-01-17 2007-01-17
US88094207P 2007-01-18 2007-01-18
PCT/KR2007/000730 WO2007091870A1 (en) 2006-02-09 2007-02-09 Method for encoding and decoding object-based audio signal and apparatus thereof

Publications (1)

Publication Number Publication Date
JP2009526467A true JP2009526467A (ja) 2009-07-16

Family

ID=39731308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008554147A Pending JP2009526467A (ja) 2006-02-09 2007-02-09 オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置

Country Status (7)

Country Link
EP (1) EP1984916A4 (ja)
JP (1) JP2009526467A (ja)
AU (1) AU2007212873B2 (ja)
BR (1) BRPI0708047A2 (ja)
CA (1) CA2646278A1 (ja)
TW (1) TWI326448B (ja)
WO (1) WO2007091870A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509591A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509588A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011523247A (ja) * 2008-04-16 2011-08-04 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2013054395A (ja) * 2006-09-29 2013-03-21 Korea Electronics Telecommun 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
US8634577B2 (en) 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
WO2014171706A1 (ko) * 2013-04-15 2014-10-23 인텔렉추얼디스커버리 주식회사 가상 객체 생성을 이용한 오디오 신호 처리 방법
WO2014192602A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9257127B2 (en) 2006-12-27 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
JP2016507173A (ja) * 2013-01-15 2016-03-07 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. バイノーラルのオーディオ処理
JP2018201224A (ja) * 2013-10-25 2018-12-20 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号レンダリング方法及び装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY144273A (en) 2006-10-16 2011-08-29 Fraunhofer Ges Forschung Apparatus and method for multi-chennel parameter transformation
CN102892070B (zh) 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
KR101069268B1 (ko) * 2007-02-14 2011-10-04 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
US20100228554A1 (en) * 2007-10-22 2010-09-09 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101061129B1 (ko) 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5589387B2 (ja) * 2008-11-27 2014-09-17 東レ株式会社 シロキサン樹脂組成物およびそれを用いたタッチパネル用保護膜
WO2014088328A1 (ko) * 2012-12-04 2014-06-12 삼성전자 주식회사 오디오 제공 장치 및 오디오 제공 방법
CN106104679B (zh) 2014-04-02 2019-11-26 杜比国际公司 利用沉浸式音频元数据中的元数据冗余

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028800A (ja) * 1999-06-10 2001-01-30 Samsung Electronics Co Ltd 位置調節が可能な仮想音像を利用したスピーカ再生用多チャンネルオーディオ再生装置及びその方法
WO2004036548A1 (en) * 2002-10-14 2004-04-29 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream
WO2004051624A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method for describing the composition of audio signals
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007089131A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
CN102768836B (zh) * 2006-09-29 2014-11-05 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028800A (ja) * 1999-06-10 2001-01-30 Samsung Electronics Co Ltd 位置調節が可能な仮想音像を利用したスピーカ再生用多チャンネルオーディオ再生装置及びその方法
WO2004036548A1 (en) * 2002-10-14 2004-04-29 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream
WO2004051624A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method for describing the composition of audio signals
JP2006517356A (ja) * 2002-12-02 2006-07-20 トムソン ライセンシング オーディオ信号の構成を記述する方法
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013054395A (ja) * 2006-09-29 2013-03-21 Korea Electronics Telecommun 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
US9311919B2 (en) 2006-09-29 2016-04-12 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US9257124B2 (en) 2006-09-29 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US8670989B2 (en) 2006-09-29 2014-03-11 Electronics And Telecommunications Research Institute Appartus and method for coding and decoding multi-object audio signal with various channel
JP2013077023A (ja) * 2006-09-29 2013-04-25 Korea Electronics Telecommun 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
JP2016200824A (ja) * 2006-12-27 2016-12-01 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute トランスコーディング装置
US9257127B2 (en) 2006-12-27 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
US8634577B2 (en) 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
JP2011509591A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509590A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509589A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011509588A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011523247A (ja) * 2008-04-16 2011-08-04 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2016507173A (ja) * 2013-01-15 2016-03-07 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. バイノーラルのオーディオ処理
WO2014171706A1 (ko) * 2013-04-15 2014-10-23 인텔렉추얼디스커버리 주식회사 가상 객체 생성을 이용한 오디오 신호 처리 방법
WO2014192602A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JPWO2014192602A1 (ja) * 2013-05-31 2017-02-23 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9805729B2 (en) 2013-05-31 2017-10-31 Sony Corporation Encoding device and method, decoding device and method, and program
JP2018201224A (ja) * 2013-10-25 2018-12-20 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号レンダリング方法及び装置
US10645513B2 (en) 2013-10-25 2020-05-05 Samsung Electronics Co., Ltd. Stereophonic sound reproduction method and apparatus
US11051119B2 (en) 2013-10-25 2021-06-29 Samsung Electronics Co., Ltd. Stereophonic sound reproduction method and apparatus

Also Published As

Publication number Publication date
AU2007212873A1 (en) 2007-08-16
WO2007091870A1 (en) 2007-08-16
TW200741649A (en) 2007-11-01
BRPI0708047A2 (pt) 2011-05-17
CA2646278A1 (en) 2007-08-16
TWI326448B (en) 2010-06-21
EP1984916A1 (en) 2008-10-29
AU2007212873B2 (en) 2010-02-25
EP1984916A4 (en) 2010-09-29
WO2007091870A8 (en) 2008-09-12

Similar Documents

Publication Publication Date Title
JP2009526467A (ja) オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置
KR20080093422A (ko) 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
JP7014176B2 (ja) 再生装置、再生方法、およびプログラム
JP6612753B2 (ja) 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング
EP2205007B1 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
US7590249B2 (en) Object-based three-dimensional audio system and method of controlling the same
BR112020000759A2 (pt) aparelho para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, método para gerar uma descrição aprimorada de campo sonoro, método para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, programa de computador, descrição aprimorada de campo sonoro
KR20210101316A (ko) 공간 확장 음원을 재생하는 장치 및 방법 또는 공간 확장 음원으로부터 비트 스트림을 생성하는 장치 및 방법
US11570569B2 (en) Associated spatial audio playback
CN104054126A (zh) 空间音频渲染和编码
CN107533843A (zh) 用于捕获、编码、分布和解码沉浸式音频的系统和方法
JP2019533404A (ja) バイノーラルオーディオ信号処理方法及び装置
KR20220031058A (ko) 불일치 오디오 비주얼 캡쳐 시스템
WO2020153027A1 (ja) オーディオシステム、オーディオ再生装置、サーバー装置、オーディオ再生方法及びオーディオ再生プログラム
KR101534295B1 (ko) 멀티 뷰어 영상 및 3d 입체음향 제공방법 및 장치
KR102058228B1 (ko) 입체 음향 컨텐츠 저작 방법 및 이를 위한 어플리케이션
KR20070081735A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
RU2407070C2 (ru) Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала
RU2780536C1 (ru) Оборудование и способ для воспроизведения пространственно протяженного источника звука или оборудование и способ для формирования потока битов из пространственно протяженного источника звука
KR102421292B1 (ko) 오디오 객체 신호 재생 시스템 및 그 방법
JP6306958B2 (ja) 音響信号変換装置、音響信号変換方法、音響信号変換プログラム
KR20190082055A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 광고 제공 방법 및 이를 위한 어플리케이션
KR20190081160A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 광고 제공 방법 및 이를 위한 어플리케이션
CN101385078A (zh) 用于编码和解码基于对象的音频信号的方法和装置
KR20090066190A (ko) 대화형 오디오 송/수신 장치 및 그 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110308