[go: up one dir, main page]

JP2009526467A - Method and apparatus for encoding and decoding object-based audio signal - Google Patents

Method and apparatus for encoding and decoding object-based audio signal Download PDF

Info

Publication number
JP2009526467A
JP2009526467A JP2008554147A JP2008554147A JP2009526467A JP 2009526467 A JP2009526467 A JP 2009526467A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2009526467 A JP2009526467 A JP 2009526467A
Authority
JP
Japan
Prior art keywords
information
audio signal
channel
parameter information
decoding apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008554147A
Other languages
Japanese (ja)
Inventor
ヨン ユーン,スン
スク パン,ヒー
クーク リー,ヒュン
スー キム,ドン
ヒュン リム,ジェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009526467A publication Critical patent/JP2009526467A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置を提供する。
【解決手段】このオーディオ信号復号化方法は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出し、オブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。そして、インデックスデータに対応して3D情報をオブジェクトオーディオ信号に適用して3D効果の適用されたオブジェクトオーディオ信号を生成する。これにより、オブジェクトオーディオ信号別に音像を定位でき、オブジェクトオーディオ信号の再生の際により精巧な現実感を提供することができる。
An object-based audio signal encoding and decoding method and apparatus are provided.
The audio signal decoding method extracts an object base downmix signal and object base parameter information from an input audio signal, and generates an object audio signal using the object base downmix signal and the object base parameter information. To do. Then, 3D information is applied to the object audio signal corresponding to the index data to generate an object audio signal to which the 3D effect is applied. Thereby, a sound image can be localized for each object audio signal, and more elaborate realism can be provided when reproducing the object audio signal.

Description

本発明は、オーディオ信号の符号化及び復号化方法とその装置に関し、より詳細には、オブジェクトオーディオ信号別に音像を所望の空間位置に定位させることができるように符号化及び復号化するオーディオ信号の符号化及び復号化方法とその装置に関する。   The present invention relates to an audio signal encoding and decoding method and apparatus, and more particularly, to an audio signal that is encoded and decoded so that a sound image can be localized at a desired spatial position for each object audio signal. The present invention relates to an encoding and decoding method and an apparatus therefor.

一般に、オブジェクトベースオーディオ符号化方法において、オブジェクトエンコーダは、複数のオブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成し、オブジェクトオーディオ信号から抽出した複数の情報を含むパラメータ情報を生成する。典型的なオブジェクトベースオーディオ復号化方法において、オブジェクトデコーダは、受信したダウンミックス信号をオブジェクトベースパラメータ情報を用いて復号化することによって複数のオブジェクトオーディオ信号を復元し、レンダラーは、復元されたオブジェクト信号の位置を指定するのに必要な制御データに基づいて、オブジェクトオーディオ信号を2チャンネル信号又はマルチチャンネル信号に合成する。   In general, in an object-based audio encoding method, an object encoder generates a downmix signal by downmixing a plurality of object audio signals, and generates parameter information including a plurality of information extracted from the object audio signals. In a typical object-based audio decoding method, the object decoder recovers a plurality of object audio signals by decoding the received downmix signal using object-based parameter information, and the renderer The object audio signal is synthesized into a two-channel signal or a multi-channel signal based on control data necessary for designating the position of the signal.

しかしながら、制御データは単なるレベル間情報であり、レベル情報を用いて単なる音像正位を行うことによって3D効果を具現するのに限界があった。   However, the control data is merely inter-level information, and there is a limit in realizing the 3D effect by performing simple sound image localization using the level information.

したがって、本発明の目的は、オブジェクトオーディオ信号別に音像を所望の空間位置に定位できるようにオーディオ信号を符号化及び復号化するオーディオ信号符号化及び復号化方法とその装置を提供することにある。   Accordingly, an object of the present invention is to provide an audio signal encoding and decoding method and apparatus for encoding and decoding an audio signal so that a sound image can be localized at a desired spatial position for each object audio signal.

上記の目的を達成するための本発明によるオーディオ信号復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、3次元(3D)効果の適用されたオブジェクトオーディオ信号を、前記オブジェクトオーディオ信号に3D情報を用いて生成する段階と、を含む。   In order to achieve the above object, an audio signal decoding method according to the present invention uses a step of extracting a downmix signal and object-based parameter information from an input audio signal, and uses the downmix signal and the object-based parameter information. Generating an object audio signal, and generating an object audio signal to which a three-dimensional (3D) effect is applied using 3D information for the object audio signal.

また、上記の目的を達成するための本発明によるオーディオ信号の復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、を含む。   According to another aspect of the present invention, there is provided a decoding method of an audio signal according to the present invention, the step of extracting a downmix signal and object base parameter information from an input audio signal, and converting the object base parameter information to a channel. Generating base parameter information; generating an audio signal using the downmix signal and the channel base parameter information; and generating an audio signal to which a 3D effect is applied using 3D information for the audio signal. And including.

一方、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、を含む。   Meanwhile, an audio signal decoding apparatus according to the present invention uses a demultiplexer that extracts an object base downmix signal and object base parameter information from an input audio signal, the object base downmix signal, and the object base parameter information. An object decoder for generating an object audio signal; and a renderer for generating an object audio signal to which a 3D effect is applied using 3D information for the object audio signal.

また、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含む。   An audio signal decoding apparatus according to the present invention includes a demultiplexer that extracts a downmix signal and object-based parameter information from an input audio signal, a renderer that extracts 3D information using index data and outputs the 3D information. The object-based parameter information is converted into channel-based parameter information, the 3D information is converted into channel-based 3D information, and each of them is output, and the downmix signal and the channel-based parameter information are used. A multi-channel decoder that generates an audio signal and generates an audio signal to which a 3D effect is applied using the channel-based 3D information for the audio signal.

本発明によれば、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報を抽出するデマルチプレクサと、入力インデックスデータを用いて3D情報を引き出すとともに3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含むオーディオ信号復号化装置が提供される。   According to the present invention, a demultiplexer that extracts a downmix signal and object-based parameter information from an input audio signal, a renderer that extracts 3D information using input index data and outputs 3D information, and the object-based parameter information Converting into channel-based parameter information, converting the 3D information into channel-based 3D information, generating an audio signal using the transcoder that outputs the information, the downmix signal, and the channel-based parameter information, There is provided an audio signal decoding apparatus including a multi-channel decoder that generates an audio signal to which a 3D effect is applied using the channel-based 3D information in the audio signal.

また、上記目的を達成するための本発明によるオーディオ信号符号化方法は、オブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成する段階と、前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、前記オブジェクトオーディオ信号に対する3D効果具現時に用いられる3D情報の検索のためのインデックスデータを、前記オブジェクトベースパラメータ情報に挿入する段階と、を含む。   According to another aspect of the present invention, there is provided an audio signal encoding method for generating a downmix signal by downmixing an object audio signal, extracting information about the object audio signal, Generating information, and inserting index data for searching for 3D information used when implementing the 3D effect on the object audio signal into the object base parameter information.

前記目的を達成するために本発明では、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体を提供する。   In order to achieve the above object, the present invention provides a computer-readable recording medium storing a program for causing the computer to execute the method.

以上説明の如く、本発明によれば、オブジェクトベースオーディオ信号の符号化及び復号化の長所を最大限に活用しながら、各オブジェクトオーディオ信号に音像を定位できるので、オブジェクトオーディオ信号の再生時により生き生きとした現実感を提供することが可能になる。また、本発明は、ゲームプレーヤーによりネットワークを通じて操作されるゲームキャラクターの位置情報が頻繁に変化するインタラクティブゲームに有用となり、精巧な現実感を提供することができる。   As described above, according to the present invention, sound images can be localized in each object audio signal while maximizing the advantages of encoding and decoding object-based audio signals, so that the object audio signals can be reproduced more vividly. It becomes possible to provide a sense of reality. In addition, the present invention is useful for an interactive game in which position information of game characters operated by a game player through a network frequently changes, and can provide elaborate reality.

以下、添付の図面を参照しつつ本発明についてより詳細に説明する。   Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

本発明によるオーディオ信号の符号化及び復号化方法とその装置は、基本的に、オブジェクトベースオーディオ信号の符号化及び復号化過程に適用されるが、必ずしもこれに限定されるわけではなく、本発明による条件を満たす他の信号の処理過程にも適用可能である。また、本発明によるオーディオ信号の符号化及び復号化方法とその装置は、オブジェクトオーディオ信号に頭部伝達関数(HRTF)などの3D情報を適用するもので、これにより、それぞれのオブジェクトオーディオ信号の音像を所望の空間位置に定位させることができる。   The audio signal encoding and decoding method and apparatus according to the present invention are basically applied to an object-based audio signal encoding and decoding process, but the present invention is not limited thereto. The present invention can also be applied to other signal processing processes that satisfy the condition (1). In addition, the audio signal encoding and decoding method and apparatus according to the present invention apply 3D information such as a head related transfer function (HRTF) to an object audio signal, and thereby a sound image of each object audio signal. Can be localized at a desired spatial position.

図1は、一般的なオブジェクトベースオーディオ符号化装置を示すブロック図である。図1を参照すると、オブジェクトベースオーディオ信号符号化装置は、オブジェクトエンコーダ110及びビットストリーム生成部120を含む。   FIG. 1 is a block diagram illustrating a general object-based audio encoding apparatus. Referring to FIG. 1, the object-based audio signal encoding apparatus includes an object encoder 110 and a bitstream generation unit 120.

オブジェクトエンコーダ110は、N個のオブジェクトオーディオ信号を受信し、オブジェクトベースダウンミックス信号と、N個のオブジェクトオーディオ信号から抽出した情報が含まれるオブジェクトベースパラメータ情報と、を生成する。この時、各オブジェクトオーディオ信号から抽出した情報は、エネルギー差の値及び相関値などに基づくものである。   The object encoder 110 receives N object audio signals, and generates an object base downmix signal and object base parameter information including information extracted from the N object audio signals. At this time, the information extracted from each object audio signal is based on the value of the energy difference, the correlation value, and the like.

ビットストリーム生成部120は、オブジェクトエンコーダ110で生成したオブジェクトベースダウンミックス信号とパラメータ情報とを結合したビットストリームを生成する。ここで、ビットストリーム生成部120で生成したビットストリームには、復号化装置のデフォルト設定のためにデフォルトミキシングパラメータを含めることができ、デフォルトミキシングパラメータには、3D効果具現時に適用されるHRTFのような3D情報の検索に使われるインデックスデータを含めることができる。   The bit stream generation unit 120 generates a bit stream obtained by combining the object base downmix signal generated by the object encoder 110 and the parameter information. Here, the bitstream generated by the bitstream generation unit 120 may include a default mixing parameter for the default setting of the decoding device, and the default mixing parameter may be an HRTF applied when the 3D effect is implemented. Index data used for searching 3D information can be included.

図2は、本発明の第1実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例によるオーディオ信号復号化装置は、一般的なオブジェクトベース符号化方法にHRTFベース3Dバイノーラル定位(binaural localisation)概念を加えたものである。HRTFは、任意の位置を持つ音源から出る音波と耳の鼓膜に到達する音波間の伝達関数を意味し、前記音源の方位と高度によってその値が異なる。指向性のない信号をHRTFでフィルタリングすると、人にとってはあたかも特定方向から音が聞こえるかのよう感じられる。   FIG. 2 is a block diagram showing an audio signal decoding apparatus according to the first embodiment of the present invention. The audio signal decoding apparatus according to the present embodiment is obtained by adding an HRTF-based 3D binaural localization concept to a general object-based encoding method. HRTF means a transfer function between a sound wave emitted from a sound source having an arbitrary position and a sound wave reaching the ear tympanic membrane, and its value varies depending on the direction and altitude of the sound source. When a signal with no directivity is filtered by HRTF, it feels as if a sound can be heard from a specific direction.

図2を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ130、オブジェクトデコーダ140、レンダラー150、及び3D情報データベース160を含む。   Referring to FIG. 2, the audio signal decoding apparatus according to the present embodiment includes a demultiplexer 130, an object decoder 140, a renderer 150, and a 3D information database 160.

デマルチプレクサ130は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報を抽出する。オブジェクトデコーダ140は、ダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。3D情報データベース160は、HRTFなどのような3D情報を保存するデータベースであり、入力インデックスデータに対応する3D情報を検索して出力する。そして、レンダラー150は、オブジェクトデコーダ140によって生成されたオブジェクトオーディオ信号と、3D情報データベース160から出力された3D情報とを用いて、3D信号を生成する。   The demultiplexer 130 extracts the downmix signal and the object base parameter information from the input bitstream. The object decoder 140 generates an object audio signal using the downmix signal and the object base parameter information. The 3D information database 160 is a database for storing 3D information such as HRTF, and searches for and outputs 3D information corresponding to input index data. Then, the renderer 150 generates a 3D signal using the object audio signal generated by the object decoder 140 and the 3D information output from the 3D information database 160.

図3は、本発明の第1実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図2及び図3を参照すると、オーディオ信号復号化装置は、符号化装置などから伝達されるビットストリームを受信すると(S170)、デマルチプレクサ130が、ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S172)。オブジェクトデコーダ140は、デマルチプレクサ130で抽出されたダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する(S174)。   FIG. 3 is a flowchart for explaining an operation method of the audio signal decoding apparatus according to the first embodiment of the present invention. 2 and 3, when the audio signal decoding apparatus receives a bit stream transmitted from the encoding apparatus or the like (S170), the demultiplexer 130 receives a downmix signal, object-based parameter information, and the like from the bit stream. Is extracted (S172). The object decoder 140 generates an object audio signal using the downmix signal extracted by the demultiplexer 130 and the object base parameter information (S174).

レンダラー150は、オブジェクトオーディオ信号の位置を指定するのに必要な制御データに含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出す(S176)。続いて、レンダラー150は、オブジェクトデコーダ110から出力されるオブジェクトオーディオ信号と3D情報データベース160から引き出した3D情報とを用いて3Dレンダリングを行うことによって、3D効果を奏する3Dベースの信号を生成する(S178)。   The renderer 150 extracts 3D information from the 3D information database 160 using the index data included in the control data necessary for designating the position of the object audio signal (S176). Subsequently, the renderer 150 performs 3D rendering using the object audio signal output from the object decoder 110 and the 3D information extracted from the 3D information database 160, thereby generating a 3D-based signal that exhibits a 3D effect ( S178).

レンダラー150によって生成された3D信号は、3以上の指向性を持つ2チャンネルの信号とすることができ、ヘッドホンのような2チャンネルスピーカーを通じて3次元立体音響として再生できる。すなわち、レンダラー150によって生成された3D信号を2チャンネルのスピーカーを通じて再生すると、3Dダウンミックス信号は3チャンネル以上の音源から再生されるかのようにユーザーが感じることができる。音源の方向は、両耳に入ってくる音の強度差、二つの音の間の時間差、二つの音の位相差のうち少なくとも一つによって決定されるので、レンダラー150は、人間が聴覚で音源の3次元上の位置を把握するメカニズムを用いて3D信号を生成できる。   The 3D signal generated by the renderer 150 can be a two-channel signal having three or more directivities, and can be reproduced as a three-dimensional stereo sound through a two-channel speaker such as a headphone. That is, when the 3D signal generated by the renderer 150 is reproduced through a two-channel speaker, the user can feel as if the 3D downmix signal is reproduced from a sound source of three or more channels. The direction of the sound source is determined by at least one of the intensity difference between the sounds coming into both ears, the time difference between the two sounds, and the phase difference between the two sounds. A 3D signal can be generated by using a mechanism for grasping the position in the three dimensions.

オーディオ信号符号化装置は、デフォルト設定のためにデフォルトミキシングパラメータ情報に3D情報引出しに必要なインデックスデータを含むことができる。この場合、レンダラー150は、デフォルトミキシングパラメータ情報に含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出すことができる。   The audio signal encoding apparatus may include index data necessary for 3D information extraction in default mixing parameter information for default setting. In this case, the renderer 150 can extract 3D information from the 3D information database 160 using the index data included in the default mixing parameter information.

オーディオ信号符号化装置は、オブジェクト信号に対して3D効果具現時に適用されるHRTFのような3D情報の検索に必要なインデックスデータを制御データに含むことができる。すなわち、本実施例によるオーディオ信号の符号化装置に使われる制御データに含まれるミキシングパラメータは、レベル情報の外に、3D情報の検索のためのインデックスデータをさらに含むことができる。そして、制御データに含まれるミキシングパラメータには、レベル情報とインデックスデータの外に、チャンネル間の時間差情報のような時間情報、位置情報、及びレベル情報と時間情報との組合せとすることができる。   The audio signal encoding apparatus can include, in the control data, index data necessary for searching 3D information such as HRTF applied to the object signal when the 3D effect is implemented. That is, the mixing parameter included in the control data used in the audio signal encoding apparatus according to the present embodiment may further include index data for searching for 3D information in addition to the level information. In addition to the level information and the index data, the mixing parameter included in the control data can be a combination of time information such as time difference information between channels, position information, and level information and time information.

複数のオブジェクトオーディオ信号及び複数のオブジェクトオーディオ信号の一つ以上に加えることを必要とする3D効果が存在する場合、所定のインデックス情報に対応する3D情報が、検索され、3D効果を加えるオブジェクトオーディオ信号のターゲット位置を特定する3D情報を格納する3D情報データベース160から引き出される。レンダラー150は、引き出された3D情報を用いて3Dレンダリング処理を行い、3D効果を奏することができる。全てのオブジェクト信号に関する3D情報を、ミキシングパラメータ情報として使用することができる。3D情報を少数のオブジェクト信号のみに適用する場合、少数のオブジェクト信号以外のオブジェクト信号に関するレベル情報及び時間情報を、ミキシングパラメータ情報として使用することができる。   When there is a 3D effect that needs to be added to one or more of the plurality of object audio signals and the plurality of object audio signals, 3D information corresponding to the predetermined index information is searched, and the object audio signal to which the 3D effect is added Is extracted from the 3D information database 160 that stores 3D information for specifying the target position of the target. The renderer 150 can perform a 3D rendering process using the extracted 3D information and achieve a 3D effect. 3D information about all object signals can be used as mixing parameter information. When 3D information is applied only to a small number of object signals, level information and time information related to object signals other than the small number of object signals can be used as mixing parameter information.

図4は、本発明の第2実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例では、オブジェクトデコーダの代わりにマルチチャンネルデコーダ270を使用する。   FIG. 4 is a block diagram showing an audio signal decoding apparatus according to the second embodiment of the present invention. In this embodiment, a multi-channel decoder 270 is used instead of the object decoder.

図4を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ230、トランスコーダ240、レンダラー250、3D情報データベース260、及びマルチチャンネルデコーダ270を含む。   Referring to FIG. 4, the audio signal decoding apparatus according to the present embodiment includes a demultiplexer 230, a transcoder 240, a renderer 250, a 3D information database 260, and a multichannel decoder 270.

デマルチプレクサ230は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する。レンダラー250は、制御データに含まれたインデックスデータに対応する3D情報を用いて、各オブジェクト信号に対して3D位置を指定する。トランスコーダ230は、オブジェクトベースパラメータ情報と、レンダラー240によって3D情報が適用された各オブジェクトオーディオ信号に対する3D位置情報とを合成し、チャンネルベースパラメータ情報を生成する。マルチチャンネルデコーダ270は、ダウンミックス信号とチャンネルベースパラメータ情報とを用いて、3D信号を生成する。   The demultiplexer 230 extracts the downmix signal and the object base parameter information from the input bitstream. The renderer 250 designates a 3D position for each object signal using 3D information corresponding to the index data included in the control data. The transcoder 230 synthesizes the object-based parameter information and the 3D position information for each object audio signal to which the 3D information is applied by the renderer 240, and generates channel-based parameter information. The multi-channel decoder 270 generates a 3D signal using the downmix signal and the channel base parameter information.

図5は、本発明の第2実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図4及び図5を参照すると、オーディオ信号復号化装置がビットストリームを受信すると(S280)、デマルチプレクサ230は、受信したビットストリームからオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S282)。   FIG. 5 is a flowchart for explaining an operation method of the audio signal decoding apparatus according to the second embodiment of the present invention. 4 and 5, when the audio signal decoding apparatus receives the bit stream (S280), the demultiplexer 230 extracts the object base downmix signal and the object base parameter information from the received bit stream (S282). ).

レンダラー250は、オブジェクトオーディオ信号の位置を指定するのに使用する制御データに含まれたインデックスデータを抽出し、抽出したインデックスデータを用いて3D情報データベース260から3D情報を引き出す(S284)。一次的にデフォルトミキシングパラメータにより指定されたオブジェクトオーディオ信号の位置は、ミキシング制御データを用いてオブジェクトオーディオ信号の所望の位置に対応する3D情報を指定することによって変更することができる。   The renderer 250 extracts index data included in the control data used to specify the position of the object audio signal, and extracts 3D information from the 3D information database 260 using the extracted index data (S284). The position of the object audio signal temporarily specified by the default mixing parameter can be changed by specifying 3D information corresponding to a desired position of the object audio signal using the mixing control data.

トランスコーダ230は、オーディオ信号符号化装置によって転送されたN個のオブジェクト信号に関するオブジェクトベースパラメータ情報と、レンダラー250によりHRTFのような3D情報を用いて得られた各オブジェクト信号に関する3D位置情報とを合成し、M個チャンネルに対するチャンネルベースパラメータ情報を生成する(S286)。   The transcoder 230 receives object base parameter information related to N object signals transferred by the audio signal encoding device, and 3D position information related to each object signal obtained by the renderer 250 using 3D information such as HRTF. Then, the channel base parameter information for the M channels is generated (S286).

マルチチャンネルデコーダ270は、デマルチプレクサ230から供給されるダウンミックス信号とトランスコーダ230から供給されるチャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、チャンネルベースパラメータ情報に含まれた3D情報を用いて3Dレンダリングを行い、3Dベースのマルチチャンネル信号を生成する(S290)。   The multi-channel decoder 270 generates an audio signal using the downmix signal supplied from the demultiplexer 230 and the channel base parameter information supplied from the transcoder 230, and uses the 3D information included in the channel base parameter information. 3D rendering is performed to generate a 3D-based multi-channel signal (S290).

図6は、本発明の第3実施例によるオーディオ信号復号化装置を示すブロック図である。図6を参照すると、本実施例によるオーディオ信号の復号化装置は、トランスコーダ440がマルチチャンネルデコーダ470にチャンネルベースパラメータ情報及び3D情報を個別に転送するという点が、前述した実施例と異なる。すなわち、第2実施例によるトランスコーダのように、3D情報を含むチャンネルベースパラメータ情報を転送するのではなく、本実施例ではトランスコーダ440が、N個のオブジェクト信号に対するオブジェクトベースパラメータ情報を用いることによって得られたM個チャンネルに対するチャンネルベースパラメータ情報をマルチチャンネルデコーダ470に転送する。   FIG. 6 is a block diagram showing an audio signal decoding apparatus according to the third embodiment of the present invention. Referring to FIG. 6, the audio signal decoding apparatus according to the present embodiment is different from the above-described embodiment in that the transcoder 440 individually transfers the channel base parameter information and the 3D information to the multi-channel decoder 470. That is, instead of transferring channel-based parameter information including 3D information as in the transcoder according to the second embodiment, the transcoder 440 uses object-based parameter information for N object signals in this embodiment. The channel base parameter information for the M channels obtained by the above is transferred to the multi-channel decoder 470.

図7に示すように、チャンネルベースパラメータ情報と3D情報は、それ自体のフレームインデックスを含む。したがって、マルチチャンネルデコーダ470は、チャンネルベースパラメータ情報と3D情報のフレームインデックスを用いてチャンネルベースパラメータ情報と3D情報との同期をとることによって、ビットストリームの特定フレームに3D情報を適用することができる。例えば、図7を参照すると、インデックス2に対応する3D情報を、インデックス2を持つフレーム2の始点に適用される。   As shown in FIG. 7, channel-based parameter information and 3D information includes its own frame index. Therefore, the multi-channel decoder 470 can apply the 3D information to a specific frame of the bitstream by synchronizing the channel base parameter information and the 3D information using the channel index of the channel base parameter information and the 3D information. . For example, referring to FIG. 7, 3D information corresponding to index 2 is applied to the start point of frame 2 having index 2.

3D情報が時間の経過につれて更新される場合でも、チャンネルベースパラメータ情報において3D情報をどの位置に適用する必要があるかを3D情報のフレームインデックスを参照することによって決定することができる。すなわち、マルチチャンネルデコーダ470がチャンネルベースパラメータ情報と3D情報とを一時的に同期をとるために、トランスコーダ440は、チャンネルベースパラメータ情報と3D情報にフレームインデックス情報を挿入することができる。   Even when the 3D information is updated over time, it is possible to determine to which position the 3D information should be applied in the channel-based parameter information by referring to the frame index of the 3D information. That is, since the multi-channel decoder 470 temporarily synchronizes channel base parameter information and 3D information, the transcoder 440 can insert frame index information into the channel base parameter information and 3D information.

図8は、本発明の第4実施例によるオーディオ信号復号化装置を示すブロック図である。図8を参照すると、本実施例によるオーディオ信号復号化装置は、プリプロセッサ543とエフェクトプロセッサ580とをさらに含み、レンダラー550内に3D情報データベース560が備えられるという点が、前述した実施例と異なる。   FIG. 8 is a block diagram showing an audio signal decoding apparatus according to the fourth embodiment of the present invention. Referring to FIG. 8, the audio signal decoding apparatus according to the present embodiment further includes a preprocessor 543 and an effects processor 580, and is different from the above-described embodiment in that a 3D information database 560 is provided in the renderer 550.

すなわち、デマルチプレクサ530、トランスコーダ547、レンダラー560、3D情報データベース560、及びマルチチャンネルデコーダ570の機能及び構成は、図6に示す実施例におけると同様である。図8を参照すると、エフェクトプロセッサ580がダウンミックス信号に所定の効果を加えることができる。プリプロセッサ543は、例えばステレオダウンミックス信号に前処理過程を行うことができ、その結果、ステレオダウンミックス信号の位置を調整することができる。レンダラー550内に3D情報データベース560を含むことができる。   That is, the functions and configurations of the demultiplexer 530, transcoder 547, renderer 560, 3D information database 560, and multi-channel decoder 570 are the same as those in the embodiment shown in FIG. Referring to FIG. 8, the effects processor 580 can add a predetermined effect to the downmix signal. The preprocessor 543 can perform a preprocessing process on, for example, a stereo downmix signal, and as a result, can adjust the position of the stereo downmix signal. A 3D information database 560 can be included in the renderer 550.

図9は、本発明の第5実施例によるオーディオ信号復号化装置を示すブロック図である。図9を参照すると、本実施例によるオーディオ信号復号化装置は、3D信号を生成する部分680がマルチチャンネルデコーダ670とメモリー675とから構成されるという点が、前述した実施例と異なる。この場合、マルチチャンネルデコーダ670は、マルチチャンネルデコーダ670の使用されていないメモリーに保存された3D情報をメモリー675に複写し、メモリー675に複写された3D情報を用いて3Dレンダリングを行う。したがって、トランスコーダ647から出力される3D情報が、メモリー675に保存された3D情報を直接更新するように構成すると、マルチチャネルデコーダ670の構成変更なしで所望の3D情報を用いて3Dベースの信号を生成することができる。   FIG. 9 is a block diagram showing an audio signal decoding apparatus according to a fifth embodiment of the present invention. Referring to FIG. 9, the audio signal decoding apparatus according to the present embodiment is different from the above-described embodiment in that a portion 680 for generating a 3D signal includes a multi-channel decoder 670 and a memory 675. In this case, the multi-channel decoder 670 copies the 3D information stored in the unused memory of the multi-channel decoder 670 to the memory 675, and performs 3D rendering using the 3D information copied to the memory 675. Accordingly, when the 3D information output from the transcoder 647 is configured to directly update the 3D information stored in the memory 675, the 3D-based signal can be obtained using the desired 3D information without changing the configuration of the multi-channel decoder 670. Can be generated.

一方、本発明は、コンピュータが読取りできる記録媒体にコンピュータが読取りできるコードとして具現することが可能である。コンピュータが読取りできる記録媒体は、コンピュータにより読み取られうるデータが保存される全ての種類の記録装置を含む。コンピュータが読取りできる記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フレキシブルディスク、光データ記憶装置などがあり、また、インターネットを介した転送などのような搬送波の形態で具現されるものも含む。また、コンピュータが読取りできる記録媒体を、ネットワークで連結されたシステムに分散し、分散方式でコンピュータが読取りできるコードが保存し、実行することができる。本発明を実現するのに必要な機能プログラム、コード及びコードセグメントを、当業者によって容易に構成することができる。   On the other hand, the present invention can be embodied as a computer readable code on a computer readable recording medium. Computer-readable recording media include all types of recording devices that store data that can be read by a computer. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, flexible disk, optical data storage device, etc., and are embodied in the form of a carrier wave such as transfer via the Internet. Also included. Further, a computer-readable recording medium can be distributed to systems connected via a network, and a computer-readable code can be stored and executed in a distributed manner. Functional programs, codes and code segments necessary for realizing the present invention can be easily configured by those skilled in the art.

また、以上では本発明を好適な実施例に挙げて説明してきたが、本発明は、上記した特定の実施例に限定されず、特許請求の範囲で請求する本発明の要旨を逸脱しない限度内で、当該技術分野における通常の知識を持つ者によって様々な変形実施が可能であることは勿論であり、それらの変形実施も本発明の技術的思想に含まれるものとして理解されるべきである。   Although the present invention has been described with reference to the preferred embodiments, the present invention is not limited to the specific embodiments described above, and is within the limits that do not depart from the gist of the present invention claimed in the claims. Therefore, it should be understood that various modifications can be made by those having ordinary knowledge in the technical field, and these modifications are also included in the technical idea of the present invention.

本発明は、オブジェクトベースのオーディオ信号の復号化過程などに適用され、オブジェクトオーディオ信号別に音像を定位し、より精巧な現実感を提供することができる。   The present invention is applied to an object-based audio signal decoding process and the like, and can localize a sound image for each object audio signal to provide a more sophisticated sense of reality.

一般的なオブジェクトベースのオーディオ信号符号化装置を示すブロック図である。1 is a block diagram showing a general object-based audio signal encoding apparatus. FIG. 本発明の第1実施例によるオーディオ信号復号化装置を示すブロック図である。1 is a block diagram showing an audio signal decoding apparatus according to a first embodiment of the present invention. 本発明の第1実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。5 is a flowchart for explaining an operation method of the audio signal decoding apparatus according to the first embodiment of the present invention; 本発明の第2実施例によるオーディオ信号復号化装置を示すブロック図である。It is a block diagram which shows the audio signal decoding apparatus by 2nd Example of this invention. 本発明の第2実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。6 is a flowchart illustrating an operation method of an audio signal decoding apparatus according to a second embodiment of the present invention. 本発明の第3実施例によるオーディオ信号復号化装置を示すブロック図である。It is a block diagram which shows the audio signal decoding apparatus by 3rd Example of this invention. 図6に示すオーディオ信号復号化装置によりフレームに3D情報を適用する例を示す図である。It is a figure which shows the example which applies 3D information to a flame | frame with the audio signal decoding apparatus shown in FIG. 本発明の第4実施例によるオーディオ信号復号化装置を示すブロック図である。It is a block diagram which shows the audio signal decoding apparatus by 4th Example of this invention. 本発明の第5実施例によるオーディオ信号復号化装置を示すブロック図である。It is a block diagram which shows the audio signal decoding apparatus by 5th Example of this invention.

Claims (35)

入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、
前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、
前記オブジェクトオーディオ信号に3D情報を用いて、3D効果の適用されたオブジェクトオーディオ信号を生成する段階と、
を含むことを特徴とするオーディオ信号復号化方法。
Extracting a downmix signal and object-based parameter information from the input audio signal;
Generating an object audio signal using the downmix signal and the object-based parameter information;
Generating 3D effect applied object audio signal using 3D information for the object audio signal;
An audio signal decoding method comprising:
前記3D情報は、頭部伝達関数(HRTF)情報であることを特徴とする、請求項1に記載のオーディオ信号復号化方法。   The audio signal decoding method according to claim 1, wherein the 3D information is head related transfer function (HRTF) information. 前記3D情報がデータベース化して保存される段階をさらに含むことを特徴とする、請求項1に記載のオーディオ信号復号化方法。   The method of claim 1, further comprising a step of storing the 3D information in a database. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれたインデックスデータに対応する情報であることを特徴とする、請求項1に記載のオーディオ信号復号化方法。   The audio signal decoding method according to claim 1, wherein the 3D information is information corresponding to index data included in control data used for rendering the object audio signal. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項4に記載のオーディオ信号復号化方法。   5. The control data according to claim 4, wherein the control data includes at least one of inter-channel level information, inter-channel time information, position information, and information obtained by combining the level information and the time information. Audio signal decoding method. 前記制御データに基づいて前記オブジェクトオーディオ信号をレンダリングする段階をさらに含むことを特徴とする、請求項4に記載のオーディオ信号復号化方法。   The method of claim 4, further comprising rendering the object audio signal based on the control data. 前記インデックスデータは、前記オブジェクトベースパラメータ情報に含まれたデフォルトミキシングパラメータに含まれることを特徴とする、請求項1に記載のオーディオ信号復号化方法。   2. The audio signal decoding method according to claim 1, wherein the index data is included in a default mixing parameter included in the object base parameter information. 入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、
前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、
前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、
を含むことを特徴とするオーディオ信号復号化装置。
A demultiplexer that extracts an object-based downmix signal and object-based parameter information from an input audio signal;
An object decoder that generates an object audio signal using the object-based downmix signal and the object-based parameter information;
A renderer for generating an object audio signal to which a 3D effect is applied using 3D information for the object audio signal;
An audio signal decoding apparatus comprising:
前記3D情報がデータベース化して保存される3D情報データベースをさらに含むことを特徴とする、請求項8に記載のオーディオ信号の復号化装置。   9. The audio signal decoding apparatus according to claim 8, further comprising a 3D information database in which the 3D information is stored as a database. 前記3D情報は、頭部伝達関数(HRTF)情報であることを特徴とする、請求項8に記載のオーディオ信号復号化装置。   The audio signal decoding apparatus according to claim 8, wherein the 3D information is head related transfer function (HRTF) information. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれたインデックスデータに対応する情報であることを特徴とする、請求項8に記載のオーディオ信号復号化装置。   The audio signal decoding apparatus according to claim 8, wherein the 3D information is information corresponding to index data included in control data used for rendering the object audio signal. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項11に記載のオーディオ信号復号化装置。   12. The control data according to claim 11, wherein the control data includes at least one of inter-channel level information, inter-channel time information, position information, and information obtained by combining the level information and the time information. Audio signal decoding apparatus. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、
前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、
を含むことを特徴とするオーディオ信号復号化方法。
Extracting a downmix signal and object-based parameter information from the input audio signal;
Converting the object-based parameter information to generate channel-based parameter information;
Generating an audio signal using the downmix signal and the channel base parameter information, and generating an audio signal to which a 3D effect is applied using 3D information for the audio signal;
An audio signal decoding method comprising:
前記3D情報がデータベース化して保存される段階をさらに含むことを特徴とする、請求項13に記載のオーディオ信号の復号化方法。   The method of claim 13, further comprising storing the 3D information in a database. 前記3D情報は、HRTF情報であることを特徴とする、請求項13に記載のオーディオ信号復号化方法。   The audio signal decoding method according to claim 13, wherein the 3D information is HRTF information. 前記3D情報は、前記オブジェクトオーディオ信号のレンダリングに用いられるミキシング制御データに含まれることを特徴とする、請求項13に記載のオーディオ信号復号化方法。   14. The audio signal decoding method according to claim 13, wherein the 3D information is included in mixing control data used for rendering the object audio signal. 前記ミキシング制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項16に記載のオーディオ信号復号化方法。   17. The mixing control data according to claim 16, wherein the mixing control data includes at least one of inter-channel level information, inter-channel time information, position information, and information obtained by combining the level information and the time information. Audio signal decoding method. 前記制御データに基づいて前記オブジェクトオーディオ信号をレンダリングする段階をさらに含むことを特徴とする、請求項16に記載のオーディオ信号復号化方法。   The method of claim 16, further comprising rendering the object audio signal based on the control data. 前記ダウンミックス信号に予め決定された効果を加える段階をさらに含むことを特徴とする、請求項13に記載のオーディオ信号復号化方法。   14. The audio signal decoding method according to claim 13, further comprising adding a predetermined effect to the downmix signal. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、
インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
前記オブジェクトベースパラメータ情報と前記3D情報とを用いてチャンネルベースパラメータ情報を生成するトランスコーダと、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベースパラメータ情報に含まれた3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
を含むことを特徴とするオーディオ信号復号化装置。
A demultiplexer that extracts a downmix signal and object-based parameter information from the input audio signal;
A renderer that extracts 3D information using index data and outputs the 3D information;
A transcoder that generates channel-based parameter information using the object-based parameter information and the 3D information;
An audio signal is generated using the downmix signal and the channel base parameter information, and an audio signal in which a 3D effect is applied to the audio signal using 3D information included in the channel base parameter information is generated. A channel decoder;
An audio signal decoding apparatus comprising:
前記インデックスデータに対応する3D情報がデータベース化して保存される3D情報データベースをさらに含むことを特徴とする、請求項20に記載のオーディオ信号復号化装置。   The audio signal decoding apparatus according to claim 20, further comprising a 3D information database in which 3D information corresponding to the index data is stored as a database. 前記3D情報データベースは、前記レンダラーに備えられることを特徴とする、請求項20に記載のオーディオ信号復号化装置。   The audio signal decoding apparatus according to claim 20, wherein the 3D information database is provided in the renderer. 前記ダウンミックス信号に予め決定された効果を加えるエフェクトプロセッサをさらに含むことを特徴とする、請求項20に記載のオーディオ信号復号化装置。   21. The audio signal decoding apparatus according to claim 20, further comprising an effect processor for adding a predetermined effect to the downmix signal. 前記インデックスデータは、前記オブジェクトオーディオ信号のレンダリングに用いられる制御データに含まれることを特徴とする、請求項20に記載のオーディオ信号復号化装置。   The audio signal decoding apparatus according to claim 20, wherein the index data is included in control data used for rendering the object audio signal. 前記制御データは、チャンネル間レベル情報、チャンネル間時間情報、位置情報、及び前記レベル情報と前記時間情報とを組み合わせた情報のうち、少なくとも一つを含むことを特徴とする、請求項24に記載のオーディオ信号復号化装置。   25. The control data according to claim 24, wherein the control data includes at least one of inter-channel level information, inter-channel time information, position information, and information obtained by combining the level information and the time information. Audio signal decoding apparatus. 入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報を抽出するデマルチプレクサと、
入力インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
を含むことを特徴とするオーディオ信号復号化装置。
A demultiplexer that extracts a downmix signal and object-based parameter information from the input audio signal;
A renderer that extracts 3D information using input index data and outputs the 3D information;
A transcoder that converts the object-based parameter information into channel-based parameter information, converts the 3D information into channel-based 3D information, and outputs these respectively;
A multi-channel decoder that generates an audio signal using the downmix signal and the channel base parameter information, and generates an audio signal in which a 3D effect is applied to the audio signal using the channel base 3D information;
An audio signal decoding apparatus comprising:
前記マルチチャンネルデコーダは、前記3D効果を奏するオーディオ信号の生成に常用される3D情報が保存されるメモリーを含むことを特徴とする、請求項26に記載のオーディオ信号復号化装置。   27. The audio signal decoding apparatus according to claim 26, wherein the multi-channel decoder includes a memory that stores 3D information that is commonly used to generate an audio signal that exhibits the 3D effect. 前記メモリーに保存された3D情報は、前記トランスコーダから出力される前記チャンネルベース3D情報によって更新されることを特徴とする、請求項27に記載のオーディオ信号復号化装置。   28. The audio signal decoding device according to claim 27, wherein the 3D information stored in the memory is updated by the channel-based 3D information output from the transcoder. 前記インデックスデータは、前記オブジェクトオーディオ信号のレンダリングに用いられるミキシング制御データに含まれることを特徴とする、請求項26に記載のオーディオ信号復号化装置。   27. The audio signal decoding apparatus according to claim 26, wherein the index data is included in mixing control data used for rendering the object audio signal. 前記チャンネルベースパラメータ情報と前記チャンネルベース3D情報は、前記チャンネルベースパラメータ情報が前記チャンネルベース3D情報に同期化をとるためのインデックス情報を含むことを特徴とする、請求項26に記載のオーディオ信号復号化装置。   27. The audio signal decoding according to claim 26, wherein the channel base parameter information and the channel base 3D information include index information for synchronizing the channel base parameter information with the channel base 3D information. Device. オブジェクトオーディオ信号をダウンミックスしたダウンミックス信号を生成する段階と、
前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、
前記オブジェクトオーディオ信号に対する3D効果の具現時に用いられる3D情報の検索のためのインデックスデータを前記オブジェクトベースパラメータ情報に挿入する段階と、
含むことを特徴とするオーディオ信号符号化方法。
Generating a downmix signal obtained by downmixing the object audio signal;
Extracting information about the object audio signal and generating object-based parameter information;
Inserting index data for searching for 3D information used when realizing a 3D effect on the object audio signal into the object base parameter information;
An audio signal encoding method comprising:
前記オブジェクトベースダウンミックス信号と、前記インデックスデータの挿入されたオブジェクトベースパラメータ情報とを結合することによって、ビットストリームを生成する段階をさらに含むことを特徴とする、請求項31に記載のオーディオ信号符号化方法。   The audio signal code of claim 31, further comprising generating a bitstream by combining the object-based downmix signal and the object-based parameter information into which the index data is inserted. Method. 前記3D情報は、HRTF情報であることを特徴とする、請求項31に記載のオーディオ信号符号化方法。   The audio signal encoding method of claim 31, wherein the 3D information is HRTF information. 請求項1〜7のいずれか1項による方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読取り可能な記録媒体。   A computer-readable recording medium in which a program for causing a computer to execute the method according to claim 1 is recorded. 請求項1〜7のいずれか1項による方法をコンピュータで実行させるためのプログラムを記録した、コンピュータで読取り可能な記録媒体。   A computer-readable recording medium in which a program for causing a computer to execute the method according to claim 1 is recorded.
JP2008554147A 2006-02-09 2007-02-09 Method and apparatus for encoding and decoding object-based audio signal Pending JP2009526467A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77147106P 2006-02-09 2006-02-09
US77333706P 2006-02-15 2006-02-15
US88071407P 2007-01-17 2007-01-17
US88094207P 2007-01-18 2007-01-18
PCT/KR2007/000730 WO2007091870A1 (en) 2006-02-09 2007-02-09 Method for encoding and decoding object-based audio signal and apparatus thereof

Publications (1)

Publication Number Publication Date
JP2009526467A true JP2009526467A (en) 2009-07-16

Family

ID=39731308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008554147A Pending JP2009526467A (en) 2006-02-09 2007-02-09 Method and apparatus for encoding and decoding object-based audio signal

Country Status (7)

Country Link
EP (1) EP1984916A4 (en)
JP (1) JP2009526467A (en)
AU (1) AU2007212873B2 (en)
BR (1) BRPI0708047A2 (en)
CA (1) CA2646278A1 (en)
TW (1) TWI326448B (en)
WO (1) WO2007091870A1 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509590A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2011509589A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Processing method and apparatus for audio signal
JP2011523247A (en) * 2008-04-16 2011-08-04 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2013054395A (en) * 2006-09-29 2013-03-21 Korea Electronics Telecommun Encoding and decoding device of multi-object audio signal constituted of various channels, and method therefor
US8634577B2 (en) 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
WO2014171706A1 (en) * 2013-04-15 2014-10-23 인텔렉추얼디스커버리 주식회사 Audio signal processing method using generating virtual object
WO2014192602A1 (en) * 2013-05-31 2014-12-04 ソニー株式会社 Encoding device and method, decoding device and method, and program
US9257127B2 (en) 2006-12-27 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
JP2016507173A (en) * 2013-01-15 2016-03-07 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Binaural audio processing
JP2018201224A (en) * 2013-10-25 2018-12-20 サムスン エレクトロニクス カンパニー リミテッド Audio signal rendering method and apparatus

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2874451C (en) 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
BRPI0715312B1 (en) * 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. APPARATUS AND METHOD FOR TRANSFORMING MULTICHANNEL PARAMETERS
EP2111617B1 (en) 2007-02-14 2013-09-04 LG Electronics Inc. Audio decoding method and corresponding apparatus
WO2009054665A1 (en) * 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101461685B1 (en) * 2008-03-31 2014-11-19 한국전자통신연구원 Method and apparatus for generating side information bitstream of multi object audio signal
KR101061129B1 (en) * 2008-04-24 2011-08-31 엘지전자 주식회사 Method of processing audio signal and apparatus thereof
JP5589387B2 (en) * 2008-11-27 2014-09-17 東レ株式会社 Siloxane resin composition and protective film for touch panel using the same
SG11201504368VA (en) 2012-12-04 2015-07-30 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
CN106104679B (en) * 2014-04-02 2019-11-26 杜比国际公司 Utilize the metadata redundancy in immersion audio metadata

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028800A (en) * 1999-06-10 2001-01-30 Samsung Electronics Co Ltd Multi-channel audio reproduction device for loudspeaker reproduction utilizing virtual sound image capable of position adjustment and its method
WO2004036548A1 (en) * 2002-10-14 2004-04-29 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
WO2004051624A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method for describing the composition of audio signals
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream
JP2005352396A (en) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd Sound signal encoding device and sound signal decoding device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693727B (en) * 2006-02-03 2015-06-10 韩国电子通信研究院 Method for control of randering multiobject or multichannel audio signal using spatial cue
CN102768835B (en) 2006-09-29 2014-11-05 韩国电子通信研究院 Apparatus and method for coding and decoding multi-object audio signal with various channel

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028800A (en) * 1999-06-10 2001-01-30 Samsung Electronics Co Ltd Multi-channel audio reproduction device for loudspeaker reproduction utilizing virtual sound image capable of position adjustment and its method
WO2004036548A1 (en) * 2002-10-14 2004-04-29 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
WO2004051624A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method for describing the composition of audio signals
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream
JP2006517356A (en) * 2002-12-02 2006-07-20 トムソン ライセンシング How to describe the structure of an audio signal
JP2005352396A (en) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd Sound signal encoding device and sound signal decoding device

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013054395A (en) * 2006-09-29 2013-03-21 Korea Electronics Telecommun Encoding and decoding device of multi-object audio signal constituted of various channels, and method therefor
US9311919B2 (en) 2006-09-29 2016-04-12 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US9257124B2 (en) 2006-09-29 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
US8670989B2 (en) 2006-09-29 2014-03-11 Electronics And Telecommunications Research Institute Appartus and method for coding and decoding multi-object audio signal with various channel
JP2013077023A (en) * 2006-09-29 2013-04-25 Korea Electronics Telecommun Encoding and decoding device and method for multi-object audio signal configured of various channels
JP2016200824A (en) * 2006-12-27 2016-12-01 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute Transcoding device
US9257127B2 (en) 2006-12-27 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
US8634577B2 (en) 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
JP2011509590A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2011509591A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2011509588A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2011509589A (en) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド Processing method and apparatus for audio signal
JP2011523247A (en) * 2008-04-16 2011-08-04 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
JP2016507173A (en) * 2013-01-15 2016-03-07 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Binaural audio processing
WO2014171706A1 (en) * 2013-04-15 2014-10-23 인텔렉추얼디스커버리 주식회사 Audio signal processing method using generating virtual object
WO2014192602A1 (en) * 2013-05-31 2014-12-04 ソニー株式会社 Encoding device and method, decoding device and method, and program
JPWO2014192602A1 (en) * 2013-05-31 2017-02-23 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
US9805729B2 (en) 2013-05-31 2017-10-31 Sony Corporation Encoding device and method, decoding device and method, and program
JP2018201224A (en) * 2013-10-25 2018-12-20 サムスン エレクトロニクス カンパニー リミテッド Audio signal rendering method and apparatus
US10645513B2 (en) 2013-10-25 2020-05-05 Samsung Electronics Co., Ltd. Stereophonic sound reproduction method and apparatus
US11051119B2 (en) 2013-10-25 2021-06-29 Samsung Electronics Co., Ltd. Stereophonic sound reproduction method and apparatus

Also Published As

Publication number Publication date
EP1984916A1 (en) 2008-10-29
CA2646278A1 (en) 2007-08-16
BRPI0708047A2 (en) 2011-05-17
AU2007212873B2 (en) 2010-02-25
TW200741649A (en) 2007-11-01
TWI326448B (en) 2010-06-21
WO2007091870A1 (en) 2007-08-16
EP1984916A4 (en) 2010-09-29
WO2007091870A8 (en) 2008-09-12
AU2007212873A1 (en) 2007-08-16

Similar Documents

Publication Publication Date Title
JP2009526467A (en) Method and apparatus for encoding and decoding object-based audio signal
KR20080093422A (en) Object-based audio signal encoding and decoding method and apparatus therefor
EP1416769B1 (en) Object-based three-dimensional audio system and method of controlling the same
JP6612753B2 (en) Multiplet-based matrix mixing for high channel count multi-channel audio
EP2205007B1 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
JP7014176B2 (en) Playback device, playback method, and program
BR112020000759A2 (en) apparatus for generating a modified sound field description of a sound field description and metadata in relation to spatial information of the sound field description, method for generating an enhanced sound field description, method for generating a modified sound field description of a description of sound field and metadata in relation to spatial information of the sound field description, computer program, enhanced sound field description
KR20210101316A (en) Apparatus and method for playing a spatially extended sound source or an apparatus and method for generating a bit stream from a spatially extended sound source
US11570569B2 (en) Associated spatial audio playback
CN104054126A (en) Spatial audio rendering and encoding
CN107533843A (en) System and method for capturing, encoding, being distributed and decoding immersion audio
JP2019533404A (en) Binaural audio signal processing method and apparatus
KR20220031058A (en) Discord Audio Visual Capture System
WO2020153027A1 (en) Audio system, audio playback device, server device, audio playback method, and audio playback program
WO2023085186A1 (en) Information processing device, information processing method, and information processing program
KR101534295B1 (en) Method and Apparatus for Providing Multiple Viewer Video and 3D Stereophonic Sound
KR102058228B1 (en) Method for authoring stereoscopic contents and application thereof
KR20070081735A (en) Method and apparatus for encoding / decoding audio signal
RU2407070C2 (en) Method and device for encoding and decoding object-oriented audio signal
KR20190081163A (en) Method for selective providing advertisement using stereoscopic content authoring tool and application thereof
KR102421292B1 (en) System and method for reproducing audio object signal
JP6306958B2 (en) Acoustic signal conversion device, acoustic signal conversion method, and acoustic signal conversion program
KR20190082056A (en) Method for selective providing advertisement using stereoscopic content authoring tool and application thereof
KR20190082055A (en) Method for providing advertisement using stereoscopic content authoring tool and application thereof
KR20190081160A (en) Method for providing advertisement using stereoscopic content authoring tool and application thereof

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110308