JP2009526467A - Method and apparatus for encoding and decoding object-based audio signal - Google Patents
Method and apparatus for encoding and decoding object-based audio signal Download PDFInfo
- Publication number
- JP2009526467A JP2009526467A JP2008554147A JP2008554147A JP2009526467A JP 2009526467 A JP2009526467 A JP 2009526467A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2008554147 A JP2008554147 A JP 2008554147A JP 2009526467 A JP2009526467 A JP 2009526467A
- Authority
- JP
- Japan
- Prior art keywords
- information
- audio signal
- channel
- parameter information
- decoding apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 163
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000000694 effects Effects 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 claims abstract description 18
- 238000009877 rendering Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 5
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
【課題】オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置を提供する。
【解決手段】このオーディオ信号復号化方法は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出し、オブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。そして、インデックスデータに対応して3D情報をオブジェクトオーディオ信号に適用して3D効果の適用されたオブジェクトオーディオ信号を生成する。これにより、オブジェクトオーディオ信号別に音像を定位でき、オブジェクトオーディオ信号の再生の際により精巧な現実感を提供することができる。An object-based audio signal encoding and decoding method and apparatus are provided.
The audio signal decoding method extracts an object base downmix signal and object base parameter information from an input audio signal, and generates an object audio signal using the object base downmix signal and the object base parameter information. To do. Then, 3D information is applied to the object audio signal corresponding to the index data to generate an object audio signal to which the 3D effect is applied. Thereby, a sound image can be localized for each object audio signal, and more elaborate realism can be provided when reproducing the object audio signal.
Description
本発明は、オーディオ信号の符号化及び復号化方法とその装置に関し、より詳細には、オブジェクトオーディオ信号別に音像を所望の空間位置に定位させることができるように符号化及び復号化するオーディオ信号の符号化及び復号化方法とその装置に関する。 The present invention relates to an audio signal encoding and decoding method and apparatus, and more particularly, to an audio signal that is encoded and decoded so that a sound image can be localized at a desired spatial position for each object audio signal. The present invention relates to an encoding and decoding method and an apparatus therefor.
一般に、オブジェクトベースオーディオ符号化方法において、オブジェクトエンコーダは、複数のオブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成し、オブジェクトオーディオ信号から抽出した複数の情報を含むパラメータ情報を生成する。典型的なオブジェクトベースオーディオ復号化方法において、オブジェクトデコーダは、受信したダウンミックス信号をオブジェクトベースパラメータ情報を用いて復号化することによって複数のオブジェクトオーディオ信号を復元し、レンダラーは、復元されたオブジェクト信号の位置を指定するのに必要な制御データに基づいて、オブジェクトオーディオ信号を2チャンネル信号又はマルチチャンネル信号に合成する。 In general, in an object-based audio encoding method, an object encoder generates a downmix signal by downmixing a plurality of object audio signals, and generates parameter information including a plurality of information extracted from the object audio signals. In a typical object-based audio decoding method, the object decoder recovers a plurality of object audio signals by decoding the received downmix signal using object-based parameter information, and the renderer The object audio signal is synthesized into a two-channel signal or a multi-channel signal based on control data necessary for designating the position of the signal.
しかしながら、制御データは単なるレベル間情報であり、レベル情報を用いて単なる音像正位を行うことによって3D効果を具現するのに限界があった。 However, the control data is merely inter-level information, and there is a limit in realizing the 3D effect by performing simple sound image localization using the level information.
したがって、本発明の目的は、オブジェクトオーディオ信号別に音像を所望の空間位置に定位できるようにオーディオ信号を符号化及び復号化するオーディオ信号符号化及び復号化方法とその装置を提供することにある。 Accordingly, an object of the present invention is to provide an audio signal encoding and decoding method and apparatus for encoding and decoding an audio signal so that a sound image can be localized at a desired spatial position for each object audio signal.
上記の目的を達成するための本発明によるオーディオ信号復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、3次元(3D)効果の適用されたオブジェクトオーディオ信号を、前記オブジェクトオーディオ信号に3D情報を用いて生成する段階と、を含む。 In order to achieve the above object, an audio signal decoding method according to the present invention uses a step of extracting a downmix signal and object-based parameter information from an input audio signal, and uses the downmix signal and the object-based parameter information. Generating an object audio signal, and generating an object audio signal to which a three-dimensional (3D) effect is applied using 3D information for the object audio signal.
また、上記の目的を達成するための本発明によるオーディオ信号の復号化方法は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する段階と、前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、を含む。 According to another aspect of the present invention, there is provided a decoding method of an audio signal according to the present invention, the step of extracting a downmix signal and object base parameter information from an input audio signal, and converting the object base parameter information to a channel. Generating base parameter information; generating an audio signal using the downmix signal and the channel base parameter information; and generating an audio signal to which a 3D effect is applied using 3D information for the audio signal. And including.
一方、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、を含む。 Meanwhile, an audio signal decoding apparatus according to the present invention uses a demultiplexer that extracts an object base downmix signal and object base parameter information from an input audio signal, the object base downmix signal, and the object base parameter information. An object decoder for generating an object audio signal; and a renderer for generating an object audio signal to which a 3D effect is applied using 3D information for the object audio signal.
また、本発明によるオーディオ信号復号化装置は、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報とを抽出するデマルチプレクサと、インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、該オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含む。 An audio signal decoding apparatus according to the present invention includes a demultiplexer that extracts a downmix signal and object-based parameter information from an input audio signal, a renderer that extracts 3D information using index data and outputs the 3D information. The object-based parameter information is converted into channel-based parameter information, the 3D information is converted into channel-based 3D information, and each of them is output, and the downmix signal and the channel-based parameter information are used. A multi-channel decoder that generates an audio signal and generates an audio signal to which a 3D effect is applied using the channel-based 3D information for the audio signal.
本発明によれば、入力オーディオ信号からダウンミックス信号とオブジェクトベースパラメータ情報を抽出するデマルチプレクサと、入力インデックスデータを用いて3D情報を引き出すとともに3D情報を出力するレンダラーと、前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、を含むオーディオ信号復号化装置が提供される。 According to the present invention, a demultiplexer that extracts a downmix signal and object-based parameter information from an input audio signal, a renderer that extracts 3D information using input index data and outputs 3D information, and the object-based parameter information Converting into channel-based parameter information, converting the 3D information into channel-based 3D information, generating an audio signal using the transcoder that outputs the information, the downmix signal, and the channel-based parameter information, There is provided an audio signal decoding apparatus including a multi-channel decoder that generates an audio signal to which a 3D effect is applied using the channel-based 3D information in the audio signal.
また、上記目的を達成するための本発明によるオーディオ信号符号化方法は、オブジェクトオーディオ信号をダウンミックスすることによってダウンミックス信号を生成する段階と、前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、前記オブジェクトオーディオ信号に対する3D効果具現時に用いられる3D情報の検索のためのインデックスデータを、前記オブジェクトベースパラメータ情報に挿入する段階と、を含む。 According to another aspect of the present invention, there is provided an audio signal encoding method for generating a downmix signal by downmixing an object audio signal, extracting information about the object audio signal, Generating information, and inserting index data for searching for 3D information used when implementing the 3D effect on the object audio signal into the object base parameter information.
前記目的を達成するために本発明では、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取り可能な記録媒体を提供する。 In order to achieve the above object, the present invention provides a computer-readable recording medium storing a program for causing the computer to execute the method.
以上説明の如く、本発明によれば、オブジェクトベースオーディオ信号の符号化及び復号化の長所を最大限に活用しながら、各オブジェクトオーディオ信号に音像を定位できるので、オブジェクトオーディオ信号の再生時により生き生きとした現実感を提供することが可能になる。また、本発明は、ゲームプレーヤーによりネットワークを通じて操作されるゲームキャラクターの位置情報が頻繁に変化するインタラクティブゲームに有用となり、精巧な現実感を提供することができる。 As described above, according to the present invention, sound images can be localized in each object audio signal while maximizing the advantages of encoding and decoding object-based audio signals, so that the object audio signals can be reproduced more vividly. It becomes possible to provide a sense of reality. In addition, the present invention is useful for an interactive game in which position information of game characters operated by a game player through a network frequently changes, and can provide elaborate reality.
以下、添付の図面を参照しつつ本発明についてより詳細に説明する。 Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.
本発明によるオーディオ信号の符号化及び復号化方法とその装置は、基本的に、オブジェクトベースオーディオ信号の符号化及び復号化過程に適用されるが、必ずしもこれに限定されるわけではなく、本発明による条件を満たす他の信号の処理過程にも適用可能である。また、本発明によるオーディオ信号の符号化及び復号化方法とその装置は、オブジェクトオーディオ信号に頭部伝達関数(HRTF)などの3D情報を適用するもので、これにより、それぞれのオブジェクトオーディオ信号の音像を所望の空間位置に定位させることができる。 The audio signal encoding and decoding method and apparatus according to the present invention are basically applied to an object-based audio signal encoding and decoding process, but the present invention is not limited thereto. The present invention can also be applied to other signal processing processes that satisfy the condition (1). In addition, the audio signal encoding and decoding method and apparatus according to the present invention apply 3D information such as a head related transfer function (HRTF) to an object audio signal, and thereby a sound image of each object audio signal. Can be localized at a desired spatial position.
図1は、一般的なオブジェクトベースオーディオ符号化装置を示すブロック図である。図1を参照すると、オブジェクトベースオーディオ信号符号化装置は、オブジェクトエンコーダ110及びビットストリーム生成部120を含む。
FIG. 1 is a block diagram illustrating a general object-based audio encoding apparatus. Referring to FIG. 1, the object-based audio signal encoding apparatus includes an
オブジェクトエンコーダ110は、N個のオブジェクトオーディオ信号を受信し、オブジェクトベースダウンミックス信号と、N個のオブジェクトオーディオ信号から抽出した情報が含まれるオブジェクトベースパラメータ情報と、を生成する。この時、各オブジェクトオーディオ信号から抽出した情報は、エネルギー差の値及び相関値などに基づくものである。
The
ビットストリーム生成部120は、オブジェクトエンコーダ110で生成したオブジェクトベースダウンミックス信号とパラメータ情報とを結合したビットストリームを生成する。ここで、ビットストリーム生成部120で生成したビットストリームには、復号化装置のデフォルト設定のためにデフォルトミキシングパラメータを含めることができ、デフォルトミキシングパラメータには、3D効果具現時に適用されるHRTFのような3D情報の検索に使われるインデックスデータを含めることができる。
The bit
図2は、本発明の第1実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例によるオーディオ信号復号化装置は、一般的なオブジェクトベース符号化方法にHRTFベース3Dバイノーラル定位(binaural localisation)概念を加えたものである。HRTFは、任意の位置を持つ音源から出る音波と耳の鼓膜に到達する音波間の伝達関数を意味し、前記音源の方位と高度によってその値が異なる。指向性のない信号をHRTFでフィルタリングすると、人にとってはあたかも特定方向から音が聞こえるかのよう感じられる。 FIG. 2 is a block diagram showing an audio signal decoding apparatus according to the first embodiment of the present invention. The audio signal decoding apparatus according to the present embodiment is obtained by adding an HRTF-based 3D binaural localization concept to a general object-based encoding method. HRTF means a transfer function between a sound wave emitted from a sound source having an arbitrary position and a sound wave reaching the ear tympanic membrane, and its value varies depending on the direction and altitude of the sound source. When a signal with no directivity is filtered by HRTF, it feels as if a sound can be heard from a specific direction.
図2を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ130、オブジェクトデコーダ140、レンダラー150、及び3D情報データベース160を含む。
Referring to FIG. 2, the audio signal decoding apparatus according to the present embodiment includes a
デマルチプレクサ130は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報を抽出する。オブジェクトデコーダ140は、ダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する。3D情報データベース160は、HRTFなどのような3D情報を保存するデータベースであり、入力インデックスデータに対応する3D情報を検索して出力する。そして、レンダラー150は、オブジェクトデコーダ140によって生成されたオブジェクトオーディオ信号と、3D情報データベース160から出力された3D情報とを用いて、3D信号を生成する。
The
図3は、本発明の第1実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図2及び図3を参照すると、オーディオ信号復号化装置は、符号化装置などから伝達されるビットストリームを受信すると(S170)、デマルチプレクサ130が、ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S172)。オブジェクトデコーダ140は、デマルチプレクサ130で抽出されたダウンミックス信号とオブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する(S174)。
FIG. 3 is a flowchart for explaining an operation method of the audio signal decoding apparatus according to the first embodiment of the present invention. 2 and 3, when the audio signal decoding apparatus receives a bit stream transmitted from the encoding apparatus or the like (S170), the
レンダラー150は、オブジェクトオーディオ信号の位置を指定するのに必要な制御データに含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出す(S176)。続いて、レンダラー150は、オブジェクトデコーダ110から出力されるオブジェクトオーディオ信号と3D情報データベース160から引き出した3D情報とを用いて3Dレンダリングを行うことによって、3D効果を奏する3Dベースの信号を生成する(S178)。
The
レンダラー150によって生成された3D信号は、3以上の指向性を持つ2チャンネルの信号とすることができ、ヘッドホンのような2チャンネルスピーカーを通じて3次元立体音響として再生できる。すなわち、レンダラー150によって生成された3D信号を2チャンネルのスピーカーを通じて再生すると、3Dダウンミックス信号は3チャンネル以上の音源から再生されるかのようにユーザーが感じることができる。音源の方向は、両耳に入ってくる音の強度差、二つの音の間の時間差、二つの音の位相差のうち少なくとも一つによって決定されるので、レンダラー150は、人間が聴覚で音源の3次元上の位置を把握するメカニズムを用いて3D信号を生成できる。
The 3D signal generated by the
オーディオ信号符号化装置は、デフォルト設定のためにデフォルトミキシングパラメータ情報に3D情報引出しに必要なインデックスデータを含むことができる。この場合、レンダラー150は、デフォルトミキシングパラメータ情報に含まれたインデックスデータを用いて3D情報データベース160から3D情報を引き出すことができる。
The audio signal encoding apparatus may include index data necessary for 3D information extraction in default mixing parameter information for default setting. In this case, the
オーディオ信号符号化装置は、オブジェクト信号に対して3D効果具現時に適用されるHRTFのような3D情報の検索に必要なインデックスデータを制御データに含むことができる。すなわち、本実施例によるオーディオ信号の符号化装置に使われる制御データに含まれるミキシングパラメータは、レベル情報の外に、3D情報の検索のためのインデックスデータをさらに含むことができる。そして、制御データに含まれるミキシングパラメータには、レベル情報とインデックスデータの外に、チャンネル間の時間差情報のような時間情報、位置情報、及びレベル情報と時間情報との組合せとすることができる。 The audio signal encoding apparatus can include, in the control data, index data necessary for searching 3D information such as HRTF applied to the object signal when the 3D effect is implemented. That is, the mixing parameter included in the control data used in the audio signal encoding apparatus according to the present embodiment may further include index data for searching for 3D information in addition to the level information. In addition to the level information and the index data, the mixing parameter included in the control data can be a combination of time information such as time difference information between channels, position information, and level information and time information.
複数のオブジェクトオーディオ信号及び複数のオブジェクトオーディオ信号の一つ以上に加えることを必要とする3D効果が存在する場合、所定のインデックス情報に対応する3D情報が、検索され、3D効果を加えるオブジェクトオーディオ信号のターゲット位置を特定する3D情報を格納する3D情報データベース160から引き出される。レンダラー150は、引き出された3D情報を用いて3Dレンダリング処理を行い、3D効果を奏することができる。全てのオブジェクト信号に関する3D情報を、ミキシングパラメータ情報として使用することができる。3D情報を少数のオブジェクト信号のみに適用する場合、少数のオブジェクト信号以外のオブジェクト信号に関するレベル情報及び時間情報を、ミキシングパラメータ情報として使用することができる。
When there is a 3D effect that needs to be added to one or more of the plurality of object audio signals and the plurality of object audio signals, 3D information corresponding to the predetermined index information is searched, and the object audio signal to which the 3D effect is added Is extracted from the 3D information database 160 that stores 3D information for specifying the target position of the target. The
図4は、本発明の第2実施例によるオーディオ信号復号化装置を示すブロック図である。本実施例では、オブジェクトデコーダの代わりにマルチチャンネルデコーダ270を使用する。
FIG. 4 is a block diagram showing an audio signal decoding apparatus according to the second embodiment of the present invention. In this embodiment, a
図4を参照すると、本実施例によるオーディオ信号復号化装置は、デマルチプレクサ230、トランスコーダ240、レンダラー250、3D情報データベース260、及びマルチチャンネルデコーダ270を含む。
Referring to FIG. 4, the audio signal decoding apparatus according to the present embodiment includes a
デマルチプレクサ230は、入力ビットストリームからダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する。レンダラー250は、制御データに含まれたインデックスデータに対応する3D情報を用いて、各オブジェクト信号に対して3D位置を指定する。トランスコーダ230は、オブジェクトベースパラメータ情報と、レンダラー240によって3D情報が適用された各オブジェクトオーディオ信号に対する3D位置情報とを合成し、チャンネルベースパラメータ情報を生成する。マルチチャンネルデコーダ270は、ダウンミックス信号とチャンネルベースパラメータ情報とを用いて、3D信号を生成する。
The
図5は、本発明の第2実施例によるオーディオ信号復号化装置の動作方法を説明するためのフローチャートである。図4及び図5を参照すると、オーディオ信号復号化装置がビットストリームを受信すると(S280)、デマルチプレクサ230は、受信したビットストリームからオブジェクトベースダウンミックス信号とオブジェクトベースパラメータ情報とを抽出する(S282)。
FIG. 5 is a flowchart for explaining an operation method of the audio signal decoding apparatus according to the second embodiment of the present invention. 4 and 5, when the audio signal decoding apparatus receives the bit stream (S280), the
レンダラー250は、オブジェクトオーディオ信号の位置を指定するのに使用する制御データに含まれたインデックスデータを抽出し、抽出したインデックスデータを用いて3D情報データベース260から3D情報を引き出す(S284)。一次的にデフォルトミキシングパラメータにより指定されたオブジェクトオーディオ信号の位置は、ミキシング制御データを用いてオブジェクトオーディオ信号の所望の位置に対応する3D情報を指定することによって変更することができる。
The
トランスコーダ230は、オーディオ信号符号化装置によって転送されたN個のオブジェクト信号に関するオブジェクトベースパラメータ情報と、レンダラー250によりHRTFのような3D情報を用いて得られた各オブジェクト信号に関する3D位置情報とを合成し、M個チャンネルに対するチャンネルベースパラメータ情報を生成する(S286)。
The
マルチチャンネルデコーダ270は、デマルチプレクサ230から供給されるダウンミックス信号とトランスコーダ230から供給されるチャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、チャンネルベースパラメータ情報に含まれた3D情報を用いて3Dレンダリングを行い、3Dベースのマルチチャンネル信号を生成する(S290)。
The
図6は、本発明の第3実施例によるオーディオ信号復号化装置を示すブロック図である。図6を参照すると、本実施例によるオーディオ信号の復号化装置は、トランスコーダ440がマルチチャンネルデコーダ470にチャンネルベースパラメータ情報及び3D情報を個別に転送するという点が、前述した実施例と異なる。すなわち、第2実施例によるトランスコーダのように、3D情報を含むチャンネルベースパラメータ情報を転送するのではなく、本実施例ではトランスコーダ440が、N個のオブジェクト信号に対するオブジェクトベースパラメータ情報を用いることによって得られたM個チャンネルに対するチャンネルベースパラメータ情報をマルチチャンネルデコーダ470に転送する。
FIG. 6 is a block diagram showing an audio signal decoding apparatus according to the third embodiment of the present invention. Referring to FIG. 6, the audio signal decoding apparatus according to the present embodiment is different from the above-described embodiment in that the
図7に示すように、チャンネルベースパラメータ情報と3D情報は、それ自体のフレームインデックスを含む。したがって、マルチチャンネルデコーダ470は、チャンネルベースパラメータ情報と3D情報のフレームインデックスを用いてチャンネルベースパラメータ情報と3D情報との同期をとることによって、ビットストリームの特定フレームに3D情報を適用することができる。例えば、図7を参照すると、インデックス2に対応する3D情報を、インデックス2を持つフレーム2の始点に適用される。
As shown in FIG. 7, channel-based parameter information and 3D information includes its own frame index. Therefore, the
3D情報が時間の経過につれて更新される場合でも、チャンネルベースパラメータ情報において3D情報をどの位置に適用する必要があるかを3D情報のフレームインデックスを参照することによって決定することができる。すなわち、マルチチャンネルデコーダ470がチャンネルベースパラメータ情報と3D情報とを一時的に同期をとるために、トランスコーダ440は、チャンネルベースパラメータ情報と3D情報にフレームインデックス情報を挿入することができる。
Even when the 3D information is updated over time, it is possible to determine to which position the 3D information should be applied in the channel-based parameter information by referring to the frame index of the 3D information. That is, since the
図8は、本発明の第4実施例によるオーディオ信号復号化装置を示すブロック図である。図8を参照すると、本実施例によるオーディオ信号復号化装置は、プリプロセッサ543とエフェクトプロセッサ580とをさらに含み、レンダラー550内に3D情報データベース560が備えられるという点が、前述した実施例と異なる。
FIG. 8 is a block diagram showing an audio signal decoding apparatus according to the fourth embodiment of the present invention. Referring to FIG. 8, the audio signal decoding apparatus according to the present embodiment further includes a preprocessor 543 and an
すなわち、デマルチプレクサ530、トランスコーダ547、レンダラー560、3D情報データベース560、及びマルチチャンネルデコーダ570の機能及び構成は、図6に示す実施例におけると同様である。図8を参照すると、エフェクトプロセッサ580がダウンミックス信号に所定の効果を加えることができる。プリプロセッサ543は、例えばステレオダウンミックス信号に前処理過程を行うことができ、その結果、ステレオダウンミックス信号の位置を調整することができる。レンダラー550内に3D情報データベース560を含むことができる。
That is, the functions and configurations of the
図9は、本発明の第5実施例によるオーディオ信号復号化装置を示すブロック図である。図9を参照すると、本実施例によるオーディオ信号復号化装置は、3D信号を生成する部分680がマルチチャンネルデコーダ670とメモリー675とから構成されるという点が、前述した実施例と異なる。この場合、マルチチャンネルデコーダ670は、マルチチャンネルデコーダ670の使用されていないメモリーに保存された3D情報をメモリー675に複写し、メモリー675に複写された3D情報を用いて3Dレンダリングを行う。したがって、トランスコーダ647から出力される3D情報が、メモリー675に保存された3D情報を直接更新するように構成すると、マルチチャネルデコーダ670の構成変更なしで所望の3D情報を用いて3Dベースの信号を生成することができる。
FIG. 9 is a block diagram showing an audio signal decoding apparatus according to a fifth embodiment of the present invention. Referring to FIG. 9, the audio signal decoding apparatus according to the present embodiment is different from the above-described embodiment in that a
一方、本発明は、コンピュータが読取りできる記録媒体にコンピュータが読取りできるコードとして具現することが可能である。コンピュータが読取りできる記録媒体は、コンピュータにより読み取られうるデータが保存される全ての種類の記録装置を含む。コンピュータが読取りできる記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フレキシブルディスク、光データ記憶装置などがあり、また、インターネットを介した転送などのような搬送波の形態で具現されるものも含む。また、コンピュータが読取りできる記録媒体を、ネットワークで連結されたシステムに分散し、分散方式でコンピュータが読取りできるコードが保存し、実行することができる。本発明を実現するのに必要な機能プログラム、コード及びコードセグメントを、当業者によって容易に構成することができる。 On the other hand, the present invention can be embodied as a computer readable code on a computer readable recording medium. Computer-readable recording media include all types of recording devices that store data that can be read by a computer. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, flexible disk, optical data storage device, etc., and are embodied in the form of a carrier wave such as transfer via the Internet. Also included. Further, a computer-readable recording medium can be distributed to systems connected via a network, and a computer-readable code can be stored and executed in a distributed manner. Functional programs, codes and code segments necessary for realizing the present invention can be easily configured by those skilled in the art.
また、以上では本発明を好適な実施例に挙げて説明してきたが、本発明は、上記した特定の実施例に限定されず、特許請求の範囲で請求する本発明の要旨を逸脱しない限度内で、当該技術分野における通常の知識を持つ者によって様々な変形実施が可能であることは勿論であり、それらの変形実施も本発明の技術的思想に含まれるものとして理解されるべきである。 Although the present invention has been described with reference to the preferred embodiments, the present invention is not limited to the specific embodiments described above, and is within the limits that do not depart from the gist of the present invention claimed in the claims. Therefore, it should be understood that various modifications can be made by those having ordinary knowledge in the technical field, and these modifications are also included in the technical idea of the present invention.
本発明は、オブジェクトベースのオーディオ信号の復号化過程などに適用され、オブジェクトオーディオ信号別に音像を定位し、より精巧な現実感を提供することができる。 The present invention is applied to an object-based audio signal decoding process and the like, and can localize a sound image for each object audio signal to provide a more sophisticated sense of reality.
Claims (35)
前記ダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成する段階と、
前記オブジェクトオーディオ信号に3D情報を用いて、3D効果の適用されたオブジェクトオーディオ信号を生成する段階と、
を含むことを特徴とするオーディオ信号復号化方法。 Extracting a downmix signal and object-based parameter information from the input audio signal;
Generating an object audio signal using the downmix signal and the object-based parameter information;
Generating 3D effect applied object audio signal using 3D information for the object audio signal;
An audio signal decoding method comprising:
前記オブジェクトベースダウンミックス信号と前記オブジェクトベースパラメータ情報とを用いてオブジェクトオーディオ信号を生成するオブジェクトデコーダと、
前記オブジェクトオーディオ信号に3D情報を用いて3D効果の適用されたオブジェクトオーディオ信号を生成するレンダラーと、
を含むことを特徴とするオーディオ信号復号化装置。 A demultiplexer that extracts an object-based downmix signal and object-based parameter information from an input audio signal;
An object decoder that generates an object audio signal using the object-based downmix signal and the object-based parameter information;
A renderer for generating an object audio signal to which a 3D effect is applied using 3D information for the object audio signal;
An audio signal decoding apparatus comprising:
前記オブジェクトベースパラメータ情報を変換してチャンネルベースパラメータ情報を生成する段階と、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に3D情報を用いて3D効果の適用されたオーディオ信号を生成する段階と、
を含むことを特徴とするオーディオ信号復号化方法。 Extracting a downmix signal and object-based parameter information from the input audio signal;
Converting the object-based parameter information to generate channel-based parameter information;
Generating an audio signal using the downmix signal and the channel base parameter information, and generating an audio signal to which a 3D effect is applied using 3D information for the audio signal;
An audio signal decoding method comprising:
インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
前記オブジェクトベースパラメータ情報と前記3D情報とを用いてチャンネルベースパラメータ情報を生成するトランスコーダと、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベースパラメータ情報に含まれた3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
を含むことを特徴とするオーディオ信号復号化装置。 A demultiplexer that extracts a downmix signal and object-based parameter information from the input audio signal;
A renderer that extracts 3D information using index data and outputs the 3D information;
A transcoder that generates channel-based parameter information using the object-based parameter information and the 3D information;
An audio signal is generated using the downmix signal and the channel base parameter information, and an audio signal in which a 3D effect is applied to the audio signal using 3D information included in the channel base parameter information is generated. A channel decoder;
An audio signal decoding apparatus comprising:
入力インデックスデータを用いて3D情報を引き出すとともに前記3D情報を出力するレンダラーと、
前記オブジェクトベースパラメータ情報をチャンネルベースパラメータ情報に変換し、前記3D情報をチャンネルベース3D情報に変換し、これらをそれぞれ出力するトランスコーダと、
前記ダウンミックス信号と前記チャンネルベースパラメータ情報とを用いてオーディオ信号を生成し、前記オーディオ信号に前記チャンネルベース3D情報を用いて3D効果の適用されたオーディオ信号を生成するマルチチャンネルデコーダと、
を含むことを特徴とするオーディオ信号復号化装置。 A demultiplexer that extracts a downmix signal and object-based parameter information from the input audio signal;
A renderer that extracts 3D information using input index data and outputs the 3D information;
A transcoder that converts the object-based parameter information into channel-based parameter information, converts the 3D information into channel-based 3D information, and outputs these respectively;
A multi-channel decoder that generates an audio signal using the downmix signal and the channel base parameter information, and generates an audio signal in which a 3D effect is applied to the audio signal using the channel base 3D information;
An audio signal decoding apparatus comprising:
前記オブジェクトオーディオ信号に関する情報を抽出し、オブジェクトベースパラメータ情報を生成する段階と、
前記オブジェクトオーディオ信号に対する3D効果の具現時に用いられる3D情報の検索のためのインデックスデータを前記オブジェクトベースパラメータ情報に挿入する段階と、
含むことを特徴とするオーディオ信号符号化方法。 Generating a downmix signal obtained by downmixing the object audio signal;
Extracting information about the object audio signal and generating object-based parameter information;
Inserting index data for searching for 3D information used when realizing a 3D effect on the object audio signal into the object base parameter information;
An audio signal encoding method comprising:
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US77147106P | 2006-02-09 | 2006-02-09 | |
US77333706P | 2006-02-15 | 2006-02-15 | |
US88071407P | 2007-01-17 | 2007-01-17 | |
US88094207P | 2007-01-18 | 2007-01-18 | |
PCT/KR2007/000730 WO2007091870A1 (en) | 2006-02-09 | 2007-02-09 | Method for encoding and decoding object-based audio signal and apparatus thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009526467A true JP2009526467A (en) | 2009-07-16 |
Family
ID=39731308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008554147A Pending JP2009526467A (en) | 2006-02-09 | 2007-02-09 | Method and apparatus for encoding and decoding object-based audio signal |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1984916A4 (en) |
JP (1) | JP2009526467A (en) |
AU (1) | AU2007212873B2 (en) |
BR (1) | BRPI0708047A2 (en) |
CA (1) | CA2646278A1 (en) |
TW (1) | TWI326448B (en) |
WO (1) | WO2007091870A1 (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011509590A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2011509589A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Processing method and apparatus for audio signal |
JP2011523247A (en) * | 2008-04-16 | 2011-08-04 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2013054395A (en) * | 2006-09-29 | 2013-03-21 | Korea Electronics Telecommun | Encoding and decoding device of multi-object audio signal constituted of various channels, and method therefor |
US8634577B2 (en) | 2007-01-10 | 2014-01-21 | Koninklijke Philips N.V. | Audio decoder |
WO2014171706A1 (en) * | 2013-04-15 | 2014-10-23 | 인텔렉추얼디스커버리 주식회사 | Audio signal processing method using generating virtual object |
WO2014192602A1 (en) * | 2013-05-31 | 2014-12-04 | ソニー株式会社 | Encoding device and method, decoding device and method, and program |
US9257127B2 (en) | 2006-12-27 | 2016-02-09 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion |
JP2016507173A (en) * | 2013-01-15 | 2016-03-07 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Binaural audio processing |
JP2018201224A (en) * | 2013-10-25 | 2018-12-20 | サムスン エレクトロニクス カンパニー リミテッド | Audio signal rendering method and apparatus |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2874451C (en) | 2006-10-16 | 2016-09-06 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
BRPI0715312B1 (en) * | 2006-10-16 | 2021-05-04 | Koninklijke Philips Electrnics N. V. | APPARATUS AND METHOD FOR TRANSFORMING MULTICHANNEL PARAMETERS |
EP2111617B1 (en) | 2007-02-14 | 2013-09-04 | LG Electronics Inc. | Audio decoding method and corresponding apparatus |
WO2009054665A1 (en) * | 2007-10-22 | 2009-04-30 | Electronics And Telecommunications Research Institute | Multi-object audio encoding and decoding method and apparatus thereof |
US8615088B2 (en) | 2008-01-23 | 2013-12-24 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning |
US8615316B2 (en) | 2008-01-23 | 2013-12-24 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
KR101461685B1 (en) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | Method and apparatus for generating side information bitstream of multi object audio signal |
KR101061129B1 (en) * | 2008-04-24 | 2011-08-31 | 엘지전자 주식회사 | Method of processing audio signal and apparatus thereof |
JP5589387B2 (en) * | 2008-11-27 | 2014-09-17 | 東レ株式会社 | Siloxane resin composition and protective film for touch panel using the same |
SG11201504368VA (en) | 2012-12-04 | 2015-07-30 | Samsung Electronics Co Ltd | Audio providing apparatus and audio providing method |
CN106104679B (en) * | 2014-04-02 | 2019-11-26 | 杜比国际公司 | Utilize the metadata redundancy in immersion audio metadata |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001028800A (en) * | 1999-06-10 | 2001-01-30 | Samsung Electronics Co Ltd | Multi-channel audio reproduction device for loudspeaker reproduction utilizing virtual sound image capable of position adjustment and its method |
WO2004036548A1 (en) * | 2002-10-14 | 2004-04-29 | Thomson Licensing S.A. | Method for coding and decoding the wideness of a sound source in an audio scene |
WO2004051624A2 (en) * | 2002-12-02 | 2004-06-17 | Thomson Licensing S.A. | Method for describing the composition of audio signals |
WO2004052052A2 (en) * | 2002-12-02 | 2004-06-17 | Thomson Licensing S.A. | Method and apparatus for processing audio signals from a bitstream |
JP2005352396A (en) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | Sound signal encoding device and sound signal decoding device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693727B (en) * | 2006-02-03 | 2015-06-10 | 韩国电子通信研究院 | Method for control of randering multiobject or multichannel audio signal using spatial cue |
CN102768835B (en) | 2006-09-29 | 2014-11-05 | 韩国电子通信研究院 | Apparatus and method for coding and decoding multi-object audio signal with various channel |
-
2007
- 2007-02-09 JP JP2008554147A patent/JP2009526467A/en active Pending
- 2007-02-09 CA CA002646278A patent/CA2646278A1/en not_active Abandoned
- 2007-02-09 AU AU2007212873A patent/AU2007212873B2/en not_active Ceased
- 2007-02-09 WO PCT/KR2007/000730 patent/WO2007091870A1/en active Application Filing
- 2007-02-09 BR BRPI0708047-6A patent/BRPI0708047A2/en not_active IP Right Cessation
- 2007-02-09 TW TW96104926A patent/TWI326448B/en not_active IP Right Cessation
- 2007-02-09 EP EP07708880A patent/EP1984916A4/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001028800A (en) * | 1999-06-10 | 2001-01-30 | Samsung Electronics Co Ltd | Multi-channel audio reproduction device for loudspeaker reproduction utilizing virtual sound image capable of position adjustment and its method |
WO2004036548A1 (en) * | 2002-10-14 | 2004-04-29 | Thomson Licensing S.A. | Method for coding and decoding the wideness of a sound source in an audio scene |
WO2004051624A2 (en) * | 2002-12-02 | 2004-06-17 | Thomson Licensing S.A. | Method for describing the composition of audio signals |
WO2004052052A2 (en) * | 2002-12-02 | 2004-06-17 | Thomson Licensing S.A. | Method and apparatus for processing audio signals from a bitstream |
JP2006517356A (en) * | 2002-12-02 | 2006-07-20 | トムソン ライセンシング | How to describe the structure of an audio signal |
JP2005352396A (en) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | Sound signal encoding device and sound signal decoding device |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013054395A (en) * | 2006-09-29 | 2013-03-21 | Korea Electronics Telecommun | Encoding and decoding device of multi-object audio signal constituted of various channels, and method therefor |
US9311919B2 (en) | 2006-09-29 | 2016-04-12 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
US9257124B2 (en) | 2006-09-29 | 2016-02-09 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
US8670989B2 (en) | 2006-09-29 | 2014-03-11 | Electronics And Telecommunications Research Institute | Appartus and method for coding and decoding multi-object audio signal with various channel |
JP2013077023A (en) * | 2006-09-29 | 2013-04-25 | Korea Electronics Telecommun | Encoding and decoding device and method for multi-object audio signal configured of various channels |
JP2016200824A (en) * | 2006-12-27 | 2016-12-01 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | Transcoding device |
US9257127B2 (en) | 2006-12-27 | 2016-02-09 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion |
US8634577B2 (en) | 2007-01-10 | 2014-01-21 | Koninklijke Philips N.V. | Audio decoder |
JP2011509590A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2011509591A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2011509588A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2011509589A (en) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | Processing method and apparatus for audio signal |
JP2011523247A (en) * | 2008-04-16 | 2011-08-04 | エルジー エレクトロニクス インコーポレイティド | Audio signal processing method and apparatus |
JP2016507173A (en) * | 2013-01-15 | 2016-03-07 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Binaural audio processing |
WO2014171706A1 (en) * | 2013-04-15 | 2014-10-23 | 인텔렉추얼디스커버리 주식회사 | Audio signal processing method using generating virtual object |
WO2014192602A1 (en) * | 2013-05-31 | 2014-12-04 | ソニー株式会社 | Encoding device and method, decoding device and method, and program |
JPWO2014192602A1 (en) * | 2013-05-31 | 2017-02-23 | ソニー株式会社 | Encoding apparatus and method, decoding apparatus and method, and program |
US9805729B2 (en) | 2013-05-31 | 2017-10-31 | Sony Corporation | Encoding device and method, decoding device and method, and program |
JP2018201224A (en) * | 2013-10-25 | 2018-12-20 | サムスン エレクトロニクス カンパニー リミテッド | Audio signal rendering method and apparatus |
US10645513B2 (en) | 2013-10-25 | 2020-05-05 | Samsung Electronics Co., Ltd. | Stereophonic sound reproduction method and apparatus |
US11051119B2 (en) | 2013-10-25 | 2021-06-29 | Samsung Electronics Co., Ltd. | Stereophonic sound reproduction method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
EP1984916A1 (en) | 2008-10-29 |
CA2646278A1 (en) | 2007-08-16 |
BRPI0708047A2 (en) | 2011-05-17 |
AU2007212873B2 (en) | 2010-02-25 |
TW200741649A (en) | 2007-11-01 |
TWI326448B (en) | 2010-06-21 |
WO2007091870A1 (en) | 2007-08-16 |
EP1984916A4 (en) | 2010-09-29 |
WO2007091870A8 (en) | 2008-09-12 |
AU2007212873A1 (en) | 2007-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009526467A (en) | Method and apparatus for encoding and decoding object-based audio signal | |
KR20080093422A (en) | Object-based audio signal encoding and decoding method and apparatus therefor | |
EP1416769B1 (en) | Object-based three-dimensional audio system and method of controlling the same | |
JP6612753B2 (en) | Multiplet-based matrix mixing for high channel count multi-channel audio | |
EP2205007B1 (en) | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction | |
JP7014176B2 (en) | Playback device, playback method, and program | |
BR112020000759A2 (en) | apparatus for generating a modified sound field description of a sound field description and metadata in relation to spatial information of the sound field description, method for generating an enhanced sound field description, method for generating a modified sound field description of a description of sound field and metadata in relation to spatial information of the sound field description, computer program, enhanced sound field description | |
KR20210101316A (en) | Apparatus and method for playing a spatially extended sound source or an apparatus and method for generating a bit stream from a spatially extended sound source | |
US11570569B2 (en) | Associated spatial audio playback | |
CN104054126A (en) | Spatial audio rendering and encoding | |
CN107533843A (en) | System and method for capturing, encoding, being distributed and decoding immersion audio | |
JP2019533404A (en) | Binaural audio signal processing method and apparatus | |
KR20220031058A (en) | Discord Audio Visual Capture System | |
WO2020153027A1 (en) | Audio system, audio playback device, server device, audio playback method, and audio playback program | |
WO2023085186A1 (en) | Information processing device, information processing method, and information processing program | |
KR101534295B1 (en) | Method and Apparatus for Providing Multiple Viewer Video and 3D Stereophonic Sound | |
KR102058228B1 (en) | Method for authoring stereoscopic contents and application thereof | |
KR20070081735A (en) | Method and apparatus for encoding / decoding audio signal | |
RU2407070C2 (en) | Method and device for encoding and decoding object-oriented audio signal | |
KR20190081163A (en) | Method for selective providing advertisement using stereoscopic content authoring tool and application thereof | |
KR102421292B1 (en) | System and method for reproducing audio object signal | |
JP6306958B2 (en) | Acoustic signal conversion device, acoustic signal conversion method, and acoustic signal conversion program | |
KR20190082056A (en) | Method for selective providing advertisement using stereoscopic content authoring tool and application thereof | |
KR20190082055A (en) | Method for providing advertisement using stereoscopic content authoring tool and application thereof | |
KR20190081160A (en) | Method for providing advertisement using stereoscopic content authoring tool and application thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100921 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110308 |