JP6439296B2 - 復号装置および方法、並びにプログラム - Google Patents
復号装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP6439296B2 JP6439296B2 JP2014136633A JP2014136633A JP6439296B2 JP 6439296 B2 JP6439296 B2 JP 6439296B2 JP 2014136633 A JP2014136633 A JP 2014136633A JP 2014136633 A JP2014136633 A JP 2014136633A JP 6439296 B2 JP6439296 B2 JP 6439296B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- priority information
- unit
- decoding
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 115
- 230000005236 sound signal Effects 0.000 claims description 562
- 238000004364 calculation method Methods 0.000 claims description 45
- 238000009877 rendering Methods 0.000 claims description 37
- 238000001228 spectrum Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 description 135
- 238000005562 fading Methods 0.000 description 45
- 238000012856 packing Methods 0.000 description 27
- 230000006866 deterioration Effects 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
〈本技術の概要について〉
本技術は、マルチチャネルを構成する各チャネルのオーディオ信号、およびオブジェクトのオーディオ信号の符号化において、各チャネルのオーディオ信号の優先度情報および各オブジェクトのオーディオ信号の優先度情報を伝送することで、復号の計算量を低減させることができるようにするものである。
次に、本技術を適用した符号化装置および復号装置の具体的な実施の形態について説明する。まず、符号化装置について説明する。
また、図5のチャネルオーディオ符号化部21は、より詳細には、例えば図6に示すように構成される。
さらに、図5のオブジェクトオーディオ符号化部22は、より詳細には、例えば図7に示すように構成される。
次に、符号化装置11により行われる処理について説明する。
次に、以上において説明した符号化装置11から出力されたビットストリームを入力とし、ビットストリームに含まれる符号化データを復号する復号装置について説明する。
また、図9に示した復号装置151のアンパッキング/復号部161は、より詳細には例えば図10に示すように構成される。
次に、復号装置151の動作について説明する。
続いて、図12のフローチャートを参照して、図11のステップS52の処理に対応する選択復号処理について説明する。
〈優先度情報について〉
なお、以上においては各チャネルや各オブジェクトの1つのオーディオ信号に対して、1つの優先度情報が生成されると説明したが、複数の優先度情報が生成されるようにしてもよい。
〈アンパッキング/復号部の構成例〉
なお、以上においては、符号化装置11から出力されるビットストリームに優先度情報が含まれている例について説明したが、符号化装置によっては、ビットストリームに優先度情報が含まれていないこともあり得る。
アンパッキング/復号部161が図13に示した構成とされる場合、復号装置151は、図11に示した復号処理のステップS52に対応する処理として、図14に示す選択復号処理を行う。以下、図14のフローチャートを参照して、復号装置151による選択復号処理について説明する。
〈優先度情報の閾値について〉
さらに、以上においては、各チャネルや各オブジェクトについて、優先度情報と、閾値Pや閾値Qとを比較して復号するオーディオ信号、より詳細にはIMDCTを行うMDCT係数を選択すると説明したが、これらの閾値Pや閾値Qがオーディオ信号のフレームごとに動的に変更されるようにしてもよい。
さらに、以上において説明した第1の実施の形態乃至第3の実施の形態では、ビットストリームの先頭のエレメントには、1フレーム分のオブジェクトのメタデータや優先度情報などが格納されると説明した。
〈オーディオ信号の完全再構成と不連続性に起因するノイズについて〉
以上においては、復号装置151においてビットストリームから読み出されたチャネルまたはオブジェクトごとの各フレーム(以下では、特に時間フレームと称する)の優先度情報が、予め定められた閾値未満である場合にIMDCT等の復号処理を省くことで、復号時の処理量を削減する例について説明した。具体的には、優先度情報が閾値未満である場合には、0値出力部195や0値出力部200から無音のオーディオ信号を出力する、つまりオーディオ信号として0データを出力すると説明した。
例えば、優先度情報が閾値未満である場合にオーディオ信号として0データを出力すると、0データの出力と、0データではない通常のオーディオ信号の出力との切り替え時に音質劣化が生じる。
また、IMDCT信号の出力元がIMDCT部201から0値出力部200へと、または0値出力部200からIMDCT部201へと切り替わる場合、信号が完全再構成されないので、IMDCTにより得られたIMDCT信号と、0データとされたIMDCT信号との接続部分で信号が不連続となることがある。そうすると、その不連続な接続部分にグリッチノイズが発生し、オーディオ信号の聴感上の音質が劣化してしまう。
まず、前後の時間フレームを考慮したMDCT係数の出力先の選択について説明する。なお、ここでもオブジェクトのオーディオ信号を例として説明するが、各チャネルのオーディオ信号についても同様である。また、以下において説明する処理は、オブジェクトごと、およびチャネルごとに行われる。
次に、オーディオ信号に対するフェードイン処理とフェードアウト処理について説明する。なお、ここでもオブジェクトのオーディオ信号を例として説明するが、各チャネルのオーディオ信号についても同様である。また、フェードイン処理とフェードアウト処理は、オブジェクトごと、およびチャネルごとに行われる。
以上において説明したMDCT係数の出力先の選択と、フェードイン処理やフェードアウト処理といったゲイン調整とが行われる場合、アンパッキング/復号部161は、例えば図21に示すように構成される。なお、図21において、図10における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
続いて、アンパッキング/復号部161が図21に示した構成とされる場合における復号装置151の動作について説明する。この場合、復号装置151は、図11を参照して説明した復号処理を行う。但し、ステップS52の選択復号処理として、図22に示す処理を行う。
〈フェードイン処理とフェードアウト処理について〉
なお、第4の実施の形態では、オーバーラップ加算後のオーディオ信号に対してゲイン調整を行い、さらにSBR時に高域のパワー値に対するゲイン調整を行うと説明した。この場合、最終的なオーディオ信号の低域成分と高域成分とで別々にゲイン調整、つまりフェードイン処理やフェードアウト処理が行われることになる。
図23および図24を参照して説明したフェードイン処理やフェードアウト処理によるゲイン調整が行われる場合、アンパッキング/復号部161は、例えば図25に示すように構成される。なお、図25において、図21における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
続いて、アンパッキング/復号部161が図25に示した構成とされる場合における復号装置151の動作について説明する。この場合、復号装置151は、図11を参照して説明した復号処理を行う。但し、ステップS52の選択復号処理として、図26に示す処理を行う。
〈フェードイン処理とフェードアウト処理について〉
ところで、レンダリング部162では、例えばVBAPが行われて各オブジェクトのオーディオ信号から、各オブジェクトの音声を再生するための各チャネルのオーディオ信号が生成される。
図27および図28を参照して説明したフェードイン処理やフェードアウト処理によるゲイン調整が行われる場合、アンパッキング/復号部161は、例えば図29に示すように構成される。なお、図29において、図25における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
続いて、アンパッキング/復号部161が図29に示した構成とされる場合における復号装置151の動作について説明する。
複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得する取得部と、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号するオーディオ信号復号部と
を備える復号装置。
(2)
前記オーディオ信号復号部は、前記優先度情報により示される優先度合いが所定の度合い以上である、前記符号化されたオーディオ信号を復号する
(1)に記載の復号装置。
(3)
前記取得部は、前記所定の時間における前記複数のチャネルまたは前記複数のオブジェクトのオーディオ信号の前記優先度情報に基づいて、前記所定の度合いを変更する
(2)に記載の復号装置。
(4)
前記取得部は、前記オーディオ信号ごとに複数の前記優先度情報を取得し、
前記オーディオ信号復号部は、前記複数の前記優先度情報のなかから選択された1つの前記優先度情報に基づいて、前記符号化されたオーディオ信号を復号する
(1)乃至(3)の何れか一項に記載の復号装置。
(5)
前記複数の前記優先度情報は、前記符号化されたオーディオ信号の復号側の計算能力に応じて、前記計算能力ごとに生成されたものである
(4)に記載の復号装置。
(6)
前記符号化されたオーディオ信号に基づいて、前記優先度情報を生成する優先度情報生成部をさらに備える
(1)乃至(5)の何れか一項に記載の復号装置。
(7)
前記優先度情報生成部は、前記符号化されたオーディオ信号から得られる、オーディオ信号の音圧またはスペクトル形状に基づいて前記優先度情報を生成する
(6)に記載の復号装置。
(8)
前記オーディオ信号復号部は、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間の前記符号化されたオーディオ信号を復号するかを選択する
(1)に記載の復号装置。
(9)
前記復号が行われた場合、前記復号により得られた信号を出力信号とし、前記復号が行われなかった場合、0データを出力信号として、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記出力信号と、前記所定の時間よりも前または後の時間の前記出力信号とを加算して前記所定の時間のオーディオ信号を生成する加算部と、
チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間のオーディオ信号のゲイン調整を行うゲイン調整部と
をさらに備える(1)に記載の復号装置。
(10)
チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、高域のパワー値をゲイン調整するとともに、ゲイン調整された前記パワー値と、前記所定の時間のオーディオ信号とに基づいて、前記所定の時間のオーディオ信号の高域成分を生成する高域生成部をさらに備える
(9)に記載の復号装置。
(11)
チャネルごとまたはオブジェクトごとに、高域のパワー値と、前記所定の時間のオーディオ信号とに基づいて、高域成分が含まれる前記所定の時間のオーディオ信号を生成する高域生成部をさらに備え、
前記ゲイン調整部は、高域成分が含まれる前記所定の時間のオーディオ信号のゲイン調整を行う
(9)に記載の復号装置。
(12)
前記所定の時間の前記優先度情報に基づいて、オブジェクトのオーディオ信号を複数の各チャネルに所定のゲイン値で割り当てて、前記複数の各チャネルのオーディオ信号を生成するレンダリング部をさらに備える
(1)に記載の復号装置。
(13)
複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得し、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号する
ステップを含む復号方法。
(14)
複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得し、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号する
ステップを含む処理をコンピュータに実行させるプログラム。
(15)
複数のチャネルまたは複数のオブジェクトのオーディオ信号の所定の時間における優先度情報を生成する優先度情報生成部と、
前記優先度情報をビットストリームに格納するパッキング部と
を備える符号化装置。
(16)
前記優先度情報生成部は、前記オーディオ信号ごとに複数の前記優先度情報を生成する
(15)に記載の符号化装置。
(17)
前記優先度情報生成部は、符号化された前記オーディオ信号の復号側の計算能力に応じて、前記計算能力ごとに前記優先度情報を生成する
(16)に記載の符号化装置。
(18)
前記優先度情報生成部は、前記オーディオ信号の音圧またはスペクトル形状に基づいて前記優先度情報を生成する
(15)乃至(17)の何れか一項に記載の符号化装置。
(19)
前記複数のチャネルまたは前記複数のオブジェクトのオーディオ信号を符号化する符号化部をさらに備え、
前記パッキング部は、前記優先度情報と符号化された前記オーディオ信号とを前記ビットストリームに格納する
(15)乃至(18)の何れか一項に記載の符号化装置。
(20)
複数のチャネルまたは複数のオブジェクトのオーディオ信号の所定の時間における優先度情報を生成し、
前記優先度情報をビットストリームに格納する
ステップを含む符号化方法。
(21)
複数のチャネルまたは複数のオブジェクトのオーディオ信号の所定の時間における優先度情報を生成し、
前記優先度情報をビットストリームに格納する
ステップを含む処理をコンピュータに実行させるプログラム。
Claims (13)
- 複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得する取得部と、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号するオーディオ信号復号部と、
前記復号が行われた場合、前記復号により得られた信号を出力信号とし、前記復号が行われなかった場合、0データを出力信号として、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記出力信号と、前記所定の時間よりも前または後の時間の前記出力信号とを加算して前記所定の時間のオーディオ信号を生成する加算部と、
チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間のオーディオ信号のゲイン調整を行うゲイン調整部と
を備える復号装置。 - 前記オーディオ信号復号部は、前記優先度情報により示される優先度合いが所定の度合い以上である、前記符号化されたオーディオ信号を復号する
請求項1に記載の復号装置。 - 前記取得部は、前記所定の時間における前記複数のチャネルまたは前記複数のオブジェクトのオーディオ信号の前記優先度情報に基づいて、前記所定の度合いを変更する
請求項2に記載の復号装置。 - 前記取得部は、前記オーディオ信号ごとに複数の前記優先度情報を取得し、
前記オーディオ信号復号部は、前記複数の前記優先度情報のなかから選択された1つの前記優先度情報に基づいて、前記符号化されたオーディオ信号を復号する
請求項1乃至請求項3の何れか一項に記載の復号装置。 - 前記複数の前記優先度情報は、前記符号化されたオーディオ信号の復号側の計算能力に応じて、前記計算能力ごとに生成されたものである
請求項4に記載の復号装置。 - 前記符号化されたオーディオ信号に基づいて、前記優先度情報を生成する優先度情報生成部をさらに備える
請求項1乃至請求項5の何れか一項に記載の復号装置。 - 前記優先度情報生成部は、前記符号化されたオーディオ信号から得られる、オーディオ信号の音圧またはスペクトル形状に基づいて前記優先度情報を生成する
請求項6に記載の復号装置。 - 前記オーディオ信号復号部は、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間の前記符号化されたオーディオ信号を復号するかを選択する
請求項1に記載の復号装置。 - チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、高域のパワー値をゲイン調整するとともに、ゲイン調整された前記パワー値と、前記所定の時間のオーディオ信号とに基づいて、前記所定の時間のオーディオ信号の高域成分を生成する高域生成部をさらに備える
請求項1に記載の復号装置。 - チャネルごとまたはオブジェクトごとに、高域のパワー値と、前記所定の時間のオーディオ信号とに基づいて、高域成分が含まれる前記所定の時間のオーディオ信号を生成する高域生成部をさらに備え、
前記ゲイン調整部は、高域成分が含まれる前記所定の時間のオーディオ信号のゲイン調整を行う
請求項1に記載の復号装置。 - 前記所定の時間の前記優先度情報に基づいて、オブジェクトのオーディオ信号を複数の各チャネルに所定のゲイン値で割り当てて、前記複数の各チャネルのオーディオ信号を生成するレンダリング部をさらに備える
請求項1に記載の復号装置。 - 複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得し、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号し、
前記復号が行われた場合、前記復号により得られた信号を出力信号とし、前記復号が行われなかった場合、0データを出力信号として、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記出力信号と、前記所定の時間よりも前または後の時間の前記出力信号とを加算して前記所定の時間のオーディオ信号を生成し、
チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間のオーディオ信号のゲイン調整を行う
ステップを含む復号方法。 - 複数のチャネルまたは複数のオブジェクトの符号化されたオーディオ信号、および所定の時間における各前記オーディオ信号の優先度情報を取得し、
前記優先度情報に基づいて、前記優先度情報に応じた所定の数のチャネルまたはオブジェクトの前記符号化されたオーディオ信号を復号し、
前記復号が行われた場合、前記復号により得られた信号を出力信号とし、前記復号が行われなかった場合、0データを出力信号として、チャネルごとまたはオブジェクトごとに、前記所定の時間の前記出力信号と、前記所定の時間よりも前または後の時間の前記出力信号とを加算して前記所定の時間のオーディオ信号を生成し、
チャネルごとまたはオブジェクトごとに、前記所定の時間の前記優先度情報と、前記所定の時間よりも前または後の時間の前記優先度情報とに基づいて、前記所定の時間のオーディオ信号のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。
Priority Applications (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014136633A JP6439296B2 (ja) | 2014-03-24 | 2014-07-02 | 復号装置および方法、並びにプログラム |
RU2019112504A RU2019112504A (ru) | 2014-03-24 | 2015-03-16 | Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования, и программа |
CN201580014248.6A CN106133828B (zh) | 2014-03-24 | 2015-03-16 | 编码装置和编码方法、解码装置和解码方法及存储介质 |
KR1020237005472A KR102741508B1 (ko) | 2014-03-24 | 2015-03-16 | 인코딩 장치 및 인코딩 방법, 디코딩 장치 및 디코딩 방법, 및 프로그램 |
EP15719835.9A EP3123470B1 (en) | 2014-03-24 | 2015-03-16 | Encoding device and encoding method, decoding device and decoding method, and program |
KR1020217028231A KR20210111897A (ko) | 2014-03-24 | 2015-03-16 | 인코딩 장치 및 인코딩 방법, 디코딩 장치 및 디코딩 방법, 및 프로그램 |
PCT/JP2015/001432 WO2015146057A1 (en) | 2014-03-24 | 2015-03-16 | Encoding device and encoding method, decoding device and decoding method, and program |
KR1020167021269A KR102300062B1 (ko) | 2014-03-24 | 2015-03-16 | 인코딩 장치 및 인코딩 방법, 디코딩 장치 및 디코딩 방법, 및 프로그램 |
EP20183981.8A EP3745397B1 (en) | 2014-03-24 | 2015-03-16 | Decoding device and decoding method, and program |
EP23168474.7A EP4243016A3 (en) | 2014-03-24 | 2015-03-16 | Decoding device and decoding method, and program |
CN202010176142.9A CN111489758B (zh) | 2014-03-24 | 2015-03-16 | 解码装置、解码方法及存储介质 |
BR112016021407-2A BR112016021407B1 (pt) | 2014-03-24 | 2015-03-16 | Dispositivo e método de decodificação, pelo menos um meio de armazenamento legível por computador não transitório, e, dispositivo e método de codificação |
KR1020247040609A KR20250002792A (ko) | 2014-03-24 | 2015-03-16 | 인코딩 장치 및 인코딩 방법, 디코딩 장치 및 디코딩 방법, 및 프로그램 |
RU2016137197A RU2689438C2 (ru) | 2014-03-24 | 2015-03-16 | Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа |
US15/127,182 US20180033440A1 (en) | 2014-03-24 | 2015-03-16 | Encoding device and encoding method, decoding device and decoding method, and program |
US16/726,755 US20200135216A1 (en) | 2014-03-24 | 2019-12-24 | Encoding device and encoding method, decoding device and decoding method, and program |
US17/464,594 US20210398546A1 (en) | 2014-03-24 | 2021-09-01 | Encoding device and encoding method, decoding device and decoding method, and program |
US18/493,363 US20240055007A1 (en) | 2014-03-24 | 2023-10-24 | Encoding device and encoding method, decoding device and decoding method, and program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014060486 | 2014-03-24 | ||
JP2014060486 | 2014-03-24 | ||
JP2014136633A JP6439296B2 (ja) | 2014-03-24 | 2014-07-02 | 復号装置および方法、並びにプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018217178A Division JP6863359B2 (ja) | 2014-03-24 | 2018-11-20 | 復号装置および方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015194666A JP2015194666A (ja) | 2015-11-05 |
JP2015194666A5 JP2015194666A5 (ja) | 2017-03-23 |
JP6439296B2 true JP6439296B2 (ja) | 2018-12-19 |
Family
ID=53039543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014136633A Active JP6439296B2 (ja) | 2014-03-24 | 2014-07-02 | 復号装置および方法、並びにプログラム |
Country Status (8)
Country | Link |
---|---|
US (4) | US20180033440A1 (ja) |
EP (3) | EP3123470B1 (ja) |
JP (1) | JP6439296B2 (ja) |
KR (4) | KR102300062B1 (ja) |
CN (2) | CN111489758B (ja) |
BR (1) | BR112016021407B1 (ja) |
RU (2) | RU2689438C2 (ja) |
WO (1) | WO2015146057A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6288100B2 (ja) * | 2013-10-17 | 2018-03-07 | 株式会社ソシオネクスト | オーディオエンコード装置及びオーディオデコード装置 |
JP6777071B2 (ja) | 2015-04-08 | 2020-10-28 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US10477269B2 (en) * | 2015-04-08 | 2019-11-12 | Sony Corporation | Transmission apparatus, transmission method, reception apparatus, and reception method |
US10424307B2 (en) * | 2017-01-03 | 2019-09-24 | Nokia Technologies Oy | Adapting a distributed audio recording for end user free viewpoint monitoring |
CN110447243B (zh) * | 2017-03-06 | 2021-06-01 | 杜比国际公司 | 基于音频数据流渲染音频输出的方法、解码器系统和介质 |
BR112019021904A2 (pt) * | 2017-04-26 | 2020-05-26 | Sony Corporation | Dispositivo e método de processamento de sinal, e, programa. |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
US11270711B2 (en) | 2017-12-21 | 2022-03-08 | Qualcomm Incorproated | Higher order ambisonic audio data |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
GB2578715A (en) * | 2018-07-20 | 2020-05-27 | Nokia Technologies Oy | Controlling audio focus for spatial audio processing |
WO2020080099A1 (ja) * | 2018-10-16 | 2020-04-23 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN111081226B (zh) * | 2018-10-18 | 2024-02-13 | 北京搜狗科技发展有限公司 | 语音识别解码优化方法及装置 |
BR112021009306A2 (pt) * | 2018-11-20 | 2021-08-10 | Sony Group Corporation | dispositivo e método de processamento de informações, e, programa. |
EP4131257A4 (en) * | 2020-04-01 | 2023-08-30 | Sony Group Corporation | Signal processing device and method, and program |
MX2023002255A (es) * | 2020-09-03 | 2023-05-16 | Sony Group Corp | Dispositivo y método de procesamiento de señales, dispositivo y método de aprendizaje y programa. |
CN116324980A (zh) * | 2020-09-25 | 2023-06-23 | 苹果公司 | 声道、对象和hoa音频内容的无缝可扩展解码 |
CN112634914B (zh) * | 2020-12-15 | 2024-03-29 | 中国科学技术大学 | 基于短时谱一致性的神经网络声码器训练方法 |
US11710491B2 (en) * | 2021-04-20 | 2023-07-25 | Tencent America LLC | Method and apparatus for space of interest of audio scene |
CN114974273B (zh) * | 2021-08-10 | 2023-08-15 | 中移互联网有限公司 | 一种会议音频混音方法和装置 |
CN114550732B (zh) * | 2022-04-15 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 一种高频音频信号的编解码方法和相关装置 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6330644B1 (en) * | 1994-10-27 | 2001-12-11 | Canon Kabushiki Kaisha | Signal processor with a plurality of kinds of processors and a shared memory accessed through a versatile control means |
JP3519722B2 (ja) * | 1997-03-17 | 2004-04-19 | 松下電器産業株式会社 | データ処理方法及びデータ処理装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6230130B1 (en) * | 1998-05-18 | 2001-05-08 | U.S. Philips Corporation | Scalable mixing for speech streaming |
JP2005292702A (ja) * | 2004-04-05 | 2005-10-20 | Kddi Corp | オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム |
US8787594B1 (en) * | 2005-01-28 | 2014-07-22 | Texas Instruments Incorporated | Multi-stream audio level controller |
RU2383941C2 (ru) * | 2005-06-30 | 2010-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для кодирования и декодирования аудиосигналов |
US7974422B1 (en) * | 2005-08-25 | 2011-07-05 | Tp Lab, Inc. | System and method of adjusting the sound of multiple audio objects directed toward an audio output device |
JP4396683B2 (ja) * | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
BRPI0715312B1 (pt) * | 2006-10-16 | 2021-05-04 | Koninklijke Philips Electrnics N. V. | Aparelhagem e método para transformação de parâmetros multicanais |
US8085786B2 (en) * | 2007-03-16 | 2011-12-27 | Qualcomm Incorporated | H-ARQ throughput optimization by prioritized decoding |
FR2929466A1 (fr) * | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
WO2011020067A1 (en) * | 2009-08-14 | 2011-02-17 | Srs Labs, Inc. | System for adaptively streaming audio objects |
MY154641A (en) * | 2009-11-20 | 2015-07-15 | Fraunhofer Ges Forschung | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter |
US9531761B2 (en) * | 2010-07-01 | 2016-12-27 | Broadcom Corporation | Method and system for prioritizing and scheduling services in an IP multimedia network |
JP2012108451A (ja) * | 2010-10-18 | 2012-06-07 | Sony Corp | 音声処理装置および方法、並びにプログラム |
WO2012125855A1 (en) * | 2011-03-16 | 2012-09-20 | Dts, Inc. | Encoding and reproduction of three dimensional audio soundtracks |
WO2013181272A2 (en) * | 2012-05-31 | 2013-12-05 | Dts Llc | Object-based audio system using vector base amplitude panning |
US9025458B2 (en) * | 2012-10-23 | 2015-05-05 | Verizon Patent And Licensing Inc. | Reducing congestion of media delivery over a content delivery network |
CN104885151B (zh) * | 2012-12-21 | 2017-12-22 | 杜比实验室特许公司 | 用于基于感知准则呈现基于对象的音频内容的对象群集 |
TR201808415T4 (tr) * | 2013-01-15 | 2018-07-23 | Koninklijke Philips Nv | Binoral ses işleme. |
JP6288100B2 (ja) * | 2013-10-17 | 2018-03-07 | 株式会社ソシオネクスト | オーディオエンコード装置及びオーディオデコード装置 |
KR102160254B1 (ko) * | 2014-01-10 | 2020-09-25 | 삼성전자주식회사 | 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치 |
-
2014
- 2014-07-02 JP JP2014136633A patent/JP6439296B2/ja active Active
-
2015
- 2015-03-16 BR BR112016021407-2A patent/BR112016021407B1/pt active IP Right Grant
- 2015-03-16 CN CN202010176142.9A patent/CN111489758B/zh active Active
- 2015-03-16 US US15/127,182 patent/US20180033440A1/en not_active Abandoned
- 2015-03-16 KR KR1020167021269A patent/KR102300062B1/ko active Active
- 2015-03-16 WO PCT/JP2015/001432 patent/WO2015146057A1/en active Application Filing
- 2015-03-16 EP EP15719835.9A patent/EP3123470B1/en active Active
- 2015-03-16 EP EP23168474.7A patent/EP4243016A3/en active Pending
- 2015-03-16 EP EP20183981.8A patent/EP3745397B1/en active Active
- 2015-03-16 KR KR1020237005472A patent/KR102741508B1/ko active Active
- 2015-03-16 KR KR1020217028231A patent/KR20210111897A/ko not_active Ceased
- 2015-03-16 RU RU2016137197A patent/RU2689438C2/ru active
- 2015-03-16 CN CN201580014248.6A patent/CN106133828B/zh active Active
- 2015-03-16 RU RU2019112504A patent/RU2019112504A/ru unknown
- 2015-03-16 KR KR1020247040609A patent/KR20250002792A/ko active Pending
-
2019
- 2019-12-24 US US16/726,755 patent/US20200135216A1/en not_active Abandoned
-
2021
- 2021-09-01 US US17/464,594 patent/US20210398546A1/en not_active Abandoned
-
2023
- 2023-10-24 US US18/493,363 patent/US20240055007A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112016021407A2 (pt) | 2022-07-19 |
CN111489758A (zh) | 2020-08-04 |
KR20160136278A (ko) | 2016-11-29 |
US20200135216A1 (en) | 2020-04-30 |
EP4243016A2 (en) | 2023-09-13 |
BR112016021407B1 (pt) | 2022-09-27 |
RU2019112504A (ru) | 2019-05-06 |
RU2016137197A3 (ja) | 2018-10-22 |
EP3745397A1 (en) | 2020-12-02 |
RU2689438C2 (ru) | 2019-05-28 |
US20180033440A1 (en) | 2018-02-01 |
WO2015146057A1 (en) | 2015-10-01 |
KR20250002792A (ko) | 2025-01-07 |
US20240055007A1 (en) | 2024-02-15 |
EP3745397B1 (en) | 2023-06-07 |
JP2015194666A (ja) | 2015-11-05 |
KR102300062B1 (ko) | 2021-09-09 |
EP3123470B1 (en) | 2020-08-12 |
EP3123470A1 (en) | 2017-02-01 |
RU2016137197A (ru) | 2018-03-21 |
CN111489758B (zh) | 2023-12-01 |
EP4243016A3 (en) | 2023-11-08 |
CN106133828A (zh) | 2016-11-16 |
KR20210111897A (ko) | 2021-09-13 |
US20210398546A1 (en) | 2021-12-23 |
KR20230027329A (ko) | 2023-02-27 |
KR102741508B1 (ko) | 2024-12-12 |
CN106133828B (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6439296B2 (ja) | 復号装置および方法、並びにプログラム | |
TWI628651B (zh) | 用於編碼或解碼多通道信號的設備及方法、以及相關實體儲存媒體及電腦程式 | |
US8060042B2 (en) | Method and an apparatus for processing an audio signal | |
KR101108060B1 (ko) | 신호 처리 방법 및 이의 장치 | |
US11640825B2 (en) | Time-domain stereo encoding and decoding method and related product | |
WO2013156814A1 (en) | Stereo audio signal encoder | |
US20200176001A1 (en) | Method for determining audio coding/decoding mode and related product | |
JP2023072027A (ja) | 復号装置および方法、並びにプログラム | |
US20200175999A1 (en) | Time-domain stereo encoding and decoding method and related product | |
WO2023286698A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
EP3987513B1 (en) | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170203 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181105 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6439296 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |