JP2009524108A - 拡張帯域周波数コーディングによる複素変換チャネルコーディング - Google Patents
拡張帯域周波数コーディングによる複素変換チャネルコーディング Download PDFInfo
- Publication number
- JP2009524108A JP2009524108A JP2008551278A JP2008551278A JP2009524108A JP 2009524108 A JP2009524108 A JP 2009524108A JP 2008551278 A JP2008551278 A JP 2008551278A JP 2008551278 A JP2008551278 A JP 2008551278A JP 2009524108 A JP2009524108 A JP 2009524108A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- coding
- audio
- extension
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009466 transformation Effects 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 99
- 238000006243 chemical reaction Methods 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 abstract description 49
- 238000000844 transformation Methods 0.000 abstract description 9
- 239000011159 matrix material Substances 0.000 description 71
- 238000013139 quantization Methods 0.000 description 55
- 239000013598 vector Substances 0.000 description 55
- 230000003595 spectral effect Effects 0.000 description 49
- 238000012805 post-processing Methods 0.000 description 27
- 238000001228 spectrum Methods 0.000 description 22
- 230000006835 compression Effects 0.000 description 20
- 238000007906 compression Methods 0.000 description 20
- 238000006073 displacement reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000007781 pre-processing Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002427 irreversible effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000006837 decompression Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000316887 Saissetia oleae Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
コンピュータは、オーディオ情報を表す一連の数字として、オーディオ情報を処理する。例えば、1つの数字は音声サンプルを表すことができるが、これは特定の時間における振幅値である。サンプル深度、サンプリングレート、およびチャネルモードを含むいくつかの要因は、オーディオ情報の品質に影響を与える。
多くのコンピュータおよびコンピュータネットワークには、ローデジタルオーディオを処理するリソースが不足している。圧縮(エンコーディングまたはコーディングとも呼ばれる)は、情報を低ビットレート形式に変換することにより、オーディオ情報を格納して伝送するコストを軽減する。解凍(デコーディングとも呼ばれる)は、元の情報の再構築バージョンを圧縮された形式から抽出する。エンコーダおよびデコーダシステムは、本件特許出願人のWindows(登録商標)Media Audio(「WMA」)エンコーダおよびデコーダと、WMA Proエンコーダおよびデコーダの特定のバージョンを含む。
図1は、説明される実施形態を実施することができる適切なコンピューティング環境100の一般的な例を示す。説明されている実施形態は様々な汎用または特殊用途のコンピューティング環境において実施することができるので、コンピューティング環境100は、使用または機能の範囲に関して何らかの限定を示すことを意図してはいない。
図2は、1つまたは複数の説明されている実施形態が実施されうる第1のオーディオエンコーダ200を示す。エンコーダ200は、変換ベースの、知覚オーディオエンコーダ200である。図3は、対応するオーディオデコーダ300を示す。
エンコーダ200は、あるサンプル深度およびレートにおける入力オーディオサンプル205の時系列を受信する。入力オーディオサンプル205は、マルチチャネルオーディオ(例えば、ステレオ)またはモノオーディオ向けのものである。エンコーダ200は、オーディオサンプル205を圧縮し、エンコーダ200の様々なモジュールによって生成される情報を多重化して、WMA形式などの圧縮形式、Advanced Streaming Format(「ASF」)などのコンテナ形式、または他の圧縮またはコンテナ形式でビットストリーム295を出力する。
デコーダ300は、エントロピーエンコードデータおよびサイド情報を含む圧縮オーディオ情報のビットストリーム305を受信するが、デコーダ300はそのビットストリームからオーディオサンプル395を再構築する。
図4を参照すると、エンコーダ400は、あるサンプル深度およびレートにおける入力オーディオサンプル405の時系列を受信する。入力オーディオサンプル405は、マルチチャネルオーディオ(例えば、ステレオ、サラウンド)またはモノオーディオ向けのものである。エンコーダ400は、オーディオサンプル405を圧縮し、エンコーダ400の様々なモジュールによって生成される情報を多重化して、WMA Pro形式などの圧縮形式、ASFなどのコンテナ形式、または他の圧縮またはコンテナ形式でビットストリーム495を出力する。
図5を参照すると、第2のオーディオデコーダ500は、圧縮されたオーディオ情報のビットストリーム505を受信する。ビットストリーム505は、エントロピーエンコードデータ、およびデコーダ500がオーディオサンプル595を再構築したサイド情報を含む。
この節は、マルチチャネル前処理技法、柔軟マルチチャネル変換技法、およびマルチチャネル後処理技法を含む、一部のエンコーダおよびデコーダにおいて使用される一部のマルチチャネル処理技法の概要である。
一部のエンコーダは、時間領域の入力オーディオサンプルにマルチチャネル前処理を実行する。
一部のエンコーダは、チャネル間相関を効果的に利用する柔軟マルチチャネル変換を実行することができる。対応するデコーダは、対応する逆マルチチャネル変換を実行することができる。
一部のデコーダは、再構築された時間領域のオーディオサンプルにマルチチャネル後処理を実行する。
マルチチャネルソースをコーディングするための通常のコード化方式において、変調重複変換(「MLT」)または離散コサイン変換(「DCT」)などの変換を使用する時間−周波数変換がエンコーダにおいて実行され、対応する逆変換がデコーダにおいて実行される。チャネルのいくつかのMLTまたはDCT係数はチャネルグループにまとめられ、コーディングされるべきチャネルを取得するために線形変換がチャネル全体にわたり適用される。ステレオソースの左右のチャネルが相関する場合、それらは和−差(sum−difference)変換(M/Sまたはミッド/サイドコーディングとも呼ばれる)を使用してコーディングされてもよい。そうすることで、2つのチャネル間の相関が除去され、その結果、これらをコーディングするために必要なビット数が少なくてすむ。しかし、低ビットレートにおいては、差チャネルがコーディングされないことも(その結果ステレオイメージが失われる)、または品質が両チャネルの多量の量子化の影響を受けることもある。
説明される実施形態において、エンコーダは結合チャネルを形成し、結合チャネルを形成するために使用されたチャネルの再構築のためにデコーダにパラメータを供給する。デコーダは、順複素変換を使用して結合チャネルの(各々実数成分と虚数成分を有する)複素係数を導き出す。次いで、結合チャネルから物理チャネルを再構築するため、デコーダは、エンコーダによって供給されたパラメータを使用して複素係数を基準化する。例えば、デコーダは、エンコーダによって供給されたパラメータからスケール因数を導き出し、それらを使用して複素係数を基準化する。結合チャネルは多くの場合、和チャネル(モノチャネルと呼ばれることもある)であるが、物理チャネルの別の組合せであってもよい。物理チャネルの位相がずれているため、チャネルを合計することで相互に打ち消し合うことになる場合、結合チャネルは、差チャネル(例えば、左右のチャネル間の差)であってもよい。
エンコーダは、明示的パラメータを決定すべきアンカーポイントを選択し、アンカーポイント間にパラメータを補間することができる。アンカーポイント間の時間量およびアンカーポイントの数は、コンテンツおよび/またはエンコーダ側の決定に応じて固定であっても、または異なっていてもよい。時間tにおいてアンカーポイントが選択された場合、エンコーダは、スペクトル内のすべての周波数帯域にそのアンカーポイントを使用することができる。代替として、エンコーダは、異なる周波数帯域の異なる時間においてアンカーポイントを選択することができる。
一般的な線形チャネル変換は、Y=AXと表記することができるが、ここでXは、Pチャネルからの係数のLベクトルのセットであり(P×L次元行列)、AはP×Pチャネル変換行列であり、YはコーディングされるべきPチャネルからのLの変換されたベクトルのセットである(P×L次元行列)。L(ベクトル次元)は、線形チャネル変換アルゴリズムが操作する所定のサブフレームの帯域サイズである。エンコーダが、YのPチャネルのサブセットNをコーディングする場合、これはZ=BXと表記することができ、ここでベクトルZはN×L行列であり、Bは、コーディングされるべきNチャネルに対応する行列YのN行をとることにより形成されるN×P行列である。Nチャネルからの再構築は、ベクトルZのコーディング後に行列Cとのもう1つの行列乗算を伴い、W=CQ(Z)を得るが、ここでQはベクトルZの量子化を表す。Zに代入すると、式W=CQ(BX)が得られる。量子化ノイズが無視できると仮定すれば、W=CBX。Cは、ベクトルXとWの間のチャネル間二次統計を保持するために適切に選択されうる。式では、これは、WW*=CBXX*B*C*=XX*と表すことができ、ここでXX*は対称P×P行列である。
上記で第IV節において説明されるチャネル拡張コーディング技法およびツールは、他の技法およびツールと組み合わせて使用されてもよい。例えば、エンコーダは、基本コーディング変換、周波数拡張コーディング変換(例えば、拡張帯域知覚類似性コーディング変換)、およびチャネル拡張コーディング変換を使用することができる(周波数拡張コーディングは、以下の第V.A.節において説明される)。エンコーダにおいて、これらの変換は、基本コーディングモジュール、基本コーディングモジュールから分離されている周波数拡張コーディングモジュール、および基本コーディングモジュールと周波数拡張コーディングモジュールから分離されているチャネル拡張コーディングモジュールで実行されてもよい。あるいは、同じモジュール内で様々な組合せで様々な変換を実行することができる。
この節は、一部のエンコーダおよびデコーダにおいて、より高い周波数スペクトルデータを、スペクトルのベースバンドデータに応じてコーディングするために使用される周波数拡張コーディング技法およびツールの概要を示す(拡張帯域知覚類似性周波数コーディング、またはワイドセンス知覚類似性コーディングと呼ばれることもある)。
図37は、時間−周波数(T/F)基本変換3710、T/F周波数拡張変換3720、およびT/Fチャネル拡張変換3730を使用してマルチチャネルソースオーディオ3705を処理する例示のエンコーダ3700の態様を示す図である(その他のエンコーダは、異なる組合せ、または図示されているものに加えて他の変換を使用してもよい)。
1)様々なウィンドウ形状/サイズに対してA、B、C行列を事前計算する。
2)A、B、およびC行列をしきい値処理し、ピーク値よりも大幅に小さい値は0まで下げられ、疎行列まで縮小される。
3)非ゼロの行列要素のみを使用して、行列乗算を計算する。
周波数/チャネルコーディングは、基本コーディング変換、周波数コーディング変換、およびチャネルコーディング変換により行うことができる。ブロックまたはフレームベースで相互に変換を切り替えることは、知覚品質を向上させることができるが、計算上は高価である。一部のシナリオ(例えば、低処理能力の装置など)においては、そのような高い複雑性は許容されない場合もある。複雑性を軽減するための1つの解決策は、エンコーダに、周波数およびチャネルのコーディングに常に基本コーディング変換を強制的に選択させることである。しかし、この手法は、出力の制約がない再生装置についても、品質に制約を設けることになる。もう1つの解決策は、エンコーダに変換の制約なしで実行させ、低複雑性が要求される場合、デコーダに、周波数/チャネルコーディングパラメータを基本コーディング変換領域にマッピングさせることである。マッピングが適切な方法で行われた場合、第2の解決策は、適度な複雑性で、高出力装置向けの良好な品質と、低出力装置向けの良好な品質を達成することができる。他の領域から基本変換領域へのパラメータのマッピングは、ビットストリームからの他の情報を使用せずに実行されるか、またはマッピングパフォーマンスを高めるためにエンコーダによってビットストリームに加えられた追加情報を使用して実行されてもよい。
第V.B節において示されているように、周波数コーディングエンコーダは、基本コーディング変換、周波数コーディング変換(例えば、拡張帯域知覚類似性コーディング変換)、およびチャネルコーディング変換を使用することができる。しかし、周波数エンコーディングが、2つの異なる変換を切り替える場合、周波数エンコーディングの開始点には、特別な注意が必要とされることがある。これは、基本変換などの変換の1つにおける信号が通常、最後にコーディングされた係数によって定義された明瞭な通過帯域で、帯域通過されるためである。しかし、異なる変換にマップされる場合、そのような明瞭な境界はあいまいなものになる可能性がある。1つの実施態様において、周波数エンコーダは、開始点を慎重に定義することにより、信号出力がまったく失われていないことを確認する。具体的には、以下のことを行う。
2)各帯域に対して、周波数エンコーダは、元の信号のエネルギーを計算する−E2
3)Tを事前定義されたしきい値として、(E2−E1)>Tである場合、周波数エンコーダはこの帯域に開始点としてマークを付ける。
4)周波数エンコーダは、ここでオペレーションを開始し、
5)周波数エンコーダは、開始点をデコーダに伝送する。
A.変調DCTコーディングを使用するエンコーダの変位ベクトル
上記の第V節において説明されているように、拡張帯域知覚類似性周波数コーディングは、時間ウィンドウ内の周波数帯域の形状パラメータおよびスケールパラメータを決定することを伴う。形状パラメータは、拡張帯域(通常は、ベースバンドよりも高い帯域)のコーディング係数の基準としての役割を果たすベースバンド(通常は低帯域)の部分を指定する。例えば、ベースバンドの指定された部分の係数は、基準化されてから、拡張帯域に適用されてもよい。
周波数コーディングが、基本コーダよりも小さいウィンドウを有する場合、ビットレートは増大する傾向がある。ウィンドウは小さいが、不快なアーティファクトを防ぐために周波数解像度をかなり高いレベルに維持することが依然として重要であるからである。
Claims (20)
- オーディオエンコーダにおいて、
マルチチャネルオーディオデータを受信するステップであって、前記マルチチャネルオーディオデータは複数のソースチャネルのグループを備えるステップと、
前記マルチチャネルオーディオデータにチャネル拡張コーディングを実行するステップであって、前記チャネル拡張コーディングは、
前記グループの結合チャネルをエンコードするステップと、
前記エンコードされた結合チャネルの変更バージョンとして前記グループの個々のソースチャネルを表すための複数のパラメータを決定するステップとを備えるステップと、
周波数拡張コーディングを実行するステップとを備えることを特徴とするコンピュータ実施の方法。 - 前記周波数拡張コーディングは、
前記マルチチャネルオーディオデータの周波数帯域をベースバンドグループと拡張帯域グループに分割するステップを備えることを特徴とする請求項1に記載の方法。 - 前記周波数拡張コーディングは、
前記ベースバンドグループのオーディオ係数に基づいて前記拡張帯域グループのオーディオ係数をコーディングするステップをさらに備えることを特徴とする請求項2に記載の方法。 - 前記エンコードされた結合チャネルおよび前記複数のパラメータをオーディオデコーダに送信するステップと、
周波数拡張コーディングデータを前記オーディオデコーダに送信するステップとをさらに備え、
前記エンコードされた結合チャネル、前記複数のパラメータ、および前記周波数拡張コーディングデータは、前記複数のソースチャネルの少なくとも2つの前記オーディオデコーダにおける再構築を容易にすることを特徴とする請求項1に記載の方法。 - 前記複数のパラメータは、前記少なくとも2つのソースチャネルの出力比を備えることを特徴とする請求項4に記載の方法。
- 前記複数のパラメータは、前記少なくとも2つのソースチャネルにわたり二次統計を保持するための複素パラメータを備えることを特徴とする請求項4に記載の方法。
- 前記オーディオデコーダは、前記少なくとも2つのソースチャネルにわたり二次統計を保持することを特徴とする請求項4に記載の方法。
- 前記オーディオエンコーダは、基本変換モジュール、周波数拡張変換モジュール、およびチャネル拡張変換モジュールを備えることを特徴とする請求項1に記載の方法。
- 前記マルチチャネルオーディオデータに基本コーディングを実行するステップをさらに備えることを特徴とする請求項1に記載の方法。
- 前記基本コーディングされたマルチチャネルオーディオデータにマルチチャネル変換を実行するステップをさらに備えることを特徴とする請求項9に記載の方法。
- それによりプログラムされたコンピュータに請求項1に記載の方法を実行させるためのコンピュータ実行可能命令を格納することを特徴とするコンピュータ可読媒体。
- オーディオデコーダにおいて、
エンコードされたマルチチャネルオーディオデータを受信するステップであって、前記エンコードされたマルチチャネルオーディオデータはチャネル拡張コーディングデータおよび周波数拡張コーディングデータを備えるステップと、
前記チャネル拡張コーディングデータおよび前記周波数拡張コーディングデータを使用して複数のオーディオチャネルを再構築するステップとを備え、
前記チャネル拡張コーディングデータは、
前記複数のオーディオチャネルの結合チャネルと、
前記複数のオーディオチャネルの個々のチャネルを前記結合チャネルの変更バージョンとして表すための複数のパラメータとを備えることを特徴とするコンピュータ実施の方法。 - それによりプログラムされたコンピュータに請求項12に記載の方法を実行させるためのコンピュータ実行可能命令を格納することを特徴とするコンピュータ可読媒体。
- オーディオデコーダにおいて、
マルチチャネルオーディオデータを受信するステップと、
前記受信したマルチチャネルオーディオデータに逆マルチチャネル変換を実行するステップと、
前記受信したマルチチャネルオーディオデータに逆基本時間−周波数変換を実行するステップと、
前記受信したマルチチャネルオーディオデータに周波数拡張処理を実行するステップと、
前記受信したマルチチャネルオーディオデータにチャネル拡張処理を実行するステップとを備えることを特徴とするコンピュータ実施の方法。 - 前記周波数拡張処理は、前記逆マルチチャネル変換および前記逆基本時間−周波数変換の前に、前記受信したマルチチャネルオーディオデータに実行されることを特徴とする請求項14に記載の方法。
- 前記受信したマルチチャネルオーディオデータに順チャネル拡張変換および逆チャネル拡張変換を実行するステップをさらに備えることを特徴とする請求項14に記載の方法。
- 前記周波数拡張処理は、少なくとも一部の前記順チャネル拡張変換の後に、前記受信したマルチチャネルオーディオデータに実行されることを特徴とする請求項16に記載の方法。
- 前記少なくとも一部の前記順チャネル拡張変換は、前記順チャネル拡張変換の実数部分であることを特徴とする請求項17に記載の方法。
- 前記順チャネル拡張変換の虚数部分は、前記順チャネル拡張変換の実数部分から導き出されることを特徴とする請求項16に記載の方法。
- それによりプログラムされたコンピュータに請求項14に記載の方法を実行させるためのコンピュータ実行可能命令を格納することを特徴とするコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/336,606 US7831434B2 (en) | 2006-01-20 | 2006-01-20 | Complex-transform channel coding with extended-band frequency coding |
PCT/US2007/000021 WO2007087117A1 (en) | 2006-01-20 | 2007-01-03 | Complex-transform channel coding with extended-band frequency coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009524108A true JP2009524108A (ja) | 2009-06-25 |
Family
ID=38286603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008551278A Pending JP2009524108A (ja) | 2006-01-20 | 2007-01-03 | 拡張帯域周波数コーディングによる複素変換チャネルコーディング |
Country Status (9)
Country | Link |
---|---|
US (2) | US7831434B2 (ja) |
EP (1) | EP1974470A4 (ja) |
JP (1) | JP2009524108A (ja) |
KR (1) | KR101143225B1 (ja) |
CN (2) | CN102708868B (ja) |
AU (2) | AU2007208482B2 (ja) |
CA (1) | CA2637185C (ja) |
RU (2) | RU2555221C2 (ja) |
WO (1) | WO2007087117A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009530651A (ja) * | 2006-03-15 | 2009-08-27 | フランス テレコム | 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法 |
JP2014523548A (ja) * | 2011-06-30 | 2014-09-11 | サムスン エレクトロニクス カンパニー リミテッド | 帯域幅拡張信号生成装置及びその方法 |
JP2019148807A (ja) * | 2015-07-31 | 2019-09-05 | アップル インコーポレイテッドApple Inc. | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 |
JP2021529354A (ja) * | 2018-07-04 | 2021-10-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
US20230124006A1 (en) * | 2021-10-15 | 2023-04-20 | Lemon Inc. | System and method for training a transformer-in-transformer-based neural network model for audio data |
US12367883B2 (en) | 2018-07-04 | 2025-07-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal audio coding using signal whitening as processing |
Families Citing this family (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US8599925B2 (en) * | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
CA2704812C (en) * | 2007-11-06 | 2016-05-17 | Nokia Corporation | An encoder for encoding an audio signal |
KR101161866B1 (ko) * | 2007-11-06 | 2012-07-04 | 노키아 코포레이션 | 오디오 코딩 장치 및 그 방법 |
US9275648B2 (en) * | 2007-12-18 | 2016-03-01 | Lg Electronics Inc. | Method and apparatus for processing audio signal using spectral data of audio signal |
KR101449434B1 (ko) * | 2008-03-04 | 2014-10-13 | 삼성전자주식회사 | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 |
JP5425066B2 (ja) * | 2008-06-19 | 2014-02-26 | パナソニック株式会社 | 量子化装置、符号化装置およびこれらの方法 |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
US8117039B2 (en) * | 2008-12-15 | 2012-02-14 | Ericsson Television, Inc. | Multi-staging recursive audio frame-based resampling and time mapping |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
US9245529B2 (en) * | 2009-06-18 | 2016-01-26 | Texas Instruments Incorporated | Adaptive encoding of a digital signal with one or more missing values |
JP2011065093A (ja) * | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
CA2778368C (en) | 2009-10-20 | 2016-01-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction |
JP4709928B1 (ja) * | 2010-01-21 | 2011-06-29 | 株式会社東芝 | 音質補正装置及び音質補正方法 |
US9378745B2 (en) * | 2010-04-09 | 2016-06-28 | Dolby International Ab | MDCT-based complex prediction stereo coding |
JP5975243B2 (ja) * | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
LT3217667T (lt) | 2011-10-17 | 2020-11-10 | Kabushiki Kaisha Toshiba | Kodavimo būdas ir dekodavimo būdas |
KR101276049B1 (ko) * | 2012-01-25 | 2013-06-20 | 세종대학교산학협력단 | 조건부 스플릿 벡터 양자화를 이용한 음성 압축 장치 및 그 방법 |
US8773291B2 (en) * | 2012-02-13 | 2014-07-08 | Intel Corporation | Audio receiver and sample rate converter without PLL or clock recovery |
KR102123770B1 (ko) * | 2012-03-29 | 2020-06-16 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 하모닉 오디오 신호의 변환 인코딩/디코딩 |
CN106791833B (zh) | 2012-06-27 | 2019-10-11 | 株式会社东芝 | 编码方法、解码方法、编码设备以及解码设备 |
JP6231093B2 (ja) * | 2012-07-09 | 2017-11-15 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ信号の符号化及び復号 |
CN104704825B (zh) * | 2012-08-21 | 2019-08-30 | Emc 公司 | 分段图像数据的无损压缩 |
CA2889942C (en) * | 2012-11-05 | 2019-09-17 | Panasonic Intellectual Property Corporation Of America | Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method |
US10043535B2 (en) | 2013-01-15 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2981960B1 (en) | 2013-04-05 | 2019-03-13 | Dolby International AB | Stereo audio encoder and decoder |
US8804971B1 (en) | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
US9425757B2 (en) * | 2013-05-15 | 2016-08-23 | Infineon Technologies Ag | Apparatus and method for controlling an amplification gain of an amplifier, and a digitizer circuit and microphone assembly |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
CN110890101B (zh) | 2013-08-28 | 2024-01-12 | 杜比实验室特许公司 | 用于基于语音增强元数据进行解码的方法和设备 |
CN105556597B (zh) * | 2013-09-12 | 2019-10-29 | 杜比国际公司 | 多声道音频内容的编码和解码 |
TW202514598A (zh) | 2013-09-12 | 2025-04-01 | 瑞典商杜比國際公司 | 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統 |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
WO2015037969A1 (ko) * | 2013-09-16 | 2015-03-19 | 삼성전자 주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
CN105745703B (zh) * | 2013-09-16 | 2019-12-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
KR101805630B1 (ko) * | 2013-09-27 | 2017-12-07 | 삼성전자주식회사 | 멀티 디코딩 처리 방법 및 이를 수행하기 위한 멀티 디코더 |
US10045135B2 (en) | 2013-10-24 | 2018-08-07 | Staton Techiya, Llc | Method and device for recognition and arbitration of an input connection |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
GB2524333A (en) * | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
CN105632505B (zh) * | 2014-11-28 | 2019-12-20 | 北京天籁传音数字技术有限公司 | 主成分分析pca映射模型的编解码方法及装置 |
JP6567691B2 (ja) * | 2015-05-20 | 2019-08-28 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | マルチチャネルオーディオ信号のコード化 |
CN105072588B (zh) * | 2015-08-06 | 2018-10-16 | 北京大学 | 全线性无纠错保护的多媒体数据组播方法 |
US12125492B2 (en) * | 2015-09-25 | 2024-10-22 | Voiceage Coproration | Method and system for decoding left and right channels of a stereo sound signal |
CN105844592A (zh) * | 2016-01-14 | 2016-08-10 | 辽宁师范大学 | 高光谱图像的小波域全变分混合去噪方法 |
WO2017125563A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for estimating an inter-channel time difference |
KR101968456B1 (ko) | 2016-01-26 | 2019-04-11 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 양자화 |
RU2638756C2 (ru) * | 2016-05-13 | 2017-12-15 | Кабусики Кайся Тосиба | Устройство кодирования, устройство декодирования, способ кодирования и способ декодирования |
EP3469588A1 (en) * | 2016-06-30 | 2019-04-17 | Huawei Technologies Duesseldorf GmbH | Apparatuses and methods for encoding and decoding a multichannel audio signal |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US11227615B2 (en) * | 2017-09-08 | 2022-01-18 | Sony Corporation | Sound processing apparatus and sound processing method |
CN110535497B (zh) * | 2018-08-10 | 2022-07-19 | 中兴通讯股份有限公司 | Csi发送、接收方法及其装置、通信节点及存储介质 |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
US20210224024A1 (en) * | 2020-01-21 | 2021-07-22 | Audiowise Technology Inc. | Bluetooth audio system with low latency, and audio source and audio sink thereof |
CN113948096A (zh) * | 2020-07-17 | 2022-01-18 | 华为技术有限公司 | 多声道音频信号编解码方法和装置 |
WO2022164229A1 (ko) * | 2021-01-27 | 2022-08-04 | 삼성전자 주식회사 | 오디오 처리 장치 및 방법 |
EP4243015A4 (en) | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | Audio processing device and method |
CN115223579A (zh) * | 2021-04-20 | 2022-10-21 | 华为技术有限公司 | 一种编解码器协商与切换方法 |
CN113282552B (zh) * | 2021-06-04 | 2022-11-22 | 上海天旦网络科技发展有限公司 | 流量统计日志的相似性向量化方法及系统 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
CN115346540B (zh) * | 2022-08-18 | 2025-02-14 | 北京百瑞互联技术股份有限公司 | 一种联合立体声音频编解码方法及装置 |
CN117746889B (zh) * | 2022-12-21 | 2025-01-28 | 行吟信息科技(武汉)有限公司 | 音频处理方法、装置、电子设备及存储介质 |
CN117730367A (zh) * | 2023-10-31 | 2024-03-19 | 北京小米移动软件有限公司 | 分组方法、编码器、解码器以及存储介质 |
Family Cites Families (137)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US728395A (en) * | 1900-05-24 | 1903-05-19 | Henry Howard | Evaporating apparatus. |
US4251688A (en) * | 1979-01-15 | 1981-02-17 | Ana Maria Furner | Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals |
EP0064119B1 (fr) | 1981-04-30 | 1985-08-28 | International Business Machines Corporation | Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné |
CA1253255A (en) | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
US4953196A (en) | 1987-05-13 | 1990-08-28 | Ricoh Company, Ltd. | Image transmission system |
US4907276A (en) | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5539829A (en) | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
JP2844695B2 (ja) | 1989-07-19 | 1999-01-06 | ソニー株式会社 | 信号符号化装置 |
JP2921879B2 (ja) | 1989-09-29 | 1999-07-19 | 株式会社東芝 | 画像データ処理装置 |
JP2560873B2 (ja) | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
US5388181A (en) | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
JP3033156B2 (ja) | 1990-08-24 | 2000-04-17 | ソニー株式会社 | ディジタル信号符号化装置 |
US5274740A (en) | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
US5559900A (en) | 1991-03-12 | 1996-09-24 | Lucent Technologies Inc. | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
US5487086A (en) | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
EP0559348A3 (en) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US5285498A (en) | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
JP3343965B2 (ja) * | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
JP3343962B2 (ja) | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
ES2165370T3 (es) | 1993-06-22 | 2002-03-16 | Thomson Brandt Gmbh | Metodo para obtener una matriz decodificadora multicanal. |
TW272341B (ja) | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
US5623577A (en) | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
DE4331376C1 (de) | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
KR960012475B1 (ko) | 1994-01-18 | 1996-09-20 | 대우전자 주식회사 | 디지탈 오디오 부호화장치의 채널별 비트 할당 장치 |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
DE4409368A1 (de) | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277677B2 (ja) | 1994-04-01 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置 |
US5635930A (en) | 1994-10-03 | 1997-06-03 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus and recording medium |
AU697176B2 (en) | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
US5629780A (en) | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
US5701389A (en) | 1995-01-31 | 1997-12-23 | Lucent Technologies, Inc. | Window switching based on interblock and intrablock frequency band energy |
JP3307138B2 (ja) | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
EP0820624A1 (en) | 1995-04-10 | 1998-01-28 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
US6940840B2 (en) * | 1995-06-30 | 2005-09-06 | Interdigital Technology Corporation | Apparatus for adaptive reverse power control for spread-spectrum communications |
US5790759A (en) | 1995-09-19 | 1998-08-04 | Lucent Technologies Inc. | Perceptual noise masking measure based on synthesis filter frequency response |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
DE19549621B4 (de) | 1995-10-06 | 2004-07-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Codieren von Audiosignalen |
US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5686964A (en) | 1995-12-04 | 1997-11-11 | Tabatabai; Ali | Bit rate control mechanism for digital image and video data compression |
US5687191A (en) | 1995-12-06 | 1997-11-11 | Solana Technology Development Corporation | Post-compression hidden data transport |
US5682152A (en) | 1996-03-19 | 1997-10-28 | Johnson-Grace Company | Data compression using adaptive bit allocation and hybrid lossless entropy encoding |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
US5822370A (en) * | 1996-04-16 | 1998-10-13 | Aura Systems, Inc. | Compression/decompression for preservation of high fidelity speech quality at low bandwidth |
DE19628293C1 (de) | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
DE19628292B4 (de) | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
US5969750A (en) | 1996-09-04 | 1999-10-19 | Winbcnd Electronics Corporation | Moving picture camera with universal serial bus interface |
US5745275A (en) * | 1996-10-15 | 1998-04-28 | Lucent Technologies Inc. | Multi-channel stabilization of a multi-channel transmitter through correlation feedback |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
KR100488537B1 (ko) | 1996-11-20 | 2005-09-30 | 삼성전자주식회사 | 듀얼모드오디오디코더의재현방법및필터 |
FI970266A7 (fi) * | 1997-01-22 | 1998-07-23 | Nokia Corp | Menetelmä solukkoradiojärjestelmän ohjauskanavien kantaman pidentämiseksi ja solukkoradiojärjestelmä |
ES2178142T3 (es) | 1997-02-08 | 2002-12-16 | Matsushita Electric Ind Co Ltd | Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento. |
JP3143406B2 (ja) | 1997-02-19 | 2001-03-07 | 三洋電機株式会社 | 音声符号化方法 |
KR100265112B1 (ko) * | 1997-03-31 | 2000-10-02 | 윤종용 | 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법 |
US6064954A (en) | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
CN1205842C (zh) | 1997-04-10 | 2005-06-08 | 索尼株式会社 | 编码方法和装置、解码方法和装置 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6185253B1 (en) | 1997-10-31 | 2001-02-06 | Lucent Technology, Inc. | Perceptual compression and robust bit-rate control system |
US6959220B1 (en) | 1997-11-07 | 2005-10-25 | Microsoft Corporation | Digital audio signal filtering mechanism and method |
EP1057292B1 (en) | 1998-02-21 | 2004-04-28 | STMicroelectronics Asia Pacific Pte Ltd. | A fast frequency transformation techique for transform audio coders |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6249614B1 (en) | 1998-03-06 | 2001-06-19 | Alaris, Inc. | Video compression and decompression using dynamic quantization and/or encoding |
US6353807B1 (en) * | 1998-05-15 | 2002-03-05 | Sony Corporation | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
US6029126A (en) | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
JP3998330B2 (ja) | 1998-06-08 | 2007-10-24 | 沖電気工業株式会社 | 符号化装置 |
DE19840835C2 (de) | 1998-09-07 | 2003-01-09 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6300888B1 (en) | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6611212B1 (en) * | 1999-04-07 | 2003-08-26 | Dolby Laboratories Licensing Corp. | Matrix improvements to lossless encoding and decoding |
US6246345B1 (en) | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US6370502B1 (en) | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US6658162B1 (en) | 1999-06-26 | 2003-12-02 | Sharp Laboratories Of America | Image coding method using visual optimization |
US6418405B1 (en) * | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6496798B1 (en) | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
AU2018201A (en) | 1999-10-12 | 2001-04-23 | Perception Digital Technology (Bvi) Limited | Digital multimedia jukebox |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
US7096240B1 (en) * | 1999-10-30 | 2006-08-22 | Stmicroelectronics Asia Pacific Pte Ltd. | Channel coupling for an AC-3 encoder |
US6738074B2 (en) | 1999-12-29 | 2004-05-18 | Texas Instruments Incorporated | Image compression system and method |
US6499010B1 (en) | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6434190B1 (en) * | 2000-02-10 | 2002-08-13 | Texas Instruments Incorporated | Generalized precoder for the upstream voiceband modem channel |
DE60132853D1 (de) | 2000-07-07 | 2008-04-03 | Nokia Siemens Networks Oy | Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation |
DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
US7103537B2 (en) * | 2000-10-13 | 2006-09-05 | Science Applications International Corporation | System and method for linear prediction |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US6463408B1 (en) | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
US7062445B2 (en) | 2001-01-26 | 2006-06-13 | Microsoft Corporation | Quantization loop with heuristic approach |
US20040062401A1 (en) | 2002-02-07 | 2004-04-01 | Davis Mark Franklin | Audio channel translation |
US7254239B2 (en) | 2001-02-09 | 2007-08-07 | Thx Ltd. | Sound system and method of sound reproduction |
CA2443837C (en) | 2001-04-13 | 2012-06-19 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
AU2002240461B2 (en) | 2001-05-25 | 2007-05-17 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7027982B2 (en) | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7460993B2 (en) | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030215013A1 (en) | 2002-04-10 | 2003-11-20 | Budnikov Dmitry N. | Audio encoder with adaptive short window grouping |
US7072726B2 (en) | 2002-06-19 | 2006-07-04 | Microsoft Corporation | Converting M channels of digital audio data into N channels of digital audio data |
JP4322207B2 (ja) | 2002-07-12 | 2009-08-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化方法 |
BR0305555A (pt) | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
BRPI0305710B1 (pt) * | 2002-08-01 | 2017-11-07 | Panasonic Corporation | "apparatus and method of decoding of audio" |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
DE60303689T2 (de) * | 2002-09-19 | 2006-10-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiodecodierungsvorrichtung und -verfahren |
KR20040060718A (ko) | 2002-12-28 | 2004-07-06 | 삼성전자주식회사 | 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체 |
ATE355590T1 (de) * | 2003-04-17 | 2006-03-15 | Koninkl Philips Electronics Nv | Audiosignalsynthese |
AU2003222397A1 (en) * | 2003-04-30 | 2004-11-23 | Nokia Corporation | Support of a multichannel audio extension |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US6790759B1 (en) * | 2003-07-31 | 2004-09-14 | Freescale Semiconductor, Inc. | Semiconductor device with strain relieving bump design |
US7519538B2 (en) * | 2003-10-30 | 2009-04-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
ES2324926T3 (es) * | 2004-03-01 | 2009-08-19 | Dolby Laboratories Licensing Corporation | Descodificacion de audio multicanal. |
US7602922B2 (en) * | 2004-04-05 | 2009-10-13 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
DE602004028171D1 (de) * | 2004-05-28 | 2010-08-26 | Nokia Corp | Mehrkanalige audio-erweiterung |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
ATE429698T1 (de) * | 2004-09-17 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten tonsignalen |
US20060259303A1 (en) * | 2005-05-12 | 2006-11-16 | Raimo Bakis | Systems and methods for pitch smoothing for text-to-speech synthesis |
WO2007043808A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
US20070168197A1 (en) | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
-
2006
- 2006-01-20 US US11/336,606 patent/US7831434B2/en active Active
-
2007
- 2007-01-03 WO PCT/US2007/000021 patent/WO2007087117A1/en active Application Filing
- 2007-01-03 JP JP2008551278A patent/JP2009524108A/ja active Pending
- 2007-01-03 CN CN201210102938.5A patent/CN102708868B/zh active Active
- 2007-01-03 AU AU2007208482A patent/AU2007208482B2/en not_active Ceased
- 2007-01-03 CN CN2007800025670A patent/CN101371447B/zh active Active
- 2007-01-03 RU RU2011108927/08A patent/RU2555221C2/ru active
- 2007-01-03 KR KR1020087017475A patent/KR101143225B1/ko active Active
- 2007-01-03 EP EP07716205A patent/EP1974470A4/en not_active Ceased
- 2007-01-03 CA CA2637185A patent/CA2637185C/en active Active
- 2007-01-03 RU RU2008129802/09A patent/RU2422987C2/ru active
-
2010
- 2010-10-19 US US12/907,889 patent/US9105271B2/en active Active
- 2010-12-03 AU AU2010249173A patent/AU2010249173B2/en active Active
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009530651A (ja) * | 2006-03-15 | 2009-08-27 | フランス テレコム | 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法 |
US10037766B2 (en) | 2011-06-30 | 2018-07-31 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwith extension signal |
US9349380B2 (en) | 2011-06-30 | 2016-05-24 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
JP2016197271A (ja) * | 2011-06-30 | 2016-11-24 | サムスン エレクトロニクス カンパニー リミテッド | 帯域幅拡張信号の復号化装置 |
US9734843B2 (en) | 2011-06-30 | 2017-08-15 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
JP2018025830A (ja) * | 2011-06-30 | 2018-02-15 | サムスン エレクトロニクス カンパニー リミテッド | 帯域幅拡張信号の復号化装置 |
JP2014523548A (ja) * | 2011-06-30 | 2014-09-11 | サムスン エレクトロニクス カンパニー リミテッド | 帯域幅拡張信号生成装置及びその方法 |
JP2019148807A (ja) * | 2015-07-31 | 2019-09-05 | アップル インコーポレイテッドApple Inc. | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 |
JP2021529354A (ja) * | 2018-07-04 | 2021-10-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
JP7384893B2 (ja) | 2018-07-04 | 2023-11-21 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
US12367883B2 (en) | 2018-07-04 | 2025-07-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal audio coding using signal whitening as processing |
US20230124006A1 (en) * | 2021-10-15 | 2023-04-20 | Lemon Inc. | System and method for training a transformer-in-transformer-based neural network model for audio data |
US11854558B2 (en) * | 2021-10-15 | 2023-12-26 | Lemon Inc. | System and method for training a transformer-in-transformer-based neural network model for audio data |
Also Published As
Publication number | Publication date |
---|---|
CN101371447B (zh) | 2012-06-06 |
RU2422987C2 (ru) | 2011-06-27 |
AU2010249173A1 (en) | 2010-12-23 |
CA2637185C (en) | 2014-03-25 |
US20110035226A1 (en) | 2011-02-10 |
RU2011108927A (ru) | 2012-09-20 |
US20070174062A1 (en) | 2007-07-26 |
EP1974470A4 (en) | 2010-12-15 |
CN101371447A (zh) | 2009-02-18 |
CA2637185A1 (en) | 2007-08-02 |
US9105271B2 (en) | 2015-08-11 |
US7831434B2 (en) | 2010-11-09 |
RU2008129802A (ru) | 2010-01-27 |
HK1176455A1 (zh) | 2013-07-26 |
EP1974470A1 (en) | 2008-10-01 |
CN102708868B (zh) | 2016-08-10 |
RU2555221C2 (ru) | 2015-07-10 |
AU2010249173B2 (en) | 2012-08-23 |
AU2007208482B2 (en) | 2010-09-16 |
KR101143225B1 (ko) | 2012-05-21 |
WO2007087117A1 (en) | 2007-08-02 |
KR20080093994A (ko) | 2008-10-22 |
CN102708868A (zh) | 2012-10-03 |
AU2007208482A1 (en) | 2007-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7831434B2 (en) | Complex-transform channel coding with extended-band frequency coding | |
US7953604B2 (en) | Shape and scale parameters for extended-band frequency coding | |
US8190425B2 (en) | Complex cross-correlation parameters for multi-channel audio | |
US8046214B2 (en) | Low complexity decoder for complex transform coding of multi-channel sound | |
US8249883B2 (en) | Channel extension coding for multi-channel source | |
US9741354B2 (en) | Bitstream syntax for multi-process audio decoding | |
US7860720B2 (en) | Multi-channel audio encoding and decoding with different window configurations | |
US7299190B2 (en) | Quantization and inverse quantization for audio | |
US8255234B2 (en) | Quantization and inverse quantization for audio | |
KR20070098930A (ko) | 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성 | |
HK1176455B (en) | Complex-transform channel coding with extended-band frequency coding | |
MX2008009186A (en) | Complex-transform channel coding with extended-band frequency coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120907 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121207 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121214 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130107 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130115 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130207 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130307 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20130308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130308 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130423 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130701 |