[go: up one dir, main page]

JP5576021B2 - 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ - Google Patents

携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ Download PDF

Info

Publication number
JP5576021B2
JP5576021B2 JP2007542996A JP2007542996A JP5576021B2 JP 5576021 B2 JP5576021 B2 JP 5576021B2 JP 2007542996 A JP2007542996 A JP 2007542996A JP 2007542996 A JP2007542996 A JP 2007542996A JP 5576021 B2 JP5576021 B2 JP 5576021B2
Authority
JP
Japan
Prior art keywords
audio
processor
frequency range
decoding
clip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007542996A
Other languages
English (en)
Other versions
JP2008522214A5 (ja
JP2008522214A (ja
Inventor
イェ・ワン
サマルジット・チャクラボルティ
ファン・ウェンドン
Original Assignee
ナショナル ユニヴァーシティー オブ シンガポール
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナショナル ユニヴァーシティー オブ シンガポール filed Critical ナショナル ユニヴァーシティー オブ シンガポール
Publication of JP2008522214A publication Critical patent/JP2008522214A/ja
Publication of JP2008522214A5 publication Critical patent/JP2008522214A5/ja
Application granted granted Critical
Publication of JP5576021B2 publication Critical patent/JP5576021B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、概して、マルチメディア・アプリケーションにおける低電力復号に関する。具体的には、オーディオ・データを復号するための方法と装置、及びオーディオ・データを復号するためのコンピュータ・プログラムを記録しているコンピュータ読取り可能媒体を含むコンピュータ・プログラム・プロダクトに関する。
携帯電話、携帯情報端末(PDA)及び携帯オーディオ・プレーヤ等の携帯用コンシューマ電子機器の多くは、内蔵式のコンピュータ・システムを備えることがますます増えている。これらの内蔵式コンピュータ・システムは、典型的には、汎用コンピュータ・ハードウェア・プラットフォームまたはアーキテクチャ・テンプレートに従って設定される。これらのコンシューマ電子機器間の唯一の相違点は、通常は、特定の機器上で実行されているソフトウェア・アプリケーションである。さらに、幾つかの異なる機能性を集めて1つの機器にすることも増えている。例えば、携帯電話の中には、情報端末(PDA)及び/または携帯オーディオ・プレーヤとして動作するものもある。従って、携帯用内蔵式コンピュータ・システムの分野における焦点は、異なるアプリケーションのための専用ハードウェアではなく、異なる機能性の適切なソフトウェア実装へと移ってきた。
このような携帯用機器にとって、携帯用機器に内蔵されるコンピュータ・システムの電力消費は、おそらくは、ハードウェア及びソフトウェアの双方の設計において最も重要な制約である。携帯用機器に内蔵されるコンピュータ・システムの電力消費を最小限に抑える1つの周知方法は、内蔵されるコンピュータ・システムのプロセッサの電圧及び周波数(即ち、クロック周波数)をマルチメディア・ストリームの処理に必要な可変ワークロードに応じて動的にスケーリングするというものである。
携帯用機器に内蔵されるコンピュータ・システムの電力消費を最小限に抑える別の周知方法は、バッファを使用してマルチメディア・ストリームを平坦化しかつ異なる処理速度を有する2つの構成成分を分離するというものである。これは、内蔵プロセッサが周期的にオフ切換されることを有効化し、またはプロセッサがより低い周波数で実行されることを有効化し、これにより、エネルギーを節約する。また、マルチメディア・アプリケーションに関連づけられるサービス品質(QoS)要件を維持すると同時に内蔵式コンピュータ・システムの電力消費を最小限に抑えるという課題に対処する既知のスケジューリング方法も幾つか存在する。
ほとんどの知覚オーディオ・コーダ/デコーダ(即ち、コーデック)は、少なくとも高いビットレートにおいてトランスペアレントなオーディオ品質を達成するように設計される。MP3等の高品質オーディオ・コーデックの周波数レンジは、約20kHzまでである。しかしながら大部分の大人は、高齢者であれば特に、16kHzより上の周波数成分をほとんど聞きとることができない。MP3デコーダ等の標準デコーダは、聴力損失の有無に関わらず、個々のユーザの聴力の能力を考慮することなく、入力されるビット・ストリーム内の全てを単に復号する。その結果、関係のない計算量は多大なものとなり、よって、携帯用コンピューティング・デバイスまたはこのようなデコーダを使用する類似デバイスの電池電力が浪費される。
本発明の目的は、既存装置における1つまたは複数の欠点を実質的に克服する、または少なくとも改善することにある。
本発明のある態様によれば、オーディオ・クリップを表すオーディオ・データを復号する方法が提供されていて、上記方法は、
予め決められた数の周波数帯のうちの1つを選択するステップと、
上記選択される周波数帯に従って上記オーディオ・クリップを表すオーディオ・データの一部を復号するステップと、
を含み、
上記オーディオ・クリップを表すオーディオ・データの残りの部分は放棄され、かつ、
上記復号されるオーディオ・データの部分を上記復号されるオーディオ・データを表すサンプル・データに変換するステップと、を含む。
本発明の別の態様によれば、オーディオ・クリップを表すオーディオ・データを復号するためのデコーダが提供されていて、上記方法は、
予め決められた数の周波数帯のうちの1つを選択するための復号レベル選択手段と、
上記選択される周波数帯に従って上記オーディオ・クリップを表すオーディオ・データの一部を復号するための復号手段と、
を含み、
上記オーディオ・クリップを表すオーディオ・データの残りの部分は放棄され、かつ、
上記復号されるオーディオ・データの部分を上記復号されるオーディオ・データを表すサンプル・データに変換するためのデータ変換手段と、を含む。
本発明のさらに別の態様によれば、携帯用電子デバイスが提供されていて、上記デバイスは、
予め決められた数の周波数帯のうちの1つを選択するための復号レベル選択手段と、
上記選択される周波数帯に従って上記オーディオ・クリップを表すオーディオ・データの一部を復号するための復号手段と、
を備え、
上記オーディオ・クリップを表すオーディオ・データの残りの部分は放棄され、かつ、
上記復号されるオーディオ・データの部分を上記復号されるオーディオ・データを表すサンプル・データに変換するためのデータ変換手段と、を備える。
また、本発明の他の態様も開示されている。
次に、添付の図面を参照し、本発明の1つまたは複数の実施形態について説明する。
添付の図面における任意の1つまたはそれ以上において、同じ引用符号を有するステップ及び/または特徴が言及される場合、これらのステップ及び/または特徴は、反対の意図が明らかでない限り、本明細書の目的に沿って同じ機能または動作を有する。
「背景」部分に記述されている議論及び先に述べた先行技術装置に関する議論は、これらの個々の刊行物及び/または使用法を通じて公知となっている文書またはデバイスの議論に関連するものであるということも注意すべきである。しかしながら、このような議論によって、本件の発明者または特許出願者は、こうした文書またはデバイスを多少なりとも技術上共通の一般的知識の一部を形成するものとして表現している、と解釈されるべきではない。
ほとんどの知覚オーディオ・コーダ/デコーダ(即ち、コーデック)は、少なくとも高いビットレートにおいてトランスペアレントなオーディオ品質を達成するように設計される。MP3等の高品質オーディオ・コーデックの周波数レンジは、約20kHzまでである。しかしながら大部分の大人は、高齢者であれば特に、16kHzより上の周波数成分をほとんど聞きとることができない。従って、知覚的に見当はずれの周波数成分を決定することは不必要である。さらに、ほとんどの人が聞き取れる広い周波数帯内では、帯域によって、他の帯域より音が大きく印象に残るものがある。概して、高い周波数帯域は、知覚的には低い周波数帯域ほど重要ではない。幾分かの高周波数成分が復号されずに残ったとしても、知覚的な低下はほとんどない。MP3デコーダ等の標準デコーダは、聴力損失の有無に関わらず、個々のユーザの聴力の能力を考慮することなく、入力されるビット・ストリーム内の全てを単に復号する。その結果、関係のない計算量は多大なものとなり、よって、携帯用コンピューティング・デバイスまたはこのようなデコーダを使用する類似デバイスの電池電力が浪費される。
以下、図1から図8までを参照して、好適な実施形態により、コード化されたビット・ストリームの形式のオーディオ・データを復号する方法800について説明する。本明細書において説明する好適な方法800の原理は、既存のほとんどのオーディオ・フォーマットに対して一般的な適用可能性を有する。但し、説明を容易にするために、好適な方法800のステップを、MP3オーディオ・フォーマットとしても知られるMPEG1、第3層のオーディオ・フォーマットに関連して説明する。MP3は非スケーラブルなコーデックであり、広範に普及している。方法800は、特に、MP3等の非スケーラブル・コーデックに、またアドバンスト・オーディオ・コーディング(AAC)にも適用可能である。非スケーラブルなコーデックは課せられるワークロードが低く、典型的には基層のみが復号されてエンハンスメント層は無視されるMPEG−4のスケーラブル・コーデック等のスケーラブル・コーデックより人気が高い。
方法800は、所望されるオーディオ品質に関する個々のユーザの固有の判断を組み込み、ユーザが複数の出力品質レベル間を切換できるようにする。このような各レベルは各々異なるレベルの電力消費に、従って電池の寿命に関連づけられる。ここで説明している方法800は、異なるレベルに関連している感知される出力品質の差が比較的少ない、という意味において、知覚意識型である。但し、コード化されたビット・ストリームの形式のオーディオ・クリップ等の、この同じオーディオ・データをより低い出力品質において復号することは、携帯用機器に内蔵されるプロセッサが消費するエネルギーを大幅に節約することになる。
およそオーディオ・コーデックの知覚品質を評価するためには、厳密な主観的聴き取りテストが実行される。これらのテストは、通常、聴力損失のない、専門家である聞き手またはパネラーが高品質のヘッドホンを使用して、静かな環境において実行される。しかしながら、一般的なユーザにとっての現実の環境は、通常、これとはかなり異なる。まず、携帯オーディオ・プレーヤが、例えば家庭の居間におけるような静かな環境で使用されることは比較的まれである。むしろ、携帯オーディオ・プレーヤは、移動中及びバス、列車または飛行機の中等の様々な環境において、単純なイヤホンを用いて使用されることの方が遙かに一般的である。これらの相違には、必要とされるオーディオ品質に関して重要な含むところがある。
本発明者らが行った実験によれば、ほとんどのユーザにとって、騒がしい環境においてコンパクト・ディスク(CD)と周波数変調(FM)品質のオーディオとを区別することは困難である。このような環境では、ほとんどのユーザが少しぐらいの品質低下には寛大であるように思われる。方法800は、ユーザがリスニング環境に合わせて復号プロファイルを変えることを有効化するが、標準MP3デコーダにはこれができない。
異なるアプリケーション及び信号は、異なる帯域を必要とする。例えば、物語を話すオーディオ・クリップに必要な帯域幅は、音楽クリップに比べて格段に少ない。方法800は、ユーザが特定のサービス及び信号タイプに合わせて適切な復号プロファイルを選ぶことを可能にし、同じく、方法800を使用する携帯用コンピューティング・デバイスの電池寿命を延ばす。方法800は、ユーザが、オーディオ品質の僅かな低下(この低下は、特定のユーザには知覚できない程度のものである)によって、例えば携帯オーディオ・プレーヤの電池寿命を大幅に延ばすことができる、ということを承知の上で、電池寿命と復号されるオーディオ品質とのかね合いを制御することを可能にする。この特徴は、ユーザが、その聴能、リスニング環境及びサービス・タイプに従って、復号されるオーディオの容認できる品質レベルを調整することを可能にする。例えば、静かな環境では、ユーザは電力消費が増えても完璧なサウンド品質の方を求めるかもしれない。反対に、長距離飛行の間は、ユーザはオーディオ品質が少々低下しても、より長い電池寿命の方を好むかもしれない。
方法800は、好適には、図1に示すもの等の電池式携帯用コンピューティング・デバイス100(例えば、携帯オーディオ(またはマルチメディア)プレーヤ、携帯(マルチメディア)電話、PDAまたはこれらに類似するもの)を使用して実施される。図2から8までに示されるプロセスは、携帯用コンピューティング・デバイス100内で実行されるソフトウェア・プログラム等のソフトウェアとして実装されてもよい。具体的には、方法800の諸ステップは、携帯用コンピューティング・デバイス100により実行されるソフトウェア内の命令によって実行される。命令は、各々が1つまたは複数の特定のタスクを実行するための1つまたは複数のソフトウェア・モジュールとして形成されてもよい。ソフトウェアは、第1の部分が方法800を実行しかつ第2の部分が上記第1の部分とユーザとの間のユーザ・インタフェースを管理する、2つの別々の部分に分割されてもよい。ソフトウェアは、例えば、後述する格納デバイスを含むコンピュータ読取り可能媒体に格納されてもよい。ソフトウェアは、例えば、メーカーによってコンピュータ読取り可能媒体からシリアル・リンクを介して携帯用コンピューティング・デバイス100へロードされ、次に携帯用コンピューティング・デバイス100によって実行されてもよい。このようなソフトウェアを有する、またはコンピュータ・プログラムが記録されているコンピュータ読取り可能媒体は、コンピュータ・プログラム・プロダクトである。コンピュータ・システム100におけるコンピュータ・プログラム・プロダクトの使用は、好適には、説明している方法800を実装するための効果的な装置に影響を与える。
携帯用コンピューティング・デバイス100は、少なくとも1つのプロセッサ・ユニット105と、例えば半導体ランダム・アクセス・メモリ(RAM)及び読取り専用メモリ(ROM)から形成されるメモリ・ユニット106とを含む。また、携帯用コンピューティング・デバイス100は、キーパッド102と、液晶ディスプレイ(LCD)等のディスプレイ114と、スピーカ117と、マイクロホン113とを備えてもよい。携帯用コンピューティング・デバイス100は、好適には電池によって電力を供給される。トランシーバ・デバイス116は、携帯用コンピューティング・デバイス100により、例えば無線通信チャネル121または他の機能媒体を介して接続可能な通信ネットワーク120(例えば、電気通信ネットワーク)を相手に通信し合うために使用される。携帯用コンピューティング・デバイス100のコンポーネント105から117までは、典型的には、相互接続バス104を介して通信する。
典型的には、アプリケーション・プログラムはメモリ・デバイス106のROMに存在し、その実行中はプロセッサ105によって読取られ、かつ、制御される。さらに、ソフトウェアは、他のコンピュータ読取り可能媒体から携帯用コンピューティング・デバイス100へロードされる場合もある。本明細書において使用している「コンピュータ読取り可能媒体」という用語は、命令及び/またはデータを実行及び/または処理するためにこれらを携帯用コンピューティング・デバイス100へ供給することに関与する任意の格納または送信媒体を指す。
或いは、方法800は、説明している方法800の機能またはサブ機能を実行する1つまたは複数の集積回路を備える専用ハードウェア・ユニット内に実装されてもよい。
方法800によれば、任意のオーディオ・クリップを復号するためにユーザにより選択される復号レベルは、プロセッサ105が実行されるべき周波数を決定する。多くの既知の動的な電圧/周波数スケーリング方法とは対照的に、方法800は、プロセッサ105の電圧または周波数のランタイム・スケーリングを含まない。プロセッサ105が固定数の電圧−周波数動作点を有していれば、方法800における復号レベルはこれらの動作点に一致するように同調されてもよい。
方法800において、内部に実装されるオーディオ・デコーダ(例えば、MP3デコーダ)を含む携帯用コンピューティング・デバイス100の周波数帯域幅は、復号レベルの数に等しい数のグループに仕切られる。これらのグループは、好適には、後に詳述するその知覚関連度に従って順序づけられる。復号に4つのレベル(即ち、レベル1から4まで)が存在すれば、最も高い知覚関連度を有する周波数帯域幅グループはレベル1に関連づけられてもよく、最も低い知覚関連度を有するグループはレベル4に関連づけられてもよい。MP3のケースにおける周波数帯域幅のこのような4つのレベルへの分割を下記の表1に示す。以下、表1の第2欄(即ち、復号されるサブバンドの指数)について説明する。
Figure 0005576021
方法800の諸ステップを実装するプロセッサ105は、「知覚意識型低電力MP3(PL−MP3)」デコーダと呼んでもよい。方法800は、汎用電圧/周波数スケーラブル・プロセッサだけでなく、電圧/周波数スケーラビリティのない汎用プロセッサにも有用である。
また方法800は、周波数スケーリングを許容せず完全なMP3復号を実行するほど強力ではないプロセッサによって使用されてもよい。その場合、方法800は、正規MP3ファイルを比較的低い品質で復号するために使用されてもよい。
方法800は、プロセッサ105により供給される処理電力に依存して、ユーザが復号レベル(即ち、このような4レベルのうちの1つ)を選べるようにする。方法800は、プロセッサ105により、ユーザが選ぶ復号レベルを基礎として実行される。各レベルは、異なるレベルの電力消費及び対応する出力オーディオ品質レベルに関連づけられる。プロセッサ105は、コード化されたビット・ストリーム形式のオーディオ・データを入力として採用し、図2に示すように、パルス・コード変調(PCM)サンプル形式の復号されたデータ・ストリームを生成する。方法800は、ネットワークからダウンロードされつつある、または流されつつあるコード化されたビット・ストリームを復号するために適用されてもよい。また、方法800は、例えば携帯用コンピューティング・デバイス100のメモリ106内に格納されるコード化されたビット・ストリーム形式のオーディオ・クリップを復号するために使用されてもよい。
コード化されたビット・ストリーム形式のオーディオ・クリップがレベル1で復号される場合は、このレベルに関連づけられる0から5512.5Hzまでの周波数レンジのみが復号される。より高いレベル(即ち、レベル2から3まで)では、より大きい周波数レンジが復号され、最後にレベル4では、周波数レンジ全体が復号される。方法800に関連づけられる計算ワークロードは復号レベルに伴ってほぼ直線的にスケーリングするが、先に述べたように、より低い周波数レンジは、より高い周波数レンジに比べて格段に高い知覚関連度を有する。従って、オーディオ・クリップがより低いレベルで復号される場合には、出力品質のほんの僅かな部分を犠牲にするだけで、プロセッサ105は、より高い復号レベルに比べて遙かに低い周波数(即ち、クロック周波数)及び電圧で実行されることが可能である。
近年、オーディオ・デコーダのハードウェア実装が幾つか開発されている。これらのハードウェア実装の中には、超低電力消費用に設計されている有線デコーダ・チップを含むものがある。このようなデコーダ・チップの一例として、Atmel Corporation(登録商標)の超低電力MP3デコーダがあるが、これは、特に携帯電話におけるMP3リング・トーンを扱うために設計されたものである。
方法800は、方法800の諸ステップを実装するソフトウェアを実行するプロセッサ105の電力消費を低減する。方法800は、特定のデコーダ部分を実装する任意の特定のハードウェア実装または任意のコプロセッサに依存しない。方法800は、全て携帯オーディオ/ビデオ・プレーヤとして使用され得るPDA、携帯オーディオ・プレーヤまたは携帯電話及び強力な電圧及び周波数スケーラブル・プロセッサを含むこれらに類似するものによる使用に極めて有用である。
他の多くのマルチメディア・ビット・ストリームのように、MP3ビット・ストリームは、図3に示すようなフレーム構造を有する。MP3ビット・ストリームのフレーム300は、ヘッダ301と、任意選択のエラー防止用CRC302と、サイド情報303としてコード化される制御ビット集合と、これに続く、MP3における基本コーディング・ユニットである2つのグラニュール(即ち、グラニュール0及びグラニュール2)から成るメイン・データ304とを含む。ステレオ・オーディオの場合、各グラニュール(例えば、グラニュール1)は、スケール係数305及びハフマン・コードのスペクトル・データ306から成る2つのチャネルのためのデータを含む。また、各フレームの終わりに、何らかの補助データを有することも可能である。方法800は、このようなMP3ビット・ストリームをフレーム毎に、またはグラニュール毎に処理する。
次に、図8を参照して、オーディオ・データを復号する方法800について説明する。方法800は、ROM106に常駐しかつその実行中はプロセッサ105によって制御されているソフトウェアとして実装されてもよい。方法800を実装する携帯用コンピューティング・デバイス100は、図4に示すように、標準MP3オーディオ・デコーダ400に従って構成されてもよい。方法800のステップは各々、別々のソフトウェア・モジュールを使用して実装されてもよい。
方法800は、表1の4つの復号レベル(即ち、レベル1から4まで)のうちの1つが選択される第1のステップ801において開始される。例えば、携帯用コンピューティング・デバイス100のユーザは、キーパッド102を使用して4つの復号レベルのうちの1つを選択してもよい。プロセッサ105は、メモリ106のRAM内に、4つの復号レベルのうちのどれが選択されているかを示すフラグを格納してもよい。
次のステップ802では、プロセッサ105は、コード化された入力ビット・ストリーム形式のデータをパースし、上記データを、メモリ106内に構成される内部バッファ500(図5参照)内に格納する。内部バッファ500については、後に詳述する。次に、ステップ803において、プロセッサ105はハフマン復号を使用して、格納されたデータのサイド情報を復号する。ステップ803は、図4に示すように、標準MP3デコーダ400のハフマン復号ソフトウェア・モジュール401等のソフトウェア・モジュールを使用して実行されてもよい。
方法800は次のステップ804へ続き、ここでプロセッサ105は、復号されたオーディオ・データの周波数帯域を、ステップ801で選択された復号レベルに従ってPCMオーディオ・サンプルへ変換する。例えば、ステップ801でレベル1が選択されていれば、ステップ804において、0から5512.5Hzまでの周波数レンジ内の復号されたオーディオ・データがPCMオーディオ・サンプルへ変換される。ステップ804は、図4に示すような標準MP3デコーダ400の逆量子化ソフトウェア・モジュール402、逆修正離散コサイン変換(IMDCT)ソフトウェア・モジュール403及び多相合成ソフトウェア・モジュール404等のソフトウェア・モジュールによって実行されてもよい。
方法800は次のステップ805で完了し、ここで、プロセッサ105はPCMオーディオ・サンプルをメモリ106内に構成される再生バッファ501(図5参照)へ書き込む。この再生バッファ501は、次に、プロセッサ105によって何らかの指定された速度で読み取られ、スピーカ117を介してオーディオとして出力されてもよい。
最も高いワークロードがかかる標準MP3デコーダ400の3つのモジュールは、逆量子化モジュール402、IMDCTモジュール403及び多相合成フィルタバンク・モジュール404である。伝統的に、標準MP3デコーダ400は、最も高い計算ワークロードに対応する周波数帯域全体を復号する。図4に示すように、好適な方法800では、復号レベル(即ち、レベル1から3まで)に依存して、逆量子化モジュール402、IMDCTモジュール403及び多相合成フィルタバンク・モジュール403は部分的な周波数レンジしか処理せず、これにより、計算コストを下げる。
メモリ及び/または計算効率的実装に使用される既知の最適化方法には、刊行物「ゼロ計算の非実行:効率的なホームスパンMPEGオーディオ第II層復号及び最適化方針」2004年ACMマルチメディア会報、2004年10月、においてDe Smet等が説明している「Do Not Zero−Pute」アルゴリズム等、幾つかの方法が存在する。「Do Not Zero−Pute」アルゴリズムは、無駄なゼロ値データの処理で浪費されている高コストの計算サイクルをなくすることにより、MPEG1第II層における多相フィルタバンク計算を最適化しようとするものである。本発明者らは、この種のアプローチを冗長計算を排除するものとして分類している。これに対して、方法800は、異なる知覚関連度を有する周波数帯域に従ってワークロードを分割し、ユーザが無関係の計算をなくすることができるようにする。
以下、計算上最も要求の多い3つのモジュール、即ち、逆量子化モジュール402、IMDCTモジュール403及び多相合成フィルタバンク・モジュール404におけるワークロードの低減を、式(1)から(4)で表現する。
1つのグラニュールの逆量子化のためにプロセッサ105により実行されなければならない計算(ロング・ブロックの場合)は、次のような式(1)で表される。
Figure 0005576021
但し、isは逆量子化されているi番目の入力係数であり、sign(is)はisの符号であり、global_gainはグラニュールgr全体の対数型量子化器のステップ・サイズである。Scalefac_multiplierは、スケール係数帯の乗算器である。Scalefac_lは、グラニュールgrのチャネルchのスケール係数帯sfbの対数量子化係数である。preflagは、量子化値の追加的な高周波数増幅のフラグである。pretabは、スケール係数帯のプリエンファシス表である。xrは、i番目の逆量子化係数である。
方法800の諸ステップを実行しない標準MP3デコーダ400の場合、i=0,1,...,N−1,N=576,であるが、方法800の諸ステップを実行するデコーダ400のプロセッサ105の場合、i=0,1,...,sbl18−1である。例えば、レベル1のレンジは、i=0,1,...,143まで減る。
IMDCTモジュール403に必要な計算は、式(2)に従って次のように表すことができる。
Figure 0005576021
但し、=0,1,...,n−1,n=36,であり、XはIMDCT演算のk番目の入力係数であり、xはi番目の出力係数である。方法800を実行しない標準MP3デコーダ400の場合、32サブバンド全体が決定されるが、好適な方法800では、
sbl≦32サブバンドしか計算されない。
多相合成フィルタバンク・モジュール404の行列演算に必要な計算は、下記式のように表される。
Figure 0005576021
方法800によれば、式(3)は、次のような式(4)になる。
Figure 0005576021
但し、Sは多相合成演算のk番目の入力係数であり、Vはi番目の出力係数である。式(4)は、方法800を実装するプロセッサ105の計算ワークロードが帯域幅に伴って線形的に低減することを示す。
合計計算ワークロードの僅かな比率(本件の例では4%)しか必要としないステップ802による(即ち、ハフマン復号モジュール401が実行するような)ビット・ストリームの解凍の後は、後続ステップ804に関連づけられる(即ち、モジュール402、403及び404が実行するような)ワークロードを分割することができる。細分性は、MPEG1オーディオ標準に規定されている32サブバンドの全てに対応するものが選択されてもよい。しかしながら、簡略にするために、好適な方法800では、これらの32サブバンドは、図4及び表1に示すように、各グループが1つの復号レベルに対応する僅か4つのグループに分割される。
先に述べたように、復号レベル1は、基層として定義することのできる最も低い周波数帯域幅(0から5.5kHzまで)をカバーする。基層は合計帯域幅の4分の1しか占有せず、オーディオ・クリップの復号においてプロセッサ105により実行される合計計算ワークロードの約4分の1に貢献するだけであるが、知覚的に最も関連のある周波数帯域はこの基層である。ニュースやスポーツ解説のようなサービスにとっては、表1のレベル1に対応する出力オーディオ品質で十分であることは確実である。レベル2は11kHzの帯域幅をカバーしてほぼFM無線品質に達し、特に騒がしい環境においては音楽クリップをも十分に聴ける性能を有する。レベル3は16.5kHzの帯域幅をカバーし、CD品質に極めて近い出力を生成する。最後に、レベル4は、22kHzの全帯域幅を復号する標準MP3デコーダに対応する。
レベル1、2及び3は異なる周波数成分を表すデータの一部しか処理しないが、レベル4は全データを処理し、よって計算コストは高まる。レベル3及び4に対応するオーディオ品質は、騒がしい環境ではほとんど区別できないが、実質的には異なる電力消費レベルに関連づけられる。
4つの周波数帯の各々はほぼ同じワークロードを必要とするが、全体的なQoSに対する個々の知覚的貢献度は大いに異なる。概して、低い周波数帯(即ちレベル1)は、高位のどの周波数帯よりも遙かに重要である。
方法800によれば、任意の特定の復号レベルにおいて、プロセッサ105がオーディオ・データを復号するための最低動作周波数を決定することができる。次には、計算された周波数をプロセッサ105による電力消費の推定に使用することができ、1つのグラニュールを構成するビット数の可変性、及び任意のグラニュールを処理する際のプロセッサ・サイクル要件の可変性も考慮される。この可変性を計上することにより、携帯用コンピューティング・デバイス100の再生遅延が変更される際のプロセッサ105の周波数要件の変化を決定することができる。
先に述べたように、かつ図5に示すように、プロセッサ105は、メモリ106内に構成されるサイズbの内部バッファ500を使用してオーディオ・ビット・ストリーム(例えば、オーディオ・クリップ)形式のオーディオ・データを復号する。復号されたオーディオ・ストリームはPCMサンプルのシーケンスであり、メモリ106内に構成されるサイズBの再生バッファ501へ書き込まれる。この再生バッファ501は、プロセッサ105により、何らかの指定された速度で読み取られる。
復号されるべき入力ビット・ストリームは、rビット/秒の定速で内部バッファ500へ供給されるものとする。MP3フレーム構造において1つのグラニュールを構成するビット数は、可変である。1グラニュール当たりの最大ビット数は、1つのグラニュールにおける最小ビット数のほぼ3倍であり、この最低数は約1200ビットである。この可変性は、2つの関数φ(k)及びφ(k)を使用して特徴づけることができ、φ(k)はオーディオ・ビット・ストリームにおける任意の連続するk個のグラニュールを構成する最小ビット数を示し、φ(k)は対応する最大ビット数を示す。φ(k)及びφ(k)は、処理されるべきオーディオ・クリップを表現するオーディオ・クリップ数を分析することによって得ることができる。
次に、復号されるべきオーディオ・クリップを所与として、x(t)は時間間隔[0,t]において再生バッファ501に着信するグラニュールの数を示すものとする。1つのグラニュールを構成するビット数は可変性であることから、関数x(t)はオーディオ・クリップに依存する。関数φ(k)及びφ(k)と同様に、グラニュールの着信プロセスの可変性を内部バッファ501内へ制限する2つの関数α(Δ)及びα(Δ)が使用されてもよい。2つの関数α(Δ)及びα(Δ)は、下記のように定義される。
Figure 0005576021
但し、α(Δ)は長さΔの任意の時間間隔において内部バッファ501に着信することのできるグラニュールの最低数を示し、α(Δ)は対応する最大数を示す。
関数φ(k)及びφ(k)が与えられると、以下の解釈により、φ1/l(n)及びφ1/u(n)で示されるこれらの2関数の擬似逆数を決定することが可能である。これらの関数は共に、ビット数nを引数として用いる。φ1/l(n)は、nビットで構成され得るグラニュールの最大数を返し、φ1/u(n)はnビットで構成され得るグラニュールの最低数を返す。入力ビット・ストリームは内部バッファ501にrビット/秒の定速で到達することから、α(Δ)は、下記式で定義することができる。
Figure 0005576021
同じく、任意のグラニュールの処理に必要なプロセッサ・サイクル数も可変であることから、この可変性は、2つの関数γ(k)及びγ(k)を使用して捕捉することができる。関数γ(k)及びγ(k)は共に、グラニュール数kを引数として用いる。γ(k)は、任意の連続するk個のグラニュールの処理に必要な最小プロセッサ・サイクル数を返し、γ(k)は対応する最大プロセッサ・サイクル数を返す。図6は、持続時間約30秒における、ビットレート160キロビット/秒のオーディオ・クリップに対応するプロセッサ105のグラニュール当たりのサイクル要件を示す。図6は、表1の4つの復号レベルに対応するプロセッサ・サイクル要件を示している。図6において注目すべきことは、(i)復号レベルの上昇に伴うプロセッサ・サイクル要件の増大、(ii)任意の復号レベルのグラニュール当たりのプロセッサ・サイクル要件の可変性、の2点である。
再生バッファ501は、d秒の再生遅延(または、バッファ時間)の後、プロセッサ105によりc個のPCMサンプル/秒という定速で読み取られるものとする。一般に、cは、各チャネルにつき44.1K個のPCMサンプル/秒であり(故に、ステレオ出力では44.1K×2個のPCMサンプル/秒)、dは0.5秒から2秒までの値に設定することができる。グラニュール当たりのPCMサンプル数がs(576×2に等しい)であれば、再生速度はc/sグラニュール/秒に等しい。関数C(t)が時間間隔[0,t]においてプロセッサ105により読み取られるグラニュール数を表すものであれば、下記のようになる。
Figure 0005576021
ここで、入力されるビットレートr、復号されるべき可能オーディオ・クリップ集合を特徴づける関数φ(k)、φ(k)、γ(k)及びγ(k)及び関数C(t)を所与とすれば、c個のPCMサンプル/秒の再生速度を持続させる最小プロセッサ周波数fを決定することができる。これは、再生バッファ501が絶対にアンダーフローしないことを要求することに等しい。y(t)が時間間隔[0,t]において再生バッファ501へ書き込まれる合計グラニュール数を示すものであれば、これは、全てのt≧0についてy(t)≧C(t)であることを要求することに等しい。
プロセッサ105により周波数fで提供されるサービスを、関数β(Δ)で表すものとする。α(Δ)と同様に、β(Δ)は、長さΔの任意の時間間隔において(内部バッファ500において利用可能であれば)確実に処理されるべきグラニュールの最低数を表す。従って、各のように示すことができる。
Figure 0005576021
上記プラス−マイナス畳み込み演算子は、2つの関数f及びgに関して、下記のように定義される。
Figure 0005576021
故に、制約y(t)≧C(t),t≧0が成り立つためには、下記の不等式が成り立てばよい。
Figure 0005576021
Figure 0005576021
Figure 0005576021
この結果を不等式(1)に使用すると、β(t)を下記のように決定することができる。
Figure 0005576021
但し、β(t)は、長さtの任意の時間間隔において処理される必要のあるグラニュール数に関して定義される。プロセッサ・サイクルに関する等価サービスを得るためには、先に定義された関数γ(k)を使用することができる。再生バッファ501が絶対にアンダーフローしないことを確実にすべくプロセッサ105により保証されなければならない最小サービスは、下記式によって、全t≧0に関するプロセッサ・サイクル数で与えられる。
Figure 0005576021
故に、指定された再生速度を持続するためにプロセッサ105が実行すべき最低周波数は、下記式によって与えられる。
Figure 0005576021
任意の動作点に対応して電圧がクロック周波数に比例する電圧/周波数スケーラブル・プロセッサを想定した場合、持続時間tのオーディオ・クリップを復号する間のエネルギー消費はftに比例する。
図7は、表1の復号レベルに対応する長さtの任意の間隔において必要とされるプロセッサ・サイクル数を示す。図7から、各復号レベルが最低(定)周波数fに関連づけられることが分かる。復号レベルが上がると、関連するf値も増加する。
プロセッサ105は、何らかの復号レベルに対応するfプロセッサ・サイクル/秒に等しい定周波数で実行されるものとする。内部及び再生バッファ500及び501は、これらのバッファが絶対にオーバーフローしないことを保証する最小サイズを決定することができ、γ1/l(n)及びγ1/u(n)で示される2つの関数γ及びγの擬似逆数が各々決定されてもよい。これらの関数γ及びγは共に、プロセッサ・サイクル数nを引数として用いる。γ1/l(n)は、nプロセッサ・サイクルを使用して処理され得るグラニュールの最大数を返し、γ1/u(n)は対応する最小数を返す。
長さΔの任意の時間間隔において処理されることが保証されるグラニュールの最低数は、プロセッサ105が周波数fで実行されるとき、γ1/u(f△)に等しい。内部バッファ500が絶対にオーバーフローしないような内部バッファ500の最小サイズbは、下記式の数のグラニュールによって与えられることは明らかであると思われる。
Figure 0005576021
同様に、長さΔの任意の時間間隔において処理され得るグラニュールの最大数は、γ1/l(f△)によって与えられる。再生バッファ501におけるグラニュールの着信プロセスは、下記の関数によって上限とされる。
Figure 0005576021
但し、上記関数は、長さΔの任意の時間間隔において再生バッファ501に書き込まれ得るグラニュールの最大数である。この時点で、バッファ501が絶対にオーバーフローしないことを保証するバッファ501の最小サイズ(即ち、B)が下記式のグラニュールに等しいことは明らかである。
Figure 0005576021

ビット数及びPCMサンプル数に関連するサイズb及びBは、各々φ(b)及びsBである。
ある実装においては、プロセッサ105は、復号レベルが下記の表2に従って設定されるIntel XScale 400MHzプロセッサであってもよい。
Figure 0005576021
上述の好適な方法は、特定の制御フローを含む。本好適な方法には、本発明の精神または範囲を逸脱することなく異なる制御フローを使用する他の変形例が多く存在する。さらに、本好適な方法ステップのうちの1つまたはそれ以上は、連続的でなく並行して実行されてもよい。
上述の内容から、説明した装置がコンピュータ及びデータ処理産業に適用可能であることは明らかである。
これまでの説明は、本発明の幾つかの実施形態に関して行ったものに過ぎず、本発明に対しては、本発明の精神及び範囲を逸脱することなく修正及び/または変更を行うことができ、実施形態は例示的なものであって、限定的なものではない。
(オーストラリア出願のみ)
本明細書の文脈において、「を備える」という用語は「を主に、但し必ずしも唯一ではなく含む」または「を有する」または「を含む」を意味し、「からのみ成る」を意味しない。「を備える(comprising)」という用語の変形としての語尾変化した「を備える(comprise, comprises)」は、相応に変わる意味を有する。
説明する実施形態を実施し得る基礎を成すプロセッサを備える携帯用コンピューティング・デバイスを示す略ブロック図である。 コード化されたビット・ストリームを入力として採用し、かつ、復号されたパルス・コード変調(PCM)サンプルのストリームを生成する図1のプロセッサを示す図である。 MPEG1の第3層(即ち、MP3)規格ビット・ストリームのフレーム構造を示す図である。 規格MP3デコーダのモジュール及び提案する新規デコーダ・アーキテクチャを示すブロック図である。 オーディオ・データの復号において図1のプロセッサが使用する内部バッファ及び再生バッファを示す図である。 予め決められた持続時間における図1のプロセッサの1つのオーディオ・クリップに対応するグラニュール当たりのサイクル要件を示すグラフである。 上記好適な実施形態の復号レベルに対応する任意の長さ間隔tにおける必要なプロセッサ・サイクルを示す図である。 上記好適な実施形態による、コード化されたビット・ストリーム形式のオーディオ・データの復号方法を示す図である。

Claims (8)

  1. 異なるオーディオ周波数レンジに対応し、ユーザにより選択可能な複数の異なるオーディオ品質レベルのうちの選択された一つのオーディオ品質レベルに対応するオーディオ周波数レンジ内のオーディオ・クリップの部分を復号することにより、前記オーディオ・クリップを選択的に復号するように構成されているオーディオ・デコーダと、
    前記オーディオ・デコーダに結合されているスピーカであって、前記選択的に復号されたオーディオ・クリップを出力するように構成されているスピーカと
    入力されるビットレートと、オーディオ・ビット・ストリームにおける任意の連続するグラニュールを構成する最小ビット数及び対応する最大ビット数と、任意の連続するグラニュールの処理に必要な最小プロセッサ・サイクル数及び対応する最大プロセッサ・サイクル数と、所定の時間間隔においてプロセッサにより読み取られるグラニュール数と、を用いて、PCMサンプルの再生速度を持続させる最小プロセッサ周波数を決定するように構成された内部バッファ及び再生バッファとを備え、
    前記異なるオーディオ周波数レンジのそれぞれは、AMオーディオ品質、FMオーディオ品質及びCDオーディオ品質のうちの1つに対応する周波数レンジを少なくとも含み、
    前記オーディオ・デコーダは、ソフトウェアを用いて実装されるものであり、装置は更に、前記オーディオ・デコーダを実行するように構成されているプロセッサを備え、
    前記オーディオ・デコーダは、ハフマン復号を前記オーディオ・クリップ全体に対して実行するように構成され、前記プロセッサは更に、前記複数の異なるオーディオ品質レベルのうちの前記選択された一つのオーディオ品質レベルに従って、前記ハフマン復号されたオーディオから前記PCMサンプルを生成するように構成されている
    装置。
  2. 請求項1に記載の装置において、前記オーディオ・デコーダに結合されているキーパッドであって、前記ユーザにより選択可能な複数の前記オーディオ品質レベルのうちの前記選択された一つのオーディオ品質レベルを選択できるように構成されているキーパッドを更に備える装置。
  3. 請求項1又は2に記載の装置において、前記プロセッサは更に、前記異なるオーディオ周波数レンジそれぞれに対して異なる電力を消費する装置。
  4. 請求項1乃至3のいずれか一項に記載の装置において、前記オーディオ周波数レンジの各々は、前記プロセッサが実行されるべき周波数を定める装置。
  5. 請求項1乃至4のいずれか一項に記載の装置において、当該装置は電池式である装置。
  6. 請求項1乃至5のいずれか一項に記載の装置において、当該装置は携帯オーディオ・プレーヤ、携帯電話又は携帯情報端末のいずれか一つである装置。
  7. オーディオ・デコーダが、第1のオーディオ周波数レンジに対応する第1のオーディオ品質レベル、又は前記第1のオーディオ周波数レンジとは異なる第2のオーディオ周波数レンジに対応する第2のオーディオ品質レベルの選択を受けるステップと、
    前記オーディオ・デコーダが、前記選択に基づいて、前記第1のオーディオ周波数レンジ内の第1のオーディオ・クリップの部分、又は前記第2のオーディオ周波数レンジ内の第2のオーディオ・クリップの部分を復号するステップと、
    前記第1のオーディオ・クリップ又は前記第2のオーディオ・クリップの前記復号された部分を出力するステップと
    内部バッファ及び再生バッファが、入力されるビットレートと、オーディオ・ビット・ストリームにおける任意の連続するグラニュールを構成する最小ビット数及び対応する最大ビット数と、任意の連続するグラニュールの処理に必要な最小プロセッサ・サイクル数及び対応する最大プロセッサ・サイクル数と、所定の時間間隔においてプロセッサにより読み取られるグラニュール数とを用いて、PCMサンプルの再生速度を持続させる最小プロセッサ周波数を決定するステップと
    を含み、
    前記第1のオーディオ周波数レンジ及び第2のオーディオ周波数レンジのそれぞれは、AMオーディオ品質、FMオーディオ品質及びCDオーディオ品質のうちの1つに対応する周波数レンジを少なくとも含み、
    前記第1のオーディオ周波数レンジ内の前記第1のオーディオ・クリップの部分を復号する前記ステップ及び前記第2のオーディオ周波数レンジ内の前記第2のオーディオ・クリップの部分を復号する前記ステップの双方、又はいずれか一方のステップは、プロセッサが前記オーディオ・デコーダを実装するために用いられるソフトウェアを実行するステップを含み、
    前記第1のオーディオ周波数レンジ内の前記第1のオーディオ・クリップの部分を復号する前記ステップ及び前記第2のオーディオ周波数レンジ内の前記第2のオーディオ・クリップの部分を復号する前記ステップの双方、又はいずれか一方のステップは、前記オーディオ・デコーダが、前記第1又は第2のオーディオ・クリップ全体に対してハフマン復号するステップと、前記第1及び第2のオーディオ品質レベルのうちの前記選択されたオーディオ品質レベルに従って、前記ハフマン復号されたオーディオから前記PCMサンプルを生成するステップとを含む
    方法。
  8. 請求項7に記載の方法において、前記第1及び第2のオーディオ周波数レンジの各々は、前記プロセッサが実行されるべき周波数を定める方法。
JP2007542996A 2004-11-29 2005-11-28 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ Expired - Fee Related JP5576021B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US63113404P 2004-11-29 2004-11-29
US60/631,134 2004-11-29
PCT/SG2005/000405 WO2006057626A1 (en) 2004-11-29 2005-11-28 Perception-aware low-power audio decoder for portable devices

Publications (3)

Publication Number Publication Date
JP2008522214A JP2008522214A (ja) 2008-06-26
JP2008522214A5 JP2008522214A5 (ja) 2010-12-02
JP5576021B2 true JP5576021B2 (ja) 2014-08-20

Family

ID=36498281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007542996A Expired - Fee Related JP5576021B2 (ja) 2004-11-29 2005-11-28 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ

Country Status (6)

Country Link
US (1) US7945448B2 (ja)
EP (1) EP1817845A4 (ja)
JP (1) JP5576021B2 (ja)
KR (1) KR101268218B1 (ja)
CN (1) CN101111997B (ja)
WO (1) WO2006057626A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101356741B (zh) * 2005-11-04 2012-10-31 新加坡国立大学 播放音频剪辑的装置和方法
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
CN101968771B (zh) * 2010-09-16 2012-05-23 北京航空航天大学 一种在dsp上实现先进音频编码算法的内存优化方法
US8762644B2 (en) * 2010-10-15 2014-06-24 Qualcomm Incorporated Low-power audio decoding and playback using cached images
CN115579013B (zh) * 2022-12-09 2023-03-10 深圳市锦锐科技股份有限公司 一种低功耗音频解码器

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2581696B2 (ja) * 1987-07-23 1997-02-12 沖電気工業株式会社 音声分析合成器
US5706290A (en) * 1994-12-15 1998-01-06 Shaw; Venson Method and apparatus including system architecture for multimedia communication
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
KR100346734B1 (ko) 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
JP3353868B2 (ja) * 1995-10-09 2002-12-03 日本電信電話株式会社 音響信号変換符号化方法および復号化方法
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
JPH11161300A (ja) * 1997-11-28 1999-06-18 Nec Corp 音声処理方法とその方法を実施するための音声処理装置
JP2002313021A (ja) * 1998-12-02 2002-10-25 Matsushita Electric Ind Co Ltd 記録媒体
US7085377B1 (en) * 1999-07-30 2006-08-01 Lucent Technologies Inc. Information delivery in a multi-stream digital broadcasting system
CN2530844Y (zh) * 2002-01-23 2003-01-15 杨曙辉 车载式无线mp3接收播放机
JP4714415B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
CN2595120Y (zh) * 2003-01-09 2003-12-24 杭州士兰微电子股份有限公司 遥控变频全自动无线调频耳机
US20040158878A1 (en) * 2003-02-07 2004-08-12 Viresh Ratnakar Power scalable digital video decoding
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치

Also Published As

Publication number Publication date
WO2006057626A1 (en) 2006-06-01
CN101111997B (zh) 2012-09-05
US7945448B2 (en) 2011-05-17
US20070299672A1 (en) 2007-12-27
EP1817845A4 (en) 2010-08-04
KR20070093062A (ko) 2007-09-17
EP1817845A1 (en) 2007-08-15
CN101111997A (zh) 2008-01-23
KR101268218B1 (ko) 2013-10-17
JP2008522214A (ja) 2008-06-26

Similar Documents

Publication Publication Date Title
JP5171256B2 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
CN103915098B (zh) 音频信号编码器
CN104509130B (zh) 立体声音频信号编码器
US20090099851A1 (en) Adaptive bit pool allocation in sub-band coding
CN104641414A (zh) 立体声音频信号编码器
US20110246206A1 (en) Audio decoding system and an audio decoding method thereof
JP5576021B2 (ja) 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ
CN101185123A (zh) 可扩展编码装置及可扩展编码方法
US11735193B2 (en) High resolution audio coding
US20210343302A1 (en) High resolution audio coding
EP1943741B1 (en) A device and a method of playing audio clips
WO2007101277A1 (en) Audio decoding techniques for mid-side stereo
US20050091052A1 (en) Variable frequency decoding apparatus for efficient power management in a portable audio device
JP3913664B2 (ja) 符号化装置、復号化装置およびこれらを用いたシステム
Chakraborty et al. A perception-aware low-power software audio decoder for portable devices
US11715478B2 (en) High resolution audio coding
US11749290B2 (en) High resolution audio coding for improving package loss concealment
Hirschfeld et al. Ultra low delay audio coding with constant bit rate
JP4573670B2 (ja) 符号化装置、符号化方法、復号化装置及び復号化方法
Huang et al. Power-Aware bandwidth and stereo-image scalable audio decoding
Bhalla et al. LC3 Codec
Amutha et al. Low power fpga solution for dab audio decoder
Kalyanasundaram et al. An Efficient Method to Improve the Audio Quality Using AAC Low Complexity Decoder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081111

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090604

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090604

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111102

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130620

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130628

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140703

R150 Certificate of patent or registration of utility model

Ref document number: 5576021

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees