JP4126680B2 - エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 - Google Patents
エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 Download PDFInfo
- Publication number
- JP4126680B2 JP4126680B2 JP2000517417A JP2000517417A JP4126680B2 JP 4126680 B2 JP4126680 B2 JP 4126680B2 JP 2000517417 A JP2000517417 A JP 2000517417A JP 2000517417 A JP2000517417 A JP 2000517417A JP 4126680 B2 JP4126680 B2 JP 4126680B2
- Authority
- JP
- Japan
- Prior art keywords
- synthesis
- block
- filter bank
- frame
- synthesized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000001629 suppression Effects 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000003595 spectral effect Effects 0.000 claims abstract description 25
- 238000003786 synthesis reaction Methods 0.000 claims description 174
- 230000015572 biosynthetic process Effects 0.000 claims description 151
- 230000004044 response Effects 0.000 claims description 114
- 238000004458 analytical method Methods 0.000 claims description 87
- 230000008569 process Effects 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 9
- 238000000844 transformation Methods 0.000 claims description 5
- 230000002238 attenuated effect Effects 0.000 claims 4
- 238000003672 processing method Methods 0.000 claims 2
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 abstract description 11
- 230000005236 sound signal Effects 0.000 abstract description 11
- 238000006243 chemical reaction Methods 0.000 description 21
- 239000000203 mixture Substances 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 10
- 238000009499 grossing Methods 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
【産業上の利用分野】
本発明は、オーディオ信号処理に関し、そこではオーディオ情報の流れが情報フレームの形で配列される。特に、本発明は、フレーム基礎付けられたオーディオ情報流れをスプライスする(継ぐ)ことによって形成されるオーディオ情報流のオーディオ品質を改良することに関する。
【0002】
【背景技術】
オーディオ又はビデオ資料を編集する工程は、本質的に資料の2つの区分を共に継ぐか若しくは接合するものである。簡単な編集範例は、映画フィルムを切断して継ぐことである。継ぐべき資料の2つの区分は、異なった源、例えば、オーディオ情報の異なったチャンネル又はそれらは同一源から生じるかも知れない。いずれの場合でも、概してスプライスはオーディオ又はビデオ資料に切れ目を生じ、それは知覚可能か若しくは知覚不能である。
【0003】
オーディオ符号化
ブロック処理
デジタルオーディオが益々用いられることで、アーティファクトを生じることなくオーディオ資料を編集することを一層困難にさせる傾向になっている。これが生じた一部の理由は、ブロックとして処理されなければならないデジタルサンプルブロックの形でデジタルオーディオがしばしば処理又は符号化されるためである。多くの知覚又は心理音響に基礎付けられたオーディオ符号化システムはフィルタバンク又は変換を利用し、信号サンプルブロックを符号化されたサブバンド信号サンプルのブロックに変換するか若しくは原信号のレプリカを復元するためにブロックとして合成フィルター又は逆変換されなければならない係数を変換するようにしている。最低でも、処理されたオーディオ信号の編集はブロック境界でなされなければならず、さもなければ、残余の区分的ブロックによって表されるオーディオ情報は適切に復元され得ない。
【0004】
残りの本論議全体を通して「コーディング(符号化)」及び「コーダ(符号発生装置)」のような用語は、信号処理のための各種の方法及び装置を指し、「エンコーデッド(符号化された)」のような他の用語は、そのような処理の結果を指す。これらの用語は、情報無関係性又は信号冗長性を低減させるもののような特殊な処理の形を意味しない。例えば、コーディングは、信号を表すパルスコード変調(PCM)を発生させること及びある明細により情報をパターン又はフォーマットに配列することを含む。本開示で用いられるような「ブロック」及び「フレーム」の用語は、情報のグループ又は区間を指し、それは、時にはAES-3/EBUデジタルオーディオ標準として知られる、ANSI S4.40-1992標準のような、他のものを指す同一用語とは異なり得る。ここで用いられる「フィルター」及び「フィルタバンク」のような用語は、直角位相鏡フィルター(QMF)及び変換のようなあらゆる形の再帰的及び非再帰的フィルターを本質的に含む。「フィルターされた」情報は、そのようなフィルターを用いた結果である。より特殊の言及は変換によって実施されるフィルタバンクについてなされる。
【0005】
プログラム資料を処理かつ符号化するために重複するブロック構造を用いる符号化システムによって、編集には追加の制限が課される。符号化されたブロックの重複特性のために、たとえ符号化されたサンプル又は係数の完全なブロックからであっても原信号は適切に復元され得ない。
【0006】
この制限は、一般に用いられる重複・ブロック変換、即ち、修正離散余弦変換(DCT)によって明瞭に例示される。それは、プリンセン、ジョンソン及びブラッドレイ(Princen,Johnson,Bradley)の「時間領域エイリアシング相殺に基づくフィルターバンクデザインを用いるサブバンド・変換符号化」(ICASSP 1987 Conf. Proc.,May 1987,pp.2161−64)に記載される。この変換は、奇数積重ね臨界サンプル単一側波帯分析・合成システムの時間領域等価物であり、ここでは、奇数積重ね時間・領域エイリアシング相殺(O-TDAC)と呼ぶ。順方向変換は、互いにブロック長の半分だけ重複するサンプルのブロックに用いられ、変換係数を2(2/10)だけ低下させることによって臨界サンプリングを達成する。しかし、この低下によって失われる情報が、復元された信号に時間領域エイリアシングを生じさせる。合成処理でこのエイリアシングを相殺することが可能で、それは変換係数ブロックに逆変換を適用することによって合成されたサンプルのブロックを発生させ、合成されたサンプルのブロックに適切に形成された合成窓関数を適用し、窓処理されたブロックを重複させて加えることによって行われる。例えば、TDAC符号化システムが一連のブロックB1-B2を発生させると、その後ブロックB1の後半分及びブロックB2の前半分のアーティファクトが互いに相殺される。
【0007】
TDAC符号化システムからの2つの符号化された情報の流れが、ブロック境界でスプライスされると、結果的に生じる一連のブロックは相互のエイリアシングアーティファクトを相殺しないであろう。例えば、一方の符号化された情報の流れが切断されて、ブロックB1-B2間のブロック境界で終わるようにされ、他方の符号化された情報の流れが切断されて、ブロックA1-A2間のブロック境界で始まるようにされると考えるとどうだろう。これら2つの情報の流れがスプライスされて、ブロックB1がブロックA2の直前に来ると仮定すると、ブロックB1の後半及びブロックA2の前半の各アーティファクトは互いに相殺することはないであろう。
【0008】
先行技術の方法及び装置は、問題を無視しているか若しくは不十分な解決法を与えているかのいずれかである。一解決法は、各符号化されたオーディオの流れから元のオーディオを復元又は復号し、一方のオーディオの流れを他方のものとクロスフェード(相互フェードイン・フェードアウト)し、結果的に得られるクロスフェードされた流れを新しい符号化されたオーディオの流れに再符号化することによって、未相殺のエイリアシングアーティファクトの可聴性を低減させることである。不幸にして、復号・符号化処理は結果的に得られる信号を劣化させ、つまらない出費を招き、クロスフェードは元に戻しえないのでスプライスした箇所のすぐ両側の信号は個別に元の信号に復元できない。
【0009】
スペクトルスプラッタ
スプライス編集は、先行技術で扱っていなかった別の問題を引き起こす。この問題は、知覚符号化のような分割・帯域知覚符号化において特に厄介である。知覚分割・帯域符号化では、人の聴覚系臨界帯域幅にふさわしい帯域幅を有するサブバンド信号又は変換係数グループを発生させるために、入力信号にフィルタバンクを適用する。理想的には、各サブバンド信号又は変換係数グループは、原信号のスペクトル成分でノイズを隠蔽させることによって、結果的に生じる量子化ノイズを聞こえないようにするのにちょうど十分なビットで量子化又は符号化される。符号化性能は、各サブバンド信号又は変換係数を発生させるために入力信号に適用されるフィルタバンクの周波数応答特性によって著しく影響される。概して、これらの特性は、より広いフィルター通過域と引換えにフィルター阻止域の周波数における減衰を増加させることによって最適化される。例えば、米国特許第5,109,417を参照のこと。
【0010】
スプライス編集は、ある周波数範囲内で顕著な不要スペクトル成分又は「スペクトルスプラッタ(ぱちぱち音)」を発生させる傾向がある。その周波数範囲は、通常通過及び阻止域間のフィルター通過域又は過渡領域以内にあり、フィルター阻止域と考えられている範囲以内にはなく、従って、一般的符号化性能を最適化するためにデザインされているフィルタバンクは、スプライス編集個所で生じるスペクトルスプラッタを減衰させるのに十分な減衰を与えない。これらのアーティファクトは、通常原信号で隠蔽されるには大きすぎるので概して聞き取り得る。
【0011】
オーディオ及びビデオ符号化
フレーム同期化
オーディオ及びビデオの双方を処理する編集用途では、少なくとも2つの理由からさらに大きな制限が課される。第1の理由は、ビデオのフレーム長が概してオーディオブロック長と等しくないことである。第2の理由は、NTSCのような一定のビデオ標準のみに関する。即ち、NTSCは、オーディオサンプルレートの整数倍とは異なるビデオフレームレートを有する。以下の論議の例ではすべて毎秒48kサンプルのオーディオサンプルレートを想定している。大抵の職業用装置はこのレートを用いる。消費者用装置で典型的に用いられる、毎秒44.1kサンプルのような他のサンプルレートにも同様な考慮が当てはまる。
【0012】
幾つかのビデオ及びオーディオ符号化標準用のフレーム及びブロック長(長さ)がそれぞれ表I及びIIに示される。「MPEGII」及び「MPEGIII」に関する表の記載項目は、標準ISO/IEC13818−3の国際標準機構の映画専門グループによって特定されたMPEG-2LayerII及びMPEG-2LayerIII符号化技術を指す。「AC-3」に関する記載項目は、ドルビー研究所(Dolby Laboratories,Inc.)によって開発された符号化技術を指し、標準A-52の高級テレビシステム委員会によって特定された。48kHzPCMは、隣接サンプル間の時間間隔である。
【0013】
【表1】
【0014】
ビデオ及びオーディオ情報が共に含まれる用途では、オーディオブロック及びビデオフレームは、めったに同期しない。オーディオ・ビデオ同期の発生間の時間間隔が表IIIに示される。例えば、表は毎秒24フレームの映画フィルムは、MPEGオーディオブロック境界と各3秒周期に一度正確に同期され、AC-3オーディオブロックと各4秒周期に一度正確に同期される。
【0015】
【表2】
【0016】
ビデオフレーム対オーディオブロックの数で表される同期発生間の間隔は、表IVに示される。例えば、5オーディオブロック及び4ビデオフレームによって計られる区間内では、AC-3ブロック及びPALフレーム間で正確に一回の同期が発生する。8,008サンプルのPCMオーディオと同期するためには5フレームのNTSCビデオを要することは重要である。この関係の重要性については以下に述べる。
【0017】
【表3】
【0018】
ビデオ及びオーディオ情報が共に束ねられると、編集は概してビデオフレーム境界で起こる。表III及びIVに示す情報からそのような編集はオーディオフレーム境界ではまれにしか起こらないことが分かるであろう。例えば、NTSCビデオ及びAC-3オーディオに関しては、ビデオフレーム境界上の編集がオーディオブロック境界でも起こる確率は、1/960、即ち、約0.1%に過ぎない。勿論、スプライスの両側の編集が両方ともこのように同期されなければならず、さもなければ、若干のオーディオ情報が失われるであろう。従って、2つの任意の編集に関してNTSC/AC-3情報のスプライスがオーディオブロック境界以外で起こり、結果的に1つ又は2つのオーディオ情報ブロックが失われることが殆ど確実であろう。しかし、AC-3はTDAC変換を用いるので、たとえ情報ブロックが失われない場合でも、上記の理由で未相殺エイリアシング歪が結果的に生じるであろう。
【0019】
この問題は、上記のオーディオブロック処理問題と類似している。先行技術の方法及び装置は、ビデオ・オーディオフレーミング問題を無視するか若しくは類似の不十分な解決策を与えている。即ち、オーディオ情報をビデオ情報との束から外し、符号化されたオーディオ情報を復号し、復元されたオーディオ情報を編集し、オーディオ情報を再符号化しかつビデを情報と共に再び束ねることによってオーディオの後処理を行っている。
【0020】
データ同期
既に述べた通り、毎秒48kサンプルにおいてPCMオーディオの8008サンプルと同期させるためには、NTSCビデオの5フレームを要する。言い換えると、NTSCビデオフレームは、オーディオ情報を整数のサンプル数には分割しない。各NTSCフレームは、1601.1サンプルに相当する。同様に、NTSCビデオフレームは、符号化されたオーディオ情報を整数の数のサンプル又は係数のブロックには分割しない。これは、オーディオサンプルを、例えば、それぞれ1602,1601,1602,1601及び1602サンプルを含む一連の反復するオーディオフレームに配列することによって適応され得る。しかし、これは編集用途にさらに大きな制限を課す。その理由は、ここでは「スーパーフレーム」と称する連続5フレームの始めにおいてのみ編集がなされなければならないからである。不幸にして、多くの用途においてビデオ情報又はビデオと束にされるオーディオ情報は、スーパーフレーム境界については何らの表示も伝えない。
【0021】
スーパーフレーム内の可変長オーディオブロックは、多くの符号化用途につき別の問題を惹き起こす。既に述べた通り、多くの符号化用途ではブロックで符号化される情報を処理する。信号が何らかの形の同期信号を伝えない限り、各スーパーフレームのどこに境界があるか若しくは編集でスーパーフレームの一部が除かれたかどうかについてデコーダでは知ることができない。言い換えると、各オーディオフレーム又はブロックの境界がどこであるかをデコーダでは知ることができない。ブロック境界の不確実性をたかだか1サンプルに下げ得る可能性はある。しかし、オーディオ情報がブロックで処理されると、復元されるオーディオ情報の復元を妨げるのには1サンプルの誤差だけで十分である。
【0022】
【課題を解決するための手段】
本発明の目的は、2つ又はそれ以上のフレームに基礎付けられたオーディオ情報の流れをスプライスすることによって形成される、オーディオ情報の流れによって表されるオーディオの品質を改良することである。
【0023】
本発明の一面の教示によると、信号処理装置及び方法は、一連のフレームから成る入力信号を受信し、それぞれの信号フレームが複数のフィルターされたオーディオ情報ブロックを含むようにし、前記一連の入力信号フレーム内において第2入力信号フレームのすぐ前の第1入力信号を識別する制御信号を受信し、第1入力信号フレームの末端においてフィルターされたオーディオ情報の末端ブロックに第1合成フィルタバンクを適用することによって信号サンプルの第1中間信号ブロックを発生させ、第2入力信号フレームの始めにおいてフィルターされたオーディオ情報の開始ブロックに第2合成フィルタバンクを適用することによって信号サンプルの第2中間信号ブロックを発生させ、フィルターされたオーディオ情報の1つ又はそれ以上の他のブロックに第3合成フィルタバンクを適用することによって信号サンプルの1つ又はそれ以上の第3中間信号ブロックを発生させる。第1合成フィルタバンクは、第1中間信号ブロック内のサンプルが第1周波数応答によりフィルターされているオーディオ情報を表すようにし、第2合成フィルタバンクは、第2中間信号ブロック内のサンプルが第2周波数応答によりフィルターされているオーディオ情報を表すようにし、第3合成フィルタバンクは、第3中間信号ブロック内のサンプルが第3周波数応答によりフィルターされているオーディオ情報を表すようにする。第3周波数応答が、特定周波数を超えるスペクトルエネルギの減衰を最適化させ、第1及び第2周波数応答が特定周波数未満の周波数範囲内のスペクトル減衰を最適化させ、隣接中間信号ブロックを重複させかつ対応する重複した信号サンプルを加算することによって出力信号を発生させる。
【0024】
本発明の他の面の教示によると、信号処理装置及び方法は、一連のフレームから成る入力信号を受信し、それぞれの信号フレームが複数のフィルターされたオーディオ情報ブロックを含むようにし、第2入力信号フレームのすぐ前の第1入力信号を識別する制御信号を受信し、第1入力信号フレームの末端においてフィルターされたオーディオ情報の末端ブロックに第1合成フィルタバンクを適用することによって信号サンプルの第1中間信号ブロックを発生させ、第2入力信号フレームの始めにおいてフィルターされたオーディオ情報の開始ブロックに第2合成フィルタバンクを適用することによって信号サンプルの第2中間信号ブロックを発生させ、フィルターされたオーディオ情報の1つ又はそれ以上の他のブロックに第3合成フィルタバンクを適用することによって信号サンプルの1つ又はそれ以上の第3中間信号ブロックを発生させる。そこでは第1合成フィルタバンクは、第1中間信号ブロック内のサンプルが第1周波数応答によりフィルターされているオーディオ情報を表すようにし、第2合成フィルタバンクは、第2中間信号ブロック内のサンプルが第2周波数応答によりフィルターされているオーディオ情報を表すようにし、第3合成フィルタバンクは、第3中間信号ブロック内のサンプルが第3周波数応答によりフィルターされているオーディオ情報を表すようにする。またそこでは第1及び第2応答が、約5msecに亘って実質的に線形・傾斜形状のインパルス応答に対応する基準応答に関してスペクトルエネルギの減衰を最適化させる。
【0025】
本発明の各種の特徴及び望ましい実施形態は、以下の議論及び添付図を参照することによってよりよく理解され得る。図面では、幾つかの図面において同一回路には同一参照番号が用いられる。各種の装置を例示する図面は、本発明の理解を支援する主要な成分を示す。簡単のために、実施形態では重要であるが本発明の概念を理解するためには重要でない多くの他の特徴が図面では除外されている。本発明を実施するのに要する信号処理は、マイクロプロセッサ、デジタル信号プロセッサ、ロジックアレイ(論理配列)及び他の形の計算回路回路等各種の広範な方法で達成され得る。信号フィルターは、再帰的、非再帰的及び格子デジタルフィルタ等本質的にあらゆる方法で達成され得る。デジタル及びアナログ技術は、用途の必要性及び特性により各種の組合せで用いられ得る。
【0026】
オーディオ及びビデオ情報の流れを処理する条件に関して一層特殊なことに触れるが、しかし、本発明の各面はビデオ情報の処理を含まない用途で実施され得る。以下の論議及び図面の内容は、例としてのみ説明されるもので、本発明の範囲を制限するものと理解すべきではない。
【0027】
【発明の実施形態】
信号及び処理
信号ブロック及びフレーム
図1aは、一連のオーディオブロック10乃至18に配列された符号化されるオーディオ情報の流れ及びビデオフレーム1のような一連のビデオフレームに配列されたビデオ情報を例示する。NTSCビデオのようなあるフォーマットにおいて各ビデオフレームは、単一画像を集合的に定める2つのビデオフレームから成る。オーディオブロック11乃至17は、ビデオフレーム1で符号化される信号フレーム21にグループ化される。
【0028】
表IVで既に述べた通り、ある用途におけるビデオフレームの中には、符号化されるオーディオ情報が整数の数で表されるサンプル、変換係数又は同種のものに分割されないものがある。これは、符号化される信号フレームのグループをそれぞれのスーパーフレームに配列することによって適応され得る。スーパーフレーム31にグループ化される5つの符号化される信号フレーム21乃至25が図1bに例示される。この特殊の配列は、NTSCビデオ及び48kサンプル/secPCMオーディオを用いる用途で用いられ得る。
【0029】
被処理信号ブロック
オーディオ情報に符号化される一連のブロックは、オーディオ信号の重複する区間を表し得る。幾つかの分割・帯域知覚符号化システムは、例えば、半ブロック長だけ互いに重複するオーディオサンプルのブロックを処理する。概して、これらの重複するサンプルは、分析窓関数によって変調される。
【0030】
図2aは、分析窓関数の変調包絡線61乃至67示す。同包絡線は一連の重複するオーディオブロックの各ブロックに用いられる。重複の長さは、ブロック長の半分と等しい。この重複区間は、上記のO-TDAC変換のような幾つかの分析・合成システムによって一般的に用いられる。
【0031】
図2bは、符号化される信号フレームに関する一連の重複するブロックに用いられる分析窓関数の結果的に得られる変調包絡線を例示する。図2bに例示されるように、この変調の正味効果、即ち、利得曲線は、重複区間内の隣接ブロックに関する変調包絡線71乃至77の合計である。各包絡線を横切る正味効果は単位利得であることが望ましい。
【0032】
図2cは、符号化される隣接信号フレームに跨る窓関数変調の総合効果を例示する。例示の通り、利得曲線80乃至82は重複しかつ加算されて正味効果が単位利得になるようにされる。
【0033】
分析窓関数のみを用いるシステムでは、すべての窓関数変調の正味効果は、分析窓関数のみの変調効果と等しい。理想的な利得曲線は、分析窓関数の変調包絡線が重複しかつ加算されて定数になることを保証することによって達成される。
【0034】
分析及び合成窓関数を用いるシステムでは、すべての窓関数変調の正味効果は、分析窓関数及び合成窓関数の積から形成される「積」窓関数と等しい。このようなシステムにおける理想的利得曲線は、積窓関数変調包絡線を重複区間において定数になるように加算することによって達成される。
【0035】
この開示全体を通して、分析及び合成窓関数を用いる符号化システム及び方法について言及される。このような関係においては、重複される分析窓関数から結果的に得られる利得曲線は、時には定数と同等であると言えるであろう。同様に、重複される合成窓関数から結果的に得られる利得曲線は、時には定数と同等であると言えるであろう。そのような説明は、システム内のすべての窓処理の正味効果に言及することを意図するものであると理解すべきである。
【0036】
窓関数
分析窓関数の形は、信号の利得曲線に影響するのみならず、対応するフィルタバンクの周波数応答特性にも影響する。
【0037】
スペクトルスプラッタ
既に述べた通り、多くの分割・帯域知覚符号化システムは、フィルタバンクを用いる。フィルタバンクは、より広いフィルター通過域と引換えにフィルター阻止域の周波数減衰を増強させることによって知覚符号化のために最適化される周波数応答特性を有する。不幸にして、スプライスは、フィルター阻止域と考えられている範囲内にはない周波数範囲内で著しいスペクトルアーティファクト、即ち、「スペクトルスプラッタ」を発生させる傾向がある。一般的な知覚符号化性能を最適化するように計画されるフィルタバンクは、スプライス編集個所で発生されるこれらのスペクトルアーティファクトを聴取不能にするために十分な減衰を与えない。
【0038】
TDAC変換エイリアシング相殺
O-TDAC変換に関しては、合成変換後の適用後に適用される合成窓関数と共に分析窓関数は、時間領域エイリアシングアーティファクトの相殺を可能にするために多くの制約をも満たさなければならない。
【0039】
合成変換から復元される信号は、原信号と分析変換によって発生する時間領域エイリアシング成分との和として概念化され得る。図3において、曲線91、93及び95は、逆変換、又は、合成変換から復元されて分析窓関数及び合成窓関数によって変調された入力信号の振幅包絡線の一部を表す。曲線92、94及び96は、逆変換、又は、合成変換から復元されて分析窓関数及び合成窓関数によって変調された時間領域エイリアシング成分を表す。以下の説明及び図から分かるように、時間領域エイリアシング成分は、分析及び合成窓関数によって変調された原入力信号の反映されたレプリカである。
【0040】
分析O-TDAC 変換及び合成O-TDAC変換の核関数は、ブロックの各半分の窓処理された信号を逆にした映像である時間領域エイリアシング成分を発生させるように設計される。プリンセン他によって開示されるように、O-TDAC変換は、2つの異なった領域で時間領域エイリアシング成分を発生させる。領域2では、時間領域エイリアシング成分は、その領域における原信号を逆に窓処理した映像である。領域1では、時間領域エイリアシング成分は、その領域における原信号を逆に窓処理した映像であるが、映像の振幅が反転される。
【0041】
例えば、エイリアシング成分94aは、信号成分93aの逆に窓操作した映像である。エイリアシング成分92bは、信号成分91bの逆に窓操作した映像であるが、反映される成分の振幅は反転される。
【0042】
隣接ブロックを重複させて加算することによって、原信号が復元されかつエイリアシング成分が相殺される。例えば、信号成分91b及び93aは、関数変調の影響なしに信号を復元するために加算され、エイリアシング成分92b及び94aは、エイリアシングを相殺するために加算される。同様に、信号成分93b及び95aは信号を復元するために加算されかつエイリアシング成分94b及び96aはエイリアシングを相殺するために加算される。
【0043】
スプライス境界の両側の時間領域アーティファクトは、一般的に相殺されない。それは、スプライス直前の合成されたオーディオサンプルの半ブロックのエイリアシングアーティファクトは、スプライス直後の合成されたオーディオブロック半分のエイリアシングアーティファクトの逆ではないからである。
【0044】
同様な考慮は、プリンセン及びブラッドレイの「時間領域エイリアシング相殺に基づく分析・合成フィルタバンク設計」(IEEE Trans.On Acoust.Speech,Signal Proc.,vol.ASSP-34,pp.1153-1161.)に記載されるような他のエイリアシング相殺フィルタバンクにも当てはまる。このフィルターバンクシステムは、臨界的にサンプリングされる偶数・積重ね単一・側波帯分析・合成システムの時間領域同等物でありかつここでは偶数・積重ね時間・領域エイリアシング相殺(E-TDAC)と呼ばれる。
【0045】
スプライスにおけるアーティファクト低減利得制御
スプライスによって発生するアーティファクトの可聴性を低減させるために用いられ得る技術は、符号化されるオーディオ信号内に複数の利得制御ワードを組み入れることである。同ワードは、デコーダ又は再生システムに再生信号の振幅を変えるよう指令する。これらの利得・制御ワードを用いる簡単な装置の実施形態については次節で論じられる。
【0046】
図4aは、装置100の機能的構成図を例示し、そこではフォーマット回路111は、ビデオ情報と、多重オーディオチャンネルを表す符号化されるオーディオ情報と、利得・制御ワードを含むフレームに配列される出力信号とを路112に沿って発生させる。フォーマット111は、フレームに配列されて多重オーディオチャンネル用のビデオ情報及び符号化されるオーディオ情報を伝える路108から受信する信号及び利得・制御ワードを伝える路110から受信する信号に応答して出力信号を発生させる。処理回路109は、各々が多重オーディオチャンネルの1つと関連する路103a及び103bから多重制御信号を受信し、各制御信号に応答して路110に沿って、それぞれのフレーム内の開始利得及び最終利得を表す一対の利得・制御ワードを発生させる。簡単にするために2つの制御・信号103及び2つの関連するオーディオチャンネル102のみが示される。この利得・制御技術は、所望なら3つ以上のチャンネルに適用し得る。
【0047】
図示の実施形態では、符号化回路105は、路102a及び102bから受信する多重オーディオチャンネル信号に応答して多重オーディオ用の符号化されるオーディオ情報を路106a及び106bに沿って発生させ、フレーム回路107は、路101から受信するビデオ情報及び路106a及び106bから受信する符号化されるオーディオ情報をフレーム内に配列することによって路108に沿って信号を発生させる。
【0048】
この利得・制御技術は、路108に沿って伝えられる信号と類似の入力信号で用いられ得る。従って、この場合符号化回路105及びフレーム107は不要である。符号化回路105を含む実施形態では、符号化は独立的に各オーディオチャンネル若しくは共に多重オーディオチャンネルに適用され得る。例えば、AC-3符号化技術は、各チャンネル間の冗長性を低減させるか若しくは除去することによって総合振幅要件を低減させるために2つ又はそれ以上のオーディオチャンネルに共に適用され得る。
【0049】
図4cは、入力信号内の利得・制御ワードにより多重オーディオチャンネルを再生するために出力信号を発生させる装置140の機能的構成図を例示する。デフォーマット回路142は、路141からビデオ情報、符号化されるオーディオ情報及び利得・制御信号を含むフレームに配列される入力信号を受信する。デフォーマット回路142は、各入力信号フレームから多重オーディオチャンネルを表す符号化されるオーディオ情報を入手すると共にオーディオチャンネルの各々と関連する一対の利得・制御ワードを入手する。処理回路148は、路145から利得・制御信号を受信し、それに応答して路149a及び149bに沿って利得制御信号を発生させる。復号回路146は、路144a及び144bから多重チャンネルの符号化されるオーディオ情報を受信し、それに応答して各オーディオチャンネルにつき出力信号を発生させ、各出力信号の振幅、即ち、レベルが関連する利得制御信号に応答して変化されるようにする。
【0050】
一対の利得・制御信号は、特殊フレーム内のそれぞれのオーディオチャンネルに関する開始利得及び最終利得を表す。処理回路148は、一対の利得・制御ワードの内挿を表す利得制御信号を発生させる。内挿は、線形、方形、対数、即ち、指数のような所望の任意の軌線に従い得る。例えば、線形内挿では、利得制御信号は特殊のフレームを直線的に横切って変化する利得を表す。
【0051】
復号は、各オーディオチャンネルに独立して用いられるか若しくは多重オーディオチャンネルに共に用いられ得る。例えば、チャンネル間の冗長性を除去又は低減させる符号化の形と相補的であり得る。合成フィルタバンク及び合成窓関数を用いる分割帯域符号化用途では、出力信号は利得制御信号により効果的に変調され得る。これは、フィルタバンクを適用する前に符号化されるオーディオを修正し、合成窓処理前に合成フィルタバンクから得られる合成されるオーディオを修正するか若しくは合成窓関数の適用から得られるオーディオ情報を修正することによって行われ得る。
【0052】
図4bは、信号内に存在する利得制御ワードを修正する装置120の機能的構成図である。デフォーマット回路123は、経路121からフレーム内に配列される入力信号を受信する。同入力信号は、ビデオ情報、多重オーディオチャンネルを表す符号化されるオーディオ情報及び入力利得・制御ワードから成る。デフォーマット123は、入力信号から多重オーディオチャンネルの1つにつき符号化されるオーディオ情報と関連する1つ以上の入力利得・制御ワードを入手し、経路124a及び124bに沿って入力利得制御ワードを送る。処理回路126は、経路122から受信する制御信号に応答して1つ以上の入力利得・制御ワードを修正することによって、経路127に沿って1つ以上の出力利得・制御ワードを発生させる。フォーマット回路128は、経路129に沿って出力信号を発生させる。同出力信号は、ビデオ情報、多重オーディオチャンネル用の符号化されるオーディオ情報、出力利得制御ワード及び出力利得制御ワードと対応しない入力利得制御信号を含むフレーム内に配列される。
【0053】
編集用途において制御信号122は、入力信号121内のスプライスを示す。それに応答して、処理回路126は、装置140のような装置を通してスプライス直前の再生信号を減衰させかつスプライスの直後に減衰を反転させるようにする、1つ以上の利得制御ワードを発生させる。利得の変化は、幾つかのフレームを横切って伸び得るが、多くの用途において変化はスプライスの一方側の一フレームに限定される。利得変化区間は、利得変化で生じる変調産物の可聴性を利得変化それ自体の可聴性と比較することによって決定され得る。利得制御ワード技術は、編集用途に限定されない。
【0054】
フレーム境界におけるエイリアシング抑制フィルタバンク
TDAC変換の1つによって与えられるような形のエイリアシング相殺を用いる符号化システムでは、既に述べた理由でスプライス編集においてはスプライスの各側でエイリアシングアーティファクトが相殺されるのが妨げられる。これらの未相殺エイリアシングアーティファクトは、各フレームの開始及び終端においてオーディオブロックに交互にフィルタバンクを用いることによって避けられ得る。例えば、図1aに示されるフレーム21については、第1フィルターバンクがブロック11に用いられ、第2フィルターバンクがブロック12乃至16に用いられ、第3フィルターバンクがブロック17に用いられる。これらのフィルタバンクの特性は、各フレームから復元されるオーディオが実質的に未相殺エイリアシングアーティファクトを含まないようにされる。
【0055】
図5aの装置200はバッファ回路202を含む。同バッファはオーディオ情報のブロックを受信して、オーディオブロックがフレーム内の第1、即ち、開始ブロックか、最終、即ち、終端ブロックか若しくは中間ブロックかどうかを示す制御信号を経路203に沿って発生させる。経路203から受信される制御信号に応答して、スイッチ204が各フレーム内の第1、即ち、開始ブロックを第1フィルターバンク205へ方向付け、各フレーム内のすべての中間ブロックを第2フィルターバンク206へ方向付け、各フレーム内の最終、即ち、終端ブロックを第3フィルターバンク207へ方向付ける。
【0056】
フォーマット回路208は、3つのフィルタバンクの各々から受信したフィルターされたオーディオ情報を経路209に沿って送られる出力信号にアセンブルする。
【0057】
図5bは装置220を示し、そこではデフォーマット回路222が経路221から入力信号を受信し、そこから経路224に沿って送られる符号化されるオーディオ情報を入手し、経路223に沿って制御信号を発生させ、符号化される情報がフレーム内の第1、即ち、開始ブロックか、最終、即ち、終端ブロックか若しくは中間ブロックかどうかを示すようにする。経路223から受信する制御信号に応答してスイッチ225が符号化されるオーディオ情報を3つの合成フィルタバンクの1つへ方向付ける。スイッチ225は、第1ブロックに対する符号化されるオーディオ情報を第1合成フィルタバンク226へ方向付け、中間ブロックに対する符号化されるオーディオ情報を第2合成フィルタバンク227へ方向付け、最終ブロックに対する符号化されるオーディオ情報を第3合成フィルタバンク228へ方向付ける。バッファ229は、3つの合成フィルタバンクから受信する合成されるオーディオブロックに応答して経路230に沿って出力信号を発生させる。
【0058】
第2フィルターバンク
エンコーダの一実施形態において第2フィルターバンクは、引用された上記プリンセン他に開示されるような、O-TDAC変換よるN・点修正DCT及びN・点分析窓関数によって実施される。相補的デコーダにおいては、O-TDAC変換によるN・点修正逆DCT及びN・点合成窓関数によって実施される。順方向及び逆方向O-TDAC変換は、それぞれ式1及び2に示される。
【0059】
【式1】
ここでk=周波数指数
n=信号サンプル数
M=サンプルブロック長
m=O‐TDAC位相項
x(n)=窓入力信号サンプルn
X(k)=変換係数k
【0060】
第2フィルターバンクは、長さがM=Nで、エイリアシング映像の2つの領域を発生させ、図3に示されるように2領域間のブロック中点に境界を有する。これらの2つの領域を与えるのに要するTDAC位相項はm=N/2である。
【0061】
望ましい実施形態では、分析及び合成窓関数は以下に述べる技術により引き出される。これらの窓関数の形状は、図6a曲線242に例示される。
【0062】
第1フィルターバンク
この同じ実施形態においてエンコーダ及び相補的デコーダ内の第1フィルターバンクは、上記修正されるDCT及び修正される形の窓関数W2(n)によって実施される。順方向及び逆方向変換は、それぞれ式1及び2に示される。第1フィルターバンクは、長さがM=3N/2で、エイリアシング映像の単一領域を与える。エイリアシングアーティファクトは、ブロック内信号の反転される端と端とをつないだ映像である。事実上、映像領域2は、長さが零で、2つの領域間の境界はブロックの先端、即ち、右手端である。この単一領域を与えるのに要するTDAC位相項はm=0である。
【0063】
第1フィルターバンクに対する分析及び合成窓関数は同一である。この窓関数の形状は、図6bの曲線241によって例示される。それは、3つの区分から構成される。区分1及び2で示される第1及び第2区分は、図6aに示される上記窓関数W2(x)と同一である。第3区域として示される第3区分は零と等しい。
【0064】
この第1分析窓関数W1(n)は、区域3内の信号が零であることを保証する。その結果、区域3から区域1内へ反映されるエイリアシングアーティファクトも零である。区域1から区域3内へ反映されるエイリアシングアーティファクトは概してゼロにはならないが、第1合成窓関数W1(n)が合成されるオーディオブロックに用いられると区域3内へ反映されるあらゆるアーティファクトは除去されるであろう。その結果、エイリアシングアーティファクトは区域2内のみに存在する。
【0065】
第3フィルターバンク
この同じ実施形態においてエンコーダ及び相補的デコーダ内の第3フィルターバンクは、上記修正されるDCT及び窓関数W2(n)の修正される形状によって実施される。順方向変換及び逆変換は、それぞれ式1及び2に示される。第3フィルターバンクは、長さがM=3N/2で、エイリアシング映像の単一領域2を与える。エイリアシングアーティファクトは、ブロック内の信号の端と端とをつないだ映像である。事実上、映像領域1は長さがゼロで、2つの領域間の境界は、ブロックの後端、即ち、左手端にある。この単一領域を与えるのに要するTDAC位相項はm=3N/2である。
【0066】
第3フィルターバンク用の各分析合成窓関数W3(n)は同一である。適切な窓関数の形状は、図6cの曲線243によって例示される。それは3つの区分から構成される。区域1として示される第1区分は零である。区域2及び3として示される第2及び第3区分は、図6aに示される上記窓関数W2(x)と同一である。
【0067】
この第3分析窓関数W3(n)は、区域1内の信号が零であることを保証する。その結果、区域1から区域3へ反映されるエイリアシングアーティファクトはゼロである。区域3から区域1へ反映されるエイリアシングアーティファクトは概してゼロではないであろう。しかし、第3合成窓関数W3(n)が合成されるオーディオブロックに用いられると、区域1内へ反映されるあらゆるアーティファクトは除去されるであろう。その結果、エイリアスアーティファクトは区域2のみに存在する。
【0068】
図6dは、窓関数W1(n)、W2(n)及びW3(n)241乃至243がどのように相互重複するかを例示する。利得曲線240は、端と端とをつないだ窓処理の正味効果を表す。それは、TDAC用で、対応する各分析合成窓関数の積から形成される一連の重複する積窓関数である。分析・合成窓関数W1(n)によって加重されるブロック11の区域2内のエイリアシングアーティファクトは、分析・合成窓関数W2(n)によって加重されるブロック12の前半分内のエイリアシングアーティファクトによって相殺される。分析・合成窓関数W3(n)によって加重されるブロック17の区域2内のエイリアシングアーティファクトは、分析・合成窓関数W2(n)によって加重されるブロック16の後半分内のエイリアシングアーティファクトによって相殺される。ブロック12及び13又はブロック15及び16のような中間ブロック対内の信号復元及びエイリアシング相殺は、従来のTDACにより行われる。
【0069】
この技術を用いることによって、スプライス編集はあらゆるフレーム境界で行われかつエイリア信号アーティファクトが未相殺で残ることはない。
【0070】
窓関数の導出
窓関数W2(n)は、次節に記載する技術を用いて基底窓関数から引き出され得る。適切な重複・加算特性を有するあらゆる窓関数が基底窓関数として用いられ得るが、望ましい実施形態で用いられる基底窓関数はカイザ・ベッセル(Kaiser-Bessel)窓関数である。
【0071】
【式2】
ここでα=カイザ・ベッセル窓関数アルファ係数
n=窓サンプル数
N=サンプル数窓長さ
【式3】
【0072】
誘導では、カイザ・ベッセル窓関数WKB(n)を直角窓関数s(n)で畳み込むことによって、(ブロック長−重複区間v)と等しい長さを有する分析・合成積窓関数WP(n)を発生させる。即ち
【式4】
これは以下のように単純化される。
【0073】
【式5】
ここでn=積・窓サンプル数
v=窓重複区間内のサンプル数
N=所望の積・窓の長さ
WKB(n)=長さv+1nの基底窓関数
WP(n)=長さNの誘導された積・窓
【式6】
【0074】
O-TDAC変換に関して、重複区間v=N/2、分析窓及び合成窓関数は等しい。従って、いずれかの窓関数は次式から得られる。
【0075】
【式7】
このようにして得られる分析及び合成窓は、ここではカイザ・ベッセル誘導(KBD)窓関数と呼ぶ。積窓関数は、KDB積窓関数と呼ぶ。基底カイザ・ベッセル窓関数のアルファ係数は、符号化性能を最適化させるために選んでもよい。多くの用途において符号化の最適アルファ係数は2乃至6である。
【0076】
フレーム全体を通して未相殺エイリアシングアーティファクトがないことは、スプライスにおいて本質的にあらゆる窓関数が用いられることを可能にする。概して、これらの窓関数は、重複区間に跨る一定の利得曲線を保持し得る形状を有する。各スプライスにおいて、重複区間は多くのフレームを横切って延び得る。しかし、多くの用途では5乃至30msecの範囲内にある「スプライス重複区間」を用いることが予想される。以下に述べる理由で、スプライスを横切る重複区間が増大され得ることは重要である。
【0077】
スプライスにおけるスペクトルスプラッタ・低減フィルタバンク
上記範囲内のアルファ係数は、知覚符号化が最適化されると言う意味で多くの符号化用途にとって最適である。既に述べたように、概して符号化は、より広いフィルター通過域と引換えにフィルター阻止域内の周波数減衰を増大させることによって最適化される。知覚符号化につき最適化されるフィルターの典型的周波数応答の例は、図7の曲線342に示される。この曲線は、O-TDAC分析・合成システムのフレーム利得曲線の周波数応答を表す。同システムは、α=6のKDB窓関数を用いかつ256サンプルと等しいフレーム重複区間を有する。通過及び阻止域間の境界はきびしく定めてないが、この例において通過域は約200Hzまでを含み、阻止域は約1kHz以上に及ぶ。遷移(過渡)区域が両域間に伸びる。
【0078】
256・サンプルブロックに用いられる用途では、スプライス編集は、フィルターの中心周波数の約200Hz乃至1kHz以内で著しい擬似のスペクトル成分又はスペクトルスプラッタを発生させる傾向がある。他の長さのブロックを用いる用途に関してこの周波数範囲は、ブロック長で割られる2つの定数の項で表され得る。従って、それぞれブロック長で割られる約50,000乃至256,000Hzで表される範囲以内に顕著なスペクトルスプラッタが発生する。
【0079】
図7に示す例では、これらの周波数はフィルター阻止域と考えられるものの外側である。知覚符号化性能を最適化するように設計されフィルタバンクは、スプライス編集において発生されるスペクトルスプラッタの十分な減衰は与えない。これらのアーティファクトは、通常信号によって隠蔽されるには大きすぎるので可聴である。
【0080】
図7の曲線341及び343は、2つの他の分析・合成システムの周波数応答を例示する。同システムは、阻止域ではかなりより少ない減衰を与えるが、スプライスにおいて発生されるスペクトルスプラッタによって影響される周波数範囲内でより多い減衰を与える。
【0081】
スペクトルスプラッタの減衰を増加させるために知覚符号化の幾つかの性能が犠牲になる。周波数応答でスペクトルエネルギの減衰が最適化されるのが望ましく、256サンプルブロックをフィルターするシステムに関しては200Hz及び600Hzを含む周波数若しくはそれぞれがブロック長で割られる約50、000及び150,000の周波数範囲以内が望ましい。
【0082】
時には一般的符号化及びスプライスにおけるクロスフェードされるフレームの双方に関する周波数要件を満たす妥協が得られる。そのような妥協が得られない用途では、スプライスが検知されて分析・合成システムの周波数応答が変更される。この変化は合成フィルターと共に行われなければならない。それは、分析フィルタバンクは概してスプライス操作を予想できないからである。
【0083】
図8は、分析・合成システムの端と端とをつないだ周波数応答を変えることによってスプライスにおけるスペクトルスプラッタを低減させるために用いられ得る装置320を例示する。この装置においてデフォーマット322は経路321から入力信号を受信し、そこから経路324に沿って送られる符号化されるオーディオ情報を入手し、スプライスがフレームの始め又は終りのいずれで起こるかを示す制御信号を経路323に沿って発生させる。スプライスの発生は、入力信号で明示的に伝えられるか若しくは信号で伝えられる他の信号から暗示され得る。
【0084】
例えば、AES-3/EBU標準によると、オーディオ情報の連続ブロックは、ゼロから255まで増加し、その後ほぼゼロになるブロック数を含む。2つの不連続な隣接ブロック数は、スプライスを示し得る。しかし、この試験は信頼できない。それは、AES/EBUデータの流れを処理する装置の中にはこの増加数を示さないものがあるからである。オーデイオの流れが符号化されると、符号化計画は連続的番号付けか若しくは他の形の予測可能な情報を与え得る。もし、情報が期待するものに従わないなら、スプライスの存在を示すために信号が発生され得る。
【0085】
経路323から受信される制御信号に応答して、スイッチ325が符号化されるオーディオ信号を3つの合成フィルタバンクの1つへ方向づける。スイッチ325は、スプライスに続くフレームの第1ブロックに関する符号化されるオーディオ情報を第1合成フィルタバンク326へ、スプライス前のフレーム内の最後のブロックに関する符号化されるオーディオ情報を第3合成フィルタバンク328へ、他のブロックに関する符号化されるオーディオ情報を第2合成フィルタバンク327へ方向づける。その代わりに、これらの他のブロックに関する符号化されるオーディオ情報は、図5に関して既に述べた技術により3つのフィルタバンクの1つへ方向づけられ得る。バッファ329は、3つのフィルタバンクから受信される、合成されるオーディオブロックに応答して経路330に沿って出力信号を発生させる。
【0086】
第1及び第3合成フィルタバンクは、幾つかの分析フィルタバンクと共に所望の周波数方途を達成するように設計される。多くの用途でこの分析フィルタバンクは、一般的符号化性能を第2合成フィルタバンクと最適化させるように設計される。第1及び第3フィルターバンクは、本質的に所望の総合周波数応答を与える任意の方法で実施され得る。概して、2つのフィルタバンクは、同一の周波数応答を有するが、時間・逆転される相互のレプリカであるインパルス応答を有するであろう。変換及び窓関数を用いるフィルタバンクを実施する用途では、適切なフィルタバンクは、スプライスの両側で隣接フレーム間の重複区間を増大させる合成窓関数を用いることによって実施され得る。
【0087】
合成されるオーディオの変調
これは幾つかの方法で実施され得る。一方法では、合成フィルタバンクから復元される合成されたオーディオ信号を変調し、スプライスの両側のフレームが互いにクロスフェードするようにされる。これは、図4cに例示されるような装置140で達成され得る。デコーダ146は、スプライスに先立つフレームの合成される信号の振幅を所望のスプライス・重複区間に跨って低減させる。事実上、スプライスに先立つフレームの利得曲線は、この区間を横切って単位レベルからある低レベルに低下する。同様にデコード146も、スプライスに続くフレーム内の合成信号振幅を所望のスプライス・重複区間を横切って増大させる。実際、スプライスに続くフレームの利得曲線は、この区間を横切って低レベルから単位レベルまで増大する。もし、利得曲線の有効変化が分析・合成窓処理の変調効果を説明するなら、重複されるフレームの総合利得は維持され得る。
【0088】
利得曲線の有効変化は直線であり得る。図7の曲線343は、持続時間約5msecの直線的に先細りになるフレーム利得曲線の周波数応答特性を例示する。毎秒48kサンプルのサンプルレートにおいてこの区間は約56サンプルに相当する。多くの符号化用途で、変換は256サンプルを有するサンプルブロックに用いられる。従って、これらの特殊な用途において、256サンプルの傾斜又は直線的に先細りになる利得曲線は、フレーム境界において「終端」ブロック及びこの終端ブロックと重複する隣接ブロックの一部を横切って伸びる。これは終端ブロックに1フィルターバンクを用い、じかに隣接するブロックに他のフィルタバンクを用い、フレーム内部の他のブロックにさらに別のフィルタバンクを用いることと同等である。図8に例示する装置320を参照すると、「終端」ブロックに隣接かつ重複するブロックを処理するためには2つの追加の合成フィルタバンクが必要とされるであろう。
【0089】
この直線的に先細りする湾曲部の周波数応答は、基準応答を表しそれに対して他の周波数応答が評価され得る。概して、この基準に関してスペクトルエネルギの減衰を最適化させるフィルタバンクは、スプライスにおいて発生されるスペクトルスプラッタを低減させるのに有効である。
【0090】
修正される合成窓関数
分析・合成システムの総合周波数応答を変化させる他の方法は、合成窓を修正し、分析・合成窓処理の正味効果が所望の応答を達成するようにすることである。実際、総合周波数応答は結果的に生じる分析・合成積窓関数により変化される。
【0091】
図7の曲線341は周波数応答を表し、それはスプライスにおいて曲線343によって表される、5msecの直線的に先細りする利得曲線周波数応答より大きな範囲までスペクトルスプラッタを減衰させる。曲線341の応答は、256・点変換及びα=1のKDB窓関数を用いて、O−TDAC分析・合成システムによって達成される。既に述べた通り、曲線342はα=6のKDB窓関数に相当する。
【0092】
これらの分析・合成システムの端と端とをつないだ周波数応答は、分析窓関数及び合成窓関数の積から形成される窓の周波数応答と同等である。これは代数的に以下のように表される。
WP6(n)=WA6(n)WS6(n) (5a)
WP1(n)=WA1(n)WS1(n) (5b)
ここでWA6(n)=α=6の分析KBD窓関数
WS6(n)=α=6の合成KBD窓関数
WP6(n)=α=6のKBD積窓関数
WA1(n)=α=1の分析KBD窓関数
WS1(n)=α=1の合成KBD窓関数
WP1(n)=α=1のKBD積窓関数
【0093】
端と端とをつないだ周波数応答を他の幾つかの望ましい応答に変換するために合成窓関数が修正されるなら、それ自体及び分析関数の積が所望の応答を有する積窓と同等になるように修正されなければならない。もし、WP1に相当する周波数応答が望ましくかつ分析窓関数WA6が信号分析に用いられるなら、この関係は代数的に以下のように表され得る。
WP1(n)=WA6(n)WX(n) (5c)
ここでWX(n)=周波数応答を変換するのに要する合成窓関数
これは以下のように表され得る。
WX(n)=WP1(n)/WA6(n) (5d)
【0094】
スプライス・重複区間がフレーム内の「終端」ブロックと重複する近接オーディオブロックまで伸びるなら、窓関数WXの実際の形状は、式5dで示されるものより幾分複雑になる。これは以下でより詳細に論じられる。とにかく、式5dは、フレーム内で他のあらゆるブロックと重複しない終端ブロックのその区分の窓関数WXに必要とされるものを正確に表す。O−TDACを用いるシステムに関しては、その区分はブロック長の半分と等しいか若しくは0≦n<N/2に関するものである。
【0095】
端と端とをつないだ周波数応答をより高いアルファ曲線からより低いアルファ曲線へ変換するために合成窓関数WXが用いられるときには、それはフレーム境界付近で非常に大きな値を持たなければならない。図9に例が示され、そこでは曲線351がα=1のKDB積窓を例示し、曲線356がα=6のKDB分析又は合成窓関数を例示し、曲線359が式5dによる合成窓を例示する。曲線356がフレーム境界に近づくにつれて曲線352より非常に小さくなる。従って、曲線359は非常に大きくなる。不幸にして、曲線359のような形状を有しかつ窓関数WXの端で大きく増加する合成窓関数は、非常に好ましくない周波数応答特性を有し、復元される信号の音質を劣化させるであろう。この問題を解決するために用いられ得る2つの技術が以下に論じられる。
【0096】
サンプル放棄
合成窓関数を修正する第1技術は、分析窓関数が最小値を有するフレーム境界において幾つかのサンプルを捨てることによって窓関数WXの大きな増加を避けることである。放棄されるサンプル数を変えることによって、フレーム重複区間内でサンプルを伝えるのに要する帯域幅は、デコーダの好ましくない周波数応答特性によって生じるシステム性能の低下に対して釣合がとられる。
【0097】
例えば、積窓関数WP1に相当する所望の周波数応答を達成するために、フレーム内の最初の3ブロックに関する合成窓関数が修正されかつ信号分析に用いられる窓関数がWA6であるときには、必要な修正される合成窓関数は以下のとおりである。
【0098】
【式8】
ここでWX1(n)=第1ブロックの修正される合成窓関数
WX2(n)=第2ブロックの修正される合成窓関数
WX3(n)=第3ブロックの修正される合成窓関数
x=フレーム境界で捨てられるサンプル数
【0099】
図10aは、幾つかのxの値に関して、KBDα=6分析窓関数を用いる256・点O−TDAC分析・合成システムを、256サンプルと等しいフレーム重複区間を有する、KBDα=1分析及び合成窓関数を用いるシステムのものと同等の周波数応答を有する分析・合成システムに変換するために要する、修正される合成窓関数の形状を例示する。曲線361、362、363及び364は、それぞれx=8、16、24及び32サンプルに対する修正される合成窓関数である。
【0100】
これらの修正された窓関数を用いる合成フィルタバンクの周波数応答は、図10bに示される。曲線372、373及び374は、それぞれx=8、16及び24に対する周波数応答である。曲線371は、α=1を有するKBD窓関数を用いる合成フィルタバンクの周波数応答である。この図から分かるように、x=16を有する修正された合成窓関数は、約200Hz以上からα=1を有するKBD窓関数を用いた合成フィルタバンクよって達成されるものと約同一の範囲まで周波数を減衰させる。言い換えると、分析フィルタバンク及びα=6分析窓関数と共に用いられるとき、x=16サンプルを捨てる合成フィルタバンクは、その分析−合成システムの周波数応答が、α=1分析及び合成窓関数を用いるシステムの端と端とをつないだ周波数応答と同等である端と端とをつないだ分析・合成周波数応答を達成でき、同時に、α=1合成フィルタバンクを用いる合成フィルタバンクと殆ど同程度の約200Hz以上の周波数を減衰させる合成フィルタバンク周波数応答を与えることができる。
【0101】
通常符号化用の低いアルファ値を有するKDB窓関数を用いるシステムは、概して合成窓関数への修正は少なく、フレーム終端で捨てられるべきサンプルは少なくてよいであろう。フレームの終端で修正を要する合成窓関数は、時間反転を除けば式6a乃至6cに示される窓関数と類似している。
【0102】
フレーム利得曲線変調
合成窓関数を修正する第2技術は、スプライスの両側にすぐ接してフレーム利得曲線が理想的レベルから僅かにずれさせることによって窓関数WXの大きな増加を避ける。利得曲線のずれを変えることによって、ずれによる可聴性がスペクトルスプラッタの可聴性に取って代わる。
【0103】
この技術は、修正された合成窓関数がフレーム境界において又はその近くで小さな値を持つよう平滑化する。適切になされると、結果的に生じる合成窓関数は、受容できる周波数応答を有し、利得が比較的小さいところでは、フレーム利得曲線がフレーム境界において又はその近くで理想的KBD積窓関数からずれるであろう。理想的クロスフェード利得形状によって与えられるものと比較して、スペクトルスプラッタの減衰の程度はほんの少し悪化するであろう。
【0104】
例えば、望ましい周波数応答を達成するために、フレーム内の始めの3ブロックに対する合成窓関数が修正されなければならないときには、第2及び第3ブロックに要する修正された合成窓関数WXは、概してx=0に対して上記式6b及び6cに示されるものと同一である。上記式6aに示される修正された合成窓関数WX1は、平滑化窓関数長の最初の半分に亘ってそれを点ごとに符号化窓関数と乗ずることによって平滑化される。結果的に生じる第1ブロックに対して修正された合成窓関数は次式である。
【0105】
【式9】
ここでWM(n)=平滑化窓関数
p=N未満と仮定される平滑化窓関数の長さ
フレームの終端において要する修正された合成窓関数は、時間逆転を除けばこの窓関数と同一である。
【0106】
平滑化窓関数WMは、本質的にあらゆる窓関数に基づき得るが、KBD平滑化関数がうまく働くと思われる。この例では、平滑化窓関数は、α=6を有する長さ128のKBD窓関数である。図11aでは、曲線381は平滑化なしで修正される合成窓関数の形状を例示し、曲線382は平滑化と共に修正される合成窓関数の形状を例示する。
【0107】
平滑化されかつ修正された窓関数を用いる分析・合成システムの周波数応答は、図11bに示される。曲線391は平滑化されかつ修正された窓関数を用いて結果的に得られる周波数応答を表す。曲線341は、α=1を有するKBD窓関数を用いる分析・合成システムの周波数応答を表す。曲線393は、周波数応答に対する各ピークの包絡線を表し、それは既に論じかつ曲線343として例示された、持続時間が約5msecの直線的に先細りされるフレームクロスフェード窓関数を用いることで結果的に得られる。図から分かるように、平滑化されかつ修正される合成窓関数は、α=1を有するKBD窓関数を用いる分析・合成システムによって達成される周波数応答と類似の周波数応答を達成する。
【0108】
ハイブリッド分析・合成窓関数修正
上記技術では、フレーム利得曲線へのすべての変化は単一合成処理でなされる。その代わりに、分析処理は、各フレーム境界におけるブロックに対する一周波数応答を有するフィルタバンクを用いかつ各内部ブロックに対して他のフィルタバンクを用い得る。フレーム境界におけるブロックに用いられるフィルタバンクは、スプライスにおけるスペクトルスプラッタの十分な減衰を達成させるために、合成処理で要する修正量を低減させるように設計され得る。
【0109】
データ同期
ビデオ及びオーディオの双方を処理する用途では、概してビデオフレーム長はオーディオブロック長と等しくない。表III及びIVに示される標準に対しては、各ビデオフレーム及び各オーディオブロックはめったに同期しない。言い換えると、ビデオ境界上のビデオ・オーディオ情報の編集個所は、多分オーディオブロック境界上にはない。その結果、ブロック符号化システムでは、残余の区分ブロックによって表されるオーディオ情報は適切に復元され得ない。この問題を解決する2つの技術が以下で論じられる。
【0110】
オーディオサンプルレート変換
第1技術では、外部レートで受信されるオーディオ入力信号が、符号化システムの内部処理で用いられる他のレートに変換される。内部レートは、内部信号に十分な帯域幅を与えかつ好都合なサンプル数がビデオの各フレームとグループ化され得るように選ばれ。復号、又は、再生時において出力信号が内部レートから外部レートへ変換され、それは原入力オーディオ信号の外部レートと等しい必要はない。
【0111】
表Vは、幾つかのビデオ標準に対してビデオフレーム長、ビデオフレーム長と等しい毎秒48kでのオーディオサンプル数、これらのオーディオサンプル数をサンプルの目標数に変換するのに要する内部レート及び以下に論じる内部オーディオフレーム長を示す。各ビデオ標準に対して括弧内に示される数は、Hzで示されるビデオフレームレートである。30Hzを超えるビデオフレームに対しては、目標数は896である。30Hz未満のビデオフレームに対しては、目標数は1792である。これらの目標数は例示のために選ばれたが、128サンプルずつ互いに重複する256サンプルブロックの整数の数に割り切れるので多くの用途にとって好都合である。
【0112】
【表4】
【0113】
例えば、毎秒48kサンプルでの入力オーディオ信号及び毎秒25フレームでのPALビデオ信号を処理する用途では、入力オーディオ信号は毎秒43kサンプルのレートを有する内部信号に変換され得る。内部信号サンプルは、処理用の内部オーディオフレーム内に配列され得る。表Vに示される例では、内部オーディオフレーム長は1920サンプルである。これらの例では、内部オーディオフレーム長はビデオフレーム長と等しくない。この不等は、一フレーム内の各オーディオサンプルが他のフレーム内のオーディオサンプルと重複するだけのサンプル数のためである。
【0114】
図2cに例示される例を参照すると、各フレームは互いに幾つかのサンプル数だけ重複する。このサンプル数がフレーム重複区間を構成する。多くの用途では、フレーム重複区間はそれぞれのフレーム以内の隣接オーディオブロック間の重複区間と等しい。ビデオフレーム長と等しいサンプル数は、一フレームの初めから次のフレームの初めまでの区間に跨るサンプル数である。これは、内部オーディオフレーム長からフレーム重複区間内のサンプル数を引いたものと等しい。
【0115】
表Vに示される既に論じた例では、ビデオフレーム長と等しいサンプル数は、ビデオフレーム長に依存して1792又は896のいずれかである。フレーム重複区間は128サンプルである。30Hzを超えるフレームレートに対しては、各内部オーディオフレームは1024(896+128)サンプルを含み、128サンプルずつ互いに重複する256サンプルの7ブロック内に配列され得る。低いビデオフレームレートに対しては、各内部オーディオフレームは1920(1792+128)サンプルを含み、128サンプルずつ互いに重複する256サンプルの14ブロック内に配列され得る。
【0116】
フレーム境界においてエイリアシングアーティファクトを発生させないフィルタバンクが用いられるときには、フレーム区間は256サンプルに増加されるのが望ましく、それは30Hzを超えるフレームレートに対しては、内部フレーム長を1152(896+256)まで、また、より低いフレームレートに対しては2048(1792+256)まで増加させる。
【0117】
オーディオ信号を所望のビデオフレームレートと同期させるために要する内部サンプルレートは、そのビデオフレームレートと、ビデオフレーム長と等しいサンプル数との積と等しい。これは次式と同等である。
R1=RV*(LA−LO) (8)
ここでR1=内部サンプルレート
RV=ビデオフレームレート
LA=内部オーディオフレーム長
LO=フレーム重複区間
【0118】
図12aは装置400の機能的構成図を例示し、同装置の変換回路403では、経路402から外部サンプルレートを有する入力オーディオ信号を受信し、入力オーディオ信号を内部サンプルレートを有する内部信号に変換し、内部信号を符号化回路404へ送る。内部信号に応答して符号化回路404は経路405に沿って内部オーディオフレーム内に配列される、符号化された信号を発生させる。フォーマット回路406は、経路401からフレーム内に配列されるビデオ情報を受信し、経路407に沿って出力信号を発生させるために内部オーディオフレームを各ビデオフレームとまとめる。
【0119】
図12bは、装置410の機能的構成図を例示し、同装置のデフォーマット回路412では、経路411からビデオ情報及び符号化されるオーディオ情報から成るフレーム内に配列される入力信号を受信する。デフォーマット回路412は、入力信号から、経路413に沿って送られるビデオ情報を得て、経路414に沿って送られ、内部オーディオフレームに配列された、符号化されるオーディオ情報を得る。デコード回路415は、変換回路416へ送られる内部サンプルレートを有する内部信号を発生させるために、符号化された情報を復号する。変換回路416は、内部信号を外部サンプルレートを有する出力信号に変換する。
【0120】
サンプルレート変換には本質的にあらゆる技術が用いられ得る。サンプルレート変換に対する各種の考察及び実施例がアダムス(Adams)及びクオーン(Kwan)の「非同期サンプルレート変換用理論及びVSLIアーキテクチャ」(J.Of Audio Engr.Soc.,July 1993,vol.41,no.7/8.Pp.539‐555)に開示される。
【0121】
ダイナミックオーディオフレーム調整
サンプルレート変換が用いられないときには、オーディオフレームレートはビデオフレームレートと共に変わらなければならない。内部オーディオフレーム長は、変換を用いる分割帯域符号化のようなブロック処理を容易にする変換長、例えば、適度に大きい2の冪指数の整数倍に設定され得る。次いでフレーム重複区間は、内部オーディオフレーム長と、ビデオフレームに正確にまたがるサンプル数との間の差と等しくなるように設定される。これは次式で表され得る。
LO=LA−LV (9)
ここでLV=オーディオサンプル数で表されるビデオフレーム長
【0122】
不幸にして、上記表Vに示すように、この技術はNTSCビデオを処理する用途に対して一層複雑である。それはNTSCビデオフレームレートがオーディオサンプルレートの整数倍と等しくないからである。表VIに示されるように、毎秒48kサンプルでオーディオの8008サンプルと同期させるためには、NTSCビデオの5フレームが必要である。5フレームのグループをここではスーパーフレームと言う。
【0123】
スーパーフレーム内の各ビデオフレームに相当するオーディオサンプル数は一定ではなく変化する。多くの配列が可能であるが、29.97HzNTSCビデオに対する望ましい配列は、それぞれ1602、1601、1602、1601及び1602サンプルに相当する一連の5フレームである。59.94HzNTSCビデオに対しては類似の列が用いられ、そこでは一対の801・サンプルブロックが各1602ブロックに対してかつ801と800とのサンプルブロック対が各1601ブロックに対して置き換えられ得る。以下の論議は、29.97HzNTSCビデオフレームを処理する用途に対する解明に向けられる。これらの概念は、他のビデオフレームレートにも適用され得る。
【0124】
式9に示されるように、デコーダは、ビデオフレーム長LVを決定し、重複区間長を正確に決定できるようにしなければならない。デコーダがフレーム境界でのスプライス編集と直面する場合は、スプライスに続くフレームは可能性のある5通りのスーパーフレーム線列の任意の1つを表し得る。各ブロックがデコーダで用いるスーパーフレームと一致しない限り、デコーダはそれらによって表されるオーディオを復元することはできないであろう。これは下記のダイナミック(動的)ビデオフレーム整列技術よって達成され得る。
【0125】
この技術によると、図13aに示される装置420では、エンコード回路423は、経路422からオーディオ情報を受信し、それぞれのスーパーフレーム内の各フレームにつき独特なラベルによって識別される各フレームのスーパーフレーム内に配列され、符号化されたオーディオ情報を発生させる。符号化されたオーディオ情報の各スーパーフレームは、経路425に沿って送られ、フレームラベルは経路424に沿って送られる。フォーマット回路426は、経路421からビデオ情報を受信してこのビデオ情報、符号化されたオーディオ情報の各フレーム及び相当するラベルを経路427に沿って送られる出力信号にまとめる。
【0126】
図13bに示される装置430では、デフォーマット回路432が、経路431から入力信号を受信し、経路433に沿って送られるビデを情報の各フレーム、経路435に沿って送られる符号化されたオーディオ情報の一連のスーパーフレーム及び経路434に沿って送られる符号化されたオーディオ情報の各フレームに対するラベルを得る。処理回路436は、ラベルに応答して符号化されたオーディオ情報の各フレームに対する開始サンプル及びフレーム長を決定し、デコード回路438は、処理回路436によって決められる開始サンプル及びフレーム長により、符号化されるオーディオ情報の各フレーム復号することによって経路439に沿って出力信号を発生させる。
【0127】
望ましい実施形態では、各スーパーフレームのフレームは0、1、2、3及び4と呼ばれる。フレーム0の開始サンプルは、ビデオ信号のフレーム境界と正確に同期すると仮定される。スーパーフレーム内の各フレームは、同一構造で発生され、「初期サンプル」、「名目開始サンプル」及び合計1603サンプルに対する他の1601サンプルを有する。望ましい実施形態では、サンプルは0から1602までの番号をつけられ、そこでは名目開始サンプルはサンプル番号1である。従って、ビデオフレーム長は1603である。既に論じたとおり、内部オーディオフレーム長はフレーム重複区間のためにより大きくなり得る。好都合な内部オーディオフレーム長は1792である。フレーム利得曲線は、1603のビデオフレーム長により決められる。今述べた例については、フレーム重複区間は189(1792−1603)である。
【0128】
装置430は、所望の任意のスーパーフレーム整列を採用しかつ各オーディオフレームの整列を動的に変えて、ビデオ情報との適切な同期が得られるようにする。整列は、開始サンプル及び各フレームに対する長さを動的に選択することによって変えられる。既に述べた通り、スーパーフレーム内の5・フレームパターンにより長さは1601及び1602間で変わる。この動的整列の効果は、同伴のビデオ情報との同期を保持する、スプライスに続く適切な整列が直ちに得られることである。
【0129】
ここで述べる望ましい実施形態では、開始サンプル番号及びビデオフレーム長は次式により得られる。
K=(FE−FD)mod5 (10)
ここでK=整列表アクセスキー
FE=エンコーダフレームラベル
FD=デコーダフレームラベル
【0130】
デコーダは、符号化された信号からエンコーダフレームラベルを得る。デコーダフレームラベルは、デコーダによって採用されるスーパーフレーム整列により0乃至4の反復列の形でデコーダによって発生される。
【0131】
デコーダは、表へのアクセスキーとしてKを用いて表VIから適切なフレーム開始サンプル及びビデオフレーム長を得る。
【0132】
【表5】
【0133】
動的整列の例は図14に例示される。この例では、スーパーフレームはフレーム453で始まり、フレーム455に続くスプライスによって中断される。スーパーフレーム内の最後のフレーム456がスプライスに続き、新しいスーパーフレームがフレーム457で始まる。各フレーム内のオーディオ情報の理想的長さは、列450のボックス内に示される。エンコーダによって発生される各フレームに対するエンコーダフレームラベルFEは、列461に示される。ラベル0が各スーパーフレームの第1フレームに相当することに注目されたい。この例では、デコーダによって仮定されるデコーダラベルFDは、列462内に示される。式10によって計算されるこれらの2ラベル間の差は、列463内に示される整列表アクセスキーKを決定する。整列表から決められるように、開始及び終了サンプル数は列464内に示される。例えば、0−1601の表示は、サンプル0で始まりサンプル1601で終わる1602・サンプルフレームを示す。
【0134】
フレーム451では、デコーダが1602サンプル長のブロックを処理する。このフレームは、エンコーダスーパーフレーム整列による「理想的」長さより一サンプル長い。従って、フレーム452は一サンプル遅く開始しかつ理想的長さより一サンプル短い。これは、サンプル番号1で始まり、スーパーフレームの第1フレームと正確に同期されるフレーム453に帰着する。フレーム454及び455の整列は理想的整列と一致する。
【0135】
スプライスの直後、フレーム456の整列は理想的配列と一致する。フレーム457は、サンプル番号1で始まり、次のスーパーフレーム開始と正確に同期する。フレーム457の長さは、理想的長さより1サンプル短いが、それでフレーム458は1サンプル早く始まりかつ理想的長さより1サンプル長い長さを有する。フレーム459の開始は、理想的なものと一致するが、それより一サンプル短い。従って、フレーム460は一サンプル早く始まりかつ理想的なものより一サンプル長い。
【0136】
このサンプルが示すように、スプライスによって発生されるあらゆる不連続性にかかわらず、デコーダは各スーパーフレームの開始との正確な同期を達成する。
【0137】
式6a乃至6cと共に既に論じたものと類似の方法で適切な端と端とをつないだフレーム利得曲線を達成させるために、装置430は修正された窓関数を用いる。各フレームの開示における修正される合成窓関数は、式6aに従って決定され、そこではフレーム境界において「捨てられる」サンプル数xは、早期開始サンプルと比較してフレーム開始整列オフセット(偏差)と等しい。例えば、サンプル2で始まるフレームに対してはx=2である。各フレームの終りにおける修正された合成窓関数は、時間反転方法におけるものを除けば、}式6aにより同様に決定される。
【図面の簡単な説明】
【図1】 ブロック、フレーム及びスーパーフレームの形で配列されるビデオ及びオーディオの構成図で、図1a及び1bで示される。
【図2】 窓関数で変調される重複ブロック及び窓されたブロックを含むフレームの結果的に生じる利得曲線の利得構成図であり、図2乃至図2cで示される。
【図3】 エイリアシング相殺変換によって発生される信号及びエイリアシング成分を例示する。
【図4】 符号化される情報の流れにおいて利得制御ワードを発生させ、変化させかつそれに応答する装置の機能的構成図を例示する。
【図5】 フレーム境界においてエイリアシングアーティファクトを抑制するために交番するフィルタバンクを加える装置の機能的構成図であり、図5a及び5bで示される。
【図6】 フレーム境界においてエイリアシングアーティファクトを抑制するために用いられ得る窓関数構成図であり、図6a乃至6dで示される。
【図7】 フレーム境界における各種の窓関数を用いる結果から得られる周波数応答特性を例示する。
【図8】 各スプライスにおいてスペクトルスプラッタの減衰を増強させるために交番するフィルタバンクを加える装置の機能的構成図を例示する。
【図9】 図8の装置に関する幾つかの窓関数の構成図である。
【図10】 図8の装置に関する幾つかの窓関数の構成図であり、図10aで示される。
【図11】 図8の装置に関する幾つかの窓関数の構成図であり、図11aで示される。
【図12】 オーディオサンプル及びビデオフレーム間の同期を行うためにサンプルレート変換に備える装置を例示する機能的構成図であり、図12a及び12bで示される。
【図13】 スプライスを横切るビデオスーパーフレームと同期させるために動的オーディオフレーム整列に備える装置を例示する機能的構成図であり、図13a及び13bで示される。
【図14】 ビデオフレーム特性及びスプライスを横切る動的オーディオフレームの効果を示す構成図である。
Claims (18)
- 一連の入力フレームから成る入力信号を受信するステップであって、それぞれの入力フレームが、符号化されたオーディオ情報を伝える複数の符号化されたブロックを含み、ここで、第1の入力フレームは、該第1の入力フレーム内に、中間符号化された第1のブロックに続く符号化された末端ブロックを有し、前記第1の入力フレームに直に続く第2の入力フレームは、該第2の入力フレーム内に、中間符号化された第2のブロックに先行する符号化された開始ブロックを有し、ここで、該符号化された開始ブロックは、第1分析フィルタバンクでフィルターされたオーディオ情報を伝え、前記符号化された末端ブロックは、第3分析フィルタバンクでフィルターされたオーディオ情報を伝え、中間符号化された前記第1のブロックと中間符号化された前記第2のブロックとは、第2分析フィルタバンクでフィルターされたオーディオ情報を伝える、
ステップと、
前記第1の入力フレームと前記第2の入力フレームとの境界を識別する制御信号323を受信するステップと、
合成されたサンプルブロックの第2合成フレームに直に先行する合成されたサンプルブロックの第1合成フレームを発生させるステップであって、該第1合成フレームは、該第1の合成フレーム内に、中間合成された第1のサンプルブロックに続く合成された末端サンプルブロックを有し、前記第2の合成フレームは、該第2の合成フレーム内に、中間合成された第2のサンプルブロックに先行する合成された開始サンプルブロックを有し、ここで、該合成された開始サンプルブロックは、前記符号化された開始ブロックに第1合成フィルタバンク326を適用することによって発生し、前記合成された末端サンプルブロックは、前記符号化された末端ブロックに第3合成フィルタバンク328を適用することによって発生し、前記中間合成された第1のサンプルブロックは、前記中間符号化された第1のブロックに第2合成フィルタバンク327を適用することによって発生し、前記中間合成された第2のサンプルブロックは、前記中間符号化された第2のブロックに第2合成フィルタバンクを適用することによって発生し、ここで、
前記合成された開始サンプルブロック内のサンプル数で約50,000を割った周波数乃至前記合成された開始サンプルブロック内のサンプル数で約150,000を割った周波数に等しい周波数Hz範囲内において、前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの周波数応答342によりスペクトルエネルギが減衰する以上に、前記第1分析フィルタバンクと関連する前記第1合成フィルタバンクの周波数応答341によりスペクトルエネルギが減衰し、
前記合成された末端サンプルブロック内のサンプル数で約50,000を割った周波数乃至前記合成された開始サンプルブロック内のサンプル数で約150,000を割った周波数に等しい周波数Hz範囲内において、前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの周波数応答によりスペクトルエネルギが減衰する以上に、前記第3分析フィルタバンクと関連する前記第3合成フィルタバンクの周波数応答341によりスペクトルエネルギを減衰する、
ステップと、
隣接する合成されたサンプルブロックを重複させかつ該重複した合成されたサンプルブロック内の対応する重複したサンプルを加算することによって出力信号330を発生させるステップと、
から成る信号処理方法。 - 一連の入力フレームから成る入力信号を受信するステップであって、それぞれの入力フレームが複数の符号化されたオーディオ情報を伝える符号化されたブロックを含み、ここで、第1の入力フレームは、該第1の入力フレーム内に、中間符号化された第1のブロックに続く符号化された末端ブロックを有し、前記第1の入力フレームに直に続く第2の入力フレームは、該第2の入力フレーム内に、中間符号化された第2のブロックに先行する符号化された開始ブロックを有し、ここで、該符号化された開始ブロックは、第1分析フィルタバンクでフィルターされたオーディオ情報を伝え、ここで、前記符号化された末端ブロックは、第3分析フィルタバンクでフィルターされたオーディオ情報を伝え、中間符号化された前記第1のブロックと中間符号化された前記第2のブロックとは、第2分析フィルタバンクでフィルターされたオーディオ情報を伝える、
ステップと、
前記第1の入力フレームと第2の入力フレームとの境界を識別する制御信号323を受信するステップと、
合成されたサンプルブロックの第2合成フレームに直に先行する合成されたサンプルブロックの第1合成フレームを発生させるステップであって、該第1合成フレームは、該第1合成フレーム内に、中間合成された第1のサンプルブロックに続く合成された末端サンプルブロックを有するようにし、前記第2合成フレームは、該第2合成フレーム内に、中間合成された第2のサンプルブロックに先行する合成された開始サンプルブロックを有し、ここで、該合成された開始サンプルブロックは、前記符号化された開始ブロックに第1合成フィルタバンク326を適用することによって発生し、前記合成された末端サンプルブロックは、前記符号化された末端ブロックに第3合成フィルタバンク328を適用することによって発生し、前記中間合成された第1のサンプルブロックは、前記中間符号化された第1のブロックに第2合成フィルタバンク327を適用することによって発生し、前記中間合成された第2のサンプルブロックは、前記中間符号化された第2のブロックに第2合成フィルタバンクを適用することによって発生し、ここで、
前記第1分析フィルタバンクと関連する前記第1合成フィルタバンクの第1周波数応答341によるスペクトルエネルギの減衰は、基準周波数応答343によって得られる減衰と比較して、前記第1周波数応答による阻止域内での減衰は小さくなるが、前記第1周波数応答による阻止域外でのスペクトルスプラッタの減衰は大きくなるよう、前記基準周波数応答の減衰に関して最適化され、該基準周波数応答は、約5msecに亘って実質的に線形・傾斜形状に従うインパルス応答に相当し、
前記第3分析フィルタバンクと関連する前記第3合成フィルタバンクの第3周波数応答341によるスペクトルエネルギの減衰は、基準周波数応答によって得られる減衰と比較して、前記第2周波数応答による阻止域内での減衰は小さくなるが、前記第2周波数応答による阻止域外でのスペクトルスプラッタの減衰は大きくなるよう、前記基準周波数応答の減衰に関して最適化され、
前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの第2周波数応答342は、前記第1周波数応答及び第3周波数応答とは異なる、
ステップと、
隣接する合成されたサンプルブロックを重複させかつ該重複された合成されたサンプルブロック内の対応する重複したサンプルを加算することによって出力信号330を発生させるステップと、
から成る信号処理方法。 - 前記合成された末端サンプルブロック内の1つ以上のサンプル及び前記合成された開始サンプルブロック内の1つ以上のサンプルを破棄するステップをさらに含む、請求項1又は2のいずれか1つの方法。
- 前記第1の入力フレームと第2の入力フレームとの間のスプライス編集個所を識別しかつそれに応答して前記制御信号を発生させるステップをさらに含む、請求項1乃至3のいずれか1つの方法。
- 前記入力信号の連続フレーム間の境界を識別しかつそれに応答して前記制御信号を発生させ、それぞれの境界に先行する各入力フレームをそれぞれの第1の入力フレームとして識別し、それぞれの境界に続く各入力フレームをそれぞれの第2の入力フレームとして識別させるようにするステップをさらに含む、請求項1乃至3のいずれか1つの方法。
- 前記第1合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含み、前記第2合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含み、前記第3合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含む、請求項1乃至5のいずれか1つの方法。
- 前記第1合成フィルタバンクは、1つ以上の逆変換及び第1合成窓関数を含み、前記第2合成フィルタバンクは、1つ以上の前記逆変換及び第2合成窓関数を含み、前記第3合成フィルタバンクは、1つ以上の前記逆変換及び第2合成窓関数を含む、請求項1乃至5のいずれか1つの方法。
- 前記第1分析フィルタバンク、前記第2分析フィルタバンク及び前記第3分析フィルタバンクの周波数応答は、実質的に同一である、請求項1乃至7のいずれか1つの方法。
- 前記第1の入力フレームから第1開始利得レベル及び第1末端利得レベルを表す複数の利得・制御ワード145を入手し、前記第2の入力フレームから第2開始利得レベル及び第2末端利得レベルを表す複数の利得・制御ワード145を入手するステップと、
前記第1開始利得レベル及び前記第1末端利得レベルの内挿を表す第1利得制御信号149a、149bを発生させ、前記第2開始利得レベル及び前記第2末端利得レベルの内挿を表す第2利得制御信号149a、149bを発生させるステップと、
前記第3合成フィルタバンク328を実施するために前記第1利得制御信号により前記合成された末端サンプルブロックを変調させ、前記第1合成フィルタバンク326を実施するために前記第2利得制御信号により前記合成された開始サンプルブロックを変調させるステップと、
を含む、請求項1乃至8のいずれか1つの方法。 - 一連の入力フレームから成る入力信号を受信する受信装置であって、それぞれの入力フレームが、符号化されたオーディオ情報を伝える複数の符号化されたブロックを含み、ここで、第1の入力フレームは、該第1の入力フレーム内に、中間符号化された第1のブロックに続く符号化された末端ブロックを有し、前記第1の入力フレームに直に続く第2の入力フレームは、該第2の入力フレーム内に、中間符号化された第2のブロックに先行する符号化された開始ブロックを有し、ここで、該符号化された開始ブロックは、第1分析フィルタバンクでフィルターされたオーディオ情報を伝え、前記符号化された末端ブロックは、第3分析フィルタバンクでフィルターされたオーディオ情報を伝え、中間符号化された前記第1のブロックと中間符号化された前記第2のブロックとは、第2分析フィルタバンクでフィルターされたオーディオ情報を伝える、受信装置と、
前記第1の入力フレームと前記第2の入力フレームとの境界を識別する制御信号323を受信する装置と、
合成されたサンプルブロックの第2合成フレームに直に先行する合成されたサンプルブロックの第1合成フレームを発生させる発生装置であって、該第1合成フレームは、該第1の合成フレーム内に、中間合成された第1のサンプルブロックに続く合成された末端サンプルブロックを有し、前記第2の合成フレームは、該第2の合成フレーム内に、中間合成された第2のサンプルブロックに先行する合成された開始サンプルブロックを有し、ここで、該合成された開始サンプルブロックは、前記符号化された開始ブロックに第1合成フィルタバンク326を適用することによって発生し、前記合成された末端サンプルブロックは、前記符号化された末端ブロックに第3合成フィルタバンク328を適用することによって発生し、前記中間合成された第1のサンプルブロックは、前記中間符号化された第1のブロックに第2合成フィルタバンク327を適用することによって発生し、前記中間合成された第2のサンプルブロックは、前記中間符号化された第2のブロックに第2合成フィルタバンクを適用することによって発生し、ここで、
前記合成された開始サンプルブロック内のサンプル数で約50,000を割った周波数乃至前記合成された開始サンプルブロック内のサンプル数で約150,000を割った周波数に等しい周波数Hz範囲内において、前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの周波数応答342によりスペクトルエネルギが減衰する以上に、前記第1分析フィルタバンクと関連する前記第1合成フィルタバンクの周波数応答341によりスペクトルエネルギが減衰し、
前記合成された末端サンプルブロック内のサンプル数で約50,000を割った周波数乃至前記合成された開始サンプルブロック内のサンプル数で約150,000を割った周波数に等しい周波数Hz範囲内において、前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの周波数応答によりスペクトルエネルギが減衰する以上に、前記第3分析フィルタバンクと関連する前記第3合成フィルタバンクの周波数応答341によりスペクトルエネルギを減衰する、
発生装置と、
隣接する合成されたサンプルブロックを重複させかつ該重複した合成されたサンプルブロック内の対応する重複したサンプルを加算することによって出力信号330を発生させる装置と、
から成る信号処理装置。 - 一連の入力フレームから成る入力信号を受信する受信装置であって、それぞれの入力フレームが複数の符号化されたオーディオ情報を伝える符号化されたブロックを含み、ここで、第1の入力フレームは、該第1の入力フレーム内に、中間符号化された第1のブロックに続く符号化された末端ブロックを有し、前記第1の入力フレームに直に続く第2の入力フレームは、該第2の入力フレーム内に、中間符号化された第2のブロックに先行する符号化された開始ブロックを有し、ここで、該符号化された開始ブロックは、第1分析フィルタバンクでフィルターされたオーディオ情報を伝え、ここで、前記符号化された末端ブロックは、第3分析フィルタバンクでフィルターされたオーディオ情報を伝え、中間符号化された前記第1のブロックと中間符号化された前記第2のブロックとは、第2分析フィルタバンクでフィルターされたオーディオ情報を伝える、受信装置と、
前記第1の入力フレームと第2の入力フレームとの境界を識別する制御信号323を受信する装置と、
合成されたサンプルブロックの第2合成フレームに直に先行する合成されたサンプルブロックの第1合成フレームを発生させる発生装置であって、該第1合成フレームは、該第1合成フレーム内に、中間合成された第1のサンプルブロックに続く合成された末端サンプルブロックを有するようにし、前記第2合成フレームは、該第2合成フレーム内に、中間合成された第2のサンプルブロックに先行する合成された開始サンプルブロックを有し、ここで、該合成された開始サンプルブロックは、前記符号化された開始ブロックに第1合成フィルタバンク326を適用することによって発生し、前記合成された末端サンプルブロックは、前記符号化された末端ブロックに第3合成フィルタバンク328を適用することによって発生し、前記中間合成された第1のサンプルブロックは、前記中間符号化された第1のブロックに第2合成フィルタバンク327を適用することによって発生し、前記中間合成された第2のサンプルブロックは、前記中間符号化された第2のブロックに第2合成フィルタバンクを適用することによって発生し、ここで、
前記第1分析フィルタバンクと関連する前記第1合成フィルタバンクの第1周波数応答341によるスペクトルエネルギの減衰は、基準周波数応答343によって得られる減衰と比較して、前記第1周波数応答による阻止域内での減衰は小さくなるが、前記第1周波数応答による阻止域外でのスペクトルスプラッタの減衰は大きくなるよう、前記基準周波数応答の減衰に関して最適化され、該基準周波数応答は、約5msecに亘って実質的に線形・傾斜形状に従うインパルス応答に相当し、
前記第3分析フィルタバンクと関連する前記第3合成フィルタバンクの第3周波数応答341によるスペクトルエネルギの減衰は、基準周波数応答によって得られる減衰と比較して、前記第2周波数応答による阻止域内での減衰は小さくなるが、前記第2周波数応答による阻止域外でのスペクトルスプラッタの減衰は大きくなるよう、前記基準周波数応答の減衰に関して最適化され、
前記第2分析フィルタバンクと関連する前記第2合成フィルタバンクの第2周波数応答342は、前記第1周波数応答及び第3周波数応答とは異なる、
発生装置と、
隣接する合成されたサンプルブロックを重複させかつ該重複された合成されたサンプルブロック内の対応する重複したサンプルを加算することによって出力信号330を発生させる装置と、
から成る信号処理装置。 - 前記合成された末端サンプルブロック内の1つ以上のサンプル及び前記合成された開始サンプルブロック内の1つ以上のサンプルを破棄することをさらに含む、請求項10又は11のいずれか1つの装置。
- 前記第1の入力フレームと第2の入力フレームとの間のスプライス編集個所を識別しかつそれに応答して前記制御信号を発生させる装置をさらに含む、請求項10乃至12のいずれか1つの装置。
- 前記入力信号の連続フレーム間の境界を識別しかつそれに応答して前記制御信号を発生させ、それぞれの境界に先行する各入力フレームをそれぞれの第1入力フレームとして識別し、それぞれの境界に続く各入力フレームをそれぞれの第2入力フレームとして識別させるようにする装置をさらに含む、請求項10乃至12のいずれか1つの装置。
- 前記第1合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含み、前記第2合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含み、前記第3合成フィルタバンクは、1つ以上の逆変換及び2未満のアルファ値を有するカイザ・ベッセル窓関数から得られる合成窓関数を含む、請求項10乃至14のいずれか1つの装置。
- 前記第1合成フィルタバンクは、1つ以上の逆変換及び第1合成窓関数を含み、前記第2合成フィルタバンクは、1つ以上の前記逆変換及び第2合成窓関数を含み、前記第3合成フィルタバンクは、1つ以上の前記逆変換及び第2合成窓関数を含む、請求項10乃至14のいずれか1つの装置。
- 前記第1分析フィルタバンク、前記第2分析フィルタバンク及び前記第3分析フィルタバンクの周波数応答は、実質的に同一である、請求項10乃至16のいずれか1つの装置。
- 前記第1入力フレームから第1開始利得レベル及び第1末端利得レベルを表す複数の利得・制御ワード145を得ると共に前記第2入力フレームから第2開始利得レベル及び第2末端利得レベルを表す複数の利得・制御ワード145を得る装置142と、
前記第1開始利得レベル及び前記第1末端利得レベルの内挿を表す第1利得制御信号149a、149b発生させ、前記第2開始及び前記第2末端利得レベルの内挿を表す第2利得制御信号149a、149b発生させる装置148と、
前記第3合成フィルタバンク328を実施するために前記第1利得制御信号により前記合成された末端サンプルブロックを変調させ、前記第1合成フィルタバンク326を実施するために前記第2利得制御信号により前記合成された開始サンプルブロックを変調させる装置146とを含む、請求項10乃至17のいずれか1つの装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/953,106 | 1997-10-17 | ||
US08/953,106 US5903872A (en) | 1997-10-17 | 1997-10-17 | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
PCT/US1998/021700 WO1999021187A1 (en) | 1997-10-17 | 1998-10-15 | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001521308A JP2001521308A (ja) | 2001-11-06 |
JP2001521308A5 JP2001521308A5 (ja) | 2006-02-09 |
JP4126680B2 true JP4126680B2 (ja) | 2008-07-30 |
Family
ID=25493577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000517417A Expired - Lifetime JP4126680B2 (ja) | 1997-10-17 | 1998-10-15 | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 |
Country Status (16)
Country | Link |
---|---|
US (1) | US5903872A (ja) |
EP (1) | EP1023730B1 (ja) |
JP (1) | JP4126680B2 (ja) |
KR (1) | KR100630893B1 (ja) |
CN (1) | CN1199179C (ja) |
AT (1) | ATE210881T1 (ja) |
AU (1) | AU745914B2 (ja) |
BR (1) | BR9812921B1 (ja) |
CA (1) | CA2305237C (ja) |
DE (1) | DE69802959T2 (ja) |
DK (1) | DK1023730T3 (ja) |
ES (1) | ES2165200T3 (ja) |
HK (1) | HK1033194A1 (ja) |
MY (1) | MY117166A (ja) |
TW (1) | TW391137B (ja) |
WO (1) | WO1999021187A1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US7283965B1 (en) * | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
US6748363B1 (en) * | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
EP1215663A1 (en) * | 2000-12-15 | 2002-06-19 | BRITISH TELECOMMUNICATIONS public limited company | Encoding audio signals |
JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
FR2824978B1 (fr) * | 2001-05-15 | 2003-09-19 | Wavecom Sa | Dispositif et procede de traitement d'un signal audio |
WO2003090918A1 (fr) | 2002-04-26 | 2003-11-06 | China Petroleum & Chemical Corporation | Reacteur de craquage catalytique a courant descendant |
US7292902B2 (en) * | 2003-11-12 | 2007-11-06 | Dolby Laboratories Licensing Corporation | Frame-based audio transmission/storage with overlap to facilitate smooth crossfading |
WO2008001316A2 (en) * | 2006-06-29 | 2008-01-03 | Nxp B.V. | Decoding sound parameters |
EP2112653A4 (en) * | 2007-05-24 | 2013-09-11 | Panasonic Corp | AUDIO DECODING DEVICE, AUDIO DECODING METHOD, PROGRAM, AND INTEGRATED CIRCUIT |
RU2433525C1 (ru) * | 2007-07-13 | 2011-11-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня |
US20090048827A1 (en) * | 2007-08-17 | 2009-02-19 | Manoj Kumar | Method and system for audio frame estimation |
RU2488898C2 (ru) * | 2007-12-21 | 2013-07-27 | Франс Телеком | Основанное на преобразовании кодирование/декодирование с адаптивными окнами |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
KR101838301B1 (ko) * | 2012-02-17 | 2018-03-13 | 삼성전자주식회사 | 멀티미디어 컨텐츠 프레임 검색 방법 및 장치 |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
US10115410B2 (en) * | 2014-06-10 | 2018-10-30 | Peter Graham Craven | Digital encapsulation of audio signals |
US10861471B2 (en) * | 2015-06-10 | 2020-12-08 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
EP3405949B1 (en) * | 2016-01-22 | 2020-01-08 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for estimating an inter-channel time difference |
ES2994324T3 (en) | 2016-02-17 | 2025-01-22 | Fraunhofer Ges Forschung | Audio encoder, audio decoder and related methods for enhancing transient processing, computer program |
US10726851B2 (en) * | 2017-08-31 | 2020-07-28 | Sony Interactive Entertainment Inc. | Low latency audio stream acceleration by selectively dropping and blending audio blocks |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60214164A (ja) * | 1984-04-09 | 1985-10-26 | Nec Corp | オ−デイオシンクロナイザ |
US5479562A (en) * | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
DE69210689T2 (de) * | 1991-01-08 | 1996-11-21 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
JP3141450B2 (ja) * | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
US5394508A (en) * | 1992-01-17 | 1995-02-28 | Massachusetts Institute Of Technology | Method and apparatus for encoding decoding and compression of audio-type data |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
DE69522883T2 (de) * | 1994-05-19 | 2002-04-11 | Koninklijke Philips Electronics N.V., Eindhoven | Vorrichtung zur bestimmung des signalspektrums eines digitalen breitbandsignals und zur ableitung einer bitzuweisungsinformation |
AU697176B2 (en) * | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
-
1997
- 1997-10-17 US US08/953,106 patent/US5903872A/en not_active Expired - Lifetime
-
1998
- 1998-10-14 TW TW087117092A patent/TW391137B/zh not_active IP Right Cessation
- 1998-10-15 CA CA002305237A patent/CA2305237C/en not_active Expired - Lifetime
- 1998-10-15 AU AU13608/99A patent/AU745914B2/en not_active Expired
- 1998-10-15 JP JP2000517417A patent/JP4126680B2/ja not_active Expired - Lifetime
- 1998-10-15 ES ES98957324T patent/ES2165200T3/es not_active Expired - Lifetime
- 1998-10-15 AT AT98957324T patent/ATE210881T1/de active
- 1998-10-15 DE DE69802959T patent/DE69802959T2/de not_active Expired - Lifetime
- 1998-10-15 BR BRPI9812921-0A patent/BR9812921B1/pt not_active IP Right Cessation
- 1998-10-15 EP EP98957324A patent/EP1023730B1/en not_active Expired - Lifetime
- 1998-10-15 CN CNB988100932A patent/CN1199179C/zh not_active Expired - Lifetime
- 1998-10-15 WO PCT/US1998/021700 patent/WO1999021187A1/en active IP Right Grant
- 1998-10-15 MY MYPI98004715A patent/MY117166A/en unknown
- 1998-10-15 KR KR1020007003420A patent/KR100630893B1/ko not_active IP Right Cessation
- 1998-10-15 DK DK98957324T patent/DK1023730T3/da active
-
2001
- 2001-05-29 HK HK01103687A patent/HK1033194A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
AU745914B2 (en) | 2002-04-11 |
ES2165200T3 (es) | 2002-03-01 |
DE69802959D1 (de) | 2002-01-24 |
MY117166A (en) | 2004-05-31 |
ATE210881T1 (de) | 2001-12-15 |
CN1275234A (zh) | 2000-11-29 |
DK1023730T3 (da) | 2002-04-02 |
BR9812921B1 (pt) | 2010-11-30 |
DE69802959T2 (de) | 2002-06-20 |
KR100630893B1 (ko) | 2006-10-02 |
US5903872A (en) | 1999-05-11 |
TW391137B (en) | 2000-05-21 |
CA2305237C (en) | 2005-12-20 |
CA2305237A1 (en) | 1999-04-29 |
KR20010024341A (ko) | 2001-03-26 |
WO1999021187A1 (en) | 1999-04-29 |
HK1033194A1 (en) | 2001-08-17 |
JP2001521308A (ja) | 2001-11-06 |
EP1023730B1 (en) | 2001-12-12 |
EP1023730A1 (en) | 2000-08-02 |
BR9812921A (pt) | 2000-08-08 |
AU1360899A (en) | 1999-05-10 |
CN1199179C (zh) | 2005-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4126681B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
JP4126680B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
JP4236813B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
JP4229586B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
JP4126682B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
JP2001521309A5 (ja) | ||
JP2001521308A5 (ja) | ||
JP2001521347A5 (ja) | ||
JP2001521310A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20051013 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051013 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080422 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080502 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |