JP4313993B2 - オーディオ復号化装置およびオーディオ復号化方法 - Google Patents
オーディオ復号化装置およびオーディオ復号化方法 Download PDFInfo
- Publication number
- JP4313993B2 JP4313993B2 JP2002211443A JP2002211443A JP4313993B2 JP 4313993 B2 JP4313993 B2 JP 4313993B2 JP 2002211443 A JP2002211443 A JP 2002211443A JP 2002211443 A JP2002211443 A JP 2002211443A JP 4313993 B2 JP4313993 B2 JP 4313993B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sine wave
- frequency
- low
- processing procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 51
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 238000000926 separation method Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims 2
- 239000002131 composite material Substances 0.000 abstract description 3
- 239000000203 mixture Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
本発明は、少ない情報量の補助情報を付加することによって、狭帯域なオーディオ信号から広帯域なオーディオ信号を生成する帯域拡張システムに関わり、当該システムにおける再生信号の高品質化と低演算量化のための技術に関する。
【0002】
【従来の技術】
一般的な音響信号を、少ない情報量で符号化でき、かつ高品質な再生信号を得られる技術として、帯域分割符号化を利用する方法が広く知られている。これは、入力された音響信号を、帯域分割フィルタを用いて複数の周波数帯域の信号に分割するか、もしくはフーリエ変換等の時間−周波数変換を用いて周波数軸の信号に変換した後、周波軸上で複数の帯域に分割した上で、分割された各帯域に適切な符号化ビット割当を行うことにより、実現されるものである。帯域分割符号化を用いることにより、少ない情報量の符号から高品質な再生信号を得られる理由は、符号化段階において人間の聴覚特性に基づいた処理を行うことができることにある。一般に、人間の聴覚は、10kHz程度以上の高い周波数の音に対しては感度が下がり、レベルの低い音は感知されにくくなる。また、周波数マスキングと呼ばれる現象も良く知られており、ある特定の周波数帯域に高いレベルの音が存在する場合、その周辺帯域のレベルの低い音は感知されにくくなる。このような、聴覚的な特性によって感知されにくい部分については、ビット割当を行って符号化を行っても再生信号の品質にはほとんど影響を及ぼさず、符号化の意味をなさない。逆に、聴覚的特性を考慮しないままこの部分に割り当てられていた符号化ビットを、他の聴覚的に敏感な部分に割当て直すことによって、聴覚的に敏感な部分を詳細に符号化し、再生信号の品質を向上することができる。このような帯域分割を利用した符号化の代表例としては、ISO国際標準規格MPEG−4 AAC(ISO/IEC 14496−3)があり、96kbps程度のビットレートにおいて、16kHz以上の広帯域のステレオ信号を高品質に符号化することが可能である。
【0003】
しかしながら、ビットレートを例えば48kbps程度に低下させた場合、高品質に符号化できる帯域は10kHz程度以下となり、聴感的にはこもった感じの音となる。このような帯域制限による音質劣化を補償する方法としては、例えば、ETSI(European Telecommunications Standards Institute)が勧告する「Digital Radio Mondiale(DRM);System Specification」(ETSI TS 101 980)に記載される、SBR(Spectral Band Replication)と呼ばれる技術がある。
【0004】
図7はSBRによる帯域拡張を行うデコーダの一例を示す図である。以降、図を参照しながら、その動作を説明する。入力ビットストリーム706は、ビットストリーム分離手段701において、低域成分情報707、高域成分情報708、および正弦波付加情報709に分離される。低域成分情報707は、例えばMPEG−4 AAC等の符号化方式を用いて符号化された情報であり、低域復号手段702において復号され、低域成分を表す時間信号が生成される。生成された低域成分を表す時間信号は、分析フィルタバンク703において複数(M個)のサブバンドに分割され、帯域拡張手段704に入力される。帯域拡張手段704は、低域成分を表す低域サブバンド信号を高域のサブバンドにコピーすることによって、帯域制限によって失われた高域成分を補償する。ここで、帯域拡張手段704に入力される高域成分情報708には、補償される高域サブバンドに対するゲイン情報が含まれており、生成された高域サブバンドごとにゲインが調整される。また、正弦波付加情報709にしたがって、各高域サブバンドに対して、ゲイン制御された正弦波が加算される。帯域拡張手段704において生成された高域サブバンド信号は、低域サブバンド信号と共に合成フィルタバンク705に入力されて帯域合成され、出力信号710が生成される。このとき、合成フィルタバンク側のサブバンド数は、分析フィルタ側のサブバンド数と一致していなくても良い。例えば、図7においてN=2Mの関係が成り立つとすれば、出力信号のサンプリング周波数は、分析フィルタバンクに入力される時間信号のサンプリング周波数に対して2倍となる。
【0005】
上記の構成では、高域成分情報708もしくは正弦波付加情報709に含まれる情報は、ゲイン制御に関わる情報のみであるので、スペクトル情報を含む低域成分情報707と比較して非常に少ない情報量しか必要としない。したがって、低ビットレートにおいて広帯域の信号を符号化するのに適した方法である。
【0006】
【発明が解決しようとする課題】
しかしながら、上記の構成においては、特に正弦波を付加する場合においてサブバンドフィルタに起因する制限を受ける。たとえば、高域サブバンドに正弦波を付加する際に、隣接するサブバンドフィルターとの境界に相当するような周波数に正弦波を付加する場合は、隣接する2つのサブバンドに対して、正弦波成分を追加しなくてはならず、かつ、その正弦波成分に対する振幅値や位相は相互に影響するので、それを導出するのに多くの計算量が必要となることが予想される。よって、実際には、各サブバンドの中心周波数に正弦波を注入することが拘束条件となってしまい、入力信号に忠実な再生音を得ることが困難である。また、本発明の対象とする帯域拡張システムにおいては、正弦波を付加する高域成分の信号は、その位相成分を詳細に符号化して情報転送すると、多くの情報量を必要とするので、情報量削減の意味から位相成分は一般的に符号化されない。したがって、復号化側では位相成分は未知であり、そのエネルギーのみから復号処理をおこなう必要がある。その場合、複素数係数のサブバンドフィルターを用いて信号の位相を考慮するのが一般であるが、演算量削減のために実数係数のサブバンドフィルタを用いることも可能である。しかしながら、実数係数のサブバンドフィルタにおける位相の制御は、複素数係数のサブバンドフィルターにおける制御と比較して困難である。
【0007】
本発明では、このような従来の問題点に鑑みてなされたものであって、正弦波付加を時間領域の信号に対して行うように構成することによって、サブバンドフィルタに起因する正弦波周波数の制限や位相に関わる問題を解決し、できるだけ入力信号に忠実な信号の復号を可能にする復号化方法を提供するものである。
【0008】
【課題を解決するための手段】
上記課題を解決するために、本発明は、定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離手段と、分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化手段と、復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタと、低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張手段と、低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタと、分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成手段と、前記正弦波生成手段から生成される正弦波の周波数を、復号された低域時間信号の周波数の整数倍になるように調整する周波数調整手段と、前記合成フィルタバンクから得られた時間領域信号と前記正弦波生成手段から得られた正弦波を合成して出力オーディオ信号を得る時間信号合成手段とを設けるものである。
【0009】
【発明の実施の形態】
本発明の第1の実施の形態関わるオーディオ復号化方法は、定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離手段と、分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化手段と、復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタと、低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張手段と、低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタと、分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成手段と、複数の時間領域の信号を合成する時間信号合成手段とを設け、前記合成フィルタバンクから得られた時間領域の信号と正弦波生成手段から得られた正弦波を合成するようにした構成である。
【0010】
本発明の第2の実施の形態に関わるオーディオ復号化方法は、本発明の第1の実施の形態に関わるオーディオ復号化方法に対して、低域復号化手段から得られた低域時間信号を分析し、信号の周期性およびその周波数を検出する周期性分析手段と、検出された周波数に基づいて、正弦波生成手段を制御する周波数調整手段とを備え、低域時間信号の特性に従って、生成される正弦波の周波数を適応的に制御するようにした構成である。
【0011】
本発明の第3の実施の形態に関わるオーディオ復号化方法は、本発明の第1の実施の形態に関わるオーディオ復号化方法に対して、前記低域時間信号を分析し、信号の変化を検出する信号変化検出手段を設け、低域時間信号の特性に従って、生成される正弦波の振幅制御位置を適応的に制御するようにした構成である。
【0012】
以下、本発明の実施の形態におけるオーディオ復号化方法について、図面を用いて説明する。
(実施の形態1)
図1は、本発明の実施の形態1における復号化方法を示す構成図である。先に説明した図7に示される従来例と異なる点は、従来例においては正弦波付加情報709が帯域拡張手段704に直接入力され、サブバンド信号に対して正弦波付加処理が行われていたのに対して、本発明の実施の形態では、時間領域正弦波生成手段106を設け、正弦波付加情報112にしたがって時間領域の正弦波信号114を生成し、合成フィルタバンク105から出力された時間領域合成信号116と加算するように構成されていることである。
【0013】
入力ビットストリーム109は、ビットストリーム分離手段101において、低域成分情報110、高域成分情報111、および正弦波付加情報112に分離される。低域成分情報110は、例えばMPEG−4 AAC等の符号化方式を用いて符号化された情報であり、低域復号手段102において復号され、低域成分を表す時間信号が生成される。生成された低域成分を表す時間信号は、分析フィルタバンク103において複数(M個)のサブバンドに分割され、帯域拡張手段104に入力される。帯域拡張手段104は、低域成分を表す低域サブバンド信号を高域のサブバンドにコピーすることによって、帯域制限によって失われた高域成分を補償する。ここで、帯域拡張手段104に入力される高域成分情報111には、補償される高域サブバンドに対するゲイン情報が含まれており、生成された高域サブバンドごとにゲインが調整される。帯域拡張手段104において生成された高域サブバンド信号は、低域サブバンド信号と共に合成フィルタバンク105に入力されて帯域合成され、時間領域合成信号116が生成される。また、時間領域正弦波生成手段106は、入力された正弦波付加情報112に基づいて、正弦波調整手段107において生成する正弦波の特性を調整するパラメータを生成した後、正弦波生成手段108において、所望の正弦波を生成し、時間領域正弦波信号114として出力する。時間領域合成信号116と、時間領域正弦波信号114は時間信号として合成され、出力信号115となる。
【0014】
ここで、時間領域正弦波生成手段106の構成および動作を詳しく説明する。図2は時間領域正弦波生成手段106の構成を示す図である。正弦波調整手段107は、振幅調整手段201、タイミング調整手段202および概形生成手段204より構成される。振幅調整手段201は、正弦波付加情報205を参照して、生成される正弦波の振幅を制御する振幅情報207を出力する。同様に、タイミング調整手段202は、正弦波付加情報205を参照して、生成される正弦波の変化のタイミングを制御するタイミング情報208を出力する。続いて、概形生成手段204は、振幅情報207とタイミング情報208から、正弦波の概形を生成する。図3は、生成された正弦波の概形を表す図である。通常、正弦波の概形はある時刻を示すタイミング情報tと、対応する振幅情報Aの組み合わせにより、(a)に示される補間前の概形301のような階段状の形状となる。正弦波付加情報205に含まれる正弦波の周波数情報206に基づいて、正弦波生成手段203において生成された振幅一定の正弦波に対して、前記概形を適用することにより、所望の時間振幅特性を有する時間領域の正弦波209を生成することができる。
【0015】
このような構成とすることにより、サブバンドフィルタによる正弦波の周波数に対する制限を受けずに、付加する正弦波の周波数を設定することができるので、より入力信号に近い高品質な出力信号を得ることができる。また、付加する正弦波は、時間信号として生成されるので、位相の制御も容易である。
【0016】
なお、正弦波付加情報に複数の正弦波を付加する情報が含まれている場合には、複数の周波数の正弦波を順次生成し、それぞれの正弦波に対して、対応する概形を適応した後、全ての正弦波を合成すればよい。対応する概形は、全ての正弦波に対して同一であっても良いし、それぞれに異なる形状であっても良い。
【0017】
また、概形生成手段204における正弦波の概形生成にあたっては、隣接フレーム間の振幅情報を用いて補間処理を行うことにより、信号の急激な変化を抑制し、音質を向上させることができる。図3の(b)に示される補間後の概形では、(a)に示される補間前の概形301に存在する振幅が急激に変化する点が無いため、出力信号の音量が滑らかに変化し聴感上の音質が向上する。同様の処理は、従来のサブバンド信号に対する正弦波付加においても可能であるが、この場合、振幅を制御できる時間方向の単位はサブサンプル(サブバンド信号におけるサンプル)単位であり、補間精度は低下することになる。本構成では、出力信号のサンプル単位での補間が可能であり、より高品質な出力信号を得ることができる。
【0018】
また、隣接フレーム間の補間としては、周波数の補間も可能である。振幅情報と同様に出力信号のサンプル単位での補間が可能であり、付加される正弦波の周波数を滑らかに変化させることにより、より高音質な出力信号を得ることができる。
【0019】
(実施の形態2)
図4は、本発明の実施の形態2における復号化方法を示す構成図である。実施の形態2の構成は、図2に示される実施の形態1の時間領域正弦波生成手段において、周波数分析手段410と周波数調整手段411を設け、周波数分析手段410において低域時間信号412を分析し、分析結果に基づいて、周波数調整手段411において、生成する正弦波の周波数を適応的に制御するようにした構成である。低域時間信号412としては、例えば図1の低域復号手段102の出力を使用する。
【0020】
ここで、低域時間信号の周波数を分析し、その結果に基づいて生成する正弦波の周波数を制御する理由を説明する。図5は、オーディオ信号のスペクトル分布を示す図である。入力ビットストリームに含まれる情報のうち、オーディオ信号のスペクトルの符号化情報を保持しているのは低域成分情報のみであり、低域成分の符号化にあたっては、501で示される帯域制限が適用されている。したがって、低域復号手段から出力された低域時間信号には、帯域制限501の範囲内のスペクトルしか含まれないことになる。正弦波付加処理においては、帯域制限501の範囲を超える高い周波数に正弦波を付加することによって、復号されるオーディオ信号の帯域幅を拡張するが、通常、付加される正弦波は、ある基本周波数を持つ基本波502の整数倍の周波数を持つ高調波503である。これは、一般に符号化されるオーディオ信号の多くが、複数の高調波の集合により構成されているという事実に基づいている。したがって、正弦波付加情報405には、基本波502の整数倍を正しく表す周波数情報を含める必要があるが、そのためには、多くの情報量を割り当てる必要があるため、本発明が対象とするような低いビットレートにおいては、近似値となる周波数情報しか割り当てることができない。これにより、付加される正弦波の周波数は、整数倍高調波503と異なることとなり、復号されるオーディオ信号の品質の低下につながっていた。これに対し、本発明の実施の形態では、周波数分析手段410において低域時間信号412を分析し、分析された基本周波数に基づいて、周波数調整手段411において、生成される正弦波の周波数を、基本周波数の整数倍になるように制御するので、付加される正弦波の周波数と、整数倍高調波503のずれが解消されるので、より入力信号に忠実な出力信号を得ることができる。
【0021】
なお、周波数分析手段410においては、分析された基本周波数の強度情報等に基づいて、周波数調整手段411での周波数の適応制御を行うか行わないかを切り替えるように構成することも可能である。
【0022】
(実施の形態3)
図6は、本発明の実施の形態3おける復号化方法を示す構成図である。実施の形態3の構成は、図2に示される実施の形態1の時間領域正弦波生成手段において、信号変化検出手段611を設け、信号変化検出手段611において低域時間信号610を分析し、分析結果に基づいて、タイミング調整手段602において、生成する正弦波の振幅制御位置を適応的に制御するようにした構成である。低域時間信号610としては、例えば、図1の低域復号手段102の出力を使用する。
【0023】
ここで、低域時間信号の変化を分析し、その結果に基づいて生成する正弦波の振幅制御位置を制御する理由を説明する。付加される正弦波の振幅は、図3に示されるようにある時間位置tにおける振幅情報として与えられる。入力信号をできるだけ忠実に表現するためには、振幅調整位置をできるだけ多く設定する必要があるが、本発明の復号化装置が対象とするような低いビットレートにおいては、情報量削減のため、少数の振幅調整位置しか設置することができない。また、振幅調整位置はあらかじめ定められた複数の候補点からしか選択できない。このため、実際の入力信号の変化点と振幅調整位置にずれが生じ、復号されるオーディオ信号の品質の低下につながっていた。これに対し、本発明の実施の形態では、信号変化検出手段611において低域時間信号610を分析し、信号の変化点を検出して、その位置情報に基づいて正弦波の振幅調整位置を適応的に制御するので、入力信号の変化点と振幅調整位置のずれが解消し、より入力信号に忠実な出力信号を得ることができる。
【0024】
なお、本実施の形態の正弦波の振幅調整位置制御は、図1に示す帯域拡張手段104における高域信号生成に対しても適用が可能である。高域信号の振幅は、正弦波信号と同様に、ある時間位置tにおける振幅情報として与えられるので、低域信号を分析して得られた変化点の位置情報に基づいて、振幅調整位置を適応的に制御することにより、入力信号の変化点と振幅調整位置のずれを解消し、より入力信号に忠実な出力信号を得ることができる。
【0025】
なお、前記本実施の形態1から3においては、正弦波付加情報に基づく正弦波の生成方法および合成方法を説明したが、正弦波の代わりに周期性を持つどのような波形の信号を用いてもよい。時間領域信号に対する処理として実現するため、使用する波形の周波数スペクトル分布に影響される事無く、本実施の形態と同様な構成により実現することが可能である。
【0026】
【発明の効果】
本発明によれば、正弦波付加を時間領域の信号に対して行うように構成することによって、サブバンドフィルタに起因する正弦波周波数の制限や位相に関わる問題を解決し、より入力信号に忠実な高品質なオーディオ信号の復号が可能となる。
また、本発明によれば、低域時間信号の分析結果に基づいて、付加する正弦波の周波数を適応的に制御することによって、より入力信号に忠実な高品質なオーディオ信号の復号が可能となる。
また、本発明によれば、低域時間信号の分析結果に基づいて、付加する正弦波の振幅制御位置を適応的に制御することによって、より入力信号に忠実な高品質なオーディオ信号の復号が可能となる。
【図面の簡単な説明】
【図1】本発明のオーディオ復号化装置の構成の一例を示す図
【図2】本発明の時間領域正弦波生成手段の一例を示す図
【図3】基本波と高調波の関係を示す図
【図4】本発明の時間領域正弦波生成手段の一例を示す図
【図5】振幅調整のための正弦波の概形を示す図
【図6】本発明の時間領域正弦波生成手段の一例を示す図
【図7】従来のオーディオ復号化装置の一例を示す図
【符号の説明】
101 ビットストリーム分離手段
102 低域復号手段
103 分析フィルタバンク
104 帯域拡張手段
105 合成フィルタバンク
106 時間領域正弦波生成手段
107 正弦波調整手段
108 正弦波生成手段
109 ビットストリーム
110 低域成分情報
111 高域成分情報
112 正弦波付加情報
113 正弦波調整情報
114 時間領域正弦波信号
115 出力信号
116 時間領域合成信号
201、401、601 振幅調整手段
202、402、602 タイミング調整手段
203、403、603 正弦波生成手段
204、404、604 概形生成手段
205、405、605 正弦波付加情報
206、406、606 周波数情報
207、407、607 振幅情報
208、408、608 タイミング情報
209、409、609 時間領域正弦波信号
301 補間前の概形
302 補間後の概形
410 周波数分析手段
411 周波数調整手段
412 低域時間信号
501 帯域制限
502 基本波
503 高調波
504 整数倍の関係
610 低域時間信号
611 信号変化検出手段
Claims (6)
- 定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離手段と、
分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化手段と、
復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタと、
低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張手段と、
低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタと、
分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成手段と、
前記正弦波生成手段から生成される正弦波の周波数を、復号された低域時間信号の周波数の整数倍になるように調整する周波数調整手段と、
前記合成フィルタバンクから得られた時間領域信号と前記正弦波生成手段から得られた正弦波を合成して出力オーディオ信号を得る時間信号合成手段と
を備えることを特徴とするオーディオ復号化装置。 - 定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離手段と、
分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化手段と、
復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタと、
低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張手段と、
低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタと、
分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成手段と、
前記正弦波生成手段から生成される正弦波の振幅変化位置を、復号された低域時間信号の変化位置に基づいて調整するタイミング調整手段と、
前記合成フィルタバンクから得られた時間領域信号と前記正弦波生成手段から得られた正弦波を合成して出力オーディオ信号を得る時間信号合成手段と
を備えることを特徴とするオーディオ復号化装置。 - 定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離処理手順と、
分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化処理手順と、
復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタ処理手順と、
低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張処理手順と、
低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタ処理手順と、
分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成処理手順と、
前記正弦波生成処理手順にて生成される正弦波の周波数を、復号された低域時間信号の周波数の整数倍になるように調整する周波数調整処理手順と、
前記合成フィルタバンク処理手順から得られた時間領域信号と前記正弦波生成処理手順にて得られた正弦波を合成して出力オーディオ信号を得る時間信号合成処理手順と
を含むことを特徴とするオーディオ復号化方法。 - 定められた時間長のフレームに分割され、さらに複数のサブバンドに分割されて符号化されたオーディオ信号情報を多重化したビットストリームから、各符号化情報を分離するビットストリーム分離処理手順と、
分離された低域の符号化情報から低域成分を表す時間信号を復号する低域復号化処理手順と、
復号された低域時間信号を複数の低域サブバンド信号に分割する分析サブバンドフィルタ処理手順と、
低域サブバンド信号と分離された高域の符号化情報とから高域サブバンド信号を生成する帯域拡張処理手順と、
低域および高域サブバンド信号を合成して時間領域の信号を得る合成サブバンドフィルタ処理手順と、
分離された正弦波付加情報から所望の周波数および振幅特性の正弦波を表す時間領域の信号を生成する正弦波生成処理手順と、
前記正弦波生成処理手順にて生成される正弦波の振幅変化位置を、復号された低域時間信号の変化位置に基づいて調整するタイミング調整処理手順と、
前記合成フィルタバンク処理手順から得られた時間領域信号と前記正弦波生成処理手順にて得られた正弦波を合成して出力オーディオ信号を得る時間信号合成処理手順と
を含むことを特徴とするオーディオ復号化方法。 - 請求項3または4に記載のオーディオ復号化方法の各処理手順を、コンピュータに実行させるためのプログラム。
- 請求項3または4に記載のオーディオ復号化方法の各処理手順を、コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002211443A JP4313993B2 (ja) | 2002-07-19 | 2002-07-19 | オーディオ復号化装置およびオーディオ復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002211443A JP4313993B2 (ja) | 2002-07-19 | 2002-07-19 | オーディオ復号化装置およびオーディオ復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004053940A JP2004053940A (ja) | 2004-02-19 |
JP4313993B2 true JP4313993B2 (ja) | 2009-08-12 |
Family
ID=31934679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002211443A Expired - Lifetime JP4313993B2 (ja) | 2002-07-19 | 2002-07-19 | オーディオ復号化装置およびオーディオ復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4313993B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4767687B2 (ja) | 2003-10-07 | 2011-09-07 | パナソニック株式会社 | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
ATE480851T1 (de) | 2004-10-28 | 2010-09-15 | Panasonic Corp | Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür |
JP4959935B2 (ja) * | 2004-11-09 | 2012-06-27 | 株式会社東芝 | 復号装置 |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
AU2008339211B2 (en) | 2007-12-18 | 2011-06-23 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101412117B1 (ko) | 2010-03-09 | 2014-06-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 |
JP5523589B2 (ja) | 2010-03-09 | 2014-06-18 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 |
SG183966A1 (en) | 2010-03-09 | 2012-10-30 | Fraunhofer Ges Forschung | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
BR112012024360B1 (pt) * | 2010-07-19 | 2020-11-03 | Dolby International Ab | sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
EP2631906A1 (en) | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
EP2019391B1 (en) * | 2002-07-19 | 2013-01-16 | NEC Corporation | Audio decoding apparatus and decoding method and program |
-
2002
- 2002-07-19 JP JP2002211443A patent/JP4313993B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004053940A (ja) | 2004-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4740260B2 (ja) | 音声信号の帯域幅を疑似的に拡張するための方法および装置 | |
CN100492492C (zh) | 音频解码设备和方法 | |
KR101345695B1 (ko) | 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법 | |
JP5224017B2 (ja) | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム | |
JP5336522B2 (ja) | 瞬間的事象を有する音声信号の操作装置および操作方法 | |
KR101373004B1 (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
JP6026678B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
JP4227772B2 (ja) | オーディオ復号装置と復号方法およびプログラム | |
US10255928B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
KR101375582B1 (ko) | 대역폭 확장 부호화 및 복호화 방법 및 장치 | |
JP2010020251A (ja) | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 | |
CN104170009B (zh) | 感知音频编解码器中的谐波信号的相位相干性控制 | |
JP4313993B2 (ja) | オーディオ復号化装置およびオーディオ復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050525 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090421 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090518 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120522 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4313993 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130522 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130522 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |