[go: up one dir, main page]

JP6425097B2 - 周波数帯域拡大装置および方法、並びにプログラム - Google Patents

周波数帯域拡大装置および方法、並びにプログラム Download PDF

Info

Publication number
JP6425097B2
JP6425097B2 JP2015550649A JP2015550649A JP6425097B2 JP 6425097 B2 JP6425097 B2 JP 6425097B2 JP 2015550649 A JP2015550649 A JP 2015550649A JP 2015550649 A JP2015550649 A JP 2015550649A JP 6425097 B2 JP6425097 B2 JP 6425097B2
Authority
JP
Japan
Prior art keywords
band
signal
low
frequency
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015550649A
Other languages
English (en)
Other versions
JPWO2015079946A1 (ja
Inventor
優樹 山本
優樹 山本
徹 知念
徹 知念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2015079946A1 publication Critical patent/JPWO2015079946A1/ja
Application granted granted Critical
Publication of JP6425097B2 publication Critical patent/JP6425097B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Amplifiers (AREA)

Description

本技術は周波数帯域拡大装置および方法、並びにプログラムに関し、特に、より少ない処理量で高音質な音声を得ることができるようにした周波数帯域拡大装置および方法、並びにプログラムに関する。
例えば、インターネット等を介して音楽を配信する音楽配信サービスが知られている。このような音楽配信サービスでは、音楽等の音声信号を符号化することで得られる符号化データが配信されるが、符号化データのデータ量を圧縮するために音声信号の高域成分を除去し、残った低域成分のみを符号化する手法がある。
ところが、このような手法で符号化された音声信号を復号して再生すると、もとの信号に含まれていた高域成分が失われているため、原音が持つ臨場感が失われていたり、音がこもったりするといった音質の劣化が生じていることがある。
そこで、低域成分の信号から高域成分を生成し、得られた高域成分を低域成分の信号に加算することで、より広い周波数帯域の信号を生成する帯域拡大技術が提案されている(例えば、特許文献1参照)。
国際公開第2011/043227号
ところで、近年、例えば48kHzなど標準的なサンプリング周波数の音声であるスタンダードレゾリューションの音声を、より高いサンプリング周波数の音声であるハイレゾリューションの音声へと変換したいという要望がある。
しかしながら、上述した帯域拡大技術とアップサンプリングを組み合わせて、音声信号をアップサンプリングした後、周波数帯域を拡大すると、高音質な音声を得ることができるが、そのために行われる処理の量が多くなってしまう。
本技術は、このような状況に鑑みてなされたものであり、より少ない処理量で高音質な音声を得ることができるようにするものである。
本技術の一側面の周波数帯域拡大装置は、入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出する低域抽出帯域通過フィルタ処理部と、前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出するフィルタ係数算出部と、前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成するレベル調整フィルタ処理部と、前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出する低域通過フィルタ処理部と、前記低域信号と前記高域信号を加算して出力信号を生成する信号加算部とを備える。
周波数帯域拡大装置には、複数の異なる帯域の前記低域サブバンド信号のレベルがほぼ一定となるように、前記低域サブバンド信号を平坦化して平坦化信号を生成する平坦化部と、前記平坦化信号をダウンサンプリングするダウンサンプリング部とをさらに設け、前記レベル調整フィルタ処理部には、前記ダウンサンプリング部によりダウンサンプリングされた前記平坦化信号を、前記ポリフェーズ構成フィルタによりフィルタリングして前記高域信号を生成させることができる。
前記平坦化部には、複数の各帯域の前記低域サブバンド信号のレベルが、最も高域側の帯域の前記低域サブバンド信号のレベルとほぼ同じレベルになるように前記平坦化を行わせることができる。
前記フィルタ係数算出部には、高域の複数の帯域ごとに、それらの前記帯域を通過させる帯域通過フィルタの帯域通過フィルタ係数を算出させ、前記高域の複数の帯域ごとに算出された前記帯域通過フィルタ係数を加算することで1つの前記フィルタ係数とする係数加算部をさらに設けることができる。
周波数帯域拡大装置には、複数の異なる帯域の前記低域サブバンド信号に基づいて、前記高域の複数の帯域ごとに、それらの前記帯域の信号のレベルの推定値を算出する推定部をさらに設け、前記フィルタ係数算出部には、前記高域の複数の帯域ごとに、それらの前記帯域の前記推定値に基づいて前記帯域通過フィルタ係数を算出させることができる。
周波数帯域拡大装置には、高域ノイズ信号を生成するノイズ生成部をさらに設け、前記信号加算部には、前記低域信号、前記高域信号、および前記高域ノイズ信号を加算して前記出力信号を生成させることができる。
周波数帯域拡大装置には、ノイズ用ポリフェーズ構成フィルタにより前記高域ノイズ信号をフィルタリングすることで、前記高域ノイズ信号に対するアップサンプリングおよびレベル調整を行うノイズレベル調整フィルタ処理部をさらに設けることができる。
周波数帯域拡大装置には、前記低域サブバンド信号または前記入力信号に基づいて、前記ノイズ用ポリフェーズ構成フィルタのフィルタ係数を算出するノイズフィルタ係数算出部をさらに設けることができる。
前記低域通過フィルタ処理部には、低域用ポリフェーズ構成フィルタにより前記入力信号をフィルタリングすることで、前記入力信号に対するアップサンプリングおよび低域成分の抽出を行って、前記低域信号を生成させることができる。
本技術の一側面の周波数帯域拡大方法またはプログラムは、入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出し、前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出し、前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成し、前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出し、前記低域信号と前記高域信号を加算して出力信号を生成するステップを含む。
本技術の一側面においては、入力信号の低域側の所定帯域を通過させることで低域サブバンド信号が抽出され、前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数が算出され、前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整が行われて高域信号が生成され、前記入力信号に対するフィルタリングにより、前記入力信号から低域信号が抽出され、前記低域信号と前記高域信号が加算されて出力信号が生成される。
本技術の一側面によれば、より少ない処理量で高音質な音声を得ることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
周波数帯域拡大装置の構成を示す図である。 入力信号のアップサンプリングについて説明する図である。 周波数帯域拡大装置の構成を示す図である。 低域信号の生成について説明する図である。 サブバンドへの分割について説明する図である。 帯域通過フィルタ係数の生成について説明する図である。 平坦化信号の生成とアップサンプリングについて説明する図である。 本技術を適用した周波数帯域拡大装置の構成を示す図である。 ポリフェーズ構成レベル調整フィルタの構成例を示す図である。 周波数帯域拡大処理を説明するフローチャートである。 周波数帯域拡大装置の構成を示す図である。 周波数帯域拡大処理を説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈周波数帯域拡大とアップサンプリングについて〉
まず、本技術の概要について説明する。
本技術は、特に以下の特徴を有している。
(特徴1)
アップサンプリングと帯域拡大技術を直列に、複数回処理することで、アップサンプリング後の信号の帯域拡大が行われる。これにより、より高音質な音声が得られる。
(特徴2)
高域信号の生成手法を振幅変調ではなく、周波数エリアシングによる方法とすることで、より少ない処理量で出力信号が生成される。
(特徴3)
高域信号に対して、高域のパワーの推定値に応じたノイズが付加される。これにより、より自然な音声を得ることができるようになる。
それでは、以下、本技術について説明していく。
図1は、処理対象となる音声信号である入力信号の周波数帯域を拡大する周波数帯域拡大装置の構成例を示す図である。
図1に示す周波数帯域拡大装置11は、低域の信号成分を入力信号とし、その入力信号に対して周波数帯域拡大処理を施して、その結果得られる出力信号を、帯域が拡大された音声信号として出力する。例えば、入力信号はもとの信号から高域成分が除去された、低域成分のみからなる音声信号とされる。
なお、以下では、周波数帯域拡大処理により生成しようとする周波数成分の最も周波数が低い側の端を拡大開始帯域とし、拡大開始帯域よりも周波数が高い帯域を高域と称するとともに、拡大開始帯域よりも周波数が低い帯域を低域と称することとする。
また、低域および高域をそれぞれ複数の帯域に分割したときの分割後の1つの帯域をサブバンドとも称し、そのサブバンドの信号をサブバンド信号とも称することとする。以下では、特に、低域のサブバンドのサブバンド信号を低域サブバンド信号とも称し、高域のサブバンドのサブバンド信号を高域サブバンド信号とも称することとする。
周波数帯域拡大装置11は、低域通過フィルタ21、遅延回路22、低域抽出帯域通過フィルタ23、特徴量算出回路24、高域サブバンドパワー推定回路25、高域信号生成回路26、高域通過フィルタ27、および加算部28を有している。
低域通過フィルタ21は、入力信号を所定の遮断周波数でフィルタリングし、その結果得られた、低域の信号成分である低域信号を遅延回路22に供給する。
遅延回路22は、低域通過フィルタ21から供給された低域信号と、後述する高域信号とを加算する際の同期をとるために、低域信号を一定の遅延時間だけ遅延させて加算部28に供給する。
低域抽出帯域通過フィルタ23は、それぞれ異なる通過帯域を持つ帯域通過フィルタ31−1乃至帯域通過フィルタ31−Nから構成される。
帯域通過フィルタ31−i(但し、1≦i≦N)は、入力信号のうちの低域側の所定通過帯域、すなわちサブバンドの信号を通過させ、その結果得られた所定帯域の信号を低域サブバンド信号として特徴量算出回路24および高域信号生成回路26に供給する。したがって、低域抽出帯域通過フィルタ23では、低域に含まれるN個のサブバンドのサブバンド信号が得られることになる。
なお、以下、帯域通過フィルタ31−1乃至帯域通過フィルタ31−Nを特に区別する必要のない場合、単に帯域通過フィルタ31とも称することとする。
特徴量算出回路24は、低域抽出帯域通過フィルタ23から供給された複数の低域サブバンド信号と、入力信号との少なくとも何れか一方を用いて、1または複数の特徴量を算出し、高域サブバンドパワー推定回路25に供給する。ここで、特徴量とは、入力信号の信号としての特徴を表す情報である。
高域サブバンドパワー推定回路25は、特徴量算出回路24から供給された特徴量に基づいて、高域サブバンド信号のパワー(レベル)である高域サブバンドパワーの推定値を高域のサブバンドごとに算出し、高域信号生成回路26に供給する。
高域信号生成回路26は、低域抽出帯域通過フィルタ23から供給された複数の低域サブバンド信号と、高域サブバンドパワー推定回路25から供給された複数の高域サブバンドパワーの推定値とに基づいて、高域の信号成分である高域信号を生成し、高域通過フィルタ27に供給する。
高域通過フィルタ27は、高域信号生成回路26から供給された高域信号を、低域通過フィルタ21における遮断周波数に対応する遮断周波数でフィルタリングし、加算部28に供給する。
加算部28は、遅延回路22から供給された低域信号と、高域通過フィルタ27から供給された高域信号とを加算して出力信号とし、出力する。
このように周波数帯域拡大装置11によれば、入力信号を、より広い周波数帯域の成分を有する出力信号に変換することができる。
しかし、周波数帯域拡大装置11では、入力信号と出力信号のサンプリング周波数は同じであり、例えばサンプリング周波数が48kHz以下のスタンダードレゾリューションの入力信号を、48kHzより高いサンプリング周波数のハイレゾリューションの出力信号に変換することはできない。
そこで、例えば図2に示すように、入力信号を所望の出力サンプリング周波数にアップサンプリングしてから周波数帯域拡大装置11に入力することにより、スタンダードレゾリューションの入力信号から、ハイレゾリューションの出力信号へと帯域拡大することができる。なお、図2において、縦軸および横軸は、それぞれ信号のパワー(レベル)および周波数を示している。
この例では、入力信号のサンプリング周波数は48kHzとなっている。すなわち、矢印A21に示すようにナイキスト周波数である24kHzまでの周波数成分が入力信号に含まれている。
このような入力信号がアップサンプリングされると、矢印A22に示すアップサンプル信号が得られる。このアップサンプル信号は、サンプリング周波数が96kHzの信号であるが、実質的に入力信号の24kHzまでの周波数成分が含まれており、24kHz以上の周波数成分はノイズ成分となっている。
さらに、このアップサンプル信号を周波数帯域拡大装置11に入力し、アップサンプル信号に対する周波数帯域拡大処理を行うと、矢印A23に示すように実質的に48kHzまでの周波数成分を有する、サンプリング周波数が96kHzの出力信号が得られる。
ここで、周波数帯域拡大装置11における低域通過フィルタ21および高域通過フィルタ27の遮断周波数や、帯域通過フィルタ31の通過帯域、高域サブバンドのそれぞれの帯域の上限周波数や下限周波数は、出力サンプリング周波数を入力サンプリング周波数で割った倍率で変わることになる。例えば、図2の例では、出力サンプリング周波数が96kHzであり、入力サンプリング周波数が48kHzであるので、上限周波数や下限周波数が2(=96/48)倍になる。
ところで、周波数帯域拡大装置の構成を、例えば図3に示す構成とすれば、入力信号のアップサンプリングと周波数帯域拡大処理を1つの装置で行うことができる。
なお、図3において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。また、以下では、サンプリング周波数が48kHzである入力信号を、4倍の192kHzにアップサンプリングし、拡大開始帯域を24kHzとして周波数帯域拡大処理を施す例について説明する。
図3に示す周波数帯域拡大装置61は、アップサンプリング部71、低域通過フィルタ21、遅延回路22、低域抽出帯域通過フィルタ23、特徴量算出回路24、高域サブバンドパワー推定回路25、帯域通過フィルタ算出回路72、平坦化回路73、ダウンサンプリング部74、アップサンプリング部75、レベル調整帯域通過フィルタ76、加算部77、高域通過フィルタ27、および加算部28を有している。
この周波数帯域拡大装置61の構成は、高域信号生成回路26が設けられていない点、並びに新たにアップサンプリング部71、および帯域通過フィルタ算出回路72乃至加算部77が設けられている点で周波数帯域拡大装置11と異なる。
また、レベル調整帯域通過フィルタ76は、帯域通過フィルタ81−1乃至帯域通過フィルタ81−Mを備えている。以下、帯域通過フィルタ81−1乃至帯域通過フィルタ81−Mを特に区別する必要のない場合、単に帯域通過フィルタ81とも称することとする。
続いて、周波数帯域拡大装置61の各部について適宜、説明する。
(アップサンプリング部と低域通過フィルタ)
まず、アップサンプリング部71は、入力信号のデータ系列のサンプル間に3つのゼロ挿入を行い、サンプリング周波数が入力の4倍の信号を生成し、低域通過フィルタ21に供給する。
ここでは、入力信号のサンプリング周波数は48kHzであるので、アップサンプリング部71による入力信号のアップサンプリングによって、サンプリング周波数が192kHzの信号が生成される。
低域通過フィルタ21は、入力信号のナイキスト周波数である24kHzを遮断周波数として、アップサンプリング部71から供給された信号をフィルタリングし、その結果得られた信号を遅延回路22に供給する。
これらの処理によって、例えば図4に示す信号が得られる。なお、図4において縦軸および横軸は信号のパワーおよび周波数を示している。
例えば矢印A31に示す入力信号がアップサンプリング部71に供給されたとする。この入力信号には、ナイキスト周波数である24kHzまでの周波数成分が含まれている。
ここで、入力信号のデータ系列、つまりサンプルのサンプル値の系列がx[0],x[1],x[2],x[3],…であるとすると、アップサンプリング部71は各サンプルの間に、サンプル値が0であるサンプルを3つ挿入する。これにより、アップサンプリング後の入力信号のデータ系列は、x[0],0,0,0,x[1],0,0,0,x[2],0,0,0,x[3],0,0,0…となる。
このようにしてアップサンプリングが行われると、矢印A32に示す信号が得られる。この信号の波形は、矢印A31に示した入力信号の波形をミラーリング、つまり周波数エリアシングして得られた波形となっている。
すなわち、24kHzから48kHzまでの波形は、24kHzまでの波形を24kHzで折り返した形状の波形となっており、さらに48kHzから96kHzまでの波形は、48kHzまでの波形をさらに48kHzで折り返した形状の波形となっている。
このように入力信号に対するアップサンプリングを行うと、実質的に96kHzまでの周波数成分が含まれる信号が得られるが、24kHz以上の周波数の成分は、もとの信号には含まれていない余分な成分となっている。
そこで、低域通過フィルタ21は、アップサンプリングされた入力信号に対して、24kHzを遮断周波数とする低域通過フィルタによりフィルタリングを行い、矢印A33に示す波形の低域信号を抽出する。すなわち、低域通過フィルタ21は、入力信号の24kHz以下の周波数成分のみを通過させて低域信号を生成する。
この低域信号は、24kHzまではもとの入力信号と同じ周波数特性であり、かつ入力信号のサンプリング周波数の4倍のサンプリング周波数の信号である。したがって、この例では、低域信号のサンプリング周波数は192kHzとなる。
(低域抽出帯域通過フィルタ)
また、低域抽出帯域通過フィルタ23では、帯域通過フィルタ31−1乃至帯域通過フィルタ31−Nにより入力信号に対するフィルタ処理が行われ、低域の各サブバンドの信号である低域サブバンド信号が抽出される。すなわち、帯域通過フィルタ31は、帯域通過フィルタを用いたフィルタリングにより、入力信号の低域側の所定通過帯域の周波数成分のみを通過させ、低域サブバンド信号を生成する。
これにより、例えば図5に示すように4つのサブバンドの信号が低域サブバンド信号として得られる。なお、図5において縦軸および横軸は入力信号のパワーおよび周波数を示している。
この例では、帯域通過フィルタ31の個数Nが4とされており、4つのサブバンドsb-3乃至サブバンドsbの各サブバンド(帯域)について低域サブバンド信号が得られる。
すなわち、例えば入力信号のナイキスト周波数(24 kHz)を8等分に分割することで得られる8個のサブバンドのうちの1つが拡大開始帯域とされ、それらの8個のサブバンドのうちの拡大開始帯域より低域の4個の各サブバンドが帯域通過フィルタ31の通過帯域とされている。
具体的には、低域における最も拡大開始帯域側の周波数帯域(サブバンド)、つまり最も高域側にある1番目のサブバンドのインデックスがsbとされており、以下ではこのサブバンドをサブバンドsbと称する。例えばサブバンドsbは、帯域通過フィルタ31−1の通過帯域である。
また、サブバンドsbに対して低域側に隣接するサブバンドのインデックスはsb-1とされており、以下ではこのサブバンドをサブバンドsb-1と称する。同様に、サブバンドsb-1に対して低域側に隣接するサブバンドのインデックスはsb-2とされ、サブバンドsb-2に対して低域側に隣接するサブバンドのインデックスはsb-3とされている。
以下では、インデックスがsb-2およびsb-3であるサブバンドを、それぞれサブバンドsb-2およびサブバンドsb-3と称する。例えばサブバンドsb-1乃至サブバンドsb-3のそれぞれは、帯域通過フィルタ31−2乃至帯域通過フィルタ31−4のそれぞれの通過帯域である。
(特徴量算出回路と高域サブバンドパワー推定回路)
さらに、特徴量算出回路24では、入力信号または低域サブバンド信号の少なくとも何れか一方が用いられて、特徴量が算出される。
例えば、特徴量として低域のサブバンド(以下、低域サブバンドとも称する)ごとに、低域サブバンド信号のパワーが算出される。以下、サブバンド信号のパワー(レベル)をサブバンドパワーとも称し、特に低域サブバンド信号のパワーを低域サブバンドパワーとも称することとする。
具体的には、特徴量算出回路24は次式(1)を計算することで、低域サブバンド信号x(ib,n)から、ある所定の時間フレームJにおける低域サブバンドパワーpower(ib,J)を算出する。なお、ibはサブバンドのインデックスを示しており、nは離散時間のインデックスを示している。また、1フレームのサンプル数をFSIZEとし、パワーはデシベルで表現されるものとする。
Figure 0006425097
このようにして4つの低域サブバンドsb乃至低域サブバンドsb-3について算出された低域サブバンドパワーpower(ib,J)が、入力信号の特徴量として特徴量算出回路24から高域サブバンドパワー推定回路25に供給される。
高域サブバンドパワー推定回路25は、特徴量算出回路24から供給された4つの低域サブバンドパワーに基づいて、インデックスがsb+1であるサブバンド(拡大開始帯域)以降の、拡大しようとする帯域(周波数拡大帯域)のサブバンド信号のパワーの推定値を算出する。
以下、高域のサブバンドを高域サブバンドとも称することとする。また、高域サブバンド信号のサブバンドパワーを高域サブバンドパワーとも称することとする。さらに、高域サブバンドパワーの推定値を疑似高域サブバンドパワーとも称する。
具体的には、高域サブバンドパワー推定回路25は、周波数拡大帯域の最高域のサブバンドのインデックスをebとすると、インデックスがsb+1乃至ebである各サブバンドについて、次式(2)を計算することで疑似高域サブバンドパワーpowerest(ib,J)を推定する。
Figure 0006425097
なお、式(2)において、係数Aib(kb)および係数Bibは、高域のサブバンドibごとに異なる値を持つ係数であり、これらの係数Aib(kb)および係数Bibは、様々な入力信号に対して好適な値が得られるように統計学習により予め求められている。
例えば、係数Aib(kb)および係数Bibは、低域サブバンドパワーを説明変数とし、高域サブバンドパワーを被説明変数とした、最小二乗法を用いた回帰分析により予め求められている。
なお、ここでいう高域サブバンドパワーは、高域成分を除去して入力信号とする前のもとの信号の高域サブバンド信号のパワーである。したがって、疑似高域サブバンドパワーは、もとの信号から除去されてしまった高域成分の各高域サブバンドの高域サブバンドパワーの推定値である。
また、この例では疑似高域サブバンドパワーは、各低域サブバンドパワーの1次線形結合により算出されているが、これに限らず、他のどのような方法により算出されるようにしてもよい。例えば、疑似高域サブバンドパワーは、時間フレームJの前後数フレームの複数の低域サブバンドパワーの線形結合を用いて算出されるようにしてもよいし、非線形な関数を用いて算出されるようにしてもよい。
高域サブバンドパワー推定回路25は、このようにして得られた各高域サブバンドの疑似高域サブバンドパワーを帯域通過フィルタ算出回路72に供給する。
(帯域通過フィルタ算出回路)
続いて、帯域通過フィルタ算出回路72は、高域サブバンドパワー推定回路25から供給された複数の各高域サブバンドの疑似高域サブバンドパワーに基づいて、高域サブバンドのそれぞれの帯域を通過帯域とする帯域通過フィルタの帯域通過フィルタ係数h_env(ib,l)を算出する。
具体的には、帯域通過フィルタ算出回路72は、次式(3)を計算することで、帯域通過フィルタ係数h_env(ib,l)を算出する。すなわち、式(3)の計算では、予め用意されたそれぞれの高域サブバンドの帯域通過フィルタ係数h_org(ib,l)に対して、以下の式(4)により得られる利得量G(ib,J)を乗算することで、帯域通過フィルタ係数h_env(ib,l)が算出される。
Figure 0006425097
Figure 0006425097
なお、式(3)において、ib、およびJは、それぞれ高域サブバンドのインデックス、および時間フレームのインデックスを示している。
またlは、帯域通過フィルタ係数h_org(ib,l)(帯域通過フィルタ係数h_env(ib,l))が乗算される時間信号のサンプルを示すインデックスである。したがって、1つの高域サブバンドについての帯域通過フィルタ係数h_env(ib,l)は、インデックスlにより示されるサンプルの数だけ、つまりフィルタを構成するタップの数だけ用意され、それらの帯域通過フィルタ係数から1つの帯域通過フィルタが構成されることになる。
また、帯域通過フィルタ係数h_env(ib,l)から構成される各高域サブバンドの帯域通過フィルタは、FIR(Finite Impulse Response)型のフィルタとなる。
帯域通過フィルタ算出回路72では、まず疑似高域サブバンドパワーpowerest(ib,J)に応じた利得量G(ib,J)が式(4)により求められる。そして、式(3)の計算によって、予め用意された帯域通過フィルタ係数h_org(ib,l)が、利得量G(ib,J)によって適切にゲイン調整されて帯域通過フィルタ係数h_env(ib,l)とされる。
これらの式(3)および式(4)の計算により、例えば図6に示すように帯域通過フィルタ係数h_org(ib,l)のゲイン調整が行われる。
なお、図6において縦軸および横軸は信号のパワーおよび周波数を示している。
この例では、矢印A41に示す部分にある点線は、予め用意された各高域サブバンドの帯域通過フィルタ係数h_org(ib,l)の周波数特性を示しており、実線は、各高域サブバンドの疑似高域サブバンドパワーpowerest(ib,J)を示している。
ここで、最も左側に位置する帯域通過フィルタ係数h_org(ib,l)および疑似高域サブバンドパワーpowerest(ib,J)が、最も低域側に位置する高域サブバンドsb+1の帯域通過フィルタ係数h_org(sb+1,l)および疑似高域サブバンドパワーpowerest(sb+1,J)を示している。また、最も右側に位置する帯域通過フィルタ係数h_org(ib,l)および疑似高域サブバンドパワーpowerest(ib,J)が、最も高域側に位置する高域サブバンドebの帯域通過フィルタ係数h_org(eb,l)および疑似高域サブバンドパワーpowerest(eb,J)を示している。
この例では、予め用意されている各高域サブバンドの帯域通過フィルタ係数h_org(ib,l)の周波数特性は、通過帯域の周波数のみが異なるだけで、その他の特性は同じものとなっている。そのため、多くの高域サブバンドにおいて、帯域通過フィルタ係数h_org(ib,l)の最大のパワーが、疑似高域サブバンドパワーよりも大きくなっている。
そこで、各高域サブバンドの帯域通過フィルタ係数h_org(ib,l)の最大のパワーが、それらの高域サブバンドの疑似高域サブバンドパワーまで抑圧されるように、疑似高域サブバンドパワーから求まる利得量G(ib,J)によってゲイン調整される。
これにより、矢印A42に示すように最大のパワーが、疑似高域サブバンドパワーと同じ大きさである帯域通過フィルタ係数h_env(ib,l)が得られる。
なお、矢印A42に示す部分にある一点鎖線は、各高域サブバンドの帯域通過フィルタ係数h_env(ib,l)の周波数特性を示しており、実線は各高域サブバンドの疑似高域サブバンドパワーpowerest(ib,J)を示している。
このようにして得られた帯域通過フィルタ係数h_env(ib,l)からなる帯域通過フィルタは、高域成分の波形形成のためのフィルタとなる。すなわち、帯域通過フィルタ係数h_env(ib,l)を用いれば、疑似高域サブバンドパワーにより表現される高域成分の波形、つまり推定により得られた高域の波形を有する高域信号を得ることができる。
帯域通過フィルタ算出回路72は、各高域サブバンドについて求めた帯域通過フィルタ係数h_env(ib,l)を、それらの高域サブバンドの帯域通過フィルタ81に供給する。この例では高域サブバンドとして、高域サブバンドsb+1乃至高域サブバンドebがあるので、帯域通過フィルタ81の個数Mは(eb-sb)個となる。
(平坦化回路、ダウンサンプリング部、およびアップサンプリング部)
平坦化回路73は、帯域通過フィルタ31から供給された複数の各低域サブバンドの低域サブバンド信号x(ib,n)に基づいて、上述した式(1)の計算により低域サブバンドパワーpower(ib,J)を算出する。
さらに、平坦化回路73は、各低域サブバンドの低域サブバンド信号x(ib,n)と低域サブバンドパワーpower(ib,J)とに基づいて、以下の式(5)を計算することで平坦化信号x_flat(n)を算出し、ダウンサンプリング部74に供給する。
Figure 0006425097
式(5)では、各低域サブバンドの低域サブバンド信号のレベル調整(平坦化)が行われ、レベル調整後の各低域サブバンド信号が加算されて、1つの時間信号である平坦化信号x_flat(n)とされている。
続いて、ダウンサンプリング部74は、平坦化回路73から供給された平坦化信号x_flat(n)に対して1/2間引きサンプリングを行い、サンプリング周波数が入力の半分である、ダウンサンプリングされた平坦化信号を生成する。
この例では、入力信号のサンプリング周波数は48kHzであるので、ダウンサンプリングされた平坦化信号のサンプリング周波数は24kHzとなる。ダウンサンプリング部74は、ダウンサンプリングされた平坦化信号をアップサンプリング部75に供給する。
さらに、アップサンプリング部75は、ダウンサンプリング部74から供給されたダウンサンプリングされた平坦化信号のデータ系列に対して、サンプル間に7つのゼロ、すなわちサンプル値が0である7つのサンプルを挿入する。
これにより、ダウンサンプリング部74から供給された平坦化信号のサンプリング周波数が8倍になるようにアップサンプリングが行われる。ダウンサンプリング部74から供給されるダウンサンプリングされた平坦化信号のサンプリング周波数は24kHzであるので、アップサンプリング後の平坦化信号のサンプリング周波数は、192kHz(=24kHz×8)となる。
したがって、結果的には、サンプリング周波数が入力の4倍となる平坦化信号が得られることになる。この例では、入力信号のサンプリング周波数は48kHzであるので、アップサンプリング後の平坦化信号は、入力信号の4倍のサンプリング周波数をもつことになる。
アップサンプリング部75は、アップサンプリングされた平坦化信号を、レベル調整帯域通過フィルタ76の各帯域通過フィルタ81に供給する。
以上において説明した処理により、図7に示す平坦化信号が得られる。なお、図7において、縦軸および横軸は、信号のパワーおよび周波数を示している。
例えば図中、最上段の曲線C11で示される波形の低域サブバンド信号が平坦化回路73に供給されたとする。この例では、各低域サブバンドの低域サブバンド信号のパワー(レベル)が異なり、低域ほどパワーが大きくなっている。つまり、高域方向になだらかにパワーが減少していく波形となっている。
平坦化回路73では、このような4つのサブバンドsb乃至サブバンドsb-3の低域サブバンド信号のパワー(レベル)が調整されて加算され、1つの平坦化信号x_flat(n)とされる。図中、上から2段目にある曲線C12は、そのようにして得られた平坦化信号x_flat(n)の波形を示している。
この例では、サブバンドsb-1乃至サブバンドsb-3のパワー(レベル)が、最も高域側にあるサブバンドsbのパワー(レベル)と同じ程度になるように各低域サブバンド信号のパワーが調整されている。つまり、4つの低域サブバンドの低域サブバンド信号からなる低域成分の信号の各周波数帯域のパワーがほぼ一定となるように平坦化されている。
また、平坦化信号x_flat(n)のサンプリング周波数は48kHzである。周波数帯域拡大装置61では、最終的には、入力のサンプリング周波数である48kHzを4倍にした192kHzの信号を得ようとしているので、高域信号を生成するためには、その高域信号の生成に用いられる平坦化信号のサンプリング周波数を192kHzとする必要がある。
しかし、現時点で得られている平坦化信号x_flat(n)には、実質的にサブバンドsb乃至サブバンドsb-3の間の成分しか含まれていない。つまり、平坦化信号x_flat(n)には、サブバンドsb-3よりも低い周波数の成分が実質的には含まれていない。
そのため、曲線C12に示される波形の平坦化信号に対して、単純に、サンプリング周波数が4倍となるアップサンプリングを施すと、実質的に周波数成分が含まれていない周波数帯域がある信号となってしまう。
そこで、周波数帯域拡大装置61では、図中、上から3段目に示すように、一旦、平坦化信号がダウンサンプリングされた後、さらにアップサンプリングが行われる。これにより、図中、上から4段目に示すように、各周波数帯域においてパワーが一定、つまり平坦な波形で、かつサンプリング周波数が192kHzである平坦化信号が得られる。
すなわち、曲線C12に示す平坦化信号x_flat(n)にダウンサンプリングが施されると、その結果得られる平坦化信号の波形は、曲線C13に示す波形となる。この例では、ダウンサンプリングによって得られる曲線C13に示す波形は、曲線C12に示される波形を12kHzの位置で低域側に折り返した形状の波形となっている。
したがって、曲線C13に示す波形の平坦化信号、つまりダウンサンプリング後の平坦化信号をアップサンプリングすることで、曲線C13に示す波形に基づいて7回のミラーリング(周波数エリアシング)が行われ、曲線C14に示す波形の平坦化信号が得られる。
曲線C14に示す波形は、0kHzから96kHzまで、各周波数でパワーがほぼ一定である平坦な波形となっている。
特に、上述した平坦化回路73では、最も周波数が高い側にあるサブバンドsbのパワーに合わせて平坦化が行われるため、最終的に得られた曲線C14に示す波形の平坦化信号の各周波数におけるパワーは、もとのサブバンドsbの低域サブバンド信号のパワーとほぼ等しくなる。つまり、もとの入力信号のサブバンドsbのパワーとほぼ等しくなる。
したがって、曲線C14に示す波形の平坦化信号を用いて高域信号を生成すれば、得られる高域信号における、サブバンドsbと隣接するサブバンドsb+1のパワーを、もとの入力信号、つまり低域信号のサブバンドsbのパワーとほぼ等しくすることができ、低域信号と高域信号を加算するときに、高域の波形と低域の波形をスムーズに接続することができる。その結果、より自然な波形の出力信号を得ることができるようになる。
(レベル調整帯域通過フィルタおよび加算部)
次に、レベル調整帯域通過フィルタ76、加算部77、および加算部28について説明する。
レベル調整帯域通過フィルタ76は、アップサンプリング部75から供給されたアップサンプリングされた平坦化信号に、帯域通過フィルタ算出回路72から供給された帯域通過フィルタ係数を用いたフィルタリングを行い、複数の高域サブバンド信号を生成する。
具体的には、高域サブバンドごとにサブバンドのインデックスib(但し、sb+1≦ib≦eb)を有する帯域通過フィルタ係数h_env(ib,l)が用いられて、平坦化信号に対するフィルタリングが行われ、その高域サブバンドibの高域サブバンド信号が生成される。これにより、高域サブバンドsb+1乃至高域サブバンドebの各高域サブバンド信号が得られる。
加算部77は、このようにして得られた複数の高域サブバンドの高域サブバンド信号を加算することで1つの高域信号を生成し、高域通過フィルタ27に供給する。そして、高域信号は、高域通過フィルタ27において低域成分が除去された後、加算部28に供給される。
加算部28には、それぞれサンプリング周波数が入力の4倍、つまり192kHzである低域信号と高域信号とが、遅延回路22および高域通過フィルタ27から供給される。加算部28は、これらの低域信号と高域信号を加算して出力信号とし、得られた出力信号を出力する。
以上の処理により、周波数帯域拡大装置61では、サンプリング周波数が48kHzである入力信号を192kHzに、つまりサンプリング周波数を4倍にアップサンプリングして帯域拡大することができる。
なお、アップサンプリングのゼロ挿入の数や、ダウンサンプリングの間引くサンプル数を変えることで、2倍、8倍、16倍といった、2のべき乗倍のアップサンプリングと帯域拡大を実現することが可能である。
〈周波数帯域拡大装置の構成例〉
ところで、上述した周波数帯域拡大装置11とアップサンプリングを組み合わせる手法や、図3に示した周波数帯域拡大装置61によれば、スタンダードレゾリューションの入力信号から、より高いサンプリング周波数のハイレゾリューションの出力信号を得ることができる。しかしながら、これらの手法では、入出力のサンプリング周波数比に応じて処理量が多くなってしまう。
例えば、入力信号のサンプリング周波数を4倍にアップサンプリングしてから、周波数帯域拡大装置11により周波数帯域拡大処理を行うと、アップサンプリングをせずに周波数帯域拡大処理を行う場合と比べて処理量が約4倍となってしまう。また、周波数帯域拡大装置61においても、入出力のサンプリング周波数比に応じてレベル調整帯域通過フィルタ76での処理の量が増加してしまう。そうすると、動作周波数が十分でないCPU(Central Processing Unit)やDSP(Digital Signal Processor)では処理できないこともある。
そこで、本技術では、さらに周波数帯域拡大装置の構成を図8に示す構成とすることで、より少ない処理量で、より高音質な音声、つまりハイレゾリューションの音声を得ることができるようにした。なお、図8において、図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図8に示す周波数帯域拡大装置111は、周波数帯域拡大装置61により行われる処理と等価な処理を、周波数帯域拡大装置61よりも少ない処理量で行うものである。周波数帯域拡大装置111は、入力信号のサンプリング周波数を2のべき乗倍にアップサンプリングし、帯域拡大を行う。
以下、周波数帯域拡大装置111の構成について説明するとともに、周波数帯域拡大装置61の構成を、周波数帯域拡大装置111の構成に等価に変更可能で、処理量を削減することができることを説明する。
なお、ここではサンプリング周波数48kHzの入力信号を、4倍のサンプリング周波数、つまり192kHzにアップサンプリングして帯域拡大する場合を例として説明する。
図8に示す周波数帯域拡大装置111は、ポリフェーズ構成低域通過フィルタ121、遅延回路22、低域抽出帯域通過フィルタ23、特徴量算出回路24、高域サブバンドパワー推定回路25、帯域通過フィルタ算出回路72、加算部122、高域通過フィルタ123、平坦化回路73、ダウンサンプリング部74、ポリフェーズ構成レベル調整フィルタ124、および加算部28を有している。
周波数帯域拡大装置111の構成と、周波数帯域拡大装置61の構成とを比較すると、以下の点が異なっている。
すなわち、周波数帯域拡大装置111では、周波数帯域拡大装置61に設けられていたアップサンプリング部71と低域通過フィルタ21が、ポリフェーズ構成低域通過フィルタ121に置き換えられている。
また、周波数帯域拡大装置111では、周波数帯域拡大装置61に設けられていたアップサンプリング部75、およびレベル調整帯域通過フィルタ76がポリフェーズ構成レベル調整フィルタ124に置き換えられている。
さらに、周波数帯域拡大装置61では、加算部77と高域通過フィルタ27は、レベル調整帯域通過フィルタ76と加算部28の間に配置されていた。
これに対して、それらの加算部77と高域通過フィルタ27に相当する周波数帯域拡大装置111の加算部122および高域通過フィルタ123は、帯域通過フィルタ算出回路72とポリフェーズ構成レベル調整フィルタ124の間に配置されている。つまり配置位置の変更により処理の順序変更がされている。
以下、これらの置き換えや配置位置の変更によって、等価な処理を行いつつ、処理量削減が可能となることについて説明する。
まず、ポリフェーズ構成低域通過フィルタ121への置き換えについて説明する。
周波数帯域拡大装置61の低域通過フィルタ21は、アップサンプリング部71から出力された信号に対してフィルタリングを行うが、この信号は上述したように入力信号のデータ系列のサンプル間に3つのゼロ挿入を行ったものである。
ここで、低域通過フィルタ21でのフィルタリングに用いられる低域通過フィルタがFIR型のフィルタであるとすると、3つのゼロ挿入分はフィルタリングの処理から省くことができ、これにより処理量を削減することができる。
そこで、周波数帯域拡大装置111では、ポリフェーズ構成低域通過フィルタ121を設けることで、入力信号のアップサンプリングと低域通過のフィルタリング処理を同時に行うようにする。すなわち、ポリフェーズ構成低域通過フィルタ121では、ポリフェーズ構成のフィルタを用いて入力信号に対するフィルタリングを行うことで、アップサンプリングされた低域信号を得ることができるので、処理量を削減することができる。
なお、ポリフェーズ構成低域通過フィルタ121では、サンプリング周波数の2のべき乗倍のアップサンプリングのみが可能である。
次に、ポリフェーズ構成レベル調整フィルタ124への置き換えと、加算部122および高域通過フィルタ123の配置位置の変更について説明する。
周波数帯域拡大装置61では、レベル調整帯域通過フィルタ76によるフィルタリングで得られた各高域サブバンドの高域サブバンド信号は、加算部77で加算される。
ここで、レベル調整帯域通過フィルタ76、つまり帯域通過フィルタ81で用いられる帯域通過フィルタがFIR型のフィルタであるとする。
そのような場合、その線形性により加算部77の出力は、帯域通過フィルタ81−1乃至帯域通過フィルタ81−Mの帯域通過フィルタ係数を予め加算して得られたフィルタ係数で平坦化信号をフィルタリングした出力と同じになる。
周波数帯域拡大装置111では、この帯域通過フィルタ81−1乃至帯域通過フィルタ81−Mの帯域通過フィルタ係数h_env(ib,l)を予め加算する処理が、加算部122により行われる。
また、周波数帯域拡大装置61では、加算部77の出力が高域通過フィルタ27において高域通過フィルタでフィルタリングされる。この加算部77の出力は、周波数帯域拡大装置111では、加算部122により加算された帯域通過フィルタ係数でフィルタリングした出力に相当する。
ここで、高域通過フィルタ27で用いられる高域通過フィルタもFIR型のフィルタであるとする。そのような場合、その線形性から、高域通過フィルタ27から出力される高域信号は、加算部122により加算された帯域通過フィルタ係数を、高域通過フィルタで予めフィルタリングして得られたフィルタ係数によるフィルタリング出力と同じになる。
そこで、周波数帯域拡大装置111では、加算部122により加算された帯域通過フィルタ係数を高域通過フィルタで予めフィルタリングする処理が、高域通過フィルタ123により行われる。
最後に、周波数帯域拡大装置111のダウンサンプリング部74の出力である平坦化信号のデータ系列のサンプル間に7つのゼロ挿入を行ってアップサンプリングし、この出力を高域通過フィルタ123から出力されたフィルタ係数でフィルタリングすれば、周波数帯域拡大装置61が行う処理と等価処理を行うことができる。
このアップサンプリングとフィルタ処理では、7つのゼロ挿入分に対するフィルタリング処理は、上述した低域信号の生成における場合と同様に省くことができ、これにより処理量を削減することができる。
そこで、周波数帯域拡大装置111では、ポリフェーズ構成レベル調整フィルタ124を設けることで、平坦化信号のアップサンプリングと帯域通過のフィルタリング処理を同時に行うようにする。すなわち、ポリフェーズ構成レベル調整フィルタ124では、ポリフェーズ構成のフィルタを用いて平坦化信号に対するフィルタリングを行うことで、アップサンプリングされた高域信号を得ることができるので、処理量を削減することができる。
なお、ポリフェーズ構成レベル調整フィルタ124では、サンプリング周波数の整数倍のアップサンプリングのみが可能である。
以上のように、周波数帯域拡大装置111によれば、周波数帯域拡大装置61と等価処理を行うとともに処理量を削減することができる。すなわち、入力信号のサンプリング周波数を4倍にアップサンプリングして帯域拡大を行っても、アップサンプリングせずに帯域拡大を行ったときと同程度の処理量で、ハイレゾリューションの音声を得ることができる。
〈ポリフェーズ構成レベル調整フィルタの構成例〉
また、図8に示した周波数帯域拡大装置111のポリフェーズ構成レベル調整フィルタ124は、例えば図9に示す構成とされる。
図9に示すポリフェーズ構成レベル調整フィルタ124は、選択部151、遅延部152−1−1乃至遅延部152−8−(Z−1)、増幅部153−1−1乃至増幅部153−8−Z、加算部154−1乃至加算部154−8、および合成部155から構成される。
なお、ここでは、遅延部152−3−1乃至遅延部152−7−(Z−1)、増幅部153−3−1乃至増幅部153−7−Z、および加算部154−3乃至加算部154−7等の一部のブロックの図示は省略されている。また、ダウンサンプリング部74からポリフェーズ構成レベル調整フィルタ124に供給される平坦化信号のサンプルの系列がd[0],d[1],…,d[N-1]であるとする。さらに、高域通過フィルタ123から出力されるM個のフィルタ係数がh_high[m](但し、m=0,1,2,…,M-1)であり、Mは8の倍数であるとする。
選択部151は、ダウンサンプリング部74から供給された平坦化信号のサンプルを、遅延部152−1−1、遅延部152−2−1、遅延部152−3−1、遅延部152−4−1、遅延部152−5−1、遅延部152−6−1、遅延部152−7−1、または遅延部152−8−1の何れか1つに供給する。例えば、遅延部152−1−1から遅延部152−8−1まで順番に選択されていき、遅延部152−8−1が選択されると、その次には再び遅延部152−1−1が選択される。そして、選択された遅延部へと1つのサンプルが順番に供給されていく。
したがって、例えば遅延部152−1−1には、平坦化信号のサンプルとしてd[0],d[8],d[16],…が順番に供給される。
また、選択部151は、ダウンサンプリング部74から供給された平坦化信号のサンプルを、増幅部153−1−1、増幅部153−2−1、増幅部153−3−1、増幅部153−4−1、増幅部153−5−1、増幅部153−6−1、増幅部153−7−1、または増幅部153−8−1の何れか1つに供給する。例えば、増幅部153−1−1から増幅部153−8−1まで順番に選択されていき、増幅部153−8−1が選択されると、その次には再び増幅部153−1−1が選択される。そして、選択された増幅部へと1つのサンプルが順番に供給されていく。
したがって、例えば増幅部153−1−1には、平坦化信号のサンプルとしてd[0],d[8],d[16],…が順番に供給される。
遅延部152−1−1は、選択部151から供給された平坦化信号の1つのサンプル、より詳細にはサンプルのサンプル値を増幅部153−1−2に供給するとともに、遅延部152−1−2に供給する。
遅延部152−1−Q(但し、2≦Q≦Z−2)は、遅延部152−1−(Q−1)から供給された平坦化信号の1つのサンプルを、増幅部153−1−(Q+1)に供給するとともに、遅延部152−1−(Q+1)に供給する。また、遅延部152−1−(Z−1)は、遅延部152−1−(Z−2)から供給された平坦化信号の1つのサンプルを、増幅部153−1−Zに供給する。
なお、以下、遅延部152−1−1乃至遅延部152−1−(Z−1)を特に区別する必要のない場合、単に遅延部152−1とも称する。ここで、Z=M/8である。
増幅部153−1−1は、選択部151から供給された平坦化信号の1つのサンプルに、高域通過フィルタ123から供給されたフィルタ係数h_high[0]を乗算し、加算部154−1に供給する。
増幅部153−1−Q(但し、2≦Q≦Z)は、遅延部152−1−(Q−1)から供給された平坦化信号の1つのサンプルに、高域通過フィルタ123から供給されたフィルタ係数h_high[8Q-8]を乗算し、加算部154−1に供給する。
なお、以下、増幅部153−1−1乃至増幅部153−1−Zを特に区別する必要のない場合、単に増幅部153−1とも称する。
加算部154−1は、増幅部153−1−1乃至増幅部153−1−Zから供給された、フィルタ係数が乗算されたサンプルを加算して、その結果得られたサンプルを高域信号の1つのサンプルとして合成部155に供給する。
例えば高域信号のサンプル系列がy[0],y[1],…,y[8N-1]であるとすると、加算部154−1からは、高域信号のサンプルとしてy[0],y[8],y[16],…が順番に出力されることになる。
また、遅延部152−R−1(但し、2≦R≦8)は、選択部151から供給された平坦化信号の1つのサンプルを増幅部153−R−2に供給するとともに、遅延部152−R−2に供給する。
遅延部152−R−Q(但し、2≦R≦8,2≦Q≦Z−2)は、遅延部152−R−(Q−1)から供給された平坦化信号の1つのサンプルを、増幅部153−R−(Q+1)に供給するとともに、遅延部152−R−(Q+1)に供給する。また、遅延部152−R−(Z−1)は、遅延部152−R−(Z−2)から供給された平坦化信号の1つのサンプルを、増幅部153−R−Zに供給する。
なお、以下、遅延部152−R−1乃至遅延部152−R−(Z−1)(但し、2≦R≦8)を特に区別する必要のない場合、単に遅延部152−Rとも称する。また、遅延部152−1乃至遅延部152−8を特に区別する必要のない場合、単に遅延部152とも称する。
増幅部153−R−1(但し、2≦R≦8)は、選択部151から供給された平坦化信号の1つのサンプルに、高域通過フィルタ123から供給されたフィルタ係数h_high[R-1]を乗算し、加算部154−Rに供給する。
増幅部153−R−Q(但し、2≦R≦8,2≦Q≦Z)は、遅延部152−R−(Q−1)から供給された平坦化信号の1つのサンプルに、高域通過フィルタ123から供給されたフィルタ係数h_high[8Q+R-9]を乗算し、加算部154−Rに供給する。
なお、以下、増幅部153−R−1乃至増幅部153−R−Z(但し、2≦R≦8)を特に区別する必要のない場合、単に増幅部153−Rとも称する。また、以下、増幅部153−1乃至増幅部153−8を特に区別する必要のない場合、単に増幅部153とも称する。
加算部154−R(但し、2≦R≦8)は、増幅部153−R−1乃至増幅部153−R−Zから供給された、フィルタ係数が乗算されたサンプルを加算して、その結果得られたサンプルを高域信号の1つのサンプルとして合成部155に供給する。
例えば加算部154−R(但し、2≦R≦8)からは、高域信号のサンプルとしてy[R-1],y[R+7],y[R+15],…が順番に出力されることになる。なお、以下、加算部154−1乃至加算部154−8を特に区別する必要のない場合、単に加算部154とも称する。
合成部155は、加算部154−1乃至加算部154−8から供給されたサンプルを、高域信号のサンプルとして順番に1つずつ出力する。
例えば、合成部155は、加算部154−1により供給されたサンプルから、加算部154−8により供給されたサンプルまで1つずつ順番に出力していき、その後は、再び加算部154−1により供給されたサンプルを出力し、以降同様にして加算部154から供給されたサンプルを出力していく。
これにより、高域信号のサンプル系列としてy[0],y[1],…,y[8N-1]が加算部28へと出力されることになる。つまり、高域信号のサンプリング周波数が、入力であるもとの平坦化信号のサンプリング周波数の8倍となるように信号のアップサンプリングが行われることになる。
なお、図8に示した周波数帯域拡大装置111のポリフェーズ構成低域通過フィルタ121もポリフェーズ構成レベル調整フィルタ124と同様の構成とされる。但し、ポリフェーズ構成低域通過フィルタ121の場合は、もとの信号と比べて4倍のサンプリング周波数を有する信号となるようにアップサンプリングが行われるような構成とされる。
〈周波数帯域拡大処理の説明〉
続いて、図10のフローチャートを参照して、周波数帯域拡大装置111により行われる周波数帯域拡大処理について説明する。
ステップS11において、ポリフェーズ構成低域通過フィルタ121は、供給された入力信号に対して、ポリフェーズ構成の低域通過フィルタを用いてフィルタリングを行い、その結果得られた低域信号を遅延回路22に供給する。このフィルタリングによって、信号のアップサンプリングおよび低域成分の抽出が行われ、低域信号が得られる。
ステップS12において、遅延回路22は、ポリフェーズ構成低域通過フィルタ121から供給された低域信号を適切に遅延させて加算部28に供給する。
ステップS13において、低域抽出帯域通過フィルタ23は、供給された入力信号を複数の低域サブバンド信号に分割する。
具体的には、帯域通過フィルタ31−1乃至帯域通過フィルタ31−Nのそれぞれは、低域の各サブバンドに対応する帯域通過フィルタを用いて入力信号をフィルタリングし、その結果得られた低域サブバンド信号を特徴量算出回路24および平坦化回路73に供給する。これにより、例えば低域サブバンドsb-3乃至低域サブバンドsbの各低域サブバンド信号が得られる。
ステップS14において、特徴量算出回路24は、供給された入力信号または帯域通過フィルタ31から供給された低域サブバンド信号の少なくとも何れか一方を用いて特徴量を算出し、高域サブバンドパワー推定回路25に供給する。
例えば特徴量算出回路24は、上述した式(1)を計算することで、低域サブバンドsb乃至低域サブバンドsb-3について、低域サブバンドパワーpower(ib,J)を特徴量として算出する。
ステップS15において、高域サブバンドパワー推定回路25は、特徴量算出回路24から供給された特徴量に基づいて、各高域サブバンドの高域サブバンドパワーの推定値である疑似高域サブバンドパワーを算出し、帯域通過フィルタ算出回路72に供給する。
例えば高域サブバンドパワー推定回路25は、上述した式(2)を計算することで、高域サブバンドsb+1乃至高域サブバンドebについて、疑似高域サブバンドパワーpowerest(ib,J)を算出する。
ステップS16において、帯域通過フィルタ算出回路72は、高域サブバンドパワー推定回路25から供給された疑似高域サブバンドパワーに基づいて帯域通過フィルタ係数を算出し、加算部122に供給する。
具体的には、帯域通過フィルタ算出回路72は、上述した式(3)および式(4)の計算を行って、高域サブバンドib(但し、sb+1≦ib≦eb)ごとに、各サンプルのインデックスlについて帯域通過フィルタ係数h_env(ib,l)を算出する。
ステップS17において、加算部122は、帯域通過フィルタ算出回路72から供給された帯域通過フィルタ係数を加算して1つのフィルタ係数とし、高域通過フィルタ123に供給する。
具体的には、各高域サブバンドibの同じサンプル(インデックス)lの帯域通過フィルタ係数h_env(ib,l)が加算されて、そのサンプルlのフィルタ係数とされる。つまり、帯域通過フィルタ係数h_env(sb+1,l)乃至帯域通過フィルタ係数h_env(eb,l)が加算されて、1つのフィルタ係数とされる。
このようにして得られたサンプルlごとのフィルタ係数から構成される1つのフィルタが、ポリフェーズ構成レベル調整フィルタ124でのフィルタ処理に用いられる、ポリフェーズ構成のフィルタとなる。
複数の帯域通過フィルタ係数を加算して1つのフィルタ係数とし、このようにして得られたフィルタ係数を用いてフィルタリングを行えば、複数回分のフィルタ処理を1度のフィルタ処理で実現することができる。これにより、処理量を削減することができる。
ステップS18において、高域通過フィルタ123は、加算部122から供給されたフィルタ係数を、高域通過フィルタを用いてフィルタリングすることでフィルタ係数から低域成分(ノイズ)を除去し、その結果得られたフィルタ係数をポリフェーズ構成レベル調整フィルタ124の増幅部153に供給する。すなわち、高域通過フィルタ123は、フィルタ係数の高域成分のみを通過させる。
ステップS19において、平坦化回路73は、帯域通過フィルタ31から供給された各低域サブバンドの低域サブバンド信号を平坦化して加算することで平坦化信号を生成し、ダウンサンプリング部74に供給する。
具体的には、平坦化回路73は、上述した式(1)を計算して低域サブバンドパワーを算出し、さらに得られた低域サブバンドパワーに基づいて式(5)を計算することで、平坦化信号を生成する。
ステップS20において、ダウンサンプリング部74は、平坦化回路73から供給された平坦化信号をダウンサンプリングしてポリフェーズ構成レベル調整フィルタ124の選択部151に供給する。
ステップS21において、ポリフェーズ構成レベル調整フィルタ124は、ダウンサンプリング部74から供給されたダウンサンプリングされた平坦化信号に対して、高域通過フィルタ123から供給されたフィルタ係数を用いたフィルタリングを行い、高域信号を生成する。
具体的には、ポリフェーズ構成レベル調整フィルタ124の選択部151は、ダウンサンプリング部74から供給された、ダウンサンプリングされた平坦化信号の各サンプルを、順番に遅延部152−1−1乃至遅延部152−8−1の何れかに供給していく。また、選択部151は、ダウンサンプリング部74から供給された平坦化信号の各サンプルを、順番に増幅部153−1−1乃至増幅部153−8−1の何れかに供給していく。
各遅延部152は、供給されたサンプルを増幅部153と次の遅延部152に供給し、増幅部153は、供給されたサンプルに対して、高域通過フィルタ123から供給されたフィルタ係数を乗算して加算部154に供給する。そして、加算部154は、各増幅部153から供給されたサンプルを加算して合成部155に供給し、合成部155は各加算部154から供給されたサンプルを、高域信号のサンプルとして適切な順番で1つずつ加算部28に供給する。
このように、平坦化信号に対してポリフェーズ構成のフィルタを用いたフィルタリングを行うことにより、平坦化信号の高域の各周波数帯域のレベルが調整されると同時にアップサンプリングが行われ、所望の波形の高域信号が得られる。
なお、ポリフェーズ構成レベル調整フィルタ124では、時間領域で、つまり時間信号である平坦化信号に対するフィルタリングによってレベル調整が行われ、高域信号とされるが、周波数領域で高域信号が生成されるようにしてもよい。
ステップS22において、加算部28は、遅延回路22から供給された低域信号と、ポリフェーズ構成レベル調整フィルタ124から供給された高域信号とを加算して出力信号とし、後段に出力する。出力信号が出力されると、周波数帯域拡大処理は終了する。
以上のようにして、周波数帯域拡大装置111は、ポリフェーズ構成のフィルタにより入力信号や平坦化信号のフィルタリングを行うことで、低域信号および高域信号の生成と同時にそれらの信号のアップサンプリングを行う。また、周波数帯域拡大装置111は、各高域サブバンドの帯域通過フィルタ係数を予め加算して1つのフィルタ係数とし、平坦化信号に対するフィルタリングを行う。
これにより、より少ない処理量でハイレゾリューションの音声を得ることができる。すなわち、より少ない処理量で高音質な音声を得ることができる。
〈第2の実施の形態〉
〈ノイズ注入について〉
ところで、以上においては入力信号の低域成分を用いて高域信号を生成する例について説明した。しかし、この場合、高域信号の周波数形状が不自然な周波数形状となることがある。すなわち、低域の微細な周波数形状が高域にそのまま含まれた不自然な周波数形状の高域信号が生成されてしまうことがある。そうすると、出力信号の音声の音質が劣化してしまうことになる。より高音質な音声を得るためには、高域の周波数形状は、なるべく平坦(フラット)な形状となっていることが望ましい。
そこで、本技術では、周波数帯域拡大装置を例えば図11に示す構成とし、高域信号に対して高域ノイズ信号を付加することで、高域の周波数形状がよりフラットな形状となるようにし、より高音質な音声を得ることができるようにした。なお、図11において、図8における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図11の周波数帯域拡大装置201は、ポリフェーズ構成低域通過フィルタ121、遅延回路22、低域抽出帯域通過フィルタ23、特徴量算出回路24、高域サブバンドパワー推定回路25、帯域通過フィルタ算出回路72、加算部122、高域通過フィルタ123、平坦化回路73、ダウンサンプリング部74、ポリフェーズ構成レベル調整フィルタ124、帯域通過フィルタ算出回路211、加算部212、高域通過フィルタ213、ノイズ生成回路214、ポリフェーズ構成レベル調整フィルタ215、および加算部28を有している。
周波数帯域拡大装置201の構成は、図8に示した周波数帯域拡大装置111の構成に、さらに帯域通過フィルタ算出回路211乃至ポリフェーズ構成レベル調整フィルタ215を設けた構成とされている。
帯域通過フィルタ算出回路72、加算部122、および高域通過フィルタ123が、高域信号の周波数形状形成のためのフィルタ生成を行うものであるのに対し、帯域通過フィルタ算出回路211、加算部212、および高域通過フィルタ213は、高域ノイズ信号の周波数形状形成のためのフィルタ生成を行う。
帯域通過フィルタ算出回路211は、高域サブバンドパワー推定回路25から供給された特徴量に基づいて、高域サブバンドのそれぞれの帯域を通過帯域とする帯域通過フィルタの帯域通過フィルタ係数を算出する。帯域通過フィルタ算出回路211には、例えば特徴量として高域サブバンドパワーの推定値、すなわち疑似高域サブバンドパワーが供給される。
具体的には、帯域通過フィルタ算出回路211は次式(6)を計算することで、各高域サブバンドの帯域通過フィルタ係数h_noise(ib,l)を算出する。すなわち、式(6)の計算では、予め用意されたそれぞれの高域サブバンドの帯域通過フィルタ係数h_org(ib,l)に対して、以下の式(7)により得られる利得量G_noise(ib,J)を乗算することで、帯域通過フィルタ係数h_noise(ib,l)が算出される。
Figure 0006425097
Figure 0006425097
なお、式(7)において、power_noise(ib,J)は、高域サブバンドごとの、追加するノイズのパワーを示しており、このノイズのパワーpower_noise(ib,J)は、例えば次式(8)により算出される。
Figure 0006425097
式(8)では、一定のSN比(Signal to Noise ratio)となるように、高域サブバンドパワーの推定値に対して所定の値を加算したものと、ノイズの下限値とのうちのより大きい値がノイズのパワーpower_noise(ib,J)とされている。この例では、一定のSN比となる値として-60dBが加算されており、またノイズの下限値は-90dBとされている。
また、式(7)において、power_noise_generatedは、ノイズ生成回路214により生成されるホワイトノイズのパワー値であり、例えば-90(dB)とされる。
加算部212は、帯域通過フィルタ算出回路211から供給された帯域通過フィルタ係数を加算して高域通過フィルタ213に供給する。高域通過フィルタ213は、加算部212から供給されたフィルタ係数に対して高域通過フィルタを用いたフィルタリングを行い、ポリフェーズ構成レベル調整フィルタ215に供給する。
なお、これらの加算部212および高域通過フィルタ213は、加算部122および高域通過フィルタ123と同様の処理を行う。
ノイズ生成回路214は、一様分布の乱数生成により、サンプリング周波数が入力信号の半分、すなわち24kHzで、パワー値がpower_noise_generated(例えば、-90dB)であるホワイトノイズ信号を生成し、ポリフェーズ構成レベル調整フィルタ215に供給する。
ポリフェーズ構成レベル調整フィルタ215は、ノイズ生成回路214から供給されたホワイトノイズ信号を、高域通過フィルタ213から供給されたフィルタ係数を用いてフィルタリングし、その結果得られた高域ノイズ信号を加算部28に供給する。
ポリフェーズ構成レベル調整フィルタ215によるフィルタリングによって、ホワイトノイズ信号の波形形成、つまりレベル調整が行われるとともに、サンプリング周波数が入力の4倍になるようにアップサンプリングが行われる。
すなわち、ポリフェーズ構成レベル調整フィルタ215では、高域通過フィルタ213から供給されたフィルタ係数から構成される、ポリフェーズ構成のフィルタを用いたフィルタ処理によって、24kHzのホワイトノイズ信号から、192kHzの高域ノイズ信号が生成される。なお、ポリフェーズ構成レベル調整フィルタ215は、図9に示したポリフェーズ構成レベル調整フィルタ124と同様の構成とされる。
以上の処理により、各高域サブバンドについてレベル調整がされた高域ノイズ信号が生成され、加算部28で、この高域ノイズ信号が高域信号および低域信号とともに加算され、出力信号とされる。
〈周波数帯域拡大処理の説明〉
次に、図12のフローチャートを参照して、周波数帯域拡大装置201により行われる周波数帯域拡大処理について説明する。
なお、ステップS51乃至ステップS61の処理は、図10のステップS11乃至ステップS21の処理と同様であるので、その説明は省略する。但し、ステップS55では、高域サブバンドパワー推定回路25は、得られた疑似高域サブバンドパワーを、帯域通過フィルタ算出回路72および帯域通過フィルタ算出回路211に供給する。
ステップS62において、帯域通過フィルタ算出回路211は、高域サブバンドパワー推定回路25から供給された疑似高域サブバンドパワーに基づいて、ノイズ用の帯域通過フィルタ係数h_noise(ib,l)を算出し、加算部212に供給する。すなわち、上述した式(6)乃至式(8)の計算が行われ、高域サブバンドごとに帯域通過フィルタ係数h_noise(ib,l)が算出される。
これにより、疑似高域サブバンドパワーに応じた、適切なパワーの高域ノイズ信号を高域信号に付加することができるようになる。
ステップS63において、加算部212は、帯域通過フィルタ算出回路211から供給されたノイズ用の帯域通過フィルタ係数を加算して1つのフィルタ係数とし、高域通過フィルタ213に供給する。具体的には、各高域サブバンドibの同じサンプルlの帯域通過フィルタ係数h_noise(ib,l)が加算されて、そのサンプルlのフィルタ係数とされる。
ステップS64において、高域通過フィルタ213は、加算部212から供給されたノイズ用のフィルタ係数を、高域通過フィルタを用いてフィルタリングすることでフィルタ係数から低域成分を除去し、その結果得られたフィルタ係数をポリフェーズ構成レベル調整フィルタ215に供給する。
このようにして得られたサンプルlごとのフィルタ係数から構成される1つのフィルタが、ポリフェーズ構成レベル調整フィルタ215でのフィルタ処理に用いられる、ポリフェーズ構成のフィルタとなる。
ステップS65において、ノイズ生成回路214は、ホワイトノイズ信号を生成し、ポリフェーズ構成レベル調整フィルタ215に供給する。
ステップS66において、ポリフェーズ構成レベル調整フィルタ215は、ノイズ生成回路214から供給されたホワイトノイズ信号に対して、高域通過フィルタ213から供給されたフィルタ係数を用いたフィルタリングを行い、高域ノイズ信号を生成する。
ポリフェーズ構成レベル調整フィルタ215によるフィルタリングでは、ホワイトノイズ信号がレベル調整されて高域ノイズ信号とされるとともに、それと同時に信号のアップサンプリングも行われる。ポリフェーズ構成レベル調整フィルタ215は、生成した高域ノイズ信号を加算部28に供給する。
ステップS67において、加算部28は、遅延回路22から供給された低域信号、ポリフェーズ構成レベル調整フィルタ124から供給された高域信号、およびポリフェーズ構成レベル調整フィルタ215から供給された高域ノイズ信号を加算して出力信号とし、後段に出力する。出力信号が出力されると、周波数帯域拡大処理は終了する。
以上のようにして、周波数帯域拡大装置201は、ポリフェーズ構成のフィルタにより入力信号や平坦化信号、ホワイトノイズ信号のフィルタリングを行うことで、低域信号や高域信号、高域ノイズ信号の生成と同時にそれらの信号のアップサンプリングを行う。また、周波数帯域拡大装置201は、各高域サブバンドの帯域通過フィルタ係数を予め加算して1つのフィルタ係数とし、平坦化信号やホワイトノイズ信号に対するフィルタリングを行う。
これにより、より少ない処理量でハイレゾリューションの音声を得ることができる。すなわち、より少ない処理量で高音質な音声を得ることができる。
さらに、周波数帯域拡大装置201では、高域ノイズ信号を生成して高域信号および低域信号に加算することで、出力信号の高域に適切なノイズ成分を付加し、高域の周波数形状をフラットな形状とすることができる。これにより、より自然な周波数形状の出力信号を得ることができる。すなわち、より自然で高音質な音声を得ることができる。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
図13は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
さらに、本技術は、以下の構成とすることも可能である。
(1)
入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出する低域抽出帯域通過フィルタ処理部と、
前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成するレベル調整フィルタ処理部と、
前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出する低域通過フィルタ処理部と、
前記低域信号と前記高域信号を加算して出力信号を生成する信号加算部と
を備える周波数帯域拡大装置。
(2)
複数の異なる帯域の前記低域サブバンド信号のレベルがほぼ一定となるように、前記低域サブバンド信号を平坦化して平坦化信号を生成する平坦化部と、
前記平坦化信号をダウンサンプリングするダウンサンプリング部と
をさらに備え、
前記レベル調整フィルタ処理部は、前記ダウンサンプリング部によりダウンサンプリングされた前記平坦化信号を、前記ポリフェーズ構成フィルタによりフィルタリングして前記高域信号を生成する
(1)に記載の周波数帯域拡大装置。
(3)
前記平坦化部は、複数の各帯域の前記低域サブバンド信号のレベルが、最も高域側の帯域の前記低域サブバンド信号のレベルとほぼ同じレベルになるように前記平坦化を行う
(2)に記載の周波数帯域拡大装置。
(4)
前記フィルタ係数算出部は、高域の複数の帯域ごとに、それらの前記帯域を通過させる帯域通過フィルタの帯域通過フィルタ係数を算出し、
前記高域の複数の帯域ごとに算出された前記帯域通過フィルタ係数を加算することで1つの前記フィルタ係数とする係数加算部をさらに備える
(1)乃至(3)の何れか一項に記載の周波数帯域拡大装置。
(5)
複数の異なる帯域の前記低域サブバンド信号に基づいて、前記高域の複数の帯域ごとに、それらの前記帯域の信号のレベルの推定値を算出する推定部をさらに備え、
前記フィルタ係数算出部は、前記高域の複数の帯域ごとに、それらの前記帯域の前記推定値に基づいて前記帯域通過フィルタ係数を算出する
(4)に記載の周波数帯域拡大装置。
(6)
高域ノイズ信号を生成するノイズ生成部をさらに備え、
前記信号加算部は、前記低域信号、前記高域信号、および前記高域ノイズ信号を加算して前記出力信号を生成する
(1)乃至(5)の何れか一項に記載の周波数帯域拡大装置。
(7)
ノイズ用ポリフェーズ構成フィルタにより前記高域ノイズ信号をフィルタリングすることで、前記高域ノイズ信号に対するアップサンプリングおよびレベル調整を行うノイズレベル調整フィルタ処理部をさらに備える
(6)に記載の周波数帯域拡大装置。
(8)
前記低域サブバンド信号または前記入力信号に基づいて、前記ノイズ用ポリフェーズ構成フィルタのフィルタ係数を算出するノイズフィルタ係数算出部をさらに備える
(7)に記載の周波数帯域拡大装置。
(9)
前記低域通過フィルタ処理部は、低域用ポリフェーズ構成フィルタにより前記入力信号をフィルタリングすることで、前記入力信号に対するアップサンプリングおよび低域成分の抽出を行って、前記低域信号を生成する
(1)乃至(8)の何れか一項に記載の周波数帯域拡大装置。
(10)
入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出し、
前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出し、
前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成し、
前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出し、
前記低域信号と前記高域信号を加算して出力信号を生成する
ステップを含む周波数帯域拡大方法。
(11)
入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出し、
前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出し、
前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成し、
前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出し、
前記低域信号と前記高域信号を加算して出力信号を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
23 低域抽出帯域通過フィルタ, 24 特徴量算出回路, 25 高域サブバンドパワー推定回路, 28 加算部, 72 帯域通過フィルタ算出回路, 73 平坦化回路, 74 ダウンサンプリング部, 111 周波数帯域拡大装置, 121 ポリフェーズ構成低域通過フィルタ, 122 加算部, 123 高域通過フィルタ, 124 ポリフェーズ構成レベル調整フィルタ, 211 帯域通過フィルタ算出回路, 214 ノイズ生成回路, 215 ポリフェーズ構成レベル調整フィルタ

Claims (11)

  1. 入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出する低域抽出帯域通過フィルタ処理部と、
    前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成するレベル調整フィルタ処理部と、
    前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出する低域通過フィルタ処理部と、
    前記低域信号と前記高域信号を加算して出力信号を生成する信号加算部と
    を備える周波数帯域拡大装置。
  2. 複数の異なる帯域の前記低域サブバンド信号のレベルがほぼ一定となるように、前記低域サブバンド信号を平坦化して平坦化信号を生成する平坦化部と、
    前記平坦化信号をダウンサンプリングするダウンサンプリング部と
    をさらに備え、
    前記レベル調整フィルタ処理部は、前記ダウンサンプリング部によりダウンサンプリングされた前記平坦化信号を、前記ポリフェーズ構成フィルタによりフィルタリングして前記高域信号を生成する
    請求項1に記載の周波数帯域拡大装置。
  3. 前記平坦化部は、複数の各帯域の前記低域サブバンド信号のレベルが、最も高域側の帯域の前記低域サブバンド信号のレベルとほぼ同じレベルになるように前記平坦化を行う
    請求項2に記載の周波数帯域拡大装置。
  4. 前記フィルタ係数算出部は、高域の複数の帯域ごとに、それらの前記帯域を通過させる帯域通過フィルタの帯域通過フィルタ係数を算出し、
    前記高域の複数の帯域ごとに算出された前記帯域通過フィルタ係数を加算することで1つの前記フィルタ係数とする係数加算部をさらに備える
    請求項1乃至請求項3の何れか一項に記載の周波数帯域拡大装置。
  5. 複数の異なる帯域の前記低域サブバンド信号に基づいて、前記高域の複数の帯域ごとに、それらの前記帯域の信号のレベルの推定値を算出する推定部をさらに備え、
    前記フィルタ係数算出部は、前記高域の複数の帯域ごとに、それらの前記帯域の前記推定値に基づいて前記帯域通過フィルタ係数を算出する
    請求項4に記載の周波数帯域拡大装置。
  6. 高域ノイズ信号を生成するノイズ生成部をさらに備え、
    前記信号加算部は、前記低域信号、前記高域信号、および前記高域ノイズ信号を加算して前記出力信号を生成する
    請求項1乃至請求項5の何れか一項に記載の周波数帯域拡大装置。
  7. ノイズ用ポリフェーズ構成フィルタにより前記高域ノイズ信号をフィルタリングすることで、前記高域ノイズ信号に対するアップサンプリングおよびレベル調整を行うノイズレベル調整フィルタ処理部をさらに備える
    請求項6に記載の周波数帯域拡大装置。
  8. 前記低域サブバンド信号または前記入力信号に基づいて、前記ノイズ用ポリフェーズ構成フィルタのフィルタ係数を算出するノイズフィルタ係数算出部をさらに備える
    請求項7に記載の周波数帯域拡大装置。
  9. 前記低域通過フィルタ処理部は、低域用ポリフェーズ構成フィルタにより前記入力信号をフィルタリングすることで、前記入力信号に対するアップサンプリングおよび低域成分の抽出を行って、前記低域信号を生成する
    請求項1乃至請求項8の何れか一項に記載の周波数帯域拡大装置。
  10. 入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出し、
    前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出し、
    前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成し、
    前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出し、
    前記低域信号と前記高域信号を加算して出力信号を生成する
    ステップを含む周波数帯域拡大方法。
  11. 入力信号の低域側の所定帯域を通過させて低域サブバンド信号を抽出し、
    前記低域サブバンド信号または前記入力信号に基づいて、ポリフェーズ構成フィルタのフィルタ係数を算出し、
    前記フィルタ係数の前記ポリフェーズ構成フィルタにより前記低域サブバンド信号をフィルタリングすることで、前記低域サブバンド信号のアップサンプリングおよびレベル調整を行って高域信号を生成し、
    前記入力信号に対するフィルタリングにより、前記入力信号から低域信号を抽出し、
    前記低域信号と前記高域信号を加算して出力信号を生成する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2015550649A 2013-11-29 2014-11-17 周波数帯域拡大装置および方法、並びにプログラム Active JP6425097B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013247092 2013-11-29
JP2013247092 2013-11-29
PCT/JP2014/080322 WO2015079946A1 (ja) 2013-11-29 2014-11-17 周波数帯域拡大装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JPWO2015079946A1 JPWO2015079946A1 (ja) 2017-03-16
JP6425097B2 true JP6425097B2 (ja) 2018-11-21

Family

ID=53198892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015550649A Active JP6425097B2 (ja) 2013-11-29 2014-11-17 周波数帯域拡大装置および方法、並びにプログラム

Country Status (4)

Country Link
US (1) US9922660B2 (ja)
JP (1) JP6425097B2 (ja)
CN (1) CN105745706B (ja)
WO (1) WO2015079946A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102721794B1 (ko) * 2016-11-18 2024-10-25 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
EP3745312A4 (en) 2018-01-23 2021-07-14 Sony Corporation DEVICE AND METHOD AND PROGRAM FOR PROCESSING NEURAL NETWORKS
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
US11693020B2 (en) * 2018-11-06 2023-07-04 Rohm Co., Ltd. Accelerometer having a root-mean-square (RMS) output
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
WO2020157888A1 (ja) * 2019-01-31 2020-08-06 三菱電機株式会社 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム
CN114467139A (zh) 2019-09-24 2022-05-10 索尼集团公司 信号处理装置、信号处理方法和程序
CN110797038B (zh) 2019-10-30 2020-11-06 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质
EP4131257A4 (en) 2020-04-01 2023-08-30 Sony Group Corporation Signal processing device and method, and program
WO2022014500A1 (ja) 2020-07-17 2022-01-20 ソニーグループ株式会社 ニューラルネットワーク処理装置、情報処理装置、情報処理システム、電子機器、ニューラルネットワーク処理方法およびプログラム
CN113299313B (zh) * 2021-01-28 2024-03-26 维沃移动通信有限公司 音频处理方法、装置及电子设备
US20230230604A1 (en) * 2022-01-20 2023-07-20 Electronics And Telecommunications Research Institute Method of encoding audio signal and encoder, method of decoding audio signal and decoder

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
JP3576942B2 (ja) 2000-08-29 2004-10-13 株式会社ケンウッド 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP3957589B2 (ja) * 2001-08-23 2007-08-15 松下電器産業株式会社 音声処理装置
US7228271B2 (en) * 2001-12-25 2007-06-05 Matsushita Electric Industrial Co., Ltd. Telephone apparatus
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
WO2006095824A1 (ja) * 2005-03-10 2006-09-14 Mitsubishi Denki Kabushiki Kaisha 音像定位装置
JP4627548B2 (ja) * 2005-09-08 2011-02-09 パイオニア株式会社 帯域拡張装置、帯域拡張方法および帯域拡張プログラム
JP5055759B2 (ja) * 2005-12-16 2012-10-24 沖電気工業株式会社 帯域変換信号生成器及び帯域拡張装置
JP5061111B2 (ja) * 2006-09-15 2012-10-31 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5164970B2 (ja) * 2007-03-02 2013-03-21 パナソニック株式会社 音声復号装置および音声復号方法
WO2009157280A1 (ja) * 2008-06-26 2009-12-30 独立行政法人科学技術振興機構 オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5523589B2 (ja) * 2010-03-09 2014-06-18 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5565405B2 (ja) * 2011-12-21 2014-08-06 ヤマハ株式会社 音響処理装置および音響処理方法
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置

Also Published As

Publication number Publication date
US20160284361A1 (en) 2016-09-29
US9922660B2 (en) 2018-03-20
CN105745706A (zh) 2016-07-06
JPWO2015079946A1 (ja) 2017-03-16
CN105745706B (zh) 2019-09-24
WO2015079946A1 (ja) 2015-06-04

Similar Documents

Publication Publication Date Title
JP6425097B2 (ja) 周波数帯域拡大装置および方法、並びにプログラム
KR101422368B1 (ko) 오디오 신호를 처리하기 위한 방법 및 장치
JP5132776B2 (ja) 高精度を有するコンポーネント信号を決定するための装置および方法
JP5754899B2 (ja) 復号装置および方法、並びにプログラム
CN102576537B (zh) 用于处理音频信号的方法和装置
JP5652658B2 (ja) 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US7818079B2 (en) Equalization based on digital signal processing in downsampled domains
JP6672322B2 (ja) オーディオ処理のためのマルチレートシステム
EP2200180B1 (en) Subband signal processing
JP2007011305A (ja) ルームインプレッションおよび/またはサウンドインプレッションのシミュレーションの方法
JP6179571B2 (ja) 復号装置および方法、並びにプログラム
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
US20170270939A1 (en) Efficient Sample Rate Conversion
JP2014109667A (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP6677110B2 (ja) 音声信号処理装置及び音声信号処理プログラム
WO2014017315A1 (ja) 周波数帯域拡大装置および方法、並びにプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181010

R151 Written notification of patent or utility model registration

Ref document number: 6425097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151