JP6816277B2

JP6816277B2 - 信号処理装置、制御方法、プログラム及び記憶媒体

Info

Publication number: JP6816277B2
Application number: JP2019527673A
Authority: JP
Inventors: 長谷川　真; 真長谷川; 弥生佐藤
Original assignee: Pioneer Corp
Current assignee: Pioneer Corp
Priority date: 2017-07-03
Filing date: 2018-06-29
Publication date: 2021-01-20
Anticipated expiration: 2038-06-29
Also published as: WO2019009204A1; US20200118579A1; EP3651365A1; EP3651365A4; JPWO2019009204A1; US11031023B2

Description

本発明は、量子化ノイズを制御する技術に関する。

従来から、ビット数の少ない量子化ビットによりデジタル化されたデータの量子化ノイズを除去する技術が知られている。例えば、特許文献１には、低ビット数により量子化されたデジタルデータをスペクトル変換し、所定レベル以下のスペクトルを除去した後、逆フーリエ変換したデータを出力する技術が開示されている。

特開平７−１９３５０２号公報

特許文献１では、聴感上気にならない量子化ノイズについても一様に除去することにより、量子化ノイズと共に、元々存在する音成分も除去してしまうという問題があった。

本発明が解決しようとする課題は上記のようなものが例として挙げられる。本発明は、量子化ノイズを好適に減衰させることが可能な信号処理装置を提供することを主な目的とする。

請求項に記載の発明は、信号処理装置であって、量子化が行われた音データを取得する取得手段と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段と、を備え、前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する。

また、請求項に記載の発明は、信号処理装置が実行する制御方法であって、量子化が行われた音データを取得する取得工程と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御工程と、を有し、前記量子化ノイズ制御工程は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する。

また、請求項に記載の発明は、コンピュータが実行するプログラムであって、量子化が行われた音データを取得する取得手段と、前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段として前記コンピュータを機能させ、前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する。

実施例に係る音出力システムの構成を示す。変換装置の機能的なブロック構成図を示す。最大減衰量を規定するグラフ、及び、周波数領域での減衰処理の具体例を示す。ハイレゾ規格及びＣＤ規格のそれぞれにより正弦波信号の量子化を行った場合の時間領域及び周波数領域での信号波形を示す。ＣＤ規格において発生する量子化ノイズの聴感を定量的に表したグラフを示す。（Ａ）は、入力レベルが比較的大きい入力信号の周波数特性を示し、（Ｂ）は、当該周波数特性を有する入力信号に対して窓関数を適用してフーリエ変換を行った算出結果を示す波形である。（Ａ）は、図６（Ｂ）の波形に対して量子化ノイズ減衰処理を行うことで得られた波形を示し、（Ｂ）は、出力信号の周波数特性を示す。（Ａ）は、入力レベルが比較的小さい入力信号の周波数特性を示し、（Ｂ）は、当該周波数特性を有する入力信号に対して窓関数を適用してフーリエ変換を行った算出結果を示す波形である。（Ａ）は、図８（Ｂ）の波形に対して量子化ノイズ減衰処理を行うことで得られた波形を示し、（Ｂ）は、出力信号の周波数特性を示す。変形例に係る変換装置のブロック構成図を示す。複数の周波数帯域に対してそれぞれ最大減衰量を決定する場合の周波数帯域の分割例を示した図である。

本発明の好適な実施形態では、信号処理装置は、量子化が行われた音データを取得する取得手段と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御手段と、を備える。この態様では、信号処理装置は、取得した音データの音量に応じて量子化ノイズに対する聴感が異なることに着目し、音データの音量に基づいて量子化ノイズを制御する制御量を決定する。これにより、信号処理装置は、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。

上記信号処理装置の一態様では、前記制御量は、所定の周波数帯域において前記音データの信号レベルを減衰させる減衰量であり、前記量子化ノイズ制御手段は、前記音量に基づいて、前記減衰量を変化させる。この態様により、量子化ノイズ制御手段は、量子化ノイズを減衰させつつ、元々存在する音成分を不要に除去するのを好適に抑制することができる。

上記信号処理装置の他の一態様では、前記量子化ノイズ制御手段は、前記音量が小さいほど、前記減衰量を大きくする。出願人は、実施例において後述するように、音データの音量が小さい場合ほど、量子化ノイズが聴こえ易くなり、かつ、量子化ノイズの減衰処理によるノイズでない音成分への影響が小さくなるという知見を得た。従って、この態様により、信号処理装置は、元々存在する音成分への影響を回避しつつ量子化ノイズを好適に減衰させることができる。

上記信号処理装置の他の一態様では、前記量子化ノイズ制御手段は、前記音量と、前記音データの周波数とに基づいて、前記減衰量を決定する。出願人は、実施例において後述するように、入力信号の周波数が比較的低い場合には、量子化ノイズが聴こえ易い傾向があるという知見を得た。よって、この態様により、信号処理装置は、元々存在する音成分への影響を回避しつつ、量子化ノイズをより効果的に減衰させることができる。好適には、前記量子化ノイズ制御手段は、前記周波数が低いほど、前記減衰量を大きくするとよい。

上記信号処理装置の他の一態様では、信号処理装置は、前記音データの時間波形を周波数領域へ変換する変換手段をさらに備え、前記量子化ノイズ制御手段は、前記周波数領域の振幅が所定レベル未満の周波数について、前記制御量に基づいて減衰を行う。この態様により、信号処理装置は、量子化ノイズの影響がある周波数の振幅を減衰させて量子化ノイズを好適に低減させることができる。

上記信号処理装置の他の一態様では、前記変換手段は、所定時間間隔により切り出した前記音データの時間波形を周波数領域へ変換する。このように音データを切り出した場合には、切出しの影響により周波数領域での波形の裾野が広がり、音データの音量によっては量子化ノイズと元々の音成分とが特定の周波数帯域において混じり合う。この場合であっても、信号処理装置は、音量に基づいて制御量を決定することで、ユーザが聴こえる範囲の量子化ノイズを好適に減衰させつつ、元々存在する音成分への影響を好適に低減させることができる。

上記信号処理装置の他の一態様では、信号処理装置は、前記音データを複数の周波数帯域に分割する分割手段をさらに備え、前記量子化ノイズ制御手段は、前記複数の周波数帯域各々に対して前記量子化ノイズに対する前記制御量を決定する。これにより、信号処理装置は、周波数帯ごとに制御量を適切に定めることができる。好適な例では、信号処理装置は、前記量子化ノイズの制御が行われた音データの倍音生成を行う倍音生成手段と、前記倍音生成が行われた音データを出力する出力手段と、をさらに備える。この態様により、信号処理装置は、より高品質となる規格へのアップコンバートを好適に実行することができる。

本発明の他の実施形態では、信号処理装置が実行する制御方法であって、量子化が行われた音データを取得する取得工程と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御工程と、を有する。信号処理装置は、この制御方法を実行することで、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。

本発明のさらに別の実施形態では、コンピュータが実行するプログラムであって、量子化が行われた音データを取得する取得手段と、前記音データの音量に基づいて、前記量子化により発生した前記音データの量子化ノイズに対する制御量を決定する量子化ノイズ制御手段として前記コンピュータを機能させる。コンピュータは、このプログラムを実行することで、ユーザに聴こえる量子化ノイズを好適に制御してその影響を低減させることができる。好適には、上記プログラムは、記憶媒体に記憶される。

以下、図面を参照して本発明の好適な実施例について説明する。以後において、「ハイレゾ」とは、サンプリング周波数：９６ｋＨｚ、ビット長２４ｂｉｔを上回る情報量を有する音源を指すものとする。

［音出力システムの構成］
図１は、本実施例に係る音出力システム１００の構成を示す。音出力システム１００は、ＣＤ規格の音データをハイレゾ規格にアップコンバートして再生するシステムであって、図１に示すように、入力装置１と、変換装置２と、出力装置３とを備える。

入力装置１は、ＣＤ音源のデジタルデータである入力信号Ｓ１を変換装置２へ入力する。入力装置１は、例えば、ＣＤなどの記録媒体から音データを読み取るインタフェース装置であってもよく、有線又は無線により他の装置から送信される音データを受信する通信装置であってもよく、入力信号Ｓ１を記憶する記憶装置であってもよい。

変換装置２は、入力装置１から入力される入力信号Ｓ１をアップコンバートすることで、ハイレゾ規格のデジタルデータである出力信号Ｓ２を出力装置３に出力する。この場合、後述するように、変換装置２は、まず、所定のハイレゾフォーマットにサンプリング周波数、ビット長をアップコンバートする。フォーマットはアップコンバートされているが、この時点では、量子化ノイズを含み、かつ、高域補間もされていない信号である為、ＣＤスペックの品質の信号である。次に、入力信号Ｓ１に含まれる量子化ノイズを減衰させる処理（量子化ノイズ減衰処理）及び倍音生成処理などを行うことで、ＣＤスペックを上回る品質の音データである出力信号Ｓ２を生成する。変換装置２は、本発明における「信号処理装置」の一例である。

出力装置３は、例えばスピーカなどであり、変換装置２から出力された出力信号Ｓ２に基づき音を出力する。なお、入力装置１又は出力装置３の少なくとも一方は、変換装置２と一体化して構成されてもよい。また、入力装置１と出力装置３とが一体化して構成されていてもよい。

[変換装置のブロック構成]
図２は、変換装置２の機能的なブロック構成図を示す。変換装置２は、ＣＰＵ、ＲＯＭ、ＲＡＭなどのハードウェア構成を有し、機能的には、時間窓切出しブロック２１と、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）ブロック２２と、減衰量制限ブロック２３と、量子化ノイズ減衰ブロック２４と、倍音生成ブロック２５と、ＩＦＦＴ（ＩｎｖｅｒｓｅＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）ブロック２６と、時間窓再合成ブロック２７とを有する。

時間窓切出しブロック２１は、ハニング窓などの種々の窓関数に基づき、入力信号Ｓ１が示す音データの時間波形を所定時間長の窓幅ごとに（フレームごとに）オーバーラップさせながら切出す。そして、時間窓切出しブロック２１は、フレームごとの音データを、ＦＦＴブロック２２及び減衰量制限ブロック２３にそれぞれ供給する。

ＦＦＴブロック２２は、時間窓切出しブロック２１が出力する所定時間長の音データに対して高速フーリエ変換を行い、周波数ごとの振幅及び位相を出力する。この場合、振幅に関する情報は、量子化ノイズ減衰ブロック２４に供給され、位相に関する情報は、倍音生成ブロック２５に供給される。

減衰量制限ブロック２３は、時間窓切出しブロック２１から供給される音データの信号レベルの大きさに基づいて、量子化ノイズ減衰ブロック２４において減衰させる周波数領域での振幅に対する最大減衰量を決定する。減衰量制限ブロック２３は、ＲＭＳ値算出ブロック３１と、最大減衰量算出ブロック３２とを有する。ＲＭＳ値算出ブロック３１は、時間窓切出しブロック２１から供給される音データのフレームごとのＲＭＳ（ＲｏｏｔＭｅａｎＳｑｕａｒｅ）値を算出する。この場合、ＲＭＳ値算出ブロック３１により算出されるＲＭＳ値は、フレームごとの音データの平均的な信号レベルの大きさに相当する。最大減衰量算出ブロック３２は、ＲＭＳ値算出ブロック３１が算出したＲＭＳ値に基づき、量子化ノイズ減衰ブロック２４での周波数領域での振幅に対する減衰量の上限に相当する最大減衰量を算出する。最大減衰量の算出方法の詳細については図３（Ａ）を参照して後述する。

なお、ＲＭＳ値算出ブロック３１は、音データの信号レベルを示す値であれば、ＲＭＳ値以外の計算値であってもよい。

量子化ノイズ減衰ブロック２４は、減衰量制限ブロック２３が決定した最大減衰量に基づき、対象となるフレームの周波数領域での振幅を調整することで、量子化ノイズを減衰させる。本実施例では、量子化ノイズ減衰ブロック２４は、ＣＤ規格において再現できる最小音量である−９０．３ｄＢ未満の音量については量子化ノイズに起因して発生したものと推定し、−９０．３ｄＢ未満の音量となる周波数の信号レベルを減衰させる。このとき、量子化ノイズ減衰ブロック２４は、減衰量制限ブロック２３が決定した最大減衰量を超えないように、−９０．３ｄＢ未満の音量となる周波数の信号レベルを調整する。この調整処理の具体例については図３（Ｂ）を参照して後述する。なお、−９０．３ｄＢは、本発明における「所定レベル」の一例である。また、−９０．３ｄＢ未満の音量となる周波数は、本発明における「所定の周波数帯域」の一例である。

倍音生成ブロック２５は、量子化ノイズ減衰ブロック２４が出力する周波数ごとの振幅の情報と、ＦＦＴブロック２２が出力した位相の情報とに基づき、倍音を生成し高域補間する倍音生成処理を行う。これにより、倍音生成ブロック２５は、ＣＤ音源の疑似的なアップサンプリングを行う。この倍音生成処理では、公知となっている任意の倍音生成手法を適用してもよい。

ＩＦＦＴブロック２６は、倍音生成処理が行われた周波数領域の音データに対して逆フーリエ高速変換を行うことで、フレームごとの音データを周波数領域から時間領域に変換する。時間窓再合成ブロック２７は、ＩＦＦＴブロック２６が出力した各フレームの音データをオーバーラップ加算することで滑らかに接続させた出力信号Ｓ２を生成する。そして、時間窓再合成ブロック２７は、生成した出力信号Ｓ２を出力装置３へ供給する。

なお、図２に示される構成において、時間窓切出しブロック２１は、本発明における「取得手段」の一例であり、ＦＦＴブロック２２は、本発明における「変換手段」の一例である。また、減衰量制限ブロック２３及び量子化ノイズ減衰ブロック２４は、本発明における「量子化ノイズ制御手段」の一例であり、倍音生成ブロック２５は、本発明における「倍音生成手段」の一例であり、時間窓再合成ブロック２７は、本発明における「出力手段」の一例である。また、各ブロックを構成する変換装置２のＣＰＵなどは、本発明におけるプログラムを実行する「コンピュータ」の一例である。

ここで、最大減衰量算出ブロック３２による最大減衰量の設定方法について具体的に説明する。

図３（Ａ）は、ＲＭＳ値算出ブロック３１が算出したＲＭＳ値をｄＢ値に変換した値と最大減衰量算出ブロック３２が決定する最大減衰量との関係を概略的に示すグラフである。図３（Ａ）の例では、０ｄＢから約−９０ｄＢまでの音量域において、最大減衰量が定められている。なお、約−９０ｄＢは、ＣＤ規格において再現できる音量の最小値に相当する。

図３（Ａ）に示すように、最大減衰量算出ブロック３２は、−９０ｄＢに近付くほど、即ち、音量が小さくなるほど、最大減衰量を大きくする。この場合、例えば、最大減衰量算出ブロック３２は、予め記憶された図３（Ａ）に相当する式又はテーブル等を参照し、ＲＭＳ値算出ブロック３１が算出したＲＭＳ値又は当該ＲＭＳ値をｄＢ値に変換した値から最大減衰量を決定する。これにより、入力信号Ｓ１の入力レベルが小さいほど減衰量を大きくし、本来必要な入力信号の減衰を好適に低減しつつ、量子化ノイズを効果的に減衰させることができる。この効果については、［効果］のセクションで詳しく説明する。

なお、最大減衰量と音量との関係は、図３（Ａ）に示すグラフに示される関係に限定されず、音量が小さいほど最大減衰量が大きくなる関係であればよく、例えば直線グラフにより示される関係であってもよい。

次に、量子化ノイズ減衰ブロック２４による量子化ノイズ減衰処理の具体例について説明する。

図３（Ｂ）は、時間窓切出しブロック２１により切り出された音データの周波数領域での波形を示す。図３（Ｂ）において、実線は量子化ノイズ減衰ブロック２４による量子化ノイズ減衰処理前の波形を示し、破線は量子化ノイズ減衰処理後の波形を示す。

図３（Ｂ）に示すように、量子化ノイズ減衰ブロック２４は、ＣＤ規格において再現できる最小音量である−９０．３ｄＢ未満の音量となる周波数の信号レベルを、減衰量制限ブロック２３が決定した最大減衰量を超えないように減衰させている。ここでは、一例として、量子化ノイズ減衰ブロック２４は、対象の周波数帯域において、−９０．３ｄＢと波形の信号レベルとの差分を減衰量として算出し、かつ、算出した減衰量が最大減衰量を超える場合には最大減衰量を適用すべき減衰量とする。これにより、量子化ノイズ減衰ブロック２４は、波形が不連続になるのを防ぎつつ、好適に量子化ノイズを減衰させることができる。

［効果］
次に、本実施例による効果について、図４〜図９を参照して補足説明する。

図４（Ａ）は、ハイレゾ規格（２４ビットの量子化ビット）により正弦波の音データを量子化した信号波形を示し、図４（Ｂ）は、ＣＤ規格（１６ビットの量子化ビット）により正弦波の音データを量子化した信号波形を示す。また、図４（Ｃ）は、図４（Ａ）の音データの周波数特性を示し、図４（Ｄ）は、図４（Ｂ）の音データの周波数特性を示す。

図４（Ｂ）に示すように、ＣＤ規格の場合には、小さい音などが階段状の信号となっている。これにより、図４（Ｄ）に示すように、ＣＤ規格の場合には、２０ｋＨｚ以下の可聴周波数帯域においても、ハイレゾ規格（ここでは２４ビット）での量子化では殆ど現れない量子化ノイズが多く発生している。一方、ハイレゾ規格の場合、量子化ビット数が高いことにより滑らかな信号波形となっており（図４（Ａ）参照）、量子化ノイズが殆ど発生していない（図４（Ｃ）参照）。

図５は、正弦波である元の音データの周波数及び音量の組合せを変化させた場合に、ＣＤ規格において発生する量子化ノイズの聴感を定量的に表したグラフである。図５では、正弦波である元の音データの周波数及び音量の任意の各組合せに対して発生する量子化ノイズを算出し、当該量子化ノイズにラウドネス曲線などから導出される聴感特性を乗じることで、量子化ノイズの聴感を定量的に求めて可視化している。図５では、色が濃い領域ほど量子化ノイズが聴こえ易い（即ちハイレゾ規格とＣＤ規格との違いが分かりやすい）領域であることを示す。なお、出願人は、聴感実験を行ったところ、図５のグラフの傾向と同様の聴感結果を得ている。

図５のグラフによれば、入力信号の音量及び周波数が小さいほど、量子化ノイズが聴き取りやすくなる傾向があり、特に約−７０ｄＢ以下の音量領域であって約１ｋＨｚ以下の低周波数帯域において量子化ノイズを聴き取りやすいことが把握される。従って、ＣＤ規格の場合には、低音量領域かつ低周波数帯域において、量子化ノイズに起因して音質が劣化していると推定される。このことから、入力信号Ｓ１の入力レベルが低いほど、または、入力信号Ｓ１の周波数が低いほど、量子化ノイズを減衰させる必要性が高いと考えられる。さらには、入力信号Ｓ１の入力レベルと入力信号Ｓ１の周波数の双方が低いほど、減衰させる必要性が高いと考えられる。

ここで、量子化ノイズの減衰処理において、最大減衰量を設けず、入力信号Ｓ１の入力レベルの大小によらず一様に振幅を減衰させたときの影響について説明する。

図６（Ａ）は、入力レベルが比較的大きい入力信号Ｓ１の周波数特性を示し、図６（Ｂ）は、図６（Ａ）に示す周波数特性を有する入力信号Ｓ１に対して窓関数を適用してフーリエ変換を行った後（即ち量子化ノイズ減衰処理前）の波形である。また、図７（Ａ）は、図６（Ｂ）の波形に対して−９０．３ｄＢ未満となる周波数を一様に減衰させる量子化ノイズ減衰処理を行った後の波形を示し、図７（Ｂ）は、図７（Ａ）に示す波形から生成される出力信号Ｓ２の周波数特性の波形を示す。

図６（Ａ）、（Ｂ）に示すように、入力信号Ｓ１の入力レベルが比較的大きいときには、窓関数を適用することにより、ピークとなる波形部分の裾野が広がることになる。そして、図７（Ａ）に示すように、−９０．３ｄＢ未満となる周波数を入力信号Ｓ１の入力レベルによらずに一様に減衰させる量子化ノイズ減衰処理を行った場合には、上述の裾野部分についても量子化ノイズと共に減衰してしまう。この裾野部分については、ＩＦＦＴブロック２６及び時間窓再合成ブロック２７において入力信号に含まれていた量子化ノイズ以外の主信号を出力信号Ｓ２として正しく元に戻すために本来必要な情報であるため、図７（Ｂ）に示すように、出力信号Ｓ２には、上述の裾野部分の減衰に起因したノイズが発生することになる。

このように、入力信号Ｓ１の入力レベルが比較的大きいときに最大減衰量を設けることなく量子化ノイズ減衰処理を行った場合、当該量子化ノイズ減衰処理により本来必要な信号についても減衰させてしまい、結果として音質が劣化する可能性がある。

図８（Ａ）は、入力レベルが比較的小さい入力信号Ｓ１の周波数特性を示し、図８（Ｂ）は、図８（Ａ）に示す周波数特性を有する入力信号Ｓ１に対して窓関数を適用してフーリエ変換を行った後（即ち量子化ノイズ減衰処理前）の波形である。また、図９（Ａ）は、図８（Ｂ）の波形に対して−９０．３ｄＢ未満となる周波数を一様に減衰させる量子化ノイズ減衰処理を行った後の波形を示し、図９（Ｂ）は、図９（Ａ）に示す波形から生成される出力信号Ｓ２の周波数特性を示す。

図８（Ａ）、（Ｂ）に示すように、入力信号Ｓ１の入力レベルが比較的小さいときには、窓関数を適用してフーリエ変換を行った場合であっても、ピークとなる波形部分の裾野は、低音量の領域まで広く生じない。従って、この場合、図９（Ａ）に示すように、−９０．３ｄＢ未満となる周波数を減衰させる量子化ノイズ減衰処理を行った場合であっても、上述した裾野部分の減衰範囲が少ない。従って、この場合、図９（Ｂ）に示すように、出力信号Ｓ２には量子化ノイズ減衰処理によるノイズが殆ど発生していない。

このように、入力信号Ｓ１の入力レベルが比較的小さいときに量子化ノイズ減衰処理を行った場合には、本来必要な入力信号を減衰させることなく好適に量子化ノイズを減衰させることができる。また、図５を参照して説明したように、入力信号Ｓ１の入力レベルが小さいほど、量子化ノイズが聴き取りやすいため、量子化ノイズを減衰させる必要性が高い。以上を勘案し、本実施例では、変換装置２は、入力信号Ｓ１の入力レベルが小さいほど最大減衰量を大きく設定する。これにより、変換装置２は、本来必要な入力信号の減衰を好適に低減しつつ、量子化ノイズを効果的に減衰させることができる。

以上説明したように、変換装置２の時間窓切出しブロック２１は、量子化が行われた音データである入力信号Ｓ１を取得し、所定時間間隔ごとに音データの切出しを行う。そして、減衰量制限ブロック２３は、切り出されたフレームごとの音データの音量に基づいて最大減衰量を決定し、量子化ノイズ減衰ブロック２４は、減衰量制限ブロック２３が決定した最大減衰量に基づき、入力信号Ｓ１の周波数領域での振幅に対する減衰量（即ち量子化ノイズに対する制御量）を決定する。これにより、変換装置２は、本来必要な入力信号の減衰を好適に低減しつつ、可聴域にある量子化ノイズを効果的に減衰させることができる。

［変形例］
次に、本実施例に好適な変形例について説明する。以下の変形例は、任意に組み合わせて上述の実施例に適用してもよい。

（変形例１）
上述の実施例では、一例として、最大減衰量算出ブロック３２は、フレームごとの平均的な入力レベルに相当するＲＭＳ値に基づき各フレームに対する最大減衰量を決定した。他の例として、最大減衰量算出ブロック３２は、上述のＲＭＳ値に加えて、フレームごとの周波数をさらに勘案して各フレームの最大減衰量を決定してもよい。

図１０は、本変形例に係る変換装置２のブロック構成を示す。図１０に示すように、変換装置２の減衰量制限ブロック２３は、ＲＭＳ値算出ブロック３１及び最大減衰量算出ブロック３２に加えて、周波数重心算出ブロック３３を有する。ここで、周波数重心算出ブロック３３は、時間窓切出しブロック２１によってフレームごとに切出された入力信号Ｓ１をＦＦＴブロック２２がフーリエ変換を行うことで得られた周波数スペクトルに基づき周波数の重心（即ちスペクトル重心）を算出する。そして、周波数重心算出ブロック３３は、算出したスペクトル重心の情報を最大減衰量算出ブロック３２へ供給する。

最大減衰量算出ブロック３２は、ＲＭＳ値算出ブロック３１から得られるＲＭＳ値と、周波数重心算出ブロック３３から得られるスペクトル重心とに基づき、最大減衰量を決定する。この場合、例えば、最大減衰量算出ブロック３２は、予め変換装置２のメモリに記憶されたテーブル又は式を参照し、ＲＭＳ値が低いほど最大減衰量を高く設定し、かつ、スペクトル重心が低い周波数であるほど最大減衰量を高く設定する。

図５を参照して説明したように、量子化ノイズは、周波数が低い入力信号ほど聴こえ易い傾向がある。よって、本変形例によれば、変換装置２は、スペクトル重心が低い周波数であるほど最大減衰量を高く設定することで、聴こえ易い量子化ノイズを効果的に減衰させ、音質を好適に向上させることができる。なお、上記の変形例ではスペクトルの中心をフレームごとに算出したが、所定の時間長でよく、例えば楽曲一曲分の重心を算出しても良い。

（変形例２）
実施例では、ＣＤ規格の入力信号Ｓ１をハイレゾ規格の出力信号Ｓ２にアップコンバートする例を示したが、本発明が適用可能な例はこれに限定されない。

例えば、変換装置２は、ＭＰ３等の音源の入力信号Ｓ１をＣＤ規格又はハイレゾ規格並みのスペックを有する出力信号Ｓ２に変換するものであってもよい。この場合、変換装置２は、入力信号Ｓ１のデコードを行った後、図２等に示される各処理ブロックの処理を実行することで、量子化ノイズの減衰及び倍音生成などを行う。この場合、変換装置２の量子化ノイズ減衰ブロック２４は、入力信号Ｓ１が採用する規格において再現できる最小音量（実施例では−９０．３ｄＢ）未満の音量については量子化ノイズに起因して発生したものと推定し、最小音量以下の音量となる周波数の信号レベルを減衰させる。このように、本発明は、量子化ビット数が高い規格にアップコンバートする種々の処理に好適に適用される。

（変形例３）
実施例では、量子化ノイズを判別する音量を−９０．３ｄＢに設定する例を示したが、本発明が適用可能な例はこれに限らず、時間窓や周波数変換の条件に応じて量子化ノイズを判別する音量を調整してもよい。

（変形例４）
実施例では、図２の減衰量制限ブロック２３の説明において、時間窓切出しブロック２１から供給される音データの全周波数帯域の信号レベルの大きさに基づいて、量子化ノイズ減衰ブロック２４において減衰させる周波数領域での振幅に対する最大減衰量を決定する例を示したが、最大減衰量の決定方法はこれに限定されない。

例えば、最大減衰量算出ブロック３２が量子化ノイズ減衰処理を行なう際に、時間窓切出しブロック２１から供給される音データを、ある周波数より大きい帯域と当該周波数以下の帯域とに分割し、それぞれの帯域におけるＲＭＳ値又は当該ＲＭＳ値をｄＢ値に変換した値から、分割したそれぞれの帯域において適用すべき最大減衰量を決定することも可能である。

具体的には、図１１（Ａ）に示すような波形を示す信号において、破線４１で囲われた周波数帯域と、そうでない周波数帯域とに分割する。本例では、周波数が２０００Ｈｚより大きい帯域と、２０００Ｈｚ以下の帯域とに分割している。この際、２０００Ｈｚより大きい帯域におけるＲＭＳ値は、２０００Ｈｚ以下の帯域におけるＲＭＳ値より小さくなる。したがって、２０００Ｈｚより大きい帯域における最大減衰量は、２０００Ｈｚ以下の帯域における最大減衰量より大きくなる。

本実施例では、２０００Ｈｚを基準として周波数帯域を２つに分割したが、本発明はこれに限定されるものではない。図１１（Ｂ）に示すように、周波数帯域は１０００Ｈｚと１００００Ｈｚを基準として３つ（破線４２で囲われた周波数帯域、一点鎖線４３で囲われた周波数帯域、それ以外の周波数帯域）に分割されてもよいし、３以上の帯域に分割されてもよい。このように、周波数帯域を分ける基準となる周波数の値や分割後の帯域数は、適宜変更可能なものである。そして、いずれの場合においても、最大減衰量算出ブロック３２は、分割したそれぞれの帯域におけるＲＭＳ値又は当該ＲＭＳ値をｄＢ値に変換した値から、分割したそれぞれの帯域において適用すべき最大減衰量を決定する。

１入力装置
２変換装置
３出力装置
１００音出力システム

Claims

量子化が行われた音データを取得する取得手段と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段と、
を備え、
前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する信号処理装置。
前記量子化ノイズ制御手段は、前記音量が小さいほど、前記最大減衰量を大きくする請求項１に記載の信号処理装置。
前記量子化ノイズ制御手段は、前記音量と前記音データの周波数とに基づいて、前記最大減衰量を決定する請求項１または２に記載の信号処理装置。
前記量子化ノイズ制御手段は、前記周波数が低いほど、前記最大減衰量を大きくする請求項３に記載の信号処理装置。
前記音データの時間波形を周波数領域へ変換する変換手段をさらに備え、
前記量子化ノイズ制御手段は、前記周波数領域の振幅を調整することで減衰を行う請求項１〜４のいずれか一項に記載の信号処理装置。
前記変換手段は、所定時間間隔により切り出した前記音データの時間波形を周波数領域へ変換する請求項５に記載の信号処理装置。
前記量子化ノイズ制御手段により減衰された前記音データの倍音生成を行う倍音生成手段と、
前記倍音生成が行われた音データを出力する出力手段と、
をさらに備えることを特徴とする請求項１〜６のいずれか一項に記載の信号処理装置。
信号処理装置が実行する制御方法であって、
量子化が行われた音データを取得する取得工程と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御工程と、
を有し、
前記量子化ノイズ制御工程は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定する制御方法。
コンピュータが実行するプログラムであって、
量子化が行われた音データを取得する取得手段と、
前記音データの音量が固定値である閾値未満となる周波数帯域において前記音データの信号レベルを減衰させる量子化ノイズ制御手段
として前記コンピュータを機能させ、
前記量子化ノイズ制御手段は、前記音量に基づいて、前記信号レベルを減衰させる減衰量の上限である最大減衰量を決定するプログラム。
請求項９に記載のプログラムを記憶した記憶媒体。