JP4760278B2 - Interpolation device, audio playback device, interpolation method, and interpolation program - Google Patents
Interpolation device, audio playback device, interpolation method, and interpolation program Download PDFInfo
- Publication number
- JP4760278B2 JP4760278B2 JP2005291261A JP2005291261A JP4760278B2 JP 4760278 B2 JP4760278 B2 JP 4760278B2 JP 2005291261 A JP2005291261 A JP 2005291261A JP 2005291261 A JP2005291261 A JP 2005291261A JP 4760278 B2 JP4760278 B2 JP 4760278B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- band
- waveform data
- audio waveform
- subbands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、補間装置、オーディオ再生装置、補間方法および補間プログラムに関する。 The present invention relates to an interpolation device, an audio playback device, an interpolation method, and an interpolation program.
特許文献1は、オーディオ信号再生装置を開示する。このオーディオ信号再生装置では、高域音信号発生手段が、高域音信号を発生し、信号重畳手段が、D/A変換手段から出力されるアナログオーディオ信号に、この高域音信号を重畳する。高域音信号発生手段が生成する高域音信号は、アナログオーディオ信号のカットオフ周波数を越える周波数成分を有するものであり、ゆらぎ成分を有することもある。
音楽などのデジタル記録および再生は、一般化している。音楽などをデジタル記録する場合、音楽の波形信号をサンプリング周波数でサンプリングし、サンプリングにより得られる量子化ビットのデータを記録することになる。 Digital recording and playback of music and the like is common. When digitally recording music or the like, a waveform signal of music is sampled at a sampling frequency, and quantized bit data obtained by sampling is recorded.
音楽などのデジタル記録には、CD−DA(Compact Disc Digital Audio)が用いられてきた。CD−DAでは、サンプリング周波数は、44.1kHzであり、量子化ビットは16ビットである。人が聞き取れる音の周波数は、20kHz程度であると言われている。サンプリング周波数を44.1kHzとすることで、CD−DAでは、約22kHzの周波数成分までをデジタル化することができる。人が聞き取れる音の周波数帯(たとえば0〜20kHz)をカバーすることができる。 CD-DA (Compact Disc Digital Audio) has been used for digital recording of music and the like. In CD-DA, the sampling frequency is 44.1 kHz, and the quantization bit is 16 bits. It is said that the frequency of sounds that humans can hear is about 20 kHz. By setting the sampling frequency to 44.1 kHz, the CD-DA can digitize up to a frequency component of about 22 kHz. It is possible to cover a frequency band (for example, 0 to 20 kHz) of a sound that can be heard by a person.
しかしながら、このように人の聞き取ることができると言われている音域をカバーする音質であったとしても、CD−DAの再生音に違和感を訴えることがある。人によっては、音のツヤが無いとか、音がこもっているとかなどと、再生音に違和感を訴えることがある。特に、クラシックやオーケストラなどの多くのアコースティック楽器を用いた楽曲を聞く人に、再生音に違和感を訴える人が多いように見受けられる。 However, even if the sound quality covers the sound range that is said to be audible to humans in this way, it may appeal to the reproduced sound of the CD-DA. Some people complain of a sense of incongruity with the playback sound, such as lack of luster or sound. In particular, it seems that there are many people who complain of a sense of incongruity in the reproduced sound when listening to music using many acoustic instruments such as classics and orchestras.
近年、新たな音楽のデジタル記録方式が提案され、実用化されている。たとえば、SACD(スーパーオーディオCD)である。SACDでは、DSD(ダイレクト・ストリーム・デジタル)信号を記録再生する。DSD信号のサンプリング周波数は、2822.4kHzである。これにより、約80〜100kHz程度までの音の周波数成分をデジタル化することができる。 In recent years, a new music digital recording system has been proposed and put into practical use. For example, SACD (Super Audio CD). In SACD, a DSD (direct stream digital) signal is recorded and reproduced. The sampling frequency of the DSD signal is 2822.4 kHz. Thereby, the frequency component of the sound up to about 80 to 100 kHz can be digitized.
このように次世代のデジタル記録方式が出現し、音楽のデジタル記録方式の世代交代が図られた場合、従来のCD−DAで記録された楽曲は、音質が悪いデータとなり、その利用価値が低下してしまう可能性が生じている。 In this way, when the next generation digital recording system appears and the generation of music digital recording system is changed, the music recorded with the conventional CD-DA becomes data with poor sound quality, and its utility value decreases. There is a possibility that it will.
そこで、特許文献1に記載される技術を利用して、従来のCD−DAで記録された楽曲の高音質化を図ることが考えられる。しかしながら、特許文献1では、オーバサンプリングデジタルローパスフィルタの出力オーディオ信号に、それと関連が無い高域音信号を重畳している。この高周波成分は、高域音信号発生手段により生成されるものであり、出力オーディオ信号からすれば、ノイズ的な音質である。そして、原信号に、このノイズ的な高周波成分を高周波成分として加えたとしても、その音質が向上するとはいえない。
Therefore, it is conceivable to improve the sound quality of the music recorded by the conventional CD-DA using the technique described in
本発明は、高周波帯域に楽器などの倍音成分を好適に補間し、これにより音質を向上することができる補間装置、オーディオ再生装置、補間方法および補間プログラムを得ることを目的とする。 An object of the present invention is to obtain an interpolation device, an audio reproduction device, an interpolation method, and an interpolation program that can suitably interpolate a harmonic component such as a musical instrument in a high frequency band and thereby improve sound quality.
本発明に係る補間装置は、可聴帯域の周波数成分を有する入力オーディオ波形データが入力され、このオーディオ波形データのサンプリング周波数を上げるアップサンプラと、アップサンプラによりアップサンプリングされたオーディオ波形データから、少なくとも入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成する分割フィルタバンクと、分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間する補間処理手段と、相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成する合成フィルタバンクと、を有するものである。 The interpolating apparatus according to the present invention receives input audio waveform data having frequency components in the audible band, and inputs at least an input from an upsampler for increasing the sampling frequency of the audio waveform data and audio waveform data upsampled by the upsampler. A divided filter bank that generates a plurality of subbands for each predetermined frequency band within a range of frequency components of the audio waveform data, and an input audio waveform for the plurality of subbands for each predetermined frequency band generated by the divided filter bank The correlation with the highest frequency subband within the range of the frequency component of the data is determined, and there is a correlation based on the frequency component of the predetermined frequency band of the highest frequency subband and the subband correlated therewith. All of the determined subbands And a band there is one correlation, and interpolation processing means for interpolating the entire band is the correlation, as frequency components above the upper limit of the frequency components of the input audio waveform data, a predetermined frequency band of the subband having a correlation from the frequency components of a predetermined frequency band of the audio waveform data frequency component is interpolated, those having a synthesis filter bank for generating audio waveform data.
本発明に係る補間装置は、上述した発明の構成に加えて、アップサンプラに入力されるオーディオ波形データは、その周波数成分の上限が、可聴帯域の上限より10kHz低い周波数以上であるものである。 In addition to the configuration of the above-described invention, the interpolating apparatus according to the present invention has audio waveform data input to the upsampler having an upper limit of the frequency component that is not less than 10 kHz lower than the upper limit of the audible band.
本発明に係る補間装置は、上述した発明の各構成に加えて、分割フィルタバンクが、アップサンプラによりアップサンプリングされたオーディオ波形データの周波数成分の中の、入力オーディオ波形データの周波数成分の範囲内のみについて、所定周波数帯域毎の複数のサブバンドを生成するものである。 In the interpolation device according to the present invention, in addition to the components of the above-described invention, the division filter bank is within the range of the frequency components of the input audio waveform data among the frequency components of the audio waveform data upsampled by the upsampler. Only, a plurality of subbands for each predetermined frequency band are generated.
本発明に係る補間装置は、上述した発明の各構成に加えて、アップサンプラによりアップサンプリングされたオーディオ波形データから、入力オーディオ波形データの周波数成分の上限以下の周波数成分を抽出するローパスフィルタを有し、分割フィルタバンクが、ローパスフィルタにより抽出された周波数成分について、所定周波数帯域毎の複数のサブバンドを生成するものである。 In addition to the components of the above-described invention, the interpolation apparatus according to the present invention has a low-pass filter that extracts frequency components below the upper limit of the frequency components of the input audio waveform data from the audio waveform data upsampled by the upsampler. The division filter bank generates a plurality of subbands for each predetermined frequency band for the frequency components extracted by the low-pass filter.
本発明に係る補間装置は、上述した発明の各構成に加えて、分割フィルタバンクが、アップサンプラによりアップサンプリングされたオーディオ波形データの周波数成分の中の、ナイキスト周波数以下のすべての周波数成分について、所定周波数帯域毎の複数のサブバンドを生成するものである。 The interpolation device according to the present invention, in addition to each configuration of the above-described invention, the division filter bank, for all the frequency components below the Nyquist frequency in the frequency components of the audio waveform data upsampled by the upsampler, A plurality of subbands for each predetermined frequency band are generated .
本発明に係る補間装置は、上述した発明の各構成に加えて、補間処理手段が、相関のあるサブバンドを繰り返し補間することで、入力オーディオ波形データの周波数成分の上限から、アップサンプラによりアップサンプリングされたオーディオ波形データのナイキスト周波数までを埋めるものである。 In addition to the components of the above-described invention, the interpolation apparatus according to the present invention is improved by the upsampler from the upper limit of the frequency component of the input audio waveform data by the interpolation processing means repeatedly interpolating correlated subbands. It fills up to the Nyquist frequency of the sampled audio waveform data.
本発明に係る補間装置は、上述した発明の各構成に加えて、補間する成分の強度として、アップサンプラに入力される入力オーディオ波形データの強度より低い強度を予測する強度分布判断手段と、予測された強度に基づいて、合成フィルタバンクにより生成されるオーディオ波形データの周波数成分の中の、少なくとも補間された周波数成分の強度を変化させる可変イコライザと、を有するものである。 The interpolation apparatus according to the present invention includes, in addition to the components of the above-described invention, intensity distribution determination means for predicting an intensity lower than the intensity of input audio waveform data input to the upsampler as the intensity of the component to be interpolated, And a variable equalizer that changes the intensity of at least the interpolated frequency component among the frequency components of the audio waveform data generated by the synthesis filter bank on the basis of the determined intensity.
本発明に係るオーディオ再生装置は、可聴帯域の周波数成分を有する所定のサンプリング周波数のオーディオ波形データを生成するデコーダと、デコーダにより生成されたオーディオ波形データを入力オーディオ波形データとして高周波側の周波数成分を補間する上述した発明の各構成に係る補間装置と、補間装置により補間されたオーディオ波形データから、オーディオの波形信号を生成するオーディオアンプと、を有するものである。 An audio reproducing apparatus according to the present invention includes a decoder that generates audio waveform data having a predetermined sampling frequency having a frequency component in an audible band, and the audio waveform data generated by the decoder as input audio waveform data. An interpolation apparatus according to each configuration of the above-described invention to be interpolated, and an audio amplifier that generates an audio waveform signal from the audio waveform data interpolated by the interpolation apparatus.
本発明に係る補間方法は、可聴帯域の周波数成分を有するオーディオ波形データの、サンプリング周波数を上げるステップと、サンプリング周波数が上げられたオーディオ波形データから、少なくとも入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成するステップと、分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間するステップと、相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成するステップと、を有するものである。 The interpolation method according to the present invention includes a step of increasing the sampling frequency of audio waveform data having frequency components in the audible band, and at least within the frequency component range of the input audio waveform data from the increased audio waveform data. of, generating a plurality of sub-bands for each predetermined frequency band, for a plurality of subbands of each predetermined frequency band produced by the filter banks, the highest frequency side within the range of the frequency components of the input audio waveform data Based on the frequency components of the predetermined frequency band of the subband on the highest frequency side and the subband correlated therewith, the whole of the plurality of subbands determined to be correlated is determined as one subband. A band with correlation and the entire band with correlation is input A step of interpolating a frequency component above the upper limit of the frequency components of the I Oh waveform data, from the frequency components of a predetermined frequency band of the audio waveform data frequency components are interpolated in a predetermined frequency band of the subband having a correlation, audio waveform Generating data.
本発明に係る補間プログラムは、コンピュータを、可聴帯域の周波数成分を有する入力オーディオ波形データが入力され、このオーディオ波形データのサンプリング周波数を上げるアップサンプラと、アップサンプラによりアップサンプリングされたオーディオ波形データから、少なくとも入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成する分割フィルタバンクと、分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間する補間処理手段と、相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成する合成フィルタバンクと、して機能させるものである。 An interpolation program according to the present invention is input to a computer from input audio waveform data having frequency components in an audible band, an upsampler for increasing the sampling frequency of the audio waveform data, and audio waveform data upsampled by the upsampler. , for the range of the frequency components of at least the input audio waveform data, and division filter bank for generating a plurality of sub-bands for each predetermined frequency band, for a plurality of subbands of each predetermined frequency band produced by the filter banks, Determine the correlation with the highest frequency subband within the range of the frequency component of the input audio waveform data, and correlate based on the frequency component of the predetermined frequency band of the highest frequency subband and the subband correlated therewith. Judge that there is The entire plurality of sub-bands, and the band there is one correlation, and interpolation processing means for interpolating the entire band is the correlation, as frequency components above the upper limit of the frequency components of the input audio waveform data, a correlation It is made to function as a synthesis filter bank that generates audio waveform data from the frequency components of the predetermined frequency band of the audio waveform data interpolated with the frequency components of the predetermined frequency band of the subband.
本発明では、高周波帯域に楽器などの倍音成分を好適に補間し、これにより音質を向上することができる。 In the present invention, harmonic components such as musical instruments are preferably interpolated in the high frequency band, thereby improving the sound quality.
以下、本発明の実施の形態に係る補間装置、オーディオ再生装置、補間方法および補間プログラムを、図面に基づいて説明する。オーディオ再生装置は、ポータブルオーディオプレーヤを例として説明する。補間装置および補間プログラムは、オーディオ再生装置の構成の一部として説明する。補間方法は、オーディオ再生装置の動作の一部として説明する。 Hereinafter, an interpolation device, an audio reproduction device, an interpolation method, and an interpolation program according to embodiments of the present invention will be described with reference to the drawings. The audio playback apparatus will be described by taking a portable audio player as an example. The interpolation device and the interpolation program will be described as a part of the configuration of the audio playback device. The interpolation method will be described as part of the operation of the audio playback device.
実施の形態1.
図1は、本発明の実施の形態1に係るポータブルオーディオプレーヤを示すブロック図である。ポータブルオーディオプレーヤは、ハードディスクドライブ(HDD)1と、デコーダ2と、補間装置としての補間部3と、オーディオアンプ4と、ヘッドホンジャック5と、を有する。補間部3は、本実施の形態では可聴帯域外成分を補間する。
FIG. 1 is a block diagram showing a portable audio player according to
ハードディスクドライブ1は、楽曲などのロスレス圧縮データ6を記憶する。ハードディスクドライブ1は、複数の楽曲のロスレス圧縮データ6を記憶する。
The
ロスレス圧縮データ6は、CD(Compact Disc)などでの楽曲記録に使用されるリニアPCM(Pulse Code Modulation)データへ可逆的に変換可能な楽曲データであり、且つ、リニアPCMデータより少ないデータ量のものである。 The lossless compressed data 6 is music data that can be reversibly converted to linear PCM (Pulse Code Modulation) data used for music recording on a CD (Compact Disc) or the like, and has a smaller data amount than the linear PCM data. Is.
オーディオ波形データの一種としてのリニアPCMデータは、楽曲などを一定時間ごとにサンプリングしたデータである。CD用のリニアPCMデータは、44.1kHzのサンプリング周波数でサンプリングしたデータである。この場合、サンプリング周波数の半分の約22kHzのナイキスト周波数までの周波数成分をデータ化することができる。人の可聴帯域の上限は、約20kHzと言われている。CD用のリニアPCMデータは、この一般的な人の可聴帯域をカバーする。22kHz以上の周波数成分、つまり可聴帯域外の高周波成分は、基本的に含まれない。また、CD用のリニアPCMデータの量子化ビットは、16ビットである。 Linear PCM data as one type of audio waveform data is data obtained by sampling music and the like at regular intervals. The linear PCM data for CD is data sampled at a sampling frequency of 44.1 kHz. In this case, frequency components up to about 22 kHz Nyquist frequency, which is half the sampling frequency, can be converted into data. The upper limit of the human audible band is said to be about 20 kHz. The linear PCM data for CD covers this general human audible band. A frequency component of 22 kHz or higher, that is, a high frequency component outside the audible band is basically not included. Further, the quantization bit of the linear PCM data for CD is 16 bits.
なお、ロスレス圧縮データ6は、ハードディスクドライブ1以外の記憶装置、たとえば半導体メモリなどに記憶されていてもよい。
The lossless compressed data 6 may be stored in a storage device other than the
デコーダ2は、ロスレス圧縮データ6をデコードし、リニアPCMデータを生成する。デコーダ2が生成するリニアPCMデータは、量子化ビットが16ビットであり、且つ、44.1kHzの周波数である。
The
図2は、図1中の補間部3を示すブロック図である。補間部3は、アップサンプラ11と、分割フィルタバンクとしての入力帯域分割フィルタバンク12と、補間処理手段としての補間処理部13と、合成フィルタバンクとしての出力帯域合成フィルタバンク14と、可変イコライザとしての帯域別可変イコライザ15と、入力信号周波数領域変換部16と、予測多項式生成部17と、強度分布判断手段としての電力分布判断部18と、を有する。
FIG. 2 is a block diagram showing the
なお、補間部3は、図1に示すように、DSP(Digital Signal Processor)7により実現される。DSP7は、プログラムを実行するコンピュータの一種であり、たとえば補間プログラムを実行することで、補間部3を実現する。この補間プログラムは、DSP7の図示外の記憶部に予め記憶された状態でポータブルオーディオプレーヤとともにユーザに提供されても、ポータブルオーディオプレーヤとは別にユーザに提供されて所定の保存処理によりDSP7の図示外の記憶部に記憶されてもよい。補間プログラムを、ポータブルオーディオプレーヤとは別にユーザへ提供する媒体としては、たとえばインターネット、電話通信網などの伝送媒体や、CD、半導体メモリなどのコンピュータ読取り可能な記憶媒体などがある。DSP7は、補間部3とともに、デコーダ2やオーディオアンプ4を実現するものであってもよい。
The
アップサンプラ11には、リニアPCMデータが入力される。アップサンプラ11は、リニアPCMデータをアップサンプリングし、サンプリング周波数が88.2kHzであるリニアPCMデータを生成する。リニアPCMデータのサンプリング周波数は、2倍になる。
Linear PCM data is input to the
入力帯域分割フィルタバンク12は、周波数帯域毎の情報を生成する。なお、入力帯域分割フィルタバンク12は、アップサンプラ11によりアップサンプリングされるリニアPCMデータの周波数成分の中の、アップサンプラ11に入力されるリニアPCMデータの周波数成分の範囲(つまり、補間部3の入力帯域である0〜22kHz)内のみについて、周波数帯域毎の情報を生成する。
The input band
また、入力帯域分割フィルタバンク12は、生成した周波数帯域毎の情報から、複数のサブバンドの情報を生成する。サブバンドとは、ある帯域をたとえば均等の帯域幅を有する複数の帯域に分けたときの各帯域である。ここでは、アップサンプラ11によりアップサンプリングされるリニアPCMデータの周波数成分(0〜22kHz)が、ある帯域に相当する。サブバンドの情報は、それぞれの周波数帯域内の周波数の情報を有する。
The input band
なお、ある帯域の周波数成分を均等な帯域幅の複数のサブバンドに分ける分割フィルタバンクとしては、たとえば、QMF(Quadrature Mirror Filter)、CQF(Conjugate Quadrature Filter:共役ミラーフィルタ)、DTFなどの各種の分割フィルタバンクがある。 In addition, as a division filter bank that divides a frequency component of a certain band into a plurality of subbands of equal bandwidth, for example, various types such as QMF (Quadrature Mirror Filter), CQF (Conjugate Quadrature Filter), DTF, etc. There is a split filter bank.
補間処理部13には、入力帯域分割フィルタバンク12が生成する複数のサブバンド情報が入力される。補間処理部13は、アップサンプラ11に入力されるリニアPCMデータの周波数成分の上限を含むサブバンドを基準サブバンドとし、この基準サブバンドとその他のすべてのサブバンドとの相関を判断する。ここでは、アップサンプラ11に入力されるリニアPCMデータの周波数成分の上限は、約22kHzである。補間処理部13は、たとえば20〜22kHzのサブバンドを基準サブバンドとして選択する。
A plurality of subband information generated by the input band
また、補間処理部13は、相関があると判断したサブバンドの情報を、入力されるリニアPCMデータに補間する。補間処理部13は、それに入力されるリニアPCMデータの周波数成分の上限(ここでは約22kHz)から、それに入力されるリニアPCMデータのナイキスト周波数(ここでは約44kHz)までに、相関があると判断したサブバンドの情報を繰り返し補間する。
Further, the
出力帯域合成フィルタバンク14は、補間処理部13により補間された複数のサブバンドの情報から、リニアPCMデータを合成により生成する。出力帯域合成フィルタバンク14は、ナイキスト周波数(ここでは約44kHz)までの周波数成分を有するリニアPCMデータを生成する。
The output band
入力信号周波数領域変換部16は、入力されるデータを周波数領域へ変換したデータを出力する。入力信号周波数領域変換部16には、アップサンプラ11に入力されるリニアPCMデータが入力される。入力信号周波数領域変換部16は、リニアPCMデータを周波数領域へ変換する。
The input signal frequency
予測多項式生成部17は、入力信号周波数領域変換部16により変換された周波数領域のデータを解析し、予測多項式を生成する。
The prediction
電力分布判断部18には、予測多項式生成部17が生成した予測多項式と、補間処理部13が生成した補間後の複数のサブバンド情報とが入力される。電力分布判断部18は、補間後の複数のサブバンド情報での周波数帯域毎の強度分布が、その予測した多項式に従う電力強度分布となるように、サブバンド毎の強度補正係数を演算する。
The power
帯域別可変イコライザ15には、出力帯域合成フィルタバンク14が生成したデータが入力される。帯域別可変イコライザ15は、入力されるデータに含まれる周波数帯域毎の強度を、サブバンド毎に、電力分布判断部18が演算したサブバンド毎の強度補正係数に基づいて調整する。なお、この実施の形態において出力帯域合成フィルタバンク14は後述するように0〜44kHzの周波数成分を有するデータを生成する。帯域別可変イコライザ15は、たとえば、このデータの中の22〜44kHzの電力強度をサブバンド毎に調整すればよい。
Data generated by the output band
図1に戻る。補間部3の後段には、オーディオアンプ4が接続される。オーディオアンプ4には、リニアPCMデータが入力される。オーディオアンプ4は、88.2kHzの周波数でサンプリングされたリニアPCMデータから、アナログ波形信号を生成する。アナログ波形信号の振幅は、リニアPCMデータの量子化ビットの値に応じて変化するものになる。オーディオアンプ4は、生成したアナログ波形信号を、ヘッドホンジャック5へ出力する。
Returning to FIG. An
ヘッドホンジャック5には、図示外のヘッドホンプラグが接続可能である。図1では、ヘッドホンジャック5には、スピーカ8に接続されたヘッドホンプラグが装着されている。
A headphone plug (not shown) can be connected to the headphone jack 5. In FIG. 1, a headphone plug connected to a
次に、以上の構成を有するポータブルオーディオプレーヤの動作を説明する。 Next, the operation of the portable audio player having the above configuration will be described.
デコーダ2は、ハードディスクドライブ1からロスレス圧縮データ6を読み込む。なお、デコーダ2は、たとえば、ポータブルオーディオプレーヤの図示外の入力キーの操作などに基づいて選択した楽曲のロスレス圧縮データ6を、ハードディスクドライブ1から読み込むようにすればよい。
The
デコーダ2は、読み込んだロスレス圧縮データ6をデコードし、リニアPCMデータを生成する。デコーダ2は、44.1kHzの周波数でサンプリングした16ビットのリニアPCMデータを生成する。デコーダ2は、生成したリニアPCMデータを補間部3へ出力する。
The
補間部3のアップサンプラ11は、デコーダ2から入力されるリニアPCMデータをアップサンプリングし、88.2kHzのサンプリング周波数にてサンプリングしたリニアPCMデータを生成する。アップサンプラ11は、たとえば、44.1kHzの入力リニアPCMデータの各量子化ビットを、88.2kHzのサンプリング周波数の下で2回続けて出力すればよい。これにより、88.2kHzのサンプリング周波数にてサンプリングしたリニアPCMデータとなる。
The up-
図3は、補間部3におけるPCMデータの周波数成分の模式的な分布図である。図3(A)は、デコーダ2から補間部3へ供給される、44.1kHzの周波数でサンプリングされたリニアPCMデータの周波数成分の模式的な分布図である。デコーダ2から出力されるリニアPCMデータは、0から約22kHzまでの周波数成分を有する。図3(B)は、アップサンプラ11により生成される88.2kHzの周波数でサンプリングされたリニアPCMデータの周波数成分の模式的な分布図である。
FIG. 3 is a schematic distribution diagram of frequency components of PCM data in the
図3(A)および(B)に示すように、アップサンプラ11により2倍の周波数にアップサンプリングされることで、リニアPCMデータには、オリジナルのリニアPCMデータの周波数成分のイメージ成分が含まれる。イメージ成分は、約22〜44kHzに発生している。
As shown in FIGS. 3A and 3B, the linear PCM data includes an image component of the frequency component of the original linear PCM data by being upsampled to twice the frequency by the
アップサンプラ11は、生成したリニアPCMデータを、入力帯域分割フィルタバンク12へ供給する。入力帯域分割フィルタバンク12は、まず、入力されるリニアPCMデータから、所定の周波数帯域毎の情報を生成する。入力帯域分割フィルタバンク12は、たとえば、入力されるリニアPCMデータの周波数成分を複数の帯域に分解し、帯域毎に周期加算をし、さらに、DCT(Discrete Cosine Transform:離散コサイン変換)処理を実行する。これにより、入力帯域分割フィルタバンク12は、0〜22kHzの帯域について、周波数帯域毎の情報を生成する。
The
0〜22kHzの帯域について所定周波数帯域毎の情報を生成した後、入力帯域分割フィルタバンク12は、複数のサブバンドの情報を生成する。たとえば、入力帯域分割フィルタバンク12は、0〜22kHzの帯域を、2kHz毎の均等な帯域幅の複数の帯域に分けて複数のサブバンド情報を生成する。この場合、生成されるサブバンドは、11個になる。
After generating information for each predetermined frequency band for the 0 to 22 kHz band, the input band
図4は、入力帯域分割フィルタバンク12によるサブバンドへの分割処理を模式的に説明する図である。図4の上部の周波数分布は、入力帯域分割フィルタバンク12へ供給されるリニアPCMデータの周波数成分である。リニアPCMデータは、0〜22kHzの帯域に原音の周波数成分を有する。
FIG. 4 is a diagram schematically illustrating the division processing into subbands by the input band
入力帯域分割フィルタバンク12は、この0〜22kHzの原音の帯域を2kHz毎の帯域に分け、2kHzの帯域毎の複数のサブバンドを生成する。図4では、リニアPCMデータの0〜2kHzの帯域に相当する第一サブバンドと、リニアPCMデータの2〜4kHzの帯域に相当する第二サブバンドと、リニアPCMデータの18〜20kHzの帯域に相当する第十サブバンドと、リニアPCMデータの20〜22kHzの帯域に相当する第十一サブバンドとが例示されている。
The input band
入力帯域分割フィルタバンク12は、生成した複数のサブバンドの情報を、補間処理部13へ供給する。補間処理部13は、まず、供給された複数のサブバンドの中の最も高周波側のサブバンドを、基準サブバンドとして選択する。図4に示す複数のサブバンドの場合、補間処理部13は、原音の20〜22kHzの周波数成分に対応する第十一サブバンドを、基準サブバンドとして選択する。
The input band
基準サブバンドを選択した後、補間処理部13は、基準サブバンドとその他のすべてのサブバンド(ここでは第一サブバンドから第十サブバンド)とを順番に比較し、それぞれの相関を判断する。図4に示す第十サブバンドの周波数成分は、3つの倍音成分が顕在して含まれており、第十一サブバンドの周波数成分に類似している。第一サブバンドの周波数成分および第二サブバンドの周波数成分は、第十サブバンドほどには、第十一サブバンドと類似していない。この場合、補間処理部13は、たとえば、第十サブバンドは相関があると判断し、第一サブバンドおよび第二サブバンドは相関がないと判断する。
After selecting the reference subband, the
なお、補間処理部13は、具体的にはたとえば、以下のような処理を実行し、周波数成分の類似に基づいて、基準サブバンドとその他すべてのサブバンドとの相関を判断すればよい。すなわち、補間処理部13は、まず、所定の相関関数に、基準サブバンドともう一つのサブバンドの特性値を入力する。これにより、補間処理部13は、サブバンド同士の相関が無い場合、相関値として0を得て、サブバンド同士の相関が100%ある場合、相関値として1を得て、その間の相関である場合、サブバンド同士の相関の度合いに応じて0〜1の範囲内での相関値を得る。次に、補間処理部13は、所定の相関関数により得た2つのサブバンドの相関値と、たとえば0.8などの所定の閾値とを比較する。そして、補間処理部13は、相関値が所定の閾値以上である場合、相関ありと判断し、相関値が所定の閾値より小さい場合、相関なしと判断する。
Specifically, for example, the
サブバンド同士の相関を判断した後、補間処理部13は、補間処理を開始する。補間処理部13は、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、リニアPCMデータの周波数成分の上限から、リニアPCMデータのナイキスト周波数までに補間する。補間処理部13は、リニアPCMデータの周波数成分の上限から、リニアPCMデータのナイキスト周波数までに、相関がある周波数帯域の情報を繰り返し補間する。
After determining the correlation between the subbands, the
図3(C)は、補間処理部13が生成する複数のサブバンド情報の周波数成分の模式的な分布図である。この図3(C)の周波数成分には、22〜44kHzの間に、図3(B)の周波数成分において相関があると判断された原音の高周波側の帯域が、約2.4回繰り返して補間されている。これにより、補間処理部13が生成する複数のサブバンド情報は、0〜44kHzまでの周波数成分の情報を有する。
FIG. 3C is a schematic distribution diagram of frequency components of a plurality of subband information generated by the
補間処理部13は、補間後の複数のサブバンド情報を、出力帯域合成フィルタバンク14へ供給する。出力帯域合成フィルタバンク14は、複数のサブバンドの合成処理により、供給された複数のサブバンド情報からリニアPCMデータを生成する。出力帯域合成フィルタバンク14は、サンプリング周波数が88.2kHzであり、且つ、0〜44kHzまでの周波数成分を有するリニアPCMデータを生成する。
The
ところで、図2に示すように、デコーダ2が補間部3へ出力するリニアPCMデータは、デコーダ2の他に、図2上段の入力信号周波数領域変換部16へ供給される。入力信号周波数領域変換部16は、入力されるリニアPCMデータを周波数領域へ変換する。
As shown in FIG. 2, the linear PCM data output from the
予測多項式生成部17は、入力信号周波数領域変換部16により変換された周波数領域のデータを解析し、予測多項式を生成する。具体的にはたとえば、予測多項式生成部17は、まず、入力信号周波数領域変換部16により変換された周波数領域のデータを解析し、入力信号周波数領域変換部16に入力されるリニアPCMデータの電力強度(パワー)を得る。次に、電力分布判断部18は、この電力強度と予め設定された所定の聴覚モデルとに基づいて、解析したリニアPCMデータの周波数特性を予測し、その周波数特性の予測多項式を生成する。
The prediction
なお、楽曲などの周波数成分は、全体的に見ると、通常、低周波側において電力強度が高く、高周波側になるほど電力強度が低下する周波数特性を有する。また、電力強度は、全体的に見ると、周波数の上昇に伴ってゆるやかに低下する。したがって、電力分布判断部18は、そのような周波数特性を有する多項式を予測する。
Note that frequency components such as music generally have frequency characteristics in which the power intensity is high on the low frequency side and the power intensity decreases as the frequency becomes higher. In addition, the power intensity generally decreases gradually as the frequency increases. Therefore, the power
電力分布判断部18には、予測多項式生成部17が生成した予測多項式と、補間処理部13が生成した補間後の複数のサブバンド情報とが入力される。電力分布判断部18は、補間後の複数のサブバンド情報での周波数帯域毎の強度分布が、その予測した多項式に従う電力強度分布となるように、周波数帯域毎の強度補正係数を演算する。
The power
具体的にはたとえば、電力分布判断部18は、まず、補間後の複数のサブバンド情報での周波数帯域毎の強度分布の中の0〜22kHzの帯域の強度分布と予測多項式とに基づいて、補間された帯域である22〜44kHzのサブバンド毎の電力強度が、計算した電力強度の分布に従ったものとなるように、サブバンド毎の強度補正係数を演算する。
Specifically, for example, the power
電力分布判断部18が演算したサブバンド毎の強度補正係数は、帯域別可変イコライザ15に供給される。帯域別可変イコライザ15には、この他にも、出力帯域合成フィルタバンク14が生成する図3(C)に基づくリニアPCMデータが入力される。
The intensity correction coefficient for each subband calculated by the power
帯域別可変イコライザ15は、出力帯域合成フィルタバンク14から供給されるリニアPCMデータに、サブバンドに相当する周波数帯域毎に、それぞれのサブバンドの強度補正係数を乗算する。
The band-specific
図3(D)は、帯域別可変イコライザ15が生成するリニアPCMデータの周波数成分の模式的な分布図である。帯域別可変イコライザ15が生成するリニアPCMデータでは、約22〜44kHzの周波数成分の電力強度が低下している。また、原音である約22kHzより低い周波数成分の電力強度と、補間した音である約22kHzより高い周波数成分の電力強度とがゆるやかに連続している。
FIG. 3D is a schematic distribution diagram of frequency components of linear PCM data generated by the band-specific
また、図3(D)の模式的な分布図を、図3(C)の出力帯域合成フィルタバンク14が生成する模式的な分布図と比較すれば明らかなように、補間された可聴帯域外の周波数成分の強度は、アップサンプラ11に入力されるオーディオ波形データの周波数成分を基準として、それよりも低い強度分布となっている。
Further, as apparent from comparing the schematic distribution chart of FIG. 3D with the schematic distribution chart generated by the output band
帯域別可変イコライザ15は、生成したリニアPCMデータを、オーディオアンプ4へ出力する。なお、可聴領域外成分補間部3の帯域別可変イコライザ15が出力するリニアPCMデータは、88.2kHzの周波数でサンプリングされたリニアPCMデータである。また、0〜44kHzの周波数成分を有する。
The band-specific
オーディオアンプ4は、サンプリング周波数が88.2kHzであるリニアPCMデータから、アナログ波形信号を生成する。アナログ波形信号の振幅は、リニアPCMデータのデータに応じたものとなる。オーディオアンプ4は、生成したアナログ波形信号を、ヘッドホンジャック5を介して、スピーカ8へ出力する。スピーカ8は、供給されるアナログ波形信号の波形に従って、図示外の振動板を振動させる。これにより、スピーカ8からは、88.2kHzのサンプリング周波数のリニアPCMデータに基づいて、0から44kHzの周波数成分を有する音を出力する。
The
図5は、デコーダ2が出力するリニアPCMデータのスペクトル強度分布と、補間部3からオーディオアンプ4へ出力されるリニアPCMデータのスペクトル強度分布との一例を示す図である。図5の上部に示すスペクトル強度分布は、デコーダ2が補間部3へ出力するリニアPCMデータのスペクトル強度分布である。図5の下部に示すスペクトル強度分布は、補間部3がオーディオアンプ4へ出力するリニアPCMデータのスペクトル強度分布である。
FIG. 5 is a diagram illustrating an example of the spectral intensity distribution of the linear PCM data output from the
図5に示すように、デコーダ2が補間部3へ出力するリニアPCMデータは、0〜22kHzの可聴帯域の周波数成分のみを有する。これに対して、補間部3がオーディオアンプ4へ出力するリニアPCMデータは、0〜44kHzの周波数成分を有する。約22〜44kHzの可聴帯域外の周波数成分が補間されている。
As shown in FIG. 5, the linear PCM data output from the
また、補間部3がオーディオアンプ4へ出力するリニアPCMデータのスペクトル強度分布は、全体に見て周波数が高くなるほど自然に低くなり、低周波側から高周波側にかけてゆるやかに低下している。原音の周波数成分の強度分布と、補間した周波数成分の強度分布との間に、調和がある。
Further, the spectral intensity distribution of the linear PCM data output from the
さらに、補間部3からオーディオアンプ4へ出力されるリニアPCMデータにおいて、補間された約22〜44kHzの周波数成分には、約12〜22kHzと同様の倍音成分が含まれている。原音の倍音成分の強度分布と、補間した倍音成分の強度分布との間に、自然な調和がある。
Further, in the linear PCM data output from the
なお、このような倍音成分を好適に補間した音質の音をオーディオ評論家に評価してもらったところ、ノイズ的な音質の高周波成分を可聴帯域外に補間した場合とは違って、音質が向上すると結論付けることができた。 In addition, when audio critics evaluated the sound quality that was appropriately interpolated with such overtone components, the sound quality improved, unlike when high frequency components with noisy sound quality were interpolated outside the audible band. I was able to conclude.
以上のように、この実施の形態1では、補間処理部13は、アップサンプラ11に入力される44.1kHzのリニアPCMデータの最も高周波側に相当する帯域のサブバンド(図4中の第十一サブバンド)を基準として、サブバンド同士の相関を判断する。そして、補間処理部13は、相関があるサブバンド(たとえば12〜22kHzなどの可聴帯域の高周波側の部分のサブバンド)の周波数毎の情報を、可聴帯域外の高周波帯域(たとえば22〜44kHz)に補間する。可聴帯域の上限より10kHz低い周波数以上の帯域には、一般的に、楽器などの倍音成分が顕著に含まれる。このように倍音成分が顕著に含まれている周波数成分を可聴帯域外に補間することで、可聴帯域外の高周波帯域には、可聴帯域の高周波側と同様の倍音成分が補間される。
As described above, in the first embodiment, the
また、補間処理部13は、相関があるサブバンドを、アップサンプラ11に入力される44.1kHzのリニアPCMデータの周波数成分の上限(たとえば22kHz)から、アップサンプラ11によりアップサンプリングされたリニアPCMデータのナイキスト周波数(たとえば44kHz)までに、繰り返して補間する。アップサンプリングされたリニアPCMデータには、そのナイキスト周波数までに倍音成分が補間されることになる。倍音成分は、可聴領域からナイキスト周波数までにかけて、自然な調和がとれた状態で連続的に補間されることになる。
Further, the
その結果、デコーダ2により生成されたリニアPCMデータには、可聴帯域外の高周波帯域に、可聴帯域の高周波側と連続して調和がとれた倍音成分が補間される。オーディオアンプ4は、良好な音質となるオーディオの波形信号を生成することができる。音質は向上する。
As a result, in the linear PCM data generated by the
また、この実施の形態1では、補間処理部13が補間した可聴帯域外の周波数成分の強度は、帯域別可変イコライザ15により、アップサンプラ11に入力されるリニアPCMデータの周波数成分を基準として、それよりも低い強度分布とされる。補間後の周波数分布は、低周波側から高周波側にかけて低くなる自然な強度分布となる。可聴領域の高周波部分から可聴領域外にかけて顕著に含まれる倍音成分の分布も、低周波側から高周波側にかけて自然に低下するものとなる。このように倍音成分の調和がオーディオ波形データの全帯域において図られることにより、より良好な音質向上が図られる。
In the first embodiment, the intensity of the frequency component outside the audible band interpolated by the
また、この実施の形態1では、入力帯域分割フィルタバンク12は、アップサンプラ11に入力されるリニアPCMデータの周波数成分の範囲(0〜22kHz)内のみについて、サブバンド情報(周波数帯域毎の情報)を生成する。入力帯域分割フィルタバンク12には、アップサンプラ11が生成したリニアPCMデータが入力される。アップサンプラ11が生成したリニアPCMデータには、原音の周波数成分に加えて、そのイメージ成分が含まれる。また、イメージ成分は、原音の周波数成分より高周波側に含まれる。入力帯域分割フィルタバンク12の処理を上述した原音帯域のみの処理とすることで、後述する実施の形態2のようにアップサンプラ11と入力帯域分割フィルタバンク12との間にローパスフィルタを設ける必要がなくなる。また、入力帯域分割フィルタバンク12は、アップサンプラ11が生成したリニアPCMデータの周波数成分(ここでは0〜44kHz)の中の、低周波数側の半分の周波数成分(つまり、0〜22kHz)についてのみ処理すればよく、その処理負荷は軽減される。
Further, in the first embodiment, the input band
なお、この実施の形態1では、入力帯域分割フィルタバンク12は、アップサンプラ11に入力されるリニアPCMデータの周波数成分の範囲(0〜22kHz)内のみを、複数のサブバンドに分割している。この他にもたとえば、リニアPCMデータを複数のサブバンドに分割する分割フィルタバンクは、アップサンプラ11が生成したリニアPCMデータのナイキスト周波数(たとえば44.2kHz)以下のすべての周波数成分を、複数のサブバンドに分割するものであってもよい。
In the first embodiment, the input band
図6は、この変形例での、補間部3におけるPCMデータの周波数成分の模式的な分布図である。図6(A)は、アップサンプラ11に入力されるリニアPCMデータの周波数成分を示す図である。図6(B)は、アップサンプラ11が生成するリニアPCMデータの周波数成分を示す図である。図6(C)は、補間処理部13が生成するリニアPCMデータの周波数成分を示す図である。図6(D)は、帯域別可変イコライザ15が生成するリニアPCMデータの周波数成分を示す図である。
FIG. 6 is a schematic distribution diagram of frequency components of PCM data in the
この変形例では、図6(B)に示すように、分割フィルタバンクは、ナイキスト周波数(44kHz)までのサブバンド情報を生成し、補間処理部13は、そのすべてのサブバンドについて相関を判断する。このとき、補間処理部13は、原音の帯域中の最も高周波側の帯域に相当するサブバンド(たとえば20〜22kHzのサブバンド)を基準サブバンドとして相関を判断すればよい。そして、補間処理部13は、図6(C)に示すように、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドを可聴帯域外に補間する。
In this modification, as shown in FIG. 6B, the division filter bank generates subband information up to the Nyquist frequency (44 kHz), and the
アップサンプラ11が生成するリニアPCMデータには、図6(B)に示すように、原音成分を写像したイメージ成分が含まれている。このイメージ成分にも、倍音成分が含まれている。補間処理部13は、このイメージ成分のサブバンドを、相関があるサブバンドと判断する。したがって、補間処理部13は、倍音成分のイメージを含むサブバンドを、相関のあるサブバンドと判断し、これを可聴帯域外に補間することになる。補間処理部13が相関があると判断するサブバンドの個数は、略倍増する。図6(C)に示すように、ナイキスト周波数までを相関のあるサブバンドで埋める場合に、その繰り返し回数を減らすことができる。図3(C)では、繰り返し回数が2.4回程度であるが、図6(C)では、1.2回程度である。半減している。
As shown in FIG. 6B, the linear PCM data generated by the
実施の形態2.
図7は、本発明の実施の形態2に係るポータブルオーディオプレーヤの補間部3を示すブロック図である。補間部3は、アップサンプラ11と入力帯域分割フィルタバンク12との間に、LPF(ローパスフィルタ)21を有する。
FIG. 7 is a block diagram showing the
LPF21は、アップサンプラ11から入力されるリニアPCMデータから、低周波成分を抽出し、入力帯域分割フィルタバンク12へ供給する。アップサンプラ11に入力されるサンプリング周波数が44.1kHzのリニアPCMデータのナイキスト周波数(約22kHz)以下の周波数成分を抽出する。
The
上述した以外の図7に示す各構成要素は、実施の形態1の図2中の同名の構成要素と同一であり、同一の符号を付して説明を省略する。また、ポータブルオーディオプレーヤの補間部3以外の構成は、実施の形態1の図1と同様であり、実施の形態1と同一の名称および符号を付して説明を省略する。
The components shown in FIG. 7 other than those described above are the same as the components having the same names in FIG. 2 according to the first embodiment, and the description thereof will be omitted by assigning the same reference numerals. The configuration other than the
次に、以上の構成を有するポータブルオーディオプレーヤの動作を説明する。 Next, the operation of the portable audio player having the above configuration will be described.
アップサンプラ11は、デコーダ2から入力されるリニアPCMデータをアップサンプリングし、88.2kHzのサンプリング周波数にてサンプリングしたリニアPCMデータを生成する。
The
アップサンプラ11がアップサンプリングにより生成したリニアPCMデータは、LPF21へ供給される。LPF21は、約22kHz以下の周波数成分を抽出し、入力帯域分割フィルタバンク12へ供給する。入力帯域分割フィルタバンク12は、まず、入力されるリニアPCMデータから、0〜22kHzの帯域について周波数帯域毎の情報を生成し、次に、複数のサブバンド情報を生成する。
Linear PCM data generated by upsampling by the
上述した以外の実施の形態2に係るポータブルオーディオプレーヤの動作は、実施の形態1のものと同様であり、説明を省略する。 The operations of the portable audio player according to the second embodiment other than those described above are the same as those of the first embodiment, and a description thereof will be omitted.
以上のように、この実施の形態2では、アップサンプラ11と入力帯域分割フィルタバンク12との間に設けられたLPF21が、約22kHz以下の周波数成分を抽出する。そのため、入力帯域分割フィルタバンク12には、図3(B)の周波数成分の中の実線部分のみを供給することができる。
As described above, in the second embodiment, the
なお、この実施の形態2では、LPF21の後段には、0〜22kHzの帯域について複数のサブバンド情報を生成する入力帯域分割フィルタバンク12が設けられている。この他にもたとえば、LPF21の後段には、0〜44kHzの帯域について複数のサブバンド情報を生成する分割フィルタバンクを設けてもよい。この変形例の場合、分割フィルタバンクが複数のサブバンドに分割する帯域と、出力帯域合成フィルタバンク14が合成する帯域とを一致させることができる。分割フィルタバンクと合成フィルタバンクとの組合せとして、帯域が一致している一般的な組合せのものを利用することができる。
In the second embodiment, an input band
以上の各実施の形態は、本発明の好適な実施の形態の例であるが、本発明は、これに限定されるものではなく、発明の要旨を逸脱しない範囲において種々の変形や変更が可能である。 Each of the above embodiments is an example of a preferred embodiment of the present invention, but the present invention is not limited to this, and various modifications and changes can be made without departing from the scope of the invention. It is.
たとえば、上記各実施の形態では、入力帯域分割フィルタバンク12は、それらに入力されるリニアPCMデータの周波数成分を、一定の帯域幅毎の複数のサブバンドに分割している。複数のサブバンドの帯域幅は同じである。この他にもたとえば、入力帯域分割フィルタバンク12は、周波数帯域毎に異なる帯域幅の複数のサブバンドに分割するようにしてもよい。周波数帯域毎にサブバンドの帯域幅を異ならせる方法としては、たとえば、2分割法がある。つまり、この2分割法では、たとえば、まず、入力されるリニアPCMデータの周波数成分を半分に分割し、次に、その半分に分割したものの中の高周波側の周波数成分をさらに半分に分割する。分割される2つの帯域の中の高周波側の周波数成分を順次二分割にする。これにより、サブバンドの帯域幅は、高周波側になるほど狭くなる。なお、出力帯域合成フィルタバンク14は、入力帯域分割フィルタバンク12の分割に対応する構成になる。
For example, in each of the above embodiments, the input band
上記各実施の形態では、補間処理部13は、複数のサブバンドのすべてについて相関を判断している。この他にもたとえば、補間処理部13は、一定の帯域内のサブバンドのみについて相関を判断するようにしてもよい。CDのリニアPCMデータでは、約10kHz以上の周波数成分においてアコースティック楽器の倍音成分が顕著に現われ易い。したがって、補間処理部13は、約10kHz以上のサブバンドのみについて相関を判断するようにしてもよい。また、ポップスなどの楽曲にあっては、16kHz以上の帯域において倍音成分が顕在化することがある。そのため、補間処理部13は、約16kHz以上のサブバンドのみについて相関を判断するようにしてもよい。
In each of the above embodiments, the
さらに他にもたとえば、補間処理部13は、相関を判断する周波数範囲を、可変するものであってもよい。そして、補間処理部13は、たとえば図示外の制御部からの指示に基づいてたとえば10kHz、12kHz、14kHzおよび16kHzの中から選択した周波数以上の帯域のサブバンドについて相関を判断するようにしてもよい。
Furthermore, for example, the
さらに、この制御部は、たとえば楽曲のロスレス圧縮データ6に含まれる楽曲のジャンルなどのタグデータや、ユーザが設定したイコライザの音響効果のジャンルなどに基づいて、周波数帯を指定するようにしてもよい。制御部は、タグデータやイコライザの音響効果設定に基づいて、たとえば、再生する楽曲のジャンルがクラシックであると判断したら10kHz以上を指定し、ポップスであると判断したら16kHzを指定するようにすればよい。 Further, the control unit may specify the frequency band based on tag data such as the genre of music included in the lossless compressed data 6 of the music, the genre of the acoustic effect of the equalizer set by the user, or the like. Good. For example, if the control unit determines that the genre of the music to be played is classic based on the tag data or the equalizer sound effect setting, it specifies 10 kHz or more, and if it determines that it is pop, it specifies 16 kHz. Good.
上記各実施の形態では、ハードディスクドライブ1は楽曲のロスレス圧縮データ6を記憶し、デコーダ2は、このロスレス圧縮データ6からリニアPCMデータを生成している。この他にもたとえば、ハードディスクドライブ1はCD用のリニアPCMデータを記憶し、デコーダ2はこのリニアPCMデータを読み込むものであってもよい。さらに他にもたとえば、ハードディスクドライブ1は、たとえばMP3(MPEG Audio Layer−3 )、AAC(Advanced Audio Coding)、WMA(Windows(登録商標) Media Audio)などの非可逆の圧縮方式で圧縮された圧縮データを記憶し、デコーダ2は、この圧縮データからリニアPCMデータを生成するようにしてもよい。
In each of the above embodiments, the
なお、MP3などの圧縮データでは、リニアPCMデータの高音域(約16kHz以上)のデータなどを間引くことで、音質の劣化を抑えながらデータ量を削減している。したがって、デコーダ2がMP3などの圧縮データを単にデコードするだけでは、デコーダ2が生成するリニアPCMデータには、16kHz以上の周波数成分が含まれなくなる。したがって、MP3などの圧縮データをデコードするデコーダ2は、圧縮データをデコードするとともに、22kHzまでの周波数成分を補間する方がよい。この補間処理には、図2などに示す可聴帯域外補間部3と略同様のブロック構成のものを使用することが可能である。
In compressed data such as MP3, the amount of data is reduced while suppressing deterioration in sound quality by thinning out data in the high sound range (approximately 16 kHz or more) of linear PCM data. Therefore, if the
上記各実施の形態では、補間部3には、ナイキスト周波数(たとえば約22kHz)までの周波数成分を有するリニアPCMデータが入力され、このリニアPCMデータを複数のサブバンドに分割し、その入力データのナイキスト周波数以上の周波数成分を補間している。この他にもたとえば、補間部3には、MP3に基づくリニアPCMデータなどのように、周波数成分の上限がナイキスト周波数より低いリニアPCMデータが入力され、このリニアPCMデータを複数のサブバンドに分割し、その高周波側の成分を補間するようにしてもよい。このように、周波数成分の上限がナイキスト周波数より低いリニアPCMデータが入力される場合、補間部3の入力帯域分割フィルタバンク12がサブバンドに分割する帯域の帯域幅は狭くなる。また、補間部3の出力帯域合成フィルタバンクが補間する帯域の帯域幅は広くなる。
In each of the above embodiments, linear PCM data having a frequency component up to the Nyquist frequency (for example, about 22 kHz) is input to the
また、このようにMP3などの圧縮データに可聴帯域外の高周波成分を補間する場合に、まず可聴帯域の周波数成分を補間し、次に可聴帯域外の周波数成分を補間するようにすることで、ポータブルオーディオプレーヤのデコーダ2以降の構成として、CDやロスレス圧縮データ6の再生のための構成を共通に使用することができる。ポータブルオーディオプレーヤのデコーダ2以降の構成を音源別に設計する必要が無くなり、デコーダ2以前の構成のみを設計することで、ポータブルオーディオプレーヤはMP3などを高音質で再生することができる。ポータブルオーディオプレーヤが高音質で再生することができるデータの種類を、容易に増やすことができる。
In addition, when interpolating high frequency components outside the audible band in the compressed data such as MP3 in this way, by first interpolating the frequency component outside the audible band and then interpolating the frequency component outside the audible band, As a configuration after the
上記各実施の形態では、図2などに示す補間部3は、22kHz以上の帯域の周波数成分を補間している。この他にもたとえば、図2などに示す補間部3は、22kHz以下の、たとえば可聴帯域の周波数成分を併せて補間するものであってもよい。たとえば、図2などに示す補間部3に、周波数成分の上限が約16kHzであるMP3に基づくリニアPCMデータが入力される場合、この補間部3は、16〜44kHzの周波数成分を補間するようにしてもよい。また、図2などに示す補間部3には、MP3など以外の、たとえばFMラジオやAMラジオなどのように帯域が制限されて伝送される音声データをサンプリングしたものが入力されてもよい。
In each of the above embodiments, the
上記各実施の形態では、補間部3は、可聴帯域外の高周波成分を補間しているが、本発明の補間装置は、可聴帯域の高周波成分を補間するものであってもよい。
In each of the above embodiments, the
上記各実施の形態では、オーディオ再生装置は、ポータブルオーディオプレーヤである。この他にもたとえば、オーディオ再生装置は、カーオーディオシステム、カーナビゲーションシステム、家庭用オーディオシステム、CD、DVDなどの再生装置、携帯電話端末、PDAなどの携帯情報端末、音声出力機能を有するパーソナルコンピュータなどであってもよい。 In the above embodiments, the audio playback device is a portable audio player. In addition to this, for example, the audio reproducing apparatus includes a car audio system, a car navigation system, a home audio system, a reproducing apparatus such as a CD and a DVD, a portable information terminal such as a mobile phone terminal and a PDA, and a personal computer having an audio output function. It may be.
本発明は、ポータブルハードディスクプレーヤなどに利用することができる。 The present invention can be used for portable hard disk players and the like.
2 デコーダ
3 補間部(補間装置)
4 オーディオアンプ
11 アップサンプラ
12 入力帯域分割フィルタバンク(分割フィルタバンク)
13 補間処理部(補間処理手段)
14 出力帯域合成フィルタバンク(合成フィルタバンク)
15 帯域別可変イコライザ(可変イコライザ)
18 電力分布判断部(強度分布判断手段)
21 LPF(ローパスフィルタ)
2
4
13 Interpolation processing unit (interpolation processing means)
14 Output Band Synthesis Filter Bank (Synthesis Filter Bank)
15 Variable equalizer by band (variable equalizer)
18 Power distribution determination unit (intensity distribution determination means)
21 LPF (low pass filter)
Claims (10)
上記アップサンプラによりアップサンプリングされたオーディオ波形データから、少なくとも上記入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成する分割フィルタバンクと、
上記分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、上記入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、上記入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間する補間処理手段と、
上記相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成する合成フィルタバンクと、
を有することを特徴とする補間装置。 An upsampler that receives input audio waveform data having an audible frequency component and raises the sampling frequency of the audio waveform data;
A divided filter bank that generates a plurality of subbands for each predetermined frequency band within a range of frequency components of at least the input audio waveform data from the audio waveform data upsampled by the upsampler;
The correlation between the plurality of subbands for each predetermined frequency band generated by the division filter bank and the highest frequency subband within the range of the frequency component of the input audio waveform data is determined, and the highest frequency subband is determined. Based on the frequency components of the predetermined frequency band of the band and the subbands correlated therewith, the entire plurality of subbands determined to be correlated are defined as one correlated band, and the entire correlated band is defined as Interpolation processing means for interpolating as a frequency component above the upper limit of the frequency component of the input audio waveform data ;
A synthesis filter bank that generates audio waveform data from the frequency components of the predetermined frequency band of the audio waveform data interpolated with the frequency components of the predetermined frequency band of the correlated subbands;
An interpolation apparatus characterized by comprising:
を特徴とする請求項1記載の補間装置。 The audio waveform data input to the upsampler is such that the upper limit of the frequency component is at least 10 kHz lower than the upper limit of the audible band,
The interpolating apparatus according to claim 1.
前記分割フィルタバンクは、上記ローパスフィルタにより抽出された周波数成分について、所定周波数帯域毎の複数のサブバンドを生成することを特徴とする請求項1または2記載の補間装置。 A low-pass filter that extracts a frequency component below the upper limit of the frequency component of the input audio waveform data from the audio waveform data up-sampled by the up-sampler;
The interpolation apparatus according to claim 1, wherein the division filter bank generates a plurality of subbands for each predetermined frequency band for the frequency component extracted by the low-pass filter.
を特徴とする請求項1または2記載の補間装置。 The divided filter bank generates a plurality of subbands for each predetermined frequency band for all frequency components below the Nyquist frequency in the frequency components of the audio waveform data upsampled by the upsampler.
The interpolation apparatus according to claim 1 or 2.
を特徴とする請求項1から5の中のいずれか1項記載の補間装置。 The interpolation processing means repeatedly interpolates the correlated subbands to fill from the upper limit of the frequency component of the input audio waveform data to the Nyquist frequency of the audio waveform data upsampled by the upsampler,
Interpolator according to any one among claims 1 to 5, wherein.
上記予測された強度に基づいて、前記合成フィルタバンクにより生成されるオーディオ波形データの周波数成分の中の、少なくとも補間された周波数成分の強度を変化させる可変イコライザと、
を有することを特徴とする請求項1から6の中のいずれか1項記載の補間装置。 Intensity distribution determination means for predicting an intensity lower than the intensity of the input audio waveform data input to the upsampler as the intensity of the component to be interpolated;
A variable equalizer that changes the intensity of at least the interpolated frequency component among the frequency components of the audio waveform data generated by the synthesis filter bank based on the predicted intensity;
Interpolator according to any one among claims 1 to 6, characterized in that it comprises a.
上記デコーダにより生成されたオーディオ波形データを入力オーディオ波形データとして高周波側の周波数成分を補間する請求項1から7の中のいずれか1項記載の補間装置と、 The interpolator according to any one of claims 1 to 7, which interpolates a frequency component on a high frequency side using the audio waveform data generated by the decoder as input audio waveform data,
前記補間装置により補間されたオーディオ波形データから、オーディオの波形信号を生成するオーディオアンプと、 An audio amplifier that generates an audio waveform signal from the audio waveform data interpolated by the interpolation device;
を有することを特徴とするオーディオ再生装置。 An audio playback apparatus comprising:
上記サンプリング周波数が上げられたオーディオ波形データから、少なくとも上記入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成するステップと、 Generating a plurality of subbands for each predetermined frequency band, at least within a range of frequency components of the input audio waveform data, from the audio waveform data having the increased sampling frequency;
上記分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、上記入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、上記入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間するステップと、 The correlation between the plurality of subbands for each predetermined frequency band generated by the division filter bank and the highest frequency subband within the range of the frequency component of the input audio waveform data is determined, and the highest frequency subband is determined. Based on the frequency components of the predetermined frequency band of the band and the subbands correlated therewith, the entire plurality of subbands determined to be correlated are defined as one correlated band, and the entire correlated band is defined as Interpolating as a frequency component above the upper limit of the frequency component of the input audio waveform data;
上記相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成するステップと、 Generating audio waveform data from the frequency components of the predetermined frequency band of the audio waveform data interpolated with the frequency components of the predetermined frequency band of the correlated subbands;
を有することを特徴とする補間方法。 An interpolation method characterized by comprising:
可聴帯域の周波数成分を有する入力オーディオ波形データが入力され、このオーディオ波形データのサンプリング周波数を上げるアップサンプラと、 An upsampler that receives input audio waveform data having an audible frequency component and raises the sampling frequency of the audio waveform data;
上記アップサンプラによりアップサンプリングされたオーディオ波形データから、少なくとも上記入力オーディオ波形データの周波数成分の範囲内についての、所定周波数帯域毎の複数のサブバンドを生成する分割フィルタバンクと、 A divided filter bank that generates a plurality of subbands for each predetermined frequency band within a range of frequency components of at least the input audio waveform data from the audio waveform data upsampled by the upsampler;
上記分割フィルタバンクにより生成された所定周波数帯域毎の複数のサブバンドについて、上記入力オーディオ波形データの周波数成分の範囲内の最も高周波側のサブバンドとの相関を判断し、その最も高周波側のサブバンドおよびそれと相関のあるサブバンドの所定周波数帯域の周波数成分に基づいて、相関があると判断した複数のサブバンドの全体を、1つの相関がある帯域とし、その相関がある帯域の全体を、上記入力オーディオ波形データの周波数成分の上限より上の周波数成分として補間する補間処理手段と、 The correlation between the plurality of subbands for each predetermined frequency band generated by the division filter bank and the highest frequency subband within the range of the frequency component of the input audio waveform data is determined, and the highest frequency subband is determined. Based on the frequency components of the predetermined frequency band of the band and the subbands correlated therewith, the entire plurality of subbands determined to be correlated are defined as one correlated band, and the entire correlated band is defined as Interpolation processing means for interpolating as a frequency component above the upper limit of the frequency component of the input audio waveform data;
上記相関のあるサブバンドの所定周波数帯域の周波数成分が補間されたオーディオ波形データの所定周波数帯域の周波数成分から、オーディオ波形データを生成する合成フィルタバンクと、 A synthesis filter bank that generates audio waveform data from the frequency components of the predetermined frequency band of the audio waveform data interpolated with the frequency components of the predetermined frequency band of the correlated subbands;
して機能させることを特徴とする補間プログラム。 Interpolation program characterized by functioning.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005291261A JP4760278B2 (en) | 2005-10-04 | 2005-10-04 | Interpolation device, audio playback device, interpolation method, and interpolation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005291261A JP4760278B2 (en) | 2005-10-04 | 2005-10-04 | Interpolation device, audio playback device, interpolation method, and interpolation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007101871A JP2007101871A (en) | 2007-04-19 |
JP4760278B2 true JP4760278B2 (en) | 2011-08-31 |
Family
ID=38028879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005291261A Active JP4760278B2 (en) | 2005-10-04 | 2005-10-04 | Interpolation device, audio playback device, interpolation method, and interpolation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4760278B2 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4992621B2 (en) * | 2007-09-13 | 2012-08-08 | 株式会社Jvcケンウッド | Audio playback apparatus, method and program |
TWI484481B (en) * | 2009-05-27 | 2015-05-11 | 杜比國際公司 | Systems and methods for generating a high frequency component of a signal from a low frequency component of the signal, a set-top box, a computer program product and storage medium thereof |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
EP4435779A3 (en) | 2010-01-19 | 2024-10-09 | Dolby International AB | Improved subband block based harmonic transposition |
CN103038819B (en) | 2010-03-09 | 2015-02-18 | 弗兰霍菲尔运输应用研究公司 | Apparatus and method for processing an audio signal using patch border alignment |
MX2012010314A (en) | 2010-03-09 | 2012-09-28 | Fraunhofer Ges Forschung | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals. |
JP5649084B2 (en) | 2010-03-09 | 2015-01-07 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | Apparatus and method for processing transient audio events in an audio signal when changing playback speed or pitch |
JP5480842B2 (en) * | 2011-04-25 | 2014-04-23 | 日本電信電話株式会社 | Clip noise detection device, clip noise detection method, program |
KR101897455B1 (en) | 2012-04-16 | 2018-10-04 | 삼성전자주식회사 | Apparatus and method for enhancement of sound quality |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3538122B2 (en) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | Frequency interpolation device, frequency interpolation method, and recording medium |
JP4254479B2 (en) * | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | Audio band expansion playback device |
-
2005
- 2005-10-04 JP JP2005291261A patent/JP4760278B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007101871A (en) | 2007-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1367566B1 (en) | Source coding enhancement using spectral-band replication | |
WO2003007480A1 (en) | Audio signal decoding device and audio signal encoding device | |
JP2006011456A (en) | Method and device for coding/decoding low-bit rate and computer-readable medium | |
US8180002B2 (en) | Digital signal processing device, digital signal processing method, and digital signal processing program | |
GB2473266A (en) | An improved filter bank | |
JP2004198485A (en) | Device and program for decoding sound encoded signal | |
JP4760278B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
JP2003108197A (en) | Audio signal decoding device and audio signal encoding device | |
JP2010145426A (en) | Audio band extension device | |
JP7262593B2 (en) | High resolution audio encoding | |
JP7150996B2 (en) | High resolution audio encoding | |
JP2013073230A (en) | Audio encoding device | |
JP4627737B2 (en) | Digital data decoding device | |
JP4649351B2 (en) | Digital data decoding device | |
KR20100024727A (en) | Apparatus and method for playing audio sources for portable terminal | |
JP4715385B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
JP4815986B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
JP2003280691A (en) | Voice processing method and voice processor | |
JP2005114813A (en) | Audio signal reproducing device and reproducing method | |
JP4271588B2 (en) | Encoding method and encoding apparatus for digital data | |
JP4441988B2 (en) | Encoding apparatus and encoding method | |
JP2004362721A (en) | Method and device for creating data, method and device for reproducing data, and program | |
JP4441989B2 (en) | Encoding apparatus and encoding method | |
JP7266689B2 (en) | High resolution audio encoding | |
JP7130878B2 (en) | High resolution audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081002 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4760278 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |