JP2008033211A - 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム - Google Patents
付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム Download PDFInfo
- Publication number
- JP2008033211A JP2008033211A JP2006260600A JP2006260600A JP2008033211A JP 2008033211 A JP2008033211 A JP 2008033211A JP 2006260600 A JP2006260600 A JP 2006260600A JP 2006260600 A JP2006260600 A JP 2006260600A JP 2008033211 A JP2008033211 A JP 2008033211A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- additional signal
- additional
- unit
- profile information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 title claims description 254
- 238000012545 processing Methods 0.000 claims abstract description 434
- 238000006243 chemical reaction Methods 0.000 claims abstract description 61
- 230000008569 process Effects 0.000 claims description 185
- 238000001514 detection method Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 description 293
- 238000007906 compression Methods 0.000 description 75
- 230000006835 compression Effects 0.000 description 73
- 238000007726 management method Methods 0.000 description 61
- 238000013139 quantization Methods 0.000 description 45
- 238000010586 diagram Methods 0.000 description 39
- 230000015654 memory Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 11
- 238000003860 storage Methods 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 10
- 238000007796 conventional method Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000002427 irreversible effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】信号変換処理された変換後信号から信号変換処理時の除去分を補うために必要な情報を生成して当該変換後信号とは別個独立に管理し、必要に応じて利用できるようにする。
【解決手段】変換後信号から、当該変換後信号の信号変換処理時において除去された高域部分の信号を付加信号として生成し、また、当該付加信号についての固有情報からなるプロファイル情報を生成する。そして、管理テーブル作成処理部223により、変換後信号と、対応する付加信号とプロファイル情報とを関連付けする管理テーブルを作成する。これら付加信号、プロファイル情報、管理テーブルのそれぞれを、対応する付加信号記録部、プロファイル情報記録部、管理テーブル記録部を通じて記録媒体に記録する。
【選択図】図1
【解決手段】変換後信号から、当該変換後信号の信号変換処理時において除去された高域部分の信号を付加信号として生成し、また、当該付加信号についての固有情報からなるプロファイル情報を生成する。そして、管理テーブル作成処理部223により、変換後信号と、対応する付加信号とプロファイル情報とを関連付けする管理テーブルを作成する。これら付加信号、プロファイル情報、管理テーブルのそれぞれを、対応する付加信号記録部、プロファイル情報記録部、管理テーブル記録部を通じて記録媒体に記録する。
【選択図】図1
Description
この発明は、例えば、周波数相関符号化等の不可逆圧縮方式が用いられて圧縮符号化処理等の信号変換処理時において除去された信号分を補うために必要な情報を生成して管理する装置、方法、プログラム、及び、信号変換処理されて形成されや信号を復元処理する装置、方法に関する。
音声信号の圧縮処理は、「量子化(PCM(Pulse Code Modulation)信号)」、音声信号の時間的連続性を用いた「時間相関符号化」、人間の聴覚特性を用いた「周波数相関符号化」、これらの符号化から得られた符号の発生確率の偏りを用いた「エントロピー符号化」を組み合わせることで実現する。
これらの圧縮手法は、MPEG(Moving Picture Expert Group)方式、ATRAC(Adaptive Transform Acoustic Coding(登録商標))方式、AC−3(Audio Code Number 3(登録商標))方式、WMA(Windows Media Audio(登録商標))方式などで規格化され、その符号化音声信号は、現在、デジタル放送、ネットワークオーディオプレーヤー、携帯電話、Webストリーミングなど広範囲で使用されている。
圧縮処理の中でも、「周波数相関符号化」は、圧縮率や音質に大きな影響を与える符号化処理である。「周波数相関符号化」とは、量子化されたPCM信号を、時間領域から周波数領域に直交変換し、周波数領域における信号エネルギーの偏差を求め、この偏差を用いて符号化することで符号化効率を高めるようにしているものである。
また、「周波数相関符号化」においては、直交変換後の信号に対して、心理聴覚特性を用いて、周波数帯域をいくつかの帯域に分け、より人間に知覚されやすい帯域の信号劣化を最小とするように、ある種の重み付けを行って量子化することにより、全体的な符号化品質を改善することができるようにしている。
ここで、心理聴覚特性を用いた符号化は、絶対可聴閾値と、マスキング効果で定まる相対可聴閾値を用いて、補正可聴閾値を求める。この補正可聴閾値に基づいて、分割された帯域ごとに符号化を行う。補正可聴閾値以下の音圧を持つ周波数成分に関しては、人間は知覚できない音として、符号化の際に除去(カット)される。また、絶対可聴閾値は高周波数帯域(以下、高域)でその振幅値が上昇するため、低周波数帯域(以下、低域)に比べて高域の周波数成分はより多くカットされてしまうことになる。
この心理聴覚特性を用いた音声信号の圧縮方法はMPEG方式で積極的に取り入られている。音声信号の符号化は各エンコーダーメーカーの技術力により、その傾向が決められるものではあるが、MPEG方式が採用されているデジタル放送の音声信号においては、上述した符号化処理により、ある周波数を境にそれ以降の高域信号が全てカットされたり、可聴帯域内においても、ある分割帯域の信号が全てカットされてしまうといった現状も確認されている。特に、音声信号を低ビットレートで圧縮する場合、符号化に使用できるビット数が少ないため、上述した方法により多くの信号がカットされてしまう。
このような圧縮符号化における信号劣化により、音質が低下する問題を解決するための先行技術はいくつか存在する。例えば、特許文献1(「信号補間装置、信号補間方法及び記録媒体」(特開2002−171588号公報))には、既存の音声信号(被補間信号)を使って高域成分を補間する方法についての技術が開示されている。
具体的には、被補間信号のうち第1の帯域内の成分を可変BPF(Band Pass Filter)で抽出し、これに可変周波数発振器からの局部発振信号を混合することによって、被補間信号が占める帯域よりも高周波側の第2の帯域の補間信号を形成し、この補間信号と被補間信号との和信号を出力信号とするものである。
また、特許文献2「周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体」(特開2002−073096号公報))には、符号化時において、欠落した信号の情報を予め記録しておき、復号時にそれを用いて音質を保ちながら復号する方法についての技術が開示されている。
これら特許文献1、特許文献2に記載の技術は、圧縮符号化における信号劣化により、音質が低下する問題を解決するための技術として有効なものである。なお、上述した特許文献1、特許文献2は以下の通りである。
特開2002−171588号公報
特開2002−073096号公報
ところで、被補間信号から高域側の補間信号を形成する特許文献1に記載の技術の場合、欠落した高域側の範囲が広い場合、可変BPFや可変周波数発振器からの出力信号には、符号化しても劣化しない基本波が多く含まれることになり、それら基本波を混合して求められる高域側の信号である補間信号は、符号化前の信号の高域側の成分(高調波成分)とみなし得る可能性が低い場合があると考えられる。
また、符号化時に欠落した信号の情報を予め記録する特許文献2に記載の技術の場合には、音声データの符号器側と復号機側とで共通のアルゴリズムが必要であるために、汎用的ではないと考えられる。すなわち、符号化時に欠落した信号の情報を予め記録するようにしても、この符号化時に欠落した信号の情報を復号化時において利用する構成がなければ、欠落した信号の復旧をすることはできない。このため、符号器側と復号器側とで共通のアルゴリズムが不可欠となり、符号器側の処理と復号器側の処理とを別個独立に考えることができないために、汎用性に欠けると考えられる。
このため、符号化音声信号についての音質向上処理は復号処理時の度に行わねばならなくなる。しかし、このことは、符号化音声信号の復号処理を行う装置の処理付加の増大を意味し、また、メモリ負荷や電力消費の面から見ても効率的ではない。
以上のことにかんがみ、この発明は、例えば、不可逆圧縮方式が用いられたれた圧縮符号化処理等の信号変換処理により、除去するようにされた除去分(劣化分)を補うために必要な情報を生成して個別に管理できるよにし、必要に応じて利用できるようにすることを目的とする。
上記課題を解決するため、請求項1に記載の発明の付加信号生成装置は、
原信号から信号変換処理時に除去されたと推定される信号成分を付加信号として、当該信号変換処理により形成された変換後信号から生成する付加信号生成手段と、
前記付加信号生成手段によって作成された前記付加信号を記録媒体に記録する付加信号記録手段と、
前記付加信号に関しての1つ以上の固有情報を取得して、前記付加信号についてのプロファイル情報を生成するプロファイル情報生成手段と、
前記プロファイル情報生成手段によって作成された前記プロファイル情報を記録媒体に記録するプロファイル情報記録手段と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルを作成する管理テーブル作成手段と、
前記管理テーブル作成手段によって作成された前記管理テーブルを記録媒体に記録する管理テーブル記録手段と
を備えることを特徴とする。
原信号から信号変換処理時に除去されたと推定される信号成分を付加信号として、当該信号変換処理により形成された変換後信号から生成する付加信号生成手段と、
前記付加信号生成手段によって作成された前記付加信号を記録媒体に記録する付加信号記録手段と、
前記付加信号に関しての1つ以上の固有情報を取得して、前記付加信号についてのプロファイル情報を生成するプロファイル情報生成手段と、
前記プロファイル情報生成手段によって作成された前記プロファイル情報を記録媒体に記録するプロファイル情報記録手段と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルを作成する管理テーブル作成手段と、
前記管理テーブル作成手段によって作成された前記管理テーブルを記録媒体に記録する管理テーブル記録手段と
を備えることを特徴とする。
この請求項1に記載の発明の付加信号生成装置は、付加信号生成手段により、所定の信号変換処理により形成された変換後信号から、当該変換後信号の信号変換処理時において除去された信号成分が付加信号として生成され、また、プロファイル情報生成手段により、当該付加信号についての固有情報からなるプロファイル情報が生成される。そして、管理テーブル作成手段により、信号変換されて形成された変換後信号と、対応する付加信号と、プロファイル情報とを関連付けする管理テーブルが作成される。そして、付加信号、プロファイル情報、管理テーブルのそれぞれは、対応する付加信号記録手段、プロファイル情報記録手段、管理テーブル記録手段を通じて記録媒体に記録される。
これにより、付加信号、プロファイル情報、管理テーブルのそれぞれを、変換後信号とは別個独立に管理することができるようにされる。そして、付加信号、プロファイル情報は、変換後信号を変換前の信号に復元する復元処理等の必要な場合に、管理テーブルを介して関連付けされて読み出され、適切な付加信号を利用して、変換後信号から変換前の信号を高品位に復元して再生するなどのことができるようにされる。
また、請求項7に記載の発明の復元装置は、
原信号から信号変換処理時に除去されたと推定される信号成分として、当該信号変換処理により形成された変換後信号から生成された付加信号が記録された付加信号記録媒体と、
前記付加信号に関しての1つ以上の固有情報からなるプロファイル情報が記録されたプロファイル情報記録媒体と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルが記録された管理テーブル記録媒体と、
供給される前記変換後信号を変換前の信号に復元する処理を行う復元処理手段と、
前記復元処理手段によって処理される変換後信号の識別情報に基づいて、前記管理テーブルを参照し、対応する付加信号を特定して読み出す付加信号読み出し手段と、
前記付加信号読み出し手段から読み出された付加信号と、前記復元処理手段によって復元された信号とを加算処理する加算手段と
を備えることを特徴とする。
原信号から信号変換処理時に除去されたと推定される信号成分として、当該信号変換処理により形成された変換後信号から生成された付加信号が記録された付加信号記録媒体と、
前記付加信号に関しての1つ以上の固有情報からなるプロファイル情報が記録されたプロファイル情報記録媒体と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルが記録された管理テーブル記録媒体と、
供給される前記変換後信号を変換前の信号に復元する処理を行う復元処理手段と、
前記復元処理手段によって処理される変換後信号の識別情報に基づいて、前記管理テーブルを参照し、対応する付加信号を特定して読み出す付加信号読み出し手段と、
前記付加信号読み出し手段から読み出された付加信号と、前記復元処理手段によって復元された信号とを加算処理する加算手段と
を備えることを特徴とする。
この請求項7に記載の発明の復号装置によれば、所定の信号変換処理により形成された変換後信号から当該信号変換処理時において除去された信号成分として生成された付加信号と、当該付加信号に関しての1つ以上の固有情報からなるプロファイル情報と、変換後信号と、付加信号と、プロファイル情報とを関連付ける管理テーブルとが記録された記録媒体を備えている。この場合の記録媒体は、各情報毎に異なる場合もあれば、同じ記録媒体に記録域(記録領域)を変えて記録されている場合もある。
そして、復元処理手段によって変換後信号が復元処理される場合には、復元処理手段によって処理される変換後信号の識別情報に基づいて、管理テーブルが参照され、対応する付加信号を特定してこれを読み出し手段が読み出す。そして、復元処理手段によって復元された信号と、当該変換後信号についての信号変換処理時に除去された信号成分である付加信号とが、加算手段によって加算処理され、変換後信号から変換前の信号を高品位に復元することができるようにされる。
この発明によれば、信号変換処理により一部の信号成分が除去(カット)された変換後信号に対し、除去された信号成分を付加信号として生成し、これを当該変換後信号とは別個独立に管理することができる。また、変換後信号とこれに対応する付加信号とは、管理テーブルによって関連付けられるので、変換後信号の復元処理時などにおいては、管理テーブルを通じて対応する付加信号を適切に特定して、これを利用することができる。
より具体的には、例えば、圧縮符号化により一部の信号成分が除去(カット)された可能性のある符号化音声信号に対し、除去された信号成分を付加信号を生成し、これを当該符号化音声信号とは別個独立に管理することができる。また、符号化音声信号とこれに対応する付加信号とは、管理テーブルによって関連付けられるので、符号化音声信号の復号処理時などにおいては、管理テーブルを通じて対応する付加信号を適切に特定して、これを利用することができる。
以下、図を参照しながら、この発明による装置、方法、プログラムの一実施の形態について説明する。以下に説明する実施の形態においては、説明を簡単にするため、MPEG−2 AAC(Moving Picture Expert Group-2 Advanced Audio Coding)と呼ばれるISO/IEC13818−7規格の符号化方式が用いられて符号化された音声信号(符号化音声信号)を復号処理する場合を例にして説明することとする。
すなわち、以下に説明する実施の形態においては、MPEG−2 AAC方式の圧縮符号化処理が、所定の信号変換処理に相当し、MPEG−2 AAC方式の圧縮符号化処理により形成された符号化音声信号が、所定の信号変換処理により形成された変換後信号に相当するものである。
なお、以下においては、MPEG−2 AACを、単にAACと呼ぶこととする。また、上記のISOは、国際標準化機構(International Organization for Standardization)の略称であり、IECは、国際電気標準会議(International Electrotechnical Commission)の略称である。
[AAC方式の符号化処理の概要]
AAC方式で符号化された符号化音声信号の復号処理の説明を簡単にするために、まず、AAC方式の符号化処理の概要について説明する。AAC方式の音声符号化は、いわゆる不可逆圧縮であり、心理聴覚(psycho acoustics)に基づいて、人が聴覚できない音の領域はデータ化しないことで、圧縮効果を高めているものである。AAC方式の符号化によると、例えば2チャンネルステレオ音声の場合、96キロビット/秒程度の伝送量でもCD(Compact Disc)なみの音質が得られ、約1/15(15分の1)の圧縮率が得られるものである。
AAC方式で符号化された符号化音声信号の復号処理の説明を簡単にするために、まず、AAC方式の符号化処理の概要について説明する。AAC方式の音声符号化は、いわゆる不可逆圧縮であり、心理聴覚(psycho acoustics)に基づいて、人が聴覚できない音の領域はデータ化しないことで、圧縮効果を高めているものである。AAC方式の符号化によると、例えば2チャンネルステレオ音声の場合、96キロビット/秒程度の伝送量でもCD(Compact Disc)なみの音質が得られ、約1/15(15分の1)の圧縮率が得られるものである。
そして、AAC方式の音声信号の符号化方式は、心理聴覚分析の結果に基づいて、(1)ゲイン調整処理→(2)適応ブロック長切換MDCT処理→(3)TNS処理→(4)インテンシティ・ステレオ符号化処理→(5)予測処理→(6)M/Sステレオ処理→(7)スケーリング処理を行った後に、(8)量子化処理と(9)ハフマン符号化処理を割り当てられたビット数を下回るまで反復して、符号化された音声データを形成し、これに処理過程において付すべき種々の係数等が付加されることにより符号化音声信号(AACビットストリーム)を形成する。
具体的な処理内容の概要を示せば以下のようになる。入力された符号化処理前の音声信号は、ゲイン調整され、所定のサンプル数毎にブロック化されて、それを1フレームとして処理される。まず、入力フレームを心理聴覚分析部においてFFT(Fast Fourier Transform)して周波数スペクトルを求め、それを元に聴覚のマスキングを計算し、予め設定された周波数帯域毎の許容量子化雑音電力と、そのフレームに対する心理聴覚エントロピー(PE:Perceptual Entropy)と呼ぶパラメータを求める。
心理聴覚エントロピーは、聴取者が雑音を知覚することがないように、そのフレームを量子化するのに必要な総ビット数に相当する。また、心理エントロピーは、音声信号のアタック部のように信号レベルが急激に増大するところで大きな値を取るという特性がある。そこで、心理エントロピーの値の急変部を元にしてMDCT(Modified Discrete Cosine Transform)の変換ブロック長を決定している。
MDCT処理は、心理聴覚分析部で決定されたブロック長で入力された音声信号を周波数スペクトル(以下、MDCT係数という。)に変換する。変換ブロック長を、入力信号に応じて適応的に切り換える処理(適応ブロック切り換え)は、プリエコーと呼ばれる聴覚的に有害な雑音を抑制するために必要な処理である。
MDCT処理によって形成されたMDCT係数は、TNS(Temporal Noise Shaping)処理される。TNS処理は、MDCT係数を時間軸上の信号であるかのように見たたて、線形予測を行い、MDCT係数に対して予測フィルタリングを行うものである。この処理により、復号側で逆MDCTして得られる波形に含まれる量子化雑音は、信号レベルの大きなところに集まるようになる。
そして、TNS処理されたMDCT係数に対しては、インテンシティ・ステレオ符号化、すなわち、高い周波数領域の音は左チャンネル(Lチャンネル)と右チャンネル(Rチャンネル)を合わせた1つのカップリングチャンネルしか伝送しないようにするための処理が施される。
インテンシティ・ステレオ符号化されたMDCT係数は、MDCT係数1本毎に、過去2フレームにおける量子化されたMDCT係数から現在のMDCT係数の値を予測し、その予測残差を求める。予測処理されたMDCT係数は、M/Sステレオ処理、すなわち、左右チャンネルの和信号(M=L+R)と差信号(S=L−R)を伝送するか、左右チャンネルのそれそれ(LチャンネルとRチャンネルとのそれぞれ)を伝送するようにするかを決定し、決定したように処理される。
M/Sステレオ処理されたMDCT係数は、予め設定された周波数帯域毎の複数本でグループ化されて(スケーリングされ)、これを単位として量子化が行われる。これらMDCT係数のグループをスケールファクタバンドと呼んでいる。スケールファクタバンドは、聴覚の特性に合わせて低域側では狭く、高域側では広くなるように設定されている。
量子化処理では、心理聴覚部で求めたスケールファクタバンド毎の許容量子化雑音電力を下回ることを目標に量子化を行う。量子化されたMDCT係数は、さらにハフマン符号化が施されて冗長度が削減される。この量子化、ハフマン符号化の処理は反復ループで行われ、実際に生成される符号量がフレームに割り当てられたビット数を下回るまで繰り返される。
このように、AAC方式の音声信号の符号化方式は、心理聴覚分析の結果に基づいて、(1)ゲイン調整処理→(2)適応ブロック長切換MDCT処理→(3)TNS処理→(4)インテンシティ・ステレオ符号化処理→(5)予測処理→(6)M/Sステレオ処理→(7)スケーリング処理を行った後に、(8)量子化処理と(9)ハフマン符号化処理を割り当てられたビット数を下回るまで反復して、符号化された音声データを形成し、これに処理過程において付すべき種々の係数等が付加されることにより、符号化音声信号(AACビットストリーム)を形成するようにしている。
なお、上述したAAC方式の音声符号化処理については、例えば、デジタルテレビ技術入門、高田豊、浅見聡著、米田出版、112頁〜124頁等の種々の文献、あるいは、Webページなどにおいても詳細に説明されている。
また、ゲイン調整処理、TNS処理、インテンシティ・ステレオ符号化処理、予測処理、M/Sステレオ処理は、オプション処理であり、AAC符号化全工程で行うものではない。すなわち、ゲイン調整処理、TNS処理、インテンシティ・ステレオ符号化処理、予測処理、M/Sステレオ処理は、オプション処理が選択された場合にのみ行われる処理である。以下に説明する実施の形態においては、上述したオプション処理が行うようにされて圧縮符号化された符号化音声信号を処理する場合を例にして説明することとする。
[符号化音声信号の復号装置について]
次に、この発明による装置、方法、プログラムの一実施の形態が適用された、この実施の形態の復号装置について説明する。上述したように、この実施の形態の復号装置は、AAC方式で符号化された音声信号を復号処理するものである。そして、この実施の形態の復号装置は、符号化処理によって除去(カット)された(劣化した)高域の音声信号を付加信号として復元し、これを復号化して得た音声信号の高域部分に足し合わせることにより、再生音声の高品位化を実現することができるものである。
次に、この発明による装置、方法、プログラムの一実施の形態が適用された、この実施の形態の復号装置について説明する。上述したように、この実施の形態の復号装置は、AAC方式で符号化された音声信号を復号処理するものである。そして、この実施の形態の復号装置は、符号化処理によって除去(カット)された(劣化した)高域の音声信号を付加信号として復元し、これを復号化して得た音声信号の高域部分に足し合わせることにより、再生音声の高品位化を実現することができるものである。
さらに、この実施の形態の復号装置は、付加信号の形成時に、付加信号に固有の情報(当該復号装置に固有の情報)からなるプロファイル情報を形成し、付加信号と共にプロファイルを情報記録媒体に記録すると共に、符号化音声信号と、対応する付加信号やプロファイル情報との関連付けも管理できるようにし、符号化音声信号の復号処理時において、付加信号を繰り返し生成しなくても、先に生成した対応する付加信号を適切に特定し、これを繰り返し利用することもできるようにしている。以下、この実施の形態の復号装置について詳細に説明する。
図1は、この実施の形態の復号装置を説明するためのブロック図である。この実施の形態の復号装置は、例えば、据え置き型の、あるいは、携帯型の音声記録再生装置、あるいは、音声再生装置等に適用される。具体的には、ハードディスクを記録媒体として用いるハードディスクプレーヤや半導体メモリを記録媒体として用いるメモリプレーヤ、MD(Mini Disc(登録商標))などの光磁気ディスクやDVDなどの光ディスクを記録媒体として用いる記録再生装置や再生装置、パーソナルコンピュータなど、圧縮符号化されたデジタル音声信号を処理する種々の電子機器に適用可能なものである。
図1に示すように、この実施の形態の復号装置は、大きく分けるとAAC復号処理部1と、付加信号生成部2と、加算部3とを有するものである。AAC復号処理部1は、AAC方式で符号化された音声信号(符号化音声信号)の供給を受けて復号処理し、符号化処理前の音声信号を復元する処理を行う部分である。
付加信号生成部2は、符号化音声信号の供給を受けて、当該符号化音声信号が符号化されることにより除去されてしまった高域部分の音声信号を付加信号として復元する処理を行う部分である。また、付加信号生成部2は、詳しくは後述もするが、生成する付加信号に固有の情報であるプロファイル情報をも生成することができるものである。
また、付加信号生成部2は、復号化の対象となった符号化音声信号と、生成した付加信号と、生成したプロファイル情報とを、関連付けて管理する管理テーブルを作成し、これら付加信号と、プロファイル情報と、管理テーブルとを記録媒体に記録して、これらを符号化音声信号とは別個独立に管理するとともに、付加信号やプロファイル情報の繰り返しての利用をできるようにしている。
そして、加算部3は、AAC復号処理部1からの音声信号と付加信号生成部2からの付加信号との供給を受けて、AAC復号処理部1からの復号された音声信号の高域部分に、付加信号生成部2からの付加信号(高域部分の音声信号)を合成することにより、符号化処理により除去された高域部分の音声信号をも復元した、高品位の音声信号を復元して出力するものである。
次に、AAC復号処理部1と、付加信号生成部2とのそれぞれについて説明する。なお、この実施の形態において、AAC方式で符号化されて形成された符号化音声信号は、48kHzサンプリングPCM信号を、MPEG−2 AAC LCプロファイルのビットレート128kbpsで符号化(圧縮)された2ch(2チャンネル)の音声信号であるものとして説明する。
[AAC復号処理部1について]
まず、AAC復号処理部1について説明する。AAC復号処理部1は、AAC方式で符号化されて形成された符号化音声信号の復号処理を行う既存の処理部分であり、図1に示したように、大きく分けると、フォーマット解析部11と、逆量子化処理部12と、ステレオ処理部13と、適応ブロック長切換逆MDCT部14と、ゲイン制御部15とからなっている。
まず、AAC復号処理部1について説明する。AAC復号処理部1は、AAC方式で符号化されて形成された符号化音声信号の復号処理を行う既存の処理部分であり、図1に示したように、大きく分けると、フォーマット解析部11と、逆量子化処理部12と、ステレオ処理部13と、適応ブロック長切換逆MDCT部14と、ゲイン制御部15とからなっている。
逆量子化処理部12は、図1に示したように、ハフマン復号化部121と、逆量子化部122と、リスケーリング部123とを備えている。また、ステレオ処理部13は、図1に示したように、M/Sステレオ処理部131と、予測処理部132と、インテンシティ・ステレオ処理部133と、TNS部134とを備えている。
復号化の対象の符号化音声信号(ビットストリーム)は、フォーマット解析部11に供給される。フォーマット解析部11は、これに供給された符号化音声信号を、MDCT係数と、それ以外のパラメータや制御情報とに分離し、MDCT係数は、逆量子化処理部12のハフマン復号化部121と、付加信号生成部2に供給する。
また、フォーマット解析部11は、符号化音声信号のビットストリームから抽出したパラメータや制御情報に基づいて、各部に対する制御信号を形成し、これを図1において点線矢印で示すように、AAC復号処理部1を構成する各部に対して供給することによって、各部における処理を制御する。
そして、上述したAAC符号化時の処理とは言わば逆となる処理を行うことによって、符号化音声信号の復号処理を行う。具体的には、上述もしたように、フォーマット解析部11において分離されたMDCT係数は、逆量子化処理部12のハフマン復号化部121に供給されるので、まず、ハフマン復号化部121でハフマン復号処理を行い、次に逆量子化部122において逆量子化処理を行った後、リスケーリング部123においてリスケーリング処理を行って、量子化前のMDCT係数を復元する。
そして、量子化前の状態に復元されたMDCT係数は、ステレオ処理部13のM/Sステレオ処理部131に供給される。M/Sステレオ処理部131においては、左チャンネル(Lch)と右チャンネル(Rch)のMDCT係数が復元される。この左右2チャンネルのMDCT係数は、予測処理部132において処理されて予測処理によるデータ圧縮前のMDCT係数に復元され、さらにインテンシティ・ステレオ処理部133において、インテンシティ・ステレオ復号化処理が施されて、高い周波数領域の音についても、左右のそれぞれのチャンネルのMDCT係数に分配される。この後、TNS部134において、予測フィルタリングがはずすようにされ、符号化時においてMDCT処理された直後のMDCT係数が復元される。
この後、ステレオ処理部13のTNS部134からのMDCT係数は、適応ブロック長切換逆MDCT部14に供給される。適応ブロック長切換逆MDCT部14は、これに供給されたMDCT係数(周波数領域の音声信号)を逆MDCT処理することにより、時間軸領域の音声信号に変換し、これをゲイン制御部15に供給して、ゲイン調整することにより、符号化前の元の時間軸領域の音声信号(時間音声信号)を復元して、加算部3に供給する。すなわち、適応ブロック長切換逆MDCT部14に供給される符号化音声信号は、周波数領域の音声信号であり、適応ブロック長切換逆MDCT部14から出力される
音声信号は、時間軸領域の音声信号、すなわち時間音声信号となる。
音声信号は、時間軸領域の音声信号、すなわち時間音声信号となる。
このように、AAC復号処理部1は、AAC方式で符号化されて形成された符号化音声信号の復号処理を行って、符号化前の音声信号を復元する処理を行う。しかし、上述もしたように、AAC方式は、いわゆる不可逆圧縮であるために、高域の音声信号が劣化している可能性が高い。
このため、この実施の形態においては、上述もしたように、付加信号生成部2において、符号化されることにより除去されてしまった(劣化してしまった)高域部分の音声信号を付加信号として復元する処理を行う。また、付加信号生成部2は、後述するように、付加信号生成部2の機能により、復号化の対象となった符号化音声信号と、対応する付加信号と、対応するプロファイル情報とを、関連付けて管理できるようにし、付加信号やプロファイル情報の繰り返しの利用を可能にしている。
[付加信号生成部2について]
次に、この実施の形態の復号装置の付加信号生成部2について説明する。図2は、この実施の形態の復号装置の付加信号生成部2を説明するためのブロック図である。この実施の形態の付加信号生成部2は、図2に示すように、付加信号生成処理部21と、付加信号記録部22と、付加信号復号処理部23とを備えたものである。
次に、この実施の形態の復号装置の付加信号生成部2について説明する。図2は、この実施の形態の復号装置の付加信号生成部2を説明するためのブロック図である。この実施の形態の付加信号生成部2は、図2に示すように、付加信号生成処理部21と、付加信号記録部22と、付加信号復号処理部23とを備えたものである。
上述もしたように、フォーマット解析部11からの符号化音声信号(MDCT係数)は、図2に示すように、付加信号生成部2の付加信号生成処理部21に供給される。付加信号生成処理部21は、これに供給されたMDCT係数に基づいて、符号化により除去された高域部分の符号化音声信号(MDCT係数)である付加信号を生成すると共に、この付加信号に固有の情報を取得してプロファイル情報を生成する。
付加信号記録部22は、付加信号生成処理部21において生成された付加信号とプロファイル情報との供給を受けて、復号化対象の符号化音声信号と、当該符号化音声信号から形成した付加信号と、当該付加信号に対する固有情報からなるプロファイル情報とを相互に関連付けて管理する管理テーブルを作成する。
そして、付加信号記録部22は、作成した管理テーブルと、供給を受けた付加信号と、供給を受けたプロファイル情報とを、記録域(記録領域)を別にして、例えば、ハードディスクなどの当該復号装置が有する記録媒体に記録する。これにより、同じ符号化音声信号を繰り返し復号処理して再生する場合であっても、過去に生成した付加信号を繰り返して用いることができるようにし、高域部分の符号化音声信号である付加信号を繰り返し生成することがないようにしている。
付加信号復号処理部23は、付加信号の供給を受けて、高域部分の符号化音声信号である当該付加信号の復号化処理を行う。すなわち、付加信号復号処理部23は、これに供給される付加信号について、逆MDCT処理を行うことにより、時間軸領域の付加信号、すなわち、時間軸領域の高域部分の音声信号を形成し、これを出力する。なお、付加信号復号処理部23においては、必要に応じてプロファイル情報も用いて付加信号の内容を確認し、適切に復号処理を行うことができるようにしている。
このようにして、時間軸領域の音声信号に復号された付加信号(高域部分の音声信号)は、加算部3に供給され、AAC復号処理部1からの復号された時間音声信号の高域部分に加算(合成)され、符号化により除去された高域部分の音声信号を補間した時間軸領域の音声信号であって、高品位の音声信号を復元し、これを再生するなどのことができるようにされる。
また、上述したように、付加信号とプロファイル情報とは記録媒体に記録されると共に、そのそれぞれを対応する符号化音声信号と関連付けた管理テーブルによって管理できるようにして、元々の符号化音声信号を復号して利用する場合に、記録媒体に記録した付加信号を利用することもできるようにしている。以下に、付加信号生成部2を構成する付加信号生成処理部21と付加信号記録部22と付加信号復号処理部23の具体的な構成例について説明する。
[付加信号生成処理部21について]
図3は、この実施の形態の付加信号生成処理部21の構成例を説明するためのブロック図である。図3に示すように、この実施の形態の付加信号生成処理部21は、ハフマン復号化部211、逆量子化部212、リスケーリング部213、ステレオ処理部214、境界周波数検出部215、追加帯域決定部216、高域信号生成部217、プロファイル情報作成処理部218を備えたものである。
図3は、この実施の形態の付加信号生成処理部21の構成例を説明するためのブロック図である。図3に示すように、この実施の形態の付加信号生成処理部21は、ハフマン復号化部211、逆量子化部212、リスケーリング部213、ステレオ処理部214、境界周波数検出部215、追加帯域決定部216、高域信号生成部217、プロファイル情報作成処理部218を備えたものである。
ハフマン復号化部211、逆量子化部212、リスケーリング部213のそれぞれは、図1に示したAAC復号処理部1の逆量子化処理部12のハフマン復号化部121、逆量子化部122、リスケーリング部123のそれぞれと同様のものであり、フォーマット解析部11からの符号音声信号(MDCT係数)に対する逆量子化処理を行って、量子化処理前のMDCT係数を復元する部分である。
ステレオ処理部214は、図1に示したステレオ処理部13と同様の処理を行う部分である。すなわち、ステレオ処理部214は、符号化時とは逆に、M/Sステレオ処理、予測処理、インテンシティ・ステレオ処理、TNS処理の各処理を行って、MDCT処理された直後のMDCT係数を復元する。
境界周波数検出部215は、ステレオ処理部214からのMDCT係数の供給を受けて、当該MDCT係数について、ある周波数を境に、高域全体が除去(カット)されている場合の境界周波数(下限側の境界周波数)を検出する。一般に、境界周波数はビットレートに依存する場合が多い。符号化の仕様はエンコーダメーカーの技術力によるため、一様ではないが、例えば、ビットレート196kbpsでエンコード(符号化)した場合には境界周波数は20kHz付近になり、ビットレート128kbpsでエンコードした場合には境界周波数は16kHz付近になり、ビットレート64kbpsでエンコードした場合には境界周波数は14kHzになるといった傾向がある。
この実施の形態の復号装置において、復号処理の対象となっている符号化音声信号は、上述もしたように、ビットレートが128kbpsでエンコードされたものであるため、境界周波数は、約16kHzであるものとする。すなわち、この実施の形態の復号装置で復号処理する符号化音声信号は、約16kHz以上の高域部分の音声信号がカットされ、劣化してしまっているものであると特定する。
このように、境界周波数は、符号化音声信号のビットレート、自機の性能、その他の条件に応じて、予め決められたものが、例えば、符号化音声信号のビットレート、自機の性能、その他の条件などと関連付けられて、あるいは、優先順位などの使用条件などのインデックス情報と関連付けられて、この実施の形態の復号装置の適宜のメモリに記憶保持しておくようにする。
これにより、境界周波数検出部215は、当該メモリに記憶保持されている境界周波数の候補の情報から、用いるべき境界周波数を検出(特定)することができる。もちろん、その他の種々の条件を考慮して、境界周波数検出部215において、境界周波数を特定するようにしてもよい。また、機器の処理能力などに応じて、予め1つの境界周波数が定まる場合には、これを用いるようにすればよい。
追加帯域決定部216は、境界周波数以降の高域における、高域信号を追加する帯域幅を決定する。この実施の形態においては、境界周波数が15kHz以上であった場合には、境界周波数以降の全帯域に高域信号を追加するようにしている。なお、この実施の形態においては、15kHzという値を用いたが、14kHz程度まで追加帯域の条件を下げることも可能である。しかし、10kHz付近まで下げると、追加信号が雑音となって聞こえてしまう可能性があるため、追加帯域の条件を10kHz付近まで下げることは好ましくない。
この実施の形態において、境界周波数検出部215で検出された境界周波数は、上述もしたように、16kHzであり、予め決められた条件である「境界周波数が15kHz以上であること」を満たしているため、追加帯域決定部216においては、16kHz以降に高域信号(付加信号(高域部分の符号化音声信号))を追加するようにする。また、この実施の形態においては、上述もしたように、48kHzサンプリングの音声信号を用いているため、追加する上限の周波数はサンプリング周波数の1/2(2分の1)である24kHzとする。よって、16kHzから24kHzまでがこの実施の形態における高域信号(付加信号)の追加帯域となる。
高域信号生成部217は、追加する高域信号(付加信号)を計算により生成する。この高域信号生成部217においては、例えば、特許第3646657号「デジタル信号処理
装置及びデジタル信号処理方法、並びに1ビット信号生成装置」に開示された技術を用いて、追加する高域信号(付加信号)を生成する。
装置及びデジタル信号処理方法、並びに1ビット信号生成装置」に開示された技術を用いて、追加する高域信号(付加信号)を生成する。
具体的には、境界周波数検出部215において求められた境界周波数における信号の振幅値から、上限周波数(この実施の形態においては24kHz)における信号の振幅値を「0(零)」として、周波数特性傾きを算出する。次に、この実施の形態においては、下限周波数として10.5kHzを設定し、10.5kHzから下限側の境界周波数(この実施の形態においては16kHz)までの信号をバッファリングし、スペクトル複製、ゲイン算出、ゲイン調整の各処理を行って、追加用の高域信号(付加信号)を生成して、後段の付加信号記録部22に供給する。
また、プロファイル情報作成処理部218は、付加信号固有の情報、例えば、復号装置の名称、バージョンナンバー、付加信号の作成日時などの情報を取得し、これらからなるプロファイル情報を形成して、これをプロファイル情報記録部22に供給する。
なお、復号装置の名称、バージョンナンバーといった復号装置に関する固定的な情報は、図示しない制御部のROMなどに記録されているものを取得すればよい。また、付加信号の作成日時などの日時情報は、図示しない時計回路によって提供されるものを取得するようにすればよい。このように、プロファイル情報に必要な情報は、この実施の形態の復号装置が元々備える種々の情報や取得可能な種々の情報を用いるようにすることができる。
また、図1、図2、図3においては、付加信号は符号化音声信号(MDCT係数)のみの供給を受けて、付加信号を生成するように記載しているが、付加信号生成部2を構成する付加信号生成処理部21のハフマン復号化部211やステレオ処理部214は、図1に示したAAC復号化部1の場合と同様に、フォーマット解析部11からのパラメータや制御情報の供給を受けて、逆量子化処理やステレオ処理を行う構成となっている。
このように、付加信号生成処理部21においては、復号対象の符号化音声信号が符号化されることにより除去されてしまった高域部分の音声信号を付加信号として形成すると共に、付加信号に固有の情報からなるプロファイル情報を形成して、これらを出力することができるものである。
[付加信号記録部22について]
図4は、この実施の形態の付加信号記録部22の構成例を説明するためのブロック図である。図4に示すように、この実施の形態の付加信号記録部22は、付加信号記録部221、プロファイル記録部(プロファイル情報の記録部)222、管理テーブル作成処理部223、管理テーブル記録部224を備えたものである。
図4は、この実施の形態の付加信号記録部22の構成例を説明するためのブロック図である。図4に示すように、この実施の形態の付加信号記録部22は、付加信号記録部221、プロファイル記録部(プロファイル情報の記録部)222、管理テーブル作成処理部223、管理テーブル記録部224を備えたものである。
付加信号記録部221は、付加信号生成処理部21において生成された付加信号の供給を受けて、これを記録媒体4に形成されている付加信号の記録域41に記録する。また、プロファイル記録部222は、付加信号生成処理部21において生成されたプロファイル情報の供給を受けて、これを記録媒体4に形成されているプロファイル情報の記録域42に記録する。
管理テーブル作成処理部223は、付加信号記録部221からの付加信号についての情報と、プロファイル記録部222からのプロファイル情報についての情報と、さらに外部から供給される復号対象の符号化音声信号についての情報とに基づいて、符号化音声信号と付加信号及びプロファイル情報とを管理するための管理テーブルを作成する。管理テーブルは、復号対象の符号化音声信号に対して、その付加信号及びプロファイル情報が一意に決まるようにまとめた内容とする。
図5は、管理テーブルの構成例を説明するための図である。図5において音声信号、付加信号、プロファイル情報の各文字は、各符号化音声信号、付加信号、プロファイル情報のそれぞれを特定することが可能な、例えば、ファイル名や固有の識別IDなどの識別情報に相当する。
また、図5において、文字「A」、「B」、「C」は、通し記号や通し番号などに相当するものであり、記号「A」が割り振られた符号化音声信号に対する付加信号とプロファイル情報とにも同じ記号「A」を割り振るようにしたものである。このようにすることによって、対応する情報の関係が一意に決まるように管理テーブルを作成することができる。
このようにして形成される管理テーブルは、管理テーブル記録部224を通じて、記録媒体4に作成されている管理テーブルの記録域43に記録される。このように、付加信号記録部22は、付加信号生成処理部21からの付加信号とプロファイル情報とを、これとの間で対応関係のある符号化音声信号とは別個独立に記録媒体に記録し管理できるようにすると共に、管理テーブルを介して、符号化音声信号、付加信号、プロファイル情報の関連付けをも確実に行うことができるようにしている。
[付加信号復号処理部23について]
次に、付加信号生成部2の付加信号復号処理部23について説明する。この実施の形態において、付加信号生成処理部21において生成される付加信号は、符号化された状態のものである。そして、上述したように、付加信号生成処理部21において生成された付加信号とプロファイル情報とは、付加信号記録部22の機能により、管理テーブルによって管理するようにされて、記録媒体に記録保持するようにされる。そして、少なくとも、付加信号については、図2に示した付加信号復号処理部23に供給されて、時間軸領域の音声信号に復元される。
次に、付加信号生成部2の付加信号復号処理部23について説明する。この実施の形態において、付加信号生成処理部21において生成される付加信号は、符号化された状態のものである。そして、上述したように、付加信号生成処理部21において生成された付加信号とプロファイル情報とは、付加信号記録部22の機能により、管理テーブルによって管理するようにされて、記録媒体に記録保持するようにされる。そして、少なくとも、付加信号については、図2に示した付加信号復号処理部23に供給されて、時間軸領域の音声信号に復元される。
すなわち、付加信号復号処理部23は、付加信号の供給を受けて、高域部分の符号化音声信号である当該付加信号の復号化処理を行う。付加信号復号化処理部23の具体的な構成例としては、図1に示したAAC復号処理部1の適応ブロック長切換逆MDCT処理部14とゲイン制御部15とを有するものとなる。そして、付加信号復号処理部23において復号された付加信号(時間軸領域の信号とされた高域部分の音声信号)は、加算部3に供給される。
これにより、図1に示したように、AAC復号処理部1からの出力である時間音声信号と付加信号生成部からの出力である時間音声信号を加算して、最終的な出力である時間音声信号を得ることができるようにされる。この場合、復号対象の符号化音声信号について、符号化処理により除去されてしまった高域部分の音声信号をも復元して高品位の音声信号を復元することができる。
[図1に示した復号装置からの出力信号について]
図6は、図1に示した復号装置の加算部3から出力される音声信号の特性について説明するためのスペクトル分布の概念図である。図6(A)は、図1に示した復号装置のAAC復号処理部1において復号処理されて得られた音声信号のスペクトル分布の概念図であり、図6(B)は、図1に示した復号装置の付加信号生成部2において形成された付加信号(高域部分の音声信号)のスペクトル分布の概念図である。
図6は、図1に示した復号装置の加算部3から出力される音声信号の特性について説明するためのスペクトル分布の概念図である。図6(A)は、図1に示した復号装置のAAC復号処理部1において復号処理されて得られた音声信号のスペクトル分布の概念図であり、図6(B)は、図1に示した復号装置の付加信号生成部2において形成された付加信号(高域部分の音声信号)のスペクトル分布の概念図である。
図6(A)に示すように、符号化音声信号を復号処理しても、符号化時において16kHzより高い部分(高域部分)の音声信号は除去されて(劣化して)しまっている。このため、図6(B)に示すように、この実施の形態の例の符号化音声信号の場合には、16kHz以降、24kHzまでの高域部分の音声信号を付加信号として形成する。
そして、AAC復号処理部1において復号された音声信号(図6(A))と、付加信号生成部2において形成された付加信号(図6(B))とを加算部3において加算することにより、図6(C)に示すように、高域部分(この実施の形態においては、16kHz〜24kHzの部分)の音声信号をも補間した高品位の音声信号を復元できる。
さらに、図4を用いて説明したように、復号対象の符号化音声信号から形成した付加信号とプロファイル情報とを記録媒体4に記録し、これを管理テーブルを通じて管理し、当該符号化音声信号を復号して利用する場合であっても、付加信号やプロファイル情報を繰り返し作成する必要もないようにしている。
なお、ここでは、図1に示したように、AAC復号処理と付加信号生成処理とを並行して行うようにした。しかし、これに限るものではない。例えば、図1に示したフォーマット解析部11と付加信号生成部2(図2〜図5を用いて説明した部分)を備えた付加信号生成装置を構成することにより、付加信号生成処理だけを行うようにすることもできる。
なお、この実施の形態において、付加信号の生成処理は、付加信号を生成するだけではなく、プロファイル情報をも生成し、これら付加信号とプロファイル情報とを記録媒体に記録すると共に、管理テーブルを作成して管理できるようにする処理を意味している。
[記録媒体に作成された付加信号とプロファイル情報の利用について]
次に、符号化音声信号の復号化処理時において、付加信号やプロファイル情報の生成を行うことなく、既に記録媒体4に記録されている付加信号を利用する場合について説明する。
次に、符号化音声信号の復号化処理時において、付加信号やプロファイル情報の生成を行うことなく、既に記録媒体4に記録されている付加信号を利用する場合について説明する。
図7は、付加信号及びプロファイル情報が既に存在する場合において、AAC復号処理を行って、高品位の音声信号を復元する復号装置の例を説明するためのブロック図である。図7に示す復号装置は、図1に示した復号装置と異なり、付加信号生成部2自体を備えるのではなく、図3を用いて説明した付加信号生成装置2内の最後尾に設けられた付加信号復号処理部23が設けられると共に、既に記録媒体4に生成されている付加信号やプロファイル情報を読み出すための読み出し部5が設けられたものである。記録媒体4は、図1には図示しなかったが、生成した付加信号やプロファイル情報、管理テーブルなどを記憶保持するものとして、図1に示した復号装置も備えていたものである。
そして、図7において、AAC復号処理部1は、図1に示した復号装置が備えているAAC復号処理部1と同様に構成される部分であり、フォーマット解析部11と、逆量子化処理部12と、ステレオ処理部13と、適正ブロック長切換逆MDCT部14と、ゲイン制御部15とを備えたものである。図7においては、逆量子化処理部12とスペクトラム処理部13との詳細な構成は省略しているが、図1にした復号装置の場合と同様に構成されるものである。このため、ここでは、AAC復号処理部1についての詳細な説明は省略する。
そして、図7に示す例の復号装置の場合には、復号対象の符号化音声信号が供給されると、読み出し部5は、記録媒体4に作成されている管理テーブルを参照し、復号対象の符号化音声信号に対応する付加信号とプロファイル情報とを特定し、特定した付加信号を付加信号記憶域41から読み出して、これを上述した付加信号復号処理部23に供給する。付加信号復号処理部23は、上述もしたように、これに供給された付加信号の逆MDCT処理やゲイン調整を行って、時間軸領域の音声信号(付加信号)を復元し、これを加算部3に供給する。
加算部3には、AAC復号処理部1からの復号された音声信号が供給されるので、加算部3においては、図1に示した復号装置の場合と同様に、また、図6を用いて説明したように、符号化処理時に高域部分が除去された(劣化した)音声信号(符号化音声信号をAAC復号処理部1において復号することにより得られた音声)と、復号された付加信号(復号処理された符号化音声信号について符号化時に除去された(劣化した)であろう高域部分の音声信号)とが加算処理され、高域部分の音声信号が補間された高品位の音声信号が復元される。
また、付加信号の生成時において生成されて記録媒体のプロファイル情報記録域に記憶保持されているプロファイル情報も必要に応じて読み出されて使用される。この図7に示した復号装置の場合、符号化音声信号の復号処理タイミングと、付加信号の生成タイミングとが異なる。このため、付加信号が、符号化音声信号の復号処理を行うAAC復号処理部1とは異なる方式を用いて生成されたものである可能性もあり、これをチェックするために、プロファイル情報を用いることができる。
すなわち、プロファイル情報は、上述もしたように、復号装置の名称、バージョンナンバーなどを有しており、AAC復号処理部1についての復号装置の名称やバージョンナンバーと異なる場合には、当該付加信号は復号対象の符号化音声信号に対応して生成されたものではない場合があるので、加算処理に用いないようにしたり、あるいは、AAC復号処理部1についての復号装置の名称やバージョンナンバーなどの情報とプロファイル情報の復号装置の名称やバージョンナンバーなどの情報とに基づいて、付加信号を補正したりするなどのことができるようにされる。
また、同じ符号化音声信号について、異なる複数の装置で付加信号やプロファイル情報が生成される場合もあると考えられる。このような場合には、復号処理の対象となっている符号化音声信号の識別情報に加えて、プロファイル情報をも考慮するために当該復号処理を行う装置の名称やバージョン情報をも用いて、管理情報を参照し、符号化音声信号の識別情報が一致し、かつ、プロファイル情報の内容も一致する符号化音声信号に割り振られた通し記号を特定し、当該通し記号が割り振られた付加信号を用いるようにしてもよい。もちろん、符号化音声信号の識別情報が一致し、かつ、プロファイル情報の内容も一致する付加信号を用いる付加信号として特定するようにしてもよい。
図8は、図7に示した復号装置の主に読み出し部5部分を中心として、付加信号及びプロファイル情報が記録媒体4に既に存在する場合の、管理テーブルを参照して付加信号及びプロファイル情報を読み出す際の処理を詳細に説明するための概念図である。
通し符号として「A」が割り振られた符号化音声信号を復号して再生する場合、例えば、フォーマット解析部11から読み出し部5に対して、復号対象の符号化音声信号の識別情報(図8において音声信号Aと記載)が供給される。読み出し部5は、図8において、上向きの点線矢印が示すように、供給された符号化音声信号の識別情報に基づいて管理情報テーブルの記憶域43に記憶されている管理情報テーブルを参照し、当該符号化音声信号に割り振られた通し符号「A」を特定する。
そして、読み出し部5は、図8において、下向きの点線矢印で示すように、特定した通し符号「A」が割り振られた付加信号とプロファイル情報とを読み出して、これらを付加信号復号処理部23に供給する。これにより、上述もしたように、目的とする付加信号が読み出されて、付加信号復号処理部23に供給され、ここで時間軸領域の音声信号に変換されて、AAC復号処理部1からの音声信号と加算部3において加算され、高域部分も補間された高品位の音声信号を復元することができるようにされる。なお、プロファイル情報は、上述もしたように、必要に応じて読み出されて使用することができれば十分な情報であるが、特定できた場合には、プロファイル情報を付加信号復号処理部23に供給しておき、いつでも使用可能にしておくことが望ましい。
このように、図7に示した復号装置の場合には、復号対象の符号化音声信号の復号処理時において、これと並行して付加信号やプロファイル情報の生成処理を常に行う必要がなくなり、既に作成されている付加信号を繰り返し用いて、高品位の音声信号を比較的に簡単に生成することができるようにされる。
図9は、記録媒体から付加信号とプロファイル情報、及び符号化音声信号とを別々に読み出し、復号して再生する場合の概念図で、図8を簡略化したものである。多くの場合、符号化音声信号も、これに対応する付加信号やプロファイル情報も、記録媒体に記録されている場合が多い。図9に示した例は、符号化音声信号、付加信号、プロファイル情報も、アクセス可能な記録媒体4に既に記録されている場合において、符号化音声信号を復号処理して再生する場合の復号装置の概要を示している。
記録媒体4からは、再生対象の符号化音声信号が読み出されて、図1、図7に示したようにように構成されるAAC復号処理部1に供給される。一方、復号対象の符号化音声信号に対応する付加信号とプロファイル情報とは、図8を用いて説明したように、読み出し部5により読み出され、付加信号は付加信号復号処理部23に供給される。また、プロファイル情報は、付加信号が使用可能なものかを判断したり、補正したりする場合などの必要なタイミングで読み出され、付加信号復号処理部23などにおいて利用することができるようにされる。
これにより、上述もしたように、AAC復号処理部1においては、符号化音声信号の復号処理を行い、時間軸領域の音声信号を復元して、これを加算部3に供給する。一方。付加信号復号処理部23においては、これに供給された付加信号の復号処理を行い、時間軸領域の音声信号を復元して、これを加算部3に供給する。加算部3は、これに供給された時間軸領域の音声信号を加算し、図6(C)を用いて説明したように、符号化時に除去された高域部分の音声信号についても補間した高品位の音声信号を復元して、再生するなど利用することができるようにされる。
図10は、図7、図8を用いて説明した復号装置を、メモリプレーヤ(メモリ型携帯音声再生装置)に適用した場合の例を説明するためのブロック図である。図10に示すように、メモリプレーヤ200内のメモリ201には、例えば、パーソナルコンピュータ100などの外部機器から、再生対象の符号化音声信号と、付加信号とプロファイル情報とを転送して利用できるようにする。
また、付加信号及びプロファイル情報の生成時において形成される図5を用いて説明した管理テーブルについても、付加信号やプロファイル情報の転送時に、あるいは、それ以前にメモリプレーヤ200内のメモリに用意しておく。なお、符号化音声信号や付加信号及びプロファイル情報は、1タイトル毎に転送したり、複数タイトルをまとめて転送したりすることも可能である。
また、パーソナルコンピュータ100などの外部機器の記録媒体に記憶保持されている全ての付加信号、全てのプロファイル情報、及び、これらを管理するための管理テーブルを1セットとして、パーソナルコンピュータ100などの外部機器からメモリプレーヤ内のメモリに転送して利用できるようにすることも可能である。
なお、図10に示したメモリプレーヤ200においては、符号化音声信号、付加信号、プロファイル情報をメモリ201に記憶保持し、管理テーブルは別のメモリに記憶保持すするように表現しているが、これに限るものではない。符号化音声信号、付加信号、プロファイル情報、管理テーブルのそれぞれを異なるメモリに記憶保持するように構成することも可能であるし、同じメモリに記憶域を変えて記録保持することも可能である。また、符号化音声信号と、これ以外の情報とを異なるメモリで記憶保持することも可能である。すなわち、各情報を個別に管理することができれば、メモリなどの記録媒体をどのように使用するようにしてもよい。
そして、図10に示したメモリプレーヤ200において、メモリ201に格納されている符号化音声信号を再生する場合には、図7、図8、あるいは、図9を用いて説明したように、まず、再生対象の符号化音声信号の識別情報に基づいて管理テーブル43を参照し、当該符号化音声信号に割り当てられている通し記号(図5に示した「A」、「B」、「C」、…など)を特定する。そして、特定した通し記号が割り当てられている付加信号、プロファイル情報を特定する。
そして、再生対象の符号化音声信号は、メモリ201から読み出されてAAC復号処理部1に供給され、上述したように特定された付加信号とプロファイル情報とは付加信号復号部23に供給される。AAC復号部1は、図1、図7、図9に示したAAC復号処理部1と同様に構成されたものであり、また、付加信号復号処理部23は、図2、図7、図9に示した付加信号復号処理部23と同様に構成されたものである。また、加算部3は、図1、図7、図9に示した加算部3と同様に構成されたものである。
これにより、AAC復号処理部1において復号処理された音声信号と付加信号復号部23において復号処理された付加信号とが加算部3において加算処理され、図6Cに示したように、符号化音声信号が復号されて形成された音声信号と、復号された付加信号とが加算されて高品位とされた音声信号が形成され、これが再生することができるようにされる。
また、符号化音声信号は、例えば、一般に流通する楽曲などであり、コピー制限がある場合もある。しかし、付加信号は、符号化音声信号を解析することにより、生成することができるものであり、しかも符号化音声信号とセットで用いないと意味をなさない。このため、付加信号やプロファイル情報については、基本的にコピー制限されることはないので、コピー回数を気にする必要がなく、符号化音声信号を利用する可能性のある種々の機器に予め容易して利用することもできる。
[付加信号等の生成処理のプログラム化について]
図3を用いて説明した付加信号生成処理部21の機能は、プログラム(ソフトウェア)によっても実現可能である。図11は、付加信号生成処理部21の付加信号を生成する処理系の機能を実現するプログラムの例を説明するためのフローチャートである。この図11に示す処理は、例えば、パーソナルコンピュータや音響記録再生装置など、符号化音声信号を処理する電子機器の信号処理部等において実行されるものである。
図3を用いて説明した付加信号生成処理部21の機能は、プログラム(ソフトウェア)によっても実現可能である。図11は、付加信号生成処理部21の付加信号を生成する処理系の機能を実現するプログラムの例を説明するためのフローチャートである。この図11に示す処理は、例えば、パーソナルコンピュータや音響記録再生装置など、符号化音声信号を処理する電子機器の信号処理部等において実行されるものである。
ここで、信号処理部は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などがCPUバスを通じて接続されて形成されたマイクロコンピュータなどであり、デジタル音声信号についての処理が可能なものである。そして、信号処理部のCPUは、所定の符号化音声信号についての付加信号を生成することが指示されると、図11に示す処理を実行し、まず、目的とする符号化音声信号を取得する処理を開始する(ステップS101)。このステップS101の処理は、付加信号の生成が指示された符号化音声信号を記録媒体から順次に読み出す処理に相当する。
次に、CPUは、読み出した符号化音声データについてハフマン復号化処理を施し(ステップS102)、逆量子化処理を行い(ステップS103)、さらにリスケーング処理(再スケーリング処理)を行って(ステップS104)、量子化処理前のMDCT係数に復元する。
そして、CPUは、図1を用いて説明したAAC復号処理部1のステレオ処理部13の各部において行われるM/Sステレオ処理、予測処理、インテンシティ・ステレオ処理、TNS処理を行うようにして、MDCT処理直後のMDCT係数を復元する(ステップS105)。この復元したMDCT係数に基づいて、ある周波数を境に、高域全体がカットされている場合の境界周波数を検出する処理を行う(ステップS106)。このステップS106の処理は、上述もしたように、符号化音声信号の例えばビットレートや機器の性能等の情報に基づいて予め決められたものを用いるなどのことができるようにされる。
次に、CPUは、境界周波数以降の高域における、高域信号を追加する帯域幅を決定する(ステップS107)。そして、CPUは、決定した追加帯域に応じて、符号化により除去された高域部分の音声信号を生成する(ステップS108)。そして、目的とする符号化音声信号の全体を対象として、付加信号の形成が終了したか否かを判断する(ステップS109)。
ステップS109の判断処理において、付加信号の生成が終了していないと判断したときには、ステップS102からの処理を繰り返す。ステップS109の判断処理において、付加信号の生成が終了したと判断したときには、この図11に示す処理を終了する。
このように、符号化音声信号が符号化された場合に除去されてしまった高域部分の音声信号である付加信号は、図11に示したように、プログラムを実行することにより生成することができる。すなわち、付加信号の生成は、プログラムによっても実現することができる。
また、プロファイル情報についても、プログラムによって生成することができる。図12は、付加信号生成処理部21のプロファイル情報を生成する処理系の機能を実現するプログラムの例を説明するためのフローチャートである。この図12に示す処理は、図11を用いて上述した付加信号の生成処理と並行するようにして信号処理部等において実行される処理である。
そして、信号処理部のCPUは、所定の符号化音声信号についての付加信号を生成することが指示されると、図12に示す処理をも実行し、付加信号固有の情報、例えば、復号装置の名称、バージョンナンバー、付加信号の作成日時などの情報を取得し(ステップS201)、これらからなるプロファイル情報を形成して(ステップS202)、これを付加信号記憶部22に供給する。
なお、上述もしたように、復号装置の名称、バージョンナンバーといった復号装置に関する固定的な情報は、復号装置のROMなどに記録されているものを取得すればよい。また、付加信号の作成日時などの日時情報は、時計回路から取得する。このように、プロファイル情報に必要な情報は、付加信号を生成する装置が元々備える種々の情報や取得可能な種々の情報を用いるようにすることができる。
このように、付加信号の生成処理やプロファイル情報の生成処理はプログラムによっても実現できるため、例えば、パーソナルコンピュータなどにおいて、符号化音声信号を管理すると共に、図11、図12に示した処理を実行するプログラムによって付加信号やプロファイル情報を生成し、これを利用するようにするなどのことが可能となる。また、既存の音声信号記録再生装置に、付加信号やプロファイル情報の生成機能を追加することも可能となる。
なお、図には示さなかったが、付加信号やプロファイル情報を生成して、これを記録媒体に記録するようにした場合には、処理の対象となった符号化音声信号の識別情報と、生成した付加信号の識別情報と、生成したプロファイル情報とのそれぞれに対して、同じ通し記号や通し番号を付与して、図5に示したような管理テーブルを作成し、これをも記録媒体に記憶保持する処理までをもプログラム(ソフトウェア)によって実現することももちろん可能である。
また、この実施の形態においては、付加信号の生成とプロファイル情報の生成とを異なりプログラムによって行うものとして説明したが、これに限るものではない。例えば、付加信号の生成後に、プロファイル情報を生成することも可能である。したがって、図11に示した処理により付加信号を生成し、この生成した付加信号を記録媒体に記録した後に、図12に示した処理を実行してプロファイル情報を作成し、この作成したプロファイル情報を記録媒体に記録し、さらに、上述もしたように、処理の対象となった符号化音声信号の識別情報と、生成した付加信号の識別情報と、生成したプロファイル情報とのそれぞれに対して、同じ通し記号や通し番号を付与して、図5に示したような管理テーブルを作成し、これを記録媒体に記憶する処理まで行うプログラムを作成することも可能である。
[付加信号生成処理部21の他の構成例について]
[第1の他の構成例]
図3を用いて説明した付加信号生成処理部21は、圧縮符号化されて形成された中低域の符号化音声信号のみから高域信号を復元するようにしている。しかし、符号化音声信号は、圧縮符号化処理によりカットされた部分を含む場合がある。このため、既存の中低域の符号化音声信号のみからでは、高域信号を高品位に復元することができない場合があると考えられる。
[第1の他の構成例]
図3を用いて説明した付加信号生成処理部21は、圧縮符号化されて形成された中低域の符号化音声信号のみから高域信号を復元するようにしている。しかし、符号化音声信号は、圧縮符号化処理によりカットされた部分を含む場合がある。このため、既存の中低域の符号化音声信号のみからでは、高域信号を高品位に復元することができない場合があると考えられる。
図13は、圧縮符号化されて形成された中低域の符号化音声信号のみから高域信号を復元する場合について説明するための概念図である。図13Aにおいて点線で示すように、圧縮符号化されて形成されたデジタル音声信号であって、復号処理の対象となる(元になる)既存の中低域の音楽信号自体がある箇所でカットされている場合、そのカットされた状態の音声信号を使って高域信号を作成しても、結局、図13Bに示すように、作成された高域信号は点線で示すようにカットされた部分が含まれてしまうので充分なものとは言えない。
そこで、以下に説明する付加信号生成処理部21の他の構成例の場合には、圧縮符号化された中低域の既存の符号化音声信号だけでなく、当該中低域の既存の符号化音声信号において、圧縮符号化処理によりカットされた可能性のある音声信号を復元し、これをも考慮して、高域信号を生成するようにしている。
図14は、付加信号生成処理部21の他の構成例である付加信号生成処理部21Aを説明するためのブロック図である。図14に示した付加信号生成処理部21Aにおいて、図3に示した付加信号生成処理部21の場合と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明は省略する。
図14に示すように、この例の付加信号生成処理部21Aは、ハフマン復号化部211、逆量子化部212、リスケーリング部213、ステレオ処理部214、プロファイル情報作成処理部218を備えると共に、ステレオ処理部214の後段に欠落信号復元部300が設けられたものである。欠落信号復元部300は、予測生成処理部301と、高域追加処理部302とを備えたものである。
ハフマン復号化部211、逆量子化部212、リスケーリング部213のそれぞれは、図1に示したAAC復号処理部1の逆量子化処理部12のハフマン復号化部121、逆量子化部122、リスケーリング部123のそれぞれと同様のものであり、フォーマット解析部11からの符号音声信号(MDCT係数)に対する逆量子化処理を行って、量子化処理前のMDCT係数を復元する部分である。
ステレオ処理部214は、図1に示したステレオ処理部13と同様の処理を行う部分である。すなわち、ステレオ処理部214は、符号化時とは逆に、M/Sステレオ処理、予測処理、インテンシティ・ステレオ処理、TNS処理の各処理を行って、MDCT処理された直後のMDCT係数を復元し、復元したMDCT係数を欠落信号復元部300の予測生成処理部301に供給する。
欠落信号復元部300の予測信号生成処理部301に供給されるMDCT係数は、図15Aに示すように、圧縮符号化処理により形成された中低域のものであり、高域成分がカットされると共に、図15Aにおいて点線で示したように、ユーザーの聴感上、影響が小さい部分についてもカットされているものである。
このため、予測生成処理部301は、詳しくは後述もするが、これに供給されるMDCT係数に基づいて、圧縮符号化時においてカットされた可能性のあるMDCT係数部分を検出する。具体的には、値がゼロであるMDCT係数部分を検出する。そして、当該MDCT係数部分を含むフレームの前後のフレームにおける対応するMDCT係数に基づいて、カットされたであろうMDCT係数の値を予測して求める。この処理が、カットされたであろう音声データの予測と生成処理に該当する。
そして、予測生成処理部301は、予測して生成したMDCT係数が、値がゼロであったMDCT係数部分の分解能よりも小さければ、当該予測して生成したMDCT係数を補間データとして採用し、当該分解能よりも大きい場合には、そのような値のMDCT係数がカットされるのは本来的におかしいので、予測が失敗したと判断し、当該予測して生成したMDCT係数は採用しないようにする。
このようにして、カットされた可能性のあるMDCT係数を予測して生成し、この予測して生成したMDCT係数が分解能以下である場合には、これを補間データとして用いることによって、図15Bに示すように、分解能以下であるためにカットされた部分のMDCT係数が補間された中低域のMDCT係数(変調周波数帯域のMDCT係数(音声データ))を形成することができる。
そして、上述したように、カットされた可能性のあるMDCT係数が補間された中低域のMDCT係数は、欠落信号復元部300の高域追加処理部302に供給される。高域追加処理部302では、例えば、図15Bに示した中低域のMDCT係数のうち、図15Aにおいて範囲aで示した部分のMDCT係数を用いて、圧縮符号化時にカットされた高域側のMDCT係数を復元する。
図15Aにおいては、範囲aには点線で示した符号化時にカットされた可能性のある部分が存在していたが、図15Bに示すように、範囲aの符号化時にカットされた可能性のある部分は、予測生成処理部301の機能により補間されている。このため、範囲aのMDCT係数を用いて、圧縮符号化処理によりカットされた高域側のMDCT係数を復元するようにすると、図13を用いて上述した場合のように、カットされた可能性のあるMDCT係数部分をそのまま残すことなく、図15Cにおいて、範囲b、範囲cに示すように、カットされた高域のMDCT係数を信頼性高く復元することができるようにしている。
この後、図15Cに示したように、復元された高域信号(MDCT係数)は、高域追加処理部302から図2に示したように、付加信号記録部22に供給され、所定の記録媒体の記録領域に記録されると共に、付加信号復号処理部23において復号化処理が施され、時間軸領域の音声信号である時間音声信号に変換されて、図1を用いて説明したように、加算部3に供給されて、ゲイン制御部15からの復号化された中低帯域の音楽信号と加算処理され、低域、中域、高域の全ての帯域からなる時間音声信号を復元することができるようにしている。
このように、この他の構成例の付加信号生成処理部21Aにおいては、まず、中低域の符号化音声信号のカットされた可能性のある部分の検出と、その部分の音声データの予測と生成とを行い、この生成した音声データを含めた中低域の符号化音声信号(デジタル音声信号)を用いて高域の音声データ(高域信号)の生成と追加とを行うことによって、符号化音声信号(圧縮符号化されたデジタル音声信号)から、圧縮符号化前の高品位のデジタル音声信号を復元することができるようにしている。
そして、圧縮符号化前の状態に復元されたデジタル音声信号を再生するようにした場合には、従来の方式を用いて復元したデジタル音声信号を再生した場合よりも、圧縮符号化によりカットされた(欠落した)部分を少なくすることができるので、音質のよい音声を再生することができる。
[予測生成処理部301での処理の詳細]
次に、この構成例の欠落信号復元部300の予測生成処理部301で行われる処理の詳細について、図16〜図18を用いて説明する。この構成例の予測生成処理部301においては、圧縮符号化することによりカットされた可能性のある信号(欠落信号)の予測方法として、最小二乗法を使って近似式を作成する予測方法を用いる。
次に、この構成例の欠落信号復元部300の予測生成処理部301で行われる処理の詳細について、図16〜図18を用いて説明する。この構成例の予測生成処理部301においては、圧縮符号化することによりカットされた可能性のある信号(欠落信号)の予測方法として、最小二乗法を使って近似式を作成する予測方法を用いる。
上述もしたように、用いている圧縮符号化方式は、MPEG2−AAC方式であり、1024サンプルを1フレームとして直交変換し、MDCT係数1024個を得る。そのMDCT係数を1フレーム単位で圧縮した信号がAACの符号化信号となる。MDCT係数は周波数領域の信号として扱われ、1フレームに1024個あるMDCT係数の0番目から1023番目は、周波数領域0Hzから24Hz(48kHzサンプリングの音声信号を用いているため)における音声信号に対応しており、縦軸は振幅である。
例えば、MDCT係数の100番目の係数値は、24000Hz/1024×100=2343.75Hzにおける音声信号を表す。MDCT係数の分布が周波数領域を表現していることから、前後のフレーム間、また、1フレーム内の前後のMDCT係数間にはそれぞれ相関関係が生じる。
ここでは、説明を簡単にするため、ある音楽の音声データをAAC方式で圧縮符号化した場合に、nフレーム目(フレーム[n])のMDCT係数のk番目(MDCT係数[k])が、圧縮処理により値「0」になってしまった、即ち、欠落してしまった場合を例にして、そのフレーム[n]のMDCT係数[k]を、近似式を使って予測する方法について説明する。
図16は、AAC方式で圧縮符号化されたデジタル音声信号において、フレーム[n]のMDCT係数[k]が欠落している場合を説明するための概念図である。図16においては、図16Cのフレーム[n]の前後各2フレーム(図16A、図16B、及び、図16D、図16E)におけるMDCT係数[k]は存在するが、フレーム[n]のMDCT係数[k]だけが値「0」となって欠落している場合を示している。
このように、MDCT係数の値が「0」になっている部分は、圧縮符号化処理により元々の音声信号がカットされ欠落した可能性のある部分である。この構成例の欠落信号復元部300の予測生成処理部301は、まず、圧縮符号化によりカットされた可能性の高い、値が「0」であるMDCT係数部分を検出し、その部分のMDCT係数を予測して復元するようにしている。
図17は、図16に示した5つのフレームのMDCT係数[k]を2次元の座標軸上に表現し、近似式を作成する場合について説明するための図である。フレーム[n]のMDCT係数[k]に対応する、当該フレーム[n]の前後各2フレームにおけるMDCT係数[k]を取得し、それぞれフレーム[n−2]のMDCT係数[k]をA、フレーム[n−1]のMDCT係数[k]をB、フレーム[n]のMDCT係数[k]をC、フレーム[n+1]のMDCT係数[k]をD、フレーム[n+2]のMDCT係数[k]をEとする。
図17に示したA〜Eまでの5点は、連続する5つのフレーム内の同じ周波数位置の信号を表している。この5点における最小二乗法による2次多項式を作成し、それを近似式とする。図3に示したように、振幅が、C=0は既知であり、それぞれ例えば、A=5、B=3、D=4、E=5であったとすると、これらを連続する5点の座標に見立て、それぞれA=(−2,5)、B=(−1,3)、C=(0,0)、D=(1,4)、E=(2,5)とおき、最小二乗法を用いて近似式を求める。
求めた近似式から、フレーム[n]のMDCT係数[k]、即ちCの予測値を求める。ここでは、図17にも示したように、近似式は、y=0.93x**2+0.1x+1.54となり、この近似式から点Cの予測値(予測したMDCT係数)を求めると、C≒1.54となる。なお、近似式における「x**2」は、xの二乗を意味する記述である。
続いて、ここで予測した点Cの予測値(予測したMDCT係数)が妥当であるかを調べる。図18は、フレーム[n]のMDCT係数[k]の分解能と予測値との関係を示す図である。この構成例においては、上述したように求めた予測値の絶対値が、フレーム[n]におけるMDCT係数[k]での分解能以下であった場合に、この予測値をフレーム[n]におけるMDCT係数[k]として採用する。すなわち、フレーム[n]の周波数位置[k]における音声信号として予測値を採用する。
一方、上述したように求めた予測値の絶対値が、分解能より大きかった場合には、予測は失敗したとして、当該予測値を音声信号として採用しない。すなわち、圧縮符号化時において、MDCT係数がカットされるということは、分解能以下の大きさの値であったからであり、分解能以上の大きな値である場合には、そもそもカットされることは無いので、欠落したままの状態を保つこととする。
ここでは、図18に示すように、フレーム[n]のMDCT係数[k]における分解能が2であったとすると、予測値C=1.54は2以下であるので、C=1.54は、フレーム[n]の[k]番目のMDCT係数として採用される。上述もしたように、音声信号が欠落するということは、元の音声信号の振幅が分解能以下であったため、既定の分解能では表現できず、0となってしまうことである。よって、予測値は必ず分解能以下の値を採用するのが理論上正しい。
このようにして、この構成例の予測生成処理部301は、各フレームにおいて、圧縮符号化によりカットされた可能性のある部分を検出し、カットされた可能性のある信号(欠落信号)として、MDCT係数を予測して生成していく処理を行う。
次に、この第1の実施の形態の処理装置の欠落信号復元部300の予測生成処理部301において行われる予測生成処理について、図19のフローチャートを参照しながら説明する。図19は、予測生成処理部301において行われる予測生成処理を説明するためのフローチャートである。
図16〜図18を用いて前述したように、まず、各フレームにおいて、圧縮符号化によりカットされた可能性のある部分(MDCT係数部分)を検出し、検出したカットされた可能性のある部分について、その前後の2フレームの対応する部分の値(MDCT係数)を予測する処理について説明する。換言すれば、この第1の実施の形態において用いる予測生成処理は、連続する5フレームにおいて、その真中の3フレーム目(フレーム[n])にカットされた可能性のある部分を位置付けて、この3フレーム目(フレーム[n])を常に予測するものである。
そして、図19に示すように、この構成の予測生成処理部301の場合には、前処理として、処理の対象となったフレームをフレーム[n]として、その前後2フレーム分の0〜1023までの全てのMDCT係数を予め取得しておく(ステップS300)。換言すれば、カットされた部分の検索対象のフレームをフレーム[n]とした場合に、5フレーム分(フレーム[n−2]、フレーム[n−1]、フレーム[n]、フレーム[n+1]、フレーム[n+2])のMDCT係数を予め取得しておく処理が、図6に示したステップSS100の処理である。そして、フレーム[n]を構成する0〜1023までのMDCT係数の内、値が0であるMDCT係数を検出する処理を行うようにする。
すなわち、予測生成処理部301は、まず、変数kに値0を代入することにより初期化し(ステップS301)、MDCT係数[k]の値が、値0か否かを判断する(ステップS302)。ステップS302の判断処理において、MDCT係数[k]の値が値0であると判断した場合には、当該MDCT係数[k]は、圧縮符号化時において、カットされ欠落した可能性があるので、予測生成処理部301は、上述もしたように、ステップS300において、予め取得しておいた前後各2フレームにおける対応する周波数位置のMDCT係数[k]を取得する(ステップS303)。
そして、予測生成処理部301は、図17を用いて説明したように、自フレーム(フレーム[n])のMDCT係数[k]と、前後2フレームの対応する部分のMDCT係数[k]の計5点のMDCT係数を用いて、最小二乗法による近似式を作成する(ステップS304)。
次に、ステップS304において作成した近似式に基づいて、フレーム[n]におけるMDCT係数[k]の値を予測して生成する(ステップS305)。そして、予測生成処理部301は、ステップS305において予測して生成したMDCT係数[k]が、その予測した部分の分解能以下か否かを判断する(ステップS306)。
ステップS306の判断処理において、予測して生成したMDCT係数[k]が、分解能以下であると判断したときには、予測生成処理部301は、ステップS305において予測して生成したMDCT係数[k]をフレーム[n]におけるMDCT係数[k]の値として採用して記録する(ステップS307)。
そして、予測生成処理部301は、変数kに1を加算し(ステップS308)、変数kが1024よりも小さいか否かを判断する(ステップS209)。ステップS209の判断処理において、変数kが1024よりも小さいと判断したときには、処理対象のフレーム[n]の全てのMDCT係数を対象とする処理は終わっていないので、予測生成処理部301は、ステップS302からの処理を繰り返すようにする。
また、ステップS309の判断処理において、変数kが1024よりも小さくないと判断したときには、処理対象のフレーム[n]の全てのMDCT係数を対象とする処理が終了したので、当該フレーム[n]について、高域追加処理を実行するようにする。そして、この図6を用いて説明した処理を、再生などの処理対象となっている圧縮符号化されたデジタル音声信号の全てのフレームについて実行することによって、当該デジタル音声信号の全体について、圧縮符号化によりカットされた音声信号を復元し、これを利用することができるようにされる。
[高域追加処理部302での処理の詳細]
次に、高域追加処理部302において行われる高域追加処理について説明する。図20は、高域追加処理部302の構成例を説明するためのブロック図である。図20に示すようにこの例の高域追加処理部302は、図3に示した境界周波数検出部215と、追加帯域決定部216と、高域信号生成部217との機能を備えたものである。
次に、高域追加処理部302において行われる高域追加処理について説明する。図20は、高域追加処理部302の構成例を説明するためのブロック図である。図20に示すようにこの例の高域追加処理部302は、図3に示した境界周波数検出部215と、追加帯域決定部216と、高域信号生成部217との機能を備えたものである。
上述したように、予測生成処理部141において、カットされた可能性のあるMDCT係数として予測されて生成されたものの内、分解能以下のものが追加するようにされた中低域のMDCT係数が、高域追加処理部302の境界周波数検出部215に供給される。
境界周波数検出部215は、これに供給されたMDCT係数について、ある周波数を境に、高域全体がカットされている場合の境界周波数(下限側の境界周波数)を検出する。上述もしたように、境界周波数検出部215においては、所定の条件にしたがって予め決められた境界周波数を用いるようにするなどのことができるようにされる。
この実施の形態処理装置において、復号処理の対象となっている符号化音声信号は、上述もしたように、ビットレートが128kbpsで圧縮符号化されたものであるため、境界周波数波は、約16kHzであるものとしている。すなわち、約16kHz以上の高域部分の音声信号がカットされ、劣化してしまっているものであると特定する。
追加帯域決定部216は、境界周波数以降の高域における、高域信号を追加する帯域幅を決定する。上述もしたように、境界周波数が15kHz以上であった場合には、境界周波数以降の全帯域に高域信号を追加するようにしている。
この実施の形態において、境界周波数検出部215で検出された境界周波数は、上述もしたように、16kHzであり、予め決められた条件である「境界周波数が15kHz以上であること」を満たしているため、追加帯域決定部216においては、16kHz以降に高域信号(高域部分の符号化音声信号)を追加するようにする。
また、この第1の実施の形態においては、上述もしたように、48kHzサンプリングの音声信号を用いているため、追加する上限の周波数はサンプリング周波数の1/2(2分の1)である24kHzとする。よって、16kHzから24kHzまでが、この第1の実施の形態における高域信号の追加帯域となる。
高域信号生成部217は、追加する高域信号を計算により生成する。この高域信号生成部217においては、上述もしたように、例えば、特許第3646657号「デジタル信号処理装置及びデジタル信号処理方法、並びに1ビット信号生成装置」に開示された技術を用いて、追加する高域信号(MDCT係数)を生成する。
具体的には、境界周波数検出部215において求められた境界周波数における信号の振幅値から、上限周波数(この実施の形態においては24kHz)における信号の振幅値を「0(零)」として、周波数特性傾きを算出する。次に、この実施の形態においては、下限周波数として10.5kHzを設定し、10.5kHzから下限側の境界周波数(この第1の実施の形態においては16kHz)までの信号をバッファリングし、スペクトル複製、ゲイン算出、ゲイン調整の各処理を行って、追加用の高域信号(MDCT係数)を生成する。
そして、高域信号生成部217で生成された高域信号が、付加信号として出力するようにされる。これが、図2を用いて説明したように、付加信号記録部22に供給され、所定の記録媒体に記録保持されると共に、付加信号復号処理部23に供給されて、逆MDCT変換されることにより時間軸領域の音声信号(時間音声信号)に変換され、ゲイン調整された後に、加算部3に供給され、ゲイン制御部15からの時間音声信号と加算処理されることになる。
なお、図1に示したAAC復号処理部1の適応ブロック長切換逆MDCT部14の前段に予測生成処理部301を設け、圧縮符号化処理の過程においてカットされた可能性のあるMDCT係数を予測して生成し、このうち理論的に適正なMDCT係数のみを、中低域のMDCT係数として採用することにより、基本となり中低域のMDCT係数自体の品位を向上させるようにすることもできる。このようにすることによって、低域、中域、高域の全ての帯域の音声信号の高品位化を図ることができる。
[第1の他の構成例の変形例]
図14〜図20を用いて説明した第1の他の構成例は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合において、図2に示した付加信号生成部2における付加信号生成処理部21の構成を図14に示したように予測生成処理部301と、高域追加処理部302とを設けるようにしたものである。
図14〜図20を用いて説明した第1の他の構成例は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合において、図2に示した付加信号生成部2における付加信号生成処理部21の構成を図14に示したように予測生成処理部301と、高域追加処理部302とを設けるようにしたものである。
しかし、予測生成処理部301と、高域追加処理部302とを設ける構成は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合にのみ適用可能なものではない。例えば、図21に示すように、AAC復号処理部1の後段に、付加信号生成部2を設けるような構成とすることも可能である。このようにする場合には、圧縮復号化処理とは別個独立に付加信号を生成することができるので、復号処理の制約を受けることがないようにすることができる。
図21に示すように、AAC復号処理部1は、図1に示したAAC復号処理部1と同様に構成されたものである。但し、説明を簡単にするため、M/Sステレオ処理部131と、予測処理部132と、インテンシティ・ステレオ処理部133と、TNS部134とからなるステレオ処理部13は、1つのブロックで表している。したがって、図21において、図1に示したAAC処理部1と同様に構成される部分には、同じ参照符号を付し、それらの詳細な説明については省略する。
そして、AAC復号処理部1において復号処理され、ゲイン制御部15から出力される時間軸領域の音声信号(時間音声信号)は、MDCT部17に供給される。MDCT部17は、これに供給された時間音声信号を再度MDCT変換して周波数軸領域の音声信号に変換し、これを欠落信号復元部310に供給するものである。
欠落信号復元部310は、図14に示した欠落信号復元部300の場合と同様に、中低域のMDCT係数においての欠落信号を予測して生成する予測生成処理部301と、欠落信号が補間された中低域のMDCT係数に基づいて、高域信号を生成する高域追加処理部312とを備えたものである。
予測生成処理部301は、図14に示した予測生成処理部301と同様に構成されたものであるので、同じ参照符号を詳細な説明については省略する。すなわち、図21に示す予測生成処理部301もまた、図19を用いて説明した処理を実行し、上述もしたように、中低域のMDCT係数において、圧縮符号化処理においてカットされた可能性のあるMDCT係数を予測して生成し、この内、理論的に妥当なものを補間データとして採用する処理を行う。
高域追加処理部312は、基本的には、図14に示した高域追加処理部302の場合と同様に、カットされた可能性のあるMDCT係数が補間された中低域のMDCT係数に基づいて、圧縮符号化処理によりカットされた高域信号を生成する処理を行うものであるが、これに加えて、図2に示した付加信号生成部2の付加信号記録部22と、さらには、加算部3の機能をも合わせ持つように構成したものである。
図22は、図21に示した高域追加処理部312の構成例を説明するためのブロック図である。この場合の高域追加処理部312は、図22に示すように、一時記憶メモリ3121と、境界周波数検出部215と、追加帯域決定部216と、高域信号生成部217と、付加信号記録部22と、高域信号合成部3122とを備えたものである。
図22において、境界周波数検出部215と、追加帯域決定部216と、高域信号生成部217とは、図3、図20に示した境界周波数検出部215と、追加帯域決定部216と、高域信号生成部217と同様に構成され、同様の機能を実現するものである。また、図22において、2重線で示した付加信号記録部22は、図2、図4に示した付加信号記録部22と同様に構成され、同様の機能を実現する部分である。
そして、図22に示した高域追加処理部312の場合には、上述したように、予測生成処理部301において、カットされた可能性のあるMDCT係数として予測されて生成されたものの内、分解能以下のものが追加するようにされた中低域のMDCT係数は、フレーム単位に高域追加処理部312の一時記憶メモリ3121に一時記憶される。
境界周波数検出部215は、この例の場合にも、復号処理の対象となっている符号化音声信号は、上述もしたように、ビットレートが128kbpsで圧縮符号化されたものであるため、境界周波数波は、約16kHzであるものとする。すなわち、復号処理する符号化音声信号は、約16kHz以上の高域部分の音声信号がカットされ、劣化してしまっているものであると特定する。
なお、一時記憶メモリ3121にフレーム単位に一時記憶されているMDCT係数を順次に読み出し、当該MDCT係数やその他の情報に基づいて、演算等により、ある周波数を境に、高域全体がカットされている場合の境界周波数(下限側の境界周波数)を検出することができる場合には、これにより境界周波数を特定するようにしてもよい。
追加帯域決定部216は、境界周波数以降の高域における、高域信号を追加する帯域幅を決定する。この例においても、境界周波数が15kHz以上であった場合には、境界周波数以降の全帯域に高域信号を追加するようにしている。
そして、この例においても、この実施の形態において、境界周波数検出部215で検出された境界周波数は、上述もしたように、16kHzであり、予め決められた条件である「境界周波数が15kHz以上であること」を満たしているため、追加帯域決定部216においては、16kHz以降に高域信号(高域部分の符号化音声信号)を追加するようにする。また、上述もしたように、48kHzサンプリングの音声信号を用いているため、追加する上限の周波数はサンプリング周波数の1/2(2分の1)である24kHzとする。よって、16kHzから24kHzまでが、この例の場合においても高域信号の追加帯域となる。
高域信号生成部217は、追加する高域信号を計算により生成する。この高域信号生成部217においては、上述もしたように、例えば、特許第3646657号「デジタル信号処理装置及びデジタル信号処理方法、並びに1ビット信号生成装置」に開示された技術を用いて、追加する高域信号(MDCT係数)を生成する。
そして、高域信号生成部424で生成された高域信号は、付加信号記録部22に供給される。付加信号記録部22は、図4を用いて説明したように構成される部分であり、付加信号とプロファイル情報の供給を受けて、これらを所定の記録媒体の所定のエリアに記録すると共に、これらの情報から管理テーブルを作成し、これを所定の記録媒体の所定のエリアに記録するものである。
なお、ここでは、プロファイル情報を作成する部分については説明を省略したが、図3を用いて説明したように、高域信号である付加信号の生成処理と並行して実行され、この付加信号記録部22に供給するようにされている。
そして、付加信号記録部22の機能により、所定の記録媒体の所定の記録エリアに記録するようにされた付加信号は、高域信号合成部3122にも供給するようにされる。高域信号合成部3122は、フレーム単位に一時記憶メモリ3121に記憶保持されている中低域のMDCT係数を読み出し、フレーム単位の中低域の音声信号に対して、付加信号である高域信号を合成し、低域、中域、高域の全帯域の音声信号からなる高品位の音声信号を復元することができるようにされる。
このようにして、全帯域のMDCT係数が復元するようにされた音声信号は、図21に示した逆MDCT部18に供給され、ここで逆MDCT変換されて、再度、時間軸領域の音声信号(時間音声信号)に変換される。この時間音声信号は、上述もしたように、低域、中域、高域の全帯域の音声信号が復元され、しかも、中低域部分においてカットされた可能性のある音声信号をも復元することができるので、高品位の音声を再生することが可能な音声信号を復元することができる。
[第2の他の構成例]
図14を用いて説明した付加信号生成部21Aの場合には、圧縮符号化されて形成された中低帯域の既存のMDCT係数において、圧縮符号化処理によりカットされた可能性のあるMDCT係数を復元した後に、付加信号となる高域信号を復元するようにした。しかし、これに限るものではない。
図14を用いて説明した付加信号生成部21Aの場合には、圧縮符号化されて形成された中低帯域の既存のMDCT係数において、圧縮符号化処理によりカットされた可能性のあるMDCT係数を復元した後に、付加信号となる高域信号を復元するようにした。しかし、これに限るものではない。
まず、圧縮符号化処理によりカットされた高域信号を復元し、さらに、中低域部分をも含めてカットされた可能性のある部分をも予測して生成し、理論的に正常なものを補間データとして採用することによって、付加信号としての高域信号を高品位なものとして生成することができる。
図23は、付加信号生成処理部21の他の構成例である付加信号生成処理部21Bを説明するためのブロック図である。図23に示した付加信号生成処理部21Bにおいて、図3に示した付加信号生成処理部21の場合と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明は省略する。
図23に示すように、この例の付加信号生成処理部21Bは、ハフマン復号化部211、逆量子化部212、リスケーリング部213、ステレオ処理部214、プロファイル情報作成処理部218を備えると共に、ステレオ処理部214の後段に欠落信号復元部320が設けられたものである。欠落信号復元部320は、高域追加処理部302と、予測生成処理部301とを備えたものである。
ハフマン復号化部211、逆量子化部212、リスケーリング部213のそれぞれは、図1に示したAAC復号処理部1の逆量子化処理部12のハフマン復号化部121、逆量子化部122、リスケーリング部123のそれぞれと同様のものであり、フォーマット解析部11からの符号音声信号(MDCT係数)に対する逆量子化処理を行って、量子化処理前のMDCT係数を復元する部分である。
ステレオ処理部214は、図1に示したステレオ処理部13と同様の処理を行う部分である。すなわち、ステレオ処理部214は、符号化時とは逆に、M/Sステレオ処理、予測処理、インテンシティ・ステレオ処理、TNS処理の各処理を行って、MDCT処理された直後のMDCT係数を復元し、復元したMDCT係数を欠落信号復元部320の高域追加処理部302に供給する。
図24は、この第2の構成例の付加信号生成処理部21Bの欠落信号復元部320において行われる処理を説明するための図である。図24Aに示すように、この第2の構成例の付加信号生成処理部21において、欠落信号復元部320の高域追加処理部302に供給されるMDCT係数は、圧縮符号化処理により形成された中低域のものであり、高域成分がカットされると共に、図24Aにおいて点線で示したように、ユーザーの聴感上、影響が小さい部分についてもカットされているものである。
このため、まず、高域追加処理部302の機能を用い、図24Aに示した範囲aのMDCT係数に基づいて、図24Bに示すように、範囲b、範囲cに示した高域信号を復元する。高域追加処理部302は、図14に示した第1の構成例の高域追加処理部302と同様の構成を有するものである。
したがって、図23に示した高域追加処理部302においては、図20を用いて説明した第1の構成例の高域追加処理部302の場合と同様に、フレーム単位に境界周波数を検出し、追加帯域を決定し、これに応じて高域信号を生成することによって、図10Bに示すように、高域信号を復元する。
しかし、図23に示した高域追加処理部302において形成されて出力されるMDCT係数は、図10Bにおいて、点線で示したように、圧縮符号化によりカットされた可能性のある部分が残った状態のままである。このため、欠落信号復元部320の予測生成処理部301が、圧縮符号化によりカットされた可能性のある部分を復元する。
すなわち、この第2の構成例の予測生成処理部301は、図16〜図19を用いて説明した第1の構成例の予測生成処理部301の場合と同様の機能を有するものであり、高域追加処理部302からMDCT係数の供給を受けて、フレーム単位に、圧縮符号化によりカットされた可能性のある部分を検出し、処理対象のフレームとその前後2フレームずつのフレームの5フレーム分の対応する位置のMDCT係数を用いて、近似式を作成し、その近似式に基づいてカットされた可能性のあるMDCT係数を予測して生成し、この予測して生成したMDCT係数が分解能以下である場合に、生成した当該MDCT係数を補間データとして採用する。
このようにすることによって、図24Cに示すように、低域、中域、高域の全帯域について、圧縮符号化によりカットされた可能性のあるMDCT係数を復元し、欠落箇所のないデジタル音声データを復元することができるようにしている。このように、この第2の構成例の付加信号生成処理部21Bの予測生成処理部302は、低域、中域、高域の全帯域を対象として、圧縮符号化によりカットされた可能性のあるMDCT係数を復元し、論理的に適正なものだけを補間データとして採用することができるようにしている。
そして、図24Cに示したように、圧縮符号化によりカットされた可能性のあるMDCT係数についても復元された周波数帯域のデジタル音声信号のうち、高域信号が付加情報として出力され、これが所定の記録媒体の所定の記録エリアに記録され、必要に応じて読み出して利用することができるようにされる。
なお、この第2の構成例の付加信号生成処理部21Bを用いる場合であっても、図1に示したAAC復号処理部1の適応ブロック長切換逆MDCT部14の前段に予測生成処理部301を設け、圧縮符号化処理の過程においてカットされた可能性のあるMDCT係数を予測して生成し、このうち理論的に適正なMDCT係数のみを、中低域のMDCT係数として採用することにより、基本となり中低域のMDCT係数自体の品位を向上させるようにすることもできる。このようにすることによって、低域、中域、高域の全ての帯域の音声信号の高品位化を図ることができる。
[第2の他の構成例の変形例]
図23、図24を用いて説明した第2の構成例は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合において、図2に示した付加信号生成部2における付加信号生成処理部21の構成を図23に示したように高域追加処理部302と、予測生成処理部301とを設けるようにしたものである。すなわち、図14に示した第1の構成例の場合とでは、予測生成処理部301と、高域追加処理部302とが逆の位置に設けられているものである。
図23、図24を用いて説明した第2の構成例は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合において、図2に示した付加信号生成部2における付加信号生成処理部21の構成を図23に示したように高域追加処理部302と、予測生成処理部301とを設けるようにしたものである。すなわち、図14に示した第1の構成例の場合とでは、予測生成処理部301と、高域追加処理部302とが逆の位置に設けられているものである。
しかし、高域追加処理部302と、予測生成処理部301とを設ける構成は、図1に示したように、AAC復号処理部1と、付加信号生成部2とが並列に存在する場合にのみ適用可能なものではない。例えば、図25に示すように、AAC復号処理部1の後段に、付加信号生成部2を設けるような構成とすることも可能である。このようにする場合には、圧縮復号化処理とは別個独立に付加信号を生成することができるので、復号処理の制約を受けることがないようにすることができる。
図25に示すように、AAC復号処理部1は、図1に示したAAC復号処理部1と同様に構成されたものである。但し、説明を簡単にするため、M/Sステレオ処理部131と、予測処理部132と、インテンシティ・ステレオ処理部133と、TNS部134とからなるステレオ処理部13は、1つのブロックで表している。したがって、図25において、図1に示したAAC処理部1と同様に構成される部分には、同じ参照符号を付し、それらの詳細な説明については省略する。
そして、AAC復号処理部1において復号処理され、ゲイン制御部15から出力される時間軸領域の音声信号(時間音声信号)は、MDCT部17に供給される。MDCT部17は、これに供給された時間音声信号を再度MDCT変換して周波数軸領域の音声信号に変換し、これを欠落信号復元部330に供給するものである。
欠落信号復元部330は、図23に示した欠落信号復元部320の場合と同様に、圧縮符号化されて形成された既存の中低域のMDCT係数に基づいて、高域信号を生成する高域追加処理331と、低域、中域、高域の全帯域について、欠落信号を予測して生成して補間するようにする予測生成処理部332とを備えたものである。
高域追加処理部331は、基本的には、図20に示した高域追加処理部302の場合と同様に動作するものであり、この例の場合には圧縮符号化されて形成された既存の中低域のMDCT係数に基づいて、圧縮符号化処理によりカットされた高域信号を生成する処理を行う。
高域追加処理部331の機能により、図24Bに示したように、高域信号が復元されることにより、一応、低域、中域、高域の全帯域のMDCT係数が整えられる。しかし、このままでは、図24Bにおいて、点線で示したように、圧縮符号化処理により、分解能より低かったMDCT係数がカットされたままである。
そこで、予測生成処理部332において、低域、中域、高域の全帯域を通じて、圧縮符号化処理によりカットされた可能性のあるMDCT係数部分を検出し、予測して生成し、この生成したMDCT係数が理論的に適正なものである場合、すなわち、分解能以下である場合に、補間データとして採用し、図24Cに示したように、全帯域に渡って、カットされた可能性のあるMDCT係数を復元することができる。
このようにして復元した全帯域のMDCT係数を逆MDCT部18に供給して、逆MDCT変換を行うことにより、時間軸領域の音声信号(時間音声信号)に変換することにより、高品位に音声信号を復号することができ、これを再生することにより、高品位な音声を再生することができるようにようにされる。
また、図24Cに示したように、全帯域に渡って、カットされた可能性のあるMDCT係数を復元したMDCT係数が得られたら、付加信号として用いる高域部分を抽出し、これを付加信号記録部22に供給することにより、付加信号を所定の記録媒体の所定の記憶エリアに記憶保持することができるようにされる。
すなわち、予測生成処理部332は、図19に示したフローチャートの処理にしたがって、全帯域を処理の対象として、圧縮符号化処理によりカットされた可能性のあるMDCT係数を予測して生成し、この生成したMDCT係数の内、理論的に適正なものを補間データとして採用するようにして、図24Cに示したように、全帯域に渡ってカットされた可能性のあるMDCT係数を復元するようにする。
この後、付加信号として用いる高域信号を抽出し、これを図4に示した機能を有する付加信号記録部22に供給することによって、付加信号を所定の記録媒体の所定の記録エリアに記録する機能をも有するものである。
このように、この第2の構成例において、予測生成処理部332は、全帯域を処理対象として、全帯域を処理の対象として、圧縮符号化処理によりカットされた可能性のあるMDCT係数を予測して生成し、この内理論的に適正なMDCT係数のみを補間データとして採用するようにして、図24Cに示したように、全帯域に渡って高品位にMDCT係数を復元する機能を有するものである。そして、さらに、予測生成処理部332は、付加信号として用いる高域信号を抽出する付加信号抽出手段としての機能と、この抽出した付加信号を所定の記録媒体の所定の記録エリアに記録する付加信号記録処理手段としての機能をも合わせ持つものである。
以上、図13〜図25を用いて説明したように、圧縮符号化されて形成された中低域のMDCT係数に基づいて、付加信号として用いる高域信号を復元するのではなく、分解能以下の値であるために、圧縮符号化処理によりカットされた可能性の高いMDCT係数をも予測して生成し、この内、理論的に適正なMDCT係数のみを補間データとして用いるようにすることによって、高品位に付加信号を復元し、これを用いるようにすることができる。
また、高域信号だけでなく、低域信号や中域信号についても、圧縮符号化処理によりカットされた可能性のある部分を復元することができるので、全帯域に渡って高品位に音声信号を復号処理することができるようにされる。
また、予測生成処理部301、332の機能は、図19のフローチャートを用いて説明した処理を行うようにするプログラム(ソフトウェア)によっても実現可能である。また、高域追加処理部302、331は、図20を用いて説明したように、境界周波数検出部215、追加帯域決定部216、高域信号生成部217の各部の機能をプログラム(ソフトウェア)によって実現することも可能である。同様に、高域追加処理部312は、図22
を用いて説明したように、境界周波数検出部215、追加帯域決定部216、高域信号生成部217、付加信号記録部22、高域信号合成部3122の各部の機能をプログラム(ソフトウェア)によって実現することも可能である。
を用いて説明したように、境界周波数検出部215、追加帯域決定部216、高域信号生成部217、付加信号記録部22、高域信号合成部3122の各部の機能をプログラム(ソフトウェア)によって実現することも可能である。
このように、各処理部の機能をプログラムによって実現する場合には、処理装置に搭載されたCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、EEPROM(Electrically Erasable and Programmable ROM)などの不揮発性メモリからなるマイクロコンピュータにおいて実行可能なようにしておけばよい。
すなわち、各処理部の機能を実現するプログラムをマイクロコンピュータのROMに記憶保持されておき、必要に応じてCPUが読み出して実行するようにするが、RAMをワークエリアとして用いて、処理対象の符号化音声信号を遂次取得し、これを処理対象として、予測生成部としての機能を実行して、圧縮符号化によりカットされた可能性のある符号化音声信号を復元し、また、高域追加処理部としての機能を実行して、高品位の付加信号としての高域信号を生成することができる。
もちろん、同様にして、初めに、高域追加処理部としての機能を実行して、高域信号を生成し、この後に、予測生成部としての機能を実行して、圧縮符号化によりカットされた可能性のある符号化音声信号を復元するようにして、高品位の付加信号としての高域信号を生成することも可能である。
[高音質化信号が追加される様子について]
ここで、上述した付加信号生成処理部21の第1の他の構成例で説明した付加信号生成処理部21が用いられた復号装置において、付加信号(高音質化信号)を追加する場合の音声信号の様子について説明する。すなわち、圧縮符号化された中低域の既存の符号化音声信号だけでなく、当該中低域の符号化音声信号において、圧縮符号化処理によりカットされた可能性のある音声信号を復元し、これをも考慮して、高域信号を生成して追加するようにする場合の例である。
ここで、上述した付加信号生成処理部21の第1の他の構成例で説明した付加信号生成処理部21が用いられた復号装置において、付加信号(高音質化信号)を追加する場合の音声信号の様子について説明する。すなわち、圧縮符号化された中低域の既存の符号化音声信号だけでなく、当該中低域の符号化音声信号において、圧縮符号化処理によりカットされた可能性のある音声信号を復元し、これをも考慮して、高域信号を生成して追加するようにする場合の例である。
図26は、付加信号生成処理部21の第1の他の構成例で説明した付加信号生成処理部21が用いられた復号装置において、付加信号(高音質化信号)を追加する場合の音声信号の様子について説明するための図である。図26は、「サウンドスペクトログラム」と呼ばれ、横軸を時間、縦軸を周波数として、音声信号の強さを色の濃さで示すようにしたものである。声紋分析などに使われているものと原理は同じである。
そして、図26Aは、符号化前(エンコード前)の原音のサウンドスペクトログラムである。図26Aに示す原音(音声信号)をAAC方式、ビットレート128kbpsで符号化処理(エンコード)し、これに通常の(従来の)デコード処理を施して復元した音声信号を再生すると、図26Bに示すように、図26Aに比べ、高域が欠落し、かつ、中低域に部分的に欠落した部分を含む音声信号が復元される。低域は中域に比べ欠落が少ないのが一般的なため図26Bにおいては、まるで囲んだ部分や矢印で示した部分のように、中域における音声信号の欠落(抜け)が認識しやすいものとなっている。
そこで、図14〜図20を用いて説明した第1の他の構成例の付加信号生成処理部21を有する復号装置においては、まず、中低域の補正処理を行うことによって、図26Bにおいて中低域において部分的に発生している欠落部分を、図26Cに示すように補正(補完)する。すなわち、上述もしたように、中低域のMDCT係数からカットされた可能性のあるMDCT部分を検出し、その前後のフレームのMDCT係数からカットされたであろうMDCT係数を求めて補完するように処理する。これをデコードして再生すれば、図26Cに示すように、中低域部分に存在していた欠落部分を補完することができる。
なお、この図26に示す例においては、音声信号の欠落部分が中域に多く発生していることが確認できる。しかし、上述もしたように、低域は中域に比べ欠落が少ないのが一般的であるが、欠落部分が存在する場合もあるので、実際には中域だけでなく、音声信号の欠落部分の補完処理は、低域部分も含めた全帯域に対して行っている。
そして、カットされた可能性のある部分を補完するようにした中低域のMDCT係数から、上述したように、欠落した高域の音声信号(高域信号)を生成し、これを別途管理して、図26Cに示した中低域部分の欠落箇所が補完された中低域の音声信号に、形成した高域の音声信号を加算することにより、図26Dに示すように、中低域の欠落箇所の音声信号と、高域側の欠落した音声信号とが補完されて、図26Aに示す原音により近い音声信号を復元することができることが分かる。
図27は、原音のサウンドスペクトログラム(図27A)と、当該原音をAAC方式、ビットレート128kbpsで符号化処理(エンコード)し、これに通常の(従来の)デコード処理を施して復元した音声信号を再生した場合のサウンドスペクトログラム(図27B)と、当該原音をAAC方式、ビットレート128kbpsで符号化処理(エンコード)し、この発明の復号装置を用いてデコード処理して復元した音声信号を再生した場合のサウンドスペクトログラム(図27C)とを比較するための図である。
図27Bに示す通常のデコード処理により復元される音声信号は、高域が欠落し、中低域に欠落箇所を含んでいるが、図27Cに示すこの発明の復号装置により復元される音声信号は、中低域の欠落も補償され、高域も復元されるため、原音に近い高音質の音声信号を復元できることが分かる。
図28は、従来から行われている符号化された音声信号の高域補償方式であって、異なる方式について説明するための図である。図28A、B、C、Dは、いずれも異なる従来方式1、2、3、4によって高域補償がなされて復号処理された音声信号のサウンドスペクトログラムである。この図28に示した例の場合においても、原音は、図27Aにサウンドスペクトログラムを示したものである。
図28A、B、C、Dの各サウンドスペクトログラムと、図27Aに示した原音のサウンドスペクトログラムとを比較すると分かるように、各方式とも低中域の補間は行っていないため、各方式とも同じような空白領域が中域にあり原音のサウンドスペクトログラムとはかなり異なっていることがわかる。
そして、さらに細かく見ると、図28Aに示す従来方式1の場合、中域の補間がないため、補われた高域の強さが原音とはかなり異なっていることが分かる。また、図28Bに示す従来方式2の場合、高域を中域のコピーによって生成しているために、中域の抜け部分が高域にそのままコピーされてしまっている。
また、図28Cに示す従来方式3の場合、生成された高域成分が他方式に比べて疎である。また、図28Dに示す従来方式4の場合、生成された高域成分の高域への伸びが他方式より少なく、また疎である。
そして、同じ原音(図27A)について符号化された後に、図28A、B、C、Dに示したように従来の高域補償方式が用いられて復元された音声信号のサウンドスペクトログラムのそれぞれと、図27Cに示したこの発明の復号装置によって復元された音声信号のサウンドスペクトログラムとを比較すると分かるように、図27Cに示したこの発明の復号装置によって復元された音声信号のサウンドスペクトログラムの方が、より原音(図27A)に近いことが分かり、この発明の有効性が十分に確認された。
[実施の形態の効果等]
なお、符号化音声信号の高音質化を考えると、一番単純には、圧縮された符号化音声の音質を向上する処理を施した後の音声信号を記録媒体に記録保存し利用することが考えられる。しかし、高音質化し、さらに符号化されてない状態の音声信号の全部を記憶保持しておくことは、記録媒体の記憶容量の問題となる。このため、符号化音声信号についての音質向上処理は復号処理時の度に行わねばならなくなる。このことはメモリ負荷、電力消費の面から見て効率的ではない。
なお、符号化音声信号の高音質化を考えると、一番単純には、圧縮された符号化音声の音質を向上する処理を施した後の音声信号を記録媒体に記録保存し利用することが考えられる。しかし、高音質化し、さらに符号化されてない状態の音声信号の全部を記憶保持しておくことは、記録媒体の記憶容量の問題となる。このため、符号化音声信号についての音質向上処理は復号処理時の度に行わねばならなくなる。このことはメモリ負荷、電力消費の面から見て効率的ではない。
しかし、この発明の場合、上述したように、付加信号やプロファイル情報は、1度作成してしまえば、符号化音声信号とは別個独立に管理することができる。従って、符号化音声信号の復号処理時のたびに、付加信号を生成するという手間を省くことができる。しかも、付加信号やプロファイル情報は、符号化音声信号(楽曲などの復号再生されるべき音声信号)と共に使用されなければ、全く意味をなさないものであり、これら付加信号やプロファイル情報だけを種々の機器に複製(コピー)しても、楽曲などの符号化音声信号の著作権の侵害に繋がることもない。
また、付加信号を再生可能な携帯型再生機などに、既存の符号化音声信号と合わせて伝送することで、あるいは、付加信号が予め用意されている再生機に符号化音声信号を伝送したり、逆に符号化音声信号が予め用意されている再生機に付加信号を伝送したりすることで、携帯型再生機などでも高音質の音声信号を聴くことができる。携帯型再生機など電力消費やメモリ負荷を極力抑えたい機器では、付加信号を作成する必要はなく、付加信号の復号機能を搭載するだけで、高音質再生が可能となる。
また、付加信号である高域信号の複製方法は、例えば、特許第3646657号「デジタル信号処理装置及びデジタル信号処理方法、並びに1ビット信号生成装置」などに開示されている技術を用いることが可能である。具体的には、上述もしたが、既存の音声信号を分析し、どの周波数以降から高域がカットされているかを示す境界周波数を検出する。
そして、境界周波数以降の所定の帯域について、スペクトル複製し、周波数特性傾きを算出し、ゲインを算出し、ゲイン調整を行って、目的とする境界周波数より高域の信号を複製することが可能である。なお、既存の音声信号を複製元とする際の範囲については、追加する高域の範囲に依らず、その下限を一定とする。下限を決めることで、生成された高域信号に基本波が含まれることを避けることが可能となる。
また、付加信号には、付加信号を生成した際の付加信号固有の情報(プロファイル情報)、例えば復号装置の名称、バージョンナンバー、作成日時なからなる情報も対応付けられるので、付加信号の利用が可能な装置の区別なども可能となる。
また、付加信号、プロファイル情報を管理テーブルで管理することで、必要な際に、元の音声信号に対して一意に読み出すことができる。
また、圧縮音声信号は、世界的に普及しており、復号系における高音質化は需要が見込まれる。また、携帯再生機の普及により、コピー規制に反する恐れのないデジタル信号の作成も需要が見込まれる。
[その他]
なお、上述した実施の形態では、左右2チャンネルのMPEG2−AAC方式のデジタル音声信号を処理する場合を例にして説明したが、これに限るものではない。マルチチャンネルのMPEG2−AAC方式のデジタル音声信号についても対応可能である。また、他の符号化信号でも応用が可能である。例えば、他のMPEG方式、ATRAC(登録商標)方式、AC−3(登録商標)方式、WMA(登録商標)方式などで圧縮符号化された符号化信号に対しても、復号処理の内容を変更することによって、適用可能である。
なお、上述した実施の形態では、左右2チャンネルのMPEG2−AAC方式のデジタル音声信号を処理する場合を例にして説明したが、これに限るものではない。マルチチャンネルのMPEG2−AAC方式のデジタル音声信号についても対応可能である。また、他の符号化信号でも応用が可能である。例えば、他のMPEG方式、ATRAC(登録商標)方式、AC−3(登録商標)方式、WMA(登録商標)方式などで圧縮符号化された符号化信号に対しても、復号処理の内容を変更することによって、適用可能である。
また、上述した実施の形態においては、付加信号生成処理に高域信号の復元処理を用いたが、他の音質向上を図る処理、例えば、各種のエフェクト処理等を用いて付加信号を生成するようにしてもよい。
また、上述した実施の形態においては、付加信号(高域信号)の生成方法について、前述の特許第3646657号「デジタル信号処理装置及びデジタル信号処理方法、並びに1ビット信号生成装置」を応用するものとして説明したが、これに限るものではない。他の種々の方法を用いるようにすることももちろん可能である。
また、上述した実施の形態においては、生成して記録媒体に記録した付加信号は、符号化された状態のものとして説明したが、これに限るものではない。例えば、復号処理して、すぐに加算部3に供給可能な状態(時間軸領域の音声信号の状態)で付加信号を記録媒体に記録保持しておくようにすれば、付加信号復号処理部を用いないようにすることも可能である。
また、上述した実施の形態においては、この発明を、ハードディスクプレーヤやメモリプレーヤに適用されるものとして説明したが、符号化音声信号を処理するパーソナルコンピュータや種々の音声再生装置や音声記録再生装置等に適用可能である。
また、符号化処理により除去されて劣化した信号成分のみを、本来の復号処理の対象である符号化信号とは別個独立に記憶保持して、管理するという思想は、符号化音声信号の場合だけでなく、符号化映像信号の場合にも適用可能である。
また、上述した実施の形態においては、MPEG−2 AAC方式の圧縮符号化処理が、所定の信号変換処理に相当し、MPEG−2 AAC方式の圧縮符号化処理により形成された符号化音声信号が、所定の信号変換処理により形成された変換後信号に相当するものとして説明した。しかし、信号変換処理は、種々の圧縮符号化処理に限るものではない。
例えば、この発明が適用されずに、所定の圧縮符号化方式に従って圧縮符号化された音声信号が、復号化処理されるとともに、アナログ音声信号に変換されて提供された場合、当該アナログ音声信号は、先の圧縮符号化により、信号成分の一部が除去された状態のまま、復号化されて提供されたものである。
このため、当該アナログ音声信号をデジタル信号に変換し、上述した実施の形態の場合のように、除去された信号成分である付加信号を形成することが可能な状態にまで変換して、目的とする変換後信号を形成した後に、この発明を適用し、当該変換後信号から、除去された可能性のある信号成分を付加信号として形成し、これらを別個独立に管理するようにすることもできる。
そして、当該変換後信号の再生時において、対応する付加信号をも加味すると共に、元のアナログ音声信号の状態にまで復元し、再生するようにすることによって、元々、一部の信号成分が除去された音声信号についても、高品位な音声を再生することが可能な音声信号として復元することができるようにされる。
この場合のデジタル信号への変換処理や、除去された信号成分である付加信号を形成することが可能な状態にまで変換する処理は、厳密には圧縮符号化処理とは異なるものであるが、このような場合であっても、この発明を適用することができる。すなわち、信号変換処理は、音声信号などの処理の対象となる主信号が、何らかの原因により一部の信号部分が除去されたようなものである場合に、その除去された信号部分を付加情報として生成することが可能な状態に変換する処理をも含むものである。
また、上述した実施の形態においては、圧縮符号化された音声信号を処理対象とした場合を例に説明したが、種々の処理により信号成分の一部が除去された可能性のある種々の信号、例えば映像信号などを処理対象とする場合においても、この発明を応用して適用することが可能である。
1…AAC復号処理部、11…フォーマット解析部、12…逆量子化処理部、121…ハフマン復号化部、122…逆量子化部、123…リスケーリング部、13…ステレオ処理部、131…M/Sステレオ処理部、132…予測処理部、133…インテンシティ・ステレオ処理部、134…TNS部、14…適応ブロック長切換逆MDCT部、15…ゲイン制御部、17…MDCT部、18…逆MDCT部、2…付加信号生成部、21…付加信号生成処理部、211…ハフマン復号化部、212…逆量子化部、213…リスケーリング部、214…ステレオ処理部、215…境界周波数検出部、216…追加帯域決定部、217…高域信号生成部、218…プロファイル情報作成処理部、22…付加信号記録部、221…付加信号記録部、222…プロファイル記録部、223…管理テーブル作成処理部、224…管理テーブル記録部、23…付加信号復号処理部、3…加算部、300…欠落信号復元部、301…予測生成処理部、302…高域追加処理部、310…欠落信号復元部、312…高域追加処理部、3121…一時記憶メモリ、3122…高域信号合成部、320、330…欠落信号復元部、331…予測生成処理部、332…高域追加処理部
Claims (20)
- 原信号から信号変換処理時に除去されたと推定される信号成分を付加信号として、当該信号変換処理により形成された変換後信号から生成する付加信号生成手段と、
前記付加信号生成手段によって作成された前記付加信号を記録媒体に記録する付加信号記録手段と、
前記付加信号に関しての1つ以上の固有情報を取得して、前記付加信号についてのプロファイル情報を生成するプロファイル情報生成手段と、
前記プロファイル情報生成手段によって作成された前記プロファイル情報を記録媒体に記録するプロファイル情報記録手段と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルを作成する管理テーブル作成手段と、
前記管理テーブル作成手段によって作成された前記管理テーブルを記録媒体に記録する管理テーブル記録手段と
を備えることを特徴とする付加信号生成装置。 - 請求項1に記載の付加信号生成装置であって、
前記プロファイル情報は、前記付加信号を生成する装置の名称、バージョンナンバー、前記付加信号の生成日の内の1つ以上の情報を含むものであることを特徴とする付加信号生成装置。 - 請求項1に記載の付加信号生成装置であって、
前記管理テーブルは、前記変換後信号の識別情報と、前記付加信号の識別情報と、前記プロファイル情報の識別情報と、これらのそれぞれの情報に対して共通に付与される情報であって、対応する情報を相互に特定することが可能な関連付け情報とからなるものであることを特徴とする付加信号生成装置。 - 請求項1に記載の付加信号生成装置であって、
前記付加信号生成手段は、
当該信号変換処理時において、除去された可能性のある信号部分の下限境界周波数を検出する境界周波数検出部と、
前記境界周波数検出部において検出された下限境界周波数と、前記変換後信号のサンプリング周波数とに基づいて、前記下限境界周波数以降の高域における、付加信号を追加する帯域幅を決定する追加帯域決定部と、
前記追加帯域決定部において決定された帯域幅で、前記変換後信号に基づいて前記付加信号を演算により生成する付加信号生成部と
を少なくとも備えることを特徴とする付加信号生成装置。 - 請求項4に記載の付加信号生成装置であって、
前記変換後信号中において、分解能以下であるためにカットされた可能性のある信号部分を予測して生成し、これを補間データとして用いるようにする予測生成部を備え、
前記付加信号生成部は、前記予測生成部において生成された信号が補間データとして用いられるようにされた変換後信号に基づいて付加信号を生成することを特徴とする付加信号生成装置。 - 請求項4に記載の付加信号生成装置であって、
前記変換後信号をも考慮して、前記付加信号生成部において形成された付加信号において、分解能以下であるためにカットされた可能性のある信号部分を予測して生成し、これを補間データとして用いるようにする予測生成部を備えることを考慮する付加信号生成装置。 - 原信号から信号変換処理時に除去されたと推定される信号成分として、当該信号変換処理により形成された変換後信号から生成された付加信号が記録された付加信号記録媒体と、
前記付加信号に関しての1つ以上の固有情報からなるプロファイル情報が記録されたプロファイル情報記録媒体と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルが記録された管理テーブル記録媒体と、
供給される前記変換後信号を変換前の信号に復元する処理を行う復元処理手段と、
前記復元処理手段によって処理される変換後信号の識別情報に基づいて、前記管理テーブルを参照し、対応する付加信号を特定して読み出す付加信号読み出し手段と、
前記付加信号読み出し手段から読み出された付加信号と、前記復元処理手段によって復元された信号とを加算処理する加算手段と
を備えることを特徴とする復元装置。 - 前記7に記載の復元装置であって、
前記読み出し手段によって読み出される前記付加信号が信号変換処理されたものである場合に、読み出された付加信号を信号変換前の信号に復元処理して、前記加算手段に供給する付加信号復元手段を備えることを特徴とする復元装置。 - 請求項7に記載の復元装置であって、
前記プロファイル情報は、少なくとも付加信号を生成した装置の名称と、バージョンナンバーとを含んでおり、
前記付加信号読み出し手段は、自己の前記復元処理手段の装置の名称とバージョンナンバーとを考慮して、復元する変換後信号に対応する付加信号を特定して読み出すことができるものであることを特徴とする復号装置。 - 原信号から信号変換処理時に除去されたと推定される信号成分を付加信号として、当該信号変換処理により形成された変換後信号から生成する付加信号生成工程と、
前記付加信号生成工程において作成した前記付加信号を記録媒体に記録する付加信号記録工程と、
前記付加信号に関しての1つ以上の固有情報を取得して、前記付加信号についてのプロファイル情報を生成するプロファイル情報生成工程と、
前記プロファイル情報生成工程において作成した前記プロファイル情報を記録媒体に記録するプロファイル情報記録工程と、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルを作成する管理テーブル作成工程と、
前記管理テーブル作成工程において作成した前記管理テーブルを記録媒体に記録する管理テーブル記録工程と
を有することを特徴とする付加信号生成方法。 - 請求項10に記載の付加信号生成方法であって、
前記プロファイル情報は、前記付加信号を生成する装置の名称、バージョンナンバー、前記付加信号の生成日の内の1つ以上の情報を含むものであることを特徴とする付加信号生成方法。 - 請求項10に記載の付加信号生成方法であって、
前記管理テーブルは、前記変換後信号の識別情報と、前記付加信号の識別情報と、前記プロファイル情報の識別情報と、これらのそれぞれの情報に対して共通に付与される情報であって、対応する情報を相互に特定することが可能な関連付け情報とからなるものであることを特徴とする付加信号生成方法。 - 請求項10に記載の付加信号生成方法であって、
前記付加信号生成工程は、
当該信号変換処理時において、除去された可能性のある信号部分の下限境界周波数を検出する境界周波数検工程と、
前記境界周波数検出工程において検出した下限境界周波数と、前記変換後信号のサンプリング周波数とに基づいて、前記下限境界周波数以降の高域における、付加信号を追加する帯域幅を決定する追加帯域決定工程と、
前記追加帯域決定工程において決定した帯域幅で、前記変換後信号に基づいて前記付加信号を演算により生成する付加信号生成工程と
からなることを特徴とする付加信号生成方法。 - 請求項13に記載の付加信号生成方法であって、
前記変換後信号中において、分解能以下であるためにカットされた可能性のある信号部分を予測して生成し、これを補間データとして用いるようにする予測生成工程を有し、
前記付加信号生成工程においては、前記予測生成工程において生成した信号が補間データとして用いられるようにされた変換後信号に基づいて付加信号を生成することを特徴とする付加信号生成方法。 - 請求項13に記載の付加信号生成方法であって、
前記変換後信号をも考慮して、前記付加信号生成工程において形成した付加信号において分解能以下であるためにカットされた可能性のある信号部分を予測して生成し、これを補間データとして用いるようにする予測生成工程を有することを考慮する付加信号生成方法。 - 原信号から信号変換処理時に除去されたと推定される信号成分として、当該信号変換処理により形成された変換後信号から生成された付加信号が記録された付加信号記録媒体と、前記付加信号に関しての1つ以上の固有情報からなるプロファイル情報が記録されたプロファイル情報記録媒体と、前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルが記録された管理テーブル記録媒体とを備えた変換後信号の復元装置で用いられる復元方法であって、
供給される前記変換後信号を変換前の信号に復元する処理を行う復元処理工程と、
前記復元処理工程において復元される変換後信号の識別情報に基づいて、前記管理テーブルを参照し、対応する付加信号を特定して読み出す付加信号読み出し工程と、
前記付加信号読み出し工程において読み出した付加信号と、前記復元処理工程において復元された信号とを加算処理する加算工程と
を有することを特徴とする復号方法。 - 前記16に記載の復号方法であって、
前記読み出し工程において読み出される前記付加信号が信号変換処理されたものである場合に、読み出された付加信号を信号変換前の信号に復元処理して、前記加算工程において加算できるようにする付加信号復元工程を有することを特徴とする復号方法。 - 請求項16に記載の復号方法であって、
前記プロファイル情報は、少なくとも付加信号を生成した装置の名称と、バージョンナンバーとを含んでおり、
前記付加信号読み出し工程においては、自己の前記復号工程で用いる手段の装置の名称とバージョンナンバーとを考慮して、復号する符号化音声信号に対応する付加信号を特定して読み出すことを特徴とする復号方法。 - 原信号から信号変換処理時に除去されたと推定される信号成分を付加信号として、当該信号変換処理により形成された変換後信号から生成するための装置に搭載されたコンピュータに、
前記変換後信号の少なくともビットレートの情報に基づいて、当該信号変換処理時において、除去された可能性のある信号部分の下限境界周波数を検出する境界周波数検出ステップと、
前記境界周波数検出ステップにおいて検出した下限境界周波数と、前記変換後信号のサンプリング周波数とに基づいて、前記下限境界周波数以降の高域における、付加信号を追加する帯域幅を決定する追加帯域決定ステップと、
前記追加帯域決定ステップにおいて決定した帯域幅で、前記変換後信号に基づいて前記付加信号を演算により生成する付加信号生成ステップと
を実行させることを特徴とする付加信号生成プログラム。 - 請求項19に記載の付加信号生成プログラムであって、
前記付加信号生成ステップにおいて生成した前記付加信号に関しての1つ以上の固有情報を取得して、前記付加信号についてのプロファイル情報を生成するプロファイル情報生成ステップと、
前記変換後信号と、前記付加信号と、前記プロファイル情報とを関連付ける管理テーブルを作成する管理テーブル作成ステップと、
前記付加信号を記録媒体に記録する付加信号記録ステップと、
前記プロファイル情報を記録媒体に記録するプロファイル情報記録ステップと、
前記管理テーブルを記録媒体に記録する管理テーブル記録ステップと
を実行することを特徴とする付加信号生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006260600A JP2008033211A (ja) | 2006-06-26 | 2006-09-26 | 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006174979 | 2006-06-26 | ||
JP2006260600A JP2008033211A (ja) | 2006-06-26 | 2006-09-26 | 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008033211A true JP2008033211A (ja) | 2008-02-14 |
Family
ID=39122669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006260600A Pending JP2008033211A (ja) | 2006-06-26 | 2006-09-26 | 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008033211A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010197862A (ja) * | 2009-02-26 | 2010-09-09 | Toshiba Corp | 信号帯域拡張装置 |
JP2016024454A (ja) * | 2014-07-25 | 2016-02-08 | 三菱電機株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
-
2006
- 2006-09-26 JP JP2006260600A patent/JP2008033211A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010197862A (ja) * | 2009-02-26 | 2010-09-09 | Toshiba Corp | 信号帯域拡張装置 |
US8271292B2 (en) | 2009-02-26 | 2012-09-18 | Kabushiki Kaisha Toshiba | Signal bandwidth expanding apparatus |
JP2016024454A (ja) * | 2014-07-25 | 2016-02-08 | 三菱電機株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101586317B1 (ko) | 신호 처리 방법 및 장치 | |
EP1334484B1 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
RU2689438C2 (ru) | Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа | |
EP1715476B1 (en) | Low-bitrate encoding/decoding method and system | |
KR101835156B1 (ko) | 신호 처리 장치 및 방법, 및 프로그램 | |
US7386445B2 (en) | Compensation of transient effects in transform coding | |
WO2003007480A1 (fr) | Dispositif de decodage de signaux audio et dispositif de codage de signaux audio | |
US7466245B2 (en) | Digital signal processing apparatus, digital signal processing method, digital signal processing program, digital signal reproduction apparatus and digital signal reproduction method | |
JP2012504260A (ja) | オーディオメタデータのトランスコーディング | |
JP2009116371A (ja) | 符号化装置および復号化装置 | |
JPH08237132A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
JP2008096567A (ja) | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム | |
JP4657570B2 (ja) | 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体 | |
JP2004199075A (ja) | ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置 | |
JP2006018023A (ja) | オーディオ信号符号化装置、および符号化プログラム | |
JP2006126826A (ja) | オーディオ信号符号化/復号化方法及びその装置 | |
JP2008158301A (ja) | 信号処理装置、信号処理方法、再生装置、再生方法、電子機器 | |
JP6863359B2 (ja) | 復号装置および方法、並びにプログラム | |
JP2008033211A (ja) | 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム | |
JP3984468B2 (ja) | 符号化装置、復号化装置及び符号化方法 | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP4627737B2 (ja) | デジタルデータ復号化装置 | |
CN101097716A (zh) | 数字信号处理设备、处理方法和再现设备 | |
JP2005114813A (ja) | オーディオ信号再生装置及び再生方法 |