JPH09120646A - オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 - Google Patents
オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体Info
- Publication number
- JPH09120646A JPH09120646A JP6527496A JP6527496A JPH09120646A JP H09120646 A JPH09120646 A JP H09120646A JP 6527496 A JP6527496 A JP 6527496A JP 6527496 A JP6527496 A JP 6527496A JP H09120646 A JPH09120646 A JP H09120646A
- Authority
- JP
- Japan
- Prior art keywords
- data
- quantized
- audio signal
- quantizing
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Optical Recording Or Reproduction (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
(57)【要約】
【課題】 CD−DA用のデータ圧縮より更に高い圧縮
率により、量子化ビット数16ビット、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化して得たデ
ータをCD−ROMに記録することができるオーディオ
信号圧縮記録装置及びオーディオ信号圧縮装置並びに光
記録媒体を提供する。 【解決手段】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する手段1、量子化された所定量の量子化デ
ータ毎に直交変換を適用してデータ量を圧縮する手段
2、3、圧縮されたデータをCD−ROMXA規格のモ
ード2、フォーム2のユーザデータ領域あるいはCD−
ROM規格のモード2のユーザデータ領域に配するよう
フォーマッティングする手段4を設けた。
率により、量子化ビット数16ビット、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化して得たデ
ータをCD−ROMに記録することができるオーディオ
信号圧縮記録装置及びオーディオ信号圧縮装置並びに光
記録媒体を提供する。 【解決手段】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する手段1、量子化された所定量の量子化デ
ータ毎に直交変換を適用してデータ量を圧縮する手段
2、3、圧縮されたデータをCD−ROMXA規格のモ
ード2、フォーム2のユーザデータ領域あるいはCD−
ROM規格のモード2のユーザデータ領域に配するよう
フォーマッティングする手段4を設けた。
Description
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
高能率符号化して光記録媒体に記録するオーディオ信号
圧縮記録装置及びそのためのオーディオ信号圧縮装置、
さらに光記録媒体に関する。
高能率符号化して光記録媒体に記録するオーディオ信号
圧縮記録装置及びそのためのオーディオ信号圧縮装置、
さらに光記録媒体に関する。
【0002】
【従来の技術】CD(コンパクトディスク)は1982
年に登場して十数年が経過し、現在では様々な展開によ
りデジタルストレージメディアとして定着している。オ
ーディオメディアの用途を考えると、サンプリング周波
数fs =44.1kHz、量子化ビット数=16ビット
のこのメディアは完全に成熟期に入っている。さらに、
DVDと呼ばれる高密度ディスクがコンピュータなどの
データ用のデジタルディスクとして利用されようとして
いる。なお、デジタルディスクとはCD、CD−RO
M、DVDなどオーディオやビデオ信号がデジタル信号
として記録された光ディスクをいうものとする。
年に登場して十数年が経過し、現在では様々な展開によ
りデジタルストレージメディアとして定着している。オ
ーディオメディアの用途を考えると、サンプリング周波
数fs =44.1kHz、量子化ビット数=16ビット
のこのメディアは完全に成熟期に入っている。さらに、
DVDと呼ばれる高密度ディスクがコンピュータなどの
データ用のデジタルディスクとして利用されようとして
いる。なお、デジタルディスクとはCD、CD−RO
M、DVDなどオーディオやビデオ信号がデジタル信号
として記録された光ディスクをいうものとする。
【0003】
【発明が解決しようとする課題】通常の音楽(オーディ
オ)用のCD(以下CD−DAという)はサンプリング
周波数fs =44.1kHz、量子化ビット数=16ビ
ットで2チャンネルのオーディオ信号を記録することが
できるが、これまでのCD−DAの規格では同一データ
量をCD−ROMのフォーマットで記録することができ
なかった。これは、CD−ROMのフォーマットには同
期信号(SYNC)やアドレスやモードを含むヘッダが
あるため、オーディオ信号を記録するための記録容量が
CD−DAより少ないためである。一方、パソコンやそ
の周辺機器の発達と急速な普及により、CD−ROMド
ライブを介して、音楽などを高音質で楽しみたいという
要望がある。
オ)用のCD(以下CD−DAという)はサンプリング
周波数fs =44.1kHz、量子化ビット数=16ビ
ットで2チャンネルのオーディオ信号を記録することが
できるが、これまでのCD−DAの規格では同一データ
量をCD−ROMのフォーマットで記録することができ
なかった。これは、CD−ROMのフォーマットには同
期信号(SYNC)やアドレスやモードを含むヘッダが
あるため、オーディオ信号を記録するための記録容量が
CD−DAより少ないためである。一方、パソコンやそ
の周辺機器の発達と急速な普及により、CD−ROMド
ライブを介して、音楽などを高音質で楽しみたいという
要望がある。
【0004】さらに、DVDと呼ばれるデジタルディス
クでは音声がリニアPCMにより圧縮されずに記録され
ているため、よりハイファイ性の高い記録のためにはデ
ータ量を要し、記録時間が短くなる。このディスクのた
めには、直交変換及び/又はハフマン符号によりデータ
処理してデータ量を削減するための圧縮を行って、DV
Dのフォーマットで記録する記録装置並びにかかる方式
で記録された光ディスクが考えられる。
クでは音声がリニアPCMにより圧縮されずに記録され
ているため、よりハイファイ性の高い記録のためにはデ
ータ量を要し、記録時間が短くなる。このディスクのた
めには、直交変換及び/又はハフマン符号によりデータ
処理してデータ量を削減するための圧縮を行って、DV
Dのフォーマットで記録する記録装置並びにかかる方式
で記録された光ディスクが考えられる。
【0005】したがって、本発明は現在のCD−DA用
のデータ処理に比較して高い圧縮率により、量子化ビッ
ト数16ビット、標本化周波数44.1kHz又はそれ
以上の周波数で量子化して得たデータをCD−ROMに
記録することができるオーディオ信号圧縮記録装置及び
オーディオ信号圧縮装置並びに光記録媒体を提供するこ
とを目的とする。
のデータ処理に比較して高い圧縮率により、量子化ビッ
ト数16ビット、標本化周波数44.1kHz又はそれ
以上の周波数で量子化して得たデータをCD−ROMに
記録することができるオーディオ信号圧縮記録装置及び
オーディオ信号圧縮装置並びに光記録媒体を提供するこ
とを目的とする。
【0006】また、本発明は、CDバリエイション(サ
イズ・変調方式)の範囲内でデータフォーマットが一般
に異なると見られているDVDオーディオに記録するこ
とができるオーディオ信号圧縮記録装置及びオーディオ
信号圧縮装置並びに光記録媒体を提供することを目的と
する。
イズ・変調方式)の範囲内でデータフォーマットが一般
に異なると見られているDVDオーディオに記録するこ
とができるオーディオ信号圧縮記録装置及びオーディオ
信号圧縮装置並びに光記録媒体を提供することを目的と
する。
【0007】
【課題を解決するための手段】本発明は上記目的を達成
するために、オーディオ信号を量子化ビット数16ビッ
ト、標本化周波数44.1kHz又はそれ以上の周波数
で量子化し、量子化された所定量の量子化データ毎に直
交変換を適用してデータ量を削減・圧縮し、圧縮された
データをCD−ROMXA規格のモード2、フォーム2
のユーザデータ領域又はCD−ROM規格のモード2の
ユーザデータ領域、あるいはDVDのユーザデータ領域
に配するようフォーマッティングし、フォーマッティン
グされたデータを記録媒体に記録するようにしている。
するために、オーディオ信号を量子化ビット数16ビッ
ト、標本化周波数44.1kHz又はそれ以上の周波数
で量子化し、量子化された所定量の量子化データ毎に直
交変換を適用してデータ量を削減・圧縮し、圧縮された
データをCD−ROMXA規格のモード2、フォーム2
のユーザデータ領域又はCD−ROM規格のモード2の
ユーザデータ領域、あるいはDVDのユーザデータ領域
に配するようフォーマッティングし、フォーマッティン
グされたデータを記録媒体に記録するようにしている。
【0008】すなわち、本発明によれば、オーディオ信
号を量子化ビット数16ビット、標本化周波数44.1
kHz又はそれ以上の周波数で量子化する量子化手段
と、前記量子化手段で量子化された所定量の量子化デー
タ毎に直交変換を適用してデータ量を圧縮するデータ圧
縮手段と、前記データ圧縮手段で圧縮されたデータをデ
ジタルディスクのユーザデータ領域に配するようフォー
マッティングするフォーマッティング手段と、前記フォ
ーマッティング手段でフォーマッティングされたデータ
をCDフォーマットとして記録媒体に記録する手段と
を、有するオーディオ信号圧縮記録装置が提供される。
号を量子化ビット数16ビット、標本化周波数44.1
kHz又はそれ以上の周波数で量子化する量子化手段
と、前記量子化手段で量子化された所定量の量子化デー
タ毎に直交変換を適用してデータ量を圧縮するデータ圧
縮手段と、前記データ圧縮手段で圧縮されたデータをデ
ジタルディスクのユーザデータ領域に配するようフォー
マッティングするフォーマッティング手段と、前記フォ
ーマッティング手段でフォーマッティングされたデータ
をCDフォーマットとして記録媒体に記録する手段と
を、有するオーディオ信号圧縮記録装置が提供される。
【0009】また、本発明によればオーディオ信号を量
子化ビット数16ビット、標本化周波数44.1kHz
又はそれ以上の周波数で量子化する量子化手段と、前記
量子化手段で量子化された所定量の量子化データ毎に直
交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをCD−R
OMXA規格のモード2、フォーム2のユーザデータ領
域に配するようフォーマッティングするフォーマッティ
ング手段と、前記フォーマッティング手段でフォーマッ
ティングされたデータをCDフォーマットとして記録媒
体に記録する手段とを、有するオーディオ信号圧縮記録
装置が提供される。
子化ビット数16ビット、標本化周波数44.1kHz
又はそれ以上の周波数で量子化する量子化手段と、前記
量子化手段で量子化された所定量の量子化データ毎に直
交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをCD−R
OMXA規格のモード2、フォーム2のユーザデータ領
域に配するようフォーマッティングするフォーマッティ
ング手段と、前記フォーマッティング手段でフォーマッ
ティングされたデータをCDフォーマットとして記録媒
体に記録する手段とを、有するオーディオ信号圧縮記録
装置が提供される。
【0010】さらに、本発明によれば、オーディオ信号
を量子化ビット数16ビット、標本化周波数44.1k
Hz又はそれ以上の周波数で量子化する量子化手段と、
前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、前記データ圧縮手段で圧縮されたデータをCD−
ROM規格のモード2のユーザデータ領域に配するよう
フォーマッティングするフォーマッティング手段と、前
記フォーマッティング手段でフォーマッティングされた
データをCDフォーマットとして記録媒体に記録する手
段とを、有するオーディオ信号圧縮記録装置が提供され
る。
を量子化ビット数16ビット、標本化周波数44.1k
Hz又はそれ以上の周波数で量子化する量子化手段と、
前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、前記データ圧縮手段で圧縮されたデータをCD−
ROM規格のモード2のユーザデータ領域に配するよう
フォーマッティングするフォーマッティング手段と、前
記フォーマッティング手段でフォーマッティングされた
データをCDフォーマットとして記録媒体に記録する手
段とを、有するオーディオ信号圧縮記録装置が提供され
る。
【0011】また、本発明によれば、オーディオ信号を
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをDVDの
ユーザデータ領域に配するようフォーマッティングする
フォーマッティング手段と、前記フォーマッティング手
段でフォーマッティングされたデータをCDフォーマッ
トとして記録媒体に記録する手段とを、有するオーディ
オ信号圧縮記録装置が提供される。
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをDVDの
ユーザデータ領域に配するようフォーマッティングする
フォーマッティング手段と、前記フォーマッティング手
段でフォーマッティングされたデータをCDフォーマッ
トとして記録媒体に記録する手段とを、有するオーディ
オ信号圧縮記録装置が提供される。
【0012】なお、本発明は上記のようにオーディオ信
号圧縮記録装置として捉えられるが、さらに、再生専用
のディスクの製造のためには、CDフォーマットとして
記録する工程はディスク製造工場側のタスクとなる。し
たがって、本発明はオーディオ信号圧縮装置としても捉
えることができる。
号圧縮記録装置として捉えられるが、さらに、再生専用
のディスクの製造のためには、CDフォーマットとして
記録する工程はディスク製造工場側のタスクとなる。し
たがって、本発明はオーディオ信号圧縮装置としても捉
えることができる。
【0013】すなわち、本発明によれば、オーディオ信
号を量子化ビット数16ビット、標本化周波数44.1
kHz又はそれ以上の周波数で量子化する量子化手段
と、前記量子化手段で量子化された所定量の量子化デー
タ毎に直交変換を適用してデータ量を圧縮するデータ圧
縮手段と、前記データ圧縮手段で圧縮されたデータをデ
ジタルディスクのユーザデータ領域に配するようフォー
マッティングするフォーマッティング手段とを、有する
オーディオ信号圧縮装置が提供される。
号を量子化ビット数16ビット、標本化周波数44.1
kHz又はそれ以上の周波数で量子化する量子化手段
と、前記量子化手段で量子化された所定量の量子化デー
タ毎に直交変換を適用してデータ量を圧縮するデータ圧
縮手段と、前記データ圧縮手段で圧縮されたデータをデ
ジタルディスクのユーザデータ領域に配するようフォー
マッティングするフォーマッティング手段とを、有する
オーディオ信号圧縮装置が提供される。
【0014】また、本発明によれば、オーディオ信号を
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをCD−R
OMXA規格のモード2、フォーム2のユーザデータ領
域に配するようフォーマッティングするフォーマッティ
ング手段とを、有するオーディオ信号圧縮装置が提供さ
れる。
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをCD−R
OMXA規格のモード2、フォーム2のユーザデータ領
域に配するようフォーマッティングするフォーマッティ
ング手段とを、有するオーディオ信号圧縮装置が提供さ
れる。
【0015】また、本発明によれば、オーディオ信号を
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをDVDの
ユーザデータ領域に配するようフォーマッティングする
フォーマッティング手段とを、有するオーディオ信号圧
縮装置が提供される。
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮するデータ圧縮手段
と、前記データ圧縮手段で圧縮されたデータをDVDの
ユーザデータ領域に配するようフォーマッティングする
フォーマッティング手段とを、有するオーディオ信号圧
縮装置が提供される。
【0016】また、本発明によれば、オーディオ信号を
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化し、量子化された所定
量の量子化データ毎に直交変換を適用してデータ量を圧
縮し、圧縮されたデータをデジタルディスクのユーザデ
ータ領域に配するようフォーマッティングし、フォーマ
ッティングされたデータをCDフォーマットとして記録
した光記録媒体が提供される。
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化し、量子化された所定
量の量子化データ毎に直交変換を適用してデータ量を圧
縮し、圧縮されたデータをデジタルディスクのユーザデ
ータ領域に配するようフォーマッティングし、フォーマ
ッティングされたデータをCDフォーマットとして記録
した光記録媒体が提供される。
【0017】また、本発明によれば、オーディオ信号を
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化し、量子化された所定
量の量子化データ毎に直交変換を適用してデータ量を圧
縮し、圧縮されたデータをCD−ROMXA規格のモー
ド2、フォーム2のユーザデータ領域に配するようフォ
ーマッティングし、フォーマッティングされたデータを
CDフォーマットとして記録した光記録媒体が提供され
る。
量子化ビット数16ビット、標本化周波数44.1kH
z又はそれ以上の周波数で量子化し、量子化された所定
量の量子化データ毎に直交変換を適用してデータ量を圧
縮し、圧縮されたデータをCD−ROMXA規格のモー
ド2、フォーム2のユーザデータ領域に配するようフォ
ーマッティングし、フォーマッティングされたデータを
CDフォーマットとして記録した光記録媒体が提供され
る。
【0018】さらに、本発明によれば、オーディオ信号
を量子化ビット数16ビット、標本化周波数44.1k
Hz又はそれ以上の周波数で量子化し、量子化された所
定量の量子化データ毎に直交変換を適用してデータ量を
圧縮し、圧縮されたデータをDVDのユーザデータ領域
に配するようフォーマッティングし、フォーマッティン
グされたデータをCDフォーマットとして記録した光記
録媒体が提供される。
を量子化ビット数16ビット、標本化周波数44.1k
Hz又はそれ以上の周波数で量子化し、量子化された所
定量の量子化データ毎に直交変換を適用してデータ量を
圧縮し、圧縮されたデータをDVDのユーザデータ領域
に配するようフォーマッティングし、フォーマッティン
グされたデータをCDフォーマットとして記録した光記
録媒体が提供される。
【0019】
【発明の実施の形態】本発明のオーディオ信号圧縮記録
装置及びオーディオ信号圧縮装置並びに光記録媒体の実
施の形態を好ましい実施例によって説明する。図1は本
発明のオーディオ信号圧縮記録装置の好ましい実施例を
示すブロック図である。入力端子INには例えば音楽信
号などのアナログ信号が供給され、出力端子OUTは図
示省略のCD原盤作成機、すなわちマスタリング装置に
必要に応じてプリマスタリング装置を介して接続され
る。マスタリング装置自体は従来のものと本質的に変ら
ないので、ここでは説明を省略する。
装置及びオーディオ信号圧縮装置並びに光記録媒体の実
施の形態を好ましい実施例によって説明する。図1は本
発明のオーディオ信号圧縮記録装置の好ましい実施例を
示すブロック図である。入力端子INには例えば音楽信
号などのアナログ信号が供給され、出力端子OUTは図
示省略のCD原盤作成機、すなわちマスタリング装置に
必要に応じてプリマスタリング装置を介して接続され
る。マスタリング装置自体は従来のものと本質的に変ら
ないので、ここでは説明を省略する。
【0020】図1の装置は入力端子INに接続されたA
/D変換器1と、その出力に接続された信号処理回路2
と、信号処理回路2に接続されたメモリ3と、信号処理
回路2の出力に接続されたCD−ROM符号化回路4
と、CD−ROM符号化回路4の出力に接続されたCD
符号化回路5を有している。CD−ROM符号化回路4
の出力は第1出力端子OUT1に接続され、CD符号化
回路5の出力は第2出力端子OUT2に接続されてい
る。なお、後述するように、CD符号化回路5は不要な
場合がある。
/D変換器1と、その出力に接続された信号処理回路2
と、信号処理回路2に接続されたメモリ3と、信号処理
回路2の出力に接続されたCD−ROM符号化回路4
と、CD−ROM符号化回路4の出力に接続されたCD
符号化回路5を有している。CD−ROM符号化回路4
の出力は第1出力端子OUT1に接続され、CD符号化
回路5の出力は第2出力端子OUT2に接続されてい
る。なお、後述するように、CD符号化回路5は不要な
場合がある。
【0021】A/D変換器1はオーディオ信号を量子化
ビット数16ビット、標本化周波数44.1kHz又は
それ以上の周波数で量子化する量子化手段として動作す
る。標本化周波数は実施例により44.1kHz(DV
Dの場合は48kHz)又は88.2kHz(DVDの
場合は96kHz)のいずれかになっているが、44.
1kHz以上の適当な値とすることができる。音楽信号
を対象とする場合は、通常左右の2チャンネルである
が、サラウンドその他の必要に応じて4チャンネルや6
チャンネルなどとすることができる。ここでは2チャン
ネルである場合について説明する。A/D変換器1で得
られた量子化データは1チャンネルあたり2m個(mは正
の整数)を単位として、信号処理回路2を介してメモリ
3に書き込まれる。その後、信号処理回路2がこの2m
個のデータの処理を開始する。
ビット数16ビット、標本化周波数44.1kHz又は
それ以上の周波数で量子化する量子化手段として動作す
る。標本化周波数は実施例により44.1kHz(DV
Dの場合は48kHz)又は88.2kHz(DVDの
場合は96kHz)のいずれかになっているが、44.
1kHz以上の適当な値とすることができる。音楽信号
を対象とする場合は、通常左右の2チャンネルである
が、サラウンドその他の必要に応じて4チャンネルや6
チャンネルなどとすることができる。ここでは2チャン
ネルである場合について説明する。A/D変換器1で得
られた量子化データは1チャンネルあたり2m個(mは正
の整数)を単位として、信号処理回路2を介してメモリ
3に書き込まれる。その後、信号処理回路2がこの2m
個のデータの処理を開始する。
【0022】図2は信号処理回路2の一例を示すブロッ
ク図である。2m個のデータは直交変換回路10にて直
交変換が施され、周波数スペクトルが得られる。この周
波数スペクトルをバンド分割のための複数のフィルタ6
a,6b,6c...6nを有するフィルタバンク6と
選択手段としてのスイッチ回路7を介して正規化部・量
子化部11に与え、バンド毎にまとめて正規化・量子化
する。ここで正規化レベル(ビット数)を補助情報、ス
ペクトルデータを主情報としてデータフレームとする。
このデータフレームからコードブックのインデックスを
補助情報、処理データを主情報として、新たなデータフ
レームを作成し、これを順次メモリ3に書き込む。次に
メモリ3からこの新たなデータフレームを読み出し、ア
ロケーション回路9を介して図1のCD−ROM符号化
回路4へ出力する。
ク図である。2m個のデータは直交変換回路10にて直
交変換が施され、周波数スペクトルが得られる。この周
波数スペクトルをバンド分割のための複数のフィルタ6
a,6b,6c...6nを有するフィルタバンク6と
選択手段としてのスイッチ回路7を介して正規化部・量
子化部11に与え、バンド毎にまとめて正規化・量子化
する。ここで正規化レベル(ビット数)を補助情報、ス
ペクトルデータを主情報としてデータフレームとする。
このデータフレームからコードブックのインデックスを
補助情報、処理データを主情報として、新たなデータフ
レームを作成し、これを順次メモリ3に書き込む。次に
メモリ3からこの新たなデータフレームを読み出し、ア
ロケーション回路9を介して図1のCD−ROM符号化
回路4へ出力する。
【0023】CD−ROM符号化回路4では、図3によ
って後述する所定のフォーマットとなるように、各セク
タに同期信号(SYNC)やヘッダ、サブヘッダなどを
付加し、各セクタのユーザデータ領域に信号処理回路2
から与えられる圧縮オーディオデータを配して出力す
る。CD−ROM符号化回路4の出力データは第1出力
端子OUT1を介して出力され、例えば磁気テープに記
録されて、再生専用のCDを製造するためのプリマスタ
リング装置やマスタリング装置に供給される。一方、C
D−ROM符号化回路4の出力データは、書込み可能
な、いわゆるライトワンスタイプのCDの場合は、CD
符号化回路5に与えられ、CDフォーマット化され、第
2出力端子OUT2を介して図示省略の記録ヘッドによ
り記録される。
って後述する所定のフォーマットとなるように、各セク
タに同期信号(SYNC)やヘッダ、サブヘッダなどを
付加し、各セクタのユーザデータ領域に信号処理回路2
から与えられる圧縮オーディオデータを配して出力す
る。CD−ROM符号化回路4の出力データは第1出力
端子OUT1を介して出力され、例えば磁気テープに記
録されて、再生専用のCDを製造するためのプリマスタ
リング装置やマスタリング装置に供給される。一方、C
D−ROM符号化回路4の出力データは、書込み可能
な、いわゆるライトワンスタイプのCDの場合は、CD
符号化回路5に与えられ、CDフォーマット化され、第
2出力端子OUT2を介して図示省略の記録ヘッドによ
り記録される。
【0024】次に図3とともに本発明のいくつかの態様
について説明する。図3はCDの種々のフォーマットを
セクタ単位で示したもので、第1段には通常の音楽用C
Dである、CD−DAを示し、以下第2段から第6段ま
で各種CD−ROMを示している。本発明の実施例とし
ては次の6つの態様がある。なお、DVDを示す図17
については後述する。
について説明する。図3はCDの種々のフォーマットを
セクタ単位で示したもので、第1段には通常の音楽用C
Dである、CD−DAを示し、以下第2段から第6段ま
で各種CD−ROMを示している。本発明の実施例とし
ては次の6つの態様がある。なお、DVDを示す図17
については後述する。
【0025】
【表1】 (1) CD−ROM XA モード2、フォーム2 (図3の6段目) 標本化周波数 :44.1kHz 量子化ビット数:16ビット (2) CD−ROM XA モード2、フォーム2 (図3の6段目) 標本化周波数 :88.2kHz 量子化ビット数:16ビット (3) CD−ROM モード2 (図3の4段目) 標本化周波数 :44.1kHz 量子化ビット数:16ビット (4) CD−ROM モード2 (図3の4段目) 標本化周波数 :88.2kHz 量子化ビット数:16ビット (5) DVD (図17) 標本化周波数 :48kHz 量子化ビット数:16ビット (6) DVD (図17) 標本化周波数 :96kHz 量子化ビット数:16ビット
【0026】CD−ROM XA モード2、フォーム
2ではユーザデータは2324バイトである。また、C
D−ROM モード2では、ユーザデータは2336バ
イトである。これらの規格では、比較的ユーザデータの
データ量、すなわちバイト数が多いので、1枚のディス
クに記録収納可能なデータ量が多く、有利である。
2ではユーザデータは2324バイトである。また、C
D−ROM モード2では、ユーザデータは2336バ
イトである。これらの規格では、比較的ユーザデータの
データ量、すなわちバイト数が多いので、1枚のディス
クに記録収納可能なデータ量が多く、有利である。
【0027】また、上記(1)、(2)のCD−ROM
XA モード2 フォーム2を用いた場合は、独自の
割当てのサブヘッダを規定することができる。サブヘッ
ダの内容を表2に示す。
XA モード2 フォーム2を用いた場合は、独自の
割当てのサブヘッダを規定することができる。サブヘッ
ダの内容を表2に示す。
【0028】
【表2】
【0029】上記サブヘッダ中、サブモードバイトのビ
ット5〜2をこの符号化IDに用いることで、サブヘッ
ダを見ながら、このフォーマットのデコードを行うこと
ができる。以下の表3と表4に、サブヘッダ中のサブモ
ードと、コーディング情報の内容を示す。サブヘッダに
はフォーマット時の条件を記録することができるが、そ
の手法として2つの方法がある。その一つはそのセクタ
のフォーマット条件を入れる方法であり、他の方法はフ
ォーマット条件を複数のセクタに分けて記録する方法で
あり、この場合これら複数のセクタの情報を集合して解
読可能となる。
ット5〜2をこの符号化IDに用いることで、サブヘッ
ダを見ながら、このフォーマットのデコードを行うこと
ができる。以下の表3と表4に、サブヘッダ中のサブモ
ードと、コーディング情報の内容を示す。サブヘッダに
はフォーマット時の条件を記録することができるが、そ
の手法として2つの方法がある。その一つはそのセクタ
のフォーマット条件を入れる方法であり、他の方法はフ
ォーマット条件を複数のセクタに分けて記録する方法で
あり、この場合これら複数のセクタの情報を集合して解
読可能となる。
【0030】
【表3】
【0031】
【表4】
【0032】上記4つの態様中、標本化周波数が88.
2kHzである、(2)と(4)では、2ブロックで1
フレームを構成することとなる。したがって、44.1
kHzの場合と比較して、記録できる時間は半分とな
る。
2kHzである、(2)と(4)では、2ブロックで1
フレームを構成することとなる。したがって、44.1
kHzの場合と比較して、記録できる時間は半分とな
る。
【0033】上記実施例は、信号処理回路2が可逆圧縮
方式である場合について説明したが、本発明者らが先に
開発したいわゆる準可逆符号化方式のものを適用するこ
とにより、更にデータ量を圧縮することができる。以下
にこの方式について説明する。
方式である場合について説明したが、本発明者らが先に
開発したいわゆる準可逆符号化方式のものを適用するこ
とにより、更にデータ量を圧縮することができる。以下
にこの方式について説明する。
【0034】図4は図1の信号処理回路に本発明者らが
開発した音声の準可逆符号化装置を適用する場合の例を
示すブロック図、図5は図4における聴覚心理分析と符
号量調整処理を説明するためのフローチャート、図6は
図4の準可逆符号化装置と従来例における符号量不足時
の再量子化ノイズレベルの比較例を示す説明図、図7は
図4の準可逆符号化装置と従来例における聴感上の音質
比較例を示す説明図である。
開発した音声の準可逆符号化装置を適用する場合の例を
示すブロック図、図5は図4における聴覚心理分析と符
号量調整処理を説明するためのフローチャート、図6は
図4の準可逆符号化装置と従来例における符号量不足時
の再量子化ノイズレベルの比較例を示す説明図、図7は
図4の準可逆符号化装置と従来例における聴感上の音質
比較例を示す説明図である。
【0035】図4に示す装置では先ず、従来の周波数領
域処理のエンコーダと同様に、バッファ21が後段の窓
掛け・直交変換部22が直交変換する際に必要なフレー
ム分のPCM信号をバッファリングし、窓掛け・直交変
換部22はこのフレームデータに窓掛け(一般にはハニ
ング窓等の窓掛け)し、MDCT(変形離散コサイン変
換)等により直交変換し、この直交変換係数を複数のバ
ンドに分割する。正規化部23はこのバンド毎の正規化
係数(スケールファクタ)を決定し、バンド内の直交変
換係数を正規化する。量子化・符号化部24はこの正規
化後の係数を可逆に必要な精度で量子化し、必要であれ
ばエントロピー符号化する。
域処理のエンコーダと同様に、バッファ21が後段の窓
掛け・直交変換部22が直交変換する際に必要なフレー
ム分のPCM信号をバッファリングし、窓掛け・直交変
換部22はこのフレームデータに窓掛け(一般にはハニ
ング窓等の窓掛け)し、MDCT(変形離散コサイン変
換)等により直交変換し、この直交変換係数を複数のバ
ンドに分割する。正規化部23はこのバンド毎の正規化
係数(スケールファクタ)を決定し、バンド内の直交変
換係数を正規化する。量子化・符号化部24はこの正規
化後の係数を可逆に必要な精度で量子化し、必要であれ
ばエントロピー符号化する。
【0036】そして、図4の例では、聴覚心理分析部2
5と符号量制御部26及び量子化・符号化部24が図5
に示すような処理を行う。図5において、先ず、量子化
・符号化部24により正規化された係数の1回目の量子
化ビット数(Bit[i])を決定し、符号量を見積もって総
符号量(Total bit )を算出する(ステップS1)。次
いでそのフレームの使用可能符号量(Avail bit )を確
認又は算出し(ステップS2)、次いで総符号量(Tota
l bit )と使用可能符号量(Avail bit )を比較するこ
とにより符号量が不足するか否かをチェックする(ステ
ップS3)。
5と符号量制御部26及び量子化・符号化部24が図5
に示すような処理を行う。図5において、先ず、量子化
・符号化部24により正規化された係数の1回目の量子
化ビット数(Bit[i])を決定し、符号量を見積もって総
符号量(Total bit )を算出する(ステップS1)。次
いでそのフレームの使用可能符号量(Avail bit )を確
認又は算出し(ステップS2)、次いで総符号量(Tota
l bit )と使用可能符号量(Avail bit )を比較するこ
とにより符号量が不足するか否かをチェックする(ステ
ップS3)。
【0037】そして、符号量が不足する場合(Total bi
t >Avail bit )には、先ず、聴覚心理モデルのマスキ
ング効果と最小可聴限特性を考慮してバンドパワーp
[i] (=正規化値2 =scale[i]2 )からマスキングカー
ブm[i] を算出する(ステップS4)。この場合、マス
キングカーブm[i] は基準カーブcurve[i]とバンドパワ
ーp[i] を畳み込み演算することにより得られる。
t >Avail bit )には、先ず、聴覚心理モデルのマスキ
ング効果と最小可聴限特性を考慮してバンドパワーp
[i] (=正規化値2 =scale[i]2 )からマスキングカー
ブm[i] を算出する(ステップS4)。この場合、マス
キングカーブm[i] は基準カーブcurve[i]とバンドパワ
ーp[i] を畳み込み演算することにより得られる。
【0038】次いで最小可聴限とマスキングカーブから
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより不足符号量
を各バンドに振り分ける。但し、バンドiにおいて1ビ
ット削減を行う毎にN[i]から6.0を減算し、ビット
削減が標準ノイズレベルN[i] と相似形になるようにす
る(ステップS6)。そして、このように各バンド毎に
最終的に決定された量子化ビット数で、量子化・符号化
部24で再量子化及び符号化する(ステップS7)。
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより不足符号量
を各バンドに振り分ける。但し、バンドiにおいて1ビ
ット削減を行う毎にN[i]から6.0を減算し、ビット
削減が標準ノイズレベルN[i] と相似形になるようにす
る(ステップS6)。そして、このように各バンド毎に
最終的に決定された量子化ビット数で、量子化・符号化
部24で再量子化及び符号化する(ステップS7)。
【0039】また、ステップS3において符号量が不足
しない場合には、余剰ビットを各バンドに割り当て又は
パディングし(ステップS8)、その量子化ビット数
で、量子化・符号化部24で再量子化及び符号化する
(ステップS7)。フォーマット化出力部27は一般
に、正規化係数(場合によっては量子化ビット数)と、
符号量制御部26の符号量制御情報と、それにヘッダ等
の補助情報を付加してフォーマット化(ビットストリー
ム化)して伝送する。
しない場合には、余剰ビットを各バンドに割り当て又は
パディングし(ステップS8)、その量子化ビット数
で、量子化・符号化部24で再量子化及び符号化する
(ステップS7)。フォーマット化出力部27は一般
に、正規化係数(場合によっては量子化ビット数)と、
符号量制御部26の符号量制御情報と、それにヘッダ等
の補助情報を付加してフォーマット化(ビットストリー
ム化)して伝送する。
【0040】図6は図4の例と、従来のエンコーダにお
いて符号量不足時の再量子化ノイズレベルの設定例を比
較した場合を示している。上記例によれば、再量子化ノ
イズ聴覚心理モデルに応じてシェーピングされており、
ノイズ量が同じであっても聴感上ではノイズレベルが下
がった場合と同等の効果を得ることができる。したがっ
て、聴感上の音質劣化を最小限にして準可逆的に符号化
することができる。
いて符号量不足時の再量子化ノイズレベルの設定例を比
較した場合を示している。上記例によれば、再量子化ノ
イズ聴覚心理モデルに応じてシェーピングされており、
ノイズ量が同じであっても聴感上ではノイズレベルが下
がった場合と同等の効果を得ることができる。したがっ
て、聴感上の音質劣化を最小限にして準可逆的に符号化
することができる。
【0041】図7は従来例で非可逆符号化を行った場合
と、上記例の場合の音質の比較例を示し、図7(a)は
フレームの一部が非可逆となる場合、図7(b)はフレ
ームの大部分が非可逆となる場合を示す。図のように非
可逆となる区間において太線で示す本発明の方が細線で
示す従来例より音質を改善することができ、したがっ
て、符号化全体として安定した音質を得ることができ
る。また、本発明によれば、非可逆符号化を行った場合
の音質を十分確保することができるので、各フレームの
使用可能符号量が一定の「固定伝送レート」で伝送する
ことができ、したがって、非可逆フレームが大幅に増加
しても音質上の問題は発生しない。この結果、オーサリ
ングや再生装置側の符号量制御に関わる処理を大幅に簡
略化することができる。
と、上記例の場合の音質の比較例を示し、図7(a)は
フレームの一部が非可逆となる場合、図7(b)はフレ
ームの大部分が非可逆となる場合を示す。図のように非
可逆となる区間において太線で示す本発明の方が細線で
示す従来例より音質を改善することができ、したがっ
て、符号化全体として安定した音質を得ることができ
る。また、本発明によれば、非可逆符号化を行った場合
の音質を十分確保することができるので、各フレームの
使用可能符号量が一定の「固定伝送レート」で伝送する
ことができ、したがって、非可逆フレームが大幅に増加
しても音質上の問題は発生しない。この結果、オーサリ
ングや再生装置側の符号量制御に関わる処理を大幅に簡
略化することができる。
【0042】次に、信号処理回路の他の例について図8
乃至図14に沿って説明する。図8は図4同様、本発者
らが開発した音声の準可逆符号化装置の他の例を示すブ
ロック図、図9は図8における符号量補正値を算出する
処理を説明するためのフローチャート、図10は符号量
偏差と符号量補正値の関係を示すグラフ、図11〜図1
3は符号量補正前と補正後の符号量偏差ヒストグラムを
示す説明図、図14は図8における聴覚心理分析と符号
量調整処理を説明するためのフローチャート、図15は
図8の準可逆符号化装置と従来例における符号量過剰時
の再量子化ノイズレベルの比較例を示す説明図、図16
は図8の準可逆符号化装置と従来例における聴感上の音
質比較例を示す説明図である。
乃至図14に沿って説明する。図8は図4同様、本発者
らが開発した音声の準可逆符号化装置の他の例を示すブ
ロック図、図9は図8における符号量補正値を算出する
処理を説明するためのフローチャート、図10は符号量
偏差と符号量補正値の関係を示すグラフ、図11〜図1
3は符号量補正前と補正後の符号量偏差ヒストグラムを
示す説明図、図14は図8における聴覚心理分析と符号
量調整処理を説明するためのフローチャート、図15は
図8の準可逆符号化装置と従来例における符号量過剰時
の再量子化ノイズレベルの比較例を示す説明図、図16
は図8の準可逆符号化装置と従来例における聴感上の音
質比較例を示す説明図である。
【0043】図8に示す装置では、先ず、従来の周波数
領域処理のエンコーダと同様に、バッファ21が後段の
窓掛け・直交変換部22が直交変換する際に必要なフレ
ーム分のPCM信号をバッファリングし、窓掛け・直交
変換部22はこのフレームデータに窓掛け(一般にはハ
ニング窓等の窓掛け)し、MDCT(変形離散コサイン
変換)等により直交変換し、この直交変換係数を複数の
バンドに分割する。正規化部23はこのバンド毎の正規
化係数(スケールファクタ)を決定し、バンド内の直交
変換係数を正規化する。量子化・符号化部24はこの正
規化後の係数を可逆に必要な精度で量子化し、この場合
にも必要であればエントロピー符号化する。但し、図1
1に示す時間領域処理の場合よりエントロピ符号化の効
果は一般に少ない。
領域処理のエンコーダと同様に、バッファ21が後段の
窓掛け・直交変換部22が直交変換する際に必要なフレ
ーム分のPCM信号をバッファリングし、窓掛け・直交
変換部22はこのフレームデータに窓掛け(一般にはハ
ニング窓等の窓掛け)し、MDCT(変形離散コサイン
変換)等により直交変換し、この直交変換係数を複数の
バンドに分割する。正規化部23はこのバンド毎の正規
化係数(スケールファクタ)を決定し、バンド内の直交
変換係数を正規化する。量子化・符号化部24はこの正
規化後の係数を可逆に必要な精度で量子化し、この場合
にも必要であればエントロピー符号化する。但し、図1
1に示す時間領域処理の場合よりエントロピ符号化の効
果は一般に少ない。
【0044】そして、この例では、聴覚心理分析部25
と符号量制御部26及び量子化・符号化部24が区間毎
の符号量補正値Adj に基づいて以下のような処理を行
う。先ず、本発明では、オーディオメディアを制作する
場合に、1曲(例えば4〜6分)又は全曲(例えば40
〜74分)等の長時間平均で符号量が目標値になるよう
に制御する方法であり、エンコード処理は2パスで行
う。具体的には、 (a)可逆符号化を仮定した1回目のエンコード処理を
行う。但し、各区間の使用符号量が得られればよく、実
際に量子化・符号化を行う必要はない。 (b)図9に示すように各区間の使用符号量と目標符号
量の差から各区間の符号量補正値Adj を算出する。 (c)2回目のエンコード処理を行う。この場合、可逆
符号化を仮定したビット割り当てを補正符号量と聴覚心
理モデルにより変更して量子化・符号化を行い、また、
ビット割り当て変更の情報を補助情報としてデコーダに
伝送する。
と符号量制御部26及び量子化・符号化部24が区間毎
の符号量補正値Adj に基づいて以下のような処理を行
う。先ず、本発明では、オーディオメディアを制作する
場合に、1曲(例えば4〜6分)又は全曲(例えば40
〜74分)等の長時間平均で符号量が目標値になるよう
に制御する方法であり、エンコード処理は2パスで行
う。具体的には、 (a)可逆符号化を仮定した1回目のエンコード処理を
行う。但し、各区間の使用符号量が得られればよく、実
際に量子化・符号化を行う必要はない。 (b)図9に示すように各区間の使用符号量と目標符号
量の差から各区間の符号量補正値Adj を算出する。 (c)2回目のエンコード処理を行う。この場合、可逆
符号化を仮定したビット割り当てを補正符号量と聴覚心
理モデルにより変更して量子化・符号化を行い、また、
ビット割り当て変更の情報を補助情報としてデコーダに
伝送する。
【0045】次に、図9を参照して上記(b)における
符号量補正値Adj を算出する処理について説明する。 先ず、対象区間の使用符号量を入力して平均符号量T
mを算出し、目標符号量Tdとの差を評価する(ステッ
プS11、S12)。 次いで、符号量過剰な場合(平均符号量Tm>目標符
号量Td)には、各区間の使用符号量と目標符号量との
偏差Delta[bit](但し、過剰な場合に正)を算出し、こ
の偏差Delta[bit]を適当なステップ幅step[bit] で量子
化し、ヒストグラムを作成する(ステップS12→S1
3)。 次いで、ヒストグラムの偏差が負の領域の偏差総量S
mと、正の領域の偏差総量Spを以下のように算出する
(ステップS14)。
符号量補正値Adj を算出する処理について説明する。 先ず、対象区間の使用符号量を入力して平均符号量T
mを算出し、目標符号量Tdとの差を評価する(ステッ
プS11、S12)。 次いで、符号量過剰な場合(平均符号量Tm>目標符
号量Td)には、各区間の使用符号量と目標符号量との
偏差Delta[bit](但し、過剰な場合に正)を算出し、こ
の偏差Delta[bit]を適当なステップ幅step[bit] で量子
化し、ヒストグラムを作成する(ステップS12→S1
3)。 次いで、ヒストグラムの偏差が負の領域の偏差総量S
mと、正の領域の偏差総量Spを以下のように算出する
(ステップS14)。
【0046】
【数1】
【0047】次いで、負の領域の偏差総量Smの比率
Sm/(Sm+Sp)が予め定めた値Bound (例えば
0.33等)より大きい場合には、以下のように各区間
毎の符号量補正値Adj を求める(ステップS15→S1
6)。
Sm/(Sm+Sp)が予め定めた値Bound (例えば
0.33等)より大きい場合には、以下のように各区間
毎の符号量補正値Adj を求める(ステップS15→S1
6)。
【0048】
【数2】
【0049】’他方、比率Sm/(Sm+Sp)が値
Bound より小さい場合には、比率Sm/(Sm+Sp)
が値Bound より大きくなるようにヒストグラムのオフセ
ット値Off を決定し(ステップS15→S17)、以下
のように各区間毎の符号量補正値Adj を求める(ステッ
プS18)。
Bound より小さい場合には、比率Sm/(Sm+Sp)
が値Bound より大きくなるようにヒストグラムのオフセ
ット値Off を決定し(ステップS15→S17)、以下
のように各区間毎の符号量補正値Adj を求める(ステッ
プS18)。
【0050】
【数3】 ここで、この手法を用いる理由は、ヒストグラムが極端
に「過剰」側に偏っている場合には、ある程度全フレー
ムにオフセットを掛けて補正する必要があるからであ
る。
に「過剰」側に偏っている場合には、ある程度全フレー
ムにオフセットを掛けて補正する必要があるからであ
る。
【0051】’また、ステップS12において平均符
号量Tm>目標符号量Tdでない場合には、平均符号量
Tmと目標符号量Tdに基づいて以下のように各区間で
一定の符号量補正値Adj を求める(ステップS19)。 Adj =(Td−Tm) [bit]
号量Tm>目標符号量Tdでない場合には、平均符号量
Tmと目標符号量Tdに基づいて以下のように各区間で
一定の符号量補正値Adj を求める(ステップS19)。 Adj =(Td−Tm) [bit]
【0052】図10は符号量偏差Delta[bit]と符号量補
正値Adj の関係を示し、偏差Delta[bit]が正であって大
きい程、補正値Adj も増大する。また、図11〜図13
は符号量補正前(実線)と補正後(破線)のヒストグラ
ムを示し、横軸がサンプル当たりの偏差(Delta /区間
当たりのサンプル数)を、また、縦軸が度数を示す。詳
しくは図11は上記のように補正値Adj を求めた場
合、また、図12、図13はそれぞれ上記 ’、’
のように補正値Adj を求めた場合を示している。
正値Adj の関係を示し、偏差Delta[bit]が正であって大
きい程、補正値Adj も増大する。また、図11〜図13
は符号量補正前(実線)と補正後(破線)のヒストグラ
ムを示し、横軸がサンプル当たりの偏差(Delta /区間
当たりのサンプル数)を、また、縦軸が度数を示す。詳
しくは図11は上記のように補正値Adj を求めた場
合、また、図12、図13はそれぞれ上記 ’、’
のように補正値Adj を求めた場合を示している。
【0053】次に、図14を参照して聴覚心理分析と符
号量調整処理を説明する。図14において、先ず、量子
化・符号化部24により正規化された係数の1回目(可
逆方式)の量子化ビット数(Bit[i])を決定し、符号量
を見積もって総符号量(Total bit )を算出する(ステ
ップS21)。次いでそのフレームの符号量補正値Adj
を読み込み(ステップS22)、補正値Adj が負(Adj
<0)か否かをチェックする(ステップS23)。
号量調整処理を説明する。図14において、先ず、量子
化・符号化部24により正規化された係数の1回目(可
逆方式)の量子化ビット数(Bit[i])を決定し、符号量
を見積もって総符号量(Total bit )を算出する(ステ
ップS21)。次いでそのフレームの符号量補正値Adj
を読み込み(ステップS22)、補正値Adj が負(Adj
<0)か否かをチェックする(ステップS23)。
【0054】そして、補正値Adj が負の場合(符号量削
減)には、先ず、聴覚心理モデルのマスキング効果と最
小可聴限特性を考慮してバンドパワーp[i] (=正規化
係数 2 =scale[i]2 )からマスキングカーブm[i] を算
出する(ステップS4)。この場合、マスキングカーブ
m[i] は基準カーブcurve[i]とバンドパワーp[i] を畳
み込み演算することにより得られる。
減)には、先ず、聴覚心理モデルのマスキング効果と最
小可聴限特性を考慮してバンドパワーp[i] (=正規化
係数 2 =scale[i]2 )からマスキングカーブm[i] を算
出する(ステップS4)。この場合、マスキングカーブ
m[i] は基準カーブcurve[i]とバンドパワーp[i] を畳
み込み演算することにより得られる。
【0055】次いで最小可聴限とマスキングカーブから
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより符号量補正
値を各バンドに振り分ける。但し、バンドiにおいて1
ビット削減を行う毎にN[i] から6.0を減算し、ビッ
ト削減が標準ノイズレベルN[i] と相似形になるように
する(ステップS6)。そして、このように各バンド毎
に最終的に決定された量子化ビット数で、量子化・符号
化部24で再量子化及び符号化する(ステップS7)。
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより符号量補正
値を各バンドに振り分ける。但し、バンドiにおいて1
ビット削減を行う毎にN[i] から6.0を減算し、ビッ
ト削減が標準ノイズレベルN[i] と相似形になるように
する(ステップS6)。そして、このように各バンド毎
に最終的に決定された量子化ビット数で、量子化・符号
化部24で再量子化及び符号化する(ステップS7)。
【0056】また、ステップS23において補正値Adj
が負でない場合(符号量増加)には、余剰ビットを各バ
ンドに割り当て又はパディングし(ステップS8)、そ
の量子化ビット数で、量子化・符号化部24で再量子化
及び符号化する(ステップS7)。フォーマット化出力
部27は一般に、正規化係数(場合によっては量子化ビ
ット数)と、符号量制御部26の符号量制御情報と、そ
れにヘッダ等の補助情報を付加してフォーマット化(ビ
ットストリーム化)して伝送する。
が負でない場合(符号量増加)には、余剰ビットを各バ
ンドに割り当て又はパディングし(ステップS8)、そ
の量子化ビット数で、量子化・符号化部24で再量子化
及び符号化する(ステップS7)。フォーマット化出力
部27は一般に、正規化係数(場合によっては量子化ビ
ット数)と、符号量制御部26の符号量制御情報と、そ
れにヘッダ等の補助情報を付加してフォーマット化(ビ
ットストリーム化)して伝送する。
【0057】したがって、上記例によれば、算術エント
ロピーが大きく、聴感エントロピーが小さい区間ほど、
より多くの符号量補正(削減)を受けることになり、聴
感に対応した符号量配分を行うことができる。また、図
15は図8の装置と、従来のエンコーダにおいて符号量
過剰時の再量子化ノイズレベルの設定例を比較した場合
を示し、この例によれば、非可逆符号化されるフレーム
においても再量子化ノイズ聴覚心理モデルに応じてシェ
ーピングされており、ノイズ量が同じであっても聴感上
ではノイズレベルが下がった場合と同等の効果を得るこ
とができる。したがって、聴感上の音質劣化を最小限に
して準可逆的に符号化することができる。
ロピーが大きく、聴感エントロピーが小さい区間ほど、
より多くの符号量補正(削減)を受けることになり、聴
感に対応した符号量配分を行うことができる。また、図
15は図8の装置と、従来のエンコーダにおいて符号量
過剰時の再量子化ノイズレベルの設定例を比較した場合
を示し、この例によれば、非可逆符号化されるフレーム
においても再量子化ノイズ聴覚心理モデルに応じてシェ
ーピングされており、ノイズ量が同じであっても聴感上
ではノイズレベルが下がった場合と同等の効果を得るこ
とができる。したがって、聴感上の音質劣化を最小限に
して準可逆的に符号化することができる。
【0058】図16は従来例において非可逆符号化を行
った場合と、上記図8の例の場合の音質の比較例を示
し、図16(a)はフレームの一部が非可逆となる場
合、図16(b)はフレームの大部分が非可逆となる場
合を示す。図のように非可逆となる区間において太線で
示す本発明の方が細線で示す従来例より音質を改善する
ことができ、したがって、符号化全体として安定した音
質を得ることができる。
った場合と、上記図8の例の場合の音質の比較例を示
し、図16(a)はフレームの一部が非可逆となる場
合、図16(b)はフレームの大部分が非可逆となる場
合を示す。図のように非可逆となる区間において太線で
示す本発明の方が細線で示す従来例より音質を改善する
ことができ、したがって、符号化全体として安定した音
質を得ることができる。
【0059】次に本発明によるデータ圧縮率がどの程度
であるかについて検討する。表5は音楽の3つのジャン
ル別に、圧縮効果を実測した結果を示したものである。
なお、表中の1段目の1644はビット数が16で、標
本化周波数が44.1kHzzであることを示してい
る。各ジャンルにおいて、5乃至10曲を選定して調査
した。
であるかについて検討する。表5は音楽の3つのジャン
ル別に、圧縮効果を実測した結果を示したものである。
なお、表中の1段目の1644はビット数が16で、標
本化周波数が44.1kHzzであることを示してい
る。各ジャンルにおいて、5乃至10曲を選定して調査
した。
【0060】
【表5】
【0061】表5中の数字は基のデータ量を100とし
たときの圧縮後のデータ量を示している。この表から分
るように、例えば、1644をクラシック音楽に適用す
ると、平均で50%、最大で60%の圧縮が可能である
ことが分る。ポップスやジャズ・フュージョンではクラ
シック程の圧縮はできないが、平均的に23%から35
%の圧縮率が得られる。
たときの圧縮後のデータ量を示している。この表から分
るように、例えば、1644をクラシック音楽に適用す
ると、平均で50%、最大で60%の圧縮が可能である
ことが分る。ポップスやジャズ・フュージョンではクラ
シック程の圧縮はできないが、平均的に23%から35
%の圧縮率が得られる。
【0062】表5に示した圧縮の効果は、図4及び図8
に示した準可逆符号化装置を用いない場合のものであ
り、準可逆符号化装置を用いることにより、さらに圧縮
率を高くすることができる。
に示した準可逆符号化装置を用いない場合のものであ
り、準可逆符号化装置を用いることにより、さらに圧縮
率を高くすることができる。
【0063】上記本発明の実施例の4つの態様は、その
いずれかを選択できるように、本発明の圧縮記録装置又
は圧縮装置の使用者が手動で図示省略のセレクトボタン
などを操作することにより、切り替えて使用できる構成
とすることができる。なお、標本化周波数を44.1k
Hzより高く設定した場合は、44.1kHzのときの
一定線速度より更に速い線速度となるよう、ディスクの
回転数を制御する必要がある。標本化周波数を44.1
kHzより高く設定した場合は、高域の周波数特性が改
善され、高音質化が図られる。図17はDVDのフォー
マットを図3と同様にセクタ単位で示すデータ配置模式
図である。図17に示されるように、DVDでは通常1
パックが2048バイト(1論理セクタ)で構成され、
その中のパケット(ユーザデータ)2034バイトが利
用できる。なお、図17において、「パックスタート」
は同期信号となるSYNCパターンを有し、「SCR」
は時間情報であるシステム・クロック・レファレンスで
あり、「Mux rate」は転送レート(マルチプレ
クシングレート)であり、「パケット(ユーザデー
タ)」はパケットヘッダとデータなどからなる。
いずれかを選択できるように、本発明の圧縮記録装置又
は圧縮装置の使用者が手動で図示省略のセレクトボタン
などを操作することにより、切り替えて使用できる構成
とすることができる。なお、標本化周波数を44.1k
Hzより高く設定した場合は、44.1kHzのときの
一定線速度より更に速い線速度となるよう、ディスクの
回転数を制御する必要がある。標本化周波数を44.1
kHzより高く設定した場合は、高域の周波数特性が改
善され、高音質化が図られる。図17はDVDのフォー
マットを図3と同様にセクタ単位で示すデータ配置模式
図である。図17に示されるように、DVDでは通常1
パックが2048バイト(1論理セクタ)で構成され、
その中のパケット(ユーザデータ)2034バイトが利
用できる。なお、図17において、「パックスタート」
は同期信号となるSYNCパターンを有し、「SCR」
は時間情報であるシステム・クロック・レファレンスで
あり、「Mux rate」は転送レート(マルチプレ
クシングレート)であり、「パケット(ユーザデー
タ)」はパケットヘッダとデータなどからなる。
【0064】
【発明の効果】以上説明したように本発明によれば、オ
ーディオ信号を量子化ビット数16ビット、標本化周波
数44.1kHz又はそれ以上の周波数で量子化し、量
子化された所定量の量子化データ毎に直交変換を適用し
てデータ量を圧縮し、圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2のユーザデータ領域あ
るいはCD−ROM規格のモード2のユーザデータ領域
Mに配するようフォーマるいはCD−ROM規格のモー
ド2のユーザデータ領域、あるいはDVDのユーザデー
タ領域に配するようフォーマッティングしているので、
音声信号を高圧縮率で圧縮して、CD−ROMやDVD
に記録することができる。したがって、音楽の内容によ
っては、CD−DAより記録時間を長くすることも可能
である。また、新規格のDVDオーディオを実現可能と
している。
ーディオ信号を量子化ビット数16ビット、標本化周波
数44.1kHz又はそれ以上の周波数で量子化し、量
子化された所定量の量子化データ毎に直交変換を適用し
てデータ量を圧縮し、圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2のユーザデータ領域あ
るいはCD−ROM規格のモード2のユーザデータ領域
Mに配するようフォーマるいはCD−ROM規格のモー
ド2のユーザデータ領域、あるいはDVDのユーザデー
タ領域に配するようフォーマッティングしているので、
音声信号を高圧縮率で圧縮して、CD−ROMやDVD
に記録することができる。したがって、音楽の内容によ
っては、CD−DAより記録時間を長くすることも可能
である。また、新規格のDVDオーディオを実現可能と
している。
【図1】本発明のオーディオ信号圧縮記録装置の好まし
い実施例を示すブロック図である。
い実施例を示すブロック図である。
【図2】図1中の信号処理回路2の一例を示すブロック
図である。
図である。
【図3】CDの種々のフォーマットをセクタ単位で示し
たデータ配置摸式図である。
たデータ配置摸式図である。
【図4】図1中の信号処理回路2の他の例としての音声
の準可逆符号化装置の一例を示すブロック図である。
の準可逆符号化装置の一例を示すブロック図である。
【図5】図4における聴覚心理分析と符号量調整処理を
説明するためのフローチャートである。
説明するためのフローチャートである。
【図6】図4の準可逆符号化装置と従来例における符号
量不足時の再量子化ノイズレベルの比較例を示す説明図
である。
量不足時の再量子化ノイズレベルの比較例を示す説明図
である。
【図7】図4の準可逆符号化装置と従来例における聴感
上の音質比較例を示す説明図である。
上の音質比較例を示す説明図である。
【図8】図1中の信号処理回路2のさらに他の例として
の音声の準可逆符号化装置の一例を示すブロック図であ
る。
の音声の準可逆符号化装置の一例を示すブロック図であ
る。
【図9】図8における符号量補正値を算出する処理を説
明するためのフローチャートである。
明するためのフローチャートである。
【図10】符号量偏差と符号量補正値の関係を示すグラ
フである。
フである。
【図11】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
ラムを示す説明図である。
【図12】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
ラムを示す説明図である。
【図13】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
ラムを示す説明図である。
【図14】図8における聴覚心理分析と符号量調整処理
を説明するためのフローチャートである。
を説明するためのフローチャートである。
【図15】図8の準可逆符号化装置と従来例における符
号量不足時の再量子化ノイズレベルの比較例を示す説明
図である。
号量不足時の再量子化ノイズレベルの比較例を示す説明
図である。
【図16】図8の準可逆符号化装置と従来例における聴
感上の音質比較例を示す説明図である。
感上の音質比較例を示す説明図である。
【図17】DVDのフォーマットをセクタ単位で示した
データ配置摸式図である。
データ配置摸式図である。
1 A/D変換回路(量子化手段) 2 信号処理部(メモリ3とともにデータ圧縮手段を構
成する) 3 メモリ 4 CD−ROM符号化回路(フォーマッティング手
段) 5 CD符号化回路 10 直交変換回路 11 正規化部 22 窓掛け・直交変換部 23 正規化部 24 量子化・符号化部 25 聴覚心理分析部 26 符号量制御部 27 フォーマット化出力部 IN 入力端子 OUT1、OUT2 出力端子
成する) 3 メモリ 4 CD−ROM符号化回路(フォーマッティング手
段) 5 CD符号化回路 10 直交変換回路 11 正規化部 22 窓掛け・直交変換部 23 正規化部 24 量子化・符号化部 25 聴覚心理分析部 26 符号量制御部 27 フォーマット化出力部 IN 入力端子 OUT1、OUT2 出力端子
Claims (13)
- 【請求項1】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをデジタルディ
スクのユーザデータ領域に配するようフォーマッティン
グするフォーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。 - 【請求項2】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをデジタルディ
スクのユーザデータ領域に配するようフォーマッティン
グするフォーマッティング手段とを、 有するオーディオ信号圧縮装置。 - 【請求項3】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化し、量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮し、圧縮されたデー
タをデジタルディスクのユーザデータ領域に配するよう
フォーマッティングし、フォーマッティングされたデー
タをCDフォーマットとして記録した光記録媒体。 - 【請求項4】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2、あるいはCD−RO
M規格のモード2のユーザデータ領域に配するようフォ
ーマッティングするフォーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。 - 【請求項5】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2、あるいはCD−RO
M規格のモード2のユーザデータ領域に配するようフォ
ーマッティングするフォーマッティング手段とを、 有するオーディオ信号圧縮装置。 - 【請求項6】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化し、量子化された所定量の量子化データ毎に
直交変換を適用してデータ量を圧縮し、圧縮されたデー
タをCD−ROMXA規格のモード2、フォーム2、あ
るいはCD−ROM規格のモード2のユーザデータ領域
に配するようフォーマッティングし、フォーマッティン
グされたデータをCDフォーマットとして記録した光記
録媒体。 - 【請求項7】 オーディオ信号を量子化ビット数16ビ
ット、標本化周波数44.1kHz又はそれ以上の周波
数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをDVDのユー
ザデータ領域に配するようフォーマッティングするフォ
ーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。 - 【請求項8】 前記オーディオ信号が2チャンネル信号
であり、前記データ圧縮手段が1チャンネルあたり2m
個(mは正の整数)の量子化データ毎に前記直交変換を適
用してデータ量を圧縮するよう構成されている請求項
1、4、7のいずれか1つに記載のオーディオ信号圧縮
記録装置。 - 【請求項9】 前記データ圧縮手段が前記オーディオ信
号を所定の区間長ごとにフレーム化する手段と、 前記フレーム内の信号を可逆方式で符号化するのに必要
な符号量を算出し、フレームで使用可能な符号量と比較
する符号量制御手段と、フレーム内の信号を聴覚心理モ
デルで分析する聴覚心理分析手段と、 フレーム符号量が使用可能符号量以下の場合にはフレー
ム内の信号を可逆方式で量子化し、フレーム符号量が使
用可能符号量を超える場合にはフレーム内の信号を前記
聴覚心理分析手段の出力に基づいて非可逆方式で量子化
する非可逆量子化手段とを、 有する請求項1、4、7、8のいずれか1つに記載のオ
ーディオ信号圧縮記録装置。 - 【請求項10】 前記データ圧縮手段が前記オーディオ
信号を所定の区間長ごとにフレーム化するフレーム化手
段と、 符号化対象の全区間の可逆方式による目標符号量と実符
号量の差を算出し、各区間毎の符号量の過不足量に応じ
た補正値を算出する符号量補正値算出手段と、 フレーム内の信号を聴覚心理モデルで分析する聴覚心理
分析手段と、 全区間の平均符号量が目標符号量になるように前記符号
量補正値に基づいて各区間の信号を可逆方式で量子化す
るか又は前記聴覚心理分析手段の出力に基づいて非可逆
方式で量子化する非可逆量子化手段とを、 有する請求項1、4、7、8のいずれか1つに記載のオ
ーディオ信号圧縮記録装置。 - 【請求項11】 前記データ圧縮手段が、前記量子化さ
れた信号を直交変換する直交変換手段と、前記直交変換
手段により直交変換されたデータを複数のバンドに分割
するバンド分割手段と、前記バンド分割手段の出力信号
に応答可能な正規化手段と、前記バンド分割手段により
バンド分割されたデータをバンド毎に前記正規化手段に
供給する選択手段とを有する請求項1、4、7乃至10
のいずれか1つに記載のオーディオ信号圧縮記録装置。 - 【請求項12】 オーディオ信号を量子化ビット数16
ビット、標本化周波数44.1kHz又はそれ以上の周
波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮するデータ圧縮手
段と、 前記データ圧縮手段で圧縮されたデータをDVDのユー
ザデータ領域に配するようフォーマッティングするフォ
ーマッティング手段とを、 有するオーディオ信号圧縮装置。 - 【請求項13】 オーディオ信号を量子化ビット数16
ビット、標本化周波数44.1kHz又はそれ以上の周
波数で量子化し、量子化された所定量の量子化データ毎
に直交変換を適用してデータ量を圧縮し、圧縮されたデ
ータをDVDのユーザデータ領域に配するようフォーマ
ッティングし、フォーマッティングされたデータをCD
フォーマットとして記録した光記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6527496A JPH09120646A (ja) | 1995-08-22 | 1996-02-27 | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 |
US09/655,046 US6393203B1 (en) | 1996-02-27 | 2000-09-05 | Signal compressing apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7-236153 | 1995-08-22 | ||
JP23615395 | 1995-08-22 | ||
JP6527496A JPH09120646A (ja) | 1995-08-22 | 1996-02-27 | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09120646A true JPH09120646A (ja) | 1997-05-06 |
Family
ID=26406402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6527496A Withdrawn JPH09120646A (ja) | 1995-08-22 | 1996-02-27 | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09120646A (ja) |
-
1996
- 1996-02-27 JP JP6527496A patent/JPH09120646A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7792414B2 (en) | Signal compressing apparatus | |
JP3937788B2 (ja) | データ記録方法及び装置、データ再生方法及び装置、データ編集方法及び装置 | |
JP2003006999A (ja) | データ記録媒体、データ記録方法及び装置、並びに、データ伝送方法及び装置 | |
JPH09120647A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 | |
US20050147004A1 (en) | Audio data recording/reproduction system and audio data recording medium therefor | |
JPH09120645A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 | |
JPH09120646A (ja) | オーディオ信号圧縮記録装置及びオーディオ信号圧縮装置並びに光記録媒体 | |
JP2002109824A (ja) | ディジタル音声信号の記録方法、およびその装置 | |
JP3454394B2 (ja) | 音声の準可逆符号化装置 | |
JP2002351500A (ja) | ディジタルデータの符号化方法 | |
Stuart et al. | MLP lossless compression | |
JP4293833B2 (ja) | ディジタル信号記録再生装置及びその制御プログラム | |
JPH0944198A (ja) | 音声の準可逆符号化装置 | |
JP2000347697A (ja) | 音声記録再生装置および記録媒体 | |
JP3387084B2 (ja) | 記録媒体、音声復号装置 | |
JP3346399B2 (ja) | 光記録媒体及び音声復号装置 | |
JP3064522B2 (ja) | 信号処理方法及び圧縮データ記録再生装置 | |
Stuart et al. | Lossless compression for dvd-audio | |
JPH1083198A (ja) | ディジタル信号処理方法及び装置 | |
JP3346403B2 (ja) | 光記録媒体及び音声復号装置 | |
JP3346406B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP2001343999A (ja) | 音声信号伝送方法 | |
JP2002268687A (ja) | 情報量変換装置及び情報量変換方法 | |
JPH11234138A (ja) | 情報符号化方法 | |
JP2008203873A (ja) | ディジタル信号再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030506 |