[go: up one dir, main page]

JPH07161140A - ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 - Google Patents

ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法

Info

Publication number
JPH07161140A
JPH07161140A JP5306892A JP30689293A JPH07161140A JP H07161140 A JPH07161140 A JP H07161140A JP 5306892 A JP5306892 A JP 5306892A JP 30689293 A JP30689293 A JP 30689293A JP H07161140 A JPH07161140 A JP H07161140A
Authority
JP
Japan
Prior art keywords
channel
channels
bit allocation
digital audio
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5306892A
Other languages
English (en)
Inventor
Katsuaki Tsurushima
克明 鶴島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP5306892A priority Critical patent/JPH07161140A/ja
Priority to EP95902919A priority patent/EP0734019A4/en
Priority to PCT/JP1994/002056 priority patent/WO1995016263A1/ja
Priority to AU11991/95A priority patent/AU1199195A/en
Publication of JPH07161140A publication Critical patent/JPH07161140A/ja
Priority to US09/204,422 priority patent/US20010047256A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • G11B2020/10601Audio or video recording specifically adapted for recording or reproducing multichannel signals surround sound signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【構成】 8チャネル(L,LC,C,SW,RC,
R,LB,RB)のディジタルオーディオ信号のうち、
6チャネル(L,LC,C,SW,RC,R)のディジ
タルオーディオ信号であって他の2チャネルのディジタ
ルオーディオ信号より聴感上影響力の高いチャネルの信
号に対しては、人間の聴覚特性に応じた高聴感の圧縮符
号化を施す高聴感圧縮符号化回路217〜222と、2
チャネル(LB,RB)のディジタルオーディオ信号に
対してはより高い圧縮率の符号化を施す高率圧縮符号化
回路223,224とを有し、高聴感圧縮符号化回路2
17〜222からの圧縮符号化出力と高率圧縮符号化回
路223,224からの圧縮符号化出力を共に伝送す
る。 【効果】 特に重要な音に対しては高音質の圧縮符号化
が可能であると共に、ビット配分量(バイト配分量)の
無駄を無くすことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、映画フィルム
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タルオーディオ信号を圧縮符号化して伝送するディジタ
ルオーディオ信号の伝送装置及びそれに対応する受信装
置に関するものである。
【0002】
【従来の技術】通常のオーディオ機器の場合のみなら
ず、例えば映画フィルム映写システム、高品位テレビジ
ョン、ビデオテープレコーダ、ビデオディスクプレーヤ
等のステレオないしはマルチサラウンド音響システムに
おいては、例えば4〜8チャネル等の複数チャネルのオ
ーディオ或いは音声信号を扱うようになりつつある。
【0003】特に、業務用においては、ディジタルオー
ディオのマルチチャネル化が進んでおり、例えば8チャ
ネルのディジタルオーディオ信号を扱う機器が浸透して
きている。上記8チャネルのディジタルオーディオ信号
を扱う機器としては、例えば映画フィルム映写システム
等がある。また、高品位テレビジョン、ビデオテープレ
コーダ、ビデオディスクプレーヤ等のステレオないしは
マルチサラウンド音響システムにおいても、例えば4〜
8チャネル等の複数チャネルのオーディオ或いは音声信
号を扱うようになりつつある。
【0004】上記8チャネルのディジタルオーディオ信
号を扱う映画フィルム映写システムにおいては、上記映
画フィルムに対して、例えばレフトチャネル,レフトセ
ンタチャネル,センタチャネル,ライトセンタチャネ
ル,ライトチャネル,サラウンドレフトチャネル,サラ
ウンドライトチャネル,サブウーファチャネルの8チャ
ネルのディジタルオーディオ信号を記録することが行わ
れつつある。なお、上記映画フィルムに記録する上記8
チャネルの各チャネルは、例えば当該映画フィルムの画
像記録領域から再生された画像が映写機によって投影さ
れるスクリーン側に配置されるレフトスピーカ、レフト
センタスピーカ、センタスピーカ、ライトセンタスピー
カ、ライトスピーカ、サブウーファスピーカ、観客席を
取り囲むように左側に配置されるサラウンドレフトスピ
ーカ及び右側に配置されるサラウンドライトスピーカと
対応するものである。
【0005】
【発明が解決しようとする課題】ところが、映画フィル
ムに上記8チャネルのディジタルオーディオ信号を記録
する場合において、映画フィルムには、例えばいわゆる
CD(コンパクトディスク)などで用いているようなサ
ンプリング周波数44.1kHzで16ビットの直線量
子化されたオーディオデータを上記8チャネル分も記録
できる領域を確保することは困難であるため、上記8チ
ャネルのオーディオデータを圧縮して記録する必要があ
る。
【0006】また、フィルムという媒体は、表面に傷な
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。
【0007】しかし、圧縮符号化を行うと楽器や人間の
声などが原音から変化するため、特に上記映画フィルム
のように原音の忠実な再現が必要とされるメディアの記
録フォーマットとして採用する場合において人間の声な
ど重要な音に対しては何らかの高音質化の手段が必要と
なってくる。
【0008】そこで、本発明は、上述したようなことに
鑑み、特に重要な音に対しては高音質の圧縮符号化が可
能であると共に、さらに高圧縮率の圧縮符号化をも可能
とする高能率符号化を用いたディジタルオーディオ信号
の伝送装置及びこれに対応する受信装置を提供すること
を目的としている。
【0009】
【課題を解決するための手段】本発明は、上述の目的を
達成するために提案されたものであり、本発明のディジ
タルオーディオ信号の伝送装置は、複数チャネル(nチ
ャネル、nは3より大なる正の整数)のディジタルオー
ディオ信号を圧縮符号化して伝送する伝送装置であり、
上記n個のチャネルのディジタルオーディオ信号のう
ち、m個(n>m)のチャネルのディジタルオーディオ
信号であって他のn−m個のチャネルのディジタルオー
ディオ信号より聴感上影響力の高い信号に対しては第1
の圧縮率の第1の符号化方式で圧縮符号化する第1の圧
縮符号化手段と、上記n−m個のチャネルのディジタル
オーディオ信号に対しては上記第1の圧縮率よりも高い
第2の圧縮率を有する第2の符号化方式で圧縮符号化す
る第2の圧縮符号化手段とを有し、上記第1の圧縮符号
化手段からの圧縮符号化出力と上記第2の圧縮符号化手
段からの圧縮符号化出力を共に伝送することを特徴とす
るものである。
【0010】ここで、本発明の伝送装置において、上記
n個のチャネルはセンタチャネルとレフトチャネルとラ
イトチャネルとサラウンドレフトチャネルとサラウンド
ライトチャネルであり、上記n−m個のチャネルはサラ
ウンドレフトチャネルとサラウンドライトチャネルであ
る。或いは、上記n個のチャネルはセンタチャネルとレ
フトチャネルとライトチャネルとレフトセンタチャネル
とライトセンタチャネルとサラウンドレフトチャネルと
サラウンドライトチャネルであり、上記n−m個のチャ
ネルはサラウンドレフトチャネルとサラウンドライトチ
ャネルである。
【0011】さらに、本発明の伝送装置において、上記
第1の符号化方式は、入力ディジタルオーディオ信号を
複数帯域に分割し、各帯域毎のディジタルオーディオ信
号を複数サンプル毎にブロック化し、各ブロック単位で
直交変換したスペクトル成分を、聴覚特性に応じて適応
的に圧縮符号化する方式であり、上記第2の符号化方式
は、入力ディジタルオーディオ信号を複数サンプル毎に
直交変換した係数情報とそれに関連するサブ情報を得、
各チャネルのエネルギに応じて各チャネルのビット配分
量を決定し、このビット配分量で適応的に圧縮符号化す
る方式である。なお、上記伝送は、記録媒体への記録を
含む。
【0012】また、本発明のディジタルオーディオ信号
の受信装置は、複数チャネル(nチャネル、nは3より
大なる正の整数)のディジタルオーディオ信号のうち、
m個(n>m)のチャネルのディジタルオーディオ信号
であって他のn−m個のチャネルのディジタルオーディ
オ信号より聴感上影響力の高い信号に対しては第1の圧
縮率の第1の符号化方式で圧縮符号化がなされていると
共に、上記n−m個のチャネルのディジタルオーディオ
信号に対しては上記第1の圧縮率よりも高い第2の圧縮
率を有する第2の符号化方式で圧縮符号化がなされた信
号を受信するディジタルオーディオ信号の受信装置であ
り、上記n個のチャネルのディジタルオーディオ信号の
うち、上記m個のチャネルのディジタルオーディオ信号
に対して上記第1の符号化方式に対応する第1の伸張復
号化を施す第1の復号化手段と、上記n−m個のチャネ
ルのディジタルオーディオ信号に対して上記第2の符号
化方式に対応する第2の伸張復号化を施す第2の復号化
手段とを有することを特徴とするものである。
【0013】
【作用】本発明のディジタルオーディオ信号の伝送装置
によれば、複数チャネルの信号のうち、聴感上影響力の
高い信号からなるチャネルの信号に対しては聴感上の劣
化が少ない第1の圧縮率の第1の符号化方式によって圧
縮符号化を行い、聴感上影響力の低い信号からなるチャ
ネルの信号に対しては第1の圧縮率よりも高い第2の圧
縮率の第2の符号化方式で圧縮符号化を行う。
【0014】また、本発明のディジタルオーディオ信号
の受信装置によれば、複数チャネルの信号のうち、聴感
上影響力の高い信号からなるチャネルの信号に対して聴
感上の劣化が少ない第1の圧縮率の第1の符号化方式に
よって圧縮符号化がされた信号と、聴感上影響力の低い
信号からなるチャネルの信号に対して第1の圧縮率より
も高い第2の圧縮率の第2の符号化方式で圧縮符号化が
なされた信号を、それぞれ復号化するようにしている。
【0015】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
【0016】図1には、本発明のディジタルオーディオ
信号の伝送装置の構成を示す。本発明実施例のディジタ
ルオーディオ信号の伝送装置は、n個(nは3より大な
る正の整数であり本実施例では例えば8個)のチャネル
のディジタルオーディオ信号を圧縮符号化して伝送する
伝送装置である。
【0017】ここで、本実施例では、上記n個(8個)
のチャネルとして、例えば前述したレフトチャネル(L
ch)、レフトセンタチャネル(LCch)、センタチ
ャネル(Cch)、サブウーファチャネル(SWc
h)、ライトセンタチャネル(RCch)、ライトチャ
ネル(Rch)、サラウンドレフトチャネル(LBc
h)、サラウンドライトチャネル(RBch)を用い
る。なお、本発明では、上記例に限らず、上記n個のチ
ャネルを例えばセンタチャネルとレフトチャネルとライ
トチャネルとサラウンドレフトチャネルとサラウンドラ
イトチャネルの5チャネルとしたり、また、センタチャ
ネルとレフトチャネルとライトチャネルとレフトセンタ
チャネルとライトセンタチャネルとサラウンドレフトチ
ャネルとサラウンドライトチャネルの7チャネルとする
こともできる。
【0018】本実施例のディジタルオーディオ信号の伝
送装置は、上記8チャネルのディジタルオーディオ信号
のうち、m個(n>mで、図1の例ではm=6)のチャ
ネルのディジタルオーディオ信号であって他のn−m
(図1の例ではn−m=8−6=2)個のチャネルのデ
ィジタルオーディオ信号より聴感上影響力の高い信号に
対しては第1の圧縮率の第1の符号化方式で圧縮符号化
する第1の圧縮符号化手段としての高聴感圧縮符号化回
路217〜222と、上記n−m個のチャネルのディジ
タルオーディオ信号に対しては上記第1の圧縮率よりも
高い第2の圧縮率を有する第2の符号化方式で圧縮符号
化する第2の圧縮符号化手段である高率圧縮符号化回路
223,224とを有し、上記高聴感圧縮符号化回路2
17〜222からの圧縮符号化出力と上記高率圧縮符号
化回路223,224からの圧縮符号化出力を共に伝送
することを特徴とするものである。
【0019】なお、本実施例では、上記8チャネルのう
ち上記第1の符号化方式で圧縮する上記聴感上影響力の
高い信号からなるチャネル(6個のチャネル)を、上記
レフトチャネルとレフトセンタチャネルとセンタチャネ
ルとサブウーファチャネルとライトセンタチャネルとラ
イトチャネルとし、上記第2の符号化方式で圧縮するチ
ャネル(n−m個のチャネル)をサラウンドレフトチャ
ネルとサラウンドライトチャネルとしている。勿論、本
発明はこれらに限定されず、例えば上記n個のチャネル
を例えばセンタチャネルとレフトチャネルとライトチャ
ネルとサラウンドレフトチャネルとサラウンドライトチ
ャネルの5チャネルとしたときには、上記m個のチャネ
ルをセンタチャネルとレフトチャネルとライトチャネル
の3チャネルとし、上記n−m個のチャネルをサラウン
ドレフトチャネルとサラウンドライトチャネルとするこ
ともできる。同様に、上記n個のチャネルを例えばセン
タチャネルとレフトチャネルとライトチャネルとレフト
センタチャネルとライトセンタチャネルとサラウンドレ
フトチャネルとサラウンドライトチャネルの7チャネル
としたときには、上記m個のチャネルをセンタチャネル
とレフトチャネルとライトチャネルとし、上記n−m個
のチャネルをサラウンドレフトチャネルとサラウンドラ
イトチャネルとすることもできる。
【0020】さらに、本発明実施例の伝送装置におい
て、上記第1の符号化方式で圧縮符号化を行う高聴感圧
縮符号化回路217〜222には、前述したようなサブ
バンドコーディング等を用いたオーディオ信号の高能率
圧縮符号化方式であって人間の聴覚上の特性を利用し、
オーディオデータを約1/5に圧縮するような方式、す
なわち、入力ディジタルオーディオ信号を複数帯域に分
割し、各帯域毎のディジタルオーディオ信号を複数サン
プル毎にブロック化し、各ブロック単位で直交変換した
スペクトルデータを、人間の聴覚特性に応じて適応的に
圧縮符号化する方式(例えばいわゆるATRAC:Adap
tive TRansform Acoustic Coding方式)を用いる。
【0021】また、第2の符号化方式で圧縮符号化を行
う高率圧縮符号化回路223,224には、入力ディジ
タルオーディオ信号を複数サンプル毎に直交変換した係
数データとそれに関連するサブ情報(語長情報やスケー
ルファクタの情報)を得、各チャネルのエネルギに応じ
て各チャネルのビット配分を決定し、この各チャネルの
ビット配分によって適応的に圧縮符号化する方式を用い
る。勿論、本発明はこれら各符号化方式に限定されるも
のでないことは言うまでもない。
【0022】さらに、本実施例では、上記伝送として、
例えば映画フィルムへの記録や、光ディスク,光磁気デ
ィスク,相変化型光ディスク,磁気ディスク等のディス
ク状記録媒体、磁気テープ等のテープ状記録媒体への記
録、半導体メモリ,ICカードなどへの記録を挙げるこ
とができる。
【0023】なお、上記伝送を映画フィルムへの記録と
した場合には、例えば図2に示すようにスピーカが配置
されるディジタルサラウンドシステムに対応することに
なる。各チャネルは、センタ(C)チャネル、サブウー
ファ(SW)チャネル、レフト(L)チャネル、レフト
センタ(CL)チャネル、ライト(R)チャネル、ライ
トセンタ(CR)チャネル、レフトサラウンド(LB)
チャネル、ライトサラウンド(RB)チャネルの8つで
ある。
【0024】ここで、この図2において、上記映画フィ
ルムに記録する上記8チャネルの各チャネルは、例えば
当該映画フィルムの画像記録領域から再生された画像が
映写機(プロジェクタ100)によって投影されるスク
リーン101側に配置されたレフトスピーカ106,レ
フトセンタースピーカ104,センタースピーカ10
2,ライトセンタースピーカ105,ライトスピーカ1
07,サラウンドレフトスピーカ108及び200,サ
ラウンドライトスピーカ109及び201,サブウーフ
ァスピーカ103と対応するものである。
【0025】上記センタスピーカ102は、スクリーン
101側の中央に配置され、センタチャネルのオーディ
オデータによる再生音を出力するもので例えば俳優のせ
りふ等の最も重要な再生音を出力する。上記サブウーフ
ァスピーカ103は、サブウーファチャネルのオーディ
オデータによる再生音を出力するもので、例えば爆発音
などの低域の音というよりは振動として感じられる音を
効果的に出力するものであり、爆発シーンなどに効果的
に使用されることが多いものである。上記レフトスピー
カ106及びライトスピーカ107は、上記スクリーン
101の左右に配置され、レフトチャネルのオーディオ
データによる再生音とライトチャネルのオーディオデー
タによる再生音を出力するもので、ステレオ音響効果を
発揮する。上記レフトセンタスピーカ104とライトセ
ンタスピーカ105は、上記センタスピーカ102と上
記レフトスピーカ106及びライトスピーカ107との
間に配置され、レフトセンタチャネルのオーディオデー
タによる再生音とライトセンタチャネルのオーディオデ
ータによる再生音を出力するもので、それぞれ上記レフ
トスピーカ106及びライトスピーカ107の補助的な
役割を果たす。特にスクリーン101が大きく収容人数
の多い映画館等では、座席の位置によって音像の定位が
不安定になりやすいが、上記レフトセンタスピーカ10
4とライトセンタスピーカ107を付加することによ
り、音像のよりリアルな定位を作り出すのに効果を発揮
する。さらに、上記サラウンドレフトスピーカ108と
サラウンドライトスピーカ109は、観客席を取り囲む
ように配置され、サラウンドレフトチャネルのオーディ
オデータによる再生音とサラウンドライトチャネルのオ
ーディオデータによる再生音を出力するもので、残響音
や拍手、歓声に包まれた印象を与える効果がある。これ
により、より立体的な音像を作り出すことができる。
【0026】図1に戻って、上述したような8チャネル
のディジタルオーディオ信号を扱う図1の伝送装置は、
上記8チャネルのディジタルオーディオ信号を得るため
に、各チャネルに対応するマイクロホン201〜208
からのアナログオーディオ信号をそれぞれ対応するA/
D変換器209〜216によってディジタルオーディオ
信号に変換する。
【0027】各A/D変換器209〜216からの各チ
ャネルのディジタルオーディオ信号は、それぞれ対応す
る圧縮符号化回路217〜224に送られて各々圧縮符
号化される。なお、これら各圧縮符号化回路217〜2
24の具体的構成については後述する。
【0028】上記高聴感圧縮符号化回路217〜222
からの圧縮符号化されたオーディオデータは、それぞれ
対応する出力端子233〜238から後段の構成に送ら
れる。
【0029】一方、上記高率圧縮符号化回路223,2
24からの圧縮符号化されたオーディオデータは、それ
ぞれハイパスフィルタ225,226によって高域成分
のみが取り出された後、加算器227によって加算され
る。また、上記高率圧縮符号化回路223,224から
の圧縮符号化されたオーディオデータは、それぞれロー
パスフィルタ228,229にも送られる。上記加算器
227からのデータは、加算器230によって上記サラ
ウンドレフトチャネル側に対応するローパスフィルタ2
28の出力と加算され、出力端子231から出力され、
上記サラウンドライトチャネルに対応するローパスフィ
ルタ229の出力は出力端子232から出力される。
【0030】ここで、上記サラウンドレフトチャネルと
サラウンドライトチャネルにおいて上記ハイパスフィル
タ225,226からの出力を加算器227によって加
算し、当該加算器227の加算出力を、更に加算器22
8によってサラウンドレフトチャネルのローパスフィル
タ228出力に加算するのは以下の理由による。
【0031】すなわち、人間の耳は高域の成分に対する
定位感が少なく、このため高域成分については例えば複
数個のスピーカのうちのいずれか1つのスピーカからで
ていても人間にはどのスピーカから出てきているのか聞
き取り難いという性質がある。このため、複数チャネル
のオーディオ信号の各高域成分を、そのうちの例えば1
チャネルに対応するスピーカのみに送るようにしても、
人間には各チャネルのオーディオ信号の高域成分が当該
1つのスピーカのみから出力されているとは感じられな
い。したがって、本実施例では、上述のように、上記8
チャネルのうちの例えばサラウンドレフトチャネルとサ
ラウンドライトチャネルの音声の高域成分を加算して、
例えばサラウンドレフトチャネルの低域成分の音声に加
えるようにしている。これにより、サラウンドレフトチ
ャネルとサラウンドライトチャネルの2つのチャネルの
高域成分を1つのチャネル分に圧縮できることになる。
なお、このような高域成分におけるチャネル間のクロス
トーク処理は、図1の例のような上記サラウンドレフト
チャネルとサラウンドライトチャネル間のみならず、図
示は省略しているが他のチャネル間(例えば全チャネ
ル)についても同様に行うことができる。このように全
チャネルについて高域成分のチャネルクロストーク処理
を行うことで更に圧縮率を上げることが可能となる。
【0032】上述した図1の各出力端子233〜238
及び231,232からの各チャネルの圧縮符号化デー
タは、図3のそれぞれ対応する端子233〜238及び
231,232を介してマルチプレクサ241に送られ
てマルチプレクスされる。当該マルチプレクサ241の
出力は出力端子242を介して伝送路に伝送若しくは上
述した本発明の映画フィルムやディスク状記録媒体,テ
ープ状記録媒体などに記録される。
【0033】次に、上記図1の各高聴感圧縮符号化回路
217〜222について具体的に説明する。
【0034】先ず、図4には、上記各高聴感圧縮符号化
回路217〜222の一具体例の構成を示す。
【0035】この図4に示す圧縮符号化回路では、入力
ディジタル信号をフィルタなどにより複数の周波数帯域
に分割すると共に、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に適応的にビット配分して符号化して
いる。この時、高域では臨界帯域幅を更に分割した帯域
を用いる。もちろんフィルタなどによる非ブロッキング
の周波数分割幅は等分割幅としてもよい。さらに、本実
施例においては、直交変換の前に入力信号に応じて適応
的にブロックサイズ(ブロック長)を変化させると共
に、クリティカルバンド単位もしくは高域では臨界帯域
幅(クリティカルバンド)を更に細分化したブロックで
フローティング処理を行っている。
【0036】なお、上記帯域分割用フィルタとしては、
例えばQMF等のフィルタがあり、これは1976 R.E.Cro
chiere Digital coding of speech in subbands Bell
Syst.Tech. J. Vol.55, No.8 1976に、述べられてい
る。同じくICASSP 83, BOSTONPolyphase Quadrature f
ilters-A new subband coding technique Joseph H.Ro
thweilerには等バンド幅のフィルタ分割手法及び装置が
述べられている。
【0037】さらに、上記クリティカルバンドとは、人
間の聴覚特性を考慮して分割された周波数帯域であり、
ある純音の周波数近傍の同じ強さの狭帯域バンドノイズ
によって当該純音がマスクされるときのそのノイズの持
つ帯域のことである。このクリティカルバンドは、高域
ほど帯域幅が広くなっており、上記0〜22kHzの全
周波数帯域は例えば25のクリティカルバンドに分割さ
れている。
【0038】すなわち、図4において、入力端子10に
は例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMF等
の帯域分割フィルタ11により0〜11kHz帯域と1
1k〜22kHz帯域とに分割され、0〜11kHz帯
域の信号は同じくいわゆるQMF等の帯域分割フィルタ
12により0〜5.5kHz帯域と5.5k〜11kH
z帯域とに分割される。帯域分割フィルタ11からの1
1k〜22kHz帯域の信号は、直交変換回路の一例で
あるMDCT(Modified Discrete Cosine Transform)
回路13に送られ、帯域分割フィルタ12からの5.5
k〜11kHz帯域の信号はMDCT回路14に送ら
れ、帯域分割フィルタ12からの0〜5.5kHz帯域
の信号はMDCT回路15に送られることにより、それ
ぞれMDCT処理される。
【0039】各MDCT回路13、14、15では、各
帯域毎に設けたブロック決定回路19、20、21によ
り後述するように決定されたブロックサイズに基づいて
MDCT処理がなされる。
【0040】なお、各MDCT回路13、14、15に
おける上記MDCT処理については、ICASSP 1987 Sub
band/Transform Coding Using Filter Bank Designs B
asedon Time Domain Aliasing Cancellation J.P.Princ
en A.B.Bradley Univ. ofSurrey Royal Melbourne Ins
t.of Tech.に述べられている。
【0041】上記ブロック決定回路19、20、21で
決定されたブロックサイズを示す情報は、後述の適応ビ
ット配分符号化回路16、17、18に送られると共
に、出力端子23、25、27から出力される。
【0042】ここで、上記適応ビット配分符号化回路1
6、17、18においては、各MDCT回路13、1
4、15の出力から、上記臨界帯域(クリティカルバン
ド)または高域では更にクリティカルバンドを分割した
帯域毎のエネルギが、例えば当該バンド内での各振幅値
の2乗平均の平方根を計算すること等により求められ、
この計算結果に基づいてビット配分が行われる。もちろ
ん、上記スケールファクタそのものを以後のビット配分
の為に用いるようにしてもよい。この場合には新たなエ
ネルギ計算の演算が不要となるため、ハード規模の節約
となる。また、各バンド毎のエネルギの代わりに、振幅
値のピーク値、平均値等を用いることも可能である。な
お、各MDCT回路13、14、15にてMDCT処理
されて得られた周波数領域のスペクトルデータあるいは
MDCT係数データは、いわゆる臨界帯域(クリティカ
ルバンド)または高域では更にクリティカルバンドを分
割した帯域毎にまとめられて当該適応ビット配分符号化
回路16、17、18に送られている。
【0043】さらに、上記適応ビット配分符号化回路1
6、17、18では、上記ブロックサイズの情報、及び
臨界帯域(クリティカルバンド)または高域では更にク
リティカルバンドを分割した帯域毎に割り当てられたビ
ット数に応じて各スペクトルデータ(あるいはMDCT
係数データ)を再量子化(正規化して量子化)するよう
にしている。適応ビット配分符号化回路16、17、1
8で符号化されたデータは、出力端子22、24、26
を介して取り出される。また、当該適応ビット配分符号
化回路16、17、18では、どのような信号の大きさ
に関する正規化がなされたかを示すスケールファクタ
と、どのようなビット長で量子化がされたかを示すビッ
ト長情報も求めており、これらも同時に出力端子22、
24、26から出力される。
【0044】これら各出力端子22〜27からのデータ
はまとめられて上記各高聴感圧縮符号化回路217〜2
22の出力となる。
【0045】ところで、上記図1及び図4の例では、各
高聴感圧縮符号化回路217〜222においては各チャ
ネル毎にビット配分を行って圧縮符号化を行っている
が、これら各高聴感圧縮符号化回路217〜222間で
ビット配分を行う(すなわち各回路217〜222に対
応するチャネル間でビット配分を行う)ことも可能であ
る。
【0046】この高聴感圧縮符号化回路217〜222
間でビット配分を行う場合の各回路構成について、以下
に説明する。図5には、チャネル間でビット配分を行う
高聴感圧縮符号化回路の構成を示す。なお、この図5の
構成のうち、適応ビット配分符号化回路16,17,1
8を除く他の構成要素は図4の対応する構成要素と基本
的には同一のものである。
【0047】この図5に示される圧縮符号化回路におい
て、図4同様のブロック決定回路19、20、21によ
り決定される各MDCT回路13、14、15でのブロ
ックサイズの具体例を図6のA及びBに示す。なお、図
6のAには直交変換ブロックサイズが長い場合(ロング
モードにおける直交変換ブロックサイズ)を、図6のB
には直交変換ブロックサイズが短い場合(ショートモー
ドにおける直交変換ブロックサイズ)を示ししている。
この図6の具体例においては、3つのフィルタ出力は、
それぞれ2つの直交変換ブロックサイズを持つ。すなわ
ち、低域側の0〜5.5kHz帯域の信号及び中域の
5.5k〜11kHz帯域の信号に対しては、長いブロ
ック長の場合(図6のA)は1ブロック内のサンプル数
を128サンプルとし、短いブロックが選ばれた場合
(図6のB)には1ブロック内のサンプル数を32サン
プル毎のブロックとしている。これに対して高域側の1
1k〜22kHz帯域の信号に対しては、長いブロック
長の場合(図6のA)は1ブロック内のサンプル数を2
56サンプルとし、短いブロックが選ばれた場合(図6
のB)には1ブロック内のサンプル数を32サンプル毎
のブロックとしている。このようにして短いブロックが
選ばれた場合には各帯域の直交変換ブロックのサンプル
数を同じとして高域程時間分解能を上げ、なおかつブロ
ック化に使用するウインドウの種類を減らしている。な
お、図5の具体例のブロック決定回路19、20、21
で決定されたブロックサイズを示す情報は、後述の適応
ビット配分符号化回路16、17、18に送られると共
に、出力端子23、25、27から出力される。
【0048】この図5の具体例の適応ビット配分符号化
回路16、17、18では、上記ブロックサイズの情
報、及び臨界帯域(クリティカルバンド)または高域で
は更にクリティカルバンドを分割した帯域毎に割り当て
られたビット数に応じて各スペクトルデータ(あるいは
MDCT係数データ)を再量子化(正規化して量子化)
するようにしている。この時、適応ビット配分符号化回
路16、17、18では、各チャネル間でのチャネルビ
ット配分、すなわち各チャネルの信号全体を見ることに
より、チャネル毎の使用ビット量を適応的に最適に振り
分けるビット配分を同時に行う。この場合の当該チャネ
ルビット配分は、後述する適応ビット配分回路から端子
28を介して供給されたチャネルビット配分信号に基づ
いて行われる。このようにして符号化されたデータは、
出力端子22、24、26を介して取り出される。ま
た、当該適応ビット配分符号化回路16、17、18で
は、どのような信号の大きさに関する正規化がなされた
かを示すスケールファクタと、どのようなビット長で量
子化がされたかを示すビット長情報も求めており、これ
らも同時に出力端子22、24、26から出力される。
【0049】次に、上記ビット配分を行うための適応ビ
ット配分回路の具体的な構成及び動作を図7を用いて説
明する。なお、この図7の例では、図1に対応して前記
8チャネルのうちの6チャネルについてのビット配分に
対応している。すなわち、聴感上影響の高い信号からな
るチャネルであるレフトチャネルとレフトセンタチャネ
ルとセンタチャネルとサブウーファチャネルとライトセ
ンタチャネルとライトチャネルの6チャネルに対応して
いる。
【0050】この図7において、各チャネルの共通部に
ついて例えばレフトチャネル(Lch)を用いて説明す
る(他のチャネルについては同一の指示符号を付して説
明は省略している)と、レフトチャネルの入力情報信号
は当該レフトチャネル用の入力端子31に与えられる。
なお、この端子31は、図5の端子29と対応してい
る。この入力情報信号はマッピング回路(Mapping)32
により時間領域の信号から周波数領域に展開される。こ
こで、フィルタによる場合には、サブバンド信号として
時間領域サンプルが得られることになり、直交変換出力
の場合及びフィルタリング後に直交変換を行う場合には
周波数領域サンプルが得られることになる。
【0051】これらのサンプルは、ブロッキング(Block
ing)回路33によって複数サンプル毎にまとめられる。
ここで、フィルタによる場合には時間領域の複数サンプ
ルがまとめられることになり、直交変換出力の場合及び
フィルタリング後に直交変換を行う場合には周波数領域
の複数サンプルがまとめられることになる。
【0052】また、本具体例では、マッピングの途中の
MDCT入力時間領域信号の時間変化を時間変化算出回
路34により算出する。
【0053】上記ブロッキング回路33により複数のサ
ンプル毎にまとめられた各サンプルは正規化回路37で
正規化される。ここで、正規化のための係数であるスケ
ールファクタは、スケールファクタ算出回路35によっ
て得られる。同時にトーナリティの大きさがトーナリテ
ィ算出回路36で算出される。
【0054】以上で求められるパラメータは、ビット配
分回路38でビット配分のために使用される。ここで、
MDCT係数を表現して伝送又は記録に使えるビット数
を、全チャネル(上記6チャネル)で800Kbpsと
すると、本具体例のビット配分回路38では、チャネル
ビット配分を含む第1のビット配分(第1のビット配分
量)と、チャネルビット配分を含まない第2のビット配
分(第2のビット配分量)の2つを求める。
【0055】先ず、チャネルビット配分を含む第1のビ
ット配分の配分手法について説明する。ここではスケー
ルファクタの周波数領域の分布をみて適応的にビット配
分を行う。
【0056】この場合、全チャネルのスケールファクタ
の周波数領域の分布をみてチャネル間でのビット配分を
行うことで有効なビット配分を行うことができる。この
とき、複数チャネルの信号情報が、スピーカの場合のよ
うに同一音場のなかで混合されて左右の耳に達する場合
を考えると、全チャネル信号の加算されたものでマスキ
ングが作用すると考えてよいから、図8のA,Fに示す
ように、同一帯域において各チャネルが同一のノイスレ
ベルになるようにビット配分を行うことが有効である。
このための一方法としてはスケールファクタ指標の大き
さに比例したビット配分を行えばよい。すなわち、以下
の式によってビット配分を行う。
【0057】Bm=B*(ΣSFn)/S S=Σ(ΣSFn)
【0058】ここで、Bmは各チャネルへのビット配分
量、Bは全チャネルへのビット配分量、SFnはスケー
ルファクタ指標であり概略ピーク値の対数に対応してい
る。nは各チャネル内のブロックフローティングバンド
番号、mはチャネル番号、Sは全チャネルのスケールフ
ァクタ指標の和である。なお、図8には、レフトチャネ
ルとライトチャネルのみ示し他の4チャネルについては
図示を省略している。
【0059】以上に加えて、ビット配分回路38は、各
チャネルの信号の時間変化特性を検出して、この指標に
よってチャネル毎のビット配分量を変えるプロセスを持
つ。この時間変化を表す指標は次のようにして求められ
る。
【0060】図9のA〜Fに示すように、チャネルが6
チャネルあるとすると、それぞれのチャネルの情報入力
信号についてビット配分の時間単位であるビット配分時
間ブロックを時間的に4分割し、それぞれの時間ブロッ
ク(サブブロック)のピーク値を得る。そして各サブブ
ロックのピーク値が小から大へと変わるところの差分の
大きさに応じてチャネル間でビットを分け合う。ここ
で、このビット配分のために6チャネル合計でCビット
使えるとしたとき、各チャネルの各サブブロックのピー
ク値が小から大へと変わるところの差分の大きさがそれ
ぞれa,b,c,d,e,fデシベル(dB)とする
と、それぞれC*a/T,C*b/T,・・・・・,C
*f/Tビット(ビット)と配分することができる。こ
こで、T=a+b+c+d+e+fである。信号情報が
大きくなる程度が大であるほどそのチャネルに対しての
ビット配分量が大きくなる。なお、図9には、レフトチ
ャネルとレフトセンタチャネルとライトチャネルのみ示
し他の3つのチャネルについては図示を省略している。
【0061】次に、チャネルビット配分を含まない第2
のビット配分の配分手法について説明する。ここでは、
チャネルビット配分を含まない第2のビット配分の手法
として更に2つのビット配分からなるビット配分手法に
ついて説明する。なお,この第2のビット配分は、前記
図4における適応ビット配分符号化回路でのビット配分
処理に対応している。
【0062】この2つのビット配分をそれぞれビット配
分(1) とビット配分(2) とする。以下のビット配分では
各チャネルで使用できるビットレートは事前にそれぞれ
のチャネルで固定的に決めておく。例えば、6チャネル
の内で音声など重要部分を担う2つのチャネルには14
7kbpsという比較的大きいビットを使い、サブウー
ハチャネルには高々2kbps、それ以外のチャネルに
は100kbpsを割り当てておく。
【0063】先ず、ビット配分(1) に使うべきビット量
を確定する。そのためには、信号情報(a)のスペクト
ル情報のうちトーナリティ情報及び信号情報(b)の時
間変化情報を使用する。
【0064】ここで、トーナリティ情報について説明す
ると、指標としては、信号スペクトルの隣接値間の差の
絶対値の和を、信号スペクトル数で割った値を、指標と
して用いている。より簡単にはブロックフローティング
の為のブロックごとのスケールファクタの、隣接スケー
ルファクタ指標の間の差の平均値を用いる。スケールフ
ァクタ指標は、概略スケールファクタの対数値に対応し
ている。本実施例では、ビット配分(1) に使うべきビッ
ト量をこのトーナリティを表す値に対応させて最大80
kbps、最小10kbpsと設定している。ここでは
簡単のために、全チャネルそれぞれの割当を等しく10
0kbpsとしている。
【0065】トーナリティ計算は次式のように行う。
【0066】 T=(1/WLmax)(ΣABS(SFn−1))
【0067】なお、WLmaxはワードレングス最大値
=16、SFnはスケールファクタ指標で概略ピーク値
の対数に対応している。nはブロックフローティングバ
ンド番号である。
【0068】このようにして求められたトーナリティ情
報Tとビット配分(1)のビット配分量とは、図10に示
すように対応付けられる。
【0069】これと共に本実施例においては、ビット配
分(1) とそれに付加するその他の少なくとも1つのビッ
ト配分との分割率は、情報信号の時間変化特性に依存す
る。本具体例では、直交変換時間ブロックサイズを更に
分割した時間区間毎に信号情報のピーク値を隣接ブロッ
ク毎に比較することにより情報信号の振幅が急激に大き
くなる時間領域を検出してその大きくなるときの状態の
程度により分割率を決定する。
【0070】時間変化率計算は次式のように行う。
【0071】Vt=ΣVm Vav=(1/Vmax)*(1/Ch)Vt
【0072】ここで、Vtは各チャネルの時間サブブロ
ックのピーク値の小から大への変化をdB値で表しもの
のチャネルに関する和、Vmは各チャネルの時間サブブ
ロックのピーク値の小から大への変化をdB値で表しも
ので一番大きいものの大きさ(但し最大値を30dBに
制限しVmaxであらわす。mはチャネル番号、Chは
チャネル数、Vavは時間サブブロックのピーク値の小
から大への変化をdB値で表しもののチャネル平均であ
る。
【0073】このようにして求められた時間変化率Va
vとビット配分(1) の配分量とは、図11に示すように
対応付けられる。最終的にビット配分(1) への配分量は
次の式で求められる。
【0074】B=1/2(Bf+Bt)
【0075】ここで、Bは最終的なビット配分(1) への
配分量、BfはTvaより求められたビット配分量、B
tはVavより求められたビット配分量である。
【0076】ここでのビット配分(1) はスケ−ルファク
タに依存した周波数、時間領域上の配分がなされる。
【0077】このようにしてビット配分(1) に使用され
るビット量が決定されたならば、次にビット配分(1) で
使われなかったビットについての配分すなわちビット配
分(2) を決定する。ここでは多種のビット配分が行われ
る。
【0078】第1に全てのサンプル値に対する均一配分
が行われる。この場合のビット配分に対する量子化雑音
スペクトルの一例を図12に示す。この場合、全周波数
帯域で均一の雑音レベル低減が行える。
【0079】第2に信号情報の周波数スペクトル及びレ
ベルに対する依存性を持たせた聴覚的な効果を得るため
のビット配分が行われる。この場合のビット配分に対す
る量子化雑音スペクトルの一例を図13に示す。この例
では情報信号のスペクトルに依存させたビット配分を行
っていて、特に情報信号のスペクトルの低域側にウエイ
トをおいたビット配分を行い、広域側に比して起きる低
域側でのマスキング効果の減少を補償している。これは
隣接臨界帯域間でのマスキングを考慮して、スペクトル
の低域側を重視したマスキングカーブの非対象性に基づ
いている。このように、図13の例では低域を重視した
ビット配分が行われている。
【0080】そして最終的にビット配分(1) とビット配
分(1) に付加されるビット配分の値の和が図7のビット
配分回路38でとられる。最終的なビット配分は以上の
各ビット配分の和として与えられる。
【0081】なお、図12,図13の図中Sは信号スペ
クトルを、NL1は上記全てのサンプルに対する均一配
分による雑音レベルを、NL2は上記周波数スペクトル
及びレベルに対する依存正を持たせた聴覚的な高かを得
るためのビット配分による雑音レベルを示している。
【0082】次にチャネルビット配分を含まないビット
配分の別の手法を次に説明する。この場合の適応ビット
配分回路の動作を図14で説明するとMDCT係数の大
きさが各ブロックごとに求められ、そのMDCT係数が
入力端子801に供給される。当該入力端子801に供
給されたMDCT係数は、帯域毎のエネルギ算出回路8
03に与えられる。帯域毎のエネルギ算出回路803で
は、クリティカルバンドまたは高域においてはクリティ
カルバンドを更に再分割したそれぞれの帯域に関する信
号エネルギを算出する。帯域毎のエネルギ算出回路80
3で算出されたそれぞれの帯域に関するエネルギは、エ
ネルギ依存ビット配分回路804に供給される。
【0083】エネルギ依存ビット配分回路804では、
使用可能総ビット発生回路802からの使用可能総ビッ
ト、本実施例では128Kbpsの内のある割合(本実
施例では100Kbps)を用いて白色の量子化雑音を
作り出すようなビット配分を行う。このとき、入力信号
のトーナリティが高いほど、すなわち入力信号のスペク
トルの凸凹が大きいほど、このビット量が上記128K
bpsに占める割合が増加する。なお、入力信号のスペ
クトルの凸凹を検出するには、隣接するブロックのブロ
ックフローティング係数の差の絶対値の和を指標として
使う。そして、求められた使用可能なビット量につき、
各帯域のエネルギの対数値に比例したビット配分を行
う。
【0084】聴覚許容雑音レベルに依存したビット配分
算出回路805は、まず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。このようにして求められたエネル
ギ依存ビットと聴覚許容雑音レベルに依存したビットは
加算されて、図5(図4の場合も同様)の適応ビット配
分符号化回路16、17、18により各クリティカルバ
ンド毎もしくは高域においてはクリティカルバンドを更
に複数帯域に分割した帯域に割り当てられたビット数に
応じて各スペクトルデータ(あるいはMDCT係数デー
タ)を再量子化するようにしている。このようにして符
号化されたデータは、図5の出力端子22、24、26
を介して取り出される。
【0085】さらに詳しく上記聴覚許容雑音スペクトル
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13、1
4、15で得られたMDCT係数が上記許容雑音算出回
路に与えられる。
【0086】図15は上記許容雑音算出回路をまとめて
説明した一具体例の概略構成を示すブロック回路図であ
る。この図15において、入力端子521には、MDC
T回路13、14、15からの周波数領域のスペクトル
データが供給されている。
【0087】この周波数領域の入力データは、帯域毎の
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図16はこのような各クリティカルバン
ド毎のバークスペクトルSBを示している。ただし、こ
の図16では、図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表現
している。
【0088】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。なお、上記
マスキングとは、人間の聴覚上の特性により、ある信号
によって他の信号がマスクされて聞こえなくなる現象を
いうものであり、このマスキング効果には、時間領域の
オーディオ信号による時間軸マスキング効果と、周波数
領域の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分にノ
イズがあったとしても、このノイズは聞こえないことに
なる。このため、実際のオーディオ信号では、このマス
キングされる範囲内のノイズは許容可能なノイズとされ
る。
【0089】ここで、上記畳込みフィルタ回路523の
各乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。
【0090】次に、上記畳込みフィルタ回路523の出
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器524には、上記レベルαを求めるるための
許容関数(マスキングレベルを表現する関数)が供給さ
れる。この許容関数を増減させることで上記レベルαの
制御を行っている。当該許容関数は、次に説明するよう
な(n−ai)関数発生回路525から供給されている
ものである。
【0091】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n-ai)が
許容関数となる。例としてn=38,a=−0.5を用い
ることができる。
【0092】このようにして、上記レベルαが求めら
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。
【0093】次に、上記マスキングスレッショールド
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図17に示すように、上記バーク
スペクトルSBは、該マスキングスレッショールドMS
のレベルで示すレベル以下がマスキングされることにな
る。なお、遅延回路529は上記合成回路527以前の
各回路での遅延量を考慮してエネルギ検出回路522か
らのバークスペクトルSBを遅延させるために設けられ
ている。
【0094】当該減算器528からの出力は、許容雑音
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。
【0095】このようにしてエネルギ依存ビットと聴覚
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報が図5の端子28を介して上記適応ビット
配分符号化回路16、17、18に送られることで、こ
こでMDCT回路13、14、15からの周波数領域の
各スペクトルデータがそれぞれのバンド毎に割り当てら
れたビット数で量子化されるわけである。
【0096】すなわち要約すれば、適応ビット配分符号
化回路16、17、18では、上記クリティカルバンド
の各バンド帯域(クリティカルバンド)毎もしくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域のエネルギもしくはピーク値と上記ノイズレベル
設定手段の出力との差分のレベルに応じて配分されたビ
ット数で上記各バンド毎のスペクトルデータを量子化す
ることになる。
【0097】ところで、上述した合成回路527での合
成の際には、最小可聴カーブ発生回路532から供給さ
れる図17に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
レッショールドMSとを合成することができる。この最
小可聴カーブにおいて、雑音絶対レベルがこの最小可聴
カーブ以下ならば該雑音は聞こえないことになる。この
最小可聴カーブは、コーディングが同じであっても例え
ば再生時の再生ボリュームの違いで異なるものとなが、
現実的なディジタルシステムでは、例えば16ビットダ
イナミックレンジへの音楽のはいり方にはさほど違いが
ないので、例えば4kHz付近の最も耳に聞こえやすい
周波数帯域の量子化雑音が聞こえないとすれば、他の周
波数帯域ではこの最小可聴カーブのレベル以下の量子化
雑音は聞こえないと考えられる。したがって、このよう
に例えばシステムの持つダイナミックレンジの4kHz
付近の雑音が聞こえない使い方をすると仮定し、この最
小可聴カーブRCとマスキングスレッショールドMSと
を共に合成することで許容ノイズレベルを得るようにす
ると、この場合の許容ノイズレベルは、図17中の斜線
で示す部分までとすることができるようになる。なお、
本実施例では、上記最小可聴カーブの4kHzのレベル
を、例えば20ビット相当の最低レベルに合わせてい
る。また、この図17は、信号スペクトルSSも同時に
示している。
【0098】また、上記許容雑音補正回路530では、
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図17に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大き
さに聞こえ、逆に、50Hz付近では1kHzでの音圧
よりも約15dB高くないと同じ大きさに聞こえない。
このため、上記最小可聴カーブのレベルを越えた雑音
(許容ノイズレベル)は、該等ラウドネス曲線に応じた
カーブで与えられる周波数特性を持つようにするのが良
いことがわかる。このようなことから、上記等ラウドネ
ス曲線を考慮して上記許容ノイズレベルを補正すること
は、人間の聴覚特性に適合していることがわかる。
【0099】以上述べた聴覚許容雑音レベルに依存した
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。
【0100】次に2つのビット配分手法の間でのビット
量分割手法について説明する。図14に戻って、MDC
T回路出力が供給される入力端子801からの信号は、
スペクトルの滑らかさ算出回路808にも与えられ、こ
こでスペクトルの滑らかさが算出される。本実施例で
は、信号スペクトルの絶対値の隣接値間の差の絶対値の
和を、信号スペクトルの絶対値の和で割った値を、上記
スペクトルの滑らかさとして算出している。
【0101】上記スペクトルの滑らかさ算出回路808
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールするマルチプ
ライヤ811及び812に対してコントロール出力を送
る。ここで、仮にスペクトルが滑らかであり、エネルギ
依存のビット配分に重きをおくように、マルチプライヤ
811へのビット分割率決定回路809の出力が0.8
の値を取ったとき、マルチプライヤ812へのビット分
割率決定回路809の出力は1−0.8=0.2とす
る。これら2つのマルチプライヤの出力はアダー806
で足し合わされて最終的なビット配分情報となって、出
力端子807から出力される。
【0102】このときのビット配分の様子を図18、図
19に示す。また、これに対応する量子化雑音の様子を
図20、図21に示す。図18は信号のスペクトルが割
合平坦である場合を示しており、図19は信号スペクト
ルが高いトーナリティを示す場合を示している。また、
図18及び図19の図中QSは信号レベル依存分のビッ
ト量を示し、図中QNは聴覚許容雑音レベル依存のビッ
ト割当分のビット量を示している。図20及び図21の
図中Lは信号レベルを示し、図中NSは信号レベル依存
分による雑音低下分を、図中NNは聴覚許容雑音レベル
依存のビット割当分による雑音低下分を示している。
【0103】先ず、信号のスペクトルが、割合平坦であ
る場合を示す図18において、聴覚許容雑音レベルに依
存したビット配分は、全帯域に渡り大きい信号雑音比を
取るために役立つ。しかし低域及び高域では比較的少な
いビット配分が使用されている。これは聴覚的にこの帯
域の雑音に対する感度が小さいためである。信号エネル
ギレベルに依存したビット配分の分は量としては少ない
が、ホワイトな雑音スペクトルを生じるように、この場
合には中低域の信号レベルの高い周波数領域に重点的に
配分されている。
【0104】これに対して、図19に示すように、信号
スペクトルが高いトーナリティを示す場合には、信号エ
ネルギレベルに依存したビット配分量が多くなり、量子
化雑音の低下は極めて狭い帯域の雑音を低減するために
使用される。聴覚許容雑音レベルに依存したビット配分
分の集中はこれよりもきつくない。
【0105】図14に示すように、この両者のビット配
分の和により、孤立スペクトル入力信号での特性の向上
が達成される。
【0106】以上の様にして得られたチャネルビット配
分を含むビット配分とチャネルビット配分を含まないビ
ット配分の2つを用いて、次のようにして第1と第2の
量子化を行う。
【0107】図22を用いて説明する。この例では、全
6チャネルのうちでチャネルビット配分を含むビット配
分により147kbpsを越えるビット配分がなされる
チャネルはセンタチャネルとサブウーファチャネルとラ
イトチャネルである。
【0108】まず、チャネルビット配分を含むビット配
分量が147kbpsを越えるチャネルについて、ある
一定のビット量例えば128kbpsを最大とする部分
と128kbpsを越える部分に2分する。
【0109】この処理を行う構成を図23に示す。図2
3の構成では、チャネルビット配分を含むビット配分で
の配分量が147kbpsを越えるビット配分の各サン
プルについて、複数サンプルごとのブロックについての
正規化処理すなわちブロックフローティングを行う。こ
の時どの程度のブロックフローティングが行われたかを
示す係数としてスケールファクタが得られる。
【0110】この図23において、入力端子900に供
給されたMDCT係数(MDCTサンプル)は正規化回
路905によって複数サンプル毎に、ブロックについて
の正規化処理すなわちブロックフローティングが施され
る。この時どの程度のブロックフローティングが行われ
たかを示す係数としてスケールファクタが得られる。
【0111】次段の第1の量子化器(quantizer) 901
は、前記チャネルビット配分を含まないビット配分の各
サンプル語長で量子化を行なう。この時、量子化雑音を
少なくするためには四捨五入による量子化が行われる。
【0112】次に、上記正規化回路905の出力と上記
量子化器901の出力が差分器902に送られる。すな
わち、当該差分器902では、量子化器901の入力と
出力の差(量子化誤差)が取られる。この差分器902
からの出力は、さらに正規化回路906を介して第2の
量子化器903に送られる。
【0113】当該第2の量子化器903では、前記チャ
ネルビット配分を含むビット配分の各サンプル語長と前
記チャネルビット配分を含まないビット配分の各サンプ
ル語長の差の語長が各サンプル毎に使用される。この時
のフローティング係数は第1の量子化器901で用いら
れたフローティング係数と語長から自動的に決定され
る。すなわち第1の量子化器901で用いられた語長が
Nビットであったときには、(2**N)で第2の量子
化器903で用いられるフローティング係数が得られ
る。
【0114】また、上記第2の量子化器903では、第
1の量子化器901と同じように四捨五入処理を含むビ
ット配分を行う。このようにして2つの量子化により、
前記チャネルビット半分を含むビット配分で147kb
psを越えるビット配分を受けたチャネルのビットは、
128kbps以下になるべく128kbpsに近いビ
ット配分と残りのビット配分とに分けられる。
【0115】ここで、128kbpsと147kbps
という2つのスレッショールドを設けているのは、以下
のような理由による。すなわち、前記残りのビット配分
データも語長を表すサブ情報が必要であるので、このサ
ブ情報量も含めてデータ領域がとれるようなビット配分
がされる最下限量として147kbpsが設定されてい
る。また、前記チャネルビット配分を含むビット配分量
が128kbpsを上回り147kbpsを下回る場合
には、128kbpsを越えたデータ部分にはサブ情報
しか書き込めないのでサンプル情報を書き込む余地がな
く意味がなくなってしまう。このため、このような場合
にはこのチャネルは前記チャネルビット配分を含まない
ビット配分で128kbpsよりも小さく、できるだけ
128kbps近いビット配分を行うために、上記12
8kbpsが設定されている。
【0116】また、前記チャネルビット配分を含むビッ
ト配分で128kbpsよりも小さいビット配分となっ
たチャネルは、そのままそのビット配分を使用する。
【0117】前に述べたように、前記残りのビット配分
の成分の大きさは図23で示されるようにビット配分
(1) のスケールファクタとワードレングスからスケール
ファクタを算出できるのでワードレングスのみがデコ−
ダに必要とされる。
【0118】このようにして量子化器901及び903
では、それぞれ四捨五入された効率の高い量子化出力が
得られる。
【0119】なお、図23の構成(エンコーダ)に対応
する構成(デコーダ)では、上記正規化回路905,9
06に対応する逆正規化処理を行う逆正規化回路90
8,907が設けられ、これら逆正規化回路908,9
07の出力が加算器904で加算される。その加算出力
が出力端子910から取りだされることになる。
【0120】次に、図1に示したサラウンドレフトチャ
ネルとサラウンドライトチャネルとの間でビット配分を
行う高率圧縮符号化回路223,224の具体的構成を
図24に示す。
【0121】この図24において、入力端子301には
サラウンドレフトチャネルのディジタルオーディオ信号
が、入力端子311にはサラウンドライトチャネルのデ
ィジタルオーディオ信号が供給される。
【0122】上記入力端子301と311からのディジ
タルオーディオ信号は、それぞれ対応するバッファ30
2,312に一旦記憶される。このバッファ302,3
12からは、各々50%オーバーラップしたNポイント
(Nサンプル)毎のブロックでデータが取り出される。
このブロック単位のデータは、直交変換回路303,3
13に送られ、当該直交変換回路303,313によっ
てそれぞれMDCT及びMDST(Modified Discrete S
ine transform)の直交変換が施される。
【0123】上記直交変換回路303からの係数データ
は、それぞれ対応するサブバンド・ブロックフローティ
ングポイント圧縮回路304,314によって圧縮され
る。上記サブバンド・ブロックフローティングポイント
圧縮回路304,314からの係数データと語長情報や
スケールファクタ等のサブ情報は、対応する適応量子化
回路305,315に送られる。また、サブバンド・ブ
ロックフローティングポイント圧縮回路304,314
からは、スペクトル情報がlogスペクトラルエンベロ
ープ検出回路308に送られる。
【0124】上記適応量子化回路305は、logスペ
クトラルエンベロープ検出回路308によって検出され
たエンベロープ情報に基づいてチャネル間ビット配分量
を決定する分配決定回路309からのビット配分情報に
基づいて、上記係数データとサブ情報を適応的に量子化
する。この適応量子化回路305,315からは、量子
化された係数データとサブ情報及びビット配分情報とが
出力される。この適応量子化回路305,315の各出
力は、上記マルチプレクス・エラーコレクション回路3
06,316に送られる。
【0125】これらマルチプレクス・エラーコレクショ
ン回路306,316では、各チャネル毎に量子化され
た係数データとサブ情報及びビット配分情報をマルチプ
レクスすると共に、エラー訂正符号を付加する。これら
マルチプレクス・エラーコレクション回路306,31
6からの出力端子307,317を介した出力が、前記
図1のサラウンドレフトチャネル用とサラウンドライト
チャネル用の高率圧縮符号化回路223,224の出力
となる。
【0126】次に、図25には、前記図1の各高聴感圧
縮符号化回路217〜222に対応する高聴感伸張復号
化回路の構成を示す。すなわち、この図25の高聴感伸
張復号化回路は、本発明の伝送装置に対応する受信装置
に適用されるものであり、前記n個の複数チャネルのデ
ィジタルオーディオ信号のうち、上記m個のチャネルの
ディジタルオーディオ信号に対して上記第1の符号化方
式で圧縮符号化がなされた信号を復号化する回路(1チ
ャネル分)の構成である。
【0127】この図25において、各帯域の量子化され
たMDCT係数は復号化装置入力端子122、124、
126に与えられ、また使用されたブロックサイズ情報
及び適応ビット配分情報は入力端子123、125、1
27に与えられる。復号化回路116、117、118
では、適応ビット配分情報を用いてビット割当を解除
し、ブロックサイズ情報を用いて伸張復号化を行う。
【0128】次に、IMDCT回路113、114、1
15では、周波数領域の信号が時間領域の信号に変換さ
れる。これらの部分帯域の時間領域信号は、IQMF回
路112、111により、全体域信号に復号化される。
【0129】ここで、高聴感伸張復号化回路では、前記
チャネルビット配分を含む128kbps以下のビット
配分(1) が行われるチャネルと、前記チャネルビット配
分を含む147kbps以上のビット配分(2) が行われ
るチャネルにおけるある一定のビット量例えば128k
bpsを最大とする部分と128kbpsを越える部分
のそれぞれが、上記復号化回路116,117,118
で復号化される。但し、ビット配分(2) の2つ部分はそ
れそれが復号化された後、それぞれのサンプルが加算さ
れて精度の高いサンプルとなる。
【0130】また、得られた各チャネルのデータの並べ
方については、シンクブロック中に、先ず、(1)前記
チャネルビット配分を含む128kbps以下のビット
配分が行われるチャネル、(2)前記チャネルビット配
分を含む147kbps以上のビット配分が行われるチ
ャネルにおけるある一定のビット量例えば128kbp
sを最大とする部分を、チャネル順に並べ、次に前記チ
ャネルビット配分を含む147kbps以上のビット配
分が行われるチャネルにおける128kbpsを越える
部分をチャネル順に並べる。
【0131】次に、図1の高率圧縮符号化回路223,
224に対応する高率伸張復号化回路の構成を図26
(1チャネル分)に示す。すなわち、この図26の高率
伸張復号化回路は、本発明の伝送装置に対応する受信装
置に適用されるものであり、前記n−m個のチャネルの
ディジタルオーディオ信号に対して上記第2の符号化方
式で圧縮符号化がされた信号を復号化する回路(1チャ
ネル分)の構成である。
【0132】この図26において、入力端子410に
は、前記高率圧縮符号化が施されたディジタルオーディ
オ信号が供給される。この信号は、デマルチプレクス・
エラーコレクション回路411によってデマルチプレク
スとエラー訂正が行われる。
【0133】当該デマルチプレクス・エラーコレクショ
ン回路411からは、適応量子化された係数データとサ
ブ情報及びビット配分情報とが出力される。係数データ
及びサブ情報は、適応逆量子化回路412に送られる。
また、ビット配分情報は量子化ステップサイズコントロ
ール回路413に送られる。上記適応逆量子化回路41
2は、上記量子化ステップサイズコントロール回路41
3からの量子化ステップサイズ情報に基づいて、上記量
子化変換係数情報に対して逆量子化を施す。この適応逆
量子化回路412からの量子化圧縮変換係数はサブバン
ド・ブロックフローティングポイント伸張回路414に
送られる。
【0134】上記サブバンド・ブロックフローティング
ポイント伸張回路414では、前記図24のサブバンド
・ブロックフローティングポイント圧縮回路304,3
14の逆処理を行う。この伸張回路414の出力は、同
じく図24の直交変換回路303,313の逆変換処理
を行う逆直交変換回路415によってNポイントのサン
プルデータに変換され、ウインドウ・オーバーラップ加
算回路416に送られる。当該ウインドウ・オーバーラ
ップ加算回路416では、前記オーバーラップが解除さ
れて、PCMオーディオ信号として出力される。このP
CMオーディオ信号が出力端子416から取り出され
る。
【0135】
【発明の効果】以上の説明からも明らかなように、本発
明のディジタルオーディオ信号の伝送装置においては、
複数チャネルの信号のうち、聴感上影響力の高い信号か
らなるチャネルの信号に対しては聴感上の劣化が少ない
第1の圧縮率の第1の符号化方式によって圧縮符号化を
行い、聴感上影響力の低い信号からなるチャネルの信号
に対しては第1の圧縮率よりも高い第2の圧縮率の第2
の符号化方式で圧縮符号化を行うようにしているため、
特に重要な音に対しては高音質の圧縮符号化が可能であ
ると共に、ビット配分量(バイト配分量)の無駄を無く
すことが可能となる。
【0136】また、本発明のディジタルオーディオ信号
の受信装置においては、複数チャネルの信号のうち、聴
感上影響力の高い信号からなるチャネルの信号に対して
聴感上の劣化が少ない第1の圧縮率の第1の符号化方式
によって圧縮符号化がされた信号と、聴感上影響力の低
い信号からなるチャネルの信号に対して第1の圧縮率よ
りも高い第2の圧縮率の第2の符号化方式で圧縮符号化
がなされた信号を、それぞれ復号化可能となる。
【図面の簡単な説明】
【図1】本発明実施例のディジタルオーディオ信号の伝
送装置の主要部の概略構成を示すブロック回路図であ
る。
【図2】8チャネルディジタルサラウンドシステムにお
けるスピーカの配置を説明するための図である。
【図3】各チャネルの圧縮されたオーディオ信号をマル
チプレクスする構成を示すブロック回路図である。
【図4】高聴感圧縮符号化回路の一具体例(チャネル間
ビット配分を行わない例)の概略構成を示すブロック回
路図である。
【図5】高聴感圧縮符号化回路の一具体例(チャネル間
ビット配分を行う例)の概略構成を示すブロック回路図
である。
【図6】高聴感圧縮符号化回路での信号の周波数及び時
間分割を示す図である。
【図7】高聴感圧縮符号化回路のマルチチャネルでのビ
ット配分用パラメータを求める構成の一例を示すブロッ
ク回路図である。
【図8】高聴感圧縮符号化回路におけるチャネル間でス
ペクトルの大きさからビット配分を行う概念を示す図で
ある。
【図9】高聴感圧縮符号化回路におけるチャネル間での
情報信号の時間特性を考慮したビット配分の為のパラメ
ータの求め方を示す図である。
【図10】ビット配分(1) のビット配分量とトーナリテ
ィとの間の関係を示す図である。
【図11】ビット配分(1) のビット配分量と時間変化率
との間の関係を示す図である。
【図12】均一配分の時のノイズスペクトルを示す図で
ある。
【図13】情報信号の周波数スペクトル及びレベルに対
する依存性を持たした聴覚的な効果を得るためのビット
配分によるノイズスペクトルの例を示す図である。
【図14】情報信号の大きさ及び聴覚許容雑音スペクト
ルの二者を用いたビット配分手法を実現する構成を示す
ブロック回路図である。
【図15】許容雑音レベルを求める構成を示すブロック
回路図である。
【図16】各帯域の信号レベルによるマスキングスレシ
ョールドの例を示す図である。
【図17】情報スペクトル、マスキングスレショール
ド、最小可聴限を示す図である。
【図18】トーナリティが低い情報信号に対する信号レ
ベル依存および聴覚許容雑音レベル依存のビット配分を
示す図である。
【図19】トーナリティが高い情報信号に対する信号レ
ベル依存および聴覚許容雑音レベル依存のビット配分を
示す図である。
【図20】トーナリティが低い情報信号に対する量子化
雑音レベルを示す図である。
【図21】トーナリティが高い情報信号に対する量子化
雑音レベルを示す図である。
【図22】高聴感圧縮符号化回路でのマルチチャネルに
おけるビット配分の関係を示す図である。
【図23】ビット配分の分割を行う具体的構成を示すブ
ロック回路図である。
【図24】高率圧縮符号化回路の具体的構成例を示すブ
ロック回路図である。
【図25】本発明実施例の受信装置の高聴感伸張復号化
回路の構成例を示すブロック回路図である。
【図26】本発明実施例の受信装置の高率伸張復号化回
路の構成例を示すブロック回路図である。
【符号の説明】
209〜216・・・A/D変換器 217〜222・・・高聴感圧縮符号化回路 223,224・・・高率圧縮符号化回路 225,226・・・ハイパスフィルタ 228,229・・・ローパスフィルタ 227,230・・・加算器 241・・・マルチプレクサ 302,313・・・バッファ 303,313・・・直交変換回路 304,314・・・サブバンドブロックフローティン
グポイント圧縮回路 305,315・・・適応量子化回路 306,316・・・マルチプレクス・エラーコレクシ
ョン回路 308・・・logスペクトラルエンベロープ検出回路 309・・・分配決定回路 11,12・・・帯域分割フィルタ 13,14,15・・・MDCT回路 16,17,18・・・適応ビット配分符号化回路 19,20,21・・・ブロックサイズ決定回路 31・・・各チャネル情報信号入力端子 32・・・マッピング回路 33・・・ブロッキング回路 34・・・時間変化算出回路 35・・・スケ−ルファクタ算出回路 36・・・トーナリティ算出回路 37・・・正規化回路 38・・・ビット配分回路 116,117,118・・・適応ビット配分復号化回
路 113,114,115・・・IMDCT回路 112,111・・・IQMF回路 411・・・デマルチプレクス・エラーコレクション回
路 412・・・適応逆量子化回路 413・・・量子化ステップサイズコントロール回路 414・・・サブバンドブロックフローティングポイン
ト伸張回路 415・・・逆直交変換回路 416・・・ウインドウ・オーバーラップ加算回路 520・・・許容雑音算出回路 521・・・許容雑音算出回路入力端子 522・・・帯域毎のエネルギ検出回路 523・・・畳込みフィルタ回路 524・・・引算器 525・・・n−ai関数発生回路 526・・・割算器 527・・・合成回路 528・・・減算器 530・・・許容雑音補正回路 532・・・最小可聴カーブ発生回路 533・・・補正情報出力回路 802・・・使用可能総ビット発生回路 803・・・帯域毎のエネルギ算出回路 804・・・エネルギ依存のビット配分回路 805・・・聴覚許容雑音レベル依存のビット配分回路 806・・・アダー 808・・・スペクトルの滑らかさ算出回路 809・・・ビット分割率決定回路 811、812・・・マルチプライヤ 905,906・・・正規化回路 901・・・第1の量子化器 903・・・第2の量子化器 907,909・・・逆正規化回路 904・・・加算器
【手続補正書】
【提出日】平成6年4月8日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 ディジタルオーディオ信号の伝送装置
及び受信装置、並びにディジタルオーディオ信号の伝送
方法及び受信方法
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、映画フィルム
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タルオーディオ信号を圧縮符号化して伝送するディジタ
ルオーディオ信号の伝送装置及びそれに対応する受信装
置、並びにディジタルオーディオ信号の伝送方法及びそ
れに対応する受信方法に関するものである。
【0002】
【従来の技術】通常のオーディオ機器の場合のみなら
ず、例えば映画フィルム映写システム、高品位テレビジ
ョン、ビデオテープレコーダ、ビデオディスクプレーヤ
等のステレオないしはマルチサラウンド音響システムに
おいては、例えば4〜8チャネル等の複数チャネルのオ
ーディオ或いは音声信号を扱うようになりつつある。
【0003】特に、業務用においては、ディジタルオー
ディオのマルチチャネル化が進んでおり、例えば8チャ
ネルのディジタルオーディオ信号を扱う機器が浸透して
きている。上記8チャネルのディジタルオーディオ信号
を扱う機器としては、例えば映画フィルム映写システム
等がある。また、高品位テレビジョン、ビデオテープレ
コーダ、ビデオディスクプレーヤ等のステレオないしは
マルチサラウンド音響システムにおいても、例えば4〜
8チャネル等の複数チャネルのオーディオ或いは音声信
号を扱うようになりつつある。
【0004】上記8チャネルのディジタルオーディオ信
号を扱う映画フィルム映写システムにおいては、上記映
画フィルムに対して、例えばレフトチャネル,レフトセ
ンタチャネル,センタチャネル,ライトセンタチャネ
ル,ライトチャネル,サラウンドレフトチャネル,サラ
ウンドライトチャネル,サブウーファチャネルの8チャ
ネルのディジタルオーディオ信号を記録することが行わ
れつつある。なお、上記映画フィルムに記録する上記8
チャネルの各チャネルは、例えば当該映画フィルムの画
像記録領域から再生された画像が映写機によって投影さ
れるスクリーン側に配置されるレフトスピーカ、レフト
センタスピーカ、センタスピーカ、ライトセンタスピー
カ、ライトスピーカ、サブウーファスピーカ、観客席を
取り囲むように左側に配置されるサラウンドレフトスピ
ーカ及び右側に配置されるサラウンドライトスピーカと
対応するものである。
【0005】
【発明が解決しようとする課題】ところが、映画フィル
ムに上記8チャネルのディジタルオーディオ信号を記録
する場合において、映画フィルムには、例えばいわゆる
CD(コンパクトディスク)などで用いているようなサ
ンプリング周波数44.1kHzで16ビットの直線量
子化されたオーディオデータを上記8チャネル分も記録
できる領域を確保することは困難であるため、上記8チ
ャネルのオーディオデータを圧縮して記録する必要があ
る。
【0006】また、フィルムという媒体は、表面に傷な
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。
【0007】しかし、圧縮符号化を行うと楽器や人間の
声などが原音から変化するため、特に上記映画フィルム
のように原音の忠実な再現が必要とされるメディアの記
録フォーマットとして採用する場合において人間の声な
ど重要な音に対しては何らかの高音質化の手段が必要と
なってくる。
【0008】そこで、本発明は、上述したようなことに
鑑み、特に重要な音に対しては高音質の圧縮符号化が可
能であると共に、さらに高圧縮率の圧縮符号化をも可能
とする高能率符号化を用いたディジタルオーディオ信号
の伝送装置及びこれに対応する受信装置を提供すること
を目的としている。
【0009】
【課題を解決するための手段】本発明は、上述の目的を
達成するために提案されたものであり、本発明のディジ
タルオーディオ信号の伝送装置は、複数チャネル(nチ
ャネル、nは3より大なる正の整数)のディジタルオー
ディオ信号を圧縮符号化して伝送する伝送装置であり、
上記n個のチャネルのディジタルオーディオ信号のう
ち、m個(n>m)のチャネルのディジタルオーディオ
信号であって他のn−m個のチャネルのディジタルオー
ディオ信号より聴感上影響力の高い信号に対しては第1
の圧縮率の第1の符号化方式で圧縮符号化する第1の圧
縮符号化手段と、上記n−m個のチャネルのディジタル
オーディオ信号に対しては上記第1の圧縮率よりも高い
第2の圧縮率を有する第2の符号化方式で圧縮符号化す
る第2の圧縮符号化手段とを有し、上記第1の圧縮符号
化手段からの圧縮符号化出力と上記第2の圧縮符号化手
段からの圧縮符号化出力を共に伝送することを特徴とす
るものである。
【0010】ここで、本発明の伝送装置において、上記
n個のチャネルはセンタチャネルとレフトチャネルとラ
イトチャネルとサラウンドレフトチャネルとサラウンド
ライトチャネルであり、上記n−m個のチャネルはサラ
ウンドレフトチャネルとサラウンドライトチャネルであ
る。或いは、上記n個のチャネルはセンタチャネルとレ
フトチャネルとライトチャネルとレフトセンタチャネル
とライトセンタチャネルとサラウンドレフトチャネルと
サラウンドライトチャネルであり、上記n−m個のチャ
ネルはサラウンドレフトチャネルとサラウンドライトチ
ャネルである。
【0011】さらに、本発明の伝送装置において、上記
第1の符号化方式は、入力ディジタルオーディオ信号を
複数帯域に分割し、各帯域毎のディジタルオーディオ信
号を複数サンプル毎にブロック化し、各ブロック単位で
直交変換したスペクトル成分を、聴覚特性に応じて適応
的に圧縮符号化する方式であり、上記第2の符号化方式
は、入力ディジタルオーディオ信号を複数サンプル毎に
直交変換した係数情報とそれに関連するサブ情報を得、
各チャネルのエネルギに応じて各チャネルのビット配分
量を決定し、このビット配分量で適応的に圧縮符号化す
る方式である。なお、上記伝送は、記録媒体への記録を
含む。
【0012】また、本発明のディジタルオーディオ信号
の受信装置は、複数チャネル(nチャネル、nは3より
大なる正の整数)のディジタルオーディオ信号のうち、
m個(n>m)のチャネルのディジタルオーディオ信号
であって他のn−m個のチャネルのディジタルオーディ
オ信号より聴感上影響力の高い信号に対しては第1の圧
縮率の第1の符号化方式で圧縮符号化がなされていると
共に、上記n−m個のチャネルのディジタルオーディオ
信号に対しては上記第1の圧縮率よりも高い第2の圧縮
率を有する第2の符号化方式で圧縮符号化がなされた信
号を受信するディジタルオーディオ信号の受信装置であ
り、上記n個のチャネルのディジタルオーディオ信号の
うち、上記m個のチャネルのディジタルオーディオ信号
に対して上記第1の符号化方式に対応する第1の伸張復
号化を施す第1の復号化手段と、上記n−m個のチャネ
ルのディジタルオーディオ信号に対して上記第2の符号
化方式に対応する第2の伸張復号化を施す第2の復号化
手段とを有することを特徴とするものである。
【0013】次に、本発明のディジタルオーディオ信号
の伝送方法は、複数チャネル(nチャネル、nは3より
大なる正の整数)のディジタルオーディオ信号を圧縮符
号化して伝送するディジタルオーディオ信号の伝送方法
であり、上記n個のチャネルのディジタルオーディオ信
号のうち、m個(n>m)のチャネルのディジタルオー
ディオ信号であって他のn−m個のチャネルのディジタ
ルオーディオ信号より聴感上影響力の高い信号に対して
は第1の圧縮率の第1の符号化方式で圧縮符号化する第
1の圧縮符号化工程と、上記n−m個のチャネルのディ
ジタルオーディオ信号に対しては上記第1の圧縮率より
も高い第2の圧縮率を有する第2の符号化方式で圧縮符
号化する第2の圧縮符号化工程とを有し、上記第1の圧
縮符号化工程からの圧縮符号化出力と上記第2の圧縮符
号化工程からの圧縮符号化出力を共に伝送することを特
徴とするものである。
【0014】また、本発明のディジタルオーディオ信号
の受信方法は、複数チャネル(nチャネル、nは3より
大なる正の整数)のディジタルオーディオ信号のうち、
m個(n>m)のチャネルのディジタルオーディオ信号
であって他のn−m個のチャネルのディジタルオーディ
オ信号より聴感上影響力の高い信号に対しては第1の圧
縮率の第1の符号化方式で圧縮符号化がなされていると
共に、上記n−m個のチャネルのディジタルオーディオ
信号に対しては上記第1の圧縮率よりも高い第2の圧縮
率を有する第2の符号化方式で圧縮符号化がなされた信
号を受信するディジタルオーディオ信号の受信方法であ
り、上記n個のチャネルのディジタルオーディオ信号の
うち、上記m個のチャネルのディジタルオーディオ信号
に対して上記第1の符号化方式に対応する第1の伸張復
号化を施す第1の復号化工程と、上記n−m個のチャネ
ルのディジタルオーディオ信号に対して上記第2の符号
化方式に対応する第2の伸張復号化を施す第2の復号化
工程とを有することを特徴とするものである。
【0015】
【作用】本発明のディジタルオーディオ信号の伝送装置
及び方法によれば、複数チャネルの信号のうち、聴感上
影響力の高い信号からなるチャネルの信号に対しては聴
感上の劣化が少ない第1の圧縮率の第1の符号化方式に
よって圧縮符号化を行い、聴感上影響力の低い信号から
なるチャネルの信号に対しては第1の圧縮率よりも高い
第2の圧縮率の第2の符号化方式で圧縮符号化を行う。
【0016】また、本発明のディジタルオーディオ信号
の受信装置及び方法によれば、複数チャネルの信号のう
ち、聴感上影響力の高い信号からなるチャネルの信号に
対して聴感上の劣化が少ない第1の圧縮率の第1の符号
化方式によって圧縮符号化がされた信号と、聴感上影響
力の低い信号からなるチャネルの信号に対して第1の圧
縮率よりも高い第2の圧縮率の第2の符号化方式で圧縮
符号化がなされた信号を、それぞれ復号化するようにし
ている。
【0017】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
【0018】図1には、本発明のディジタルオーディオ
信号の伝送方法を実現する本発明のディジタルオーディ
オ信号の伝送装置の構成を示す。本発明実施例のディジ
タルオーディオ信号の伝送装置は、n個(nは3より大
なる正の整数であり本実施例では例えば8個)のチャネ
ルのディジタルオーディオ信号を圧縮符号化して伝送す
る伝送装置である。
【0019】ここで、本実施例では、上記n個(8個)
のチャネルとして、例えば前述したレフトチャネル(L
ch)、レフトセンタチャネル(LCch)、センタチ
ャネル(Cch)、サブウーファチャネル(SWc
h)、ライトセンタチャネル(RCch)、ライトチャ
ネル(Rch)、サラウンドレフトチャネル(LBc
h)、サラウンドライトチャネル(RBch)を用い
る。なお、本発明では、上記例に限らず、上記n個のチ
ャネルを例えばセンタチャネルとレフトチャネルとライ
トチャネルとサラウンドレフトチャネルとサラウンドラ
イトチャネルの5チャネルとしたり、また、センタチャ
ネルとレフトチャネルとライトチャネルとレフトセンタ
チャネルとライトセンタチャネルとサラウンドレフトチ
ャネルとサラウンドライトチャネルの7チャネルとする
こともできる。
【0020】本実施例のディジタルオーディオ信号の伝
送装置は、上記8チャネルのディジタルオーディオ信号
のうち、m個(n>mで、図1の例ではm=6)のチャ
ネルのディジタルオーディオ信号であって他のn−m
(図1の例ではn−m=8−6=2)個のチャネルのデ
ィジタルオーディオ信号より聴感上影響力の高い信号に
対しては第1の圧縮率の第1の符号化方式で圧縮符号化
する第1の圧縮符号化手段としての高聴感圧縮符号化回
路217〜222と、上記n−m個のチャネルのディジ
タルオーディオ信号に対しては上記第1の圧縮率よりも
高い第2の圧縮率を有する第2の符号化方式で圧縮符号
化する第2の圧縮符号化手段である高率圧縮符号化回路
223,224とを有し、上記高聴感圧縮符号化回路2
17〜222からの圧縮符号化出力と上記高率圧縮符号
化回路223,224からの圧縮符号化出力を共に伝送
することを特徴とするものである。
【0021】なお、本実施例では、上記8チャネルのう
ち上記第1の符号化方式で圧縮する上記聴感上影響力の
高い信号からなるチャネル(6個のチャネル)を、上記
レフトチャネルとレフトセンタチャネルとセンタチャネ
ルとサブウーファチャネルとライトセンタチャネルとラ
イトチャネルとし、上記第2の符号化方式で圧縮するチ
ャネル(n−m個のチャネル)をサラウンドレフトチャ
ネルとサラウンドライトチャネルとしている。勿論、本
発明はこれらに限定されず、例えば上記n個のチャネル
を例えばセンタチャネルとレフトチャネルとライトチャ
ネルとサラウンドレフトチャネルとサラウンドライトチ
ャネルの5チャネルとしたときには、上記m個のチャネ
ルをセンタチャネルとレフトチャネルとライトチャネル
の3チャネルとし、上記n−m個のチャネルをサラウン
ドレフトチャネルとサラウンドライトチャネルとするこ
ともできる。同様に、上記n個のチャネルを例えばセン
タチャネルとレフトチャネルとライトチャネルとレフト
センタチャネルとライトセンタチャネルとサラウンドレ
フトチャネルとサラウンドライトチャネルの7チャネル
としたときには、上記m個のチャネルをセンタチャネル
とレフトチャネルとライトチャネルとし、上記n−m個
のチャネルをサラウンドレフトチャネルとサラウンドラ
イトチャネルとすることもできる。
【0022】さらに、本発明実施例の伝送装置におい
て、上記第1の符号化方式で圧縮符号化を行う高聴感圧
縮符号化回路217〜222には、前述したようなサブ
バンドコーディング等を用いたオーディオ信号の高能率
圧縮符号化方式であって人間の聴覚上の特性を利用し、
オーディオデータを約1/5に圧縮するような方式、す
なわち、入力ディジタルオーディオ信号を複数帯域に分
割し、各帯域毎のディジタルオーディオ信号を複数サン
プル毎にブロック化し、各ブロック単位で直交変換した
スペクトルデータを、人間の聴覚特性に応じて適応的に
圧縮符号化する方式(例えばいわゆるATRAC:Adap
tive TRansform Acoustic Coding方式)を用いる。
【0023】また、第2の符号化方式で圧縮符号化を行
う高率圧縮符号化回路223,224には、入力ディジ
タルオーディオ信号を複数サンプル毎に直交変換した係
数データとそれに関連するサブ情報(語長情報やスケー
ルファクタの情報)を得、各チャネルのエネルギに応じ
て各チャネルのビット配分を決定し、この各チャネルの
ビット配分によって適応的に圧縮符号化する方式を用い
る。勿論、本発明はこれら各符号化方式に限定されるも
のでないことは言うまでもない。
【0024】さらに、本実施例では、上記伝送として、
例えば映画フィルムへの記録や、光ディスク,光磁気デ
ィスク,相変化型光ディスク,磁気ディスク等のディス
ク状記録媒体、磁気テープ等のテープ状記録媒体への記
録、半導体メモリ,ICカードなどへの記録を挙げるこ
とができる。
【0025】なお、上記伝送を映画フィルムへの記録と
した場合には、例えば図2に示すようにスピーカが配置
されるディジタルサラウンドシステムに対応することに
なる。各チャネルは、センタ(C)チャネル、サブウー
ファ(SW)チャネル、レフト(L)チャネル、レフト
センタ(CL)チャネル、ライト(R)チャネル、ライ
トセンタ(CR)チャネル、レフトサラウンド(LB)
チャネル、ライトサラウンド(RB)チャネルの8つで
ある。
【0026】ここで、この図2において、上記映画フィ
ルムに記録する上記8チャネルの各チャネルは、例えば
当該映画フィルムの画像記録領域から再生された画像が
映写機(プロジェクタ100)によって投影されるスク
リーン101側に配置されたレフトスピーカ106,レ
フトセンタースピーカ104,センタースピーカ10
2,ライトセンタースピーカ105,ライトスピーカ1
07,サラウンドレフトスピーカ108及び200,サ
ラウンドライトスピーカ109及び201,サブウーフ
ァスピーカ103と対応するものである。
【0027】上記センタスピーカ102は、スクリーン
101側の中央に配置され、センタチャネルのオーディ
オデータによる再生音を出力するもので例えば俳優のせ
りふ等の最も重要な再生音を出力する。上記サブウーフ
ァスピーカ103は、サブウーファチャネルのオーディ
オデータによる再生音を出力するもので、例えば爆発音
などの低域の音というよりは振動として感じられる音を
効果的に出力するものであり、爆発シーンなどに効果的
に使用されることが多いものである。上記レフトスピー
カ106及びライトスピーカ107は、上記スクリーン
101の左右に配置され、レフトチャネルのオーディオ
データによる再生音とライトチャネルのオーディオデー
タによる再生音を出力するもので、ステレオ音響効果を
発揮する。上記レフトセンタスピーカ104とライトセ
ンタスピーカ105は、上記センタスピーカ102と上
記レフトスピーカ106及びライトスピーカ107との
間に配置され、レフトセンタチャネルのオーディオデー
タによる再生音とライトセンタチャネルのオーディオデ
ータによる再生音を出力するもので、それぞれ上記レフ
トスピーカ106及びライトスピーカ107の補助的な
役割を果たす。特にスクリーン101が大きく収容人数
の多い映画館等では、座席の位置によって音像の定位が
不安定になりやすいが、上記レフトセンタスピーカ10
4とライトセンタスピーカ107を付加することによ
り、音像のよりリアルな定位を作り出すのに効果を発揮
する。さらに、上記サラウンドレフトスピーカ108と
サラウンドライトスピーカ109は、観客席を取り囲む
ように配置され、サラウンドレフトチャネルのオーディ
オデータによる再生音とサラウンドライトチャネルのオ
ーディオデータによる再生音を出力するもので、残響音
や拍手、歓声に包まれた印象を与える効果がある。これ
により、より立体的な音像を作り出すことができる。
【0028】図1に戻って、上述したような8チャネル
のディジタルオーディオ信号を扱う図1の伝送装置は、
上記8チャネルのディジタルオーディオ信号を得るため
に、各チャネルに対応するマイクロホン201〜208
からのアナログオーディオ信号をそれぞれ対応するA/
D変換器209〜216によってディジタルオーディオ
信号に変換する。
【0029】各A/D変換器209〜216からの各チ
ャネルのディジタルオーディオ信号は、それぞれ対応す
る圧縮符号化回路217〜224に送られて各々圧縮符
号化される。なお、これら各圧縮符号化回路217〜2
24の具体的構成については後述する。
【0030】上記高聴感圧縮符号化回路217〜222
からの圧縮符号化されたオーディオデータは、それぞれ
対応する出力端子233〜238から後段の構成に送ら
れる。
【0031】一方、上記高率圧縮符号化回路223,2
24からの圧縮符号化されたオーディオデータは、それ
ぞれハイパスフィルタ225,226によって高域成分
のみが取り出された後、加算器227によって加算され
る。また、上記高率圧縮符号化回路223,224から
の圧縮符号化されたオーディオデータは、それぞれロー
パスフィルタ228,229にも送られる。上記加算器
227からのデータは、加算器230によって上記サラ
ウンドレフトチャネル側に対応するローパスフィルタ2
28の出力と加算され、出力端子231から出力され、
上記サラウンドライトチャネルに対応するローパスフィ
ルタ229の出力は出力端子232から出力される。
【0032】ここで、上記サラウンドレフトチャネルと
サラウンドライトチャネルにおいて上記ハイパスフィル
タ225,226からの出力を加算器227によって加
算し、当該加算器227の加算出力を、更に加算器22
8によってサラウンドレフトチャネルのローパスフィル
タ228出力に加算するのは以下の理由による。
【0033】すなわち、人間の耳は高域の成分に対する
定位感が少なく、このため高域成分については例えば複
数個のスピーカのうちのいずれか1つのスピーカからで
ていても人間にはどのスピーカから出てきているのか聞
き取り難いという性質がある。このため、複数チャネル
のオーディオ信号の各高域成分を、そのうちの例えば1
チャネルに対応するスピーカのみに送るようにしても、
人間には各チャネルのオーディオ信号の高域成分が当該
1つのスピーカのみから出力されているとは感じられな
い。したがって、本実施例では、上述のように、上記8
チャネルのうちの例えばサラウンドレフトチャネルとサ
ラウンドライトチャネルの音声の高域成分を加算して、
例えばサラウンドレフトチャネルの低域成分の音声に加
えるようにしている。これにより、サラウンドレフトチ
ャネルとサラウンドライトチャネルの2つのチャネルの
高域成分を1つのチャネル分に圧縮できることになる。
なお、このような高域成分におけるチャネル間のクロス
トーク処理は、図1の例のような上記サラウンドレフト
チャネルとサラウンドライトチャネル間のみならず、図
示は省略しているが他のチャネル間(例えば全チャネ
ル)についても同様に行うことができる。このように全
チャネルについて高域成分のチャネルクロストーク処理
を行うことで更に圧縮率を上げることが可能となる。
【0034】上述した図1の各出力端子233〜238
及び231,232からの各チャネルの圧縮符号化デー
タは、図3のそれぞれ対応する端子233〜238及び
231,232を介してマルチプレクサ241に送られ
てマルチプレクスされる。当該マルチプレクサ241の
出力は出力端子242を介して伝送路に伝送若しくは上
述した本発明の映画フィルムやディスク状記録媒体,テ
ープ状記録媒体などに記録される。
【0035】次に、上記図1の各高聴感圧縮符号化回路
217〜222について具体的に説明する。
【0036】先ず、図4には、上記各高聴感圧縮符号化
回路217〜222の一具体例の構成を示す。
【0037】この図4に示す圧縮符号化回路では、入力
ディジタル信号をフィルタなどにより複数の周波数帯域
に分割すると共に、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に適応的にビット配分して符号化して
いる。この時、高域では臨界帯域幅を更に分割した帯域
を用いる。もちろんフィルタなどによる非ブロッキング
の周波数分割幅は等分割幅としてもよい。さらに、本実
施例においては、直交変換の前に入力信号に応じて適応
的にブロックサイズ(ブロック長)を変化させると共
に、クリティカルバンド単位もしくは高域では臨界帯域
幅(クリティカルバンド)を更に細分化したブロックで
フローティング処理を行っている。
【0038】なお、上記帯域分割用フィルタとしては、
例えばQMF等のフィルタがあり、これは1976 R.E.Cro
chiere Digital coding of speech in subbands Bell
Syst.Tech. J. Vol.55, No.8 1976に、述べられてい
る。同じくICASSP 83, BOSTONPolyphase Quadrature f
ilters-A new subband coding technique Joseph H.Ro
thweilerには等バンド幅のフィルタ分割手法及び装置が
述べられている。
【0039】さらに、上記クリティカルバンドとは、人
間の聴覚特性を考慮して分割された周波数帯域であり、
ある純音の周波数近傍の同じ強さの狭帯域バンドノイズ
によって当該純音がマスクされるときのそのノイズの持
つ帯域のことである。このクリティカルバンドは、高域
ほど帯域幅が広くなっており、上記0〜22kHzの全
周波数帯域は例えば25のクリティカルバンドに分割さ
れている。
【0040】すなわち、図4において、入力端子10に
は例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMF等
の帯域分割フィルタ11により0〜11kHz帯域と1
1k〜22kHz帯域とに分割され、0〜11kHz帯
域の信号は同じくいわゆるQMF等の帯域分割フィルタ
12により0〜5.5kHz帯域と5.5k〜11kH
z帯域とに分割される。帯域分割フィルタ11からの1
1k〜22kHz帯域の信号は、直交変換回路の一例で
あるMDCT(Modified Discrete Cosine Transform)
回路13に送られ、帯域分割フィルタ12からの5.5
k〜11kHz帯域の信号はMDCT回路14に送ら
れ、帯域分割フィルタ12からの0〜5.5kHz帯域
の信号はMDCT回路15に送られることにより、それ
ぞれMDCT処理される。
【0041】各MDCT回路13、14、15では、各
帯域毎に設けたブロック決定回路19、20、21によ
り後述するように決定されたブロックサイズに基づいて
MDCT処理がなされる。
【0042】なお、各MDCT回路13、14、15に
おける上記MDCT処理については、ICASSP 1987 Sub
band/Transform Coding Using Filter Bank Designs B
asedon Time Domain Aliasing Cancellation J.P.Princ
en A.B.Bradley Univ. ofSurrey Royal Melbourne Ins
t.of Tech.に述べられている。
【0043】上記ブロック決定回路19、20、21で
決定されたブロックサイズを示す情報は、後述の適応ビ
ット配分符号化回路16、17、18に送られると共
に、出力端子23、25、27から出力される。
【0044】ここで、上記適応ビット配分符号化回路1
6、17、18においては、各MDCT回路13、1
4、15の出力から、上記臨界帯域(クリティカルバン
ド)または高域では更にクリティカルバンドを分割した
帯域毎のエネルギが、例えば当該バンド内での各振幅値
の2乗平均の平方根を計算すること等により求められ、
この計算結果に基づいてビット配分が行われる。もちろ
ん、上記スケールファクタそのものを以後のビット配分
の為に用いるようにしてもよい。この場合には新たなエ
ネルギ計算の演算が不要となるため、ハード規模の節約
となる。また、各バンド毎のエネルギの代わりに、振幅
値のピーク値、平均値等を用いることも可能である。な
お、各MDCT回路13、14、15にてMDCT処理
されて得られた周波数領域のスペクトルデータあるいは
MDCT係数データは、いわゆる臨界帯域(クリティカ
ルバンド)または高域では更にクリティカルバンドを分
割した帯域毎にまとめられて当該適応ビット配分符号化
回路16、17、18に送られている。
【0045】さらに、上記適応ビット配分符号化回路1
6、17、18では、上記ブロックサイズの情報、及び
臨界帯域(クリティカルバンド)または高域では更にク
リティカルバンドを分割した帯域毎に割り当てられたビ
ット数に応じて各スペクトルデータ(あるいはMDCT
係数データ)を再量子化(正規化して量子化)するよう
にしている。適応ビット配分符号化回路16、17、1
8で符号化されたデータは、出力端子22、24、26
を介して取り出される。また、当該適応ビット配分符号
化回路16、17、18では、どのような信号の大きさ
に関する正規化がなされたかを示すスケールファクタ
と、どのようなビット長で量子化がされたかを示すビッ
ト長情報も求めており、これらも同時に出力端子22、
24、26から出力される。
【0046】これら各出力端子22〜27からのデータ
はまとめられて上記各高聴感圧縮符号化回路217〜2
22の出力となる。
【0047】ところで、上記図1及び図4の例では、各
高聴感圧縮符号化回路217〜222においては各チャ
ネル毎にビット配分を行って圧縮符号化を行っている
が、これら各高聴感圧縮符号化回路217〜222間で
ビット配分を行う(すなわち各回路217〜222に対
応するチャネル間でビット配分を行う)ことも可能であ
る。
【0048】この高聴感圧縮符号化回路217〜222
間でビット配分を行う場合の各回路構成について、以下
に説明する。図5には、チャネル間でビット配分を行う
高聴感圧縮符号化回路の構成を示す。なお、この図5の
構成のうち、適応ビット配分符号化回路16,17,1
8を除く他の構成要素は図4の対応する構成要素と基本
的には同一のものである。
【0049】この図5に示される圧縮符号化回路におい
て、図4同様のブロック決定回路19、20、21によ
り決定される各MDCT回路13、14、15でのブロ
ックサイズの具体例を図6のA及びBに示す。なお、図
6のAには直交変換ブロックサイズが長い場合(ロング
モードにおける直交変換ブロックサイズ)を、図6のB
には直交変換ブロックサイズが短い場合(ショートモー
ドにおける直交変換ブロックサイズ)を示ししている。
この図6の具体例においては、3つのフィルタ出力は、
それぞれ2つの直交変換ブロックサイズを持つ。すなわ
ち、低域側の0〜5.5kHz帯域の信号及び中域の
5.5k〜11kHz帯域の信号に対しては、長いブロ
ック長の場合(図6のA)は1ブロック内のサンプル数
を128サンプルとし、短いブロックが選ばれた場合
(図6のB)には1ブロック内のサンプル数を32サン
プル毎のブロックとしている。これに対して高域側の1
1k〜22kHz帯域の信号に対しては、長いブロック
長の場合(図6のA)は1ブロック内のサンプル数を2
56サンプルとし、短いブロックが選ばれた場合(図6
のB)には1ブロック内のサンプル数を32サンプル毎
のブロックとしている。このようにして短いブロックが
選ばれた場合には各帯域の直交変換ブロックのサンプル
数を同じとして高域程時間分解能を上げ、なおかつブロ
ック化に使用するウインドウの種類を減らしている。な
お、図5の具体例のブロック決定回路19、20、21
で決定されたブロックサイズを示す情報は、後述の適応
ビット配分符号化回路16、17、18に送られると共
に、出力端子23、25、27から出力される。
【0050】この図5の具体例の適応ビット配分符号化
回路16、17、18では、上記ブロックサイズの情
報、及び臨界帯域(クリティカルバンド)または高域で
は更にクリティカルバンドを分割した帯域毎に割り当て
られたビット数に応じて各スペクトルデータ(あるいは
MDCT係数データ)を再量子化(正規化して量子化)
するようにしている。この時、適応ビット配分符号化回
路16、17、18では、各チャネル間でのチャネルビ
ット配分、すなわち各チャネルの信号全体を見ることに
より、チャネル毎の使用ビット量を適応的に最適に振り
分けるビット配分を同時に行う。この場合の当該チャネ
ルビット配分は、後述する適応ビット配分回路から端子
28を介して供給されたチャネルビット配分信号に基づ
いて行われる。このようにして符号化されたデータは、
出力端子22、24、26を介して取り出される。ま
た、当該適応ビット配分符号化回路16、17、18で
は、どのような信号の大きさに関する正規化がなされた
かを示すスケールファクタと、どのようなビット長で量
子化がされたかを示すビット長情報も求めており、これ
らも同時に出力端子22、24、26から出力される。
【0051】次に、上記ビット配分を行うための適応ビ
ット配分回路の具体的な構成及び動作を図7を用いて説
明する。なお、この図7の例では、図1に対応して前記
8チャネルのうちの6チャネルについてのビット配分に
対応している。すなわち、聴感上影響の高い信号からな
るチャネルであるレフトチャネルとレフトセンタチャネ
ルとセンタチャネルとサブウーファチャネルとライトセ
ンタチャネルとライトチャネルの6チャネルに対応して
いる。
【0052】この図7において、各チャネルの共通部に
ついて例えばレフトチャネル(Lch)を用いて説明す
る(他のチャネルについては同一の指示符号を付して説
明は省略している)と、レフトチャネルの入力情報信号
は当該レフトチャネル用の入力端子31に与えられる。
なお、この端子31は、図5の端子29と対応してい
る。この入力情報信号はマッピング回路(Mapping)32
により時間領域の信号から周波数領域に展開される。こ
こで、フィルタによる場合には、サブバンド信号として
時間領域サンプルが得られることになり、直交変換出力
の場合及びフィルタリング後に直交変換を行う場合には
周波数領域サンプルが得られることになる。
【0053】これらのサンプルは、ブロッキング(Block
ing)回路33によって複数サンプル毎にまとめられる。
ここで、フィルタによる場合には時間領域の複数サンプ
ルがまとめられることになり、直交変換出力の場合及び
フィルタリング後に直交変換を行う場合には周波数領域
の複数サンプルがまとめられることになる。
【0054】また、本具体例では、マッピングの途中の
MDCT入力時間領域信号の時間変化を時間変化算出回
路34により算出する。
【0055】上記ブロッキング回路33により複数のサ
ンプル毎にまとめられた各サンプルは正規化回路37で
正規化される。ここで、正規化のための係数であるスケ
ールファクタは、スケールファクタ算出回路35によっ
て得られる。同時にトーナリティの大きさがトーナリテ
ィ算出回路36で算出される。
【0056】以上で求められるパラメータは、ビット配
分回路38でビット配分のために使用される。ここで、
MDCT係数を表現して伝送又は記録に使えるビット数
を、全チャネル(上記6チャネル)で800Kbpsと
すると、本具体例のビット配分回路38では、チャネル
ビット配分を含む第1のビット配分(第1のビット配分
量)と、チャネルビット配分を含まない第2のビット配
分(第2のビット配分量)の2つを求める。
【0057】先ず、チャネルビット配分を含む第1のビ
ット配分の配分手法について説明する。ここではスケー
ルファクタの周波数領域の分布をみて適応的にビット配
分を行う。
【0058】この場合、全チャネルのスケールファクタ
の周波数領域の分布をみてチャネル間でのビット配分を
行うことで有効なビット配分を行うことができる。この
とき、複数チャネルの信号情報が、スピーカの場合のよ
うに同一音場のなかで混合されて左右の耳に達する場合
を考えると、全チャネル信号の加算されたものでマスキ
ングが作用すると考えてよいから、図8のA,Fに示す
ように、同一帯域において各チャネルが同一のノイスレ
ベルになるようにビット配分を行うことが有効である。
このための一方法としてはスケールファクタ指標の大き
さに比例したビット配分を行えばよい。すなわち、以下
の式によってビット配分を行う。
【0059】Bm=B*(ΣSFn)/S S=Σ(ΣSFn)
【0060】ここで、Bmは各チャネルへのビット配分
量、Bは全チャネルへのビット配分量、SFnはスケー
ルファクタ指標であり概略ピーク値の対数に対応してい
る。nは各チャネル内のブロックフローティングバンド
番号、mはチャネル番号、Sは全チャネルのスケールフ
ァクタ指標の和である。なお、図8には、レフトチャネ
ルとライトチャネルのみ示し他の4チャネルについては
図示を省略している。
【0061】以上に加えて、ビット配分回路38は、各
チャネルの信号の時間変化特性を検出して、この指標に
よってチャネル毎のビット配分量を変えるプロセスを持
つ。この時間変化を表す指標は次のようにして求められ
る。
【0062】図9のA〜Fに示すように、チャネルが6
チャネルあるとすると、それぞれのチャネルの情報入力
信号についてビット配分の時間単位であるビット配分時
間ブロックを時間的に4分割し、それぞれの時間ブロッ
ク(サブブロック)のピーク値を得る。そして各サブブ
ロックのピーク値が小から大へと変わるところの差分の
大きさに応じてチャネル間でビットを分け合う。ここ
で、このビット配分のために6チャネル合計でCビット
使えるとしたとき、各チャネルの各サブブロックのピー
ク値が小から大へと変わるところの差分の大きさがそれ
ぞれa,b,c,d,e,fデシベル(dB)とする
と、それぞれC*a/T,C*b/T,・・・・・,C
*f/Tビット(ビット)と配分することができる。こ
こで、T=a+b+c+d+e+fである。信号情報が
大きくなる程度が大であるほどそのチャネルに対しての
ビット配分量が大きくなる。なお、図9には、レフトチ
ャネルとレフトセンタチャネルとライトチャネルのみ示
し他の3つのチャネルについては図示を省略している。
【0063】次に、チャネルビット配分を含まない第2
のビット配分の配分手法について説明する。ここでは、
チャネルビット配分を含まない第2のビット配分の手法
として更に2つのビット配分からなるビット配分手法に
ついて説明する。なお,この第2のビット配分は、前記
図4における適応ビット配分符号化回路でのビット配分
処理に対応している。
【0064】この2つのビット配分をそれぞれビット配
分(1) とビット配分(2) とする。以下のビット配分では
各チャネルで使用できるビットレートは事前にそれぞれ
のチャネルで固定的に決めておく。例えば、6チャネル
の内で音声など重要部分を担う2つのチャネルには14
7kbpsという比較的大きいビットを使い、サブウー
ハチャネルには高々2kbps、それ以外のチャネルに
は100kbpsを割り当てておく。
【0065】先ず、ビット配分(1) に使うべきビット量
を確定する。そのためには、信号情報(a)のスペクト
ル情報のうちトーナリティ情報及び信号情報(b)の時
間変化情報を使用する。
【0066】ここで、トーナリティ情報について説明す
ると、指標としては、信号スペクトルの隣接値間の差の
絶対値の和を、信号スペクトル数で割った値を、指標と
して用いている。より簡単にはブロックフローティング
の為のブロックごとのスケールファクタの、隣接スケー
ルファクタ指標の間の差の平均値を用いる。スケールフ
ァクタ指標は、概略スケールファクタの対数値に対応し
ている。本実施例では、ビット配分(1) に使うべきビッ
ト量をこのトーナリティを表す値に対応させて最大80
kbps、最小10kbpsと設定している。ここでは
簡単のために、全チャネルそれぞれの割当を等しく10
0kbpsとしている。
【0067】トーナリティ計算は次式のように行う。
【0068】 T=(1/WLmax)(ΣABS(SFn−1))
【0069】なお、WLmaxはワードレングス最大値
=16、SFnはスケールファクタ指標で概略ピーク値
の対数に対応している。nはブロックフローティングバ
ンド番号である。
【0070】このようにして求められたトーナリティ情
報Tとビット配分(1)のビット配分量とは、図10に示
すように対応付けられる。
【0071】これと共に本実施例においては、ビット配
分(1) とそれに付加するその他の少なくとも1つのビッ
ト配分との分割率は、情報信号の時間変化特性に依存す
る。本具体例では、直交変換時間ブロックサイズを更に
分割した時間区間毎に信号情報のピーク値を隣接ブロッ
ク毎に比較することにより情報信号の振幅が急激に大き
くなる時間領域を検出してその大きくなるときの状態の
程度により分割率を決定する。
【0072】時間変化率計算は次式のように行う。
【0073】Vt=ΣVm Vav=(1/Vmax)*(1/Ch)Vt
【0074】ここで、Vtは各チャネルの時間サブブロ
ックのピーク値の小から大への変化をdB値で表したも
ののチャネルに関する和、Vmは各チャネルの時間サブ
ブロックのピーク値の小から大への変化をdB値で表し
たもので一番大きいものの大きさ(但し最大値を30d
Bに制限しVmaxであらわす。mはチャネル番号、C
hはチャネル数、Vavは時間サブブロックのピーク値
の小から大への変化をdB値で表したもののチャネル平
均である。
【0075】このようにして求められた時間変化率Va
vとビット配分(1) の配分量とは、図11に示すように
対応付けられる。最終的にビット配分(1) への配分量は
次の式で求められる。
【0076】B=1/2(Bf+Bt)
【0077】ここで、Bは最終的なビット配分(1) への
配分量、BfはTvaより求められたビット配分量、B
tはVavより求められたビット配分量である。
【0078】ここでのビット配分(1) はスケ−ルファク
タに依存した周波数、時間領域上の配分がなされる。
【0079】このようにしてビット配分(1) に使用され
るビット量が決定されたならば、次にビット配分(1) で
使われなかったビットについての配分すなわちビット配
分(2) を決定する。ここでは多種のビット配分が行われ
る。
【0080】第1に全てのサンプル値に対する均一配分
が行われる。この場合のビット配分に対する量子化雑音
スペクトルの一例を図12に示す。この場合、全周波数
帯域で均一の雑音レベル低減が行える。
【0081】第2に信号情報の周波数スペクトル及びレ
ベルに対する依存性を持たせた聴覚的な効果を得るため
のビット配分が行われる。この場合のビット配分に対す
る量子化雑音スペクトルの一例を図13に示す。この例
では情報信号のスペクトルに依存させたビット配分を行
っていて、特に情報信号のスペクトルの低域側にウエイ
トをおいたビット配分を行い、広域側に比して起きる低
域側でのマスキング効果の減少を補償している。これは
隣接臨界帯域間でのマスキングを考慮して、スペクトル
の低域側を重視したマスキングカーブの非対象性に基づ
いている。このように、図13の例では低域を重視した
ビット配分が行われている。
【0082】そして最終的にビット配分(1) とビット配
分(1) に付加されるビット配分の値の和が図7のビット
配分回路38でとられる。最終的なビット配分は以上の
各ビット配分の和として与えられる。
【0083】なお、図12,図13の図中Sは信号スペ
クトルを、NL1は上記全てのサンプルに対する均一配
分による雑音レベルを、NL2は上記周波数スペクトル
及びレベルに対する依存正を持たせた聴覚的な高かを得
るためのビット配分による雑音レベルを示している。
【0084】次にチャネルビット配分を含まないビット
配分の別の手法を次に説明する。この場合の適応ビット
配分回路の動作を図14で説明するとMDCT係数の大
きさが各ブロックごとに求められ、そのMDCT係数が
入力端子801に供給される。当該入力端子801に供
給されたMDCT係数は、帯域毎のエネルギ算出回路8
03に与えられる。帯域毎のエネルギ算出回路803で
は、クリティカルバンドまたは高域においてはクリティ
カルバンドを更に再分割したそれぞれの帯域に関する信
号エネルギを算出する。帯域毎のエネルギ算出回路80
3で算出されたそれぞれの帯域に関するエネルギは、エ
ネルギ依存ビット配分回路804に供給される。
【0085】エネルギ依存ビット配分回路804では、
使用可能総ビット発生回路802からの使用可能総ビッ
ト、本実施例では128Kbpsの内のある割合(本実
施例では100Kbps)を用いて白色の量子化雑音を
作り出すようなビット配分を行う。このとき、入力信号
のトーナリティが高いほど、すなわち入力信号のスペク
トルの凸凹が大きいほど、このビット量が上記128K
bpsに占める割合が増加する。なお、入力信号のスペ
クトルの凸凹を検出するには、隣接するブロックのブロ
ックフローティング係数の差の絶対値の和を指標として
使う。そして、求められた使用可能なビット量につき、
各帯域のエネルギの対数値に比例したビット配分を行
う。
【0086】聴覚許容雑音レベルに依存したビット配分
算出回路805は、まず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。このようにして求められたエネル
ギ依存ビットと聴覚許容雑音レベルに依存したビットは
加算されて、図5(図4の場合も同様)の適応ビット配
分符号化回路16、17、18により各クリティカルバ
ンド毎もしくは高域においてはクリティカルバンドを更
に複数帯域に分割した帯域に割り当てられたビット数に
応じて各スペクトルデータ(あるいはMDCT係数デー
タ)を再量子化するようにしている。このようにして符
号化されたデータは、図5の出力端子22、24、26
を介して取り出される。
【0087】さらに詳しく上記聴覚許容雑音スペクトル
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13、1
4、15で得られたMDCT係数が上記許容雑音算出回
路に与えられる。
【0088】図15は上記許容雑音算出回路をまとめて
説明した一具体例の概略構成を示すブロック回路図であ
る。この図15において、入力端子521には、MDC
T回路13、14、15からの周波数領域のスペクトル
データが供給されている。
【0089】この周波数領域の入力データは、帯域毎の
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図16はこのような各クリティカルバン
ド毎のバークスペクトルSBを示している。ただし、こ
の図16では、図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表現
している。
【0090】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。なお、上記
マスキングとは、人間の聴覚上の特性により、ある信号
によって他の信号がマスクされて聞こえなくなる現象を
いうものであり、このマスキング効果には、時間領域の
オーディオ信号による時間軸マスキング効果と、周波数
領域の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分にノ
イズがあったとしても、このノイズは聞こえないことに
なる。このため、実際のオーディオ信号では、このマス
キングされる範囲内のノイズは許容可能なノイズとされ
る。
【0091】ここで、上記畳込みフィルタ回路523の
各乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。
【0092】次に、上記畳込みフィルタ回路523の出
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器524には、上記レベルαを求めるるための
許容関数(マスキングレベルを表現する関数)が供給さ
れる。この許容関数を増減させることで上記レベルαの
制御を行っている。当該許容関数は、次に説明するよう
な(n−ai)関数発生回路525から供給されている
ものである。
【0093】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n-ai)が
許容関数となる。例としてn=38,a=−0.5を用い
ることができる。
【0094】このようにして、上記レベルαが求めら
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。
【0095】次に、上記マスキングスレッショールド
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図17に示すように、上記バーク
スペクトルSBは、該マスキングスレッショールドMS
のレベルで示すレベル以下がマスキングされることにな
る。なお、遅延回路529は上記合成回路527以前の
各回路での遅延量を考慮してエネルギ検出回路522か
らのバークスペクトルSBを遅延させるために設けられ
ている。
【0096】当該減算器528からの出力は、許容雑音
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。
【0097】このようにしてエネルギ依存ビットと聴覚
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報が図5の端子28を介して上記適応ビット
配分符号化回路16、17、18に送られることで、こ
こでMDCT回路13、14、15からの周波数領域の
各スペクトルデータがそれぞれのバンド毎に割り当てら
れたビット数で量子化されるわけである。
【0098】すなわち要約すれば、適応ビット配分符号
化回路16、17、18では、上記クリティカルバンド
の各バンド帯域(クリティカルバンド)毎もしくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域のエネルギもしくはピーク値と上記ノイズレベル
設定手段の出力との差分のレベルに応じて配分されたビ
ット数で上記各バンド毎のスペクトルデータを量子化す
ることになる。
【0099】ところで、上述した合成回路527での合
成の際には、最小可聴カーブ発生回路532から供給さ
れる図17に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
レッショールドMSとを合成することができる。この最
小可聴カーブにおいて、雑音絶対レベルがこの最小可聴
カーブ以下ならば該雑音は聞こえないことになる。この
最小可聴カーブは、コーディングが同じであっても例え
ば再生時の再生ボリュームの違いで異なるものとなが、
現実的なディジタルシステムでは、例えば16ビットダ
イナミックレンジへの音楽のはいり方にはさほど違いが
ないので、例えば4kHz付近の最も耳に聞こえやすい
周波数帯域の量子化雑音が聞こえないとすれば、他の周
波数帯域ではこの最小可聴カーブのレベル以下の量子化
雑音は聞こえないと考えられる。したがって、このよう
に例えばシステムの持つダイナミックレンジの4kHz
付近の雑音が聞こえない使い方をすると仮定し、この最
小可聴カーブRCとマスキングスレッショールドMSと
を共に合成することで許容ノイズレベルを得るようにす
ると、この場合の許容ノイズレベルは、図17中の斜線
で示す部分までとすることができるようになる。なお、
本実施例では、上記最小可聴カーブの4kHzのレベル
を、例えば20ビット相当の最低レベルに合わせてい
る。また、この図17は、信号スペクトルSSも同時に
示している。
【0100】また、上記許容雑音補正回路530では、
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図17に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大き
さに聞こえ、逆に、50Hz付近では1kHzでの音圧
よりも約15dB高くないと同じ大きさに聞こえない。
このため、上記最小可聴カーブのレベルを越えた雑音
(許容ノイズレベル)は、該等ラウドネス曲線に応じた
カーブで与えられる周波数特性を持つようにするのが良
いことがわかる。このようなことから、上記等ラウドネ
ス曲線を考慮して上記許容ノイズレベルを補正すること
は、人間の聴覚特性に適合していることがわかる。
【0101】以上述べた聴覚許容雑音レベルに依存した
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。
【0102】次に2つのビット配分手法の間でのビット
量分割手法について説明する。図14に戻って、MDC
T回路出力が供給される入力端子801からの信号は、
スペクトルの滑らかさ算出回路808にも与えられ、こ
こでスペクトルの滑らかさが算出される。本実施例で
は、信号スペクトルの絶対値の隣接値間の差の絶対値の
和を、信号スペクトルの絶対値の和で割った値を、上記
スペクトルの滑らかさとして算出している。
【0103】上記スペクトルの滑らかさ算出回路808
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールするマルチプ
ライヤ811及び812に対してコントロール出力を送
る。ここで、仮にスペクトルが滑らかであり、エネルギ
依存のビット配分に重きをおくように、マルチプライヤ
811へのビット分割率決定回路809の出力が0.8
の値を取ったとき、マルチプライヤ812へのビット分
割率決定回路809の出力は1−0.8=0.2とす
る。これら2つのマルチプライヤの出力はアダー806
で足し合わされて最終的なビット配分情報となって、出
力端子807から出力される。
【0104】このときのビット配分の様子を図18、図
19に示す。また、これに対応する量子化雑音の様子を
図20、図21に示す。図18は信号のスペクトルが割
合平坦である場合を示しており、図19は信号スペクト
ルが高いトーナリティを示す場合を示している。また、
図18及び図19の図中QSは信号レベル依存分のビッ
ト量を示し、図中QNは聴覚許容雑音レベル依存のビッ
ト割当分のビット量を示している。図20及び図21の
図中Lは信号レベルを示し、図中NSは信号レベル依存
分による雑音低下分を、図中NNは聴覚許容雑音レベル
依存のビット割当分による雑音低下分を示している。
【0105】先ず、信号のスペクトルが、割合平坦であ
る場合を示す図18において、聴覚許容雑音レベルに依
存したビット配分は、全帯域に渡り大きい信号雑音比を
取るために役立つ。しかし低域及び高域では比較的少な
いビット配分が使用されている。これは聴覚的にこの帯
域の雑音に対する感度が小さいためである。信号エネル
ギレベルに依存したビット配分の分は量としては少ない
が、ホワイトな雑音スペクトルを生じるように、この場
合には中低域の信号レベルの高い周波数領域に重点的に
配分されている。
【0106】これに対して、図19に示すように、信号
スペクトルが高いトーナリティを示す場合には、信号エ
ネルギレベルに依存したビット配分量が多くなり、量子
化雑音の低下は極めて狭い帯域の雑音を低減するために
使用される。聴覚許容雑音レベルに依存したビット配分
分の集中はこれよりもきつくない。
【0107】図14に示すように、この両者のビット配
分の和により、孤立スペクトル入力信号での特性の向上
が達成される。
【0108】以上の様にして得られたチャネルビット配
分を含むビット配分とチャネルビット配分を含まないビ
ット配分の2つを用いて、次のようにして第1と第2の
量子化を行う。
【0109】図22を用いて説明する。この例では、全
6チャネルのうちでチャネルビット配分を含むビット配
分により147kbpsを越えるビット配分がなされる
チャネルはセンタチャネルとサブウーファチャネルとラ
イトチャネルである。
【0110】まず、チャネルビット配分を含むビット配
分量が147kbpsを越えるチャネルについて、ある
一定のビット量例えば128kbpsを最大とする部分
と128kbpsを越える部分に2分する。
【0111】この処理を行う構成を図23に示す。図2
3の構成では、チャネルビット配分を含むビット配分で
の配分量が147kbpsを越えるビット配分の各サン
プルについて、複数サンプルごとのブロックについての
正規化処理すなわちブロックフローティングを行う。こ
の時どの程度のブロックフローティングが行われたかを
示す係数としてスケールファクタが得られる。
【0112】この図23において、入力端子900に供
給されたMDCT係数(MDCTサンプル)は正規化回
路905によって複数サンプル毎に、ブロックについて
の正規化処理すなわちブロックフローティングが施され
る。この時どの程度のブロックフローティングが行われ
たかを示す係数としてスケールファクタが得られる。
【0113】次段の第1の量子化器(quantizer) 901
は、前記チャネルビット配分を含まないビット配分の各
サンプル語長で量子化を行なう。この時、量子化雑音を
少なくするためには四捨五入による量子化が行われる。
【0114】次に、上記正規化回路905の出力と上記
量子化器901の出力が差分器902に送られる。すな
わち、当該差分器902では、量子化器901の入力と
出力の差(量子化誤差)が取られる。この差分器902
からの出力は、さらに正規化回路906を介して第2の
量子化器903に送られる。
【0115】当該第2の量子化器903では、前記チャ
ネルビット配分を含むビット配分の各サンプル語長と前
記チャネルビット配分を含まないビット配分の各サンプ
ル語長の差の語長が各サンプル毎に使用される。この時
のフローティング係数は第1の量子化器901で用いら
れたフローティング係数と語長から自動的に決定され
る。すなわち第1の量子化器901で用いられた語長が
Nビットであったときには、(2**N)で第2の量子
化器903で用いられるフローティング係数が得られ
る。
【0116】また、上記第2の量子化器903では、第
1の量子化器901と同じように四捨五入処理を含むビ
ット配分を行う。このようにして2つの量子化により、
前記チャネルビット半分を含むビット配分で147kb
psを越えるビット配分を受けたチャネルのビットは、
128kbps以下になるべく128kbpsに近いビ
ット配分と残りのビット配分とに分けられる。
【0117】ここで、128kbpsと147kbps
という2つのスレッショールドを設けているのは、以下
のような理由による。すなわち、前記残りのビット配分
データも語長を表すサブ情報が必要であるので、このサ
ブ情報量も含めてデータ領域がとれるようなビット配分
がされる最下限量として147kbpsが設定されてい
る。また、前記チャネルビット配分を含むビット配分量
が128kbpsを上回り147kbpsを下回る場合
には、128kbpsを越えたデータ部分にはサブ情報
しか書き込めないのでサンプル情報を書き込む余地がな
く意味がなくなってしまう。このため、このような場合
にはこのチャネルは前記チャネルビット配分を含まない
ビット配分で128kbpsよりも小さく、できるだけ
128kbps近いビット配分を行うために、上記12
8kbpsが設定されている。
【0118】また、前記チャネルビット配分を含むビッ
ト配分で128kbpsよりも小さいビット配分となっ
たチャネルは、そのままそのビット配分を使用する。
【0119】前に述べたように、前記残りのビット配分
の成分の大きさは図23で示されるようにビット配分
(1) のスケールファクタとワードレングスからスケール
ファクタを算出できるのでワードレングスのみがデコ−
ダに必要とされる。
【0120】このようにして量子化器901及び903
では、それぞれ四捨五入された効率の高い量子化出力が
得られる。
【0121】なお、図23の構成(エンコーダ)に対応
する構成(デコーダ)では、上記正規化回路905,9
06に対応する逆正規化処理を行う逆正規化回路90
8,907が設けられ、これら逆正規化回路908,9
07の出力が加算器904で加算される。その加算出力
が出力端子910から取りだされることになる。
【0122】次に、図1に示したサラウンドレフトチャ
ネルとサラウンドライトチャネルとの間でビット配分を
行う高率圧縮符号化回路223,224の具体的構成を
図24に示す。
【0123】この図24において、入力端子301には
サラウンドレフトチャネルのディジタルオーディオ信号
が、入力端子311にはサラウンドライトチャネルのデ
ィジタルオーディオ信号が供給される。
【0124】上記入力端子301と311からのディジ
タルオーディオ信号は、それぞれ対応するバッファ30
2,312に一旦記憶される。このバッファ302,3
12からは、各々50%オーバーラップしたNポイント
(Nサンプル)毎のブロックでデータが取り出される。
このブロック単位のデータは、直交変換回路303,3
13に送られ、当該直交変換回路303,313によっ
てそれぞれMDCT及びMDST(Modified Discrete S
ine transform)の直交変換が施される。
【0125】上記直交変換回路303からの係数データ
は、それぞれ対応するサブバンド・ブロックフローティ
ングポイント圧縮回路304,314によって圧縮され
る。上記サブバンド・ブロックフローティングポイント
圧縮回路304,314からの係数データと語長情報や
スケールファクタ等のサブ情報は、対応する適応量子化
回路305,315に送られる。また、サブバンド・ブ
ロックフローティングポイント圧縮回路304,314
からは、スペクトル情報がlogスペクトラルエンベロ
ープ検出回路308に送られる。
【0126】上記適応量子化回路305は、logスペ
クトラルエンベロープ検出回路308によって検出され
たエンベロープ情報に基づいてチャネル間ビット配分量
を決定する分配決定回路309からのビット配分情報に
基づいて、上記係数データとサブ情報を適応的に量子化
する。この適応量子化回路305,315からは、量子
化された係数データとサブ情報及びビット配分情報とが
出力される。この適応量子化回路305,315の各出
力は、上記マルチプレクス・エラーコレクション回路3
06,316に送られる。
【0127】これらマルチプレクス・エラーコレクショ
ン回路306,316では、各チャネル毎に量子化され
た係数データとサブ情報及びビット配分情報をマルチプ
レクスすると共に、エラー訂正符号を付加する。これら
マルチプレクス・エラーコレクション回路306,31
6からの出力端子307,317を介した出力が、前記
図1のサラウンドレフトチャネル用とサラウンドライト
チャネル用の高率圧縮符号化回路223,224の出力
となる。
【0128】次に、図25には、前記図1の各高聴感圧
縮符号化回路217〜222に対応する高聴感伸張復号
化回路の構成を示す。すなわち、この図25の高聴感伸
張復号化回路は、本発明の伝送装置及び方法に対応する
受信装置及び方法に適用されるものであり、前記n個の
複数チャネルのディジタルオーディオ信号のうち、上記
m個のチャネルのディジタルオーディオ信号に対して上
記第1の符号化方式で圧縮符号化がなされた信号を復号
化する回路(1チャネル分)の構成である。
【0129】この図25において、各帯域の量子化され
たMDCT係数は復号化装置入力端子122、124、
126に与えられ、また使用されたブロックサイズ情報
及び適応ビット配分情報は入力端子123、125、1
27に与えられる。復号化回路116、117、118
では、適応ビット配分情報を用いてビット割当を解除
し、ブロックサイズ情報を用いて伸張復号化を行う。
【0130】次に、IMDCT回路113、114、1
15では、周波数領域の信号が時間領域の信号に変換さ
れる。これらの部分帯域の時間領域信号は、IQMF回
路112、111により、全体域信号に復号化される。
【0131】ここで、高聴感伸張復号化回路では、前記
チャネルビット配分を含む128kbps以下のビット
配分(1) が行われるチャネルと、前記チャネルビット配
分を含む147kbps以上のビット配分(2) が行われ
るチャネルにおけるある一定のビット量例えば128k
bpsを最大とする部分と128kbpsを越える部分
のそれぞれが、上記復号化回路116,117,118
で復号化される。但し、ビット配分(2) の2つ部分はそ
れそれが復号化された後、それぞれのサンプルが加算さ
れて精度の高いサンプルとなる。
【0132】また、得られた各チャネルのデータの並べ
方については、シンクブロック中に、先ず、(1)前記
チャネルビット配分を含む128kbps以下のビット
配分が行われるチャネル、(2)前記チャネルビット配
分を含む147kbps以上のビット配分が行われるチ
ャネルにおけるある一定のビット量例えば128kbp
sを最大とする部分を、チャネル順に並べ、次に前記チ
ャネルビット配分を含む147kbps以上のビット配
分が行われるチャネルにおける128kbpsを越える
部分をチャネル順に並べる。
【0133】次に、図1の高率圧縮符号化回路223,
224に対応する高率伸張復号化回路の構成を図26
(1チャネル分)に示す。すなわち、この図26の高率
伸張復号化回路は、本発明の伝送装置に対応する受信装
置に適用されるものであり、前記n−m個のチャネルの
ディジタルオーディオ信号に対して上記第2の符号化方
式で圧縮符号化がされた信号を復号化する回路(1チャ
ネル分)の構成である。
【0134】この図26において、入力端子410に
は、前記高率圧縮符号化が施されたディジタルオーディ
オ信号が供給される。この信号は、デマルチプレクス・
エラーコレクション回路411によってデマルチプレク
スとエラー訂正が行われる。
【0135】当該デマルチプレクス・エラーコレクショ
ン回路411からは、適応量子化された係数データとサ
ブ情報及びビット配分情報とが出力される。係数データ
及びサブ情報は、適応逆量子化回路412に送られる。
また、ビット配分情報は量子化ステップサイズコントロ
ール回路413に送られる。上記適応逆量子化回路41
2は、上記量子化ステップサイズコントロール回路41
3からの量子化ステップサイズ情報に基づいて、上記量
子化変換係数情報に対して逆量子化を施す。この適応逆
量子化回路412からの量子化圧縮変換係数はサブバン
ド・ブロックフローティングポイント伸張回路414に
送られる。
【0136】上記サブバンド・ブロックフローティング
ポイント伸張回路414では、前記図24のサブバンド
・ブロックフローティングポイント圧縮回路304,3
14の逆処理を行う。この伸張回路414の出力は、同
じく図24の直交変換回路303,313の逆変換処理
を行う逆直交変換回路415によってNポイントのサン
プルデータに変換され、ウインドウ・オーバーラップ加
算回路416に送られる。当該ウインドウ・オーバーラ
ップ加算回路416では、前記オーバーラップが解除さ
れて、PCMオーディオ信号として出力される。このP
CMオーディオ信号が出力端子416から取り出され
る。
【0137】
【発明の効果】以上の説明からも明らかなように、本発
明のディジタルオーディオ信号の伝送装置及び方法にお
いては、複数チャネルの信号のうち、聴感上影響力の高
い信号からなるチャネルの信号に対しては聴感上の劣化
が少ない第1の圧縮率の第1の符号化方式によって圧縮
符号化を行い、聴感上影響力の低い信号からなるチャネ
ルの信号に対しては第1の圧縮率よりも高い第2の圧縮
率の第2の符号化方式で圧縮符号化を行うようにしてい
るため、特に重要な音に対しては高音質の圧縮符号化が
可能であると共に、ビット配分量(バイト配分量)の無
駄を無くすことが可能となる。
【0138】また、本発明のディジタルオーディオ信号
の受信装置及び方法においては、複数チャネルの信号の
うち、聴感上影響力の高い信号からなるチャネルの信号
に対して聴感上の劣化が少ない第1の圧縮率の第1の符
号化方式によって圧縮符号化がされた信号と、聴感上影
響力の低い信号からなるチャネルの信号に対して第1の
圧縮率よりも高い第2の圧縮率の第2の符号化方式で圧
縮符号化がなされた信号を、それぞれ復号化可能とな
る。
【図面の簡単な説明】
【図1】本発明実施例のディジタルオーディオ信号の伝
送装置の主要部の概略構成を示すブロック回路図であ
る。
【図2】8チャネルディジタルサラウンドシステムにお
けるスピーカの配置を説明するための図である。
【図3】各チャネルの圧縮されたオーディオ信号をマル
チプレクスする構成を示すブロック回路図である。
【図4】高聴感圧縮符号化回路の一具体例(チャネル間
ビット配分を行わない例)の概略構成を示すブロック回
路図である。
【図5】高聴感圧縮符号化回路の一具体例(チャネル間
ビット配分を行う例)の概略構成を示すブロック回路図
である。
【図6】高聴感圧縮符号化回路での信号の周波数及び時
間分割を示す図である。
【図7】高聴感圧縮符号化回路のマルチチャネルでのビ
ット配分用パラメータを求める構成の一例を示すブロッ
ク回路図である。
【図8】高聴感圧縮符号化回路におけるチャネル間でス
ペクトルの大きさからビット配分を行う概念を示す図で
ある。
【図9】高聴感圧縮符号化回路におけるチャネル間での
情報信号の時間特性を考慮したビット配分の為のパラメ
ータの求め方を示す図である。
【図10】ビット配分(1) のビット配分量とトーナリテ
ィとの間の関係を示す図である。
【図11】ビット配分(1) のビット配分量と時間変化率
との間の関係を示す図である。
【図12】均一配分の時のノイズスペクトルを示す図で
ある。
【図13】情報信号の周波数スペクトル及びレベルに対
する依存性を持たした聴覚的な効果を得るためのビット
配分によるノイズスペクトルの例を示す図である。
【図14】情報信号の大きさ及び聴覚許容雑音スペクト
ルの二者を用いたビット配分手法を実現する構成を示す
ブロック回路図である。
【図15】許容雑音レベルを求める構成を示すブロック
回路図である。
【図16】各帯域の信号レベルによるマスキングスレシ
ョールドの例を示す図である。
【図17】情報スペクトル、マスキングスレショール
ド、最小可聴限を示す図である。
【図18】トーナリティが低い情報信号に対する信号レ
ベル依存および聴覚許容雑音レベル依存のビット配分を
示す図である。
【図19】トーナリティが高い情報信号に対する信号レ
ベル依存および聴覚許容雑音レベル依存のビット配分を
示す図である。
【図20】トーナリティが低い情報信号に対する量子化
雑音レベルを示す図である。
【図21】トーナリティが高い情報信号に対する量子化
雑音レベルを示す図である。
【図22】高聴感圧縮符号化回路でのマルチチャネルに
おけるビット配分の関係を示す図である。
【図23】ビット配分の分割を行う具体的構成を示すブ
ロック回路図である。
【図24】高率圧縮符号化回路の具体的構成例を示すブ
ロック回路図である。
【図25】本発明実施例の受信装置の高聴感伸張復号化
回路の構成例を示すブロック回路図である。
【図26】本発明実施例の受信装置の高率伸張復号化回
路の構成例を示すブロック回路図である。
【符号の説明】 209〜216・・・A/D変換器 217〜222・・・高聴感圧縮符号化回路 223,224・・・高率圧縮符号化回路 225,226・・・ハイパスフィルタ 228,229・・・ローパスフィルタ 227,230・・・加算器 241・・・マルチプレクサ 302,313・・・バッファ 303,313・・・直交変換回路 304,314・・・サブバンドブロックフローティン
グポイント圧縮回路 305,315・・・適応量子化回路 306,316・・・マルチプレクス・エラーコレクシ
ョン回路 308・・・logスペクトラルエンベロープ検出回路 309・・・分配決定回路 11,12・・・帯域分割フィルタ 13,14,15・・・MDCT回路 16,17,18・・・適応ビット配分符号化回路 19,20,21・・・ブロックサイズ決定回路 31・・・各チャネル情報信号入力端子 32・・・マッピング回路 33・・・ブロッキング回路 34・・・時間変化算出回路 35・・・スケ−ルファクタ算出回路 36・・・トーナリティ算出回路 37・・・正規化回路 38・・・ビット配分回路 116,117,118・・・適応ビット配分復号化回
路 113,114,115・・・IMDCT回路 112,111・・・IQMF回路 411・・・デマルチプレクス・エラーコレクション回
路 412・・・適応逆量子化回路 413・・・量子化ステップサイズコントロール回路 414・・・サブバンドブロックフローティングポイン
ト伸張回路 415・・・逆直交変換回路 416・・・ウインドウ・オーバーラップ加算回路 520・・・許容雑音算出回路 521・・・許容雑音算出回路入力端子 522・・・帯域毎のエネルギ検出回路 523・・・畳込みフィルタ回路 524・・・引算器 525・・・n−ai関数発生回路 526・・・割算器 527・・・合成回路 528・・・減算器 530・・・許容雑音補正回路 532・・・最小可聴カーブ発生回路 533・・・補正情報出力回路 802・・・使用可能総ビット発生回路 803・・・帯域毎のエネルギ算出回路 804・・・エネルギ依存のビット配分回路 805・・・聴覚許容雑音レベル依存のビット配分回路 806・・・アダー 808・・・スペクトルの滑らかさ算出回路 809・・・ビット分割率決定回路 811、812・・・マルチプライヤ 905,906・・・正規化回路 901・・・第1の量子化器 903・・・第2の量子化器 907,909・・・逆正規化回路 904・・・加算器

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数チャネル(nチャネル、nは3より
    大なる正の整数)のディジタルオーディオ信号を圧縮符
    号化して伝送するディジタルオーディオ信号の伝送装置
    において、 上記n個のチャネルのディジタルオーディオ信号のう
    ち、m個(n>m)のチャネルのディジタルオーディオ
    信号であって他のn−m個のチャネルのディジタルオー
    ディオ信号より聴感上影響力の高い信号に対しては第1
    の圧縮率の第1の符号化方式で圧縮符号化する第1の圧
    縮符号化手段と、 上記n−m個のチャネルのディジタルオーディオ信号に
    対しては上記第1の圧縮率よりも高い第2の圧縮率を有
    する第2の符号化方式で圧縮符号化する第2の圧縮符号
    化手段とを有し、 上記第1の圧縮符号化手段からの圧縮符号化出力と上記
    第2の圧縮符号化手段からの圧縮符号化出力を共に伝送
    することを特徴とするディジタルオーディオ信号の伝送
    装置。
  2. 【請求項2】 上記n個のチャネルはセンタチャネルと
    レフトチャネルとライトチャネルとサラウンドレフトチ
    ャネルとサラウンドライトチャネルであり、 上記n−m個のチャネルはサラウンドレフトチャネルと
    サラウンドライトチャネルであることを特徴とする請求
    項1記載のディジタルオーディオ信号の伝送装置。
  3. 【請求項3】 上記n個のチャネルはセンタチャネルと
    レフトチャネルとライトチャネルとレフトセンタチャネ
    ルとライトセンタチャネルとサラウンドレフトチャネル
    とサラウンドライトチャネルであり、 上記n−m個のチャネルはサラウンドレフトチャネルと
    サラウンドライトチャネルであることを特徴とする請求
    項1記載のディジタルオーディオ信号の伝送装置。
  4. 【請求項4】 上記第1の符号化方式は、入力ディジタ
    ルオーディオ信号を複数帯域に分割し、各帯域毎のディ
    ジタルオーディオ信号を複数サンプル毎にブロック化
    し、各ブロック単位で直交変換したスペクトル成分を、
    聴覚特性に応じて適応的に圧縮符号化する方式であり、 上記第2の符号化方式は、入力ディジタルオーディオ信
    号を複数サンプル毎に直交変換した係数情報とそれに関
    連するサブ情報を得、各チャネルのエネルギに応じて各
    チャネルの情報量を割り当てて適応的に圧縮符号化する
    方式であることを特徴とする請求項1記載のディジタル
    オーディオ信号の伝送装置。
  5. 【請求項5】 上記伝送は、記録媒体への記録を含むこ
    とを特徴とする請求項1記載のディジタルオーディオ信
    号の伝送装置。
  6. 【請求項6】 複数チャネル(nチャネル、nは3より
    大なる正の整数)のディジタルオーディオ信号のうち、
    m個(n>m)のチャネルのディジタルオーディオ信号
    であって他のn−m個のチャネルのディジタルオーディ
    オ信号より聴感上影響力の高い信号に対しては第1の圧
    縮率の第1の符号化方式で圧縮符号化がなされていると
    共に、上記n−m個のチャネルのディジタルオーディオ
    信号に対しては上記第1の圧縮率よりも高い第2の圧縮
    率を有する第2の符号化方式で圧縮符号化がなされた信
    号を受信するディジタルオーディオ信号の受信装置であ
    って、 上記n個のチャネルのディジタルオーディオ信号のう
    ち、上記m個のチャネルのディジタルオーディオ信号に
    対して上記第1の符号化方式に対応する第1の伸張復号
    化を施す第1の復号化手段と、 上記n−m個のチャネルのディジタルオーディオ信号に
    対して上記第2の符号化方式に対応する第2の伸張復号
    化を施す第2の復号化手段とを有することを特徴とする
    ディジタルオーディオ信号の受信装置。
JP5306892A 1993-12-07 1993-12-07 ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 Withdrawn JPH07161140A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP5306892A JPH07161140A (ja) 1993-12-07 1993-12-07 ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
EP95902919A EP0734019A4 (en) 1993-12-07 1994-12-07 INFORMATION PROCESSING PROCESS, ARRANGEMENT AND MEDIA.
PCT/JP1994/002056 WO1995016263A1 (fr) 1993-12-07 1994-12-07 Procede, dispositif et support concernant le traitement de l'information
AU11991/95A AU1199195A (en) 1993-12-07 1994-12-07 Information processing method, information processing device and media
US09/204,422 US20010047256A1 (en) 1993-12-07 1998-12-02 Multi-format recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5306892A JPH07161140A (ja) 1993-12-07 1993-12-07 ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法

Publications (1)

Publication Number Publication Date
JPH07161140A true JPH07161140A (ja) 1995-06-23

Family

ID=17962517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5306892A Withdrawn JPH07161140A (ja) 1993-12-07 1993-12-07 ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法

Country Status (1)

Country Link
JP (1) JPH07161140A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088915A1 (en) * 2000-05-15 2001-11-22 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
JP2010156822A (ja) * 2008-12-26 2010-07-15 Nippon Hoso Kyokai <Nhk> 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088915A1 (en) * 2000-05-15 2001-11-22 Qdesign Usa, Inc. Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
JP2010156822A (ja) * 2008-12-26 2010-07-15 Nippon Hoso Kyokai <Nhk> 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Similar Documents

Publication Publication Date Title
JP3404837B2 (ja) 多層符号化装置
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
JP3178026B2 (ja) ディジタル信号符号化装置及び復号化装置
KR100310216B1 (ko) 다중채널오디오신호를위한코딩장치또는방법
JP3278900B2 (ja) データ符号化装置及び方法
JP3449715B2 (ja) 多次元音場のための符号器・復号器
US5774844A (en) Methods and apparatus for quantizing, encoding and decoding and recording media therefor
JP3397001B2 (ja) 符号化方法及び装置、復号化装置、並びに記録媒体
JPH066236A (ja) 高能率符号化及び/又は復号化装置
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
JPH0816195A (ja) ディジタルオーディオ符号化方法及び装置
US20010047256A1 (en) Multi-format recording medium
JPH0846517A (ja) 高能率符号化及び復号化システム
JP3227942B2 (ja) 高能率符号化装置
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l&#39;information
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
JPH07161140A (ja) ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3318824B2 (ja) デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
JP3362476B2 (ja) 高能率符号化装置及びインタフェース装置
JP3227948B2 (ja) 復号化装置
JP3227945B2 (ja) 符号化装置
JPH07161142A (ja) 記録方法、記録媒体、及び再生方法
JP3141853B2 (ja) オーディオ信号処理方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010306