JP3186307B2 - 圧縮データ記録装置及び方法 - Google Patents
圧縮データ記録装置及び方法Info
- Publication number
- JP3186307B2 JP3186307B2 JP04794493A JP4794493A JP3186307B2 JP 3186307 B2 JP3186307 B2 JP 3186307B2 JP 04794493 A JP04794493 A JP 04794493A JP 4794493 A JP4794493 A JP 4794493A JP 3186307 B2 JP3186307 B2 JP 3186307B2
- Authority
- JP
- Japan
- Prior art keywords
- block size
- band
- power
- circuit
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
信号をビット圧縮した圧縮データの記録装置及び方法に
関し、特に入力信号の時間軸上の波形の振幅変化に応じ
て、その処理ブロックの時間的大きさを変化させるよう
な圧縮データの記録装置及び方法に関するものである。
タルオーディオ信号をビット圧縮し、所定のデータ量を
記録単位としてバースト的に記録するような技術を、例
えば特願平2−221364号、特願平2−22136
5号、特願平2−222821号、特願平2−2228
23号の各明細書及び図面等において提案している。
クを用い、いわゆるCD−I(CD−インタラクティ
ブ)やCD−ROM XAのオーディオデータフォーマ
ットに規定されているAD(適応差分)PCMオーディ
オデータを記録再生するものであり、このADPCMデ
ータの例えば32セクタ分とインターリーブ処理のため
のリンキング用の数セクタとを記録単位として、光磁気
ディスクにバースト的に記録している。
におけるADPCMオーディオにはいくつかのモードが
選択可能になっており、例えば通常のCDの再生時間に
比較して、2倍の圧縮率でサンプリング周波数が37.
8kHzのレベルA、4倍の圧縮率でサンプリング周波
数が37.8kHzのレベルB、8倍の圧縮率でサンプ
リング周波数が18.9kHzのレベルCが規定されて
いる。すなわち、例えば上記レベルBの場合には、ディ
ジタルオーディオデータが略々1/4に圧縮され、この
レベルBのモードで記録されたディスクの再生時間(プ
レイタイム)は、標準的なCDフォーマット(CD−D
Aフォーマット)の場合の4倍となる。これは、より小
型のディスクで標準12cmと同じ程度の記録再生時間
が得られることから、装置の小型化が図れることにな
る。
Dと同じであるため、例えば上記レベルBの場合、所定
時間当たりその4倍の再生時間分の圧縮データが得られ
ることになる。このため、例えばセクタやクラスタ等の
時間単位で同じ圧縮データを重複して4回読み出すよう
にし、そのうちの1回分の圧縮データのみをオーディオ
再生にまわすようにしている。具体的には、スパイラル
状の記録トラックを走査(トラッキング)する際に、1
回転毎に元のトラック位置に戻るようなトラックジャン
プを行って、同じトラックを4回ずつ繰り返しトラッキ
ングするような形態で再生動作を進めることになる。こ
れは、例えば4回の重複読み取りの内、少なくとも1回
だけ正常な圧縮データが得られればよいことになり、外
乱等によるエラーに強く、特に携帯用小型機器に適用し
て好ましいものである。
2号公報及び特開平3−263926号公報において、
入力信号の大きな振幅変化に適応して圧縮過程の処理ブ
ロックを可変とすることで、処理系の時間的分解能なら
びに応答性を改善する技術を開示している。
分解能という互いに相反する特性を入力信号の性質に応
じて変化させることによって、入力信号への適応性を高
め、聴感上の良質な音質を得るものである。数多く知ら
れる高能率圧縮法のうち、直交変換を用いる、いわゆる
トランスフォームコーディングにおいては、振幅変化の
激しい信号が入力された場合に生じるプリエコーに対し
て、特に有効な手法である。ここで述べているプリエコ
ーとは、直交変換ブロック中に大きな振幅変化が生じた
状態で圧縮、伸張を行なった場合、その直交変換ブロッ
ク内に時間的に均一な量子化ノイズが発生し、元の信号
の振幅の小さい部分において先の量子化ノイズが聴感上
問題となる現象を示している。
ンスフォームコーディングにおいては、その直交変換の
特質から、変換ブロックの時間的長さを短くすると周波
数分解能が低下し、スペクトラムあるいは直交変換係数
が分散するため、このスペクトラムあるいは直交変換係
数を量子化して圧縮を実現すると、ビットの割当効率が
低下する。従って、上述のプリエコーの影響を低減する
ために、直交変換ブロックの時間的長さを極端に短くす
ると、量子化ノイズの増加が聴感上無視できなくなり、
伸張時の音質劣化を招く。上記の理由により直交変換ブ
ロックサイズの可変は、入力信号の変化に適応した制御
を必要とする。この手法として、当該直交変換ブロック
の入力信号である時間軸上の波形の振幅変化に注目して
直交変換サイズを制御する方法が容易に考えられるが、
実際の時間軸上の入力波形は非常に複雑であり、また、
人間の聴感上の特性も影響を及ぼし、先の手法では実際
の入力信号に対し、直交変換ブロックの時間的サイズを
短い方向へと誘導してしまう。その結果として相対的な
音質の劣化を及ぼす。
のであり、実際の複雑な入力信号に対し、良好に適応し
た直交変換サイズの制御手法を実現するための圧縮デー
タ記録及び/又は再生若しくは伝送及び/又は受信装
置、圧縮データ記録及び/又は再生若しくは伝送及び/
又は受信方法、及びその記録媒体の提供を目的とするも
のである。
記録装置は、上述した目的を達成するために、ディジタ
ルオーディオ信号を情報圧縮する際に、入力信号に適応
して処理ブロックの長さを可変とする圧縮データ記録装
置において、入力信号を複数の帯域に分割する帯域分割
手段と、上記帯域分割手段で分割した帯域信号のパワー
を算出するパワー算出手段と、上記パワー算出手段で求
めたパワーの変化情報を抽出する変化情報抽出手段と、
上記変化情報抽出手段で抽出されたパワーの変化情報に
基づいて1次のブロックサイズを決定するブロックサイ
ズ1次決定手段と、各帯域の帯域信号のパワーを比較す
るパワー比較手段と、上記パワー比較手段の結果に応じ
て上記ブロックサイズ1次決定手段で決定したブロック
サイズを修正するブロックサイズ修正手段とを有する。
また、本発明に係る圧縮データ記録方法は、ディジタル
オーディオ信号を情報圧縮する際に、入力信号に適応し
て処理ブロックの長さを可変とする圧縮データ記録方法
において、入力信号を複数の帯域に分割する帯域分割ス
テップと、上記帯域分割ステップで分割した帯域信号の
パワーを算出するパワー算出ステップと、上記パワー算
出ステップで求めたパワーの変化情報を抽出する変化情
報抽出ステップと、上記変化情報抽出ステップで抽出さ
れたパワーの変化情報に基づいて1次のブロックサイズ
を決定するブロックサイズ1次決定ステップと、各帯域
の帯域信号のパワーを比較するパワー比較ステップと、
上記パワー比較ステップの結果に応じて上記ブロックサ
イズ1次決定ステップで決定したブロックサイズを修正
するブロックサイズ修正ステップとを有する。
及びこの処理ブロックに時間的に隣接する処理ブロック
のみならず、時間的に前の複数個の処理ブロックの情報
を解析することにより、入力信号の処理ブロックに比較
するところのより時間的に長い周期変化、特徴を上述の
処理ブロックの時間的サイズを決定するに当たり、加味
することによって、聴感上、良好な音質を得るようにし
ている。
ームコーディングにおけるプリエコーの影響の効率の良
い低減と聴感上の良好な音質の両立に効果的であるが、
他の高能率符号化方法においても、周波数分解能と時間
分解能の両立を図るという観点から有効である。
対し、直交変換ブロックの時間的サイズ、並びにウィン
ドウ形状を変化させる際に、必要以上に時間的に短いブ
ロックを選択することが無くなり、同一のビットレート
においては、より良好な音質を得ることが出来、同一の
音質においては、より低いビットレートでの記録、電送
等を実施することができる。
ながら説明する。
縮データ記録及び/又は再生装置の概略構成を示すブロ
ック回路図である。
装置において、先ず記録媒体としては、スピンドルモー
タ51により回転駆動される光磁気ディスク1が用いら
れる。光磁気デイスク1に対するデータの記録時には、
例えば光学ヘッド53によりレーザ光を照射した状態で
記録データに応じた変調磁界を磁気ヘッド54により印
加することによって、いわゆる磁界変調記録を行い、光
磁気ディスク1の記録トラックに沿ってデータを記録す
る。また再生時には、光磁気ディスク1の記録トラック
を光学ヘッド53によりレーザ光でトレースして磁気光
学的に再生を行う。
ード等のレーザ光源、コリメータレンズ、対物レンズ、
偏光ビームスプリッタ、シリンドリカルレンズ等の光学
部品及び所定パターンの受光部を有するフォトディテク
タ等から構成されている。この光学ヘッド53は、光磁
気ディスク1を介して上記磁気ヘッド54と対向する位
置に設けられている。光磁気ディスク1にデータを記録
するときには、後述する記録系のヘッド駆動回路66に
より磁気ヘッド54を駆動して記録データに応じた変調
磁界を印加すると共に、光学ヘッド53により光磁気デ
ィスク1の目的トラックにレーザ光を照射することによ
って、磁界変調方式により熱磁気記録を行う。またこの
光学ヘッド53は、目的トラックに照射したレーザ光の
反射光を検出し、例えばいわゆる非点収差法によりフォ
ーカスエラーを検出し、例えばいわゆるプッシュプル法
によりトラッキングエラーを検出する。光磁気ディスク
1からデータを再生するとき、光学ヘッド53は上記フ
ォーカスエラーやトラッキングエラーを検出すると同時
に、レーザ光の目的トラックからの反射光の偏光角(カ
ー回転角)の違いを検出して再生信号を生成する。
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して後述する再生系のデコーダ7
1に供給する。
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
作部58や表示部59が接続されている。このシステム
コントローラ57は、キー入力操作部58による操作入
力情報により指定される動作モードで記録系及び再生系
の制御を行う。またシステムコントローラ7は、光磁気
デイスク1の記録トラックからヘッダータイムやサブコ
ードのQデータ等により再生されるセクタ単位のアドレ
ス情報に基づいて、光学ヘッド53及び磁気ヘッド54
がトレースしている上記記録トラック上の記録位置や再
生位置を管理する。さらにシステムコントローラ57
は、データ圧縮率と上記記録トラック上の再生位置情報
とに基づいて表示部59に再生時間を表示させる制御を
行う。
記録トラックからいわゆるヘッダータイムやいわゆるサ
ブコードQデータ等により再生されるセクタ単位のアド
レス情報(絶対時間情報)に対し、データ圧縮率の逆数
(例えば1/4圧縮のときには4)を乗算することによ
り、実際の時間情報を求め、これを表示部59に表示さ
せるものである。なお、記録時においても、例えば光磁
気ディスク等の記録トラックに予め絶対時間情報が記録
されている(プリフォーマットされている)場合に、こ
のプリフォーマットされた絶対時間情報を読み取ってデ
ータ圧縮率の逆数を乗算することにより、現在位置を実
際の記録時間で表示させることも可能である。
機の記録系において、入力端子60からのアナログオー
デイオ入力信号AINがローパスフイルタ61を介してA
/D変換器62に供給され、このA/D変換器62は上
記アナログオーディオ入力信号AINを量子化する。A/
D変換器62から得られたディジタルオーディオ信号
は、ATC(Adaptive Transform Coding )PCMエン
コーダ63に供給される。また、入力端子67からのデ
ィジタルオーディオ入力信号DINがディジタル入力イン
ターフェース回路68を介してATCエンコーダ63に
供給される。ATCエンコーダ63は、上記入力信号A
INを上記A/D変換器62により量子化した所定転送速
度のディジタルオーディオPCMデータについて、ビッ
ト圧縮(データ圧縮)処理を行う。ここではその圧縮率
を4倍として説明するが、本実施例はこの倍率には依存
しない構成となっており、応用例により任意に選択が可
能である。
読み出しがシステムコントローラ57により制御され、
ATCエンコーダ63から供給されるATCデータを一
時的に記憶しておき、必要に応じてディスク上に記録す
るためのバッファメモリとして用いられている。すなわ
ち、例えばATCエンコーダ63から供給される圧縮オ
ーディオデータは、そのデータ転送速度が、標準的なC
D−DAフォーマットのデータ転送速度(75セクタ/
秒)の1/4、すなわち18.75セクタ/秒に低減さ
れており、この圧縮データがメモリ14に連続的に書き
込まれる。この圧縮データ(ATCデータ)は、前述し
たように4セクタにつき1セクタの記録を行えば足りる
が、このような4セクタおきの記録は事実上不可能に近
いため、後述するようなセクタ連続の記録を行うように
している。この記録は、休止期間を介して、所定の複数
セクタ(例えば32セクタ+数セクタ)から成るクラス
タを記録単位として、標準的なCD−DAフォーマット
と同じデータ転送速度(75セクタ/秒)でバースト的
に行われる。すなわちメモリ14においては、上記ビッ
ト圧縮レートに応じた18.75(=75/4)セクタ
/秒の低い転送速度で連続的に書き込まれたATCオー
ディオデータが、記録データとして上記75セクタ/秒
の転送速度でバースト的に読み出される。この読み出さ
れて記録されるデータについて、記録休止期間を含む全
体的なデータ転送速度は、上記18.75セクタ/秒の
低い速度となっているが、バースト的に行われる記録動
作の時間内での瞬時的なデータ転送速度は上記標準的な
75セクタ/秒となっている。従って、デイスク回転速
度が標準的なCD−DAフォーマットと同じ速度(一定
線速度)のとき、該CD−DAフォーマットと同じ記録
密度、記憶パターンの記録が行われることになる。
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、エンコーダ65
に供給される。ここで、メモリ64からエンコーダ65
に供給されるデータ列において、1回の記録で連続記録
される単位は、複数セクタ(例えば32セクタ)から成
るクラスタ及び該クラスタの前後位置に配されたクラス
タ接続用の数セクタとしている。このクラスタ接続用セ
クタは、エンコーダ65でのインターリーブ長より長く
設定しており、インターリーブされても他のクラスタの
データに影響を与えないようにしている。
たようにバースト的に供給される記録データについて、
エラー訂正のための符号化処理(パリティ付加及びイン
ターリーブ処理)やEFM符号化処理などを施す。この
エンコーダ65による符号化処理の施された記録データ
が磁気ヘッド駆動回路66に供給される。この磁気ヘッ
ド駆動回路66は、磁気ヘッド54が接続されており、
上記記録データに応じた変調磁界を光磁気ディスク1に
印加するように磁気ヘッド54を駆動する。
リ64に対する上述の如きメモリ制御を行うとともに、
このメモリ制御によりメモリ64からバースト的に読み
出される上記記録データを光磁気ディスク2の記録トラ
ックに連続的に記録するように記録位置の制御を行う。
この記録位置の制御は、システムコントローラ57によ
りメモリ64からバースト的に読み出される上記記録デ
ータの記録位置を管理して、光磁気ディスク1の記録ト
ラック上の記録位置を指定する制御信号をサーボ制御回
路56に供給することによって行われる。
トの再生系について説明する。この再生系は、上述の記
録系により光磁気ディスク1の記録トラック上に連続的
に記録された記録データを再生するためのものであり、
光学ヘッド53によって光磁気ディスク1の記録トラッ
クをレーザ光でトレースすることにより得られる再生出
力がRF回路55により2値化されて供給されるデコー
ダ71を備えている。この時、光磁気ディスクのみでは
なく、例えばいわゆるコンパクトディスク(compact di
sc)と同じ再生専用光ディスクの読み出しも行なうこと
ができる。
ンコーダ65に対応するものであって、RF回路55に
より2値化された再生出力について、エラー訂正のため
の上述の如き復号化処理やEFM復号化処理などの処理
を行いオーディオデータを、正規の転送速度よりも早い
75セクタ/秒の転送速度で再生する。このデコーダ7
1により得られる再生データは、メモリ72に供給され
る。
出しがシステムコントローラ57により制御され、デコ
ーダ71から75セクタ/秒の転送速度で供給される再
生データがその75セクタ/秒の転送速度でバースト的
に書き込まれる。また、このメモリ72は、上記75セ
クタ/秒の転送速度でバースト的に書き込まれた上記再
生データが正規の75セクタ/秒の転送速度18.75
セクタ/秒で連続的に読み出される。
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記18.7
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72からバースト的に
書き込まれる上記再生データを光磁気ディスク1の記録
トラックから連続的に再生するように再生位置の制御を
行う。この再生位置の制御は、システムコントローラ5
7によりメモリ72からバースト的に読み出される上記
再生データの再生位置を管理して、光磁気デイスク1若
しくは光ディスク1の記録トラック上の再生位置を指定
する制御信号をサーボ制御回路56に供給することによ
って行われる。
送速度で連続的に読み出された再生データとして得られ
るATCオーディオオデータは、ATCデコーダ73に
供給される。このATCデコーダ73は、ATCデータ
を4倍にデータ伸張(ビット伸張)することで16ビッ
トのディジタルオーディオデータを再生する。このAT
Cデコーダ73からのディジタルオーディオデータは、
D/A変換器74に供給される。
から供給されるディジタルオーディオデータをアナログ
信号に変換して、アナログオーデイオ出力信号AOUT を
形成する。このD/A変換器74により得られるアナロ
グオーデイオ信号AOUT は、ローパスフィルタ75を介
して出力端子76から出力される。
ディジタル信号を、帯域分割符号化(SBC)、適応変
換符号化(ATC)及び適応ビット割当ての各技術を用
いて高能率符号化する技術について、図2以降を参照し
ながら説明する。
は、入力ディジタル信号を複数の周波数帯域に分割する
と共に、最低域の隣接した2帯域の帯域幅は同じで、よ
り高い周波数帯域では高い周波数帯域ほどバンド幅を広
く選定し、各周波数帯域毎に直交変換を行って、得られ
た周波数軸のスペクトルデータを、低域では、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に、中高域ではブロックフローティン
グ効率を考慮して臨界帯域幅を細分化した帯域毎に、適
応的にビット割当して符号化している。通常このブロッ
クが量子化雑音発生ブロックとなる。さらに、本発明実
施例においては、直交変換の前に入力信号に応じて適応
的にブロックサイズ(ブロック長)を変化させると共
に、該ブロック単位でフローティング処理を行ってい
る。
は例えばサンプリング周波数が44.1kHzの時、0
〜22kHzのオーディオPCM信号が供給されてい
る。この入力信号は、例えばいわゆるQMFフィルタ等
の帯域分割フィルタ11により0〜11kHz帯域と1
1kHz〜22kHz帯域とに分割され、0〜11kH
z帯域の信号は同じくいわゆるQMFフィルタ等の帯域
分割フィルタ12により0〜5.5kHz帯域と5.5
kHz〜11kHz帯域とに分割される。帯域分割フィ
ルタ11からの11kHz〜22kHz帯域の信号は直
交変換回路の一例であるMDCT回路13に送られ、帯
域分割フィルタ12からの5.5kHz〜11kHz帯
域の信号はMDCT回路14に送られ、帯域分割フィル
タ12からの0〜5.5kHz帯域の信号はMDCT回
路15に送られることにより、それぞれMDCT処理さ
れる。
数の周波数帯域に分割する手法としては、例えばQMF
フィルタがあり、1976 R.E.Crochiere Digital Coding
ofSpeech In Subbands Bell Syst.Tech. J. Vol.55,N
o.8 1976に、述べられている。またICASSP 83,Boston P
olyphase Quadrature Filters-A New Subband CodingTe
chnique Joseph H. Rothweilerには等バンド幅のフィル
タ分割手法が述べられている。
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に高速フーリエ変換(F
FT)、コサイン変換(DCT)、モディファイドDC
T変換(MDCT)等を行うことで時間軸を周波数軸に
変換するような直交変換がある。MDCTについては、
ICASSP 1987 Subband/Transform Coding Using Filter
Bank DesignsBased OnTime Domain Aliasing Cancella
tion J.P.Princen A.B.Bradley Univ.of SurreyRoyal M
elbourne Inst.Of Tech.に述べられている。
に供給する各帯域毎のブロックについての標準的な入力
信号に対する具体例を図3に示す。
ルタ出力信号は、各帯域毎に独立に各々複数の直交変換
ブロックサイズを持ち、信号の時間特性、周波数分布等
により時間分解能を切り換えられるようにしている。信
号が時間的に準定常的である場合には、直交変換ブロッ
クサイズを11.6ms、すなわち、図3におけるAの
ロングモード(Long Mode)と大きくし、信号
が非定常的である場合には、直交変換ブロックサイズを
更に2分割、4分割とする。図3におけるBのショート
モード(Short Mode)のごとく、全てを4分
割、2.9msとする場合や、図3におけるCのミドル
モードA(Middle Mode A、図3における
DのミドルモードB(Middle Mode B)の
ごとく、一部を2分割、5.8ms、1部を4分割、
2.9msの時間分解能とすることで、実際の複雑な入
力信号に適応するようになっている。この直交変換ブロ
ックサイズの分割は処理装置の規模が許せば、さらに複
雑な分割を行なうと、より効果的なことは明白である。
このブロックサイズの決定は図2におけるブロックサイ
ズ決定回路19、20、21で決定され、各MDCT回
路13、14、15に伝えられるとともに、該当ブロッ
クのブロックサイズ情報として出力端子28、29、3
0より出力される。
4に示す。図2におけるブロック決定回路19を例に説
明する。図2における帯域分割フィルタ11の出力のう
ち、11kHz〜22kHzの出力は図4における入力
端子301を介してパワー算出回路304に送られる。
さらに、図2における帯域分割フィルタ12の出力のう
ち、5.5kHz〜11kHzの出力は図4における入
力端子302を介してパワー算出回路305へ、0〜
5.5kHzの出力は図4における入力端子303を介
してパワー算出回路306へとそれぞれ送られる。
路20、21は図4における入力端子301、302、
303へ入力される信号がブロックサイズ決定回路19
の場合と異なるだけで、動作は同一である。各ブロック
サイズ決定回路19、20、21におけるそれぞれの入
力端子301、302、303はマトリクス構成となっ
ている。すなわち、ブロックサイズ決定回路20の入力
端子301には図2における帯域分割フィルタ12の
5.5kHz〜11kHzの出力が接続されており、同
入力端子302には0〜5.5kHzの出力が接続され
ている。ブロックサイズ決定回路21についても、同様
である。
305、306は入力された時間波形を一定時間、積分
することによって、各周波数帯域のパワーを求めてい
る。この際、積分する時間幅は上述の直交変換ブロック
サイズのうち、最小時間ブロック以下である必要があ
る。また、上述の算出法以外、例えば直交変換ブロック
サイズの最小時間幅内の最大振幅の絶対値あるいは振幅
の平均値を代表パワーとして用いることもある。パワー
算出回路304の出力は変化分抽出回路308及びパワ
ー比較回路309に、パワー算出回路305、306の
出力はパワー比較回路309にそれぞれ送られる。
304より送られたパワーの微係数を求めてパワーの変
化情報として、ブロックサイズ1次決定回路310及び
メモリ307へ送る。メモリ307では、変化分抽出回
路308より送られたパワーの変化情報を上述の直交変
換ブロックサイズの最大時間以上、蓄積する。これは時
間的に隣接する直交変換ブロックが直交変換の際のウィ
ンドウ処理により、互いに影響を与え合うため、時間的
に隣接する1つ前のブロックのパワー変化情報をブロッ
クサイズ1次決定回路310において必要とするためで
ある。ブロックサイズ1次決定回路310では変化分抽
出回路308より送られた当該ブロックのパワー変化情
報とメモリ307より送られた時間的に隣接する該当ブ
ロックの1つ前のブロックのパワー変化情報をもとに、
該当する周波数帯域内のパワーの時間的変位から該当す
る周波数帯域の直交変換ブロックサイズを決定する。こ
の際、一定以上の変位が認められた場合、より時間的に
短い直交変換ブロックイサイズを選択するわけである
が、その変位点は固定でも効果は得られる。さらに周波
数に比例した値、即ち、周波数が高い場合は大きな変位
によって時間的に短いブロックサイズとなり、周波数が
低い場合は、高い場合のそれに比べ小さな変位で時間的
に短いブロックサイズに決定されると、より効果的であ
る。この値は滑らかに変化することが望ましいが、複数
段階の階段状の変化であっても、構わない。以上のよう
に決定されたブロックサイズはブロックサイズ修正回路
311へ伝送される。
パワー算出回路304、305、306より送られた各
周波数帯域のパワー情報を同時刻及び時間軸上でマスキ
ング効果の発生する時間幅で比較を行ない、パワー算出
回路304の出力周波数帯域に及ぼす他の周波数帯域の
影響を求め、ブロックサイズ修正回路311へ伝送す
る。
比較回路309より送られたマスキング情報及びディレ
イ群312、313、314の各タップから送られた過
去のブロックサイズ情報を基に、ブロックサイズ1次決
定回路310より送られたブロックサイズをより時間的
に長いブロックサイズを選択するよう修正をかけ、ディ
レイ群312及びウィンドウ形状決定回路317へ出力
している。ブロックサイズ修正回路311における作用
は、ある周波数帯域においてプリエコーが問題となる場
合でも、他の周波数帯域、特にこの周波数帯域より低い
帯域において、大きな振幅を持つ信号が存在した場合、
そのマスキング効果により、プリエコーが聴感上問題と
ならない、あるいは問題が軽減される場合があるという
特性を利用している。
の特性により、ある信号によって他の信号がマスクされ
て聞こえなくなる現象をいうものであり、このマスキン
グ効果には、時間軸上のオーデイオ信号による時間軸マ
スキング効果と、周波数軸上の信号による同時刻マスキ
ング効果とがある。これらのマスキング効果により、マ
スキングされる部分にノイズがあったとしても、このノ
イズは聞こえないことになる。このため、実際のオーデ
イオ信号では、このマスキングされる範囲内のノイズは
許容可能なノイズとされる。
では過去の直交変換ブロックサイズを順に記録してお
き、各タップ、即ち、ディレイ312、313、314
の出力より、ブロックサイズ決定回路311へ出力して
いる。同時に、ディレイ312の出力は出力端子315
へ、ディレイ312、313の出力はウィンドウ形状決
定回路317へ接続している。このディレイ群312、
313、314からの出力はブロックサイズ修正回路3
11においてより長い時間幅でのブロックサイズの変化
をこのブロックのブロックサイズの決定に役立てる働
き、例えば、過去頻繁により時間的に短いブロックサイ
ズが選択されている場合は、時間的に短いブロックサイ
ズの選択を増やし、過去において時間的に短いブロック
サイズの選択がなされてない場合においては、時間的に
長いブロックサイズの選択を増やす等の判断を可能とし
ている。なお、このディレイ群はウィンドウ決定回路3
17及び出力端子315に必要なディレイ312、31
3を除けば、そのタップ数は装置の実際的な構成、規模
により増減させて用いられる場合もある。
クサイズ修正回路311の出力、即ち、該当ブロックの
時間的に隣接する1つ後のブロックサイズととディレイ
312の出力、即ち、該当ブロックのブロックサイズと
ディレイ313の出力、即ち、該当ブロックの時間的隣
接する1つ前のブロックサイズとから、上述の図2にお
ける各MDCT回路13、14、15において使用され
るウィンドウの形状を決定し、出力端子317へ出力す
る。図4における出力端子315、即ち、ブロックサイ
ズ情報と出力端子319、即ち、ウィンドウ形状情報
が、図2におけるブロックサイズ決定回路19、20、
21の出力として各部へ接続される。
いて決定されるウィンドウの形状について説明する。
ドウの形状の様子を示す。図5より判るように、図中点
線及び実線で示すように直交変換に使用されるウィンド
ウは時間的に隣接するブロックとの間で重複する部分が
あり、本実施例では、隣接するブロックの中心まで重複
する形状を採用しているため、隣接するブロックの直交
変換サイズによりウィンドウの形状が変化する。
図6においてウィンドウ関数f(n)、g(n+N)は
次式(1)を満たす関数として与えられる。
ブロック長が同一であればそのまま変換ブロック長とな
るが、隣接する変換ブロック長が異なる場合は、より短
いほうの変換ブロック長をLとし、より長い変換ブロッ
ク長をKとすると、ウィンドウが重複しない領域におい
ては、式(2)に示すように、
重複部分をできる限り長く取ることにより、直交変換の
際のスペクトルの周波数分解能をを良好なものとしてい
る。
用するウィンドウの形状は時間的に連続する3ブロック
分の直交変換サイズが確定した後、決定される。従っ
て、図4における入力端子301、302、303から
入力される信号のブロックと出力端子315、317か
ら出力される信号のブロックは本実施例において1ブロ
ック分の差異を生じている。
5、306及びパワー比較回路309を省略しても図2
におけるブロックサイズ決定回路19、20、21を構
成することは可能である。さらに、ウィンドウの形状を
直交変換ブロックの取りうる時間的に最小のブロックサ
イズに固定することによってその種類を1種類とし、図
4におけるディレイ群312、313、314及びブロ
ックサイズ修正回路311ならびにウィンドウ形状決定
回路317を省略して構成することも可能である。特
に、処理時間の遅延を好まない応用例においては上述の
省略により遅延の少ない構成となり、有効に作用する。
10の作用を、図7及び8を用いて説明する。
の入力を単一の正弦波とし、図7の(A)、(B)共に
11kHz〜22kHzの帯域における入力信号は同一
のものとする。ここにおいて、ブロックNの直交変換ブ
ロックの時間的サイズを該当周波数の振幅変化のみで決
定した場合、図7の(A)、(B)共に同一のブロック
サイズが決定される。
5.5kHz〜11kHzの帯域の入力信号に注目する
と、図7の(A)では11kHz〜22kHz帯域の振
幅のエネルギ乃至パワーに比較して、他の帯域のエネル
ギ乃至パワーが低いために11kHz〜22kHzの帯
域に発生するプリエコーはマスクされず、聴感上問題と
なるため、図7の(A)の場合においては11kHz〜
22kHzの帯域のNブロックはより短い時間幅の直交
変換ブロックに決定されるべきである。
〜5.5kHz乃至5.5kHz〜11kHzの帯域の
エネルギ乃至パワーが11kHz〜22kHzの帯域の
それに比較し、プリエコーをマスクするに足りうる値で
あるから、11kHz〜22kHzの帯域に発生するプ
リエコーはマスクされ、聴感上問題とはなりにくい。従
って、図7の(B)の場合においては、周波数分解能を
優先し、図7の(A)の場合よりも長い時間幅の直交変
換ブロックに決定されるべきである。
305、306及びパワー比較回路309、ブロックサ
イズ修正回路311の働きより、図7における(A)及
び(B)のそれぞれの場合において異なるブロックサイ
ズの決定が可能となっている。
こす信号(図8の(A))と単発に大きな振幅変化を起
こす信号(図8の(B))を示す。
ブロックN−1及びN+1の間では同一の入力信号とす
る。この場合、N−1からN+1のブロックのみに注目
して上述の直交変換ブロックの時間的サイズを決定した
場合、共に同一のブロック長となる。
8の(A)の信号においては、東海ブロックN以前にも
Nと類似した振幅変化が周期的に起きており、これが入
力信号の特徴を意味づける重要な要素となっており、他
の部分の振幅変化と異なる直交変換ブロックサイズを決
定した場合、聴感上の音質変化を伴う可能性が生じる。
記ブロックN以前には、類似した振幅変化が発生してお
らず、単発の振幅変化となっているため、このブロック
N近傍のブロックに注目して上述のブロックサイズを決
定しても聴感上の障害になることが少ない。
2、313、314及びブロックサイズ修正回路311
において上述の類似信号による直交変換の時間的ブロッ
クの長さの誤決定を防止している。
スキング状態を考慮するために、直交変換前の帯域分割
をそのまま利用しているが、より多くの帯域に分割、な
いしは独立した直交変換を用いてマスキングの計算を行
うとさらに良好な結果が得られる。さらには、上述のよ
り長い時間を観察することによって得られる入力信号の
周期的時間変化を図4におけるディレイ群312、31
3、314、即ち、過去のブロックの直交変換サイズを
記憶することで実現しているが、入力波形の特徴抽出
に、圧縮過程とは別の直交変換を施したデータもしく
は、より細かい周波数帯に分割したデータ等を用いるこ
とによりさらに良好な結果が得られる。
14、15にてMDCT処理されて得られた周波数軸上
のスペクトルデータあるいはMDCT係数データは、低
域はいわゆる臨界帯域(クリティカルバンド)毎にまと
められて、中高域はブロックフローティングの有効性を
考慮して、臨界帯域幅を細分化して適応ビット割当符号
化回路22、23、24及びビット配分算出回路18に
送られている。このクリテイカルバンドとは、人間の聴
覚特性を考慮して分割された周波数帯域であり、ある純
音の周波数近傍の同じ強さの狭帯域バンドノイズによっ
て当該純音がマスクされるときのそのノイズの持つ帯域
のことである。このクリティカルバンドは、高域ほど帯
域幅が広くなっており、上記0〜22kHzの全周波数
帯域は例えば25のクリティカルバンドに分割されてい
る。
カルバンド及びブロックフローティングを考慮して分割
されたスペクトルデータに基づき、いわゆるマスキング
効果等を考慮してクリティカルバンド及びブロックフロ
ーティングを考慮した各分割帯域毎のマスキング量を求
め、このマスキング量とクリティカルバンド及びブロッ
クフローティングを考慮した各分割帯域毎のエネルギあ
るいはピーク値等に基づいて、各帯域毎に割当ビット数
を求め、適応ビット割当符号化回路22、23、24へ
伝送している。適応ビット割当符号化回路22、23、
24により各帯域毎に割り当てられたビット数に応じて
各スペクトルデータ(あるいはMDCT係数データ)を
量子化するようにしている。このようにして符号化され
たデータは、出力端子25、26、27を介して取り出
される。
の一具体例の概略構成を示すブロック回路図である。こ
の図9において、入力端子701には、上記各MDCT
回路13、14、15からの周波数軸上のスペクトルデ
ータが供給されている。
エネルギ算出回路702に送られて、上記マスキング量
とクリティカルバンド及びブロックフローティングを考
慮した各分割帯域のエネルギが、例えば当該バンド内で
の各振幅値の総和を計算すること等により求められる。
この各バンド毎のエネルギの代わりに、振幅値のピーク
値、平均値等が用いられることもある。このエネルギ算
出回路702からの出力として、例えば各バンドの総和
値のスペクトルを図9にSBとして示している。ただ
し、この図9では、図示を簡略化するため、上記マスキ
ング量とクリティカルバンド及びブロックフローティン
グを考慮した分割帯域数を12バンド(B1 〜B12)
で表現している。
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路702の出力すなわち該スペ
クトルSBの各値は、畳込みフイルタ回路703に送ら
れる。該畳込みフイルタ回路703は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフイルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図10
中点線で示す部分の総和がとられる。
各乗算器の乗算係数(フイルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
力は引算器704に送られる。該引算器704は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリユーション処理を
行うことによって、クリテイカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器704には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。この許容関数を増減させることで上記レベルαの制
御を行っている。当該許容関数は、次に説明するような
(n−ai)関数発生回路705から供給されているも
のである。
ベルαは、クリテイカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(3)式で求めるこ
とができる。
>0、Sは畳込み処理されたバークスペクトルの強度で
あり、(3)式中(n−ai)が許容関数となる。本実
施例では、 n=38,a=1 としており、この時の音質劣化はなく、良好な符号化が
行えた。
れ、このデータは、割算器706に伝送される。当該割
算器706では、上記畳込みされた領域での上記レベル
αを逆コンボリユーションするためのものである。した
がって、この逆コンボリユーション処理を行うことによ
り、上記レベルαからマスキングスペクトルが得られる
ようになる。すなわち、このマスキングスペクトルが許
容ノイズスペクトルとなる。なお、上記逆コンボリユー
ション処理は、複雑な演算を必要とするが、本実施例で
は簡略化した割算器706を用いて逆コンボリユーショ
ンを行っている。
回路707を介して減算器708に伝送される。ここ
で、当該減算器708には、上記帯域毎のエネルギ検出
回路702からの出力、すなわち前述したスペクトルS
Bが、遅延回路709を介して供給されている。したが
って、この減算器708で上記マスキングスペクトルと
スペクトルSBとの減算演算が行われることで、図11
示すように、上記スペクトルSBは、該マスキングスペ
クトルMSのレベルで示すレベル以下がマスキングされ
ることになる。
補正回路710を介し、出力端子711を介して取り出
され、例えば割当てビット数情報が予め記憶されたRO
M等(図示せず)に送られる。このROM等は、上記減
算回路708から許容雑音補正回路710を介して得ら
れた出力(上記各バンドのエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じ、各バンド毎
の割当ビット数情報を出力する。この割当ビット数情報
が図2における適応ビット割当符号化回路22、23、
24に送られることで、図2におけるMDCT回路1
3、14、15からの周波数軸上の各スペクトルデータ
がそれぞれのバンド毎に割り当てられたビット数で量子
化されるわけである。
ット割当符号化回路22、23、24では、上記マスキ
ング量とクリテイカルバンド及びブロックフローティン
グを考慮した各分割帯域のエネルギと上記ノイズレベル
設定手段の出力との差分のレベルに応じて割当てられた
ビット数で上記各バンド毎のスペクトルデータを量子化
することになる。なお、図9における遅延回路709は
上記合成回路707以前の各回路での遅延量を考慮して
エネルギ検出回路702からのスペクトルSBを遅延さ
せるために設けられている。
成の際には、最小可聴カーブ発生回路712から供給さ
れる図12に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。この最小可聴
カーブにおいて、雑音絶対レベルがこの最小可聴カーブ
以下ならば該雑音は聞こえないことになる。この最小可
聴カーブは、コーデイングが同じであっても例えば再生
時の再生ボリユームの違いで異なるものとなが、現実的
なディジタルシステムでは、例えば16ビットダイナミ
ツクレンジへの音楽のはいり方にはさほど違いがないの
で、例えば4kHz付近の最も耳に聞こえやすい周波数
帯域の量子化雑音が聞こえないとすれば、他の周波数帯
域ではこの最小可聴カーブのレベル以下の量子化雑音は
聞こえないと考えられる。
持つワードレングスの4kHz付近の雑音が聞こえない
使い方をすると仮定し、この最小可聴カーブRCとマス
キングスペクトルMSとを共に合成することで許容ノイ
ズレベルを得るようにすると、この場合の許容ノイズレ
ベルは、図12中の斜線で示す部分までとすることがで
きるようになる。なお、本実施例では、上記最小可聴カ
ーブの4kHzのレベルを、例えば20ビット相当の最
低レベルに合わせている。また、この図12は、信号ス
ペクトルSSも同時に示している。
補正情報出力回路713から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器708から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図12に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。
上記適応ビット割当符号化回路22、23、24での量
子化の際の出力情報量(データ量)の検出出力と、最終
符号化データのビットレート目標値との間の誤差の情報
に基づいて、上記許容ノイズレベルを補正するようにし
てもよい。これは、全てのビット割当単位ブロックに対
して予め一時的な適応ビット割当を行って得られた総ビ
ット数が、最終的な符号化出力データのビットレートに
よって定まる一定のビット数(目標値)に対して誤差を
持つことがあり、その誤差分を0とするように再度ビッ
ト割当をするものである。すなわち、目標値よりも総割
当ビット数が少ないときには、差のビット数を各単位ブ
ロックに割り振って付加するようにし、目標値よりも総
割当ビット数が多いときには、差のビット数を各単位ブ
ロックに割り振って削るようにするわけである。
ット数の上記目標値からの誤差を検出し、この誤差デー
タに応じて補正情報出力回路713が各割当ビット数を
補正するための補正データを出力する。ここで、上記誤
差データがビット数不足を示す場合は、上記単位ブロッ
ク当たり多くのビット数が使われることで上記データ量
が上記目標値よりも多くなっている場合を考えることが
できる。また、上記誤差データが、ビット数余りを示す
データとなる場合は、上記単位ブロック当たり少ないビ
ット数で済み、上記データ量が上記目標値よりも少なく
なっている場合を考えることができる。したがって、上
記補正情報出力回路713からは、この誤差データに応
じて、上記減算器708からの出力における許容ノイズ
レベルを、例えば上記等ラウドネス曲線の情報データに
基づいて補正させるための上記補正値のデータが出力さ
れるようになる。上述のような補正値が、上記許容雑音
補正回路710に伝送されることで、上記減算器708
からの許容ノイズレベルが補正されるようになる。以上
説明したようなシステムでは、メイン情報として直交変
換出力スペクトルをサブ情報により処理したデータとサ
ブ情報としてブロックフローティングの状態を示すスケ
ールファクタ、語長を示すワードレングスが得られ、エ
ンコーダからデコーダに送られる。
3、即ち、上述のごとく高能率符号化された信号を再び
複合化するための復号回路を示している。各帯域の量子
化されたMDCT係数、即ち、図2における出力端子2
5、26、27の出力信号と等価のデータは、復号回路
入力端子152、154、156に与えられ、使用され
たブロックサイズ情報、即ち、図2における出力端子2
8、29、30の出力信号と等価のデータは、入力端子
153、155、157に与えられる。復号回路14
6、147、148では適応ビット割当情報を用いてビ
ット割当を解除する。次にIMDCT回路143、14
4、145では周波数軸上の信号が時間軸上の信号に変
換される。これらの部分帯域の時間軸上信号は、IQM
F回路142、141により、全帯域信号に復号化され
て、出力端子130から出力される。
るものではなく、例えば、上記の記録再生媒体と信号圧
縮装置あるいは伸張装置と、さらには、記録媒体を介せ
ずに信号圧縮装置と伸張装置とは一体化されている必要
はなく、その間をデータ転送用回線等で結ぶ事も可能で
ある。更に例えば、オーデイオPCM信号のみならず、
ディジタル音声(スピーチ)信号やディジタルビデオ信
号等の信号処理装置にも適用可能である。また、上述し
た最小可聴カーブの合成処理を行わない構成としてもよ
い。この場合には、図9における最小可聴カーブ発生回
路712、合成回路707が不要となり、上記引算器7
04からの出力は、割算器706で逆コンボリユーショ
ンされた後、直ちに減算器708に伝送されることにな
る。叉ビット配分手法は多種多様であり、最も簡単には
固定のビット配分もしくは信号の各帯域エネルギによる
簡単なビット配分もしくは固定分と可変分を組み合わせ
たビット配分など使うことができる。
明に係る処理ブロックの時間的サイズの決定手法は、時
間的に変動する情報信号の圧縮に対して、聴覚的にも望
ましい処理ブロックの時間的サイズの決定手法の提供を
行なうことが出来、聴感上、音質の優れた高能率な圧
縮、伸張を行なうことが出来る。
施例としてのディスク記録再生装置の構成例を示すブロ
ック回路図である。
な高能率圧縮符号化エンコーダの一具体例を示すブロッ
ク回路図である。
す図である。
例を示すブロック回路図である。
さの変化と直交変換時に用いるウィンドウ形状の関係を
示す図である。
を示す図である。
マスキング効果について説明する図である。
ロックにわたる様な入力信号の変化情報をブロックの決
定に関与させる効果を説明する図である。
すブロック回路図である。
慮して分割された帯域のスペクトルを示す図である。
成した図である。
能な高能率圧縮符号化に対応するデコーダの一具体例を
示すブロック回路図である。
MF) 143、144、145・・・逆直交変換回路(IMD
CT) 702・・・・・・・・・・・帯域毎のエネルギ検出回
路 703・・・・・・・・・・・畳込みフィルタ回路 707・・・・・・・・・・・合成回路 708・・・・・・・・・・・減算器 710・・・・・・・・・・・許容雑音補正回路 712・・・・・・・・・・・最小可聴カーブ発生回路 713・・・・・・・・・・・補正情報出力回路
Claims (8)
- 【請求項1】 ディジタルオーディオ信号を情報圧縮す
る際に、入力信号に適応して処理ブロックの長さを可変
とする圧縮データ記録装置において、 入力信号を複数の帯域に分割する帯域分割手段と、 上記帯域分割手段で分割した帯域信号のパワーを算出す
るパワー算出手段と、 上記パワー算出手段で求めたパワーの変化情報を抽出す
る変化情報抽出手段と、 上記変化情報抽出手段で抽出されたパワーの変化情報に
基づいて1次のブロックサイズを決定するブロックサイ
ズ1次決定手段と、 各帯域の帯域信号のパワーを比較するパワー比較手段
と、 上記パワー比較手段の結果に応じて上記ブロックサイズ
1次決定手段で決定したブロックサイズを修正するブロ
ックサイズ修正手段とを有することを特徴とする圧縮デ
ータ記録装置。 - 【請求項2】 上記変化情報抽出手段は、最大ブロック
サイズより長い期間の変化情報を求めることを特徴とす
る請求項1記載の圧縮データ記録装置。 - 【請求項3】 上記ブロックサイズ修正手段は、帯域間
のマスキング量に応じて上記ブロックサイズ1次決定手
段で決定したブロックサイズを修正することを特徴とす
る請求項1記載の圧縮データ記録装置。 - 【請求項4】 過去のブロックサイズを記憶するディレ
イ手段を更に有し、 上記ブロックサイズ修正手段は、上記過去のブロックサ
イズに応じて上記ブロックサイズ1次決定手段で決定し
たブロックサイズを修正することを特徴とする請求項1
記載の圧縮データ記録装置。 - 【請求項5】 上記処理ブロックサイズは、上記帯域信
号を直交変換するための変換長であることを特徴とする
請求項1記載の圧縮データ記録装置。 - 【請求項6】 ディジタルオーディオ信号を情報圧縮す
る際に、入力信号に適応して処理ブロックの長さを可変
とする圧縮データ記録方法において、 入力信号を複数の帯域に分割する帯域分割ステップと、 上記帯域分割ステップで分割した帯域信号のパワーを算
出するパワー算出ステップと、 上記パワー算出ステップで求めたパワーの変化情報を抽
出する変化情報抽出ステップと、 上記変化情報抽出ステップで抽出されたパワーの変化情
報に基づいて1次のブロックサイズを決定するブロック
サイズ1次決定ステップと、 各帯域の帯域信号のパワーを比較するパワー比較ステッ
プと、 上記パワー比較ステップの結果に応じて上記ブロックサ
イズ1次決定ステップで決定したブロックサイズを修正
するブロックサイズ修正ステップとを有することを特徴
とする圧縮データ記録方法。 - 【請求項7】 上記変化情報抽出ステップは、最大ブロ
ックサイズより長い期間の変化情報を求めることを特徴
とする請求項6記載の圧縮データ記録方法。 - 【請求項8】 上記ブロックサイズ修正ステップは、帯
域間のマスキング量に応じて上記ブロックサイズ1次決
定手段で決定したブロックサイズを修正することを特徴
とする請求項6記載の圧縮データ記録方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04794493A JP3186307B2 (ja) | 1993-03-09 | 1993-03-09 | 圧縮データ記録装置及び方法 |
DE69429687T DE69429687T2 (de) | 1993-03-09 | 1994-03-09 | System zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten |
EP94301660A EP0615348B1 (en) | 1993-03-09 | 1994-03-09 | Devices for recording and/or reproducing or transmitting and/or receiving compressed data |
US08/803,530 US5819214A (en) | 1993-03-09 | 1997-02-20 | Length of a processing block is rendered variable responsive to input signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04794493A JP3186307B2 (ja) | 1993-03-09 | 1993-03-09 | 圧縮データ記録装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0738443A JPH0738443A (ja) | 1995-02-07 |
JP3186307B2 true JP3186307B2 (ja) | 2001-07-11 |
Family
ID=12789480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04794493A Expired - Lifetime JP3186307B2 (ja) | 1993-03-09 | 1993-03-09 | 圧縮データ記録装置及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5819214A (ja) |
EP (1) | EP0615348B1 (ja) |
JP (1) | JP3186307B2 (ja) |
DE (1) | DE69429687T2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5731767A (en) * | 1994-02-04 | 1998-03-24 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method |
US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
AU697176B2 (en) * | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
TW429700B (en) | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
TW384434B (en) | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
US6353807B1 (en) | 1998-05-15 | 2002-03-05 | Sony Corporation | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium |
JP2000101439A (ja) | 1998-09-24 | 2000-04-07 | Sony Corp | 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体 |
JP3992419B2 (ja) * | 2000-03-27 | 2007-10-17 | パイオニア株式会社 | 情報再生装置 |
AU2001276588A1 (en) | 2001-01-11 | 2002-07-24 | K. P. P. Kalyan Chakravarthy | Adaptive-block-length audio coder |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7133228B2 (en) * | 2003-10-10 | 2006-11-07 | Seagate Technology Llc | Using data compression to achieve lower linear bit densities on a storage medium |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US9541658B2 (en) * | 2007-08-02 | 2017-01-10 | Westerngeco L. L. C. | Dynamically allocating different numbers of bits to windows of a series representing a seismic trace |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
WO2010075377A1 (en) * | 2008-12-24 | 2010-07-01 | Dolby Laboratories Licensing Corporation | Audio signal loudness determination and modification in the frequency domain |
KR102657912B1 (ko) | 2012-10-01 | 2024-04-15 | 지이 비디오 컴프레션, 엘엘씨 | 향상 레이어에서 변환 계수 블록들의 서브블록-기반 코딩을 이용한 스케일러블 비디오 코딩 |
JP6175148B2 (ja) | 2013-02-20 | 2017-08-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチオーバーラップ部分を使用して符号化済み信号を生成し又は符号化済みオーディオ信号を復号化するための装置及び方法 |
CN104579209A (zh) * | 2014-12-22 | 2015-04-29 | 宁波市鄞州奥创电子有限公司 | 一种信号压缩电路及录音话筒信号压缩器 |
CN110211580B (zh) * | 2019-05-15 | 2021-07-16 | 海尔优家智能科技(北京)有限公司 | 多智能设备应答方法、装置、系统及存储介质 |
Family Cites Families (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3349183A (en) * | 1963-10-29 | 1967-10-24 | Melpar Inc | Speech compression system transmitting only coefficients of polynomial representations of phonemes |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
CH645501GA3 (ja) * | 1981-07-24 | 1984-10-15 | ||
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
JPH07118159B2 (ja) * | 1982-12-06 | 1995-12-18 | ソニー株式会社 | Pcm信号記録方法 |
DE3314384A1 (de) * | 1983-04-21 | 1984-10-25 | Siemens AG, 1000 Berlin und 8000 München | Uebertragungssystem |
JPH07118160B2 (ja) * | 1983-06-18 | 1995-12-18 | ソニー株式会社 | ディジタル情報信号の記録方法 |
US4516241A (en) * | 1983-07-11 | 1985-05-07 | At&T Bell Laboratories | Bit compression coding with embedded signaling |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
JPS61107818A (ja) * | 1984-10-30 | 1986-05-26 | Nec Corp | エントロピ−符号化方式とその装置 |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4748579A (en) * | 1985-08-14 | 1988-05-31 | Gte Laboratories Incorporated | Method and circuit for performing discrete transforms |
DE3688980T2 (de) * | 1986-10-30 | 1994-04-21 | Ibm | Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens. |
AU604807B2 (en) * | 1986-12-19 | 1991-01-03 | Sony Corporation | Data recorder and method |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4882754A (en) * | 1987-08-25 | 1989-11-21 | Digideck, Inc. | Data compression system and method with buffer control |
JP2618916B2 (ja) * | 1987-09-10 | 1997-06-11 | 富士通株式会社 | 動き補償のブロックサイズ決定方法 |
US4964166A (en) * | 1988-05-26 | 1990-10-16 | Pacific Communication Science, Inc. | Adaptive transform coder having minimal bit allocation processing |
JPH0213135A (ja) * | 1988-06-30 | 1990-01-17 | Sony Corp | ディジタル信号伝送装置 |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
EP0370277A3 (de) * | 1988-11-24 | 1991-09-18 | Siemens Aktiengesellschaft | Subband-Übertragungssystem |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
CA2026213C (en) * | 1989-01-27 | 1995-04-04 | Louis Dunn Fielder | Low bit rate transform coder, decoder and encoder/decoder for high-quality audio |
US4932062A (en) * | 1989-05-15 | 1990-06-05 | Dialogic Corporation | Method and apparatus for frequency analysis of telephone signals |
JP2844695B2 (ja) * | 1989-07-19 | 1999-01-06 | ソニー株式会社 | 信号符号化装置 |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
FR2653280B1 (fr) * | 1989-10-13 | 1992-01-10 | France Etat | Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif. |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
EP0428156B1 (en) * | 1989-11-14 | 1996-08-21 | Nec Corporation | Adaptive transform coding by selecting optimum block lengths according to variations between successive blocks |
US5150387A (en) * | 1989-12-21 | 1992-09-22 | Kabushiki Kaisha Toshiba | Variable rate encoding and communicating apparatus |
JP2913731B2 (ja) * | 1990-03-07 | 1999-06-28 | ソニー株式会社 | ディジタルデータの高能率符号化方法 |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
JP3185214B2 (ja) * | 1990-06-12 | 2001-07-09 | 日本電気株式会社 | 改良dctの順変換計算装置および逆変換計算装置 |
JPH0472909A (ja) * | 1990-07-13 | 1992-03-06 | Sony Corp | オーディオ信号の量子化誤差低減装置 |
JP3033156B2 (ja) * | 1990-08-24 | 2000-04-17 | ソニー株式会社 | ディジタル信号符号化装置 |
JP3141241B2 (ja) * | 1990-08-24 | 2001-03-05 | ソニー株式会社 | ディスク記録装置及びディスク再生装置 |
JP2619561B2 (ja) * | 1990-09-28 | 1997-06-11 | 株式会社日立製作所 | 知識処理システム及びその構築方法 |
US5235671A (en) * | 1990-10-15 | 1993-08-10 | Gte Laboratories Incorporated | Dynamic bit allocation subband excited transform coding method and apparatus |
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
EP0506394A2 (en) * | 1991-03-29 | 1992-09-30 | Sony Corporation | Coding apparatus for digital signals |
JP3134338B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル音声信号符号化方法 |
JP3134337B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル信号符号化方法 |
KR100268623B1 (ko) * | 1991-06-28 | 2000-10-16 | 이데이 노부유끼 | 압축 데이타 기록 재생 장치 및 신호 처리 방법 |
ES2164640T3 (es) * | 1991-08-02 | 2002-03-01 | Sony Corp | Codificador digital con asignacion dinamica de bits de cuantificacion. |
US5388209A (en) * | 1991-08-02 | 1995-02-07 | Sony Corporation | Apparatus for high-speed recording compressed digital data with increased compression |
JP3178026B2 (ja) * | 1991-08-23 | 2001-06-18 | ソニー株式会社 | ディジタル信号符号化装置及び復号化装置 |
JP3198550B2 (ja) * | 1991-09-03 | 2001-08-13 | ソニー株式会社 | 圧縮データ記録方法及び圧縮データ記録再生装置 |
JP3158556B2 (ja) * | 1991-09-27 | 2001-04-23 | ソニー株式会社 | ディスク記録装置及びディスク再生装置 |
DE69227570T2 (de) * | 1991-09-30 | 1999-04-22 | Sony Corp., Tokio/Tokyo | Verfahren und Anordnung zur Audiodatenkompression |
JP3141450B2 (ja) * | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
JP3189401B2 (ja) * | 1992-07-29 | 2001-07-16 | ソニー株式会社 | 音声データ符号化方法及び音声データ符号化装置 |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
JP3508146B2 (ja) * | 1992-09-11 | 2004-03-22 | ソニー株式会社 | ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置 |
JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JPH06180948A (ja) * | 1992-12-11 | 1994-06-28 | Sony Corp | ディジタル信号処理装置又は方法、及び記録媒体 |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
-
1993
- 1993-03-09 JP JP04794493A patent/JP3186307B2/ja not_active Expired - Lifetime
-
1994
- 1994-03-09 EP EP94301660A patent/EP0615348B1/en not_active Expired - Lifetime
- 1994-03-09 DE DE69429687T patent/DE69429687T2/de not_active Expired - Lifetime
-
1997
- 1997-02-20 US US08/803,530 patent/US5819214A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69429687T2 (de) | 2002-08-14 |
EP0615348A1 (en) | 1994-09-14 |
EP0615348B1 (en) | 2002-01-23 |
DE69429687D1 (de) | 2002-03-14 |
US5819214A (en) | 1998-10-06 |
JPH0738443A (ja) | 1995-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3186307B2 (ja) | 圧縮データ記録装置及び方法 | |
JP3123286B2 (ja) | ディジタル信号処理装置又は方法、及び記録媒体 | |
JP3173218B2 (ja) | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 | |
JP3123290B2 (ja) | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 | |
KR100276788B1 (ko) | 디지탈 신호 처리 장치와 방법 및 기록 매체 | |
JP3531177B2 (ja) | 圧縮データ記録装置及び方法、圧縮データ再生方法 | |
US5608713A (en) | Bit allocation of digital audio signal blocks by non-linear processing | |
JP3175446B2 (ja) | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 | |
JP3200851B2 (ja) | ディジタル信号処理装置,ディジタル信号処理方法及びデータ記録媒体 | |
JP3185415B2 (ja) | 圧縮データ再生記録装置及び方法 | |
JPH08162964A (ja) | 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体 | |
JP4470304B2 (ja) | 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体 | |
JP3334374B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JP3175456B2 (ja) | ディジタル信号処理装置 | |
JP3186489B2 (ja) | ディジタル信号処理方法及び装置 | |
JP3304717B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JP3334375B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JP3477735B2 (ja) | 圧縮データ変換装置及び方法 | |
JP3561923B2 (ja) | ディジタル信号処理装置 | |
JP3134368B2 (ja) | 圧縮データ記録再生装置 | |
JP3552239B2 (ja) | 圧縮データ記録装置及び方法、並びに圧縮データ再生方法 | |
JP3064522B2 (ja) | 信号処理方法及び圧縮データ記録再生装置 | |
JP3084815B2 (ja) | データ記録方法及び装置 | |
JPH07231259A (ja) | ディジタル信号処理方法及び装置、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010410 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090511 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100511 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100511 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110511 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120511 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130511 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |