[go: up one dir, main page]

JP2001184090A - 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2001184090A
JP2001184090A JP36957199A JP36957199A JP2001184090A JP 2001184090 A JP2001184090 A JP 2001184090A JP 36957199 A JP36957199 A JP 36957199A JP 36957199 A JP36957199 A JP 36957199A JP 2001184090 A JP2001184090 A JP 2001184090A
Authority
JP
Japan
Prior art keywords
signal
spectrum
frequency spectrum
frequency
envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36957199A
Other languages
English (en)
Inventor
Toshikazu Fujinaga
利和 藤長
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUJI TECHNO ENTERPRISE KK
Original Assignee
FUJI TECHNO ENTERPRISE KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUJI TECHNO ENTERPRISE KK filed Critical FUJI TECHNO ENTERPRISE KK
Priority to JP36957199A priority Critical patent/JP2001184090A/ja
Publication of JP2001184090A publication Critical patent/JP2001184090A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 音響信号などに対する従来の符号化・復号化
方式では,圧縮率,品質,演算量を高い水準で同時に満
足することが難しかった。 【解決手段】 本発明は,対象となる信号の周波数スペ
クトルのスペクトル包絡に応じて各周波数成分に割り当
てる割当ビット数を定め,前記割当ビット数に応じて量
子化した周波数スペクトルと前記スペクトル包絡を符号
化することにより,少ない演算量で高い圧縮率と品質と
を確保することを図ったものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,例えば音声信号や
楽音信号を含む音響信号,或いは映像信号など,時間的
又は空間的に変化する対象信号の符号化,復号化を行う
ための装置,及び符号化,復号化を行うためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体に関
するものである。
【0002】
【従来の技術】近年のインターネットの急速な普及に伴
って,一般消費者が利用可能な通信伝送路は多様化しつ
つあり,数Mbps程度の帯域幅を提供することが可能
な通信サービスも幾つか現れはじめている。しかしなが
ら,比較的高速な通信サービスを利用する利用者は,現
在のところ少数であり,多くの利用者が利用可能な帯域
幅はたかだか128kbps程度である。この帯域幅
は,音楽や映像といった,いわゆるマルチメディア情報
を伝送するのには十分なものとは言い難い。前記マルチ
メディア情報をディジタル化する場合の最も基本的な符
号化方式は,線形PCM(Pulse Code Modulation)方式であ
る。前記線形PCM 方式は,時間的又は空間的に離散化さ
れた信号の大きさを等ステップで量子化することによ
り,対象となった信号を符号に置き換えるものである。
前記線形PCM 方式により符号化された情報のビットレー
トは,サンプリング周波数×量子化ビット数×チャンネ
ル数であり,例えばオーディオ用CD(サンプリングレ
ート44.1kHz,量子化ビット数16,ステレオ)
相当の情報のビットレートは,約1411kbpsとな
る。多くの利用者が利用可能な帯域幅は,このビットレ
ートよりずっと小さく,上述した128kbps程度の
帯域幅では,4分程度の楽音信号を得るのに少なくとも
44分程度の時間が必要となる。もちろん,この条件で
は前記楽音信号を実時間で再生することは望めない。但
し,前記マルチメディア情報には,冗長な部分が比較的
多く存在するため,可逆的,非可逆的に情報を高能率符
号化(圧縮)することが可能である。上述のような比較
的低速な通信伝送路を用いる場合,対象となる信号につ
いて高能率符号化を行うことは,実用上欠かせない。例
えば楽音信号について高能率符号化を行う方式の代表的
なものには,国際標準規格MPEG-1(Moving Picture Expe
rts Group)に含まれるMPEG-1 audio layer3(いわゆるMP
3)に規定された復号化方式に対応したものや,NTTヒ
ューマンインターフェース研究所が開発した,TwinVQ(T
ransform-domain Weighted INterleave Vector Quantiz
ation)などがある。これらは,人間の聴覚特性を利用す
るなどして,音質の劣化を抑えながら,1/10〜1/
20程度まで楽音信号を圧縮する。これらの楽音信号に
対する高能率符号化方式は,インターネット等を利用し
た音楽配信サービスを普及させる主因となり,また半導
体メモリを用いた携帯用再生端末の製品化も可能にし
た。前記MP3 や,TwinVQを採用した携帯用再生端末は,
64Mバイト程度のメモリ容量があれば,CD相当の音
質でも1時間強の録音が可能であり,十分実用的なもの
となっている。また,高能率符号化を行うことは,限り
ある通信伝送路の資源を節約することにもなる。例えば
携帯電話などに代表される移動体無線通信の分野では,
無線帯域の制限を考慮して,ADPCM(Adaptive Different
ial Pulse Code Modulation)方式や,各種CELP(Code Ex
cited Linear Prediction)方式などに従って,音声信号
の符号化が行われてきた。音声信号を前記線形PCM 方式
により符号化する場合,少なくとも64kbpsの帯域
幅が必要とされているが,前記ADPCM 方式により符号化
された音声信号のビットレートは,32kbpsであ
り,前記各種CELP方式により符号化された音声信号のビ
ットレートは,4kbps〜16kbps程度である。
前記各種CELP方式により符号化した場合には,前記線形
PCM 方式により符号化した場合と較べると,かなり低ビ
ット化され,必要な無線周波数帯域が節約されることに
なる。また,このような音声通信の符号化方式は,前記
移動体無線通信の分野だけでなく,IP(Internet Protoc
l)ネットワークを用いて音声通信を行うVOIP(Voice Ove
r IP) にも採用されており,インターネットを利用した
長距離電話通信の低価格サービスの提供が期待されてい
る。
【0003】
【発明が解決しようとする課題】ところで,前記楽音信
号や音声信号を含む音響信号に対する高能率符号化処理
を行うにあたって,主要な評価基準となるものに,圧縮
率,品質,演算量がある。前記圧縮率は,もちろん,符
号化前後でのビットレートの比であり,前記品質は,符
号化された符号化信号を復号化して再生した場合の感覚
的評価である。また,前記演算量は,信号の符号化や復
号化を行う際に必要となる演算量であり,処理の複雑さ
に関係する。上述したような各種の高能率符号化方式
(及びそれらに対応した復号化方式)は,用途に応じた
適当なバランスの元で前記基準を満足するが,ある程度
の音質と高い圧縮率を得るために処理が複雑化し,前記
演算量が増大する傾向にあり,前記3つの評価基準の全
てを高い水準で満足することは難しい。この問題は,前
記音響信号のように時間的に変化する信号だけでなく,
静止画或いは動画像に含まれる画像のように空間的に変
化する信号について高能率符号化を行う場合でも,同様
に発生する。本発明は,このような従来の技術における
課題を解決するために,信号符号化装置,及び信号符号
化プログラム,並びに信号復号化装置,及び信号復号化
プログラムを改良し,品質を維持しながら少ない演算量
で高い圧縮率を得ることのでる信号符号化装置,及び信
号符号化プログラムを記録したコンピュータ読み取り可
能な記録媒体,並びに前記信号符号化装置や前記信号符
号化プログラムを用いて生成した符号化信号を少ない演
算量で復号化し高い品質の再生を行うことが可能な信号
復号化装置,及び信号復号化プログラムを記録したコン
ピュータ読み取り可能な記録媒体を提供することを目的
とするものである。
【0004】
【課題を解決するための手段】前記目的を達成するため
に,請求項1に係る発明は,時間的又は空間的に変化す
る対象信号の周波数スペクトルを求める周波数スペクト
ル演算手段と,前記周波数スペクトル演算手段により演
算された前記対象信号の周波数スペクトルからスペクト
ル包絡を抽出するスペクトル包絡抽出手段と,前記スペ
クトル包絡抽出手段により抽出された前記スペクトル包
絡に応じて,前記対象信号の周波数スペクトルの各周波
数成分に割り当てる割当ビット数を定める割当ビット数
決定手段と,前記割当ビット数決定手段により定められ
た前記割当ビット数に基づいて,前記対象信号の周波数
スペクトルを量子化する周波数スペクトル量子化手段
と,前記周波数スペクトル量子化手段により量子化され
た前記対象信号の周波数スペクトルに関する周波数スペ
クトル情報と,前記スペクトル包絡に関するスペクトル
包絡情報とを符号化した符号化信号を生成する符号化信
号生成手段とを具備してなる信号符号化装置として構成
されている。前記請求項1に記載の信号符号化装置によ
り生成される符号化信号には,時間的又は空間的に変化
する対象信号の周波数スペクトルに関する周波数スペク
トル情報と前記対象信号のスペクトル包絡に関するスペ
クトル包絡情報とが含まれる。前記周波数スペクトル情
報は,前記スペクトル包絡に応じて割り当てられた割当
ビット数に基づいて前記対象信号の周波数スペクトルが
量子化されて符号化されたものであり,そのビットレー
トは,前記対象信号を線形PCM 方式により符号化した場
合と較べてずっと少なく,スペクトル包絡を利用する前
記MP3 やTwinVQなどの高能率符号化方式と同等かそれよ
り少ない。また,周波数スペクトルをほぼそのまま符号
化するため,前記対象信号の品質の劣化を抑えることが
できる。しかも,時間領域から周波数領域への変換演算
は,符号化に当たって一度だけ行えばよく,演算量が少
なくてすみ,短時間で符号化を行うことができる。
【0005】また,請求項2に係る発明は,時間的又は
空間的に変化する対象信号の周波数スペクトルに関する
周波数スペクトル情報と前記対象信号のスペクトル包絡
に関するスペクトル包絡情報とを符号化した符号化信号
から前記スペクトル包絡情報を取得し,該取得した前記
スペクトル包絡情報に基づいて前記対象信号の周波数ス
ペクトルの各周波数成分に対する前記スペクトル包絡を
復元するスペクトル包絡復元手段と,前記スペクトル包
絡復元手段により復元された前記スペクトル包絡から,
前記対象信号の周波数スペクトルの各周波数成分に割り
当てられた割当ビット数を取得する割当ビット数取得手
段と,前記符号化信号から前記周波数スペクトル情報を
取得し,前記割当ビット数取得手段により取得された前
記割当ビット数に基づいて,前記取得した前記周波数ス
ペクトル情報から前記対象信号の周波数スペクトルを復
号化する周波数スペクトル復号化手段と,前記周波数ス
ペトル復号化手段により復号化された前記対象信号の周
波数スペクトルに基づいて,前記対象信号を復元する信
号復元手段とを具備してなる信号復号化装置である。前
記請求項2に記載の発明によれば,前記請求項1に記載
の信号符号化装置により生成された符号化信号を復号化
して,時間的又は空間的に変化する対象信号を復元する
のに好適な信号復号化装置を提供することができる。前
記請求項2に記載の信号復号化装置において,復号化の
ために行われる主な演算は,周波数領域から時間領域に
変換する一度だけの逆変換の処理と割当ビット数の取得
に必要な比較的単純な演算のみであるから,短時間で前
記対象信号の復号化を行うことができ,また実時間再生
を行うのも容易になる。
【0006】また,請求項3に係る発明は,コンピュー
タに,空間的又は時間的に変化する対象信号の周波数ス
ペクトルを求める手順,前記対象信号の周波数スペクト
ルからスペクトル包絡を抽出する手順,前記スペクトル
包絡に応じて,前記対象信号の周波数スペクトルの各周
波数成分に割り当てる割当ビット数を定める手順,前記
割当ビット数に基づいて,前記対象信号の周波数スペク
トルを量子化する手順,前記対象信号の周波数スペクト
ルに関する周波数スペクトル情報と,前記スペクトル包
絡を定めるスペクトル包絡情報とを符号化した符号化信
号を生成する手順を実行させるための信号符号化プログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
ある。前記請求項3に記載のコンピュータ読み取り可能
な記録媒体は,前記請求項1に記載の信号符号化装置を
コンピュータにより実現するのに好適な信号符号化プロ
グラムを提供する。前記請求項3に記載の信号符号化プ
ログラムに従って,コンピュータにより生成させた符号
化信号には,前記請求項1に記載の信号符号化装置と同
様に,時間的又は空間的に変化する対象信号の周波数ス
ペクトルに関する周波数スペクトル情報と前記対象信号
のスペクトル包絡に関するスペクトル包絡情報とが含ま
れる。前記周波数スペクトル情報は,前記スペクトル包
絡に応じて割り当てられた割当ビット数に基づいて前記
対象信号の周波数スペクトルが量子化されて符号化され
たものであり,その伝送や記録に必要な情報量は,前記
対象信号を線形PCM 方式により符号化した場合と較べて
ずっと少なく,スペクトル包絡を利用する前記MP3 やTw
inVQなどの高能率符号化方式と同等かそれよりも少な
い。また,周波数スペクトルをほぼそのまま符号化する
ため,前記対象信号の劣化を抑えることができる。しか
も,スペクトル分析に伴うFFT などの演算は,符号化に
当たって一度だけ行えばよく,コンピュータの演算量は
少なくてすみ,短時間で符号化を行うことができる。
【0007】また,請求項4に係る発明は,コンピュー
タに,時間的又は空間的に変化する対象信号の周波数ス
ペクトルに関する周波数スペクトル情報と前記対象信号
のスペクトル包絡に関するスペクトル包絡情報とを符号
化した符号化信号から前記スペクトル包絡情報を取得
し,前記スペクトル包絡情報に基づいて前記対象信号の
周波数スペクトルの各周波数成分に対する前記スペクト
ル包絡を復元する手順,前記スペクトル包絡から,前記
対象信号の周波数スペクトルの各周波数成分に割り当て
られた割当ビット数を取得する手順,前記符号化信号か
ら前記周波数スペクトル情報を取得し,前記割当ビット
数に基づいて,前記周波数スペクトル情報から前記対象
信号の周波数スペクトルを復号化する手順,前記対象信
号の周波数スペクトルに基づいて前記対象信号を復元す
る手順を実行させるための信号復号化プログラムを記録
したコンピュータ読み取り可能な記録媒体である。前記
請求項4に記載のコンピュータ読み取り可能な記録媒体
によれば,前記請求項1に記載の信号符号化装置によっ
て生成された符号化信号を,又は前記請求項3に記載の
信号符号化プログラムに従ってコンピュータにより生成
された符号化信号を復号化して,時間的又は空間的に変
化する対象信号を復元するのに好適な信号復号化プログ
ラムを提供することができる。前記請求項4に記載の信
号復号化プログラムにおいても,周波数領域から時間領
域に変換する逆変換の処理は,復号化を行うにあたって
一度行うだけでよいから,コンピュータが行う全体の演
算量は少なくてすみ,短時間で前記対象信号の復号化を
行うことができ,また比較的低速なコンピュータを用い
て実時間再生を行うことも可能となる。
【0008】
【発明の実施の形態】以下,添付図面を参照して,本発
明の実施の形態につき説明し,本発明の理解に供する。
尚,以下の実施の形態は,本発明の具体的な例であっ
て,本発明の技術的範囲を限定する性格のものではな
い。本発明の実施の形態に係る符号化装置1は,図1に
示す如く,時間的に変化する音声信号,楽音信号,又は
その両方を含む音響信号(対象信号の一例)の周波数ス
ペクトルを求める周波数スペクトル演算部103と,前
記周波数スペクトル演算部103により演算された前記
音響信号の周波数スペクトルから,スペクトル包絡を抽
出するスペクトル包絡抽出部104と,前記スペクトル
包絡抽出部104により抽出された前記スペクトル包絡
に応じて,前記音響信号の周波数スペクトルの各周波数
成分に割り当てる割当ビット数を定める割当ビット数決
定部105と,前記割当ビット数決定部105により定
められた前記割当ビット数に基づいて,前記音響信号の
周波数スペクトルを量子化する周波数スペクトル量子化
部106と,前記周波数スペクトル量子化部106によ
り量子化された前記音響信号の周波数スペクトルに関す
る周波数スペクトル情報と,前記スペクトル包絡に関す
るスペクトル情報とを符号化した符号化信号を生成する
符号化信号生成部107とを具備する。また,本発明の
実施の形態に係る信号復号化装置2は,図2に示す如
く,時間的に変化する前記音響信号の周波数スペクトル
に関する周波数スペクトル情報と前記2響信号のスペク
トル包絡に関するスペクトル包絡情報とを符号化した符
号化信号から前記スペクトル包絡情報を取得し,該取得
した前記スペクトル包絡情報に基づいて前記音響信号の
周波数スペクトルの各周波数成分に対する前記スペクト
ル包絡を復元するスペクトル包絡復元部203と,前記
スペクトル包絡復元部203により復元された前記スペ
クトル包絡から,前記音響信号の周波数スペクトルの各
周波数成分に割り当てられた割当ビット数を取得する割
当ビット数取得部204と,前記符号化信号から前記周
波数スペクトル情報を取得し,前記割当ビット数取得部
204により取得された前記割当ビット数に基づいて,
前記取得した前記周波数スペクトル情報から前記音響信
号の周波数スペクトルを復号化する周波数スペクトル復
号化部205と,前記周波数スペクトル復号化部205
により復号化された前記音響信号の周波数スペクトルに
基づいて前記音響信号を復元する信号復元部206とを
具備する。
【0009】また,本発明の実施の形態に係る信号符号
化プログラムは,コンピュータに,図3に示すような,
前記音響信号の周波数スペクトルを求める手順S10
1,前記音響信号の周波数スペクトルからスペクトル包
絡を抽出する手順S102,前記スペクトル包絡に応じ
て,前記音響信号の周波数スペクトルの各周波数成分に
割り当てる割当ビット数を定める手順S103,前記割
当ビット数に基づいて,前記音響信号の周波数スペクト
ルを量子化する手順S104,前記音響信号の周波数ス
ペクトルに関する周波数スペクトル情報と,前記スペク
トル包絡を定めるスペクトル包絡情報とを符号化した符
号化信号を生成する手順S104を実行させるためのも
のであって,この信号符号化プログラムを記録した例え
ばCD−ROMが,本発明の実施の形態に係る信号化符
号化プログラムを記録したコンピュータ読み取り可能な
記録媒体の具体例である。また,本発明の実施の形態に
係る信号復号化プログラムは,コンピュータに,図4に
示すような,時間的に変化する前記音響信号の周波数ス
ペクトルに関する周波数スペクトル情報と前記音響信号
のスペクトル包絡に関するスペクトル包絡情報とを符号
化した符号化信号から前記スペクトル包絡情報を取得
し,該取得した前記スペクトル包絡情報に基づいて前記
音響信号の周波数スペクトルの各周波数成分に対する前
記スペクトル包絡を復元する手順S201,前記スペク
トル包絡から,前記音響信号の周波数スペクトルの各周
波数成分に割り当てられた割当ビット数を取得する手順
S202,前記符号化信号から前記周波数スペクトル情
報を取得し,前記割当ビット数に基づいて,前記周波数
スペクトル情報から前記音響信号の周波数スペクトルを
復号化する手順S203,前記音響信号の周波数スペク
トルに基づいて前記音響信号を復元する手順S204を
実行させるためのものであって,この信号復号化プログ
ラムを記録した例えばCD−ROMが,本発明の実施の
形態に係る信号復号化プログラムを記録したコンピュー
タ読み取り可能な記録媒体の具体例である。
【0010】そして,前記信号符号化装置1,及び前記
信号復号化装置2は,例えば前記信号符号化プログラ
ム,及び信号復号化プログラムを実行可能にしたコンピ
ュータとしてそれぞれ具体化される。前記コンピュータ
は,図5に示す如く,キーボードやマウス等の入力装置
501,ディスプレイなどの出力装置502,CD−R
OMドライブ503,ハードディスクドライブ504,
RAM505,演算装置506,スピーカ5071及び
マイク5072が接続された音響入出力用ボード50
7,LANボードやモデム等の通信装置508などを有
する標準的な構成を備えるものである。前記コンピュー
タにおいて,前記信号符号化プログラム,及び信号復号
化プログラムのいずれか一方又は両方が圧縮状態で記録
されたCD−ROMが,前記CD−ROMドライブ50
3に挿入され,使用者が入力装置501を用いて与えた
指示に従って前記CD−ROM中のインストールプログ
ラムが実行されると,前記CD−ROMから読み出され
た前記信号符号化プログラム,及び信号復号化プログラ
ムのいずれか一方又は両方が,ハードディスクドライブ
504などの記憶媒体上に実行可能な状態に展開され
る。前記信号符号化プログラム,及び前記信号復号化プ
ログラムのいずれか一方又は両方の実行指示が,入力装
置501を介して使用者からあった場合には,前記ハー
ドディスクドライブ504上などに展開された前記信号
符号化プログラム,及び前記信号復号化プログラムのい
ずれか一方又は両方の,一部又は全部が前記RAM50
5や前記ハードディスクドライブ504などから読み出
され,前記演算装置506により,前記信号符号化プロ
グラム,及び前記信号復号化プログラムのいずれか一方
又は両方が実行される。
【0011】以下,前記信号符号化装置1,及び前記信
号復号化装置2が,同一のコンピュータによって実現さ
れた場合を例にして,前記信号符号化装置1,前記信号
復号化装置2,前記信号符号化プログラム,及び前記信
号復号化プログラムの詳細を説明する。前記信号符号化
プログラムが実行され,前記コンピュータが前記信号符
号化装置1として動作すると,はじめに例えば符号化対
象となる前記音響信号の指定や,符号化後のビットレー
トの指定など各種設定が可能なダイアログが前記出力装
置502に表示される。前記符号化後のビットレートの
指定は,前記信号符号化装置1による符号化処理の際に
利用可能なビット数の上限を定めるのに用いられる。ま
た,符号化対象となる前記音響信号は,そのときにマイ
クから入力するものや,既に何らかの符号化形式により
ディジタル化され,前記ハードディスクドライブ504
上に格納されているものなどである。前記音響信号をマ
イクから入力することが使用者により選択された場合に
は,前記出力装置502に,取り込み時の量子化ビット
数や,サンプリングレート,ステレオ・モノラルの区別
などの情報を使用者が指定するためのダイアログが表示
される。使用者が,前記入力装置501を用いて前記取
り込み時に必要な情報を与え,更に取り込みの指示を与
えると,マイクから入力される前記音響信号に対して,
符号化処理が開始される。前記信号符号化装置1におい
て,マイクなどから入力端子101を介して入力された
前記音響信号は,A/D変換器102を介して前記周波
数スペクトル演算部103に供給される。前記信号符号
化装置1が前記コンピュータによって実現されるこの例
では,前記入力端子101に接続されるマイクとして,
例えば前記音響入出力用ボード507に接続されたマイ
ク5072が,前記A/D変換器102には,前記音響
入出力用ボード507に実装された図示しないA/D変
換器が用いられる。前記音響入出力用ボード507に実
装されたA/D変換器から出力された信号は,実際に
は,前記ハードディスクドライブ504上などに一時的
に格納される。前記A/D変換器102から出力され前
記ハードディスクドライブ504上などに一時的に格納
されたディジタル化後の前記音響信号は,前記線形PCM
方式により符号化したものに対応する。CD相当の取り
込み条件であれば,既述の通り,そのビットレートは,
約1411bpsである。前記ディジタル化後の前記音
響信号は,前記RAM505などに格納された前記信号
符号化プログラムに従って,前記周波数スペクトル演算
部103として動作する前記演算装置506によって読
み出される。
【0012】前記周波数スペクトル演算部103は,入
力された前記音響信号についてFFT(Fast Fourier Tr
ansform)演算を行い,前記音響信号の周波数スペクトル
を求める。前記周波数スペクトル演算部103に供給さ
れる前記音響信号は,予め時系列に分割されたものであ
る。分割の際には各フレーム間で一部が重複するように
処理される。時系列に分割された前記音響信号のフレー
ムの幅は,20ms〜60ms程度のフレーム幅を採用
することが多い他の符号化方式よりも長めの100ms
程度が適当である。これは,本実施の形態に係る符号化
方式が,周波数スペクトルから抽出したスペクトル包絡
に基づいて各周波数成分の割当ビット数を定め,その割
当ビット数に応じて各周波数成分を量子化することによ
り,低ビットレート化を行うため,前記スペクトル包絡
を良好に抽出する必要があるということに起因する。前
記フレーム幅は各フレームに対して一定である必要はな
く,また対象となるフレームの信号に応じて動的に変化
させるようにしてもよい。前記音響信号の各フレームに
は,必要に応じて前記FFT演算の前にハミング窓など
の窓関数が掛けられる。前記周波数スペクトル演算部1
03は,各フレームについて前記FFT演算を行い,周
波数領域における前記音響信号のパワー成分と位相成分
とを定める。前記音響信号に対するサンプリングレート
が44.1kHzである場合,前記FFT演算の際のサ
ンプル点数は,4096が適当である。前記フレーム幅
に対する設定や,窓関数の有無,窓関数の種類などの情
報は,前記出力装置502にダイアログを表示させるな
どして,使用者が適宜変更し得るようにしてもよい。
尚,前記周波数スペクトル演算部103が行う上述の通
りの処理が,前記信号符号化プログラムが前記コンピュ
ータに実行させる手順S101に対応する処理である。
前記周波数スペクトル演算部103により定められた前
記音響信号の周波数スペクトルのパワー成分と位相成分
は,前記RAM505や前記演算装置506などの一次
キャッシュなどに一時的に保持される。前記演算装置5
06は,前記信号符号化プログラムに従って,次にスペ
クトル包絡抽出部104として動作する。前記スペクト
ル包絡抽出部104は,前記音響信号の周波数スペクト
ルのパワー成分から,スペクトル包絡を抽出する。LP
C(Linear prediction code)などを用いることも可能で
あるが,本実施の形態に係る信号符号化装置(及び信号
符号化プログラム)の場合,スペクトル包絡を定めるの
に必要な情報量ができるだけ少なく,また周波数−強度
の2次元空間で前記スペクトル包絡が占める面積ができ
るだけ小さくなることが重要である。
【0013】本実施の形態に係る信号符号化装置(及び
信号符号化プログラム)に,より適したスペクトル包絡
抽出の具体的な演算手順を図6に示す。図6に示す通
り,まず,前記パワー成分の周波数領域を複数の周波数
帯に分割し,各周波数帯における前記パワー成分の最大
値を抽出する(S1001)。前記パワー成分の周波数
領域の分割数は,圧縮率に関係するので,予め使用者な
どにより指定されたビットレートに従って定められる。
次に,前記各周波数帯における前記パワー成分の最大値
を結んだ仮のスペクトル包絡を設定する(S100
2)。次に,前記パワー成分のうち前記仮のスペクトル
包絡よりも著しく大きい周波数成分があるか否かを,全
周波数領域について探索する(S1003)。前記仮の
スペクトル包絡より当該周波数成分の大きさが著しく大
きいか否かは,例えば予め設定したしきい値よりその差
が大きいか否かに基づいて判別すればよい。次に,前記
仮のスペクトル包絡よりも著しく大きいと判断された周
波数成分が存在する場合には,当該周波数成分と前記各
周波数帯における前記パワー成分の最大値を,前記仮の
スペクトル包絡よりも著しく大きいと判断された周波数
成分が存在しない場合には,前記各周波数帯における前
記パワー成分の最大値のみを,抽出しようとするスペク
トル包絡のピーク点として設定する(S1004)。
尚,スペクトル包絡を得るための各周波数帯の大きさは
同じである必要はなく,周波数に応じて異ならせてもよ
い。前記ピーク点の点数は,低中周波数領域に多い方が
人間の聴覚特性上好ましい。高周波数領域の音はさほど
精密に再現しなくても,聴感上問題は少ない。前記スペ
クトル包絡のピーク点が設定されたら,次に,隣り合う
ピーク点を支点として糸を垂らす要領で,両ピーク点間
にある周波数スペクトルの谷の部分を表現する。谷の部
分を表現するために使用する関数を,以下,谷関数とい
う。前記谷関数の具体例としては,正弦波関数L=A×
sin(ω×n)や,正弦波の平方根関数L=A×√
(sin(ω×n)),正弦波のべき乗関数L=A×s
inc (ω×n),放物線関数L=A×n2 +b,高次
関数,懸垂曲線L=A×cosh(ω×n)などが挙げ
られる。但し,nは両ピーク点間にある(周波数軸上
の)各サンプルを一方のピーク点から数え始めたときの
サンプル数であり,Lは両ピーク点間にある各サンプル
の大きさである。例えば前記正弦波関数を前記谷関数と
して用いる場合,両ピーク点間のスペクトル包絡を,次
式(1)に従って表す。 L=a×n−A×sin(ω×n)+C (1) 図7に示す通り,上式(1)におけるNは一方のピーク
点P1から数え始めたときの他方のピーク点P2までの
サンプル数であって,0≦n≦N,ω=π/Nである。
また,aは両ピーク点P1,P2間の前記仮のスペクト
ル包絡L′の傾き,Cは一方のピーク点P1の大きさで
ある。尚,前記ピーク点Pの大きさが,両ピーク点P間
にあるサンプル数と較べてかなり大きい場合,即ち前記
周波数スペクトルの谷部分が深くなる場合には,前記正
弦波関数よりも,正弦波のべき乗関数を用いる方がよ
い。上式(1)に含まれる前記谷関数の係数Aを変化さ
せ,両ピーク点P1,P2間のスペクトル包絡を定め
る。例えば両ピーク点P1,P2間にあるサンプルのう
ち,前記仮のスペクトル包絡L′よりも小さい,いずれ
かのサンプルE1の大きさと前記スペクトル包絡の値L
とが一致したときの係数Aを用いた上式(1)によって
表されるスペクトル包絡を,抽出しようとするスペクト
ル包絡の一部(両ピーク点間のスペクトル包絡)として
定める(S1005)。前記手順S1005を,全ての
ピーク点間に対して繰り返すことによって(S100
6),例えば図8に示すような各周波数成分に対するス
ペクトル包絡が得られる。図8に示す通り,上述の手順
に従って抽出したスペクトル包絡は,各周波数成分の大
きさよりも所定値以上小さくなることはなく,また周波
数−強度2次元空間で前記スペクトル包絡が占める面積
が小さい。
【0014】ところで,上述の通りの好適なスペクトル
包絡を得るためには,前記ピーク点間が広く,前記谷部
分が深い方がよい。既述した100ms程度のフレーム
幅が好適であるという理由は,この点に関係する。20
ms程度のフレーム幅を採用した場合でも,好適なスペ
クトル包絡を得るには,100ms程度の時と同等の情
報量が必要となる。しかしながら,フレーム毎に復号化
のためのスペクトル包絡の情報が必要となるので,フレ
ーム幅が小さくなればなるほど,スペクトル包絡の情報
量が増加してしまう。一方,フレーム幅を大きくして
も,前記ピーク点の数はさほど増えず,前記谷部分の深
さは大きくなる。これは,例えば有声音声の場合,基本
周波数及びその高調波がピークとして現れるが,フレー
ム幅を大きくすると,ピーク間の間隔が周波数でみたと
きには同じであっても,次数でみたときには広がるから
である。また,楽音の場合も,ランダムに周波数成分が
折り重なっている訳ではなく,12段階の音程により規
則性があり,楽器の音も基本周波数及びその高調波で成
り立っている場合が多く,ほぼ有声音声の場合と同様で
ある。また,100ms程度のフレーム幅では,信号の
定常性が増すという理由もある。尚,前記スペクトル包
絡抽出部104が行う上述の通りの処理が,前記信号符
号化プログラムが前記コンピュータに実行させる手順S
102に対応する処理である。
【0015】前記スペクトル包絡抽出部104により抽
出された前記スペクトル包絡は,前記RAM505や前
記演算装置506の一次キャッシュなどに一時的に保持
される。次に前記演算装置506は,前記信号符号化プ
ログラムに従って,割当ビット数決定部105として動
作する。前記割当ビット数決定部105は,前記スペク
トル包絡の各値に応じたビット数を各周波数成分に割り
当てる。基本的には,前記スペクトル包絡の各値が大き
い周波数成分ほど,多くのビットを割り当てる。例え
ば,前記スペクトル包絡の各値を対数化する。対数化は
必須ではないが,ビットの持つ特性上最も好ましい。次
に,予め設けておいた下限値が0になるように,前記ス
ペクトル包絡を正規化する。次に,対数化した前記スペ
クトル包絡の各値の総和を,複数に分割した各周波数帯
毎に求める。次に,各周波数帯における前記スペクトル
包絡の各値の和が,当該周波数帯の総ビット数と等しく
なるような係数(=総ビット数/スペクトル包絡の各値
の和)を,当該周波数帯における前記スペクトル包絡の
各値に乗じ,その値に応じて各周波数成分に割り当てる
ビット数を算出する。予め定められた全周波数領域にお
ける全総ビット数を,複数の周波数帯毎に配分するの
は,ある周波数領域に大きな成分が集中した場合に,他
の周波数領域に割り当てるビット数が極端に少なくなる
ことを防止するためである。大きな成分が集中する周波
数領域の近くの領域にある成分は,マスク効果によって
人間が知覚し難いが,離れた領域にある成分は,比較的
知覚し易いからである。ビット数配分の割合は予め定め
ておいてもよいし,符号化の対象となった前記音響信号
の周波数スペクトルに応じて定めるようにしてもよい。
基本的には,低中領域における周波数帯に,より多くの
ビットを配分した方が,人間の聴覚特性に合致する。前
記スペクトル包絡の各値からビット数を定める際,少数
点以下は切り捨てるか,若しくは四捨五入等の丸めを行
う。また少ないビット数には丸め,多いビット数には切
り捨てを適用するなど,ビット数に応じて異ならせても
よい。また,必要以上に多くのビットを割り当てても,
音質が向上することはないので,ビットの浪費を防止す
るため,例えば各周波数帯毎に割り当てるビット数の上
限値を定めておき,前記スペクトル包絡の各値に応じた
ビット数が前記上限値を越える場合には,当該周波数成
分に応じたビット数の代わりに前記上限値を割り当て
る。更に,必要に応じて,切り捨て丸め等により余った
ビット数に対して,その周波数帯に配分した総ビット数
と実際に配分したビット数の合計が等しくなるか,予め
設けた範囲内に入るまで,上述した正規化の手順から繰
り返すか,前記係数を調整する。尚,前記割当ビット数
決定部105が行う上述の通りの処理が,前記信号符号
化プログラムが前記コンピュータに実行させる手順S1
03に対応する処理である。
【0016】前記割当ビット数決定部105により定め
られた割当ビット数は,前記RAM505や前記演算装
置506の一次キャッシュなどに一時的に保持される。
次に前記演算装置506は,前記信号符号化プログラム
に従って,周波数スペクトル量子化部106として動作
する。前記周波数スペクトル量子化部106は,前記周
波数スペクトルのパワー成分を量子化するパワー成分量
子化部1061,位相成分を量子化する位相成分量子化
部1062,及び前記パワー成分が0となる周波数成分
を位相成分から排除するための0成分排除部1063か
らなる。前記パワー成分量子化部1061には,前記周
波数スペクトル演算部103から前記パワー成分が供給
されており,前記割当ビット数決定部105から供給さ
れた割当ビット数に従って,前記パワー成分の各周波数
成分が線形的又は非線形的に量子化される。線形的に量
子化を行う場合には,各周波数成分の量子化後の大きさ
は,当該周波数成分の大きさと当該周波数スペクトル成
分のスペクトル包絡との比に前記割当ビット数で表現で
きる最大値を乗じた値によって表される。量子化演算の
際に発生した小数点については,四捨五入等の丸めを行
う。但し,前記割当ビット数が少ない場合には,量子化
ひずみが大きくなる可能性がある。このため,例えば前
記割当ビット数が1ビットの場合と,2ビット以上の場
合とで,次式(2a),(2b)の通り丸め方を異なら
せるなどして,量子化ひずみを低減するようにした方が
好ましい。 R=Int(Sp/En+0.3) (2a) R=Int(Sp×(2Ba−1)/En+0.5) (2b) ここで,Rは量子化後の当該周波数成分の大きさ,Sp
は当該周波数成分の大きさ,Enは当該周波数成分のス
ペクトル包絡,Baは当該周波数成分の割当ビット数,
ntは整数化関数である。また,前記位相成分量子化部
1062には,前記周波数スペクトル演算部103から
前記位相成分が供給されており,例えば前記パワー成分
量子化部1061と同じく前記割当ビット数決定部10
5から供給された割当ビット数に従って,前記位相成分
の各周波数成分が量子化される。但し,前記パワー成分
が0となる周波数成分は復元されないので,前記パワー
成分量子化部1061から出力されたパワー成分に従っ
て,予め0成分排除部1063により,前記位相成分量
子化部1062が量子化する対象から,当該周波数成分
が除外される。前記位相成分は,復元した楽音(特に打
撃音等)の明瞭さに大きな影響を与えるため,1ビット
や2ビットなどの少ないビット数しか割り当てられなか
った周波数成分に対して,余計に1ビット〜数ビットの
ビットを付加して,前記位相成分の再現性を向上させる
ようにしてもよい。また,前記位相成分では,極近辺の
成分の位相差が特に重要となるため,絶対的な値を量子
化するより,隣のサンプルとの差分を量子化するように
する方が好ましい。但し,隣のサンプルとの差分を量子
化する場合には,演算誤差等により絶対的な値からずれ
が生じる恐れがある。このため,隣のサンプルとの差分
を量子化する場合には,差分の対象を,隣のサンプルの
絶対的な値ではなく,量子化した値の累積値とした方が
よい。尚,前記周波数スペクトル量子化部106が行う
上述の通りの処理が,前記信号符号化プログラムが前記
コンピュータに実行させる手順S104に対応する処理
である。
【0017】上述の通り量子化された前記パワー成分と
前記位相成分は,量子化ビット数こそ各周波数成分で異
なるものの,ほぼ前記周波数スペクトルそのものであ
る。また,量子化ビット数は前記スペクトル包絡に応じ
て変化するが,各周波数成分よりも所定値以上小さくな
ることがないように抽出した前記スペクトル包絡は,マ
スク効果など人間の聴覚特性に結果的に合致しており,
品質上量子化前後で失われる情報は極僅かである。前記
周波数スペクトル量子化部106により量子化された前
記パワー成分と前記位相成分は,前記RAM505や前
記演算装置506の一次キャッシュなどに一時的に保持
される。次に前記演算装置506は,前記信号符号化プ
ログラムに従って,符号化信号生成部107として動作
する。前記符号化信号生成部107では,前記スペクト
ル包絡抽出部104により抽出されたスペクトル包絡,
前記パワー成分量子化部1061により量子化されたパ
ワー成分,及び前記位相成分量子化部1062により量
子化された位相成分を基に,前記スペクトル包絡に関す
るスペクトル包絡情報,前記パワー成分に関するパワー
成分情報,前記位相成分に関する位相成分情報を符号化
した符号化信号が生成される。前記スペクトル包絡情報
は,前記スペクトル包絡を定めるのに必要な情報であ
る。前記スペクトル包絡を上述の好適な手順で抽出した
場合には,前記スペクトル包絡情報は,前記ピーク点の
大きさ,前記ピーク点の周波数,前記谷関数の種類,前
記谷関数のパラメータを含む。上述の4つのパラメータ
は,ほぼ前記ピーク点の点数に比例する数だけ必要とな
る。即ち,前記ピーク点の点数を変更することによっ
て,圧縮率を変化させることができる。各ピーク点の大
きさは,前記パワー成分の量子化とは別途に量子化され
る。各ピーク点の大きさを量子化する際の量子化ビット
数は,例えば予め定められたものを用いればよい。この
各ピーク点に対する量子化ビット数も,複数の周波数帯
毎に定めるようにしてもよい。複数の周波数帯毎に前記
ピーク点の大きさを量子化する場合,前記パワー成分の
量子化と同様,低中周波数領域に配分するビット数を多
くした方がよい。また,前記ピーク点の周波数は,絶対
周波数よりも隣のピーク点との差分周波数で表現した方
が,必要なビット数を低減させることができる。前記谷
関数の種類は,複数の谷関数を使用する場合にのみ必要
で,予め谷関数を定める場合には,省略可能である。ま
た,前記谷関数のパラメータは,前記谷関数の種類によ
り,一つの場合もあるし,複数の場合もある。前記正弦
波関数やその平方根関数を用いる場合には,前記パラメ
ータは,振幅Aの一つのみでよい。この振幅は,2〜4
ビットの量子化ビット数で表現するのが適当である。前
記パワー成分情報は,基本的に,上述のようにして量子
化されたパワー成分そのものである。但し,前記ピーク
点の大きさや,前記ピーク点の周波数は,前記スペクト
ル包絡情報に含まれるので,前記パワー成分から取り除
くことが可能である。また,前記位相成分情報も,基本
的には,上述のようにして量子化された位相成分そのも
のである。もちろん,上述のように量子化された前記パ
ワー成分や前記位相成分に何らかの符号化処理を施した
ものを前記パワー成分情報や前記位相成分情報とするよ
うにしてもよい。例えば前記位相成分について絶対値で
はなく差分値に対して量子化を行った場合,小さな値が
出現する頻度が高くなるため,必要に応じて,ハフマン
符号化を施すと,符号化信号のデータ量をより小さくす
ることができる。尚,前記符号化信号生成部107が行
う上述の通りの処理が,前記信号符号化プログラムが前
記コンピュータに実行させる手順S105に対応する処
理である。前記符号化信号生成部107から出力された
符号化信号は,出力端子108を介して,例えば前記コ
ンピュータのハードディスクドライブ504上などに保
存される。このようにして,前記信号符号化装置により
符号化された符号化信号を保存するのに必要な記憶容量
は,線形PCM 方式により前記音響信号を符号化した場合
よりずっと少なく,前記MP3 やTwinVQと同等かそれより
少ない。また,周波数スペクトルをほぼそのまま符号化
するため,音質の劣化は少ない。しかも,前記周波数ス
ペクトル包絡情報を定める際には一度だけFFT 変換を行
えばよく, スペクトル包絡情報を用いる前記MP3 やTwin
VQと較べて演算量を大幅に低減することができる。
【0018】前記信号符号化装置1により生成された符
号化信号を復号化するのに好適な装置が,前記信号復号
化装置2である。前記信号復号化プログラムが実行さ
れ,前記コンピュータが前記信号復号化装置2として動
作すると,はじめに例えば復号化対象となる前記符号化
信号の指定等を行うためのダイアログが前記出力装置5
02に表示される。使用者により,復号化対象となる前
記符号化信号が指定されると,当該符号化信号に対して
復号化処理が開始される。前記信号復号化装置2におい
て,入力端子201を介して入力された前記符号化信号
は,バッファ202に一時的に格納される。前記信号復
号化装置2が前記コンピュータによって実現されるこの
例では,前記バッファ202には,前記ハードディスク
ドライブ504や前記RAM505などが利用される。
前記バッファ202として利用される前記ハードディス
クドライブ504上などに格納された前記符号化信号
は,スペクトル包絡復元部203,周波数スペクトル復
号化部205として動作する前記演算装置506によっ
て読み出されることになる。前記スペクトル包絡復元部
203は,前記符号化信号から前記スペクトル包絡情報
を取得し,該取得した前記スペクトル包絡情報に基づい
て前記音響信号の周波数スペクトルの各周波数成分に対
する前記スペクトル包絡を復元する。前記スペクトル包
絡情報が,例えばピーク点の大きさ,ピーク点の周波
数,谷関数の種類,谷関数のパラメータを含むのは既述
の通りである。前記ピーク点の大きさを表現するのに用
いた量子化ビット数が,前記スペクトル包絡情報に含ま
れている場合には,当該量子化ビット数を用いて前記ピ
ーク点の大きさを復元するが,前記スペクトル包絡情報
に必要なデータ量をできるだけ低減するために,前記量
子化ビット数は,前記信号符号化装置1と前記信号復号
化装置2とで予め共通化しておくのが望ましい。前記ピ
ーク点の大きさとその周波数が定まると,前記谷関数の
種類及び前記谷関数のパラメータ(例えば係数A)を前
記スペクトル包絡情報から取得すれば,前記スペクトル
包絡が復元される。尚,前記スペクトル包絡復元部20
3が行う上述の通りの処理が,前記信号復号化プログラ
ムが前記コンピュータに実行させる手順S201に対応
する処理である。前記スペクトル包絡復元部203によ
り復元された前記スペクトル包絡は,割当ビット数取得
部204に供給される。前記割当ビット数取得部204
は,前記スペクトル包絡から,前記音響信号の周波数ス
ペクトルの各周波数成分に割り当てられた割当ビット数
を取得する。前記スペクトル包絡から前記割当ビット数
を取得する処理は,前記信号符号化装置1の前記割当ビ
ット数決定部105が行う処理と同様である。尚,前記
割当ビット数取得部204が行う上述の通りの処理が,
前記信号復号化プログラムが前記コンピュータに実行さ
せる手順S202に対応する処理である。前記割当ビッ
ト数取得部204により取得された各周波数成分に対す
る割当ビット数は,周波数スペクトル復号化部205に
供給される。
【0019】前記周波数スペクトル復号化部205は,
前記パワー成分を復号化するパワー成分復号化部205
1,前記位相成分を復号化する位相成分復号化部205
2,0成分を排除するための0成分排除部2053を具
備する。前記パワー成分復号化部2051は,前記バッ
ファ202に格納された前記符号化信号から前記周波数
スペクトル情報のうちのパワー成分情報を取得し,前記
割当ビット数取得部204により取得された各周波数成
分に対する割当ビット数に応じて,前記パワー成分を復
号化する。前記パワー成分情報がビットストリーム化さ
れていれば,各周波数成分に対する前記割当ビット数づ
つ順次取り出せば,前記パワー成分が復号化される。ま
た,前記位相成分復号化部2052は,前記バッファ2
02に格納された前記符号化信号から前記周波数スペク
トル情報のうちの位相成分情報を取得し,前記割当ビッ
ト数取得部204により取得された各周波数成分に対す
る割当ビット数に応じて,前記位相成分を復号化する。
但し,前記パワー成分の大きさが0の周波数成分は復元
されないので,前記パワー成分復号化部2051により
復号化された前記パワー成分に基づき,前記位相成分復
号化部2052が復号化を行う対象から,前記0成分排
除部2053により前記パワー成分が0の周波数成分が
除外される。前記パワー成分や位相成分の量子化する際
に,上式(2a)や(2b)を用い,割当ビット数に応
じて丸め処理を異ならせた場合には,次式(3a),
(3b)に従って,復号化処理を行う。 Sp=0.85×R×Ep (3a) Sp=R×Ep/(2Ba−1) (3b) 尚,前記周波数スペクトル復号化部205が行う上述の
通りの処理が,前記信号復号化プログラムが前記コンピ
ュータに実行させる手順S203に対応する処理であ
る。前記パワー成分復号化部2051,及び前記位相成
分復号化部2052により前記パワー成分,及び前記位
相成分が復号化されると,次に前記演算装置506は,
信号復元部206として動作する。前記信号復元部20
6では,前記パワー成分復号化部2051により復号化
された前記パワー成分と,前記位相成分復号化部205
2により復号化された前記位相成分とから,実数成分と
虚数成分とを導出して,IFFT(Inverse FFT) 演算を行
い,時間領域の信号に変換し,前記音響信号を復元す
る。前記信号符号化装置1において,各フレームに窓関
数が施されている場合には,前記IFFT演算後の値に,対
応する窓関数の逆関数を乗じ復元する必要がある。前記
窓関数に関する情報は,前記信号符号化装置1と前記信
号復号化装置2とで共通化しておくか,前記符号化信号
に含ませる。各フレームの結合部については,窓関数を
施した部分を,オーバーラップさせることにより,結合
部の不連続性に伴うノイズを除去することができる。ま
た,窓関数を施した部分の近傍の部分を除外して,残っ
た部分の両端に窓関数を乗じて結合部を再生することも
有効である。その場合には,フレーム分割の際に除外す
る部分を予め余計に確保しておく必要がある。尚,前記
信号復元部205が行う上述の通りの処理が,前記信号
復号化プログラムが前記コンピュータに実行させる手順
S204に対応する処理である。
【0020】そして,前記信号復元部206により復元
された前記音響信号について,再生実行の指示が与えら
れると,前記音響信号は,D/A変換器207によりア
ナログ化されてから,出力端子208を介してスピーカ
などから出力される。このように,本発明の実施の形態
に係る信号復号化装置は,前記信号符号化装置により生
成された符号化信号を復号化して,時間的に変化する対
象信号を復元するのに好適である。前記信号復号化装置
においても,周波数領域から時間領域に変換する逆変換
の処理は,復号化を行うにあたって一度行うだけでよい
から,全体の演算量は少なくてすみ,短時間で前記対象
信号の復号化を行うことができ,また実時間再生を行う
のも容易になる。また,前記信号復号化装置(及び信号
復号化プログラム)の処理のほとんどは,前記信号符号
化装置(及び信号符号化プログラム)の処理と共通の,
又は対照的な処理であり,一台の装置及び一つのプログ
ラムによって両者を構成することが比較的容易である。
ここで,図9に源信号と,前記MP3 により符号化・復号
化した後の信号と,本実施の形態に係る方式により符号
化・復号化した後の信号と,のパワー成分を比較して示
す。尚,前記MP3 と本実施の形態に係る方式のビットレ
ートは両方とも128kbpsである。図9に示す通
り,本実施の形態に係る方式の周波数スペクトルは,低
周波領域から高周波領域に渡ってよく一致しているが,
前記MP3 によるものは,特に低周波領域と高周波領域で
源信号のものと大きく異なっている。即ち,本実施の形
態に係る符号化・復号化方式では,同じ圧縮率ながら高
い品質を確保することができる。また,その際の演算量
も少ない。
【0021】
【実施例】前記実施の形態では,前記信号符号化装置
1,及び前記信号復号化装置2を一台のコンピュータに
より実現する例を説明したが,これに限られるものでな
く,例えば前記信号符号化装置1と前記信号復号化装置
2とを別個のコンピュータにより実現するようにしても
よい。前記信号符号化装置1を実現するコンピュータに
よって生成された符号化信号は,各コンピュータに備え
られている前記通信装置を用い,インターネットなどを
介して,前記信号復号化装置2を実現するコンピュータ
に伝送するようにすればよい。前記信号符号化装置1を
実現するコンピュータは,例えば前記符号化信号を,当
該通信に対応したプロトコロルに応じたパケットに格納
し,前記信号符号化装置2は該パケットをデパケットし
た後,復号化処理を行う。伝送時間が保証されないネッ
トワークを介して実時間再生を行う場合,前記符号化信
号に含まれる前記スペクトル包絡情報,及び前記周波数
スペクトル情報(前記パワー成分情報,前記位相成分情
報)は,同じパケットに格納されることが好ましい。但
し,各々の情報を別々のパケットに格納した場合でも,
例えば前記スペクトル包絡情報と前記パワー成分情報の
み,前記スペクトル包絡情報と前記位相成分情報のみ,
又は前記周波数スペクトル情報のみを格納したパケット
が到着していれば,音質は劣化するものの受信側で再生
を行うことは可能である。また,前記信号符号化装置
1,及び前記信号復号化装置2は,汎用のコンピュータ
によって実現するのではなく,DSPなどを備えた専用
のハードウェアにより実現するようにしてもよい。この
場合にも,同一の装置に前記信号符号化装置1及び前記
信号復号化装置2を備えさせてもよいし,別個の装置に
前記信号復号化装置1及び前記信号復号化装置2をそれ
ぞれ備えさせてもよい。また,前記実施の形態では,前
記音響信号を符号化,復号化する例を説明したが,これ
に限られるものではなく,静止画像や,動画像など時間
的,又は空間的に変化する他の対象信号についても本発
明を適用することは可能である。例えば前記対象信号が
空間的に変化する静止画像の場合,FFT などの変換を2
次元的に行うと,空間周波数領域のスペクトル分布が得
られる。各空間周波数成分のスペクトル強度に応じて,
当該空間周波数成分に割り当てる割当ビット数を変化さ
せる。また,既述の通り前記フレーム幅は圧縮率に影響
を与えるため,前記フレーム幅を前記対象信号に対して
動的に最適化する処理を加えてもよい。最適化の手法と
しては,例えば次の(1)〜(4)がある。 (1) フレーム幅を変化させて,最もスペクトル包絡
の面積が小さくなるフレーム幅を採用する。 (2) フレーム幅を変化させて,同程度の圧縮率でそ
れぞれ圧縮し,圧縮したスペクトルと非圧縮のスペクト
ルの差が,最も小さくなるフレーム幅を採用する。 (3) フレーム幅を変化させて,同程度のスペクトル
精度が得られる圧縮率でそれぞれ圧縮して,圧縮率が最
も小さくなるフレーム幅を採用する。 (4) 上述の(1),(2),(3)のいずれか,又
はこれらの組み合わせて,圧縮率或いはスペクトル精度
が最も良いフレーム幅を,予め統計的手法で決定して,
そのフレーム幅を使用する。このとき音声(男女別),
楽音の種類(ポップス,ロック,演歌等)別に,フレー
ム幅を算出することも有効である。また,前記実施の形
態では,周波数スペクトルに関連してFFT やIFFTを用い
たが, これに限られるものではなく,MDCT(Modified De
screte Cosine Transform)などの他の変換処理,逆変換
処理を用いるようにしてもよい。
【0022】
【発明の効果】以上説明した通り,前記請求項1に記載
の信号符号化装置によれば,少ない演算量で高い圧縮率
と品質とを確保することのできる。また,前記請求項2
に記載の発明によれば,前記請求項1に記載の信号符号
化装置により生成された符号化信号を復号化して,時間
的又は空間的に変化する対象信号を復元するのに好適で
あって復号化に伴う演算量も少ない信号復号化装置を提
供することができる。また,前記請求項3に記載のコン
ピュータ読み取り可能な記録媒体によれば,前記請求項
1に記載の信号符号化装置をコンピュータにより実現す
るのに好適な信号符号化プログラムを提供することがで
きる。また,前記請求項4に記載のコンピュータ読み取
り可能な記録媒体によれば,前記請求項1に記載の信号
符号化装置によって生成された符号化信号を,又は前記
請求項3に記載の信号符号化プログラムに従ってコンピ
ュータにより生成された符号化信号を復号化して,時間
的又は空間的に変化する対象信号を復元するのに好適な
信号復号化プログラムを提供することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る信号符号化装置の
概略構成を示す図。
【図2】 本発明の実施の形態に係る信号復号化装置の
概略構成を示す図。
【図3】 本発明の実施の形態に係る信号符号化プログ
ラムを説明するためのフローチャート。
【図4】 本発明の実施の形態に係る信号復号化プログ
ラムを説明するためのフローチャート。
【図5】 前記信号符号化装置,前記信号復号化装置を
実現するコンピュータの構成例を示す図。
【図6】 スペクトル包絡抽出処理を説明するためのフ
ローチャート。
【図7】 スペクトル包絡抽出処理における谷関数の決
定手法を説明するための図。
【図8】 抽出したスペクトル包絡の例を示す図。
【図9】 源信号,本方式,その他の符号化方式を周波
数スペクトルを比較して示す図。
【符号の説明】
103…周波数スペクトル演算部 104…スペクトル包絡抽出部 105…割当ビット数決定部 106…周波数スペクトル量子化部 107…符号化信号生成部 203…スペクトル包絡復元部 204…割当ビット数取得部 205…周波数スペクトル復号化部 206…信号復元部
───────────────────────────────────────────────────── フロントページの続き (54)【発明の名称】 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読 み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録 媒体

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 時間的又は空間的に変化する対象信号の
    周波数スペクトルを求める周波数スペクトル演算手段
    と,前記周波数スペクトル演算手段により演算された前
    記対象信号の周波数スペクトルからスペクトル包絡を抽
    出するスペクトル包絡抽出手段と,前記スペクトル包絡
    抽出手段により抽出された前記スペクトル包絡に応じ
    て,前記対象信号の周波数スペクトルの各周波数成分に
    割り当てる割当ビット数を定める割当ビット数決定手段
    と,前記割当ビット数決定手段により定められた前記割
    当ビット数に基づいて,前記対象信号の周波数スペクト
    ルを量子化する周波数スペクトル量子化手段と,前記周
    波数スペクトル量子化手段により量子化された前記対象
    信号の周波数スペクトルに関する周波数スペクトル情報
    と,前記スペクトル包絡に関するスペクトル包絡情報と
    を符号化した符号化信号を生成する符号化信号生成手段
    とを具備してなる信号符号化装置。
  2. 【請求項2】 時間的又は空間的に変化する対象信号の
    周波数スペクトルに関する周波数スペクトル情報と前記
    対象信号のスペクトル包絡に関するスペクトル包絡情報
    とを符号化した符号化信号から前記スペクトル包絡情報
    を取得し,該取得した前記スペクトル包絡情報に基づい
    て前記対象信号の周波数スペクトルの各周波数成分に対
    する前記スペクトル包絡を復元するスペクトル包絡復元
    手段と,前記スペクトル包絡復元手段により復元された
    前記スペクトル包絡から,前記対象信号の周波数スペク
    トルの各周波数成分に割り当てられた割当ビット数を取
    得する割当ビット数取得手段と,前記符号化信号から前
    記周波数スペクトル情報を取得し,前記割当ビット数取
    得手段により取得された前記割当ビット数に基づいて,
    前記取得した前記周波数スペクトル情報から前記対象信
    号の周波数スペクトルを復号化する周波数スペクトル復
    号化手段と,前記周波数スペトル復号化手段により復号
    化された前記対象信号の周波数スペクトルに基づいて,
    前記対象信号を復元する信号復元手段とを具備してなる
    信号復号化装置。
  3. 【請求項3】 コンピュータに,空間的又は時間的に変
    化する対象信号の周波数スペクトルを求める手順,前記
    対象信号の周波数スペクトルからスペクトル包絡を抽出
    する手順,前記スペクトル包絡に応じて,前記対象信号
    の周波数スペクトルの各周波数成分に割り当てる割当ビ
    ット数を定める手順,前記割当ビット数に基づいて,前
    記対象信号の周波数スペクトルを量子化する手順,前記
    対象信号の周波数スペクトルに関する周波数スペクトル
    情報と,前記スペクトル包絡を定めるスペクトル包絡情
    報とを符号化した符号化信号を生成する手順を実行させ
    るための信号符号化プログラムを記録したコンピュータ
    読み取り可能な記録媒体。
  4. 【請求項4】 コンピュータに,時間的又は空間的に変
    化する対象信号の周波数スペクトルに関する周波数スペ
    クトル情報と前記対象信号のスペクトル包絡に関するス
    ペクトル包絡情報とを符号化した符号化信号から前記ス
    ペクトル包絡情報を取得し,前記スペクトル包絡情報に
    基づいて前記対象信号の周波数スペクトルの各周波数成
    分に対する前記スペクトル包絡を復元する手順,前記ス
    ペクトル包絡から,前記対象信号の周波数スペクトルの
    各周波数成分に割り当てられた割当ビット数を取得する
    手順,前記符号化信号から前記周波数スペクトル情報を
    取得し,前記割当ビット数に基づいて,前記周波数スペ
    クトル情報から前記対象信号の周波数スペクトルを復号
    化する手順,前記対象信号の周波数スペクトルに基づい
    て前記対象信号を復元する手順を実行させるための信号
    復号化プログラムを記録したコンピュータ読み取り可能
    な記録媒体。
JP36957199A 1999-12-27 1999-12-27 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JP2001184090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36957199A JP2001184090A (ja) 1999-12-27 1999-12-27 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36957199A JP2001184090A (ja) 1999-12-27 1999-12-27 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2001184090A true JP2001184090A (ja) 2001-07-06

Family

ID=18494773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36957199A Pending JP2001184090A (ja) 1999-12-27 1999-12-27 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2001184090A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085183A (ja) * 2001-07-10 2006-03-30 Coding Technologies Ab 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7822617B2 (en) 2005-02-23 2010-10-26 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US8073144B2 (en) 2001-07-10 2011-12-06 Coding Technologies Ab Stereo balance interpolation
JP2006085183A (ja) * 2001-07-10 2006-03-30 Coding Technologies Ab 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
US10902859B2 (en) 2001-07-10 2021-01-26 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8014534B2 (en) 2001-07-10 2011-09-06 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8059826B2 (en) 2001-07-10 2011-11-15 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10297261B2 (en) 2001-07-10 2019-05-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8081763B2 (en) 2001-07-10 2011-12-20 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8116460B2 (en) 2001-07-10 2012-02-14 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8243936B2 (en) 2001-07-10 2012-08-14 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9865271B2 (en) 2001-07-10 2018-01-09 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9799341B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9799340B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US9761234B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761236B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761237B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818418B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9792923B2 (en) 2001-11-29 2017-10-17 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US9779746B2 (en) 2001-11-29 2017-10-03 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9812142B2 (en) 2001-11-29 2017-11-07 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US11238876B2 (en) 2001-11-29 2022-02-01 Dolby International Ab Methods for improving high frequency reconstruction
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10685661B2 (en) 2002-09-18 2020-06-16 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US11423916B2 (en) 2002-09-18 2022-08-23 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7945055B2 (en) 2005-02-23 2011-05-17 Telefonaktiebolaget Lm Ericcson (Publ) Filter smoothing in multi-channel audio encoding and/or decoding
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7822617B2 (en) 2005-02-23 2010-10-26 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding

Similar Documents

Publication Publication Date Title
US7392176B2 (en) Encoding device, decoding device and audio data distribution system
US5886276A (en) System and method for multiresolution scalable audio signal encoding
JP4742087B2 (ja) オーディオ信号の2重変換符号化
JP5647571B2 (ja) フルバンド拡張可能なオーディオコーデック
KR101770237B1 (ko) 오디오 데이터 처리 방법, 장치 및 시스템
JP2012198555A (ja) オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
JP2002041089A (ja) 周波数補間装置、周波数補間方法及び記録媒体
EP1538602B1 (en) Wideband synthesis from a narrowband signal
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
CN115171709B (zh) 语音编码、解码方法、装置、计算机设备和存储介质
JP2001184090A (ja) 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体
US11735193B2 (en) High resolution audio coding
US20210343302A1 (en) High resolution audio coding
JPWO2002058053A1 (ja) ディジタル音声データの符号化方法及び復号化方法
CN118692475A (zh) 一种基于体域网技术的数字音频实时传输系统
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP4538705B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP2006171751A (ja) 音声符号化装置及び方法
JP3510493B2 (ja) 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体
WO1991006945A1 (en) Speech compression system
JP2000078018A (ja) 音声符号化方式、音声符号化装置、及びデ―タ記録媒体
WO2022267754A1 (zh) 语音编码、语音解码方法、装置、计算机设备和存储介质
US11749290B2 (en) High resolution audio coding for improving package loss concealment
US11715478B2 (en) High resolution audio coding