WO2006104017A1

WO2006104017A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2006104017A1
Application number: PCT/JP2006/305871
Authority: WO
Inventors: Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-03-25
Filing date: 2006-03-23
Publication date: 2006-10-05
Also published as: US20090055172A1; JPWO2006104017A1; CN101147191B; US8768691B2; CN101147191A; EP1858006A1; JP4887288B2; ES2623551T3; EP1858006A4; EP1858006B1

Abstract

　効率よくステレオ音声を符号化することができる音声符号化装置。この装置において、予測パラメータ分析部（２１）は、第１ch復号信号と第２ch音声信号とから、第１ch音声信号に対する第２ch音声信号の遅延差Dおよび振幅比gをチャネル間予測パラメータとして求め、予測パラメータ量子化部（２２）は、予測パラメータを量子化し、信号予測部（２３）は、第１ch復号信号と量子化予測パラメータとを用いて第２ch信号を予測する。この際、予測パラメータ量子化部（２２）は、信号の音源から受信地点までの空間的特性（距離等）に起因する遅延差Dと振幅比gとの間の関係性（相関性）を利用して、予測パラメータ（遅延差D、振幅比g）を符号化および量子化する。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 移動体通信や IP通信での伝送帯域の広帯域化、サービスの多様化に伴 1、、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号ィ匕が必須となる。

[0003] また、 IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号ィ匕が望まれている。スケーラブルな構成とは、受信側で部分的な符号ィ匕データ力もでも音声データの復号が可能な構成を、う。

[0004] よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側にぉ、て選択可能な、モノラルーステレオ間でのスケーラブル構成（モノラルステレオ'スケーラブル構成）を有する符号化が望まれる。

[0005] このような、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕方法としては、例えば、チャネル (以下、適宜「ch」と略す）間の信号の予測（第 lch信号から第 2c h信号の予測、または、第 2ch信号から第 lch信号の予測)を、チャネル相互間のピッチ予測により行う、すなわち、 2チャネル間の相関を利用して符号ィ匕を行うものがある (非特許文献 1参照)。非特言午文献 1 : Ramprashad， S.A., "Stereophonic CELP coding using cross channel p rediction", Proc. IEEE Workshop on Speech Coding, pp.136- 138， Sep. 2000.

発明の開示

発明が解決しょうとする課題

[0006] し力しながら、上記非特許文献 1記載の音声符号化方法では、チャネル間の予測ノラメータ（チャネル間のピッチ予測の遅延およびゲイン）はそれぞれ独立に符号ィ匕されるため、符号ィ匕効率が高くない。

[0007] 本発明の目的は、効率よくステレオ音声を符号化することができる音声符号化装置および音声符号ィ匕方法を提供することである。

課題を解決するための手段

[0008] 本発明の音声符号化装置は、第 1信号と第 2信号との間の遅延差および振幅比を予測パラメータとして求める予測パラメータ分析手段と、前記遅延差と前記振幅比との間の相関性に基づいて前記予測パラメータ力量子化予測パラメータを得る量子化手段と、を具備する構成を採る。

発明の効果

[0009] 本発明によれば、効率よくステレオ音声を符号ィ匕することができる。

図面の簡単な説明

[0010] [図 1]実施の形態 1に係る音声符号ィ匕装置の構成を示すブロック図

[図 2]実施の形態 1に係る第 2ch予測部の構成を示すブロック図

[図 3]実施の形態 1に係る予測パラメータ量子化部の構成を示すブロック図 (構成例 1 )

[図 4]実施の形態 1に係る予測パラメータ符号帳の一例を示す特性図

[図 5]実施の形態 1に係る予測パラメータ量子化部の構成を示すブロック図 (構成例 2

)

[図 6]実施の形態 1に係る振幅比推定部で用いられる関数の一例を示す特性図

[図 7]実施の形態 2に係る予測パラメータ量子化部の構成を示すブロック図 (構成例 3 ) [図 8]実施の形態 2に係る歪み算出部で用いられる関数の一例を示す特性図

[図 9]実施の形態 2に係る予測パラメータ量子化部の構成を示すブロック図 (構成例 4

)

[図 10]実施の形態 2に係る振幅比補正部および振幅比推定部で用いられる関数の一例を示す特性図

[図 11]実施の形態 2に係る予測パラメータ量子化部の構成を示すブロック図 (構成例 5)

発明を実施するための最良の形態

[0011] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0012] (実施の形態 1)

本実施の形態に係る音声符号化装置の構成を図 1に示す。図 1に示す音声符号化装置 10は、第 lch符号化部 11、第 lch復号部 12、第 2ch予測部 13、減算器 14、および、第 2ch予測残差符号ィ匕部 15を備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。

[0013] 第 lch符号ィ匕部 11は、入力ステレオ信号のうち第 lch音声信号 s__Chl(_n) (n=0〜NF- 1 ;NFはフレーム長)に対する符号ィ匕を行い、第 lch音声信号の符号ィ匕データ (第 lch 符号ィ匕データ）を第 lch復号部 12に出力する。また、この第 lch符号ィ匕データは、第 2ch予測パラメータ符号化データおよび第 2ch符号化データと多重されて音声復号装置（図示せず)へ伝送される。

[0014] 第 lch復号部 12は、第 lch符号化データから第 lch復号信号を生成して第 2ch予測部 13に出力する。

[0015] 第 2ch予測部 13は、第 lch復号信号と入力ステレオ信号のうちの第 2ch音声信号 s_ ch2(n) (n=0〜NF-l； NFはフレーム長)とから第 2ch予測パラメータを求め、この第 2ch 予測パラメータを符号ィ匕した第 2ch予測パラメータ符号ィ匕データを出力する。この第 2 ch予測パラメータ符号化データは、他の符号化データと多重されて音声復号装置（図示せず)へ伝送される。また、第 2ch予測部 13は、第 lch復号信号と第 2ch音声信号とから第 2ch予測信号 _Sp_ch2(n)を合成し、その第 2ch予測信号を減算器 14に出力する。第 2ch予測部 13の詳細につ、ては後述する。 [0016] 減算器 14は、第 2ch音声信号 _S_ch2(n)と第 2ch予測信号 _Sp_ch2(n)との差、すなわち

、第 2ch音声信号に対する第 2ch予測信号の残差成分の信号 (第 2ch予測残差信号

)を求め、第 2ch予測残差符号化部 15に出力する。

[0017] 第 2ch予測残差符号化部 15は、第 2ch予測残差信号を符号化して第 2ch符号化データを出力する。この第 2ch符号ィ匕データは他の符号ィ匕データと多重されて音声復号装置へ伝送される。

[0018] 次いで、第 2ch予測部 13の詳細について説明する。図 2に、第 2ch予測部 13の構成を示す。この図に示すように、第 2ch予測部 13は、予測パラメータ分析部 21、予測パラメータ量子化部 22、および、信号予測部 23を備える。

[0019] 第 2ch予測部 13では、ステレオ信号の各チャネル信号間の相関性に基づき、第 lc h音声信号に対する第 2ch音声信号の遅延差 Dおよび振幅比 gを基本とするパラメ一タを用いることで、第 lch音声信号力第 2ch音声信号を予測する。

[0020] 予測パラメータ分析部 21は、第 lch復号信号と第 2ch音声信号とから、第 lch音声信号に対する第 2ch音声信号の遅延差 Dおよび振幅比 gをチャネル間予測パラメータとして求め、予測パラメータ量子化部 22に出力する。

[0021] 予測パラメータ量子化部 22は、入力された予測パラメータ (遅延差 D、振幅比 g)を量子化し、量子化予測パラメータおよび第 2ch予測パラメータ符号化データを出力する。量子化予測パラメータは信号予測部 23に入力される。予測パラメータ量子化部 2

2の詳細については後述する。

[0022] 信号予測部 23は、第 lch復号信号と量子化予測パラメータとを用いて第 2ch信号の予測を行い、その予測信号を出力する。信号予測部 23で予測される第 2ch予測信号 sp_ch2(n) (n=0〜NF-l； NFはフレーム長)は、第 lch復号信号 sd_chl(n)を用いて式（

1)より表される。

[数 1]

sp_ch2 (n) = g · sd_chl (n - D) … ( 1 )

[0023] なお、予測パラメータ分析部 21では、式（2)で表される歪み Dist、すなわち、第 2ch 音声信号 s_ch2(n)と第 2ch予測信号 sp_ch2(n)との歪み Distを最小とするように予測パラメータ (遅延差 D、振幅比 g)を求める。また、予測パラメータ分析部 21は、第 2ch音声信号と第 lch復号信号との間の相互相関を最大にするような遅延差 Dや、フレーム単位の平均振幅の比 gを求めて予測パラメータとしてもよい。

[数 2]

Dist = ∑ { s— ch2 (n) - sp_ch2 (n) } ² … ( 2 )

[0024] 次いで、予測パラメータ量子化部 22の詳細について説明する。

[0025] 予測パラメータ分析部 21において得られた遅延差 Dと振幅比 gとの間には、信号の音源力も受信地点までの空間的特性 (距離等）に起因する関係性湘関性)がある。すなわち、遅延差 D(〉0)が大きい (正方向（遅れ方向）に大きい）ほど振幅比 g (く 1.0)は小さぐ逆に、遅延差 D (く 0)が小さい (負方向（進み方向）に大きい）ほど振幅比 g(〉1.0 )は大きくなる、という関係性がある。そこで、予測パラメータ量子化部 22では、この関係性を利用して、チャネル間予測パラメータ (遅延差 D、振幅比 g)を効率的に符号ィ匕し、より少な!、量子化ビット数で同等の量子化歪みを実現する。

[0026] 本実施の形態に係る予測パラメータ量子化部 22の構成は図 3<構成例 1 >または図 5く構成例 2 >に示すようになる。

[0027] <構成例 1 >

構成例 1 (図 3)では、遅延差 Dと振幅比 gを 2次元ベクトルとして表し、その 2次元べタトルに対してベクトル量子化を行う。図 4は、この 2次元ベクトルを点（〇）で表した符号ベクトルの特性図である。

[0028] 図 3において、歪み算出部 31は、遅延差 Dと振幅比 gと力もなる 2次元ベクトル (D,g) で表された予測パラメータに対して、予測パラメータ符号帳 33の各符号ベクトルとの間の歪みを算出する。

[0029] 最小歪み探索部 32は、すべての符号ベクトルのうち、歪みが最も小さ、符号べタトルを探索し、その探索結果を予測パラメータ符号帳 33に送るとともに、その符号べクトルに対応するインデクスを第 2ch予測パラメータ符号ィ匕データとして出力する。

[0030] 予測パラメータ符号帳 33は、探索結果に基づ!/、て、歪みが最も小さ!/、符号ベクトルを量子化予測パラメータとして出力する。

[0031] ここで、予測パラメータ符号帳 33の第 k番目の符号ベクトルを (Dc(k),gc(k》 (k=0〜N cb-1, Ncb :符号帳サイズ)とすると、歪み算出部 31で算出される、第 k番目の符号べタトルに対する歪み Dst(k)は式（3)により表される。式（3)において、 wdおよび wgは、歪み算出時の遅延差に対する量子化歪みと、振幅比に対する量子化歪みとの間の重みを調整する重み定数である。

[数 3]

Dst (k) = wd - (D-Dc (k) )² + wg · (g-gc (k) )² … ( 3 )

[0032] 予測パラメータ符号帳 33は、予め、遅延差 Dと振幅比 gとの対応関係を示す複数のデータ（学習データ)を学習用のステレオ音声信号から取得しておき、その対応関係力学習により予め用意しておく。予測パラメータである遅延差と振幅比との間には上記の関係性があるため、学習用データはその関係性に従って取得される。よって、学習から得られる予測パラメータ符号帳 33は、図 4に示すように、遅延差 Dと振幅比 g 力 (D,g)=(0, 1.0)となる点を中心に、負の比例関係にある符号ベクトルの集合の密度が高ぐそれ以外は疎になると考えられる。図 4に示すような特性を有する予測パラメータ符号帳を用いることで、遅延差と振幅比との対応関係を表す予測パラメータの中で、発生頻度の高いものの量子化誤差を小さくでき、その結果、量子化効率を向上することができる。

[0033] <構成例 2>

構成例 2 (図 5)では、遅延差 Dから振幅比 gを推定する関数を予め定め、遅延差 D を量子化後、その量子化値力その関数を用いて推定した振幅比に対する予測残差を量子化する。

[0034] 図 5において、遅延差量子化部 51は、予測パラメータのうちの遅延差 Dに対して量子化を行い、この量子化遅延差 Dqを振幅比推定部 52に出力するとともに、量子化予測パラメータとして出力する。また、遅延差量子化部 51は、遅延差 Dの量子化により得られる量子化遅延差インデクスを第 2ch予測パラメータ符号ィ匕データとして出力する。

[0035] 振幅比推定部 52は、量子化遅延差 Dqから振幅比の推定値 (推定振幅比) gpを求めて、振幅比推定残差量子化部 53に出力する。振幅比の推定には、予め用意された、量子化遅延差力も振幅比を推定するための関数を用いる。この関数は、量子化遅延差 Dqと推定振幅比 gpとの対応関係を示す複数のデータを学習用のステレオ音声信号から求めておき、その対応関係力も学習により予め用意しておく。

[0036] 振幅比推定残差量子化部 53は、振幅比 gの推定振幅比 gpに対する推定残差 δ g を式 (4)に従って求める。

画 δ g = g - gp · · ' ( 4 )

[0037] そして、振幅比推定残差量子化部 53は、式 (4)で得られた推定残差 δ gに対して量子化を行い、量子化推定残差を量子化予測パラメータとして出力する。また、振幅比推定残差量子化部 53は、推定残差 δ gの量子化により得られる量子化推定残差インデクスを第 2ch予測パラメータ符号ィ匕データとして出力する。

[0038] 図 6に、振幅比推定部 52で用いられる関数の一例を示す。入力される予測パラメータ (D,g)は、 2次元ベクトルとして図 6の座標平面上の点で示される。図 6に示すように、遅延差力も振幅比を推定するための関数 61は、（D,g)=(0,1.0)またはその付近を通るような負の比例関係にある関数である。そして、振幅比推定部 52では、この関数を用いて、量子化遅延差 Dqから推定振幅比 gpを求める。また、振幅比推定残差量子化部 53では、入力予測パラメータの振幅比 gの推定振幅比 gpに対する推定残差 δ g を求め、この推定残差 δ gを量子化する。このようにして推定残差を量子化することで、振幅比を直接量子化するよりも量子化誤差を小さくすることができ、その結果、量子化効率を向上することができる。

[0039] なお、上記説明では、量子化遅延差力振幅比を推定するための関数を用いて量子化遅延差 Dqから推定振幅比 gpを求め、その推定振幅比 gpに対する入力振幅比 g の推定残差 δ gを量子化する構成について説明したが、入力振幅比 gを量子化し、量子化振幅比から遅延差を推定するための関数を用いて量子化振幅比 gqから推定遅延差 Dpを求め、その推定遅延差 Dpに対する入力遅延差 Dの推定残差 δ Dを量子化する構成としてちよい。

[0040] (実施の形態 2)

本実施の形態に係る音声符号化装置は、実施の形態 1と、予測パラメータ量子化部 22 (図 2、 3、 5)の構成が異なる。本実施の形態における予測パラメータの量子化では、遅延差および振幅比の量子化において、双方のパラメータの量子化誤差が聴感的に相互に打ち消しあう方向に生じるような量子化を行う。すなわち、遅延差の量子化誤差が正の方向に生じる場合は振幅比の量子化誤差がより大きくなるように量子化し、逆に、遅延差の量子化誤差が負の方向に生じる場合は振幅比の量子化誤差がより小さくなるように量子化する。

[0041] ここで、人間の聴覚特性として、同じステレオ音の定位感を得るように、遅延差と振幅比を相互に調整することが可能である。すなわち、遅延差が実際より大きくなつた場合には、振幅比を大きくすれば、同等の定位感が得られる。この聴覚特性に基づき、聴感的にステレオの定位感が変わらないように、遅延差の量子化誤差と振幅比の量子化誤差とを相互に調整して遅延差および振幅比を量子化することで、予測パラメータをより効率よく符号ィ匕することができる。つまり、同等の音質をより低符号ィ匕ビットレートで、または、同一の符号ィ匕ビットレートでより高音質を実現することができる。

[0042] 本実施の形態に係る予測パラメータ量子化部 22の構成は図 7<構成例 3 >または図 9く構成例 4 >に示すようになる。

[0043] <構成例 3 >

構成例 3 (図 7)は、歪みの算出において構成例 1 (図 3)と異なる。なお、図 7においては、図 3と同一の構成部分には同一符号を付し説明を省略する。

[0044] 図 7において、歪み算出部 71は、遅延差 Dと振幅比 gからなる 2次元ベクトル (D,g) で表された予測パラメータに対して、予測パラメータ符号帳 33の各符号ベクトルとの間の歪みを算出する。

[0045] 予測パラメータ符号帳 33の第 k番目の符号ベクトル (Dc(k),gc(k)) (k=0〜Ncb, Ncb：符号帳サイズ)とすると、歪み算出部 71は、入力される予測パラメータの 2次元べタトル (D,g)を、各符号ベクトル (Dc(k),gc(k))に最も近ヽ聴感的に等価な点 (Dc' (k),gc' (k)) に移動をさせた後、式（5)に従って歪み Dst(k)を算出する。なお、式（5)において、 w dおよび wgは、歪み算出時の遅延差に対する量子化歪みと、振幅比に対する量子化歪みとの間の重みを調整する重み定数である。

[数 5]

Dst (k) = wd - ( (Dc' (k) -Dc (k) )² + wg * (gc, (k) -gc (k) )² … （5 ) [0046] ここで、各符号ベクトル (Dc(k),gc(k))に最も近い聴感的に等価な点とは、図 8に示すように、各符号ベクトルから、入力予測パラメータベクトル (D,g)とステレオ定位感が聴感的に等価な関数 81へ垂線を下ろした点に相当する。この関数 81は、遅延差 Dと振幅比 gとが正の方向に比例する関数であり、遅延差が大きいほど振幅比も大きぐ逆に、遅延差が小さいほど振幅比も小さくすることで聴感的に等価な定位感を得られる t 、う聴感的特性に基づくものである。

[0047] なお、入力予測パラメータベクトルを (D,g)を、関数 81上において、各符号ベクトル（ Dc(k),gc(k))に最も近ヽ（すなわち、垂線上）の聴感的に等価な点 (Dc， (k),gc， (k》へ移動させる際には、所定以上大きく離れた点への移動に対しては歪みを大きくしてペナルティを課す。

[0048] このようにして求めた歪みを用いてベクトル量子化を行うと、例えば図 8においては、入力予測パラメータベクトル力の距離が近い符号ベクトル A (量子化歪み A)ゃ符号ベクトル B (量子化歪み B)ではなぐ入力予測パラメータベクトルにステレオ定位感が聴感的により近い符号ベクトル C (量子化歪み C)が量子化値となり、より聴感的な歪みの小さ、量子化を行うことができる。

[0049] <構成例 4>

構成例 4 (図 9)は、遅延差の量子化誤差を踏まえて聴感的に等価な値へと補正した振幅比 (補正振幅比）に対する推定残差を量子化する点において、構成例 2 (図 5 )と異なる。なお、図 9においては、図 5と同一の構成部分には同一符号を付し説明を省略する。

[0050] 図 9において、遅延差量子化部 51は、量子化遅延差 Dqを振幅比補正部 91にも出力する。

[0051] 振幅比補正部 91は、遅延差の量子化誤差を踏まえて振幅比 gを聴感的に等価な値へと補正し、補正振幅比 g'を得る。この補正振幅比 g'は、振幅比推定残差量子化部 92に入力される。

[0052] 振幅比推定残差量子化部 92は、補正振幅比 g'の推定振幅比 gpに対する推定残差 S gを式 (6)に従って求める。

[数 6] δ g = g， - gp … ( 6 )

[0053] そして、振幅比推定残差量子化部 92は、式 (6)で得られた推定残差 δ gに対して量子化を行い、量子化推定残差を量子化予測パラメータとして出力する。また、振幅比推定残差量子化部 92は、推定残差 δ gの量子化により得られる量子化推定残差インデクスを第 2ch予測パラメータ符号ィ匕データとして出力する。

[0054] 図 10に、振幅比補正部 91および振幅比推定部 52で用いられる関数の一例を示す。振幅比補正部 91で用、る関数 81は構成例 3にお、て用、た関数 81と同一の関数であり、振幅比推定部 52で用、る関数 61は構成例 2において用、た関数 61と同一の関数である。

[0055] 関数 81は、上記のように、遅延差 Dと振幅比 gとが正の方向に比例する関数であり、振幅比補正部 91では、この関数 81を用いて、量子化遅延差 Dqから、遅延差の量子化誤差を踏まえた、振幅比 gと聴感的に等価な補正振幅比 g'を得る。また、関数 61 は、上記のように、（D,g)=(0,1.0)またはその付近を通るような負の比例関係にある関数であり、振幅比推定部 52では、この関数 61を用いて、量子化遅延差 Dqから推定振幅比 gpを求める。そして、振幅比推定残差量子化部 92では、補正振幅比 g'の推定振幅比 gpに対する推定残差 δ gを求め、この推定残差 δ gを量子化する。

[0056] このように、遅延差の量子化誤差を踏まえて聴感的に等価な値へと補正した振幅比 (補正振幅比)から推定残差を求め、その推定残差を量子化することで、聴感的に歪みが小さぐかつ、量子化誤差の小さい量子化を行うことができる。

[0057] <構成例 5 >

遅延差 Dと振幅比 gとをそれぞれ独立に量子化する場合においても、本実施の形態のように、遅延差と振幅比に関する聴感的特性を利用するようにしてもよい。この場合の予測パラメータ量子化部 22の構成は、図 11に示すようになる。なお、図 11において、構成例 4 (図 9)と同一の構成部分には同一符号を付す。

[0058] 図 11において、振幅比補正部 91は、構成例 4同様、遅延差の量子化誤差を踏まえて振幅比 gを聴感的に等価な値へと補正し、補正振幅比 g'を得る。この補正振幅比 g'は、振幅比量子化部 1101に入力される。 [0059] 振幅比量子化部 1101は、補正振幅比 g'に対して量子化を行い、量子化振幅比を量子化予測パラメータとして出力する。また、振幅比量子化部 1101は、補正振幅比 g'の量子化により得られる量子化振幅比インデクスを第 2ch予測パラメータ符号ィ匕データとして出力する。

[0060] なお、上記各実施の形態では、予測パラメータ (遅延差 Dおよび振幅比 g)をそれぞれスカラー値（1次元の値）として説明したが、複数の時間単位 (フレーム）に渡って得られた複数の予測パラメータをまとめて 2次元以上のベクトルとして上記同様の量子化を行ってもよい。

[0061] また、上記各実施の形態を、モノラル—ステレオ'スケーラブル構成を有する音声符号ィ匕装置に適用することもできる。この場合、モノラルコアレイヤにおいて、入力ステレオ信号 (第 lchおよび第 2ch音声信号)からモノラル信号を生成して符号ィ匕し、ステレオ拡張レイヤにおいて、モノラル復号信号から、チャネル間予測により第 lch (または第 2ch)音声信号を予測し、この予測信号と第 lch (または第 2ch)音声信号との予測残差信号を符号化する。さらに、モノラルコアレイヤおよびステレオ拡張レイヤの符号ィ匕に CELP符号ィ匕を用い、ステレオ拡張レイヤにて、モノラルコアレイヤで得られたモノラル駆動音源信号に対するチャネル間予測を行ヽ、予測残差を CELP音源符号ィ匕により符号ィ匕するようにしてもよい。なお、スケーラブル構成の場合は、チャネル間予測パラメータは、モノラル信号力もの第 lch (または第 2ch)音声信号の予測に対するノラメータとなる。

[0062] また、上記各実施の形態を、モノラル—ステレオ'スケーラブル構成を有する音声符号化装置に適用する場合、モノラル信号に対する第 lchおよび第 2ch音声信号の遅延差 Dml,Dm2、振幅比 gml,gm2を 2チャネル信号分まとめて、実施の形態 2と同様にして量子化するようにしてもよい。この場合、各チャネルの遅延差間（Dmlと Dm2との間）および振幅比間（gmlと gm2との間）にも相関性があり、その相関性を利用することで、モノラルステレオ'スケーラブル構成にお、て予測パラメータの符号ィ匕効率を向上することができる。

[0063] また、上記各実施の形態に係る音声符号化装置を、移動体通信システムにお！/、て使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可會である。

[0064] また、上記各実施の形態では、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

[0065] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されてもよいし、一部又は全てを含むように 1チップィ匕されてもよい。

[0066] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレ卜ラ LSIと呼称されることちある。

[0067] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用してもよい。

[0068] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行ってもよい。バイオ技術の適応等が可能性としてありえる。

[0069] 本明細書は、 2005年 3月 25曰出願の特願 2005— 088808に基づくものである。

この内容はすべてここに含めておく。

産業上の利用可能性

[0070] 本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。

Claims

請求の範囲

[1] 第 1信号と第 2信号との間の遅延差および振幅比を予測パラメータとして求める予測パラメータ分析手段と、

前記遅延差と前記振幅比との間の相関性に基づいて前記予測パラメータから量子化予測パラメータを得る量子化手段と、

を具備する音声符号化装置。

[2] 前記量子化手段は、前記振幅比の、前記遅延差から推定される振幅比に対する残差を量子化して前記量子化予測パラメータを得る、

請求項 1記載の音声符号化装置。

[3] 前記量子化手段は、前記遅延差の、前記振幅比から推定される遅延差に対する残差を量子化して前記量子化予測パラメータを得る、

請求項 1記載の音声符号化装置。

[4] 前記量子化手段は、前記遅延差の量子化誤差と前記振幅比の量子化誤差とが聴感的に相互に打ち消しあう方向に生じる量子化を行って前記量子化予測パラメータを得る、

請求項 1記載の音声符号化装置。

[5] 前記量子化手段は、前記遅延差と前記振幅比とからなる 2次元ベクトルを用いて前記量子化予測パラメータを得る、

請求項 1記載の音声符号化装置。

[6] 請求項 1記載の音声符号化装置を具備する無線通信移動局装置。

[7] 請求項 1記載の音声符号化装置を具備する無線通信基地局装置。

[8] 第 1信号と第 2信号との間の遅延差および振幅比を予測パラメータとして求め、前記遅延差と前記振幅比との間の相関性に基づいて前記予測パラメータから量子化予測パラメータを得る、

音声符号化方法。