JP3483958B2 - 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 - Google Patents
広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法Info
- Publication number
- JP3483958B2 JP3483958B2 JP26527794A JP26527794A JP3483958B2 JP 3483958 B2 JP3483958 B2 JP 3483958B2 JP 26527794 A JP26527794 A JP 26527794A JP 26527794 A JP26527794 A JP 26527794A JP 3483958 B2 JP3483958 B2 JP 3483958B2
- Authority
- JP
- Japan
- Prior art keywords
- wideband
- signal
- narrowband
- spectrum
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 72
- 230000005540 biological transmission Effects 0.000 title claims description 14
- 238000001228 spectrum Methods 0.000 claims abstract description 343
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 28
- 230000005284 excitation Effects 0.000 claims description 215
- 230000003044 adaptive effect Effects 0.000 claims description 92
- 230000003595 spectral effect Effects 0.000 claims description 68
- 238000004458 analytical method Methods 0.000 claims description 36
- 230000015572 biosynthetic process Effects 0.000 claims description 34
- 238000003786 synthesis reaction Methods 0.000 claims description 34
- 230000005236 sound signal Effects 0.000 claims description 33
- 238000005070 sampling Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000006837 decompression Effects 0.000 claims description 15
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims 4
- 238000012986 modification Methods 0.000 claims 4
- 230000004048 modification Effects 0.000 claims 4
- 230000000694 effects Effects 0.000 description 77
- 238000010586 diagram Methods 0.000 description 41
- 238000012545 processing Methods 0.000 description 36
- 238000013139 quantization Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000006866 deterioration Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 238000010183 spectrum analysis Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012950 reanalysis Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
域音声信号や、狭帯域音声信号を符号化した狭帯域音声
符号から広帯域の音声信号を復元する広帯域音声復元装
置に関するものである。
話音声がある。電話システムでは音声信号は約300H
zから3.4KHzの帯域に制限されて伝送されてお
り、帯域制限がない場合に比べると、貧弱で籠った感じ
の音質となっている。高品質化するためには広帯域の音
声信号を伝送できる電話システムを構築することが考え
られるが、多くの時間と経費が必要である。
域音声信号を復元する広帯域音声復元方法として考えら
れた従来のものに、特開平6−118995号がある。
信号をLPC分析してスペクトルパラメータを算出し、
このスペクトルパラメータを狭帯域符号帳を用いてベク
トル量子化する。そして、狭帯域符号帳と対応づけて学
習した広帯域符号帳を用いて広帯域のスペクトルパラメ
ータを復号する。このスペクトルパラメータを用いてL
PC合成処理を行い、仮の広帯域音声信号を得る。狭帯
域音声信号をアップサンプリングしたものに、仮の広帯
域音声信号から狭帯域音声信号以外の帯域成分を抽出し
て加算することで、最終的な広帯域音声信号を生成す
る。なお、広帯域のLPC合成処理を行う場合には、広
帯域の音源信号が必要となるが、この音源信号の生成方
法については具体的に開示されていない。
ち、広帯域の音源信号生成について開示されている文献
として、文献1「コードブックマッピングによる狭帯域
音声から広帯域音声の復元」電子情報通信学会、信学技
報SP93-61 (1993-08) がある。
して2つの方法が開示されている。第1の方法は、狭帯
域音声を分析して得られたピッチとパワーを用いて、同
業者間では一般的な方法によって音源生成を行う。すな
わち、有声音ではピッチ周期で繰り返すインパルス列、
無声音では白色雑音を生成し、パワーによってその振幅
を決定する。なお文献1では、音質改善のために幾つか
の後処理を行っている。300Hz以下の低域を復元す
る場合には、復元帯域のパワー不足を補うために低域復
元音のパワーを低数倍する。3.4Hzから7.3KH
zの高域を復元する場合には、インパルス列を音源とし
たことによって発生するパルス的な音を軽減するために
パルスをつぶすようにcosine関数をかける。
ルパラメータをベクトル量子化し、得られた符号に対応
する狭帯域の代表波形素片と高域の代表波形素片を選択
する。そして、この2つの波形素片に対して以下の処理
を行う。波形素片の有声無声を判定し、有声音の場合に
は狭帯域音声信号を分析して得られたピッチに同期して
前記波形素片を重ね合わせる。無声音の場合には、波形
素片のランダムな位置から必要な長さの信号を切り出
す。狭帯域波形素片から上記処理によって生成された信
号と狭帯域スペクトルパラメータを用いて合成された合
成音と狭帯域音声のパワー比を算出する。そして、高域
波形素片から上記処理によって生成された信号と広帯域
のスペクトルパラメータを用いて合成音を生成し、これ
に前記パワー比を乗ずることで高域の復元信号を得る。
げる別の方法として、文献2「 A 2.4Kbps High−Qauli
ty Speech Coder 」IEEE International Conference on
Acoustics, Speech, and Signal Processing vol.1, S
9.5, pp. 589-592 (1991.5)に開示されているものがあ
る。
し、復号化する方式に関するもので、符号化する際の音
源の情報量を削減するために、0Hzから3.4KHz
の音源信号を長周期予測分析し、長周期予測係数と長周
期予測残差信号に分離する。0Hzから3.4KHzの
長周期予測残差信号を0Hzから1KHzに帯域制限し
て符号化を行う。そして、復号化する際に帯域制限され
た長周期予測残差信号から3.4KHzまでの電話帯域
の長周期予測残差信号を生成した後、長周期合成処理を
行って音源信号を復元するものである。長周期予測残差
信号の復元は、0Hzから1KHzの成分を持つ信号を
8KHzのサンプリング周波数にアップサンプリングし
た後、4サンプル間隔で残し、それ以外を零にすること
で行っている。
下に述べる課題がある。特開平6−118995号と、
別の文献ではあるが、その具体的実用例を開示している
文献1では、大別して次の4つの課題、つまり音源振幅
推定、音源生成方法、スペクトルパラメータ推定法、通
信系への適用に関する課題がある。まず、第1の音源振
幅推定に関して説明する。文献1の第1の音源生成方法
を用いる場合、復元音の合成に用いるパワーについて
は、狭帯域音声を分析して得られたパワー値をそのま
ま、もしくは定数倍して用いているが、狭帯域のスペク
トルパラメータと推定された広帯域のスペクトルパラメ
ータでは合成フィルタの利得が異なるので、同一の音源
振幅を与えても得られる合成音の振幅が異なって来る。
この差異がフレーム毎に変化するため、音源振幅、つま
りパワー値を定数倍する事では、正しい振幅を持った広
帯域音声は復元されない課題がある。また、文献1の第
2の音源生成方法を用いる場合、狭帯域合成音を生成し
て狭帯域音声とのパワー比を算出して、高域合成音に乗
じているが、2つの波形素片に対して複雑な処理を実行
する事が必要となる課題がある。
する。文献1の第1の音源生成方法を用いる場合、ピッ
チとパワーという僅かな情報だけで広帯域音源信号の生
成を行うので、様々に変化する本来の広帯域音源を十分
に推定する事はできない。この結果、cosine関数
によってパルス的な音の軽減を行っているが、完全にパ
ルス的な音の抑圧はできず、音質が不自然となる課題が
ある。また、話者毎に大きく性質が異なる有声音源を1
つの固定音源で表現する事に無理があるため、話者によ
って音質が劣化する課題がある。文献1の第2の音源生
成方法を用いる場合、スペクトルパラメータのベクトル
量子化結果の符号に対応する代表波形素片を用いている
が、本来スペクトルパラメータは声道の形状に依存し、
音源波形は声帯の振動の仕方に依存するものであるの
で、両者の間に強い対応関係は無い。音源波形は、むし
ろ話者に依存する所が大きい。従って、適切な音源が選
択されない課題がある。
の音源生成法を用いた場合には、有声音であるにもかか
わらず無声音の波形素片を選択したり、逆に無声音であ
るにもかかわらず有声音の波形素片を選択してしまう場
合があり、そのまま合成を行うと品質劣化を起こす課題
がある。この事を回避するために、その部分でのパワー
比を強制的に0としているが、この結果、復元された高
域の振幅が部分的に0となってしまい別の品質劣化を起
こす課題がある。更に、どちらの音源生成法において
も、有声無声判定、ピッチ抽出誤りが起こった場合の品
質劣化が避けられないという課題がある。特に、雑音が
重畳した狭帯域音声信号に対して適用した場合に、判定
誤り、抽出誤りが増大し、大きな劣化が起こる課題があ
る。また、有声音と無声音の2つのモードしかないた
め、中間的な性質を持つ音源が十分表現できず、有声音
と無声音の境界部分において品質劣化が起こる課題があ
る。
法に関して説明する。特開平6−118995号と文献
1では、2つの符号帳を利用したベクトル量子化と逆量
子化を行っているが、符号帳を蓄積しておくメモリが必
要である事、量子化処理のための多くの演算量が必要で
ある事が課題である。また、雑音、無声音、有声音の区
別はパワーによってしやすく、かつそれらの区別によっ
て狭帯域のスペクトルパラメータと広帯域のスペクトル
パラメータの対応関係は変化する。しかしながら、何れ
の場合も、スペクトルパラメータとパワーを独立に扱っ
ているので、広帯域のスペクトルパラメータの推定にパ
ワーに関する情報が反映されていない。このため、狭帯
域のスペクトルの形状が類似していれば、パワーの大小
に関係なく、同様な広帯域スペクトルが推定されてしま
う課題がある。
する。特開平6−118995号と文献1の方法を通信
系へ適用する場合、受信した音声符号から狭帯域合成音
を復号した後、この狭帯域合成音を再分析して広帯域音
声信号を復元する事となるが、スペクトルパラメータと
音源情報が分離・符号化されて伝送されてくる場合に
は、その音声符号を直接利用して広帯域音声信号を復元
する方が効率的と考えられる。つまり、特開平6−11
8995号と文献1の方法は再分析が必要である点で非
効率である課題がある。また、合成と再分析を行って得
られるパラメータには、合成時の補間や分析時の窓掛等
による歪が重畳しており、広帯域音声の品質劣化もあ
る。
1では、一般に合成音の雑音感の低減や了解性の改善の
ために導入される信号加工処理を付加していないため、
復元された広帯域音声信号の音質が不足する場合にその
改善をする事ができない課題がある。また、通信系へ適
用する場合、狭帯域合成音に対して信号加工処理が適用
されることがあり、加工された狭帯域音声信号と加工さ
れていない広帯域音声信号を重畳するために、両者の音
質の連続性が悪くなる課題がある。
狭帯域、0Hzから3.4KHzを広帯域と考えれば、
広帯域の音源信号推定を行っていることになるが、前記
した通りこの方式は広帯域の音声信号を入力とし、これ
を分析して得たパラメータを符号化し、復号化して広帯
域合成音を得るものであり、狭帯域の音声信号、または
狭帯域の音声信号から抽出されたパラメータから広帯域
の音声信号を復元する方法を開示したものではない。
なされたものであり、狭帯域音声からより正しい振幅を
持った広帯域音声信号を復元する広帯域音声復元装置を
実現する事を目的としている。また、比較的簡単な処理
の広帯域音源振幅の推定処理を持った広帯域音声復元装
置を実現する事を目的としている。更に、話者に依存性
が少なく、有声無声境界付近でも良好な広帯域音源を推
定し、安定で自然な音質の広帯域音声を復元する広帯域
音声復元装置を実現する事を目的としている。また、雑
音が重畳した狭帯域音声信号に対して起こりがちな有声
無声判定誤りやピッチ抽出誤りの影響の少ない広帯域音
声復元装置を実現する事を目的としている。更に、通信
系へ適用した場合に、再分析を行わずに効率良く広帯域
音声の復元を行う広帯域音声復元装置を実現する事を目
的としている。更に、復元された広帯域音声信号の音質
が不足する場合にその改善を可能とし、狭帯域合成音に
対して信号加工処理が適用される場合に、加工された狭
帯域連続性が良い広帯域音声信号が得られる広帯域音声
復元装置を実現する事を目的としている。
声復元装置は、狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号を得る分析手段と、こ
の狭帯域スペクトルパラメータを用いて広帯域スペクト
ルパラメータを推定するスペクトル推定手段と、狭帯域
音源信号を用い広帯域音源信号を推定する広帯域音源推
定手段と、この推定された広帯域スペクトルパラメータ
と広帯域音源信号とから広帯域音声信号を生成する合成
手段を備えた。
力の狭帯域音源信号の各サンプル間隔中に所定の零値を
挿入する零詰手段を用いた。
域音源信号を分析して狭帯域適応音源符号と狭帯域駆動
音源信号を得る音源分析手段と、この狭帯域適応音源符
号を用いて広帯域適応音源信号を推定する適応音源推定
手段と、狭帯域駆動音源信号を用いて広帯域駆動音源信
号を推定する駆動音源推定手段と、この推定された広帯
域適応音源信号と広帯域駆動音源信号とから広帯域音源
信号を生成する加算手段とで構成した。
帯域音源信号を分析して狭帯域長周期予測符号と狭帯域
長周期予測残差信号を得る音源分析手段と、この狭帯域
長周期予測残差信号を用いて広帯域長周期予測残差信号
を推定する長周期予測残差推定手段と、狭帯域長周期予
測符号を用いて広帯域長周期予測符号を推定する広帯域
長周期予測符号推定手段と、これら推定された広帯域長
周期予測残差信号と広帯域長周期予測符号とから広帯域
音源信号を合成する長周期合成手段とで構成した。
域音声信号を分析して狭帯域スペクトルパラメータと狭
帯域振幅情報とを得る分析手段と、この狭帯域スペクト
ルパラメータと狭帯域振幅情報を用いて少なくとも広帯
域スペクトルパラメータまたは広帯域振幅情報を推定す
るスペクトル推定手段と、これら推定された広帯域スペ
クトルパラメータと広帯域振幅情報または広帯域音源信
号とから広帯域音声信号を生成する合成手段を備えた。
声信号を推定する広帯域推定手段と、推定された広帯域
音声信号に対してポストフィルタリングを行うポストフ
ィルタ手段を備えた。
スペクトルパラメータを得る分析手段と、狭帯域スペク
トルパラメータをそのまま広帯域スペクトルパラメータ
として用いて広帯域スペクトルパラメータを出力するス
ペクトル推定手段と、この出力された広帯域スペクトル
パラメータから広帯域音声信号を生成する合成手段を備
えた。
スペクトルパラメータを得る分析手段と、狭帯域スペク
トルパラメータを必要に応じて別領域に変換し、変形を
行い、スペクトルパラメータの領域に逆変換して広帯域
スペクトルパラメータを出力するスペクトル推定手段
と、この出力された広帯域スペクトルパラメータから広
帯域音声信号を生成する合成手段を備えた。
域音声符号から広帯域スペクトルパラメータを推定する
スペクトル復号手段と、この推定された広帯域スペクト
ルパラメータから広帯域音声信号を生成する合成手段を
備えた。
帯域スペクトル符号を用いて広帯域スペクトルパラメー
タを推定するスペクトル復号手段と、狭帯域音声符号か
ら分離された狭帯域音源符号を用いて広帯域音源信号を
推定する広帯域音源復号手段と、この推定された広帯域
スペクトルパラメータと広帯域音源信号とから広帯域音
声信号を生成する合成手段を備えた。
帯域音源符号から復元した狭帯域音源信号の各サンプル
間隔中に所定の零値を挿入する零詰手段を用いた。
帯域音声符号から分離した狭帯域適応音源符号を用いて
広帯域適応音源信号を推定する広帯域適応音源復号手段
と、入力の狭帯域音声符号から分離した狭帯域駆動音源
符号を用いて広帯域駆動音源信号を推定する広帯域駆動
音源復号手段と、これらの推定された広帯域適応音源信
号と広帯域駆動音源信号とから広帯域音源信号を生成す
る加算手段とで構成した。
帯域音声符号から分離した狭帯域長周期予測符号を用い
て広帯域長周期予測符号を推定する広帯域長周期予測符
号復号手段と、入力の狭帯域音声符号から分離した狭帯
域長周期予測残差符号を用いて広帯域長周期予測残差信
号を推定する広帯域長周期予測残差復号手段と、これら
推定された広帯域長周期予測符号と広帯域長周期予測残
差信号とから広帯域音源信号を生成する加算手段とで構
成した。
帯域音源符号を用いて狭帯域振幅情報を推定する狭帯域
振幅情報復号手段と、狭帯域音声符号から分離された狭
帯域スペクトル符号と狭帯域振幅情報を用いて少なくと
も広帯域スペクトルパラメータまたは広帯域振幅情報を
推定するスペクトル復号手段と、この推定された広帯域
スペクトルパラメータと必要に応じて広帯域振幅情報ま
たは広帯域音源信号とから広帯域音声信号を生成する合
成手段を備えた。
声信号を推定する広帯域音声復号手段と、この復号し推
定された広帯域音声信号に対してポストフィルタリング
を行うポストフィルタ手段を備えた。
スペクトルパラメータを用いて推定した広帯域スペクト
ルパラメータと、狭帯域音源信号を用いて推定した広帯
域音源信号とから広帯域音声信号が合成される。
定個ずつの零を挿入する事で広帯域音源信号が生成さ
れ、これと推定した広帯域スペクトルとを用いて広帯域
音声信号が合成される。
は、入力の狭帯域音源信号を分析して狭帯域適応音源符
号と狭帯域駆動音源信号が算出され、この狭帯域適応音
源符号を用いて推定した広帯域適応音源信号と、狭帯域
駆動音源を用いて推定した広帯域駆動音源信号とを加算
して広帯域音源信号とした。これと推定した広帯域スペ
クトルとを用いて広帯域音声信号が合成される。
として、入力狭帯域音源信号を分析して狭帯域長周期予
測符号と狭帯域長周期残差信号が算出され、狭帯域長周
期予測符号を用いて推定した広帯域長周期予測符号と、
狭帯域長周期残差信号を用いて推定した広帯域長周期残
差信号とを用いて広帯域音源信号とした。これと推定し
た広帯域スペクトルとを用いて広帯域音声信号が合成さ
れる。
装置は、狭帯域音声信号を分析して狭帯域スペクトルパ
ラメータと狭帯域振幅情報と狭帯域音源信号が算出さ
れ、狭帯域スペクトルパラメータと狭帯域振幅情報を用
いて広帯域スペクトルパラメータと広帯域振幅情報のい
ずれかまたはその両方が推定される。その後、これらの
信号と狭帯域音源信号から推定された広帯域音源信号と
で広帯域音声信号が合成される。
装置は、狭帯域音声信号を用いて推定した広帯域音声信
号にポストフィルタリングが行われ、主として、高域特
性が加工される。
装置は、狭帯域スペクトルパラメータの特性を全域に伸
張して広帯域スペクトルパラメータとして用いて広帯域
音声信号が合成される。
装置は、狭帯域スペクトルパラメータの特定次数までを
用い、これを対応するスペクトルパラメータに逆変換す
る事で広帯域スペクトルパラメータを得、これを用いて
広帯域音声信号が合成される。
装置は、狭帯域音声符号を用いて狭帯域合成音の生成と
広帯域音声信号の推定を行い、狭帯域合成音をアップサ
ンプリングした信号または狭帯域合成音に、前記広帯域
音声信号の狭帯域合成音以外の主として高域の帯域の成
分を抽出した信号を加算して広帯域音声信号が合成され
る。
装置は、狭帯域スペクトル符号を用いて推定した広帯域
スペクトルパラメータと、狭帯域音源符号を用いて推定
した広帯域音源信号とを用いて広帯域音声信号が合成さ
れる。
狭帯域音源符号を用いて復号した狭帯域音源の各サンプ
ル間に所定個ずつの零値を挿入する事で広帯域音源信号
が生成され、これと推定した広帯域スペクトルとを用い
て広帯域音声信号が合成される。
手段により、狭帯域適応音源符号を用いて推定した広帯
域適応音源信号と、狭帯域駆動音源信号から推定した広
帯域駆動音源信号が加算されて広帯域音源信号が生成さ
れる。これと推定した広帯域スペクトルとを用いて広帯
域音声信号が合成される。
手段により、狭帯域音源符号を用いて推定した広帯域長
周期予測符号と、狭帯域長周期予測残差信号から推定さ
れた広帯域長周期残差信号とから広帯域音源信号が合成
される。これと推定した広帯域スペクトルとを用いて広
帯域音声信号が合成される。
装置は、狭帯域スペクトル符号と狭帯域振幅情報を用い
て広帯域スペクトルパラメータと広帯域振幅情報のいず
れかまたはその両方が推定される。その後、これらの情
報と狭帯域音源信号から推定された広帯域音源信号とで
広帯域音声信号が合成される。
装置は、狭帯域音声符号を用いて推定した広帯域音声信
号にポストフィルタリングが行われ、主として高域特性
が加工される。
本実施例は、主として広帯域音源信号の生成をより正し
い形で復元する構成と動作を説明するものである。図1
は本発明の実施例1の広帯域音声復元装置の構成図であ
る。図において、1は入力の狭帯域音声信号、2は分析
手段、3はスペクトル分析手段、4は狭帯域スペクトル
パラメータ、5は逆フィルタ、6は狭帯域音源信号、7
は広帯域スペクトル推定手段、8はベクトル量子化手
段、9は狭帯域スペクトル符号帳、10はスペクトル符
号、11は逆量子化手段、12は広帯域スペクトル符号
帳、13は広帯域スペクトルパラメータである。14は
本実施例での重要な新規構成要素である広帯域音源推定
手段、15はその具体例としての零詰手段、16は広帯
域音源信号、17は合成手段としての合成フィルタ、1
8は帯域フィルタ、19はアップサンプリング手段、2
0は広帯域音声信号である。また、図2は、零詰手段1
5の処理を説明する信号説明図である。
1の動作について説明する。まず、例えば8KHzでサ
ンプリングされ、300Hzから3.4KHzの電話帯
域に制限された狭帯域音声信号1が分析手段2とアップ
サンプリング手段19に入力される。分析手段2内のス
ペクトル分析手段3は、狭帯域音声信号1を分析して狭
帯域スペクトルパラメータ4を算出し、分析手段2内の
逆フィルタ5と広帯域スペクトル推定手段7内に出力す
る。なお、狭帯域スペクトルパラメータ4としては、線
形予測係数、LSP、PARCOR係数、ケプストラム
等様々なものが適用可能である。逆フィルタ5は、狭帯
域スペクトルパラメータ4を用いて狭帯域音声信号1を
逆フィルタリングし、得られた狭帯域音源信号6を広帯
域音源推定手段14内に出力する。
量子化手段8は、狭帯域スペクトル符号帳9を用いて前
記狭帯域スペクトルパラメータ4をベクトル量子化し、
得られたスペクトル符号10を広帯域スペクトル推定手
段7内の逆量子化手段11に出力する。逆量子化手段1
1は、広帯域スペクトル符号帳12を用いてスペクトル
符号10を逆量子化し、得られた広帯域スペクトルパラ
メータ13を合成フィルタ17に出力する。なお、この
広帯域スペクトル推定手段7内の処理は、文献1と同様
であり、狭帯域スペクトル符号帳9と広帯域スペクトル
符号帳12の生成法や、ベクトル量子化の方法に関する
詳細な説明を省略する。
手段14内の零詰手段15は、狭帯域音源信号6の各サ
ンプル値間にM−1サンプルずつ零を挿入し、得られた
M倍のサンプル数の信号を広帯域音源信号16として合
成フィルタ17に出力する。ここで、Mは、復元する広
帯域音声信号のサンプリング周波数を、狭帯域音声信号
のサンプリング周波数で除した値であり、この実施例で
は、Mが2の場合について説明する。図2(a)は、N
サンプルの狭帯域音源信号6である。この信号に対し
て、零詰手段15による零詰め処理を行うと、M−1サ
ンプル、つまり1サンプルずつの零が各サンプル間に挿
入されて、図2(b)に示す2Nサンプルの広帯域音源
信号16が得られる。Mが2の零詰め処理を行うと、広
帯域音声信号のサンプリング周波数の半分の周波数、つ
まり4KHzを中心にして、0Hzから4KHzと対称
のスペクトルが4KHzから8KHzに復元される。
ラメータ13を用いて広帯域音源信号16に合成フィル
タ処理を行い仮の広帯域音声信号を生成する。帯域フィ
ルタ18は、この仮の広帯域音声信号に対して、帯域通
過フィルタ処理を行い、狭帯域音声の成分の存在する帯
域以外の成分を抽出する。広帯域音声信号の帯域が0H
zから7.3KHzの場合、0Hzから300Hzと
3.4KHzから7.3KHzの成分が抽出される。ア
ップサンプリング手段19は、狭帯域音声信号1をM倍
にアップサンプリングする。アップサンプリングによっ
て生成される信号は、サンプリング周波数が広帯域音声
信号20と同じで、狭帯域音声信号1と同じ狭帯域成分
を持つものである。そして、帯域フィルタ18の出力と
アップサンプリング手段19の出力を加算して広帯域音
声信号20を生成する。
同一の発声器官から生成された音源信号の特徴を反映し
ているので、ピッチ周波数の高調波成分の強さ、高調波
成分間の雑音的成分の強さ等の音源信号の特徴において
相関がある。つまり、狭帯域音源信号がピッチ周波数の
高調波成分が強い規則的な特徴を持っている場合には、
広帯域音源信号も同様にピッチ周波数の高調波成分が強
い規則的な特徴を持っているし、逆に狭帯域音源信号が
雑音的な成分が強い特徴を持っている場合には、広帯域
音源信号も同様に雑音的な成分が強い特徴を持ってい
る。この実施例の様に広帯域音源推定手段を構成する事
により、低域の0〜4KHzの狭帯域音源信号と同様の
特徴を持つ0〜8KHzの広帯域音源信号を生成する事
ができるので、話者に依存性が少なく、安定で自然な音
質の広帯域音声を復元することができる効果がある。ま
た、従来例のように有声無声判定やピッチ抽出が必要な
く、本構成により自ずと中間的な性質の音源も表現でき
るので、雑音が重畳した狭帯域音声信号に対して起こり
がちな有声無声判定誤りやピッチ抽出誤りの影響がな
く、有声無声境界付近でも良好な広帯域音源を推定する
ことができ、安定で自然な音質の広帯域音声を復元する
ことができる効果がある。
域音声復元装置における音源推定手段14の構成図であ
る。図において新規な部分は、21の音源分析手段、2
2の狭帯域適応符号帳、23の歪最小化手段、24の狭
帯域駆動音源信号、25の狭帯域適応ラグ長、26の狭
帯域適応ゲイン、27の広帯域駆動音源推定手段、28
の零詰手段、29の広帯域駆動音源信号、30の広帯域
適応音源推定手段、31の広帯域適応音源符号帳、32
の広帯域適応音源信号、33の広帯域適応ラグ長、34
の広帯域適応ゲインである。全体構成は、図1と同じで
あるので、構成の記載と図3以外の部分の動作の説明を
省略する。本構成によれば、広帯域音源信号が更により
よく復元できる。
作について説明する。狭帯域音源信号6が広帯域音源推
定手段14内の音源分析手段21に入力される。音源分
析手段21内の狭帯域適応符号帳22には、過去の狭帯
域音源信号6が記憶されており、後述する歪最小化手段
23が順次出力するラグ長に従って、ラグ長が整数値で
ある場合には記憶してある過去の狭帯域音源信号6をこ
のラグ長で繰り返して得られる信号を出力する。ラグ長
が非整数値である場合には、文献3「 Pitch Predictor
s with High Temporal Resolution 」IEEE Internatio
nal Conference on Acoustics, Speech, and Signal Pr
ocessing vol.2, S12.6, pp.661-664 (1990.4) に記載
されているようにポリフェイズフィルタ出力により信号
を生成し、出力する。出力する信号の長さは、現在の狭
帯域音源信号6と同じ長さである。
れている過去の狭帯域音源信号6と、入力されたラグ長
に従って出力される信号の例を示す。図において、横軸
は時間で矢印方向に時間が経過することを示す。(A
1),(B1)は従って音源信号の時間的な長さを示
し、(A2),(B2)は20〜128等、出力される
時間に対して正規化されたラグ長を示し、(A3),
(B3)は出力される音源信号の例を示す。図4(a)
は出力信号の長さがラグ長より短い場合を示し、その場
合にはラグ長の最初から出力信号時間T1の長さの音源
信号(A3)を過去の音源信号に引続いて出力する。ラ
グ長が出力する信号の長さよりもT2のように短い時に
は、図4(b)に示す様に複数回同じ音源信号(B3)
を繰り返して過去の音源信号に続いて出力する。
帳22に対して複数のラグ長の値を順次出力し、各ラグ
長に対して狭帯域適応符号帳22が出力した信号にゲイ
ンを乗じた信号と狭帯域音源信号6との歪が最小になる
ようにそのゲインを決定していく。そして、全てのラグ
長に中で歪を最小にするものを選択し、狭帯域適応ラグ
長25として広帯域適応音源推定手段30に出力する。
また、その時のゲインの値を狭帯域適応ゲイン26とし
て広帯域適応音源推定手段30に出力し、狭帯域適応符
号帳22が出力した信号に狭帯域適応ゲイン26を乗じ
た信号と狭帯域音源信号6の誤差信号を狭帯域駆動音源
信号24として広帯域駆動音源推定手段27に出力す
る。なお、歪最小化手段23内でのゲインの決定方法と
しては、一般に知られているラグランジュの未定係数法
を用いる事ができる。即ち歪最小化手段23は、狭帯域
音源信号6と狭帯域適応符号帳22出力を入力とし、狭
帯域適応音源符号である歪最小のラグ長25とゲイン2
6と、誤差信号の狭帯域駆動音源信号24を出力する。
28は、狭帯域駆動音源信号24の各サンプル値間にM
−1サンプルずつ零を挿入し、得られたM倍のサンプル
数の信号を広帯域駆動音源信号29として出力する。こ
こで、Mは、復元する広帯域音声信号のサンプリング周
波数を、狭帯域音声信号のサンプリング周波数で除した
値であり、零を挿入する動作は前記零詰手段15と同じ
である。
狭帯域適応ラグ長25をM倍して広帯域適応ラグ長33
とし、狭帯域適応ゲイン26をg倍して広帯域適応ゲイ
ン34とする。gを1とすると最終的に得られる広帯域
音源信号16のピッチ周期性が狭帯域音源信号6と同等
となり、1から小さくしていくにつれて狭帯域音源信号
6に比べてピッチ周期性が弱くなっていく。実際の音声
を観察すると、周波数が高い部分ほどピッチ周期性が弱
くなっていく場合がおおいので、高域を復元する場合に
gを1より小さい値に設定するとより高品質な広帯域音
声が復元できる。広帯域適応音源推定手段30内の広帯
域適応音源符号帳31には、過去の広帯域音源信号16
が記憶されており、この信号を前記広帯域適応ラグ長3
3で繰り返して得られる信号を出力する。そして広帯域
適応音源推定手段30内でこの信号を前記広帯域適応ゲ
イン34で乗算して、広帯域適応音源信号32として出
力する。最後に広帯域駆動音源信号29と広帯域適応音
源信号32を加算して、広帯域音源信号16として出力
する。
号の持つピッチ周期性の強さや変動に関する特徴が、狭
帯域適応ラグ長25と狭帯域適応ゲイン26によって良
好に表現され、広帯域音源信号に反映されるので、様々
に変化する音源を十分に推定でき、パルス的な音もな
く、良好な音質の広帯域音声を復元することができる効
果がある。また、話者によらずに適切な音源が推定でき
る効果がある。広帯域適応音源信号32において、広帯
域適応ラグ長33によって決まる基本周波数とその高調
波成分の周波数が、正しく整数倍の位置に並ぶので、最
終的に復元される広帯域音声信号20での狭帯域成分と
復元広帯域成分のつながりが良く、高品質な広帯域音声
を復元できる効果がある。更に、周波数が高くなるにつ
れてピッチ周期性が弱くなっていく特徴を係数gによっ
て導入する事ができるので、より自然な音質が得られる
効果がある。また、有声無声判定やピッチ抽出が必要な
く、中間的な性質の音源も表現できるので、雑音が重畳
した狭帯域音声信号に対して起こりがちな有声無声判定
誤りやピッチ抽出誤りの影響がなく、有声無声境界付近
でも良好な広帯域音源を推定することができ、安定で自
然な音質の広帯域音声を復元することができる効果があ
る。
域音声復元装置における広帯域駆動音源推定手段27の
構成図である。図において新規な部分は、35のパワー
算出手段、36の雑音生成手段である。その他の構成は
図1および図3と同じであるので、対応部分の動作の説
明を省略する。
に示された部分の動作について説明する。狭帯域駆動音
源信号24が広帯域駆動音源推定手段27内のパワー算
出手段35に入力される。パワー算出手段35は狭帯域
駆動音源信号24のパワーを算出し、出力する。雑音生
成手段36は、パワー正規化された白色雑音信号を生成
し出力する。そして、広帯域駆動音源推定手段27内
で、前記白色雑音信号にパワー算出手段35が出力した
パワーを乗じ、得られた信号を広帯域駆動音源信号29
として出力する。
している。狭帯域音源信号6におけるピッチ周期や周期
性の強さの細かい変動分は狭帯域適応ラグ長25と狭帯
域適応ゲイン26では表現できないため、その誤差が狭
帯域駆動音源信号24に含まれている。実施例2のよう
にこの誤差成分を含む狭帯域駆動音源信号24を用いて
広帯域駆動音源信号29を生成すると、広帯域駆動音源
信号29に不必要な乱れが生じてしまう事があり、パワ
ーが同じ白色雑音を生成して広帯域駆動音源信号29と
して用いた方が良好な復元音が得られる場合がある事を
実験的に確認している。実施例3の様に構成する事によ
り、狭帯域駆動音源信号24とパワーが同じ白色雑音を
生成して広帯域駆動音源信号29として用いているの
で、実施例2が持つ効果に加えて、ピッチ周期や周期性
の強さの変動分による乱れの少ない良好な復元音が得ら
れる効果がある。
に対称なスペクトルが生成される。従って、この0Hz
から300Hzと3.4KHzから4.0KHzの成分
がない狭帯域駆動音源信号24に対して零詰めを行う
と、0Hzから300Hz、3.4KHzから4.6K
Hz、7.7KHzから8KHzの成分がない信号が得
られてしまう。これに対し、白色雑音を用いるこの構成
では、0Hzから8KHzまで全ての成分を持つ広帯域
駆動音源信号29が得られるので、全域にわたって帯域
がある良好な復元音が得られる効果がある。特に0Hz
から300Hzの復元を行う場合には効果が大きい。
域音声復元装置における広帯域駆動音源推定手段27の
構成図である。図において、28の零詰手段、35のパ
ワー算出手段、36の雑音生成手段は実施例2および実
施例3のものと同一である。その他の構成は図1および
図3と同じであるので、図示以外の部分の動作の説明を
省略する。
作について説明する。狭帯域駆動音源信号24が広帯域
駆動音源推定手段27内の零詰手段28とパワー算出手
段35に入力される。広帯域駆動音源推定手段27内の
零詰手段28は、狭帯域駆動音源信号24の各サンプル
値間にM−1サンプルずつ零を挿入し、得られたM倍の
サンプル数の信号を出力する。ここで、Mは、復元する
広帯域音声信号のサンプリング周波数を、狭帯域音声信
号のサンプリング周波数で除した値であり、零を挿入す
る動作は前記零詰手段15と同じである。パワー算出手
段35は狭帯域駆動音源信号24のパワーを算出し、出
力する。雑音生成手段36は、パワー正規化された白色
雑音信号を生成し出力する。そして、零詰手段28が出
力した信号にゲインgr1を乗じた信号と、雑音生成手
段36が出力した白色雑音信号にパワー算出手段35が
出力したパワーを乗じ、さらにゲインgr2を乗じた信
号を加算して広帯域駆動音源信号29として出力する。
それぞれ一長一短を有している場合、この様に構成し、
gr1とgr2を適切に設定することで、両者を上回る
品質の広帯域音声が復元できる得られる効果がある。な
お、実施例2と実施例3と同じ効果も持っている。
出来る他の構成を説明する。図7は本発明の実施例5の
広帯域音声復元装置における広帯域音源推定手段14の
構成図である。図において新規な部分は、37の狭帯域
長周期予測分析手段、38の狭帯域長周期遅延、39の
狭帯域長周期予測係数、40の長周期逆フィルタ、41
の狭帯域長周期予測残差信号、42の広帯域長周期予測
残差推定手段、43の零詰手段、44の広帯域長周期予
測パラメータ(符号)推定手段、45の広帯域長周期遅
延、46の広帯域長周期予測係数、47の長周期合成フ
ィルタ、48の広帯域長周期予測残差信号である。全体
構成は、図1と同じであるので、説明を省略する。
作について説明する。狭帯域音源信号6が広帯域音源推
定手段14内の音源分析手段21に入力される。音源分
析手段21内の狭帯域長周期予測分析手段37は、狭帯
域音源信号6に対して長周期予測分析を行い、狭帯域長
周期予測符号である狭帯域長周期遅延38と狭帯域長周
期予測係数39を出力する。なお、長周期予測分析につ
いては、CELP系の符号化方式でしばしば用いられて
いた方法であるので説明を省略する。音源分析手段21
内の長周期逆フィルタ40は、狭帯域長周期遅延38と
狭帯域長周期予測係数39を用いて狭帯域音源信号6を
逆フィルタリングし、得られた信号を狭帯域長周期予測
残差信号41として広帯域長周期予測残差推定手段42
に出力する。
詰手段43は狭帯域長周期予測残差信号41の各サンプ
ル値間にM−1サンプルずつ零を挿入し、得られたM倍
のサンプル数の信号を広帯域長周期予測残差信号48と
して出力する。ここで、Mは、復元する広帯域音声信号
のサンプリング周波数を、狭帯域音声信号のサンプリン
グ周波数で除した値であり、零を挿入する動作は前記零
詰手段15と同じである。
手段44は、狭帯域長周期遅延38をM倍して予測符号
の1つである広帯域長周期遅延45を出力し、また狭帯
域長周期予測係数39をg倍して他の予測符号である広
帯域長周期予測係数46を出力する。gを1とすると最
終的に得られる広帯域音源信号16のピッチ周期性が狭
帯域音源信号6と同等となり、1から小さくしていくに
つれて狭帯域音源信号6に比べてピッチ周期性が弱くな
っていく。実施例2と同様に、高域を復元する場合には
gを1より小さい値に設定した方が高品質となる。最後
に、長周期合成フィルタ47は、広帯域長周期遅延45
と広帯域長周期予測係数46を用いて、広帯域長周期予
測残差信号48に対して長周期合成フィルタリングを行
い、得られた信号を広帯域音源信号16として出力す
る。
号の持つピッチ周期性の強さや変動に関する特徴が、狭
帯域長周期遅延38と狭帯域長周期予測係数39によっ
て良好に表現され、広帯域音源信号に反映されるので、
様々に変化する音源を十分に推定でき、パルス的な音も
なく、良好な音質の広帯域音声を復元することができる
効果がある。また、話者によらずに適切な音源が推定で
きる効果がある。広帯域音源信号16において、広帯域
長周期遅延45によって決まる基本周波数とその高調波
成分の周波数が、正しく整数倍の位置に並ぶので、最終
的に復元される広帯域音声信号20での狭帯域成分と復
元広帯域成分のつながりが良く、高品質な広帯域音声を
復元できる効果がある。更に、周波数が高くなるにつれ
てピッチ周期性が弱くなっていく特徴を係数gによって
導入する事ができるので、より自然な音質が得られる効
果がある。また、有声無声判定やピッチ抽出が必要な
く、中間的な性質の音源も表現できるので、雑音が重畳
した狭帯域音声信号に対して起こりがちな有声無声判定
誤りやピッチ抽出誤りの影響がなく、有声無声境界付近
でも良好な広帯域音源を推定することができ、安定で自
然な音質の広帯域音声を復元することができる効果があ
る。
域音声復元装置における広帯域長周期予測残差推定手段
42の構成図である。図において、35のパワー算出手
段、36の雑音生成手段は実施例3のものと同一であ
る。その他の構成は図1および図7と同じであるので、
説明を省略する。
作について説明する。狭帯域長周期予測残差信号41が
広帯域長周期予測残差推定手段42内のパワー算出手段
35に入力される。パワー算出手段35は狭帯域長周期
予測残差信号41のパワーを算出し、出力する。雑音生
成手段36は、パワー正規化された白色雑音信号を生成
し出力する。そして、広帯域長周期予測残差推定手段4
2内で、前記白色雑音信号にパワー算出手段35が出力
したパワーを乗じ、得られた信号を広帯域長周期予測残
差信号48として出力する。
号6におけるピッチ周期や周期性の強さの細かい変動分
は狭帯域長周期遅延38と狭帯域長周期予測係数39で
は表現できないため、その誤差が狭帯域長周期予測残差
信号41に含まれている。実施例5のようにこの誤差成
分を含む狭帯域長周期予測残差信号41を用いて広帯域
長周期予測残差信号48を生成すると広帯域長周期予測
残差信号48に不必要な乱れが生じてしまう事があり、
パワーが同じ白色雑音を生成して広帯域長周期予測残差
信号48として用いた方が良好な復元音が得られる場合
がある。実施例6の様に構成する事により、狭帯域長周
期予測残差信号41とパワーが同じ白色雑音を生成して
広帯域長周期予測残差信号48として用いているので、
実施例5が持つ効果に加えて、ピッチ周期や周期性の強
さの変動分による乱れの少ない良好な復元音が得られる
効果がある。
に対称なスペクトルが生成されるので、この0Hzから
300Hzと3.4KHzから4.0KHzの成分がな
い狭帯域長周期予測残差信号41に対して行うと、0H
zから300Hz、3.4KHzから4.6、KHz
7.7KHzから8KHzの成分がない信号が得られて
しまう。これに対し、白色雑音を用いるこの構成では、
0Hzから8KHzまで全ての成分を持つ広帯域長周期
予測残差信号48が得られるので、不足する帯域がない
良好な復元音が得られる効果がある。特に0Hzから3
00Hzの復元を行う場合には効果が大きい。
域音声復元装置における広帯域長周期予測残差推定手段
42の構成図である。図において、43の零詰手段、3
5のパワー算出手段、36の雑音生成手段は実施例5お
よび実施例6のものと同一である。その他の構成は図1
および図7と同じであるので、説明を省略する。
作について説明する。狭帯域長周期予測残差信号41が
広帯域長周期予測残差推定手段42内の零詰手段43と
パワー算出手段35に入力される。広帯域長周期予測残
差推定手段42内の零詰手段43は、狭帯域長周期予測
残差信号41の各サンプル値間にM−1サンプルずつ零
を挿入し、得られたM倍のサンプル数の信号を出力す
る。ここで、Mは、復元する広帯域音声信号のサンプリ
ング周波数を、狭帯域音声信号のサンプリング周波数で
除した値であり、零を挿入する動作は前記零詰手段15
と同じである。パワー算出手段35は狭帯域長周期予測
残差信号41のパワーを算出し、出力する。雑音生成手
段36は、パワー正規化された白色雑音信号を生成し出
力する。そして、零詰手段43が出力した信号にゲイン
gr1を乗じた信号と、雑音生成手段36が出力した白
色雑音信号にパワー算出手段35が出力したパワーを乗
じ、さらにゲインgr2を乗じた信号を加算して広帯域
長周期予測残差信号48として出力する。
それぞれ一長一短を有している場合、この様に構成し、
gr1とgr2を適切に設定することで、両者を上回る
品質の広帯域音声が復元できる得られる効果がある。な
お、実施例5と実施例6と同じ効果も持っている。
帯域音声復元装置における広帯域音源推定手段14の構
成図である。図において新規な部分は、49のアップサ
ンプリング手段、50の零化手段である。全体構成は、
図1と同じであるので、説明を省略する。
動作について説明する。狭帯域音源信号6がアップサン
プリング手段49に入力される。アップサンプリング手
段49は、狭帯域音源信号6をM倍にアップサンプリン
グして、得られた信号を音源分析手段21に出力する。
音源分析手段21内の狭帯域長周期予測分析手段37
は、アップサンプリング手段49の出力信号に対して長
周期予測分析を行い、狭帯域長周期遅延38と狭帯域長
周期予測係数39を出力する。なお、長周期予測分析に
おける遅延探索範囲が実施例5の場合のM倍になる。音
源分析手段21内の長周期逆フィルタ40は、狭帯域長
周期遅延38と狭帯域長周期予測係数39を用いて、ア
ップサンプリング手段49の出力信号を逆フィルタリン
グし、得られた信号を狭帯域長周期予測残差信号41と
して広帯域長周期予測残差推定手段42に出力する。
化手段50は、狭帯域長周期予測残差信号41のMサン
プル置きの信号のみを残し、残りの信号の値を零とす
る。そして、得られた信号を広帯域長周期予測残差信号
48として出力する。広帯域長周期予測パラメータ推定
手段44は、狭帯域長周期遅延38をそのまま広帯域長
周期遅延45として出力し、狭帯域長周期予測係数39
をg倍して広帯域長周期予測係数46として出力する。
gについては実施例5と同様である。最後に、長周期合
成フィルタ47は、広帯域長周期遅延45と広帯域長周
期予測係数46を用いて、広帯域長周期予測残差信号4
8に対して長周期合成フィルタリングを行い、得られた
信号を広帯域音源信号16として出力する。
ング周波数の信号に対して長周期分析が行えるので、よ
り精度の高い遅延が分析できるようになり、狭帯域音源
信号の持つピッチ周期性の強さや変動に関する特徴をよ
り細かく広帯域音源信号に反映することが可能となり、
様々に変化する音源を十分に推定でき、良好な音質の広
帯域音声を復元することができる効果がある。なお、実
施例5と同じ効果も持っている。
帯域音声復元装置の構成図である。図において新規な部
分は、51の狭帯域パワー算出手段、52の狭帯域音源
パワー、53の狭帯域パワー込みスペクトル符号帳であ
る。その他は、前記したものと同じであるので、動作に
若干の差異があるものだけ説明を行う。
動作について説明する。分析手段2内の狭帯域パワー算
出手段51は、狭帯域音源信号6の振幅情報に含まれる
パワーを算出して狭帯域音源パワー52として出力す
る。この他にスペクトルパラメータ4と、狭帯域音源信
号6も出力する。広帯域スペクトル推定手段7内のベク
トル量子化手段8は、狭帯域パワー込みスペクトル符号
帳53を用いて、狭帯域スペクトルパラメータ4と狭帯
域音源パワー52を一括してベクトル量子化し、得られ
たスペクトル符号10を広帯域スペクトル推定手段7内
の逆量子化手段11に出力する。
帳53は、多くの狭帯域音声信号を分析して得られた狭
帯域スペクトルパラメータと狭帯域音源パワーの対を学
習データとして、文献1と同様な方法で作成する。狭帯
域パワー込みスペクトル符号帳53の学習時とベクトル
量子化手段8における距離尺度としては、パワーの対数
値のユークリッド距離をw倍したものとスペクトルパラ
メータのユークリッド距離を加算したものを用いること
ができる。
音源信号6ではなく、狭帯域音声信号1のパワーを算出
して、これを上記狭帯域音源パワー52の代わりに用い
る事もできる。この場合には、狭帯域スペクトルパラメ
ータと狭帯域音声信号のパワーの対を学習データとし
て、狭帯域パワー込みスペクトル符号帳53の学習を行
う。
つ効果に加えて、広帯域のスペクトルパラメータの推定
にパワーに関する情報が反映され、より安定に良好なス
ペクトルが推定できる効果がある。
の広帯域音声復元装置の構成図である。図において新規
な部分は、54の音源正規化手段、55の狭帯域正規化
音源信号、56の広帯域正規化音源信号、57の広帯域
パワー符号帳、58の広帯域音源パワー、広帯域スペク
トル推定手段に含まれる59の広帯域音源パワー推定手
段である。その他は、前記したものと同じであるので、
説明を省略する。
動作について説明する。分析手段2内の音源正規化手段
54は、狭帯域音源信号6の振幅情報に含まれるパワー
を算出して狭帯域音源パワー52として広帯域音源パワ
ー推定手段59に出力するとともに、狭帯域音源信号6
のパワーを正規化した信号を狭帯域正規化音源信号55
として広帯域音源推定手段14に出力する。
ある広帯域音源パワー推定手段59中のベクトル量子化
手段8は、狭帯域パワー込みスペクトル符号帳53を用
いて、狭帯域スペクトルパラメータ4と狭帯域音源パワ
ー52を一括してベクトル量子化し、得られたスペクト
ル符号10を広帯域音源パワー推定手段59内の逆量子
化手段11に出力する。逆量子化手段11は、広帯域パ
ワー符号帳57を用いてスペクトル符号10を復号し、
得られた広帯域音源パワー58を出力する。
音源信号54を用いて、広帯域正規化音源信号56を推
定する。なお、広帯域スペクトル推定手段7と広帯域音
源推定手段14における推定には、実施例1ないし実施
例8と同様な方法を用いる事ができる。そして、この広
帯域正規化音源信号56に前記広帯域音源パワー58を
乗じて広帯域音源信号16を生成する。
つ効果に加えて、広帯域音源パワーの推定にスペクトル
パラメータの違いを反映させる事ができるので、より正
しい振幅を持った広帯域音声が復元できる効果がある。
の広帯域音声復元装置の構成図である。図において新規
な部分は、60の広帯域パワー込みスペクトル符号帳で
ある。その他は、図11および図12と同じであるの
で、動作に若干の差異があるものだけ説明を行う。
動作について説明する。広帯域スペクトル推定手段7内
の逆量子化手段11は、広帯域パワー込みスペクトル符
号帳60を用いてスペクトル符号10を復号し、得られ
た広帯域スペクトルパラメータ13と広帯域音源パワー
58を出力する。ここで、広帯域パワー込みスペクトル
符号帳60は、多くの広帯域音声信号を分析して得られ
た広帯域スペクトルパラメータと広帯域音源パワーの対
を学習データとして、文献1と同様な方法で作成する。
距離尺度には、狭帯域パワー込みスペクトル符号帳53
の作成に用いたものと同じものを用いる。
施例10が持つ効果を合わせ持つ事ができる。
の広帯域音声復元装置の構成図である。図において新規
な部分は、61のポストフィルタ手段である。その他
は、実施例1ないし実施例11と同じであり、説明を省
略する。
動作について説明する。ポストフィルタ手段61は、合
成フィルタ17が出力した仮の広帯域音声信号に対して
ポストフィルタリング処理を行い、得られた信号を帯域
フィルタ18に出力する。帯域フィルタ18は、ポスト
フィルタ手段61が出力した信号に対して、帯域通過フ
ィルタ処理を行い、狭帯域音声の成分のある帯域以外の
成分を抽出する。なお、ポストフィルタリング処理は、
聴感的品質を改善する信号加工処理のことで、ピッチ周
期性やスペクトルの極を強調したり、高域を強調して明
瞭性を改善したり、伝送路を通す際に発生する歪が多い
帯域を抑圧して歪感を低減するものである。ピッチ周期
性の強調処理としては、ピッチ周期だけ前の仮の広帯域
音声信号に1より小さい係数を乗じて現在の仮の広帯域
音声信号に加算する方法が一般的である。
ラメータ13を変形して、広帯域スペクトルパラメータ
13の持つ極周波数近傍の周波数帯域に大きなゲインを
持ち、広帯域スペクトルパラメータ13の持つ極近傍以
外の周波数帯域に小さいゲインを持つ極零型のフィルタ
のフィルタ係数を算出する方法が各種提案されており、
このフィルタを仮の広帯域音声信号に掛けることで実現
できる。また、伝送路を通す際に発生する歪は振幅の小
さい周波数帯域、つまり極近傍以外の周波数帯域に多い
ので、この極強調処理により歪が多い帯域を抑圧する事
もできる。高域強調処理としては、プリエンファシスと
呼ばれる方法、すなわち1点前の仮の広帯域音声信号に
1以下の係数を乗じて現在の仮の広帯域音声信号から減
算する方法が一般的である。また、図14において、ポ
ストフィルタ手段61と帯域フィルタ18が逆の位置で
も構わないし、広帯域音声信号20に対してポストフィ
ルタ手段61をかける構成でも構わない。
果に加えて、復元された広帯域音声信号の音質が不足す
る場合に、広帯域音声信号のピッチ周期性やスペクトル
の極を強調したり、高域を強調して明瞭性を改善した
り、伝送路を通す際に発生する歪が多い帯域を抑圧して
歪感を低減することができる効果がある。なお、図14
において逆フィルタ5と広帯域音源推定手段14を外し
た構成も可能である。この構成は、文献1に本発明を適
用したものに相当し、上記と同様の効果がある。
おける広帯域スペクトル推定手段7が、狭帯域スペクト
ルパラメータ4をそのまま広帯域スペクトルパラメータ
13として出力する構成も可能である。
広帯域スペクトルの概形の関係を説明する説明図であ
る。狭帯域スペクトルパラメータ4が表すスペクトル包
絡が図15(a)である場合、これをそのまま広帯域ス
ペクトルパラメータ13として用いると、結果的にその
幅が伸張し、広帯域スペクトルパラメータ13が表すス
ペクトル包絡は図15(a)を周波数軸方向にM倍に引
き伸ばした形で、Mが2の時には図15(b)のように
なる。従って、狭帯域スペクトル包絡の2KHzから
3.4KHzが高い場合には復元される3.4KHz以
上の高域も高くなり、逆に2KHzから3.4KHzが
低い場合には高域も低くなり、この結果狭帯域スペクト
ル包絡のおおまかな傾斜がそのまま高域に反映される事
となる。
果に加えて、おおまかではあるが、極めて簡単に広帯域
スペクトルを復元できる効果がある。実施例1に比べ
て、符号帳を蓄積しておくメモリが不必要で、演算量が
少なくなる効果がある。
おいて、広帯域スペクトル推定手段7が、狭帯域スペク
トルパラメータ4の最低次から所定次数までを広帯域ス
ペクトルパラメータ13として出力する構成も可能であ
る。ただし、スペクトル分析手段3が出力する狭帯域ス
ペクトルパラメータ4としては、PARCOR係数や自
己相関係数のように最低次から所定次数までを取り出し
たものを広帯域スペクトルパラメータ13としてもちい
ても合成が常に安定なパラメータである場合に限られ
る。
広帯域スペクトルの概形の関係を説明する説明図であ
る。狭帯域スペクトルパラメータ4が表すスペクトル包
絡が図16(a)である場合、これの最低次から所定次
数までを広帯域スペクトルパラメータ13として用いる
と、広帯域スペクトルパラメータ13が表すスペクトル
包絡は図16(a)を周波数軸方向にM倍に引き伸ばし
て更に極構造をなめらかにした形となり、Mが2の時に
は図16(b)のようになる。この結果狭帯域スペクト
ル包絡のおおまかな傾斜がそのまま高域に反映され、か
つ存在しない強い極が高域に生成され、不自然な復元音
が発生することを抑えることができる。
効果に加えて、実施例13の場合にまれにおこる、存在
しない強い極が高域に生成されて不自然な復元音の発生
を抑える事ができる効果がある。
の広帯域音声復元装置の広帯域スペクトル推定手段7の
構成図である。図において新規な部分は、62のスペク
トルパラメータ変換手段、63の次数低減手段、64の
スペクトルパラメータ逆変換手段である。その他は、実
施例1ないし実施例12と同じであり、説明を省略す
る。
動作について説明する。広帯域スペクトル推定手段7内
のスペクトルパラメータ変換手段62は、狭帯域スペク
トルパラメータ4を、PARCOR係数や自己相関係数
のように最低次から所定次数までを取り出した場合に合
成が常に安定なパラメータに変換する。次数低減手段6
3は、スペクトルパラメータ変換手段62が出力したパ
ラメータの最低次から所定次数までを取り出したものを
スペクトルパラメータ逆変換手段64に出力する。スペ
クトルパラメータ逆変換手段64は、次数低減手段63
の出力したパラメータを狭帯域スペクトルパラメータ4
と同じ領域に戻し、広帯域スペクトルパラメータ13と
して出力する。
パラメータ4が、最低次から所定次数までを取り出した
場合に合成が不安定になるパラメータである場合でも、
実施例14と同じ効果が得られる。
では、次数低減によって強い極を抑制したが、スペクト
ルパラメータとして自己相関係数を用いてこれにラグ窓
をかける等、類似の効果を与える方法を用いる事ができ
る。この様に構成する事で、実施例14と同じ効果が別
の手段で得られる効果がある。なお、上記実施例13な
いし16の広帯域スペクトル推定手段7を、文献1等の
従来構成に適用する事も可能である。例えば文献1に適
用する場合の全体構成は、図14から逆フィルタ5、広
帯域音源推定手段14、ポストフィルタ手段61を外し
たものとなる。この様に構成した場合には、実施例13
ないし16にて新たに発生した効果を従来技術に付加す
る事ができる。
よる符号化情報を基に広帯域音声を復元する装置に対し
て本発明を適用する例を説明する。図18は本発明の実
施例17の広帯域音声復元装置の構成図である。図にお
いて、101は狭帯域音声符号、102は分離手段、1
03は狭帯域スペクトル符号、104は狭帯域音源符
号、105は広帯域スペクトル復号手段、106は広帯
域音源復号手段、107は狭帯域スペクトル復号手段、
108は狭帯域音源復号手段、109は狭帯域音声復号
手段である。その他は、実施例1ないし実施例16と同
じであり、説明を省略する。本実施例においても、再分
析を行わずに良好な広帯域音源信号を得る構成となって
いる。
動作について説明する。まず、狭帯域音声符号101
が、分離手段102と狭帯域音声復号手段109に入力
される。この狭帯域音声符号101は、例えば8KHz
でサンプリングされ、300Hzから3.4KHzの電
話帯域に制限された狭帯域音声信号が別途符号化された
ものであり、蓄積メディアや通信路から入力されて来る
ものである。分離手段102では、狭帯域音声符号10
1を狭帯域スペクトル符号103と狭帯域音源符号10
4に分離して、狭帯域スペクトル符号103を広帯域ス
ペクトル復号手段105に、狭帯域音源符号104を広
帯域音源復号手段106に出力する。
域スペクトル復号手段107は、狭帯域スペクトル符号
103を復号して、得られた狭帯域スペクトルパラメー
タ4を出力する。なお、狭帯域スペクトル復号手段10
7は、狭帯域音声符号101が符号化された時に用いら
れた狭帯域スペクトルパラメータの符号化処理の逆の処
理を行えば良い。そして、広帯域スペクトル復号手段1
05内の広帯域スペクトル推定手段7が、前記狭帯域ス
ペクトルパラメータ4を用いて広帯域スペクトルパラメ
ータ13を推定する。なお、広帯域スペクトル推定手段
7としては、これまで説明を行った実施例に記載されて
いる方法を用いる事ができる。
復号手段108は、前記狭帯域音源符号104を復号し
て、得られた狭帯域音源信号6を出力する。そして、広
帯域音源復号手段106内の広帯域音源推定手段14
が、前記狭帯域音源信号6を用いて広帯域音源信号16
を推定する。なお、広帯域音源推定手段14には、零詰
手段等を用いる事ができる。狭帯域音源復号手段108
では、狭帯域音声符号101が符号化された時に用いら
れた狭帯域音源信号の符号化処理の逆の処理を行えば良
い。
ラメータ13を用いて広帯域音源信号16に合成フィル
タ処理を行い仮の広帯域音声信号を生成する。帯域フィ
ルタ18は、この仮の広帯域音声信号に対して、帯域通
過フィルタ処理を行い、狭帯域音声の成分のある帯域以
外の成分を抽出する。広帯域音声信号の帯域が0Hzか
ら7.3KHzの場合、0Hzから300Hzと3.4
KHzから7.3KHzの成分が抽出される。
した狭帯域音声符号101を復号して、得られた狭帯域
音声信号1をアップサンプリング手段19に出力する。
この復号処理は、狭帯域音声符号101が符号化された
時に用いられた符号化処理の逆の処理を行えば良い。次
に、アップサンプリング手段19は、狭帯域音声信号1
をM倍にアップサンプリングする。アップサンプリング
によって生成される信号は、サンプリング周波数が広帯
域音声信号20と同じで、狭帯域音声信号1と同じ狭帯
域成分を持つものである。そして、帯域フィルタ18の
出力とアップサンプリング手段19の出力を加算して広
帯域音声信号20を生成する。
や通信路から狭帯域音声符号を受信した場合、狭帯域音
声を再分析する必要がないので少ない処理量で復元がで
きる効果がある。また、合成時の補間や分析時の窓掛等
による歪が重畳しないので、より良い品質の広帯域音声
が復元できる効果がある。なお、実施例1と同じ効果も
持っている。
域スペクトルパラメータ4と狭帯域音源信号6を入力し
て、狭帯域音声信号1を合成する構成でも良いし、逆に
狭帯域音声復号手段109内の復号過程の中間パラメー
タとして算出される狭帯域スペクトルパラメータ4と狭
帯域音源信号6を広帯域スペクトル復号手段105と広
帯域音源復号手段106に入力する構成も可能である。
この場合、重複している処理を省く事ができ、更に少な
い処理量で広帯域音声が復元できる効果がある。また、
狭帯域音声符号101から、ピッチ周期符号とパワー符
号が分離できる場合には、これらの符号からピッチ周期
とパワー情報を復号して、前記広帯域スペクトルパラメ
ータ13とこのピッチ周期とパワー情報を用いて文献1
と同じ方法で仮の広帯域合成音を生成する構成も可能で
ある。
の広帯域音声復元装置の広帯域音源復号手段106の構
成図である。図において新規な部分は、110の狭帯域
ピッチ符号、111の狭帯域パワー符号、112の広帯
域ピッチ復号手段、113の広帯域ピッチ周期、114
の広帯域パワー復号手段、115の広帯域パワー、11
6の音源生成手段である。その他は、実施例17と同じ
であり、説明を省略する。
単に狭帯域ピッチ符号110と狭帯域パワー符号111
が分離できるような狭帯域音声符号101が入力される
場合に限られる。この場合には図19の構成が意味を持
つ。以下、図19を用いて本発明の一実施例の動作につ
いて説明する。狭帯域音源符号104として、狭帯域ピ
ッチ符号110と狭帯域パワー符号111が広帯域音源
復号手段106に入力される。
チ復号手段112は、狭帯域ピッチ符号110を用いて
広帯域ピッチ周期113を推定する。推定の方法として
は、狭帯域ピッチ符号110から狭帯域ピッチ周期を復
号してその値をM倍してもよいが、その結果をテーブル
として持っておいて狭帯域ピッチ符号110に対応する
テーブル成分を読みだす事で求めてもよい。次に、広帯
域音源復号手段106内の広帯域パワー復号手段114
は、狭帯域パワー符号111を用いて広帯域パワー11
5を推定する。推定の方法としては、狭帯域パワー符号
111から狭帯域パワーを復号してその値をg倍しても
よいが、その結果をテーブルとして持っておいて狭帯域
パワー符号111に対応するテーブル成分を読みだす事
で求めてもよい。
周期113を繰り返し周期として、固定音源を並べ立て
た信号を出力し、最後にこの音源生成手段116の出力
信号に広帯域パワー115を乗じて、広帯域音源信号1
6として出力する。
持つ効果に加えて、狭帯域音源信号の復号を行わずに直
接広帯域音源信号16が生成されるので、少ない処理量
で復元ができる効果がある。
の広帯域音声復元装置の広帯域音源復号手段106の構
成図である。図において新規な部分は、117の狭帯域
適応音源符号、118の狭帯域駆動音源符号、119の
広帯域適応音源復号手段、120の広帯域駆動音源復号
手段、121の狭帯域適応音源復号手段、122の狭帯
域駆動音源復号手段である。その他は、前記したものと
同じであり、説明を省略する。
力の狭帯域音声符号から簡単に狭帯域適応音源符号11
7と狭帯域駆動音源符号118が分離できるような狭帯
域音声符号101が入力される場合に限られる。この場
合には図20の構成が意味を持つ。以下、図20を用い
て本発明の一実施例の動作について説明する。狭帯域音
源符号104として、狭帯域適応音源符号117と狭帯
域駆動音源符号118が広帯域音源復号手段106に入
力される。
適応音源復号手段121は、前記狭帯域適応音源符号1
17を復号して、得られた狭帯域適応ラグ長25と狭帯
域適応ゲイン26を出力する。広帯域適応音源復号手段
119内の広帯域適応音源推定手段30は、この狭帯域
適応ラグ長25と狭帯域適応ゲイン26から、広帯域適
応音源信号32を生成し、出力する。広帯域適応音源推
定手段30の動作については、実施例2と同様である。
駆動音源復号手段122は、前記狭帯域駆動音源符号1
18を復号して、得られた狭帯域駆動音源信号24を出
力する。広帯域駆動音源復号手段120内の広帯域駆動
音源推定手段27は、この狭帯域駆動音源信号24から
広帯域駆動音源信号29を推定し、出力する。広帯域駆
動音源推定手段27の動作は、実施例2ないし実施例4
と同様である。最後に、広帯域適応音源信号32と広帯
域駆動音源信号29を加算して、広帯域音源信号16と
して出力する。
し実施例4および実施例17が持つ効果に加えて、狭帯
域音源信号の復号を行わずに直接広帯域音源信号16が
生成されるので、少ない処理量で復元ができる効果があ
る。更に、基本周波数とその高調波成分の周波数が正し
く整数倍の位置に並ぶので、最終的に復元される広帯域
音声信号での狭帯域成分と復元広帯域成分のつながりが
良く、高品質な広帯域音声を復元できる効果がある。ま
た、有声無声情報やピッチ周期情報を用いないので、中
間的な性質の音源も表現できるので、雑音が重畳した狭
帯域音声信号に対して起こりがちな有声無声判定誤りや
ピッチ抽出誤りの影響がなく、有声無声境界付近でも良
好な広帯域音源を推定することができ、安定で自然な音
質の広帯域音声を復元することができる効果がある。
の広帯域音声復元装置の広帯域音源復号手段106の構
成図である。図において新規な部分は、123の狭帯域
長周期予測符号、124の広帯域長周期予測パラメータ
(符号)復号手段、125の狭帯域長周期予測パラメー
タ(符号)復号手段、126の狭帯域長周期予測残差符
号、127の広帯域長周期予測残差復号手段、128の
狭帯域長周期予測残差復号手段である。その他は、前記
したものと同じであり、説明を省略する。
力の狭帯域音声符号から簡単に狭帯域長周期予測符号1
23と狭帯域長周期予測残差符号126が分離できるよ
うな狭帯域音声符号101が入力される場合に限られ
る。この場合には図21の構成が意味を持つ。以下、図
21を用いて本発明の一実施例の動作について説明す
る。狭帯域音源符号104として、狭帯域長周期予測符
号123と狭帯域長周期予測残差符号126が広帯域音
源復号手段106に入力される。
手段124内の狭帯域長周期予測パラメータ復号手段1
25は、前記狭帯域長周期予測符号123を復号して、
得られた予測符号の1つである狭帯域長周期遅延38
と、他の予測符号である狭帯域長周期予測係数39を出
力する。広帯域長周期予測パラメータ復号手段124内
の広帯域長周期予測パラメータ推定手段44は、この狭
帯域長周期遅延38と狭帯域長周期予測係数39から、
長周期予測符号の1つである広帯域長周期遅延45と、
他の長周期予測符号の1つである広帯域長周期予測係数
46を推定し、出力する。広帯域長周期予測パラメータ
推定手段44の動作については、実施例5と同様であ
る。
狭帯域長周期予測残差復号手段128は、前記狭帯域長
周期予測残差符号126を復号して、得られた狭帯域長
周期予測残差信号41を出力する。広帯域長周期予測残
差復号手段127内の広帯域長周期予測残差推定手段4
2は、この狭帯域長周期予測残差信号41から広帯域長
周期予測残差信号48を推定し、出力する。広帯域長周
期予測残差推定手段42の動作は、実施例5ないし実施
例7と同様である。最後に、長周期合成フィルタ47
は、広帯域長周期遅延45と広帯域長周期予測係数46
を用いて、広帯域長周期予測残差信号48に対して長周
期合成フィルタリングを行い、得られた信号を広帯域音
源信号16として出力する。
し実施例7および実施例17が持つ効果に加えて、狭帯
域音源信号の復号を行わずに直接広帯域音源信号16が
生成されるので、少ない処理量で復元ができる効果があ
る。
では、狭帯域スペクトル符号103から狭帯域スペクト
ルパラメータ4を復号した後に広帯域スペクトルパラメ
ータ13の推定を行っているが、狭帯域スペクトル符号
103によって広帯域スペクトル符号帳を参照する事で
直接広帯域スペクトルパラメータ13を算出する構成も
可能である。この様に構成する事により、実施例17な
いし実施例20が持つ効果に加えて、更に少ない処理量
で復元ができる効果がある。
ある広帯域音声復元装置の構成図である。図において新
規な部分は、129の狭帯域パワー復号手段、130の
広帯域正規化音源復号手段である。広帯域スペクトル推
定手段7は実施例11と同じであり、その他は前記した
ものと同じであり、説明を省略する。
動作について説明する。狭帯域パワー復号手段129
は、狭帯域音源符号104の中に含まれる狭帯域振幅情
報からパワーに関する部分を復号して、得られた狭帯域
音源パワー52を広帯域スペクトル推定手段7に対して
出力する。広帯域スペクトル推定手段7は、狭帯域スペ
クトルパラメータ4と狭帯域音源パワー52を用いて、
広帯域スペクトルパラメータ13と広帯域音源パワー5
8を推定する。広帯域正規化音源復号手段130は、狭
帯域音源符号104の中に含まれる狭帯域パワーに関す
る部分以外を用いて、パワーが正規化された広帯域の音
源信号を推定し、広帯域正規化音源信号56として出力
する。この広帯域正規化音源復号手段130における処
理には、実施例18ないし実施例20と同様なものを用
いる事ができる。そして、この広帯域正規化音源信号5
6に前記広帯域音源パワー58を乗じて広帯域音源信号
16を生成する。
よび実施例18ないし実施例20が持つ効果を合わせ持
つ事ができる。なお、実施例9や実施例10のように広
帯域スペクトル推定手段7が広帯域スペクトルパラメー
タ13もしくは広帯域音源パワー58の一方だけを推定
する構成も可能である。
において、合成フィルタ17と帯域フィルタ18の間に
ポストフィルタ手段61を挿入した構成も可能である。
また、ポストフィルタ手段61と帯域フィルタ18が逆
の位置の構成も可能であるし、広帯域音声信号20に対
してポストフィルタ手段61をかける構成も可能であ
る。この様に構成する事により、狭帯域音声復号手段1
09内でポストフィルタ処理が行なわれる場合に、狭帯
域部と復元した帯域の連続性を良くする事ができる。ま
た、実施例12および実施例17ないし実施例22が持
つ効果を合わせ持つ事ができる。
いて、合成フィルタ17と帯域フィルタ18の間にポス
トフィルタ手段61を挿入した構成も可能である。ま
た、ポストフィルタ手段61と帯域フィルタ18が逆の
位置の構成も可能であるし、広帯域音声信号20に対し
てポストフィルタ手段61をかける構成も可能である。
この構成は、文献1に本発明の実施例17に実施例12
を適用したものに相当し、狭帯域音声復号手段109内
でポストフィルタ処理が行なわれる場合に、狭帯域部と
復元した帯域の連続性を良くする事ができる効果があ
る。
狭帯域音源信号を用いて広帯域音源信号の推定を行い、
これを用いて広帯域音声信号を合成するようにしたの
で、狭帯域音源信号の特徴を良好に広帯域音源信号に与
える事ができ、話者に依存性が少なく、安定で自然な音
質の広帯域音声を復元することができる効果がある。
音源信号の各サンプル間に所定個ずつの零を挿入する零
詰め手段を用いたので、有声無声判定やピッチ抽出が必
要なく、有声無声判定誤りやピッチ抽出誤りの影響がな
い良好な広帯域音源を推定でき、安定で自然な音質の広
帯域音声を復元することができる効果がある。
適応音源符号と狭帯域駆動音源信号を用いて広帯域適応
音源信号と広帯域駆動音源信号を推定するようにし、こ
れから広帯域音源信号を生成するようにしたので、狭帯
域音源信号の持つピッチ周期性の強さや変動に関する特
徴が良好に広帯域音源信号に反映され、パルス的な音も
なく、良好な音質の広帯域音声を復元することができる
効果がある。更に、基本周波数とその高調波成分の周波
数が正しく整数倍の位置に並ぶので、広帯域音声信号で
の狭帯域成分と復元広帯域成分のつながりが良く、また
ピッチ周期性の実際的な性質も復元でき、高品質な広帯
域音声を復元できる効果がある。
長周期予測符号と狭帯域長周期残差信号を用いて広帯域
長周期予測符号と広帯域長周期残差信号を推定するよう
にし、これらを用いて広帯域音源信号を合成するように
したので、狭帯域音源信号の持つピッチ周期性の強さや
変動に関する特徴が良好に広帯域音源信号に反映され、
パルス的な音もなく、良好な音質の広帯域音声を復元す
ることができる効果がある。更に、基本周波数とその高
調波成分の周波数が正しく整数倍の位置に並ぶので、最
終的に復元される広帯域音声信号での狭帯域成分と復元
広帯域成分のつながりが良く、実際のピッチ周期性の特
性もとり入れることができ、高品質な広帯域音声を復元
できる効果がある。
域振幅情報を用いて広帯域スペクトルパラメータと広帯
域振幅情報のいずれか、または両方を推定するようにし
たので、広帯域のスペクトルパラメータの推定に狭帯域
振幅情報が反映され、より安定に良好なスペクトルが推
定でき、より正しい振幅を持った広帯域音声が復元でき
る効果がある。
た広帯域音声信号にポストフィルタリングを行うように
したので、復元された広帯域音声信号の音質が不足する
場合に、ピッチ周期性の強調、スペクトル包絡の極の強
調等の音質改善ができる効果がある。
伸張して広帯域スペクトルパラメータとして用いて広帯
域音声信号を合成するようにしたので、極めて簡単にお
おまかな広帯域スペクトルを復元できる効果がある。ま
た、符号帳を蓄積しておくメモリが不必要で、演算量が
少なくなる効果がある。
所定次数までを用いてこれをスペクトルパラメータに逆
変換する事で広帯域スペクトルパラメータを得るように
したので、極めて簡単におおまかな広帯域スペクトルを
復元できる効果がある。また、符号帳を蓄積しておくメ
モリが不必要で、演算量が少なくなる効果がある。
用いて狭帯域合成音の生成と広帯域音声信号の推定を行
い、狭帯域合成音をアップサンプリングした信号か狭帯
域合成音に、広帯域音声信号の狭帯域合成音以外の帯域
の成分を抽出して加算したので、符号化された狭帯域音
声からでも広帯域音声の復元が可能となり、復号した狭
帯域音声を再分析しないので、少ない処理量で復元がで
きる効果がある。
定した広帯域スペクトルパラメータと、狭帯域音源符号
を用いて推定した広帯域音源信号とを用いて広帯域音声
信号を合成するようにしたので、復号した狭帯域音声を
再分析する必要がなく、少ない処理量で復元ができる効
果がある。また、合成時の補間や分析時の窓掛等による
歪が重畳しないので、より良い品質の広帯域音声が復元
できる効果がある。
源符号を用いて復号した狭帯域音源の各サンプル間に所
定個ずつの零を挿入する零詰め手段を用いたので、有声
と無声の中間的な性質の音源も良好に復元でき、安定で
自然な音質の広帯域音声を復元することができる効果が
ある。
音源符号を用いて推定した広帯域適応音源信号と広帯域
駆動音源信号を推定するようにし、それを加算して広帯
域音源信号としたので、狭帯域音源信号の復号を行わず
に直接広帯域音源信号が生成され、少ない処理量で復元
ができる効果がある。また、狭帯域音源符号が含んでい
るピッチ周期性の強さや変動に関する特徴が良好に広帯
域音源信号に反映されるので、良好な音質の広帯域音声
を復元することができる効果がある。
音源符号を用いて推定した広帯域長周期予測符号と広帯
域長周期残差信号とを推定するようにし、これらを用い
て広帯域音源信号を合成するようにしたので、狭帯域音
源信号の復号を行わずに直接広帯域音源信号が生成さ
れ、少ない処理量で復元ができる効果がある。また、狭
帯域音源符号が含んでいるピッチ周期性の強さや変動に
関する特徴が良好に広帯域音源信号に反映されるので、
良好な音質の広帯域音声を復元することができる効果が
ある。
情報を用いて広帯域スペクトルパラメータと広帯域振幅
情報のいずれか、またはその両方を推定するようにした
ので、広帯域のスペクトルパラメータの推定に狭帯域振
幅情報が反映され、より安定に良好なスペクトルが推定
でき、広帯域振幅情報の推定に狭帯域スペクトルパ符号
の違いを反映させる事ができるので、より正しい振幅を
持った広帯域音声が復元できる効果がある。
た広帯域音声信号にポストフィルタリングを行うように
したので、狭帯域合成音に対してポストフィルタ処理が
適用される場合に、狭帯域部と復元した帯域の連続性が
よくなる効果がある。また、復元された広帯域音声信号
の音質が不足する場合に、ピッチ周期性の強調、スペク
トル包絡の極の強調等の音質改善ができる効果がある。
構成図である。
を説明する説明図である。
おける広帯域音源推定手段の構成図である。
一例を説明する説明図である。
おける広帯域駆動音源推定手段の構成図である。
おける広帯域駆動音源推定手段の構成図である。
おける広帯域音源推定手段の構成図である。
おける広帯域駆動音源推定手段の構成図である。
おける広帯域駆動音源推定手段の構成図である。
における広帯域音源推定手段の構成図である。
の構成図である。
置の構成図である。
置の構成図である。
置の構成図である。
クトルと広帯域スペクトルの概形の関係を説明する説明
図である。
クトルと広帯域スペクトルの概形の関係を説明する説明
図である。
置における広帯域スペクトル推定手段の構成図である。
置の構成図である。
置における広帯域音源復号手段の構成図である。
置における広帯域音源復号手段の構成図である。
置における広帯域音源復号手段の構成図である。
置の構成図である。
析手段、4 狭帯域スペクトルパラメータ、5 逆フィ
ルタ、6 狭帯域音源信号、7 広帯域スペクトル推定
手段、8 ベクトル量子化手段、9 狭帯域スペクトル
符号帳、10スペクトル符号、11 逆量子化手段、1
2 広帯域スペクトル符号帳、13広帯域スペクトルパ
ラメータ、14 広帯域音源推定手段、15 零詰手
段、16 広帯域音源信号、17 合成フィルタ、18
帯域フィルタ、19 アップサンプリング手段、20
広帯域音声信号、21 音源分析手段、22 狭帯域
適応符号帳、23 歪最小化手段、24 狭帯域駆動音
源信号、25 狭帯域適応ラグ長、26 狭帯域適応ゲ
イン、27 広帯域駆動音源推定手段、28 零詰手
段、29 広帯域駆動音源信号、30 広帯域適応音源
推定手段、31 広帯域適応音源符号帳、32 広帯域
適応音源信号、33 広帯域適応ラグ長、34 広帯域
適応ゲイン、35 パワー算出手段、36 雑音生成手
段、37 狭帯域長周期予測分析手段、38 狭帯域長
周期遅延、39 狭帯域長周期予測係数、40 長周期
逆フィルタ、41 狭帯域長周期予測残差信号、42
広帯域長周期予測残差推定手段、43 零詰手段、44
広帯域長周期予測パラメータ推定手段、45 広帯域
長周期遅延、46 広帯域長周期予測係数、47 長周
期合成フィルタ、48 広帯域長周期予測残差信号、4
9 アップサンプリング手段、50 零化手段、51
狭帯域パワー算出手段、52 狭帯域音源パワー、53
狭帯域パワー込みスペクトル符号、54 音源正規化
手段、55 狭帯域正規化音源信号、56 広帯域正規
化音源信号、57 広帯域パワー符号帳、58 広帯域
音源パワー、59 広帯域音源パワー推定手段、60
広帯域パワー込みスペクトル符号帳、61 ポストフィ
ルタ手段、62 スペクトルパラメータ変換手段、63
次数低減手段、64 スペクトルパラメータ逆変換手
段、101 狭帯域音声符号、102 分離手段、10
3 狭帯域スペクトル符号、104 狭帯域音源符号、
105 広帯域スペクトル復号手段、106 広帯域音
源復号手段、107 狭帯域スペクトル復号手段、10
8 狭帯域音源復号手段、109 狭帯域音声復号手
段、110 狭帯域ピッチ符号、111 狭帯域パワー
符号、112 広帯域ピッチ復号手段、113 広帯域
ピッチ周期、114 広帯域パワー復号手段、115
広帯域パワー復号手段、116 音源生成手段、117
狭帯域適応音源符号、118 狭帯域駆動音源符号、
119 広帯域適応音源復号手段、120 広帯域駆動
音源復号手段、121 狭帯域適応音源復号手段、12
2 狭帯域駆動音源復号手段、123 狭帯域長周期予
測符号、124 広帯域長周期予測パラメータ復号手
段、125 狭帯域長周期予測パラメータ復号手段、1
26 狭帯域長周期予測残差符号、127 広帯域長周
期予測残差復号手段、128 狭帯域長周期予測残差復
号手段、129 狭帯域パワー復号手段、130 広帯
域正規化音源復号手段。
Claims (30)
- 【請求項1】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号を得る分析手段と、 上記狭帯域スペクトルパラメータを用いて広帯域スペク
トルパラメータを推定するスペクトル推定手段と、 上記狭帯域音源信号を用い広帯域音源信号を推定する広
帯域音源推定手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源推定手段は、入力の狭帯域音源信号の各
サンプル間隔中に所定の零値を挿入して出力する零詰手
段と、 雑音信号を生成する雑音生成手段と、 上記零詰手段が出力した信号と上記雑音生成手段が生成
した雑音信号とを加算する加算手段とを備えたことを特
徴とする広帯域音声復元装置。 - 【請求項2】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号を得る分析手段と、 上記狭帯域スペクトルパラメータを用いて広帯域スペク
トルパラメータを推定するスペクトル推定手段と、 上記狭帯域音源信号を用い広帯域音源信号を推定する広
帯域音源推定手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源推定手段は、入力の狭帯域音源信号を分
析して狭帯域適応音源符号と狭帯域駆動音源信号を得る
音源分析手段と、 上記狭帯域適応音源符号を用いて広帯域適応音源信号を
推定する適応音源推定手段と、 上記狭帯域駆動音源信号を用いて広帯域駆動音源信号を
推定する駆動音源推定手段と、 上記推定された広帯域適応音源信号と広帯域駆動音源信
号とから広帯域音源信号を生成する加算手段とを備えた
ことを特徴とする広帯域音声復元装置。 - 【請求項3】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号を得る分析手段と、 上記狭帯域スペクトルパラメータを用いて広帯域スペク
トルパラメータを推定するスペクトル推定手段と、 上記狭帯域音源信号を用い広帯域音源信号を推定する広
帯域音源推定手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源推定手段は、入力の狭帯域音源信号を分
析して狭帯域長周期予測符号と狭帯域長周期予測残差信
号を得る音源分析手段と、 上記狭帯域長周期予測残差信号を用いて広帯域長周期予
測残差信号を推定する長周期予測残差推定手段と、 上記狭帯域長周期予測符号を用いて広帯域長周期予測符
号を推定する広帯域長周期予測符号推定手段と、 上記推定された広帯域長周期予測残差信号と広帯域長周
期予測符号とから広帯域音源信号を合成する長周期合成
手段とを備えたことを特徴とする広帯域音声復元装置。 - 【請求項4】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号と狭帯域音源信号の狭
帯域振幅情報を得る分析手段と、 上記狭帯域スペクトルパラメータと上記狭帯域振幅情報
を用いて広帯域スペクトルパラメータを推定するスペク
トル推定手段と、 上記狭帯域音源信号と上記狭帯域振幅情報とを用い広帯
域音源信号を推定する広帯域音源推定手段と、 上記推定された広帯域スペクトルパラメータと、広帯域
音源信号とから広帯域音声信号を生成する合成手段を備
えた広帯域音声復元装置。 - 【請求項5】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータと狭帯域音源信号と狭帯域音源信号の狭
帯域振幅情報を得る分析手段と、 上記狭帯域スペクトルパラメータと上記狭帯域振幅情報
を用いて少なくとも広帯域スペクトルパラメータと広帯
域振幅情報を推定するスペクトル推定手段と、 上記狭帯域音源信号と上記広帯域振幅情報とを用い広帯
域音源信号を推定する広帯域音源推定手段と、 上記推定された広帯域スペクトルパラメータと、広帯域
音源信号とから広帯域音声信号を生成する合成手段を備
えた広帯域音声復元装置。 - 【請求項6】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータを得る分析手段と、 上記狭帯域スペクトルパラメータをそのまま広帯域スペ
クトルパラメータとして用いて広帯域スペクトルパラメ
ータを出力するスペクトル推定手段と、 上記出力された広帯域スペクトルパラメータから広帯域
音声信号を生成する合成手段を備えた広帯域音声復元装
置。 - 【請求項7】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータを得る分析手段と、 上記狭帯域スペクトルパラメータのスペクトル包絡の極
を抑制する変形を行い、当該極を抑制する変形を行った
狭帯域スペクトルパラメータを広帯域スペクトルパラメ
ータとして出力するスペクトル推定手段と、 上記出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた広帯域音声復
元装置。 - 【請求項8】 狭帯域音声信号を分析して狭帯域スペク
トルパラメータを得る分析手段と、 上記狭帯域スペクトルパラメータを別領域に変換し、ス
ペクトル包絡の極を抑制する変形を行い、当該極を抑制
する変形を行ったスペクトル包絡を上記狭帯域スペクト
ルパラメータと同じ領域に逆変換して、当該極を抑制す
る変形を行ったスペクトル包絡を逆変換した狭帯域スペ
クトルパラメータを広帯域スペクトルパラメータとして
出力するスペクトル推定手段と、 上記出力された広帯域スペクトルパラメータから広帯域
音声信号を生成する合成手段を備えた広帯域音声復元装
置。 - 【請求項9】 狭帯域スペクトル符号から狭帯域スペク
トルパラメータを復号し、この復号した狭帯域スペクト
ルパラメータのスペクトル包絡の極を抑制する変形を行
い、当該極を抑制する変形を行った狭帯域スペクトルパ
ラメータを広帯域スペクトルパラメータとして出力する
スペクトル復号手段と、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた広帯域音声復
元装置。 - 【請求項10】 広帯域音源信号を推定する広帯域音源
推定手段を備え、 上記合成手段は、上記広帯域音源信号と広帯域スペクト
ルパラメータとから広帯域音声信号を生成するように構
成された請求項9に記載の広帯域音声復元装置。 - 【請求項11】 狭帯域音声符号から分離された狭帯域
スペクトル符号を用いて広帯域スペクトルパラメータを
推定するスペクトル復号手段と、 上記狭帯域音声符号から分離された狭帯域音源符号を用
いて広帯域音源信号を推定する広帯域音源復号手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源復号手段は、狭帯域音源符号から復元し
た狭帯域音源信号の各サンプル間隔中に所定の零値を挿
入して出力する零詰手段と、 雑音信号を生成する雑音生成手段と、 上記零詰手段が出力した信号と上記雑音生成手段が生成
した雑音信号とを加算する加算手段とを備えたことを特
徴とする広帯域音声復元装置。 - 【請求項12】 狭帯域音声符号から分離された狭帯域
スペクトル符号を用いて広帯域スペクトルパラメータを
推定するスペクトル復号手段と、 上記狭帯域音声符号から分離された狭帯域音源符号を用
いて広帯域音源信号を推定する広帯域音源復号手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源復号手段は、入力の狭帯域音声符号から
分離した狭帯域適応音源符号を用いて広帯域適応音源信
号を推定する広帯域適応音源復号手段と、 入力の狭帯域音声符号から分離した狭帯域駆動音源符号
を用いて広帯域駆動音源信号を推定する広帯域駆動音源
復号手段と、 上記推定された広帯域適応音源信号と広帯域駆動音源信
号とから広帯域音源信号を生成する加算手段とで構成さ
れることを特徴とする広帯域音声復元装置。 - 【請求項13】 狭帯域音声符号から分離された狭帯域
スペクトル符号を用いて広帯域スペクトルパラメータを
推定するスペクトル復号手段と、 上記狭帯域音声符号から分離された狭帯域音源符号を用
いて広帯域音源信号を推定する広帯域音源復号手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備
え、 上記広帯域音源復号手段は、入力の狭帯域音声符号から
分離した狭帯域長周期予測符号を用いて広帯域長周期予
測符号を推定する広帯域長周期予測符号復号手段と、 入力の狭帯域音声符号から分離した狭帯域長周期予測残
差符号を用いて広帯域長周期予測残差信号を推定する広
帯域長周期予測残差復号手段と、 上記推定された広帯域長周期予測符号と広帯域長周期予
測残差信号とから広帯域音源信号を生成する加算手段と
で構成されることを特徴とする広帯域音声復元装置。 - 【請求項14】 狭帯域音声符号から分離された狭帯域
音源符号を用いて狭帯域振幅情報を推定する狭帯域振幅
情報復号手段と、 上記狭帯域音声符号から分離された狭帯域スペクトル符
号と上記狭帯域振幅情報を用いて広帯域スペクトルパラ
メータと広帯域振幅情報を推定するスペクトル復号手段
と、 上記狭帯域音源符号と上記広帯域振幅情報とを用いて広
帯域音源信号を推定する広帯域音源復号手段と、 上記推定された広帯域スペクトルパラメータと広帯域音
源信号とから広帯域音声信号を生成する合成手段を備え
た広帯域音声復元装置。 - 【請求項15】 狭帯域スペクトル符号から狭帯域スペ
クトルパラメータを復号し、この復号した狭帯域スペク
トルパラメータのスペクトル包絡の極を抑制する変形を
行い、当該極を抑制する変形を行った狭帯域スペクトル
パラメータを広帯域スペクトルパラメータとして出力す
るスペクトル復号ステップと、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成ステップを有する広帯域音
声復元方法。 - 【請求項16】 狭帯域音声信号を分析して得られた狭
帯域スペクトルパラメータのスペクトル包絡の極を抑制
する変形を行い、当該極を抑制する変形を行った狭帯域
スペクトルパラメータを広帯域スペクトルパラメータと
して用いて広帯域音声信号を生成する広帯域音声復元装
置。 - 【請求項17】 広帯域音源信号を推定する広帯域音源
推定手段を備え、 上記生成された広帯域音源信号と上記広帯域スペクトル
パラメータとから広帯域音声信号を生成する請求項16
に記載の広帯域音声復元装置。 - 【請求項18】 狭帯域音声信号を分析して得られた狭
帯域スペクトルパラメータのスペクトル包絡の極を抑制
する変形を行い、当該極を抑制する変形を行った狭帯域
スペクトルパラメータを広帯域スペクトルパラメータと
して用いて広帯域音声信号を生成する広帯域音声復元方
法。 - 【請求項19】 狭帯域音声信号を符号化して狭帯域音
声符号を出力する音声符号化装置と、上記狭帯域音声符
号を受信して広帯域音声信号を生成する広帯域音声復元
装置とを含む音声伝送システムにおいて、 上記広帯域音声復元装置は、 上記受信した狭帯域音声符号に含まれた狭帯域スペクト
ル符号から狭帯域スペクトルパラメータを復号し、この
復号した狭帯域スペクトルパラメータのスペクトル包絡
の極を抑制する変形を行い、当該極を抑制する変形を行
った狭帯域スペクトルパラメータを広帯域スペクトルパ
ラメータとして出力するスペクトル復号手段と、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた音声伝送シス
テム。 - 【請求項20】 狭帯域音声信号を符号化して狭帯域音
声符号を出力する音声符号化ステップと、上記狭帯域音
声符号を受信して広帯域音声信号を生成する広帯域音声
復元ステップとを含む音声伝送方法において、 上記広帯域音声復元ステップは、 上記受信した狭帯域音声符号に含まれた狭帯域スペクト
ル符号から狭帯域スペクトルパラメータを復号し、この
復号した狭帯域スペクトルパラメータのスペクトル包絡
の極を抑制する変形を行い、当該極を抑制する変形を行
った狭帯域スペクトルパラメータを広帯域スペクトルパ
ラメータとして出力するスペクトル復号ステップと、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成ステップを有する音声伝送
方法。 - 【請求項21】 狭帯域音声信号を分析して狭帯域スペ
クトルパラメータを得る分析手段と、 上記狭帯域スペクトルパラメータのスペクトル包絡の極
構造をなめらかにする変形を行い、当該極構造をなめら
かにする変形を行った狭帯域スペクトルパラメータを広
帯域スペクトルパラメータとして出力するスペクトル推
定手段と、 上記出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた広帯域音声復
元装置。 - 【請求項22】 狭帯域音声信号を分析して狭帯域スペ
クトルパラメータを得る分析手段と、 上記狭帯域スペクトルパラメータを別領域に変換し、ス
ペクトル包絡の極構造をなめらかにする変形を行い、当
該極構造をなめらかにする変形を行ったスペクトル包絡
を上記狭帯域スペクトルパラメータと同じ領域に逆変換
して、当該極構造をなめらかにする変形を行ったスペク
トル包絡を逆変換した狭帯域スペクトルパラメータを広
帯域スペクトルパラメータとして出力するスペクトル推
定手段と、 上記出力された広帯域スペクトルパラメータから広帯域
音声信号を生成する合成手段を備えた広帯域音声復元装
置。 - 【請求項23】 狭帯域スペクトル符号から狭帯域スペ
クトルパラメータを復号し、この復号した狭帯域スペク
トルパラメータのスペクトル包絡の極構造をなめらかに
する変形を行い、当該極構造をなめらかにする変形を行
った狭帯域スペクトルパラメータを広帯域スペクトルパ
ラメータとして出力するスペクトル復号手段と、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた広帯域音声復
元装置。 - 【請求項24】 広帯域音源信号を推定する広帯域音源
推定手段を備え、 上記合成手段は、上記広帯域音源信号と広帯域スペクト
ルパラメータとから広帯域音声信号を生成するように構
成された請求項23に記載の広帯域音声復元装置。 - 【請求項25】 狭帯域スペクトル符号から狭帯域スペ
クトルパラメータを復号し、この復号した狭帯域スペク
トルパラメータのスペクトル包絡の極構造をなめらかに
する変形を行い、当該極構造をなめらかにする変形を行
った狭帯域スペクトルパラメータを広帯域スペクトルパ
ラメータとして出力するスペクトル復号ステップと、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成ステップを有する広帯域音
声復元方法。 - 【請求項26】 狭帯域音声信号を分析して得られた狭
帯域スペクトルパラメータの スペクトル包絡の極構造を
なめらかにする変形を行い、当該極構造をなめらかにす
る変形を行った狭帯域スペクトルパラメータを広帯域ス
ペクトルパラメータとして用いて広帯域音声信号を生成
する広帯域音声復元装置。 - 【請求項27】 広帯域音源信号を推定する広帯域音源
推定手段を備え、 上記生成された広帯域音源信号と上記広帯域スペクトル
パラメータとから広帯域音声信号を生成する請求項26
に記載の広帯域音声復元装置。 - 【請求項28】 狭帯域音声信号を分析して得られた狭
帯域スペクトルパラメータのスペクトル包絡の極構造を
なめらかにする変形を行い、当該極構造をなめらかにす
る変形を行った狭帯域スペクトルパラメータを広帯域ス
ペクトルパラメータとして用いて広帯域音声信号を生成
する広帯域音声復元方法。 - 【請求項29】 狭帯域音声信号を符号化して狭帯域音
声符号を出力する音声符号化装置と、上記狭帯域音声符
号を受信して広帯域音声信号を生成する広帯域音声復元
装置とを含む音声伝送システムにおいて、 上記広帯域音声復元装置は、 上記受信した狭帯域音声符号に含まれた狭帯域スペクト
ル符号から狭帯域スペクトルパラメータを復号し、この
復号した狭帯域スペクトルパラメータのスペクトル包絡
の極構造をなめらかにする変形を行い、当該極構造をな
めらかにする変形を行った狭帯域スペクトルパラメータ
を広帯域スペクトルパラメータとして出力するスペクト
ル復号手段と、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成手段を備えた音声伝送シス
テム。 - 【請求項30】 狭帯域音声信号を符号化して狭帯域音
声符号を出力する音声符号化ステップと、上記狭帯域音
声符号を受信して広帯域音声信号を生成する広帯域音声
復元ステップとを含む音声伝送方法において、 上記広帯域音声復元ステップは、 上記受信した狭帯域音声符号に含まれた狭帯域スペクト
ル符号から狭帯域スペクトルパラメータを復号し、この
復号した狭帯域スペクトルパラメータのスペクトル包絡
の極構造をなめらかにする変形を行い、当該極構造をな
めらかにする変形を行った狭帯域スペクトルパラメータ
を広帯域スペクトルパラメータとして出力するスペクト
ル復号ステップと、 この出力された広帯域スペクトルパラメータを用いて広
帯域音声信号を生成する合成ステップを有する音声伝送
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26527794A JP3483958B2 (ja) | 1994-10-28 | 1994-10-28 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26527794A JP3483958B2 (ja) | 1994-10-28 | 1994-10-28 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003315636A Division JP3773509B2 (ja) | 2003-09-08 | 2003-09-08 | 広帯域音声復元装置及び広帯域音声復元方法 |
JP2003315485A Division JP3560964B2 (ja) | 2003-09-08 | 2003-09-08 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08123495A JPH08123495A (ja) | 1996-05-17 |
JP3483958B2 true JP3483958B2 (ja) | 2004-01-06 |
Family
ID=17414992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26527794A Expired - Lifetime JP3483958B2 (ja) | 1994-10-28 | 1994-10-28 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3483958B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
EP0945852A1 (en) * | 1998-03-25 | 1999-09-29 | BRITISH TELECOMMUNICATIONS public limited company | Speech synthesis |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP4792613B2 (ja) * | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
FR2807897B1 (fr) † | 2000-04-18 | 2003-07-18 | France Telecom | Methode et dispositif d'enrichissement spectral |
US7742927B2 (en) | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
JP2002229599A (ja) | 2001-02-02 | 2002-08-16 | Nec Corp | 音声符号列の変換装置および変換方法 |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US7580834B2 (en) | 2002-02-20 | 2009-08-25 | Panasonic Corporation | Fixed sound source vector generation method and fixed sound source codebook |
JP4304360B2 (ja) | 2002-05-22 | 2009-07-29 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 |
BR0311601A (pt) | 2002-07-19 | 2005-02-22 | Nec Corp | Aparelho e método decodificador de áudio e programa para habilitar computador |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
JP4438280B2 (ja) * | 2002-10-31 | 2010-03-24 | 日本電気株式会社 | トランスコーダ及び符号変換方法 |
US7486719B2 (en) | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
CN100590712C (zh) * | 2003-09-16 | 2010-02-17 | 松下电器产业株式会社 | 编码装置和译码装置 |
JP4822843B2 (ja) * | 2003-10-23 | 2011-11-24 | パナソニック株式会社 | スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法 |
US8024181B2 (en) | 2004-09-06 | 2011-09-20 | Panasonic Corporation | Scalable encoding device and scalable encoding method |
EP1793373A4 (en) * | 2004-09-17 | 2008-10-01 | Matsushita Electric Ind Co Ltd | AUDIOCODING DEVICE, AUDIO DECODING DEVICE, COMMUNICATION DEVICE AND AUDIOCODING METHOD |
ATE429698T1 (de) * | 2004-09-17 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten tonsignalen |
BRPI0515453A (pt) | 2004-09-17 | 2008-07-22 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base |
JP4871501B2 (ja) * | 2004-11-04 | 2012-02-08 | パナソニック株式会社 | ベクトル変換装置及びベクトル変換方法 |
US8229749B2 (en) * | 2004-12-10 | 2012-07-24 | Panasonic Corporation | Wide-band encoding device, wide-band LSP prediction device, band scalable encoding device, wide-band encoding method |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
EP1892703B1 (en) * | 2006-08-22 | 2009-10-21 | Harman Becker Automotive Systems GmbH | Method and system for providing an acoustic signal with extended bandwidth |
JP5404418B2 (ja) | 2007-12-21 | 2014-01-29 | パナソニック株式会社 | 符号化装置、復号装置および符号化方法 |
JP2009104169A (ja) * | 2009-01-22 | 2009-05-14 | Nec Corp | 音声符号列の変換装置および変換方法 |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
JP5792821B2 (ja) * | 2010-10-07 | 2015-10-14 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法 |
-
1994
- 1994-10-28 JP JP26527794A patent/JP3483958B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH08123495A (ja) | 1996-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3483958B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 | |
JP4550289B2 (ja) | Celp符号変換 | |
JPH1055199A (ja) | 音声符号化並びに復号化方法及びその装置 | |
JP3598111B2 (ja) | 広帯域音声復元装置 | |
JP3560964B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 | |
JP3559485B2 (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP3770901B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3748081B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP4447546B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3676801B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3773509B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法 | |
JP3598112B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP4087823B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3636327B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3748083B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3770899B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3770900B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3748080B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3748082B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JPH0736484A (ja) | 音響信号符号化装置 | |
JP2005321828A (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP2003216189A (ja) | 符号化装置及び復号装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP2005321827A (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP2005321824A (ja) | 広帯域音声復元方法及び広帯域音声復元装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031007 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081017 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091017 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091017 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101017 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 9 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |