JPH02244100A - 駆動音源信号生成装置 - Google Patents
駆動音源信号生成装置Info
- Publication number
- JPH02244100A JPH02244100A JP1064387A JP6438789A JPH02244100A JP H02244100 A JPH02244100 A JP H02244100A JP 1064387 A JP1064387 A JP 1064387A JP 6438789 A JP6438789 A JP 6438789A JP H02244100 A JPH02244100 A JP H02244100A
- Authority
- JP
- Japan
- Prior art keywords
- residual
- residual waveform
- waveform
- phase
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 19
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 239000000872 buffer Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 7
- 230000001755 vocal effect Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 2
- 101000687448 Homo sapiens REST corepressor 1 Proteins 0.000 description 1
- 102100024864 REST corepressor 1 Human genes 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声合成装置において、音声のスペクトル包
絡を模擬する回路を駆動するための駆動音源信号生成装
置に関する。
絡を模擬する回路を駆動するための駆動音源信号生成装
置に関する。
〔従来の技術と発明が解決しようとする課題〕従来の音
声合成装置は、音声のピッチ周期、振幅、スペクトル微
細構造を表現する駆動音源信号生成装置と、これにより
生成された駆動音源信号で駆動される、音声のスペクト
ル包絡を模擬するための声道フィルタとから構成される
。
声合成装置は、音声のピッチ周期、振幅、スペクトル微
細構造を表現する駆動音源信号生成装置と、これにより
生成された駆動音源信号で駆動される、音声のスペクト
ル包絡を模擬するための声道フィルタとから構成される
。
声道フィルタはP A RCOR(partial a
uto−corralation)方式やL S P
(linear pradictivecoding)
方式などのデジタルフィルタで構成され、駆動音源はイ
ンパルスやホワイトノイズが切り替えて用いられる。
uto−corralation)方式やL S P
(linear pradictivecoding)
方式などのデジタルフィルタで構成され、駆動音源はイ
ンパルスやホワイトノイズが切り替えて用いられる。
駆動音源としては、人間の原音声信号を逆フイルタリン
グ処理として得た残差波形を用いることもある。これは
、スペク1〜ルパラメータで近似できなかった成分を音
源でカバーして、音質向上を狙ったものである。
グ処理として得た残差波形を用いることもある。これは
、スペク1〜ルパラメータで近似できなかった成分を音
源でカバーして、音質向上を狙ったものである。
しかし1通常の規則音声合成では合成時のピッチ周期が
分析時のそれと異なり、残差波形そのままを用いてピッ
チ周期の短い音声を合成する場合。
分析時のそれと異なり、残差波形そのままを用いてピッ
チ周期の短い音声を合成する場合。
残差波形が部分的に削除されスペクトルが保存されない
。
。
そこで、残差波形のスペクトルを保存したままで残差波
形のパワーを短い時間に集中させる目的で、残差波形の
パワースペクトルの位相をすべてゼロにして逆フーリエ
変換した時間波形を、有声部の音源信号として用いる方
式がある。しかしながら、この方式では、調音の狭めに
よって発生する雑音や1女声特有といわれる声帯付近で
発生する雑音による影響を含めた合成音声を得られない
。
形のパワーを短い時間に集中させる目的で、残差波形の
パワースペクトルの位相をすべてゼロにして逆フーリエ
変換した時間波形を、有声部の音源信号として用いる方
式がある。しかしながら、この方式では、調音の狭めに
よって発生する雑音や1女声特有といわれる声帯付近で
発生する雑音による影響を含めた合成音声を得られない
。
本発明の目的は、このような問題点を解消することによ
り、より人間の音声に近く自然な合成音声”を得ること
である。
り、より人間の音声に近く自然な合成音声”を得ること
である。
なお、音声合成に関しては多数の文献がある。
例えは、月刊誌[情報処理J (vol、24. N
o8゜Aug、 1983)のpp、993−100
0に所載の解説“音声合成技術“において、音声合成モ
デルとして音源にパルス周期と雑音を切り替えて用する
方式が述べられている。また、特開昭58−88798
号公報に、残差信号から切り出した、およそ1ピツチの
周期の波形を駆動波形とした音声合成方式が述べられて
いる。
o8゜Aug、 1983)のpp、993−100
0に所載の解説“音声合成技術“において、音声合成モ
デルとして音源にパルス周期と雑音を切り替えて用する
方式が述べられている。また、特開昭58−88798
号公報に、残差信号から切り出した、およそ1ピツチの
周期の波形を駆動波形とした音声合成方式が述べられて
いる。
〔課題を解決するための手段及び作用〕本発明は0位相
を揃えた残差波形に位相をランダム化した残差波形を加
えることにより、残差波形のスペクトルを保存したまま
で周期信号に重なった雑音信号を模擬し、ピッチ周期の
変化に対してもスペクトルを保存し、これによって高品
質な音声の合成を可能とするものである。
を揃えた残差波形に位相をランダム化した残差波形を加
えることにより、残差波形のスペクトルを保存したまま
で周期信号に重なった雑音信号を模擬し、ピッチ周期の
変化に対してもスペクトルを保存し、これによって高品
質な音声の合成を可能とするものである。
以下、図2面を用い1本発明の実施例について説明する
。
。
第1図は本発明による音声合成装置の一実施例を示すブ
ロック図である。この音声合成装置は。
ロック図である。この音声合成装置は。
駆動音源信号生成装置1によって生成した音源信号を、
振幅制御回路2によって振幅制御した信号により、声道
フィルタ3を駆動するというものである。
振幅制御回路2によって振幅制御した信号により、声道
フィルタ3を駆動するというものである。
声道フィルタ3は音声のスペクトル特性を模擬するもの
で、具体的にはLSP合成回路等が用いられる。
で、具体的にはLSP合成回路等が用いられる。
駆動音源信号生成装置1は、人間の原音声イ占号の逆フ
ィルタリングを行い残差波形を得るための、声道フィル
タ3の逆フィルタ4と、残差波形のパワースペクトルの
位相を揃える(位相等化)ための位相等化回路5、残差
波形のパワースペクトルの位相をランダム化するランダ
ム位相化回路6、および残差合成回路7とからなる。
ィルタリングを行い残差波形を得るための、声道フィル
タ3の逆フィルタ4と、残差波形のパワースペクトルの
位相を揃える(位相等化)ための位相等化回路5、残差
波形のパワースペクトルの位相をランダム化するランダ
ム位相化回路6、および残差合成回路7とからなる。
逆フィルタ4は具体的には、原音声信号をLSP分析し
5て残差波形を出力するものである0位相等化回路5は
残差波形の時間的なパワーの集中のためのものであり、
逆にランダム位相化回路6は残差波形の時間的なパワー
の拡散のためのものである。
5て残差波形を出力するものである0位相等化回路5は
残差波形の時間的なパワーの集中のためのものであり、
逆にランダム位相化回路6は残差波形の時間的なパワー
の拡散のためのものである。
第2図は、位相等化回路5による位相等化処理の説明図
である。まず、逆フィルタ4によって得られた残差波形
に、離散的な一定長の窓関数としてハミング窓等の窓掛
は処理を行う。次にフーリエ変換によって残差波形のス
ペクトルを求める。
である。まず、逆フィルタ4によって得られた残差波形
に、離散的な一定長の窓関数としてハミング窓等の窓掛
は処理を行う。次にフーリエ変換によって残差波形のス
ペクトルを求める。
次にスペクトルの各周波数の位相をゼロにしたのち、逆
フーリエ変換によって時間波形に戻す。
フーリエ変換によって時間波形に戻す。
なお、一般的には、位相をゼロでなく、ある−定値にし
てよい、ただし、ゼロ位相とした場合に比べ、パワーが
拡散する(パワーの集中度が下がる)ことは避けられな
い。
てよい、ただし、ゼロ位相とした場合に比べ、パワーが
拡散する(パワーの集中度が下がる)ことは避けられな
い。
第3図は、ランダム位相化回路6によるランダム位相化
処理の説明図である。まず逆フィルタ4によって得られ
た残差波形にハミング窓等の窓掛けを行ってフーリエ変
換を行う。次に、スペクトルの位相をランダム化した後
、逆フーリエ変換によって時間波形に戻す。
処理の説明図である。まず逆フィルタ4によって得られ
た残差波形にハミング窓等の窓掛けを行ってフーリエ変
換を行う。次に、スペクトルの位相をランダム化した後
、逆フーリエ変換によって時間波形に戻す。
第4図に、逆フィルタ4によって得られた元の残差波形
と、その位相等化(ゼロ位相)した残差波形およびラン
ダム位相化した残差波形の例を示す。
と、その位相等化(ゼロ位相)した残差波形およびラン
ダム位相化した残差波形の例を示す。
第5図は残差合成回路7の一例を示す。この例では、加
算回路10によって、1ピッチ周期程度の長さの位相等
化残差波形とランダム位相化残差波形とを、ある割合で
加算して得た時間波形を、バッファ11に保存しておく
。そして、繰り返し波形生成部12によって、バッファ
11内の波形を、指定されたピッチ周期で繰り返し読み
出すことにより合成残差波形(駆動音源信号)を生成す
る。
算回路10によって、1ピッチ周期程度の長さの位相等
化残差波形とランダム位相化残差波形とを、ある割合で
加算して得た時間波形を、バッファ11に保存しておく
。そして、繰り返し波形生成部12によって、バッファ
11内の波形を、指定されたピッチ周期で繰り返し読み
出すことにより合成残差波形(駆動音源信号)を生成す
る。
ここで、すべての音韻の種類や、音韻の部分によって残
差波形は異なるために、残差波形を複数用意し、合成残
差波形を得るための残差波形を適宜更新する必要がある
。この更新の周期は、音素やフレーム単位で変更する。
差波形は異なるために、残差波形を複数用意し、合成残
差波形を得るための残差波形を適宜更新する必要がある
。この更新の周期は、音素やフレーム単位で変更する。
第6図に残差合成回路7の別の例を示す。この例では、
位相等化残差波形とランダム位相化残差波形を別々のバ
ッファ14.15に保存する。ランダム位相化残差波形
のバッファ15は複数バンクに分割されている。バッフ
ァ14内の位相等化残差波形は、繰り返し波形生成部1
6によってピッチ周期で繰り返し読み出される。倍力、
ランダム位相化残差波形のバッファ15は、乱数発生回
路17で発生する乱数に従ってバンク切替回路18によ
ってバングがランダムに選択されることにより、バッフ
ァ15内のランダム位相化残差波形の分割部分がランダ
ムに取り出される。
位相等化残差波形とランダム位相化残差波形を別々のバ
ッファ14.15に保存する。ランダム位相化残差波形
のバッファ15は複数バンクに分割されている。バッフ
ァ14内の位相等化残差波形は、繰り返し波形生成部1
6によってピッチ周期で繰り返し読み出される。倍力、
ランダム位相化残差波形のバッファ15は、乱数発生回
路17で発生する乱数に従ってバンク切替回路18によ
ってバングがランダムに選択されることにより、バッフ
ァ15内のランダム位相化残差波形の分割部分がランダ
ムに取り出される。
バッファ14.15より取り出された波形は振幅制御回
路19.20によって振幅制御された後、加算回路21
により加算(混合)されることにより、合成残差波形が
得られる。
路19.20によって振幅制御された後、加算回路21
により加算(混合)されることにより、合成残差波形が
得られる。
すなわち、この実施例においては、ランダム位相化残差
波形は、単調な繰り返しではなく、ランダムな繰り返し
として位相等化残差波形と混合される。
波形は、単調な繰り返しではなく、ランダムな繰り返し
として位相等化残差波形と混合される。
この二つの残差波形の混合割合は、振幅制御回路19.
20における振幅制御値(yw y−1)によって決ま
る。
20における振幅制御値(yw y−1)によって決ま
る。
なお、図示しないが、本発明の他の実施例によれば、位
相等化残差波形と、ランダム位相化残差波形との混合割
合を、音韻の種類やフレーム位置によって変化させる。
相等化残差波形と、ランダム位相化残差波形との混合割
合を、音韻の種類やフレーム位置によって変化させる。
より具体的には、予め音韻やフレーム毎に混合割合を定
めてメモリに蓄積しておき、例えば第5図または第6図
に示した構成において、メモリより選択的に読み出した
混合割合になるように加算回路10または振幅制御回路
19.20を制御するに のようにすることにより、有声音と無声音とを区別する
ことなく統一的に扱うことができる。
めてメモリに蓄積しておき、例えば第5図または第6図
に示した構成において、メモリより選択的に読み出した
混合割合になるように加算回路10または振幅制御回路
19.20を制御するに のようにすることにより、有声音と無声音とを区別する
ことなく統一的に扱うことができる。
また1本発明のさらに別の実施例によれば、位相等化残
差波形とランダム位相化残差波形との混合割合を、スペ
クトル包絡の傾きによって変化させる。
差波形とランダム位相化残差波形との混合割合を、スペ
クトル包絡の傾きによって変化させる。
以上説明したように、本発明によれば1位相等化した残
差波形とランダム位相化した残差波形を混合するので、
残差波形のスペクトルを保存したままで周期信号に重な
った雑音成分を模擬し、ピッチ周期の変化に対してもス
ペクトルを保存することができるため、より高品質の合
成音声を得ることができ、また、位相等化残差波形とラ
ンダム位相化残差波形との混合割合を音韻の種類やフレ
ーム位置によって変化させることにより、有声音と無声
音とを区別しない統一的な扱いが可能になる。
差波形とランダム位相化した残差波形を混合するので、
残差波形のスペクトルを保存したままで周期信号に重な
った雑音成分を模擬し、ピッチ周期の変化に対してもス
ペクトルを保存することができるため、より高品質の合
成音声を得ることができ、また、位相等化残差波形とラ
ンダム位相化残差波形との混合割合を音韻の種類やフレ
ーム位置によって変化させることにより、有声音と無声
音とを区別しない統一的な扱いが可能になる。
第1図は本発明による音声合成装置の一実施例を示すブ
ロック図、第2図は位相等化処理の説明図、第3図はラ
ンダム位相化処理の説明図、第4図は元の残差波形と位
相等化後およびランダム位相化後の波形の一例を示す波
形図、第5図は残差合成回路の一例を示すブロック図、
第6図は残差合成回路の別の例を示すブロック図である
。 1・・・駆動音源信号生成装置、 2.19.20・・・振幅制御回路、 3・・・声道フィルタ、 4・・・逆フィルタ、5・・
・位相等化回路、 6・・・ランダム位相化回路、7・
・・残差合成回路、 10.11・・・加算回路、11
.14,15・・・バッファ、 12.16・・・繰り返し波形生成部。 17・・・乱数発生回路、 18・・・バンク切替回路
。 第2図 第3図 第4図
ロック図、第2図は位相等化処理の説明図、第3図はラ
ンダム位相化処理の説明図、第4図は元の残差波形と位
相等化後およびランダム位相化後の波形の一例を示す波
形図、第5図は残差合成回路の一例を示すブロック図、
第6図は残差合成回路の別の例を示すブロック図である
。 1・・・駆動音源信号生成装置、 2.19.20・・・振幅制御回路、 3・・・声道フィルタ、 4・・・逆フィルタ、5・・
・位相等化回路、 6・・・ランダム位相化回路、7・
・・残差合成回路、 10.11・・・加算回路、11
.14,15・・・バッファ、 12.16・・・繰り返し波形生成部。 17・・・乱数発生回路、 18・・・バンク切替回路
。 第2図 第3図 第4図
Claims (3)
- (1)音声信号を逆フィルタリングして残差波形を得る
手段と、該手段によって得られた残差波形のパワースペ
クトルの位相等化およびランダム位相化をする手段と、
該手段により位相等化された残差波形とランダム位相化
された残差波形とを所定割合で混合する手段と、該手段
により混合された時間波形を保存する手段と、該手段に
保存された時間波形を繰返して取り出す手段とを有する
こを特徴とする音声合成装置の駆動音源信号生成装置。 - (2)音声信号を逆フィルタリングして残差波形を得る
手段と、該手段によって得られた残差波形のパワースペ
クトルの位相等化およびランダム位相化をする手段と、
該手段により位相等化された残差波形とランダム位相化
された残差波形とをそれぞれ別々に保存する手段と、該
保存された位相等化残差波形を周期的に繰り返し取り出
し、該保存されたランダム位相化残差波形の分割部分を
ランダムに取り出し、それぞれを所定割合で混合する手
段とを有することを特徴とする音声合成装置の駆動音源
信号生成装置。 - (3)位相等化された残差波形とランダム位相化された
残差波形との混合割合を、音韻の種類、フレーム位置、
またはスペクトル包絡の傾きによって変化することを特
徴とする請求項(1)または(2)に記載の駆動音源信
号生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1064387A JPH02244100A (ja) | 1989-03-16 | 1989-03-16 | 駆動音源信号生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1064387A JPH02244100A (ja) | 1989-03-16 | 1989-03-16 | 駆動音源信号生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02244100A true JPH02244100A (ja) | 1990-09-28 |
Family
ID=13256859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1064387A Pending JPH02244100A (ja) | 1989-03-16 | 1989-03-16 | 駆動音源信号生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02244100A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008536170A (ja) * | 2005-04-01 | 2008-09-04 | クゥアルコム・インコーポレイテッド | 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置 |
-
1989
- 1989-03-16 JP JP1064387A patent/JPH02244100A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008536170A (ja) * | 2005-04-01 | 2008-09-04 | クゥアルコム・インコーポレイテッド | 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置 |
US8069040B2 (en) | 2005-04-01 | 2011-11-29 | Qualcomm Incorporated | Systems, methods, and apparatus for quantization of spectral envelope representation |
US8244526B2 (en) | 2005-04-01 | 2012-08-14 | Qualcomm Incorporated | Systems, methods, and apparatus for highband burst suppression |
US8260611B2 (en) | 2005-04-01 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
US8332228B2 (en) | 2005-04-01 | 2012-12-11 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
US8364494B2 (en) | 2005-04-01 | 2013-01-29 | Qualcomm Incorporated | Systems, methods, and apparatus for split-band filtering and encoding of a wideband signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3294604B2 (ja) | 波形の加算重畳による音声合成のための処理装置 | |
Sambur et al. | On reducing the buzz in LPC synthesis | |
US5890118A (en) | Interpolating between representative frame waveforms of a prediction error signal for speech synthesis | |
JPH02239292A (ja) | 音声合成装置 | |
JP2001513225A (ja) | 伸長オーディオ信号からの周期性の除去 | |
JPH02244100A (ja) | 駆動音源信号生成装置 | |
JP3756864B2 (ja) | 音声合成方法と装置及び音声合成プログラム | |
JP3197975B2 (ja) | ピッチ制御方法及び装置 | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JPH04116700A (ja) | 音声分析・合成装置 | |
JP3133427B2 (ja) | 音声合成装置 | |
JP3130305B2 (ja) | 音声合成装置 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JP2866086B2 (ja) | 残差駆動型音声合成方式 | |
JPS58168097A (ja) | 音声合成装置 | |
JP2614436B2 (ja) | 音声合成装置 | |
JPS5965895A (ja) | 音声合成方法 | |
JP2937322B2 (ja) | 音声合成装置 | |
JPH0756598B2 (ja) | 音声合成装置の音声合成方式 | |
JPS602678B2 (ja) | 音成合成方式 | |
JPS61259300A (ja) | 音声合成方式 | |
JPH01304500A (ja) | 音声合成方式とその装置 | |
JPH03259200A (ja) | 音声の発声時間長制御方法および装置 | |
Gokhale et al. | Analysis and synthesis of speech using least P th norm filter design | |
JPS61256400A (ja) | 音声分析合成方式 |