JP2956069B2 - 音声合成装置のデータ処理方式 - Google Patents
音声合成装置のデータ処理方式Info
- Publication number
- JP2956069B2 JP2956069B2 JP1145605A JP14560589A JP2956069B2 JP 2956069 B2 JP2956069 B2 JP 2956069B2 JP 1145605 A JP1145605 A JP 1145605A JP 14560589 A JP14560589 A JP 14560589A JP 2956069 B2 JP2956069 B2 JP 2956069B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- speech
- energy
- speech synthesizer
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 A.産業上の利用分野 本発明は、規則合成方式による音声合成装置に係り、
特にCVデータとVCデータの処理方式に関する。
特にCVデータとVCデータの処理方式に関する。
B.発明の概要 本発明は、文字入力列に対応するCVデータとVCデータ
の接続によって音声合成を行う音声合成装置において、 CVデータとVCデータの接続点のエネルギーを一致させ
たデータ作成と保存を行うことにより、 CVデータとVCデータの接続に自然性を高めたものであ
る。
の接続によって音声合成を行う音声合成装置において、 CVデータとVCデータの接続点のエネルギーを一致させ
たデータ作成と保存を行うことにより、 CVデータとVCデータの接続に自然性を高めたものであ
る。
C.従来の技術 規則合成方式による音声合成装置は、入力文字列を構
文解析によって単語,文節に区切り、夫々にはイントネ
ーション,アクセントを決定し、単語や文節を音節さら
には音素にまで分解し、音節又は音素単位の音源波及び
調音フイルタのパラメータを求め、音源波に対する調音
フイルタの応答出力として合成音声を得るようにしてい
る。
文解析によって単語,文節に区切り、夫々にはイントネ
ーション,アクセントを決定し、単語や文節を音節さら
には音素にまで分解し、音節又は音素単位の音源波及び
調音フイルタのパラメータを求め、音源波に対する調音
フイルタの応答出力として合成音声を得るようにしてい
る。
このような音声合成装置において、音節単位の規則合
成には、音節パラメータメモリに子音+母音(CVデー
タ)又は母音+子音(VCデータ)単位で音声を特徴づけ
るパラメータを保存しておき、入力文字列に応じて音韻
毎のつながり継続時間,音の強さ(エネルギー,ピッチ
周波数)通の規則を外部から与えて音声特徴パラメータ
を変化させ、これを調音フイルタに入力して合成音声を
得るようにしている。
成には、音節パラメータメモリに子音+母音(CVデー
タ)又は母音+子音(VCデータ)単位で音声を特徴づけ
るパラメータを保存しておき、入力文字列に応じて音韻
毎のつながり継続時間,音の強さ(エネルギー,ピッチ
周波数)通の規則を外部から与えて音声特徴パラメータ
を変化させ、これを調音フイルタに入力して合成音声を
得るようにしている。
ここで、CVデータ又はVCデータを作成するのに、各音
節を独立して発声したときの音声信号からパラメータを
求めている。
節を独立して発声したときの音声信号からパラメータを
求めている。
D.発明が解決しようとする課題 従来の音声合成装置において、CVデータ又はVCデータ
は音声信号からの作成時に音の強さにバラツキが生じ、
入力文字列に従ってCV,VCデータを接続する際に接続点
で異音が生じ易いという問題があった。
は音声信号からの作成時に音の強さにバラツキが生じ、
入力文字列に従ってCV,VCデータを接続する際に接続点
で異音が生じ易いという問題があった。
例えば、第4図に示すように、CVデータとVCデータを
接続するのに、CVデータの終了点のエネルギーECVとVC
データの開始点のエネルギーEVCとにずれがあると、接
続点で異音が発生し、自然性の高い合成音声を得るのを
難しくする。
接続するのに、CVデータの終了点のエネルギーECVとVC
データの開始点のエネルギーEVCとにずれがあると、接
続点で異音が発生し、自然性の高い合成音声を得るのを
難しくする。
本発明の目的は、CVデータのVCデータの接続に自然性
を高めた処理方式を提供することにある。
を高めた処理方式を提供することにある。
E.課題を解決するための手段と作用 本発明は、上記目的を達成するため、入力文字列に対
応したCVデータとVCデータを接続した音声特徴パラメー
タから合成音声を得る音声合成装置において、 音節毎の音声波形のレベルを正規化及び音声パラメー
タ分析によって前記CVデータ及びVCデータを得、このCV
データとVCデータの一方又は両方の切り出し範囲の調節
又はVCデータの全体のレベル調節によってCVデータの終
了のエネルギーにVCデータの開始のエネルギーを一致さ
せて該CVデータ及びVCデータとして保存しておくように
し、 CVデータの終了からVCデータの開始にかけてのわたり
にエネルギーの急激な変化を無くした接続を得る。
応したCVデータとVCデータを接続した音声特徴パラメー
タから合成音声を得る音声合成装置において、 音節毎の音声波形のレベルを正規化及び音声パラメー
タ分析によって前記CVデータ及びVCデータを得、このCV
データとVCデータの一方又は両方の切り出し範囲の調節
又はVCデータの全体のレベル調節によってCVデータの終
了のエネルギーにVCデータの開始のエネルギーを一致さ
せて該CVデータ及びVCデータとして保存しておくように
し、 CVデータの終了からVCデータの開始にかけてのわたり
にエネルギーの急激な変化を無くした接続を得る。
F.実施例 第1図は本発明の一実施例を示す処理フローチャート
である。アナウンサー等により発声された音節毎の音声
波形を取込み(ステップS1)、この音声波形のレベルを
正規化し(ステップS2)、音声パラメータの分析によっ
てパラメータ抽出を行う(ステップS3)。このパラメー
タは時系列データとしてエネルギーやピッチ周波数とし
て取出され、このパラメータに対してCVデータ及びVCデ
ータの決定には時系列データのうちのCVデータの終了と
VCデータの開始のエネルギーレベルを合わせたデータ切
出しを行う(ステップS4)。データ切出しを行われたCV
データ及びVCデータは夫々のパラメータとして音節パラ
メータメモリに保存される(ステップS5)。
である。アナウンサー等により発声された音節毎の音声
波形を取込み(ステップS1)、この音声波形のレベルを
正規化し(ステップS2)、音声パラメータの分析によっ
てパラメータ抽出を行う(ステップS3)。このパラメー
タは時系列データとしてエネルギーやピッチ周波数とし
て取出され、このパラメータに対してCVデータ及びVCデ
ータの決定には時系列データのうちのCVデータの終了と
VCデータの開始のエネルギーレベルを合わせたデータ切
出しを行う(ステップS4)。データ切出しを行われたCV
データ及びVCデータは夫々のパラメータとして音節パラ
メータメモリに保存される(ステップS5)。
上述のようなCV,VCデータの作成処理において、ステ
ップS4におけるデータ切出しには、第2図に示すように
CVデータの終了エネルギーESに一致するVCデータの切出
し範囲の調節によって実現され、CVデータとVCデータの
接続点のエネルギー変化を連続的にする。逆に、CVデー
タの切出し範囲の調節さらには両データの切出し範囲調
節にする。
ップS4におけるデータ切出しには、第2図に示すように
CVデータの終了エネルギーESに一致するVCデータの切出
し範囲の調節によって実現され、CVデータとVCデータの
接続点のエネルギー変化を連続的にする。逆に、CVデー
タの切出し範囲の調節さらには両データの切出し範囲調
節にする。
また、第3図に示すように、VCデータの切出し範囲は
CVデータと同じにし、VCデータの全体のレベルを調節す
ることで同じエネルギーESによる接続を得ることができ
る。
CVデータと同じにし、VCデータの全体のレベルを調節す
ることで同じエネルギーESによる接続を得ることができ
る。
従って、CVデータとVCデータの接続による音声合成時
にはCVデータとVCデータの接続点でのエネルギーレベル
の急変を少なくし、自然性の高いエネルギー変化にして
合成音声の自然性を高めることができる。
にはCVデータとVCデータの接続点でのエネルギーレベル
の急変を少なくし、自然性の高いエネルギー変化にして
合成音声の自然性を高めることができる。
G.発明の効果 以上のとおり、本発明によれば、CVデータとVCデータ
の接続点のエネルギーを一致させたCVデータ及びVCデー
タとして保存しておくため、音声合成時のCVデータとVC
データの接続に滑らかなエネルギー変化を得て自然性を
高めた合成音声を得ることができる。
の接続点のエネルギーを一致させたCVデータ及びVCデー
タとして保存しておくため、音声合成時のCVデータとVC
データの接続に滑らかなエネルギー変化を得て自然性を
高めた合成音声を得ることができる。
第1図は本発明の一実施例を示すフローチャート、第2
図及び第3図は実施例におけるCVデータとVCデータの結
合状態図、第4図は従来の結合状態図である。
図及び第3図は実施例におけるCVデータとVCデータの結
合状態図、第4図は従来の結合状態図である。
Claims (1)
- 【請求項1】入力文字列に対応したCVデータとVCデータ
を接続した音声特徴パラメータから合成音声を得る音声
合成装置において、 音節毎の音声波形のレベルを正規化及び音声パラメータ
分析によって前記CVデータ及びVCデータを得、このCVデ
ータとVCデータの一方又は両方の切り出し範囲の調節又
はVCデータの全体のレベル調節によってCVデータの終了
のエネルギーにVCデータの開始のエネルギーを一致させ
て該CVデータ及びVCデータとして保存しておくことを特
徴とする音声合成装置のデータ処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1145605A JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1145605A JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0310300A JPH0310300A (ja) | 1991-01-17 |
JP2956069B2 true JP2956069B2 (ja) | 1999-10-04 |
Family
ID=15388910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1145605A Expired - Lifetime JP2956069B2 (ja) | 1989-06-08 | 1989-06-08 | 音声合成装置のデータ処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2956069B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5528726A (en) * | 1992-01-27 | 1996-06-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital waveguide speech synthesis system and method |
JP3614874B2 (ja) * | 1993-08-19 | 2005-01-26 | ソニー株式会社 | 音声合成装置及び方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5868099A (ja) * | 1981-10-19 | 1983-04-22 | 富士通株式会社 | 音声合成装置 |
JPS63307500A (ja) * | 1987-06-09 | 1988-12-15 | 日本電気株式会社 | 録音編集合成装置 |
-
1989
- 1989-06-08 JP JP1145605A patent/JP2956069B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0310300A (ja) | 1991-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111429877B (zh) | 歌曲处理方法及装置 | |
JP2005018097A (ja) | 歌唱合成装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JPH0641557A (ja) | 音声合成のための方法および装置 | |
JP2904279B2 (ja) | 音声合成方法および装置 | |
JP2956069B2 (ja) | 音声合成装置のデータ処理方式 | |
Saitou et al. | Analysis of acoustic features affecting" singing-ness" and its application to singing-voice synthesis from speaking-voice. | |
JP3437064B2 (ja) | 音声合成装置 | |
O'Shaughnessy | Design of a real-time French text-to-speech system | |
JP3727885B2 (ja) | 音声素片生成方法と装置及びプログラム、並びに音声合成方法と装置 | |
JPH037995A (ja) | 歌音声合成データの作成装置 | |
JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
JP2995774B2 (ja) | 音声合成方式 | |
JP2703253B2 (ja) | 音声合成装置 | |
JPH0756590A (ja) | 音声合成装置、音声合成方法及び記録媒体 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JPH0836397A (ja) | 音声合成装置 | |
JP2725381B2 (ja) | 音声合成装置の抑揚制御方式 | |
D’Souza et al. | Comparative Analysis of Kannada Formant Synthesized Utterances and their Quality | |
JP3368948B2 (ja) | 音声規則合成装置 | |
Siivola | A survey of methods for the synthesis of the singing voice | |
JPH03200300A (ja) | 音声合成装置 | |
Saitou et al. | Speech-to-Singing Synthesis System: Vocal conversion from speaking voices to singing voices by controlling acoustic features unique to singing voices | |
JPH03216699A (ja) | 音声合成装置の音源データ生成方法 | |
JPH0553595A (ja) | 音声合成装置 |