JP3513071B2 - 音声合成方法及び音声合成装置 - Google Patents
音声合成方法及び音声合成装置Info
- Publication number
- JP3513071B2 JP3513071B2 JP2000053822A JP2000053822A JP3513071B2 JP 3513071 B2 JP3513071 B2 JP 3513071B2 JP 2000053822 A JP2000053822 A JP 2000053822A JP 2000053822 A JP2000053822 A JP 2000053822A JP 3513071 B2 JP3513071 B2 JP 3513071B2
- Authority
- JP
- Japan
- Prior art keywords
- prosody
- control
- parameter
- dictionaries
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001308 synthesis method Methods 0.000 title claims description 8
- 230000015572 biosynthetic process Effects 0.000 title description 69
- 238000003786 synthesis reaction Methods 0.000 title description 68
- 238000000034 method Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 13
- 230000002194 synthesizing effect Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 230000008451 emotion Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 238000013213 extrapolation Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 241001417093 Moridae Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Description
のための音声合成方法及び音声合成装置に関する。
出すことをテキスト音声合成という。通常、テキスト合
成システムは、テキスト解析、合成パラメータ生成、音
声合成の3つの段階から構成される。
構成例を示す。図10に示されるように、従来の一般的
なテキスト合成システムは、通常、テキスト解析部10
10、合成パラメータ生成部1001、音声合成部10
13、韻律制御辞書1002から構成される。入力され
たテキスト1102は、まず、テキスト解析部1010
において形態素解析や構文解析などが行われ、言語情報
1104が出力される。言語情報1104は、テキスト
1102の読みに対応する音声記号列や、韻律制御の単
位となるアクセント句の情報、アクセントの位置、品詞
など、合成パラメータの生成に必要な様々な情報を含ん
でいる。次に、合成パラメータ生成部1001は、言語
情報104に基づき、韻律制御辞書1002を参照して
韻律制御を行い、合成パラメータ1100を生成する。
合成パラメータ1100は、基本周波数・音韻継続時間
・パワーなどの韻律パラメータと音素記号列などの音韻
パラメータとから構成される。そして、音声合成部10
13は、合成パラメータ1100で指定された音韻情報
や韻律情報に従って音声情報1108を生成する。
を読み上げるときのような調子(いわゆる朗読調)の音
声を合成することが普通であったが、近年、発話スタイ
ルを制御して多様な合成音を生成する方法が提案されて
いる。例えば、特開平10−11083号公報では、基
準発話スタイル(朗読調など)を含む複数の発話スタイ
ルの韻律制御辞書を用いて合成音声の発話スタイルを制
御する方法が開示されている。図11に、この従来の音
声合成装置の構成を示す。
の相違は、韻律制御辞書を複数持ち(図11では201
4,2015の2つ)、発話スタイル指定情報2103
に基づいて選択された韻律制御辞書(例えば2015)
と基準発話スタイル韻律制御辞書2016とを用いてそ
れぞれ合成パラメータ2105および合成パラメータ2
106を生成し、発話スタイル強調部2012において
強調度指定情報2101に従って発話スタイルを補正す
ることにある。複数の韻律制御情報2014,2015
は、基準発話スタイルと異なる発話スタイルの韻律制御
辞書であり、例えば会話調スタイルやアナウンサー調ス
タイルなどがある。発話スタイル強調部2012は、発
話スタイル指定情報2103によって選択された発話ス
タイルの合成パラメータ2105と、基準発話スタイル
の合成パラメータ2106との韻律パラメータの差分を
計算し、強調度指定情報2101と該差分に応じて合成
パラメータ2106の韻律パラメータを補正することに
より、発話スタイルが調整された合成パラメータ210
7を生成する。
音声合成方法では、基準発話スタイルと選択された1つ
の発話スタイルとの中間的な発話スタイルに変更するこ
としかできず、また文中では常に一定の発話スタイルと
なり変更の自由度は小さい。さらに、変更できるのは、
発話スタイル(朗読調・会話調・アナウンサー調など)
のみであり、話者の個人性(Aさんの声・Bさんの声な
ど)や感情(怒った声・悲しい声など)の変更は不可能
であるという問題があった。
ので、テキスト音声合成による合成音の韻律の多様性を
向上させることのできる音声合成方法及び音声合成装置
を提供することを目的とする。
御辞書を用いてそれぞれ生成された韻律パラメータを任
意の割合で内挿して韻律パラメータを生成することによ
り、多様な韻律の合成音声を生成できるようにしたもの
である。ここで、複数の韻律制御辞書は、発話スタイル
が異なる場合の他、話者の個人性や年齢・性別が異なる
ものであってもよいし、感情が異なるものであってもよ
く、また、これらの組み合わせによる様々な特徴を持っ
たものを用いてもよい。
合成方法は、入力された言語情報に従って、複数の韻律
制御辞書を用いてそれぞれ第1の韻律パラメータを生成
し、前記韻律制御辞書毎に指定された重み情報に従っ
て、複数の前記第1の韻律パラメータ間で内挿処理を行
って第2の韻律パラメータを生成し、前記第2の韻律パ
ラメータに従って合成音声を生成することを特徴とす
る。
対応する音節記号列や、韻律制御の単位となるアクセン
ト句の情報、アクセントの位置、品詞、かかり受け、な
どのテキストを解析することによって得られる情報と、
平均的な発生速度や声の大きさなどを指定する付加情報
から構成されるものである。
本周波数・音韻継続時間長・パワー・ポーズなどの韻律
を制御するために参照するものであり、例えば、基本周
波数の典型的な変化パターンや、アクセント成分・音韻
継続時間長・パワー・ポーズ長などの制御量の統計的な
モデルのパラメータ、あるいは決定木で表現されるルー
ルなどが考えられる。
・音韻継続時間長・パワー・ポーズなどの合成音声の韻
律を特徴付けるパラメータの集合である。
は、複数の韻律パラメータ間で加重平均などの処理によ
って前記複数の韻律パラメータの中間的な韻律パラメー
タを生成する処理である。ただし、ここで言う内挿処理
には、重みが負になるような、いわゆる外挿処理も含ま
れるものとし、この場合、生成された韻律パラメータ
は、前記複数の韻律パラメータの中間的なものとはなら
ず、いずれかの韻律パラメータの特徴をより強調したよ
うなものとなることもありうる。また、この内挿処理
は、全ての韻律パラメータに対して行ってもよいし、一
部のパラメータ、例えば基本周波数のみに対して行って
もよい。また、例えば基本周波数と音韻継続時間長では
内挿の際の重みが異なるようにしてもよい。
変化するようにしてもよい。
方法は、複数の第1の韻律制御辞書間で内挿処理を行っ
て第2の韻律制御辞書を生成し、入力された言語情報に
従って、前記第2の韻律制御辞書を用いて韻律パラメー
タを生成し、前記韻律パラメータに従って合成音声を生
成することを特徴とする。
の韻律制御辞書内の対応する情報の間で、加重平均など
の処理によって前記複数の韻律制御辞書の中間的な特性
を持つ音韻制御辞書を生成する処理である。ただし、上
述した韻律パラメータの内挿と同様に、ここで言う内挿
処理には、重みが負になるような、いわゆる外挿処理も
含まれるものとし、この場合、生成された韻律制御辞書
の特性は、前記複数の韻律制御辞書の中間的なものとは
ならず、いずれかの韻律制御辞書の特性をより強調した
ようなものとなることもありうる。また、この内挿処理
は、韻律制御辞書全体に対して行ってもよいし、一部分
だけ、例えば基本周波数制御に関する部分のみに対して
行ってもよい。また、例えば基本周波数に関する部分の
内挿のための重みと音韻継続時間長制御に関する部分の
内挿のための重みが異なるようにしてもよい。
方法は、複数の第1の韻律制御辞書間で内挿処理を行う
ことによって生成される第2の韻律制御辞書を用いて、
入力された言語情報に従って韻律パラメータを生成し、
前記韻律パラメータに従って合成音声を生成することを
特徴とする。
型的な基本周波数の変化パターンを表す代表パターン、
もしくはこれと同等の情報を有するもの、例えば典型的
なピッチ周期の変化パターンなどを含むようにしてもよ
い。
装置は、入力された言語情報に従って、複数の韻律制御
辞書を用いてそれぞれ第1の韻律パラメータを生成する
手段と、前記韻律制御辞書毎に指定された重み情報に従
って、複数の前記第1の韻律パラメータ間で内挿処理を
行って第2の韻律パラメータを生成する手段と、前記第
2の韻律パラメータに従って合成音声を生成する手段と
を備えたことを特徴とする。
装置は、複数の第1の韻律制御辞書間で内挿処理を行っ
て第2の韻律制御辞書を生成する手段と、入力された言
語情報に従って、前記第2の韻律制御辞書を用いて韻律
パラメータを生成する手段と、前記韻律パラメータに従
って合成音声を生成する手段とを備えたことを特徴とす
る。
は、複数の韻律制御辞書毎に指定された重み情報を入力
し、入力された前記重み情報に従って、複数の第1の韻
律制御辞書間で内挿処理を行って第2の韻律制御辞書を
生成することを特徴とする。
は、複数の韻律制御辞書毎に指定された重み情報を入力
する手段と、入力された前記重み情報に従って、複数の
第1の韻律制御辞書間で内挿処理を行って第2の韻律制
御辞書を生成する手段とを備えたことを特徴とする。
た言語情報に従って、複数の韻律制御辞書を用いてそれ
ぞれ第1の韻律パラメータを生成させ、前記韻律制御辞
書毎に指定された重み情報に従って、複数の前記第1の
韻律パラメータ間で内挿処理を行って第2の韻律パラメ
ータを生成させ、前記第2の韻律パラメータに従って合
成音声を生成させるためのプログラムを記録したコンピ
ュータ読取り可能な記録媒体である。
1の韻律制御辞書間で内挿処理を行って第2の韻律制御
辞書を生成させ、入力された言語情報に従って、前記第
2の韻律制御辞書を用いて韻律パラメータを生成させ、
前記韻律パラメータに従って合成音声を生成させるため
のプログラムを記録したコンピュータ読取り可能な記録
媒体である。
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。
ンピュータに当該発明に相当する手順を実行させるため
の(あるいはコンピュータを当該発明に相当する手段と
して機能させるための、あるいはコンピュータに当該発
明に相当する機能を実現させるための)プログラムを記
録したコンピュータ読取り可能な記録媒体としても成立
する。
いて生成された韻律パラメータを任意の重みで内挿処理
して韻律パラメータを生成し、その韻律パラメータを用
いて音声合成を行うことで、多種多様な韻律的特徴を持
つ合成音声を生成することができる。
御辞書に内挿処理を行って韻律制御辞書を生成し、その
韻律制御辞書を用いて音声合成を行うことによって、計
算量を増加させることなく多種多様な韻律的特徴を持つ
合成音声を生成することができる。
実施の形態を説明する。
の実施形態に係る音声合成方法を実現する音声合成装置
(もしくは音声合成ソフト)の構成例を示すブロック図
である。
は、テキスト解析部10、合成パラメータ生成部20、
合成パラメータ内挿部22、音声合成部13、複数の韻
律制御辞書(図1では24〜26の3つ)を備えてい
る。
うになる(基本的には、テキスト解析部10、合成パラ
メータ生成部20、合成パラメータ内挿部22、音声合
成部13の順番で処理が行われる)。
ト102に対して、形態素解析や構文解析などを行い、
言語情報104を生成する。言語情報104は、テキス
ト102の読みに対応する音声記号列や、韻律制御の単
位となるアクセント句の情報、アクセントの位置、品詞
など、合成パラメータの生成に必要な様々な情報を含ん
でいる。
04に従って、韻律制御辞書24を参照して合成パラメ
ータ204を、韻律制御辞書25を参照して合成パラメ
ータ205を、韻律制御辞書26を参照して合成パラメ
ータ206をそれぞれ生成する。
01に従って、合成パラメータ204・合成パラメータ
205・合成パラメータ206の韻律パラメータに内挿
処理を行って、合成パラメータ207を生成する。
で指定された音韻情報や韻律情報に従って、音声情報1
08を生成する。
例として、本実施形態の動作例について詳細に説明す
る。
が生成されると、合成パラメータ生成部20では言語情
報104に従って複数の韻律制御辞書を参照して複数の
合成パラメータを生成する。
における基本周波数を生成する処理を表す機能ブロック
図を示す。なお、図2では、1つの韻律制御辞書につい
て示してある(実際には複数の韻律制御辞書のそれぞれ
に対して図2の処理が行われる)。
の一部であり、代表パターン辞書45と代表パターン選
択規則46とオフセット生成規則47から構成される。
代表パターン辞書45は、アクセント句単位の典型的な
基本周波数の変化パターンの集合であり、例えば図3で
表されるようなパターンを格納している。代表パターン
選択部41は、言語情報104に従って、代表パターン
選択規則46を参照して、代表パターン辞書より最も適
当と予想される代表パターン401をアクセント句毎に
選択する。オフセット生成部44は、言語情報104に
従って、オフセット生成規則47を参照してアクセント
句毎にアクセント句の平均的な高さを指定するオフセッ
ト404を生成する。オフセット処理部42は、代表パ
ターン辞書45を対数周波数軸上でオフセット404だ
け並行移動させてアクセント毎に基本周波数パターン4
02を生成する。パターン接続部43は、アクセント句
毎の基本周波数パターン402を滑らかに接続して文章
全体の基本周波数パターン403を出力する。テキスト
「ただいまマイクのテスト中です」を例として、代表パ
ターン401,基本周波数パターン402,基本周波数
パターン403を図4(a),(b),(c)にそれぞ
れ示す。
本周波数パターン生成の処理を、複数の韻律制御辞書2
4・25・26を参照してそれぞれ行って基本周波数パ
ターンを生成し、合成パラメータ204・205・20
6をそれぞれ出力する。
成パラメータ204・205・206の基本周波数パタ
ーンに対して、重み情報201に従って加重平均処理を
行って基本周波数パターンを生成し、合成パラメータ2
07を出力する。
律制御辞書(図1の場合、24〜26)に対応するn個
(図1の場合、3つ)の重み係数の組で表される。図5
は、重み情報201の入力手段(例えば、GUIによ
る)の一例を示している。この例では、3つの韻律制御
辞書24・25・26はそれぞれA氏、B氏、C氏の口
調の韻律的特徴を表現する韻律制御辞書に対応してい
る。黒丸で示されているポインタの位置で、誰にどの程
度似た韻律にするのかを指定する。ポインタの位置が、
図5のa,b,c,dのときの重み情報201の値を図
6に示す。ポインタの位置がaの場合には重み情報20
1は韻律は3人の中間的なものとなり、bの場合にはB
氏に最も似た韻律でC氏とA氏の特徴も少し含むような
ものとなり、cの場合にはA氏とC氏の中間的な韻律と
なりB氏の特徴は含まれず、dの場合にはA氏の韻律の
特徴を大げさにしたような韻律となる。このように、重
み情報を制御することによって、様々な個人性を持った
合成音声を生成することが可能となる。
して、文中で、重み情報が変化できるようにすることも
可能である。図7は、「この宝くじ当たっている、これ
で一生遊んで暮らせるよ。」に対して、テキストに対応
して変化する重み情報の一例を示している。この例で
は、3つの韻律制御辞書24・25・26は、同一人物
の、平穏なとき・驚いたとき・喜んだときの韻律に対応
している。このような変化する重み情報に従って内挿処
理を行うことによって、感情の細かな変化を表現する基
本周波数パターンを生成することが可能となる。
る形態、他のプログラム(プロセス)から与える形態、
テキストの所定の単位(例えば、文単位、文の構成要素
単位)ごとに付与する形態、テキスト解析部10がテキ
ストを解析することによって生成する形態など、種々の
形態が可能である。
づく基本周波数制御モデルを用いて説明したが、この他
に、いわゆる藤崎モデルのような、パターンを関数近似
するモデルなど種々の基本周波数制御モデルを用いるこ
とが可能である。
例として基本周波数について説明したが、韻律継続時間
長やパワー、ポーズなどの韻律パラメータについても同
様の形態で実施することが可能である。すなわち、音韻
継続時間長やパワー、ポーズなどの系列を、複数の韻律
制御辞書を用いてそれぞれ生成し、上述した重み情報に
従って内挿処理を行うことにより様々な韻律的特徴を持
った合成音声を生成することができる。
れば、複数の韻律制御辞書を用いて生成された韻律パラ
メータを任意の重みで内挿処理して韻律パラメータを生
成し、その韻律パラメータを用いて音声合成を行うこと
で、多種多様な韻律的特徴を持つ合成音声を生成するこ
とができる。
実施形態について説明する。
を参照して生成された韻律パラメータに対して内挿処理
を行ったのに対して、第2の実施形態では、複数の韻律
制御辞書に対してあらかじめ内挿処理を行って、韻律の
特徴が調整された韻律制御辞書を作成する点が異なって
いる。
実現する音声合成装置(もしくは音声合成ソフト)の構
成例を示すブロック図である。
は、テキスト解析部10、合成パラメータ生成部30、
韻律制御辞書内挿部31、音声合成部13、内挿のもと
となる複数の韻律制御辞書(図8では24〜26の3
つ)、内挿により得られた韻律制御辞書32を備えてい
る。
を中心に説明する。
音声合成処理の2つに大きく分けられる。すなわち、予
め韻律制御辞書内挿部31により複数の韻律制御辞書
(24〜26)をもとに韻律制御辞書32を生成する。
以降は、韻律制御辞書32を使って、テキスト解析部1
0・合成パラメータ生成部30・音声合成部13により
音声合成を行う。また、韻律制御辞書32の内容を修正
もしくは別のものにしたい場合には、再度、韻律制御辞
書内挿部31により韻律制御辞書32を生成する。
タ生成部30・音声合成部13の構成・動作は基本的に
は図10におけるそれらと同様であるので各ユニットに
関するここでの説明は省略する。
明する。
御辞書24・25・26に対して重み情報301に従っ
て内挿処理を行って、韻律制御辞書32を生成する(合
成パラメータ生成部30は、言語情報104に従って、
この韻律制御辞書32を参照して合成パラメータ305
を生成することになる)。
例として、本実施形態の動作例について詳細に説明す
る。
波数制御モデルは、第1の実施形態と同様に、図2で説
明した代表パターンに基づくモデルを用いて説明する。
ターン辞書・代表パターン選択規則・オフセット生成規
則から構成される。ただし、代表パターン選択規則は、
複数の韻律制御辞書24・25・26について全て共通
となるように韻律制御辞書が作られているものとする。
この場合、韻律制御辞書32の代表パターン選択規則
は、複数の韻律制御辞書24・25・26のいずれかの
代表パターン選択規則の複製とすればよい。そこで、韻
律制御辞書内挿部31における処理は、複数の韻律制御
辞書24・25・26の代表パターン辞書を内挿して韻
律制御辞書32の代表パターン辞書を生成することと、
複数の韻律制御辞書24・25・26のオフセット生成
規則を内挿して韻律制御辞書32のオフセット生成規則
を生成することとなる。
て説明する。
ンによって構成されている。1番からN番までの代表パ
ターンについて、各代表パターン辞書の同じ番号の代表
パターン同士を、重み情報301に従って加重平均処理
することにより内挿処理された代表パターンが生成され
る。
いて説明する。
一つである数量化I類を用いて行うことができる。数量
化I類によるオフセット生成規則の例を図9に示す。オ
フセットの値は、各言語情報が属するカテゴリに対応す
る係数と平均値mの和で与えられる。例えば、あるアク
セント句の文中位置が文中、モーラ数が4、品詞が名詞
であれば、オフセットの値は、m+a2+b4+c1と
なる。そこで、各オフセット生成規則の、同じカテゴリ
に対応する係数同士を、重み情報301に従って加重平
均処理することにより内挿処理されたオフセット生成規
則が生成される。
律制御辞書(図8の場合、24〜26)に対応するn個
(図8の場合、3つ)の重み係数の組で表され、重み係
数を変化させて韻律制御辞書を生成することによって、
第1の実施形態と同様に、様々な韻律的特徴を持った合
成音声を生成することができる。
スト解析部10・合成パラメータ生成部30・音声合成
部13により音声合成を行うことができる。
た複数種類の韻律制御辞書32を用意しておき、それら
を適宜選択して使用可能にすることもできる。
づく基本周波数制御モデルを用いて説明したが、この他
に、いわゆる藤崎モデルのようなパターンを関数近似す
るモデルなど種々の基本周波数制御モデルを用いること
が可能である。
例として基本周波数制御について説明したが、音韻継続
時間長や、パワー、ポーズなどの韻律パラメータについ
ても同様の形態で実施することが可能である。すなわ
ち、音韻継続時間長やパワー、ポーズなどは、数量化I
類などの統計的モデルを用いて制御することが可能であ
るため、上述したオフセット生成規則と同様にモデルの
パラメータを重み情報に従って内挿処理することによ
り、様々な韻律的特徴を持った韻律制御情報を生成する
ことができる。
してあらかじめ内挿処理を行って生成された韻律制御辞
書のみを用いて韻律パラメータを生成するため、音声合
成を行う際の韻律パラメータ生成の計算量が、従来の音
声合成方法と比較して小さいという利点がある。
素のうちテキスト解析部10と合成パラメータ生成部3
0と音声合成部13と韻律制御辞書32とを含む音声合
成装置(もしくは音声合成ソフト)として構成する形態
も可能である。もしくは、テキスト解析部10と合成パ
ラメータ生成部30と音声合成部13とを含む音声合成
装置(もしくは音声合成ソフト)として構成し、韻律制
御辞書32は別途入力する形態も可能である。このよう
な構成は、例えばテレビゲームの各キャラクターの口調
に適した韻律制御辞書32をそれぞれ作成しておき、こ
のキャラクターにゲームの中で合成音声で喋らせるよう
な用途に利用するなど、種々の装置もしくはアプリケー
ションプログラムに適用することができる。
律制御辞書32の素材となる複数の韻律制御辞書を含む
韻律制御辞書作成装置(もしくは韻律制御辞書作成ソフ
ト)として構成する形態も可能である。もしくは、韻律
制御辞書内挿部31を含む韻律制御辞書作成装置(もし
くは韻律制御辞書作成ソフト)として構成し、素材とな
る複数の韻律制御辞書は別途入力する形態も可能であ
る。このような構成によって、様々な韻律制御辞書32
を、ユーザ自身で作成して使用し、あるいはメーカーが
作成してユーザに提供することができる。
れば、予め複数の韻律制御辞書に内挿処理を行って韻律
制御辞書を生成し、その韻律制御辞書を用いて音声合成
を行うことによって、計算量を増加させることなく多種
多様な韻律的特徴を持つ合成音声を生成することができ
る。
てもソフトウェアとしても実現可能である。
の手段を実行させるための(あるいはコンピュータを所
定の手段として機能させるための、あるいはコンピュー
タに所定の機能を実現させるための)プログラムを記録
したコンピュータ読取り可能な記録媒体としても実施す
ることもできる。
るものではなく、その技術的範囲において種々変形して
実施することができる。
用いて生成された韻律パラメータを任意の重みで内挿処
理して韻律パラメータを生成し、その韻律パラメータを
用いて音声合成を行うことで、多種多様な韻律的特徴を
持つ合成音声を生成することができる。
御辞書に内挿処理を行って韻律制御辞書を生成し、その
韻律制御辞書を用いて音声合成を行うことによって、計
算量を増加させることなく多種多様な韻律的特徴を持つ
合成音声を生成することができる。
構成例を示す図
を示す図
構成例を示す図
示す図
図
の構成例を示す図
Claims (7)
- 【請求項1】入力された言語情報に従って、少なくとも
3つの韻律制御辞書を用いてそれぞれ第1の韻律パラメ
ータを生成し、 前記韻律制御辞書毎に指定された重み情報に従って、前
記第1の韻律パラメータ間で内挿処理を行って第2の韻
律パラメータを生成し、 前記第2の韻律パラメータに従って合成音声を生成し、 前記重み情報が文中で変化する ことを特徴とする音声合
成方法。 - 【請求項2】前記韻律制御辞書は典型的な基本周波数の
変化パターンを表す代表パターンを含むことを特徴とす
る請求項1に記載の音声合成方法。 - 【請求項3】複数の第1の韻律制御辞書間で内挿処理を
行って第2の韻律制御辞書を生成し、 入力された言語情報に従って、前記第2の韻律制御辞書
を用いて韻律パラメータを生成し、 前記韻律パラメータに従って合成音声を生成する音声合
成方法であって、 前記第1、第2の韻律制御辞書は典型的な基本周波数の
変化パターンを表す代表パターンを含むことを特徴とす
る音声合成方法。 - 【請求項4】入力された言語情報に従って、少なくとも
3つの韻律制御辞書を用いてそれぞれ第1の韻律パラメ
ータを生成する手段と、前記韻律制御辞書毎に指定され
た重み情報に従って、 前記第1の韻律パラメータ間で内挿処理を行って第2の
韻律パラメータを生成する手段と、前記第2の韻律パラ
メータに従って合成音声を生成する手段と、前記重み情
報を文中で変化させる手段と、を備えたことを特徴とす
る音声合成装置。 - 【請求項5】複数の第1の韻律制御辞書間で内挿処理を
行って第2の韻律制御辞書を生成する手段と、 入力された言語情報に従って、前記第2の韻律制御辞書
を用いて韻律パラメータを生成する手段と、 前記韻律パラメータに従って合成音声を生成する手段と
を備え、前記第1、第2の韻律制御辞書は典型的な基本
周波数の変化パターンを表す代表パターンを含むことを
特徴とする音声合成装置。 - 【請求項6】入力された言語情報に従って、少なくとも
3つの韻律制御辞書を用いてそれぞれ第1の韻律パラメ
ータを生成させ、 前記韻律制御辞書毎に指定された重み情報に従って、前
記第1の韻律パラメータ間で内挿処理を行って第2の韻
律パラメータを生成させ、 前記第2の韻律パラメータに従って合成音声を生成さ
せ、 前記重み情報を文中で変化させ るためのプログラムを記
録したコンピュータ読取り可能な記録媒体。 - 【請求項7】複数の第1の韻律制御辞書間で内挿処理を
行って典型的な基本周波数の変化パターンを表す代表パ
ターンを含む第2の韻律制御辞書を生成させ、 入力された言語情報に従って、前記第2の韻律制御辞書
を用いて韻律パラメータを生成させ、 前記韻律パラメータに従って合成音声を生成させるため
のプログラムを記録したコンピュータ読取り可能な記録
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000053822A JP3513071B2 (ja) | 2000-02-29 | 2000-02-29 | 音声合成方法及び音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000053822A JP3513071B2 (ja) | 2000-02-29 | 2000-02-29 | 音声合成方法及び音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001242882A JP2001242882A (ja) | 2001-09-07 |
JP3513071B2 true JP3513071B2 (ja) | 2004-03-31 |
Family
ID=18575153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000053822A Expired - Fee Related JP3513071B2 (ja) | 2000-02-29 | 2000-02-29 | 音声合成方法及び音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3513071B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7200558B2 (en) | 2001-03-08 | 2007-04-03 | Matsushita Electric Industrial Co., Ltd. | Prosody generating device, prosody generating method, and program |
JP2003233388A (ja) * | 2002-02-07 | 2003-08-22 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
JP2006337468A (ja) * | 2005-05-31 | 2006-12-14 | Brother Ind Ltd | 音声合成装置及び音声合成プログラム |
JP4246790B2 (ja) * | 2006-06-05 | 2009-04-02 | パナソニック株式会社 | 音声合成装置 |
JP2009025328A (ja) * | 2007-07-17 | 2009-02-05 | Oki Electric Ind Co Ltd | 音声合成装置 |
JP5726822B2 (ja) * | 2012-08-16 | 2015-06-03 | 株式会社東芝 | 音声合成装置、方法及びプログラム |
JP6048726B2 (ja) | 2012-08-16 | 2016-12-21 | トヨタ自動車株式会社 | リチウム二次電池およびその製造方法 |
JP5802807B2 (ja) * | 2014-07-24 | 2015-11-04 | 株式会社東芝 | 韻律編集装置、方法およびプログラム |
JP2017107228A (ja) * | 2017-02-20 | 2017-06-15 | 株式会社テクノスピーチ | 歌声合成装置および歌声合成方法 |
-
2000
- 2000-02-29 JP JP2000053822A patent/JP3513071B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
吉村貴克,他,HMMに基づく音声合成システムにおける話者補間,日本音響学会平成9年度秋季研究発表会講演論文集,1997年 9月,1−P−17,p.337−338 |
坂野秀樹,他,包絡と音源の独立操作による音声モーフィング,電子情報通信学会論文誌A,1998年 2月25日,Vol.J81−A,No.2,p.261−268 |
Also Published As
Publication number | Publication date |
---|---|
JP2001242882A (ja) | 2001-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4125362B2 (ja) | 音声合成装置 | |
US7739113B2 (en) | Voice synthesizer, voice synthesizing method, and computer program | |
JP5039865B2 (ja) | 声質変換装置及びその方法 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JPH1138989A (ja) | 音声合成装置及び方法 | |
JP3513071B2 (ja) | 音声合成方法及び音声合成装置 | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
JP2623586B2 (ja) | 音声合成におけるピッチ制御方式 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP2003337592A (ja) | 音声合成方法及び音声合成装置及び音声合成プログラム | |
JP2006227589A (ja) | 音声合成装置および音声合成方法 | |
JP2001282276A (ja) | 音声合成方法、装置および記憶媒体 | |
JP3425996B2 (ja) | ピッチパターン生成装置 | |
JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JP2002304186A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3575919B2 (ja) | テキスト音声変換装置 | |
JP6163454B2 (ja) | 音声合成装置、その方法及びプログラム | |
JP6299141B2 (ja) | 楽音情報生成装置および楽音情報生成方法 | |
JPH09179576A (ja) | 音声合成方法 | |
JP4758931B2 (ja) | 音声合成装置、方法、プログラム及びその記録媒体 | |
JP2001265374A (ja) | 音声合成装置及び記録媒体 | |
JP2003330482A (ja) | 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム | |
JP2995774B2 (ja) | 音声合成方式 | |
JP2573586B2 (ja) | 規則型音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100116 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110116 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |