JP3971577B2 - 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 - Google Patents
音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 Download PDFInfo
- Publication number
- JP3971577B2 JP3971577B2 JP2001017189A JP2001017189A JP3971577B2 JP 3971577 B2 JP3971577 B2 JP 3971577B2 JP 2001017189 A JP2001017189 A JP 2001017189A JP 2001017189 A JP2001017189 A JP 2001017189A JP 3971577 B2 JP3971577 B2 JP 3971577B2
- Authority
- JP
- Japan
- Prior art keywords
- accent phrase
- text analysis
- probability
- text
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 35
- 238000003786 synthesis reaction Methods 0.000 title claims description 25
- 238000001308 synthesis method Methods 0.000 title claims description 10
- 240000000220 Panda oleosa Species 0.000 claims description 74
- 235000016496 Panda oleosa Nutrition 0.000 claims description 74
- 230000006870 function Effects 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 abstract description 3
- 230000033764 rhythmic process Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 46
- 238000000034 method Methods 0.000 description 39
- 239000011295 pitch Substances 0.000 description 19
- 239000002245 particle Substances 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004523 agglutinating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000011306 natural pitch Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Description
【発明の属する技術分野】
この発明は、文字情報から音声を合成する音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体に関する。
【0002】
【従来の技術】
従来より、文字情報から音声を合成するテキスト音声合成として、テキスト解析処理,韻律生成処理および音声合成処理の3つの処理を順次行う方法が知られている。図9に従来の音声合成装置のブロック図を示す。
【0003】
テキスト解析部1は、上記テキスト解析処理を行ない、入力文字情報から単語境界を検出し、各単語の音素記号列を求める。また、韻律生成部2は、上記韻律生成処理を行ない、上記求められた音素の継続時間長,単語のアクセント,文イントネーション等の韻律情報を付与する。また、音声合成部3は、上記音声合成処理を行ない、予め蓄積してある合成単位と規則とに基づいて、音声合成器の制御信号を生成する。
【0004】
以下、日本語のテキスト音声合成装置を例に、テキスト音声合成方法について詳細に説明する。日本語は、英語のように単語の境界をスペースで区切る言語と異なり、単語境界が明確でない所謂膠着語であるため、テキスト解析処理を行って単語境界を検出するのである。このテキスト解析処理は、単語の表記や読みの情報を記憶した辞書と単語の接続関係情報を記憶した文法とを用いて、文章の先頭から順次照合処理を行うことによって実行される。
【0005】
上記単語には、名詞や動詞のような自立語と、助詞や助動詞のような付属語とがある。例えば、「今日は天気です。」という文は、以下のようにテキスト解析される。
「今日(名詞)/ は(助詞)/ 天気(名詞)/ です(助動詞)。」
【0006】
このようなテキスト解析結果に基づいて、韻律生成処理および音声合成処理を行うのが一般的なテキスト音声合成方法である。尚、韻律生成処理および音声合成処理の詳細については、例えば古井著「ディジタル音声処理」(東海大学出版会)に記載されている通りである。
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来のテキスト音声合成方法においては、以下のような問題がある。すなわち、近年、インターネット等の普及によって電子化された文字情報が一般社会で日常使われるようになってきている。特に、メール文のように日常会話で使う言葉で書かれたテキストが増加している。日常会話で使うような所謂話し言葉は、表現が多様であるため文法で規則化することは困難である。
【0008】
このように、文法では規定できないような話し言葉が入力テキストとして与えられた場合、テキスト解析が正しく行われないことが多い。その場合、上記韻律生成処理はテキスト解析結果が正しいという前提で行われるために、不自然な韻律が生成されてしまうのである。
【0009】
例えば、「見たことなーい」という話し言葉文が、テキスト解析処理によって以下のように解析されたとする。
「見(動詞)/ たこ(名詞)/ となー(名詞)/ い(名詞)」
このテキスト解析結果に基づいて韻律生成処理が行われると、「見る」という動詞と「たこ」という名詞に誤解析されたことが原因となって、音節「た」の位置で声立て成分が開始されて不自然なアクセントになってしまうのである。
【0010】
このような問題を解決するために、特開平11‐259094号公報においては、図10にブロック図を示すような音声合成装置が提案されている。図10において、テキスト解析部11,韻律生成部12および音声合成部13は、図9におけるテキスト解析部1,韻律生成部2および音声合成部3と同じである。本音声合成装置は、ユーザの選択した文字列に付与された韻律情報をユーザの指示に応じて修正する韻律編集部14を有している。したがって、テキスト解析部11の誤解析等に起因して韻律生成部12によって不自然な韻律が生成された場合には、韻律の不自然な箇所を韻律編集部14の修正機能を用いてユーザが修正することによって、自然な音声に修正することができるのである。
【0011】
しかしながら、上記特開平11‐259094号公報に記載された音声合成装置においては、ユーザが手作業で修正する必要があり、ユーザに手間と負担が掛るという問題がある。
【0012】
そこで、この発明の目的は、話し言葉等に出現する文法規定外の表現に起因して生成される不自然な韻律を自動的に抑制できる音声合成装置および音声合成方法、この音声合成装置が搭載された携帯端末器、音声合成プログラム、並びに、プログラム記録媒体を提供することにある。
【0013】
【課題を解決するための手段】
上記目的を達成するため、第1の発明は、
入力テキストを解析するテキスト解析手段と、上記テキスト解析結果に基づいて韻律情報を生成する韻律生成手段と、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成手段を有する音声合成装置において、
上記テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成して上記韻律生成手段に送出する第1アクセント句生成手段と、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成して上記韻律生成手段に送出する第2アクセント句生成手段と、
上記テキスト解析結果に基づいて、上記第1アクセント句生成手段と第2アクセント句生成手段との何れによってアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定手段
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴としている。
【0014】
上記構成によれば、アクセント句生成判定手段によって、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成する第1アクセント句生成手段と上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく生成する第2アクセント句生成手段との何れによって行うかが予め判定される。したがって、例えば話し言葉のようにテキスト解析手段によって誤解析され易い入力テキストに関するアクセント句は、上記第2アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【0015】
さらに、上記アクセント句生成判定手段によって、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖情報、および、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度情報の少なくとも一つを基準として、第1アクセント句生成手段か第2アクセント句生成手段かの判定が行われる。したがって、話し言葉での入力テキストに基づくアクセント句の生成は第2アクセント句生成手段によって行うべきと、的確に判定される。
【0016】
また、第1の実施例は、上記第1の発明の音声合成装置において、
上記第2アクセント句生成手段は、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定する
ことを特徴としている。
【0017】
この実施例によれば、上記第2アクセント句生成手段によって、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。こうして、上記品詞付き単語に囚われることなく正しくアクセント句が生成される。すなわち、例えば話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成が抑制されて自然な韻律が生成される。
【0018】
また、第2の実施例は、上記第1の発明の音声合成装置において、
上記仮名連鎖情報は、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率であり、
上記テキスト解析尤度情報は、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であり、
上記アクセント句候補のモーラ数は、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であり、
上記アクセント句候補中の位置は、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率である
ことを特徴としている。
【0019】
この実施例によれば、上記第2アクセント句生成手段によって、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率である仮名連鎖情報、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であるテキスト解析尤度情報、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であるアクセント句候補のモーラ数、および、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率であるアクセント句候補中の位置、の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。
【0020】
また、第2の発明は、
入力テキストを解析し、このテキスト解析結果に基づいて韻律情報を生成し、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成方法において、
上記テキスト解析結果のうちの品詞付き単語に基づいて、上記韻律情報を生成する際に用いる第1アクセント句を生成する第1アクセント句生成ステップと、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく、上記韻律情報を生成する際に用いる第2アクセント句を生成する第2アクセント句生成ステップと、
上記テキスト解析結果に基づいて、上記第1アクセント句と第2アクセント句とのうちの何れのアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定ステップ
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴としている。
【0021】
上記構成によれば、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成するか、上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく生成するかが、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖分岐確率、および、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度分岐確率、の少なくとも一つを用いて予め判定される。したがって、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句は、テキスト解析結果のうちの上記品詞付き単語に囚われることなく生成することが可能になる。
【0022】
また、第3の発明の携帯端末器は、上記第1の発明の音声合成装置を搭載したことを特徴としている。
【0023】
上記構成によれば、例えば話し言葉のように文法では規定できない入力テキストに対して自然なアクセント句を与えることができる音声合成装置が携帯端末器に搭載される。したがって、日常会話で使う言葉で書かれたメール文を受信した場合でも合成音声によって正確に出力することが可能になり、携帯端末器の操作性が向上される。
【0024】
また、第4の発明の音声合成プログラムは、コンピューターを、上記第1の発明におけるテキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第1アクセント句生成手段および第2アクセント句生成手段として機能させることを特徴としている。
【0025】
また、第5の発明のプログラム記録媒体は、上記第4の発明の音声合成プログラムが記録されたことを特徴としている。
【0026】
上記第4,第5の発明の構成によれば、上記第1の発明の場合と同様に、例えば話し言葉のようにテキスト解析手段で誤解析され易い入力テキストに関するアクセント句が、上記第2アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【0027】
【発明の実施の形態】
以下、この発明を図示の実施の形態により詳細に説明する。図1は、本実施の形態の音声合成装置におけるブロック図である。テキスト解析部21は、入力されたテキストを解析して単語境界を検出し、各単語の音素記号列を求める。アクセント句生成判定部22は、上記テキスト解析結果に基づいて、アクセント句の生成を第1アクセント句生成部23で行なうか第2アクセント句生成部24で行なうかを判定する。そして、第1アクセント句生成部23によって、上記テキスト解析結果に基づいてアクセント句が生成される。一方、第2アクセント句生成部24は、上記テキスト解析結果に依存せずにアクセント句を生成する。
【0028】
韻律生成部25は、上記第1アクセント句生成部23あるいは第2アクセント句生成部24によって生成された各アクセント句に対して、音素の継続時間長,アクセント核の位置および文イントネーション等の韻律情報を付与する。音声合成部26は、上記付与された韻律生成情報に基づいて、予め蓄積されている合成単位と規則とによって音声合成器の制御信号を生成する。
【0029】
上記テキスト解析部21,第1アクセント句生成部23,韻律生成部25および音声合成部26の詳細については、例えば、古井著「ディジタル音声処理」(東海大学出版会)に記載されている通りであり、ここでは用語の簡単な説明にとどめる。
【0030】
アクセント核を1個保有するアクセントのまとまりをアクセント句という。ここで、上記アクセント核とは、個々の語において、声の高さが高から低へ移る位置をいう。声は、その出始めでは高いが、次第に声門下圧の低下等によって高さが低下する。このようなピッチ(基本周波数)が時間と共に低下する特性を声立て成分と呼び、この特性の上に、アクセントによって決まる単語および文節固有のピッチパターン(アクセント成分)が重畳されて、文全体のピッチパターンが決まる。図6にピッチパターンを求める過程を示す。
【0031】
以下においては、説明を容易にするために、アクセント句生成判定部22は、テキスト解析結果を見て、書き言葉であれば第1アクセント句生成部23に解析結果データを送る一方、話し言葉であれば第2アクセント句生成部24に判定結果データを送るものとする。しかしながら、この発明はこれに限定されるものではない。また、説明の都合上、先ず第1アクセント句生成部23による話し言葉の処理に関する問題点について述べる。尚、第1アクセント句生成部23の機能は、図9や図10に示す従来の音声合成装置においては、テキスト解析部1,11または韻律生成部2,12の何れか、あるいは両者で行われるものである。そして次に、アクセント句生成判定部22の処理、最後に第2アクセント句生成部24の処理の順に説明する。
【0032】
上記第1アクセント句生成部23は、上記テキスト解析部21によるテキスト解析の結果に基づいてアクセント句を生成するものであり、上述したように従来から一般的に行なわれている技術である。例として、単語の接続関係情報を記憶した文法に則った文「今日は天気です。」に対する第1アクセント句生成部23でのピッチパターンの生成は、上述のように図6に示す手順によって行なわれる。こうして、文法に則った文が正しくテキスト解析されれば、問題なく第1アクセント句生成部23によってピッチパターンが生成されるのである。
【0033】
ここで、仮に、上記第1アクセント句生成部23によって、文法に則っていない「なーんちゃってぇー」という文のピッチパターンを生成すると図7に示すようになる。すなわち、テキスト解析部21によるテキスト解析結果は、「なー(助:終助詞)/ ん(助詞:格助詞)/ ちゃっ(動詞:5段ワ行)/ て(助詞:接続助詞)/ ぇ(未知語)/ ー(未知語)」のように解析され、「ん」と「ちゃっ」の間にアクセント句の区切れがあると判断されることで、「ちゃっ」のところで次の声立て成分が開始される。これは、図7において、声立て成分が2つに別れていることで示されており、不自然なピッチパターンの原因になっている。
【0034】
そこで、本実施の形態における音声合成装置では、上記第2アクセント句生成部24を設けて、図8に示すように、アクセント句の区切れで生成される次の声立て成分の開始を抑制し、更にアクセント成分も抑制することによって、ピッチパターンの変動を抑えて大きく誤らないようにするのである。
【0035】
上記テキスト解析部21によるテキスト解析が確実に正しく行われれば、第1アクセント句生成部23だけで十分なのである。ところが、現時点におけるテキスト解析処理では、区切り位置の誤りや品詞の判断誤り、あるいは辞書に登録されていない未知語の処理等、不完全な部分がまだある。特に、話し言葉のような文法規定外の入力テキストからは、韻律情報を付与するための正確な情報は得にくい。すなわち、「なーんちゃってぇー」のような話し言葉を辞書や文法で表現しようとしても、多くのバリエーションがあるために書き言葉に比べて規則化が困難なのである。
【0036】
上記話し言葉の特徴は仮名文字列に現れる。本実施の形態においては、この仮名文字列の特徴を捕えて不自然な韻律を抑制するのである。例えば、「なーんちゃってぇー」の例の場合には、「ちゃっ」が動詞であるというテキスト解析結果を用いないために、「なーんちゃってぇー」という一つのアクセント句に対してピッチパターンを生成できるのである。
【0037】
次に、「なーんちゃってぇー」を一つのアクセント句として第2アクセント句生成部24で処理すべきであると判定するアクセント句生成判定部22について述べる。書き言葉のテキスト解析結果は、一般的に自立語と付属語とが連続する形になる。これに対して、話し言葉をテキスト解析すると、誤解析によって、自立語がない文節ができたり辞書に登録されていない未知語と判定されたりするという現象が見られる。そこで、この現象を捕えて、テキスト解析結果が信頼できると判定すれば第1アクセント句生成部23でアクセント句生成の処理を行ない、そうでなければ第2アクセント句生成部24でアクセント句生成の処理を行なうのである。
【0038】
したがって、上記第2アクセント句生成部24で処理を行なう場合には、どの単位をアクセント句とするかを予め決めてやる必要がある。その場合、テキスト解析部21によるテキスト解析の結果は信頼性が低いため、区切り位置や品詞情報は使用しないようにする。そして、未知語と判定された単語および小文字「ぇ」や長音記号「ー」を含む部分は書き言葉である可能性が高いため、アクセント句を細切れとせずに広い範囲をアクセント句としてまとめるのである。
【0039】
このように、上記テキスト解析結果に未知語を含んだりあるいは話し言葉特有の文字が存在するという情報を手がかりにすることによって、アクセント句生成判定部22によって、入力された文字列が書き言葉であるか話し言葉であるか、すなわち第1アクセント句生成部23で処理するか第2アクセント句生成部24で処理するかを判断することが可能になるのである。
【0040】
図2に、上記テキスト解析部21,アクセント句生成判定部22,第1アクセント句生成部23および第2アクセント句生成部24によって行なわれるアクセント句生成処理動作のフローチャートを示す。以下、第1アクセント句生成部23で処理される通常のテキスト「今日は天気です」と、第2アクセント句生成部24で処理される話し言葉のテキスト「なーんちゃってぇー」とを例に、アクセント句生成処理動作の具体的手法について説明する。
【0041】
ステップS1で、上記テキスト解析部21によって入力テキストに対してテキスト解析処理が行なわれる。ステップS2で、単語番号iに初期値「1」がセットされる。ステップS3で、単語番号iが、上記テキスト解析処理結果に基づく当該入力テキストの単語数N1よりも大きいか否かが判別される。その結果、N1よりも大きければアクセント句生成処理動作を終了する。一方、N1以下であればステップS4に進む。ステップS4で、i番目の単語が読み出されて変数Tiに代入される。ステップS5で、単語Ti中に連続する仮名列が在るか否かが判別される。その結果、在ればステップS6に進む。一方、なければステップS9に進む。ステップS6で、仮名連鎖分岐確率テーブルが参照される。
【0042】
ここで、仮名連鎖分岐確率とは、2つの仮名文字の第1文字Wiと第2文字Wjとが連続して出現する場合に第2アクセント句生成部24での処理に分岐すべきと判断される確率(つまり、話し言葉である確率)であり、予め求められて仮名連鎖分岐確率テーブルに格納されている。上記仮名連鎖分岐確率テーブルの求め方は次のように行う。
【0043】
予め大量のテキストデータに基づいて、任意の平仮名文字連鎖Wi,Wjが書き言葉のテキストコーパスL1と話し言葉のテキストコーパスL2との夫々に出現する確率P(Wi,Wj,L1)とP(Wi,Wj,L2)とを求める。そして、平仮名文字連鎖Wi,Wjが出現した場合に話し言葉のテキストコーパスL2に属する確率R(Wi,Wj)を、次式
R(Wi,Wj)=P(Wi,Wj,L2)/{(P(Wi,Wj,L1)+P(Wi,Wj,L2)}
によって求める。こうして求めた、話し言葉のテキストコーパスL2に属する確率R(Wi,Wj)を上記分岐確率として、第1文字Wiと第2文字Wjとに対応付けてテーブルに格納することによって、上記仮名連鎖分岐確率テーブルが得られるのである。
【0044】
図3は上記仮名連鎖分岐確率テーブルの一例を示し、例えば、第1文字「で」と第2文字「す」と両仮名文字連鎖が現れた場合にテキストコーパスL2に属する確率値R(で,す)である分岐確率とが対応付けられて格納されている。この場合、仮名文字「で」と「す」との連鎖は話し言葉特有のものではないために、分岐確率R(で,す)の値は小さい。一方、仮名文字「な」と「ー」との連鎖は話し言葉特有のものであり、分岐確率R(な,ー)の値は大きい。
【0045】
ステップS7で、解析尤度分岐確率テーブルが参照される。ここで、解析尤度分岐確率は、テキスト解析の結果の信頼性が低いために第2アクセント句生成部24での処理に分岐すべきと判断される確率(つまり、話し言葉である確率)である。例えば、品詞が「未知語」であれば解析尤度分岐確率は高くなり、その他の品詞であれば小さくなる。また、文頭が付属語で始まる場合にはテキスト解析の信頼性は低いと考えられるため、解析尤度分岐確率は高くなる。この解析尤度分岐確率は、品詞条件とその品詞条件を満たす場合には第2アクセント句生成部24での処理に分岐すべきと判断される分岐確率とが対応付けられて格納された解析尤度分岐確率テーブルを参照することで求められる。図4は上記解析尤度分岐確率テーブルの一例を示す。例えば、「今日は天気です」中の「です」は、品詞が助動詞で付属語ではあるが名詞「天気」に後続しているために文頭の付属語ではなく、解析尤度分岐確率値は小さい値となるのである。
【0046】
ステップS8で、上記ステップS6において求められた仮名連鎖分岐確率値とステップSS7において求められた解析尤度分岐確率値とに基づいて、分岐確率が計算される。ステップS9で、アクセント句が形成されるか否かが判別される。その結果、アクセント句が形成される場合はステップS10に進む一方、形成されない場合はステップS13に進む。ステップS10で、分岐確率は所定値αよりも大きいか否かが判別される。その結果、所定値αよりも大きければステップS11に進み、所定値α以下であればステップS12に進む。ステップS11で、上記第2アクセント句生成部24によってアクセント句が生成される。そうした後にステップS13に進む。ステップS12で、テキスト解析結果に基づいて、第1アクセント句生成部23によってアクセント句が生成される。ステップS13で、単語番号iがインクリメントされる。そうした後に上記ステップS3に戻って、次の単語番号iの処理に移行する。そして、上記ステップS3において、単語番号iが入力テキストの単語数N1よりも大きいと判別されと、アクセント句生成処理動作を終了する。
【0047】
以下、通常のテキスト「今日は天気です」が入力された場合を例に、上述したアクセント句生成処理動作について具体的に説明する。先ず、テキスト「今日は天気です」に対してテキスト解析が行なわれ、処理結果「今日(名詞)/ は(助詞)/ 天気(名詞)/ です(助動詞)」が得られる。この場合には、上記テキスト解析処理によって、入力テキスト「今日は天気です」は4つの単語(N1=4)に区切られる。
【0048】
次に、1番目の単語「今日」が読み出される。そして、この単語「今日」には連続する仮名列はないので、アクセント句を形成するか否かが判別される。そして、後方に助詞が続くのでアクセント句は形成されないと判定されて、2番目の単語「は」が読み出される。そして、前の単語「今日」との連結を考慮しても連続する仮名列がないので、アクセント句を形成するか否かが判別される。そして、前の単語「今日」との結合で「今日は」という文節になるため、アクセント句を形成すると判別される。ここで、連続する仮名列はなく分岐確率の計算処理を行っていないため分岐確率は「0」となり、第1アクセント句生成部23によって、テキスト解析結果に基づいてアクセント句が生成される。
【0049】
次に、3番目の単語「天気」に対する処理が1番目の単語「今日」の場合と同様に処理される。次に、4番目の単語「です」が読み出される。そして、この単語「です」には、連続する仮名列(「で」と「す」)とがあるので、「で」と「す」との仮名連鎖分岐確率と解析尤度分岐確率とが求められる。また、求められた仮名連鎖分岐確率値と解析尤度分岐確率値とに基づいて、分岐確率が計算される。この場合、仮名連鎖分岐確率値と解析尤度分岐確率値との両者共に小さいために、単語「です」の分岐確率の値は小さくなる。さらに、アクセント句「天気です」が形成されると判断される。そして、上記分岐確率の値は小さいためにαより小さいと判断されて、第1アクセント句生成部23によるテキスト解析結果に基づくアクセント句の生成が行なわれるのである。そして、単語番号iの内容が単語数「4」より大きくなると、テキスト「今日は天気です」によるアクセント句生成部判定処理動作を終了する。尚、上述の例においては2連鎖の仮名列を例に説明しているが、3連鎖以上であっても同様である。
【0050】
次に、話し言葉によるテキスト「なーんちゃってぇー」が入力された場合を例に挙げて、上述したアクセント句生成処理動作について具体的に説明する。先ず、テキスト「なーんちゃってぇー」に対してテキスト解析が行なわれ、処理結果「なー(助詞:終助詞)/ ん(助詞:格助詞)/ ちゃっ(動詞:5段ワ行)/ て(助詞:接続助詞)/ ぇ(未知語)/ ー(未知語)」が得られる。この場合は、上記テキスト解析処理によって、入力テキスト「なーんちゃってぇー」は6つの単語に区切られる。
【0051】
次に、1番目の単語「なー」が読み出される。そして、この単語「なー」には、連続する仮名列(「な」と「ー」)とがあるため、「な」と「ー」との仮名連鎖分岐確率と解析尤度分岐確率とが求められる。その場合、「な」と「ー」との連鎖は話し言葉特有のものであるために、仮名連鎖分岐確率R(な,ー)の値は大きくなっている。また、文頭が付属語で始まる場合はテキスト解析の信頼性が低いと考えられるために、解析尤度分岐確率は大きくなっている。そして、求められた仮名連鎖分岐確率値と解析尤度分岐確率値とに基づいて、分岐確率が計算される。この場合、仮名連鎖分岐確率値と解析尤度分岐確率値との両者共に大きいため、単語「なー」の分岐確率の値は大きくなる。
【0052】
さらに、後続の単語「ん」とまとまってアクセント句が形成されるため、当該単語「なー」だけではアクセント句が形成されないと判断される。次に、2番目の単語「ん」に対する処理が1番目の単語「なー」の場合と同様に処理される。そして、アクセント句を形成するか否かを判別する際に、後続の「ちゃっ」という動詞との間にアクセント句の切れ目がないと判断され、「なーん」だけではアクセント句は形成しないと判別される。このことは、「なーん」や「ちゃっ」の分岐確率がある程度高いことから判断される。以下、3番目の単語「ちゃっ」から6番目の単語「ー」に対して同様の処理が行われ、何れの単語も分岐確率が高いことからアクセント句を形成することはないと判断される。結局、入力テキスト「なーんちゃってぇー」に対するテキスト解析によって区切られた単語は、夫々分岐確率が高いことから「なんーちゃってぇー」という一つのアクセント句が形成されることになる。
【0053】
このようにして形成された一つのアクセント句は、上記分岐確率が大きいためにαより大きいと判断されて、第2アクセント生成部24によって、テキスト解析の結果を用いずにアクセント句が生成されるのである。したがって、第1アクセント生成部23によって、テキスト解析の誤解析結果を用いてアクセント句を生成することによる不自然なアクセントの生成を避けることができるのである。
【0054】
次に、上記第2アクセント句生成部24によって実行されるテキスト解析結果を用いないアクセント句生成処理について詳細に説明する。図5に、第2アクセント句生成部24によるアクセント句生成処理動作のフローチャートを示す。図2に示すアクセント句生成処理動作における上記ステップS11において、アクセント句候補「なーんちゃってぇー」が第2アクセント生成部24に送出されるとアクセント句生成処理動作がスタートする。
【0055】
ステップS21で、入力アクセント句候補のモーラ番号jに初期値「1」がセットされる。ステップS22で、入力アクセント句候補「なーんちゃってぇー」からj番目のモーラに該当する文字が読み出されて変数Mjに代入される。ステップS23で、仮名連鎖M(j-1),Mjに基づいて、文字Mjの部分で声立て成分が開始される確率(以下、声立て確率と言う)が仮名連鎖情報テーブルを用いて求められ、変数a1に代入される。ここで、上記仮名連鎖情報テーブルは、連続する二つの仮名文字の間で声立て成分が開始される確率を予め大量のテキストデータに基づいて求めたものである。アクセント句生成判定部22で用いられる上記仮名連鎖分岐確率テーブルは、その確率値(分岐確率値)は話し言葉である確率値である。これに対して、仮名連鎖情報テーブルの確率値は、上記声立て確率値であることだけが異なるのである。したがって、上記仮名連鎖情報テーブルの確率値が大きければ、第2文字Mjで声立て成分が開始される可能性が高いのである。例えば、入力アクセント句候補「なーんちゃってぇー」における「ん」と「ちゃ」との場合には、大量のテキストデータ中において「ん」と「ちゃ」との間で声立て成分が開始される場合は少ないので、その声立て確率値は低くなるのである。
【0056】
ステップS24で、仮名Mjに続く文字列に基づいて、図2に示すアクセント句生成処理動作における上記ステップS7において参照された解析尤度分岐確率の値が検索され、その逆数の値が変数a2に代入される。ここで、上記解析尤度分岐確率が高いと言うことはテキスト解析結果の信頼性が低いことを意味しているので、解析尤度分岐確率の値が大きければ文字Mjが声立て成分の開始位置となる可能性は低くなる。例えば、解析尤度を計る尺度として品詞情報を例に説明すると、未知語と解析された仮名文字列は、テキスト解析結果が正しい確率は低いので声立て成分の開始位置となる可能性も低い。これに対して、代名詞,副詞等と解析された平仮名は、テキスト解析結果が正しい確率は高いので声立て成分の開始位置となる可能性も高いのである。
【0057】
入力アクセント句候補の仮名文字連鎖「なーん」の場合は、文頭であるにも拘らず助詞+助詞(つまり、文頭の付属語)と解析されているので、解析尤度分岐確率の値は高くなる。したがって、その逆数であるa2の値は小さくなるのである。
【0058】
ステップS25で、入力アクセント句候補のモーラ数に基づく声立て成分開始確率が変数a3に代入される。入力アクセント句候補のモーラ数が多ければ当該アクセント句候補の先頭で声立て成分を開始する必要性は高くなるので、先頭文字における上記声立て確率はモーラ数に対して単調増加の関数になる。そこで、文字Mjが入力アクセント句候補の先頭文字である場合には、上記関数に基づいて上記声立て確率が得られる。例えば、上記入力アクセント句候補「なーんちゃってぇー」の場合には7モーラであるから、「な」で声立て成分が開始される可能性が高くなる。尚、当該文字Mjが入力アクセント句候補の先頭文字でない場合には、変数a3には「0」が代入される。
【0059】
ステップS26で、文字Mjが入力アクセント句候補中において占める位置に基づく声立て成分の開始確率が変数a4に代入される。注目文字Mjが入力アクセント句候補の先頭であれば声立て成分が開始される可能性が高くなり、末尾に近づく程低くなるので、先頭からの位置に対する上記声立て確率は単調減少の関数になる。したがって、この関数に基づいて、注目文字Mjにおける上記声立て確率が求められるのである。すなわち、上記入力アクセント句候補「なーんちゃってぇー」の場合には、「な」で声立て成分が開始される確率は高いが、「ちゃ」で声立て成分が開始される確率は低くなる。
【0060】
ステップS27で、上述のようにして上記ステップS23〜ステップS26において求められた変数a1〜a4に重み係数b1〜b4が乗じられて加算され、変数Aに代入される。ステップS28で、変数Aの値が所定値βよりも大きいか否かが判別される。その結果、A>βであればステップS29に進み、A≦βであればステップS30に進む。ステップS29で、文字列M1〜M(j-1)に対して声立て成分が与えられる。そうした後にステップS31に進む。ステップS30で、文字列M1〜M(j-1)に対して声立て成分が与えられない。
【0061】
ステップS31で、上記モーラ番号jが、上記入力アクセント句候補の総モーラ数N2よりも小さいか否かが判別される。その結果、総モーラ数N2よりも小さければステップS32に進み、総モーラ数N2以上であればアクセント句生成処理動作を終了する。ステップS32で、モーラ番号jがインクリメントされる。そうした後、上記ステップS22に戻り、次のモーラに該当する文字に対する処理に移行する。そして、上記ステップS31においてモーラ番号jが総モーラ数N2以上であると判別されると、アクセント句生成処理動作を終了するのである。
【0062】
このように、上記第2アクセント句生成部24は、入力アクセント句候補の仮名連鎖に基づく上記声立て確率、1/解析尤度分岐確率、モーラ数に基づく上記声立て確立、アクセント句候補中に占める位置に基づく上記声立て確立に基づいて、入力アクセント句候補に対して新たに声立て成分開始位置を設定するか否かを判定するようにしている。したがって、話し言葉のテキストに基づくアクセント句候補「なーんちゃってぇー」が入力された場合には、文字列「ちゃっ」に関する仮名連鎖に基づく上記声立て確率,1/解析尤度分岐確率,モーラ数に基づく上記声立て確立およびアクセント句候補中に占める位置に基づく上記声立て確立の値は何れも小さく、文字列「ちゃっ」で声立て成分が開始されることはない。こうして、声立て成分が2つに別れて不自然なピッチパターンの要因にはなることが抑制されるのである。
【0063】
上述したように、本実施の形態においては、テキスト解析部21によるテキスト解析結果に基づいてアクセント句を生成する第1アクセント句生成部23に加えて、上記テキスト解析結果に依存せずにアクセント句を生成する第2アクセント句生成部24を設けている。そして、アクセント句生成判定部22によって、上記テキスト解析結果に基づいて、入力テキストが書き言葉である場合には、アクセント句の生成を第1アクセント句生成部23で行なうと判定する。一方、話し言葉である場合には、第2アクセント句生成部24で行なうと判定するようにしている。
【0064】
したがって、入力テキストが、文法に則っていない話し言葉「なーんちゃってぇー」である場合には、第2アクセント句生成部24によって、上記テキスト解析結果に依存せずにアクセント句を生成することができる。その結果、テキスト解析部21による誤ったテキスト解析結果に基づいてアクセント句が生成された場合のように「ちゃっ」のところで次の声立て成分が開始されることはなく、不自然なピッチパターンが生成されることを防止できるのである。
【0065】
その際に、上記アクセント句生成判定部22は、2つの仮名文字の連鎖と第2アクセント句生成部24での処理に分岐すべき確率とを対応付けた仮名連鎖分岐確率テーブルと、品詞条件とその品詞条件を満たす場合に第2アクセント句生成部24での処理に分岐すべき確率とを対応付けた解析尤度分岐確率テーブルとを参照して、第1アクセント句生成部23で処理するか第2アクセント句生成部24で処理するかを判定するようにしている。したがって、話し言葉特有の仮名文字列情報および品詞条件に基づいて、的確に第2アクセント句生成部24で処理するか否かを判定することができるのである。
【0066】
また、上記第2アクセント句生成部24は、上記アクセント句生成判定部22から入力されたアクセント句候補の仮名連鎖に基づく上記声立て確率,1/解析尤度分岐確率,モーラ数に基づく上記声立て確立,アクセント句候補中に占める位置に基づく上記声立て確立に基づいて、入力アクセント句候補に対して新たに声立て成分開始位置を設定するか否かを判定するようにしている。したがって、例えば話し言葉のように文法では規定できないテキストが入力された場合でも、誤ったテキスト解析結果に基づいて不自然な声立てが与えられることが抑制されて、自然な韻律が生成されるのである。
【0067】
尚、上記実施の形態においては、アクセント句の生成を第1アクセント句生成部23で行なうか第2アクセント句生成部24で行なうかのアクセント句生成判定部22による判定を、書き言葉であるか話し言葉であるかによって行う場合を例に説明しているが、この発明はこれに限定されるものではない。要は、テキスト解析によって誤解析が生ずるような文法では規定できない文章を第2アクセント句生成部24で処理すると判定すればよいのである。
【0068】
上述したような話し言葉によるテキスト入力は、携帯端末器によるメール文の入力時によく行われる。そして、上記携帯端末器においては、画面における表示文字数に制限があるため、受信したメール文を合成音声によって出力することが望ましい。そこで、上記実施の形態で述べたような音声合成装置を上記携帯端末器に搭載することによって、携帯端末器の機能を大幅に向上することができるのである。
【0069】
ところで、上記実施の形態におけるテキスト解析部21,アクセント句生成判定部22,第1アクセント句生成部23および第2アクセント句生成部24による上記テキスト解析手段,アクセント句生成判定手段,第1アクセント句生成手段および第2アクセント句生成手段としての機能は、プログラム記録媒体に記録された音声合成処理プログラムによって実現される。上記実施の形態における上記プログラム記録媒体は、ROM(リード・オンリ・メモリ)でなるプログラムメディアである。または、外部補助記憶装置に装着されて読み出されるプログラムメディアであってもよい。尚、何れの場合においても、上記プログラムメディアから音声合成処理プログラムを読み出すプログラム読み出し手段は、上記プログラムメディアに直接アクセスして読み出す構成を有していてもよいし、RAM(ランダム・アクセス・メモリ)に設けられたプログラム記憶エリア(図示せず)にダウンロードし、上記プログラム記憶エリアにアクセスして読み出す構成を有していてもよい。尚、上記プログラムメディアからRAMの上記プログラム記憶エリアにダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。
【0070】
ここで、上記プログラムメディアとは、本体側と分離可能に構成され、磁気テープやカセットテープ等のテープ系、フロッピーディスク,ハードディスク等の磁気ディスクやCD(コンパクトディスク)‐ROM,MO(光磁気)ディスク,MD(ミニディスク),DVD(ディジタルビデオディスク)等の光ディスクのディスク系、IC(集積回路)カードや光カード等のカード系、マスクROM,EPROM(紫外線消去型ROM),EEPROM(電気的消去型ROM),フラッシュROM等の半導体メモリ系を含めた、固定的にプログラムを坦持する媒体である。
【0071】
また、上記実施の形態における音声合成装置は、モデムを備えてインターネットを含む通信ネットワークと接続可能な構成を有している場合には、上記プログラムメディアは、通信ネットワークからのダウンロード等によって流動的にプログラムを坦持する媒体であっても差し支えない。尚、その場合における上記通信ネットワークからダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。あるいは、別の記録媒体からインストールされるものとする。
【0072】
尚、上記記録媒体に記録されるものはプログラムのみに限定されるものではなく、データも記録することが可能である。
【0073】
【発明の効果】
以上より明らかなように、第1の発明の音声合成装置は、テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成する第1アクセント句生成手段と上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成する第2アクセント句生成手段とを有し、アクセント句生成判定手段によって、アクセント句の生成を上記第1アクセント句生成手段で行うか第2アクセント句生成手段で行うかを判定するので、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句を、上記第2アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【0074】
したがって、この発明によれば、話し言葉のように文法では規定できないテキストに対して自然なピッチパターンを付与することが可能になり、不自然な韻律を抑制することが可能になる。
【0075】
さらに、上記アクセント句生成判定手段は、上記判定の基準として、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖情報、および、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度情報の少なくとも一つを用いるように成したので、話し言葉のように文法では規定できないテキストに基づくアクセント句の生成は上記第2アクセント句生成手段によって行うべきと、的確に判定することができる。
【0076】
また、第1の実施例は、上記第2アクセント句生成手段を、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定するようにしたので、テキスト解析結果のうちの品詞付き単語に囚われることなく正しくアクセント句を生成することができる。したがって、話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成を抑制して自然な韻律を生成することができる。
【0077】
また、第2の実施例は、上記第2アクセント句生成手段によって、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率である仮名連鎖情報、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であるテキスト解析尤度情報、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であるアクセント句候補のモーラ数、および、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率であるアクセント句候補中の位置、の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。したがって、話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成を抑制してより自然な韻律を生成することができる。
【0078】
また、第2の発明の音声合成方法は、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成するか上記テキスト解析結果基づいて且つ上記品詞付き単語に囚われることなく生成するかを、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖分岐確率、および、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度分岐確率、の少なくとも一つを用いて予め判定し、その判定結果に従って上記アクセント句を生成するので、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句を、テキスト解析結果のうちの上記品詞付き単語に囚われることなく生成することが可能になる。
【0079】
また、第3の発明の携帯端末器は、話し言葉のように文法では規定できな入力テキストに対して自然なアクセント句を与えることができる上記第1の発明の音声合成装置を搭載したので、日常会話で使う言葉で書かれたメール文を受信した場合でも合成音声によって正確に出力することが可能になり、携帯端末器の操作性を向上することができる。
【0080】
また、第4の発明の音声合成プログラムは、コンピューターを、上記第1の発明におけるテキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第1アクセント句生成手段および第2アクセント句生成手段として機能させる。また、第5の発明のプログラム記録媒体は、上記第4の発明の音声合成プログラムを記録している。したがって、上記第1の発明の場合と同様に、話し言葉のようにテキスト解析手段で誤解析され易い入力テキストに関するアクセント句を、上記第2アクセント句生成手段によってテキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【図面の簡単な説明】
【図1】 この発明の音声合成装置におけるブロック図である。
【図2】 図1に示す音声合成装置によって行なわれるアクセント句生成処理動作のフローチャートである。
【図3】 仮名連鎖分岐確率テーブルの一例を示す図である。
【図4】 解析尤度分岐確率テーブルの一例を示す図である。
【図5】 図1における第2アクセント句生成部によって行われるアクセント句生成処理動作のフローチャートである。
【図6】 ピッチパターンを求める過程を示す図である。
【図7】 図1における第1アクセント句生成部によって話し言葉に基づいてピッチパターンを生成する過程を示す図である。
【図8】 図1における第2アクセント句生成部によって話し言葉に基づいてピッチパターンを生成する過程を示す図である。
【図9】 従来の音声合成装置のブロック図である。
【図10】 図9とは異なる従来の音声合成装置のブロック図である。
【符号の説明】
21…テキスト解析部、
22…アクセント句生成判定部、
23…第1アクセント句生成部、
24…第2アクセント句生成部、
25…韻律生成部、
26…音声合成部。
Claims (7)
- 入力テキストを解析するテキスト解析手段と、上記テキスト解析結果に基づいて韻律情報を生成する韻律生成手段と、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成手段を有する音声合成装置において、
上記テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成して上記韻律生成手段に送出する第1アクセント句生成手段と、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成して上記韻律生成手段に送出する第2アクセント句生成手段と、
上記テキスト解析結果に基づいて、上記第1アクセント句生成手段と第2アクセント句生成手段との何れによってアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定手段
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴とする音声合成装置。 - 請求項1に記載の音声合成装置において、
上記第2アクセント句生成手段は、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報 , テキスト解析尤度情報 , アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定する
ことを特徴とする音声合成装置。 - 請求項2に記載の音声合成装置において、
上記仮名連鎖情報は、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率であり、
上記テキスト解析尤度情報は、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であり、
上記アクセント句候補のモーラ数は、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であり、
上記アクセント句候補中の位置は、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率である
ことを特徴とする音声合成装置。 - 入力テキストを解析し、このテキスト解析結果に基づいて韻律情報を生成し、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成方法において、
上記テキスト解析結果のうちの品詞付き単語に基づいて、上記韻律情報を生成する際に用いる第1アクセント句を生成する第1アクセント句生成ステップと、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく、上記韻律情報を生成する際に用いる第2アクセント句を生成する第2アクセント句生成ステップと、
上記テキスト解析結果に基づいて、上記第1アクセント句と第2アクセント句とのうちの何れのアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定ステップ
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第2アクセント句生成手段によるアクセント句生成への分岐確率を表してお り、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第2アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴とする音声合成方法。 - 請求項1乃至請求項3の何れか一つに記載の音声合成装置を搭載したことを特徴とする携帯端末器。
- コンピューターを、
請求項1における、テキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第1アクセント句生成手段および第2アクセント句生成手段
として機能させることを特徴とする音声合成プログラム。 - 請求項6に記載の音声合成プログラムが記録されたことを特徴とするコンピュータ読出し可能なプログラム記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001017189A JP3971577B2 (ja) | 2001-01-25 | 2001-01-25 | 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001017189A JP3971577B2 (ja) | 2001-01-25 | 2001-01-25 | 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002221982A JP2002221982A (ja) | 2002-08-09 |
JP2002221982A5 JP2002221982A5 (ja) | 2005-05-19 |
JP3971577B2 true JP3971577B2 (ja) | 2007-09-05 |
Family
ID=18883429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001017189A Expired - Fee Related JP3971577B2 (ja) | 2001-01-25 | 2001-01-25 | 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3971577B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100811226B1 (ko) * | 2006-08-14 | 2008-03-07 | 주식회사 보이스웨어 | 악센트구 매칭 사전선택을 이용한 일본어음성합성방법 및시스템 |
-
2001
- 2001-01-25 JP JP2001017189A patent/JP3971577B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002221982A (ja) | 2002-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8234118B2 (en) | Method and apparatus for generating dialog prosody structure, and speech synthesis method and system employing the same | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US6725199B2 (en) | Speech synthesis apparatus and selection method | |
EP1213705B1 (en) | Method and apparatus for speech synthesis | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
US7062439B2 (en) | Speech synthesis apparatus and method | |
CA2351988C (en) | Method and system for preselection of suitable units for concatenative speech | |
US7062440B2 (en) | Monitoring text to speech output to effect control of barge-in | |
EP0688011B1 (en) | Audio output unit and method thereof | |
WO2006106182A1 (en) | Improving memory usage in text-to-speech system | |
GB2380381A (en) | Speech synthesis method and apparatus | |
WO2004066271A1 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
JP3415585B2 (ja) | 統計的言語モデル生成装置、音声認識装置及び情報検索処理装置 | |
Stöber et al. | Speech synthesis using multilevel selection and concatenation of units from large speech corpora | |
JP3971577B2 (ja) | 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体 | |
JP2005257954A (ja) | 音声検索装置、音声検索方法および音声検索プログラム | |
JP3655808B2 (ja) | 音声合成装置および音声合成方法、携帯端末器、並びに、プログラム記録媒体 | |
US6772116B2 (en) | Method of decoding telegraphic speech | |
JPS6050600A (ja) | 規則合成方式 | |
JP2002510075A (ja) | 派生された単語を使用する音声認識辞書の拡張 | |
JP2000244609A (ja) | 話者状況適応型音声対話装置及び発券装置 | |
JP2002221982A5 (ja) | ||
JP3201329B2 (ja) | 音声合成装置 | |
EP1777697B1 (en) | Method for speech synthesis without prosody modification | |
JPH11282494A (ja) | 音声合成装置および記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040713 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070608 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100615 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110615 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |