JP3971577B2

JP3971577B2 - 音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体

Info

Publication number: JP3971577B2
Application number: JP2001017189A
Authority: JP
Inventors: 浩幸勘座
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2001-01-25
Filing date: 2001-01-25
Publication date: 2007-09-05
Anticipated expiration: 2021-01-25
Also published as: JP2002221982A

Description

【０００１】
【発明の属する技術分野】
この発明は、文字情報から音声を合成する音声合成装置および音声合成方法、携帯端末器、音声合成プログラム、並びに、プログラム記録媒体に関する。
【０００２】
【従来の技術】
従来より、文字情報から音声を合成するテキスト音声合成として、テキスト解析処理,韻律生成処理および音声合成処理の３つの処理を順次行う方法が知られている。図９に従来の音声合成装置のブロック図を示す。
【０００３】
テキスト解析部１は、上記テキスト解析処理を行ない、入力文字情報から単語境界を検出し、各単語の音素記号列を求める。また、韻律生成部２は、上記韻律生成処理を行ない、上記求められた音素の継続時間長,単語のアクセント,文イントネーション等の韻律情報を付与する。また、音声合成部３は、上記音声合成処理を行ない、予め蓄積してある合成単位と規則とに基づいて、音声合成器の制御信号を生成する。
【０００４】
以下、日本語のテキスト音声合成装置を例に、テキスト音声合成方法について詳細に説明する。日本語は、英語のように単語の境界をスペースで区切る言語と異なり、単語境界が明確でない所謂膠着語であるため、テキスト解析処理を行って単語境界を検出するのである。このテキスト解析処理は、単語の表記や読みの情報を記憶した辞書と単語の接続関係情報を記憶した文法とを用いて、文章の先頭から順次照合処理を行うことによって実行される。
【０００５】
上記単語には、名詞や動詞のような自立語と、助詞や助動詞のような付属語とがある。例えば、「今日は天気です。」という文は、以下のようにテキスト解析される。
「今日(名詞)/ は(助詞)/ 天気(名詞)/ です(助動詞)。」
【０００６】
このようなテキスト解析結果に基づいて、韻律生成処理および音声合成処理を行うのが一般的なテキスト音声合成方法である。尚、韻律生成処理および音声合成処理の詳細については、例えば古井著「ディジタル音声処理」(東海大学出版会)に記載されている通りである。
【０００７】
【発明が解決しようとする課題】
しかしながら、上記従来のテキスト音声合成方法においては、以下のような問題がある。すなわち、近年、インターネット等の普及によって電子化された文字情報が一般社会で日常使われるようになってきている。特に、メール文のように日常会話で使う言葉で書かれたテキストが増加している。日常会話で使うような所謂話し言葉は、表現が多様であるため文法で規則化することは困難である。
【０００８】
このように、文法では規定できないような話し言葉が入力テキストとして与えられた場合、テキスト解析が正しく行われないことが多い。その場合、上記韻律生成処理はテキスト解析結果が正しいという前提で行われるために、不自然な韻律が生成されてしまうのである。
【０００９】
例えば、「見たことなーい」という話し言葉文が、テキスト解析処理によって以下のように解析されたとする。
「見(動詞)/ たこ(名詞)/ となー(名詞)/ い(名詞)」
このテキスト解析結果に基づいて韻律生成処理が行われると、「見る」という動詞と「たこ」という名詞に誤解析されたことが原因となって、音節「た」の位置で声立て成分が開始されて不自然なアクセントになってしまうのである。
【００１０】
このような問題を解決するために、特開平１１‐２５９０９４号公報においては、図１０にブロック図を示すような音声合成装置が提案されている。図１０において、テキスト解析部１１,韻律生成部１２および音声合成部１３は、図９におけるテキスト解析部１,韻律生成部２および音声合成部３と同じである。本音声合成装置は、ユーザの選択した文字列に付与された韻律情報をユーザの指示に応じて修正する韻律編集部１４を有している。したがって、テキスト解析部１１の誤解析等に起因して韻律生成部１２によって不自然な韻律が生成された場合には、韻律の不自然な箇所を韻律編集部１４の修正機能を用いてユーザが修正することによって、自然な音声に修正することができるのである。
【００１１】
しかしながら、上記特開平１１‐２５９０９４号公報に記載された音声合成装置においては、ユーザが手作業で修正する必要があり、ユーザに手間と負担が掛るという問題がある。
【００１２】
そこで、この発明の目的は、話し言葉等に出現する文法規定外の表現に起因して生成される不自然な韻律を自動的に抑制できる音声合成装置および音声合成方法、この音声合成装置が搭載された携帯端末器、音声合成プログラム、並びに、プログラム記録媒体を提供することにある。
【００１３】
【課題を解決するための手段】
上記目的を達成するため、第１の発明は、
入力テキストを解析するテキスト解析手段と、上記テキスト解析結果に基づいて韻律情報を生成する韻律生成手段と、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成手段を有する音声合成装置において、
上記テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成して上記韻律生成手段に送出する第１アクセント句生成手段と、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成して上記韻律生成手段に送出する第２アクセント句生成手段と、
上記テキスト解析結果に基づいて、上記第１アクセント句生成手段と第２アクセント句生成手段との何れによってアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定手段
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴としている。
【００１４】
上記構成によれば、アクセント句生成判定手段によって、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成する第１アクセント句生成手段と上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく生成する第２アクセント句生成手段との何れによって行うかが予め判定される。したがって、例えば話し言葉のようにテキスト解析手段によって誤解析され易い入力テキストに関するアクセント句は、上記第２アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【００１５】
さらに、上記アクセント句生成判定手段によって、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖情報、および、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度情報の少なくとも一つを基準として、第１アクセント句生成手段か第２アクセント句生成手段かの判定が行われる。したがって、話し言葉での入力テキストに基づくアクセント句の生成は第２アクセント句生成手段によって行うべきと、的確に判定される。
【００１６】
また、第１の実施例は、上記第１の発明の音声合成装置において、
上記第２アクセント句生成手段は、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定する
ことを特徴としている。
【００１７】
この実施例によれば、上記第２アクセント句生成手段によって、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。こうして、上記品詞付き単語に囚われることなく正しくアクセント句が生成される。すなわち、例えば話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成が抑制されて自然な韻律が生成される。
【００１８】
また、第２の実施例は、上記第１の発明の音声合成装置において、
上記仮名連鎖情報は、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率であり、
上記テキスト解析尤度情報は、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であり、
上記アクセント句候補のモーラ数は、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であり、
上記アクセント句候補中の位置は、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率である
ことを特徴としている。
【００１９】
この実施例によれば、上記第２アクセント句生成手段によって、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率である仮名連鎖情報、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であるテキスト解析尤度情報、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であるアクセント句候補のモーラ数、および、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率であるアクセント句候補中の位置、の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。
【００２０】
また、第２の発明は、
入力テキストを解析し、このテキスト解析結果に基づいて韻律情報を生成し、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成方法において、
上記テキスト解析結果のうちの品詞付き単語に基づいて、上記韻律情報を生成する際に用いる第１アクセント句を生成する第１アクセント句生成ステップと、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく、上記韻律情報を生成する際に用いる第２アクセント句を生成する第２アクセント句生成ステップと、
上記テキスト解析結果に基づいて、上記第１アクセント句と第２アクセント句とのうちの何れのアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定ステップ
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴としている。
【００２１】
上記構成によれば、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成するか、上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく生成するかが、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖分岐確率、および、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度分岐確率、の少なくとも一つを用いて予め判定される。したがって、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句は、テキスト解析結果のうちの上記品詞付き単語に囚われることなく生成することが可能になる。
【００２２】
また、第３の発明の携帯端末器は、上記第１の発明の音声合成装置を搭載したことを特徴としている。
【００２３】
上記構成によれば、例えば話し言葉のように文法では規定できない入力テキストに対して自然なアクセント句を与えることができる音声合成装置が携帯端末器に搭載される。したがって、日常会話で使う言葉で書かれたメール文を受信した場合でも合成音声によって正確に出力することが可能になり、携帯端末器の操作性が向上される。
【００２４】
また、第４の発明の音声合成プログラムは、コンピューターを、上記第１の発明におけるテキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第１アクセント句生成手段および第２アクセント句生成手段として機能させることを特徴としている。
【００２５】
また、第５の発明のプログラム記録媒体は、上記第４の発明の音声合成プログラムが記録されたことを特徴としている。
【００２６】
上記第４,第５の発明の構成によれば、上記第１の発明の場合と同様に、例えば話し言葉のようにテキスト解析手段で誤解析され易い入力テキストに関するアクセント句が、上記第２アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【００２７】
【発明の実施の形態】
以下、この発明を図示の実施の形態により詳細に説明する。図１は、本実施の形態の音声合成装置におけるブロック図である。テキスト解析部２１は、入力されたテキストを解析して単語境界を検出し、各単語の音素記号列を求める。アクセント句生成判定部２２は、上記テキスト解析結果に基づいて、アクセント句の生成を第１アクセント句生成部２３で行なうか第２アクセント句生成部２４で行なうかを判定する。そして、第１アクセント句生成部２３によって、上記テキスト解析結果に基づいてアクセント句が生成される。一方、第２アクセント句生成部２４は、上記テキスト解析結果に依存せずにアクセント句を生成する。
【００２８】
韻律生成部２５は、上記第１アクセント句生成部２３あるいは第２アクセント句生成部２４によって生成された各アクセント句に対して、音素の継続時間長,アクセント核の位置および文イントネーション等の韻律情報を付与する。音声合成部２６は、上記付与された韻律生成情報に基づいて、予め蓄積されている合成単位と規則とによって音声合成器の制御信号を生成する。
【００２９】
上記テキスト解析部２１,第１アクセント句生成部２３,韻律生成部２５および音声合成部２６の詳細については、例えば、古井著「ディジタル音声処理」(東海大学出版会)に記載されている通りであり、ここでは用語の簡単な説明にとどめる。
【００３０】
アクセント核を１個保有するアクセントのまとまりをアクセント句という。ここで、上記アクセント核とは、個々の語において、声の高さが高から低へ移る位置をいう。声は、その出始めでは高いが、次第に声門下圧の低下等によって高さが低下する。このようなピッチ(基本周波数)が時間と共に低下する特性を声立て成分と呼び、この特性の上に、アクセントによって決まる単語および文節固有のピッチパターン(アクセント成分)が重畳されて、文全体のピッチパターンが決まる。図６にピッチパターンを求める過程を示す。
【００３１】
以下においては、説明を容易にするために、アクセント句生成判定部２２は、テキスト解析結果を見て、書き言葉であれば第１アクセント句生成部２３に解析結果データを送る一方、話し言葉であれば第２アクセント句生成部２４に判定結果データを送るものとする。しかしながら、この発明はこれに限定されるものではない。また、説明の都合上、先ず第１アクセント句生成部２３による話し言葉の処理に関する問題点について述べる。尚、第１アクセント句生成部２３の機能は、図９や図１０に示す従来の音声合成装置においては、テキスト解析部１,１１または韻律生成部２,１２の何れか、あるいは両者で行われるものである。そして次に、アクセント句生成判定部２２の処理、最後に第２アクセント句生成部２４の処理の順に説明する。
【００３２】
上記第１アクセント句生成部２３は、上記テキスト解析部２１によるテキスト解析の結果に基づいてアクセント句を生成するものであり、上述したように従来から一般的に行なわれている技術である。例として、単語の接続関係情報を記憶した文法に則った文「今日は天気です。」に対する第１アクセント句生成部２３でのピッチパターンの生成は、上述のように図６に示す手順によって行なわれる。こうして、文法に則った文が正しくテキスト解析されれば、問題なく第１アクセント句生成部２３によってピッチパターンが生成されるのである。
【００３３】
ここで、仮に、上記第１アクセント句生成部２３によって、文法に則っていない「なーんちゃってぇー」という文のピッチパターンを生成すると図７に示すようになる。すなわち、テキスト解析部２１によるテキスト解析結果は、「なー(助：終助詞)/ ん(助詞：格助詞)/ ちゃっ(動詞：５段ワ行)/ て(助詞：接続助詞)/ ぇ(未知語)/ ー(未知語)」のように解析され、「ん」と「ちゃっ」の間にアクセント句の区切れがあると判断されることで、「ちゃっ」のところで次の声立て成分が開始される。これは、図７において、声立て成分が２つに別れていることで示されており、不自然なピッチパターンの原因になっている。
【００３４】
そこで、本実施の形態における音声合成装置では、上記第２アクセント句生成部２４を設けて、図８に示すように、アクセント句の区切れで生成される次の声立て成分の開始を抑制し、更にアクセント成分も抑制することによって、ピッチパターンの変動を抑えて大きく誤らないようにするのである。
【００３５】
上記テキスト解析部２１によるテキスト解析が確実に正しく行われれば、第１アクセント句生成部２３だけで十分なのである。ところが、現時点におけるテキスト解析処理では、区切り位置の誤りや品詞の判断誤り、あるいは辞書に登録されていない未知語の処理等、不完全な部分がまだある。特に、話し言葉のような文法規定外の入力テキストからは、韻律情報を付与するための正確な情報は得にくい。すなわち、「なーんちゃってぇー」のような話し言葉を辞書や文法で表現しようとしても、多くのバリエーションがあるために書き言葉に比べて規則化が困難なのである。
【００３６】
上記話し言葉の特徴は仮名文字列に現れる。本実施の形態においては、この仮名文字列の特徴を捕えて不自然な韻律を抑制するのである。例えば、「なーんちゃってぇー」の例の場合には、「ちゃっ」が動詞であるというテキスト解析結果を用いないために、「なーんちゃってぇー」という一つのアクセント句に対してピッチパターンを生成できるのである。
【００３７】
次に、「なーんちゃってぇー」を一つのアクセント句として第２アクセント句生成部２４で処理すべきであると判定するアクセント句生成判定部２２について述べる。書き言葉のテキスト解析結果は、一般的に自立語と付属語とが連続する形になる。これに対して、話し言葉をテキスト解析すると、誤解析によって、自立語がない文節ができたり辞書に登録されていない未知語と判定されたりするという現象が見られる。そこで、この現象を捕えて、テキスト解析結果が信頼できると判定すれば第１アクセント句生成部２３でアクセント句生成の処理を行ない、そうでなければ第２アクセント句生成部２４でアクセント句生成の処理を行なうのである。
【００３８】
したがって、上記第２アクセント句生成部２４で処理を行なう場合には、どの単位をアクセント句とするかを予め決めてやる必要がある。その場合、テキスト解析部２１によるテキスト解析の結果は信頼性が低いため、区切り位置や品詞情報は使用しないようにする。そして、未知語と判定された単語および小文字「ぇ」や長音記号「ー」を含む部分は書き言葉である可能性が高いため、アクセント句を細切れとせずに広い範囲をアクセント句としてまとめるのである。
【００３９】
このように、上記テキスト解析結果に未知語を含んだりあるいは話し言葉特有の文字が存在するという情報を手がかりにすることによって、アクセント句生成判定部２２によって、入力された文字列が書き言葉であるか話し言葉であるか、すなわち第１アクセント句生成部２３で処理するか第２アクセント句生成部２４で処理するかを判断することが可能になるのである。
【００４０】
図２に、上記テキスト解析部２１,アクセント句生成判定部２２,第１アクセント句生成部２３および第２アクセント句生成部２４によって行なわれるアクセント句生成処理動作のフローチャートを示す。以下、第１アクセント句生成部２３で処理される通常のテキスト「今日は天気です」と、第２アクセント句生成部２４で処理される話し言葉のテキスト「なーんちゃってぇー」とを例に、アクセント句生成処理動作の具体的手法について説明する。
【００４１】
ステップＳ1で、上記テキスト解析部２１によって入力テキストに対してテキスト解析処理が行なわれる。ステップＳ2で、単語番号ｉに初期値「１」がセットされる。ステップＳ3で、単語番号ｉが、上記テキスト解析処理結果に基づく当該入力テキストの単語数Ｎ1よりも大きいか否かが判別される。その結果、Ｎ1よりも大きければアクセント句生成処理動作を終了する。一方、Ｎ1以下であればステップＳ4に進む。ステップＳ4で、ｉ番目の単語が読み出されて変数Ｔiに代入される。ステップＳ5で、単語Ｔi中に連続する仮名列が在るか否かが判別される。その結果、在ればステップＳ6に進む。一方、なければステップＳ9に進む。ステップＳ6で、仮名連鎖分岐確率テーブルが参照される。
【００４２】
ここで、仮名連鎖分岐確率とは、２つの仮名文字の第１文字Ｗiと第２文字Ｗjとが連続して出現する場合に第２アクセント句生成部２４での処理に分岐すべきと判断される確率(つまり、話し言葉である確率)であり、予め求められて仮名連鎖分岐確率テーブルに格納されている。上記仮名連鎖分岐確率テーブルの求め方は次のように行う。
【００４３】
予め大量のテキストデータに基づいて、任意の平仮名文字連鎖Ｗi,Ｗjが書き言葉のテキストコーパスＬ1と話し言葉のテキストコーパスＬ2との夫々に出現する確率Ｐ(Ｗi,Ｗj,Ｌ1)とＰ(Ｗi,Ｗj,Ｌ2)とを求める。そして、平仮名文字連鎖Ｗi,Ｗjが出現した場合に話し言葉のテキストコーパスＬ2に属する確率Ｒ(Ｗi,Ｗj)を、次式
Ｒ(Ｗi,Ｗj)＝Ｐ(Ｗi,Ｗj,Ｌ2)/{(Ｐ(Ｗi,Ｗj,Ｌ1)＋Ｐ(Ｗi,Ｗj,Ｌ2)}
によって求める。こうして求めた、話し言葉のテキストコーパスＬ2に属する確率Ｒ(Ｗi,Ｗj)を上記分岐確率として、第１文字Ｗiと第２文字Ｗjとに対応付けてテーブルに格納することによって、上記仮名連鎖分岐確率テーブルが得られるのである。
【００４４】
図３は上記仮名連鎖分岐確率テーブルの一例を示し、例えば、第１文字「で」と第２文字「す」と両仮名文字連鎖が現れた場合にテキストコーパスＬ2に属する確率値Ｒ(で,す)である分岐確率とが対応付けられて格納されている。この場合、仮名文字「で」と「す」との連鎖は話し言葉特有のものではないために、分岐確率Ｒ(で,す)の値は小さい。一方、仮名文字「な」と「ー」との連鎖は話し言葉特有のものであり、分岐確率Ｒ(な,ー)の値は大きい。
【００４５】
ステップＳ7で、解析尤度分岐確率テーブルが参照される。ここで、解析尤度分岐確率は、テキスト解析の結果の信頼性が低いために第２アクセント句生成部２４での処理に分岐すべきと判断される確率(つまり、話し言葉である確率)である。例えば、品詞が「未知語」であれば解析尤度分岐確率は高くなり、その他の品詞であれば小さくなる。また、文頭が付属語で始まる場合にはテキスト解析の信頼性は低いと考えられるため、解析尤度分岐確率は高くなる。この解析尤度分岐確率は、品詞条件とその品詞条件を満たす場合には第２アクセント句生成部２４での処理に分岐すべきと判断される分岐確率とが対応付けられて格納された解析尤度分岐確率テーブルを参照することで求められる。図４は上記解析尤度分岐確率テーブルの一例を示す。例えば、「今日は天気です」中の「です」は、品詞が助動詞で付属語ではあるが名詞「天気」に後続しているために文頭の付属語ではなく、解析尤度分岐確率値は小さい値となるのである。
【００４６】
ステップＳ8で、上記ステップＳ6において求められた仮名連鎖分岐確率値とステップＳＳ7において求められた解析尤度分岐確率値とに基づいて、分岐確率が計算される。ステップＳ9で、アクセント句が形成されるか否かが判別される。その結果、アクセント句が形成される場合はステップＳ10に進む一方、形成されない場合はステップＳ13に進む。ステップＳ10で、分岐確率は所定値αよりも大きいか否かが判別される。その結果、所定値αよりも大きければステップＳ11に進み、所定値α以下であればステップＳ12に進む。ステップＳ11で、上記第２アクセント句生成部２４によってアクセント句が生成される。そうした後にステップＳ13に進む。ステップＳ12で、テキスト解析結果に基づいて、第１アクセント句生成部２３によってアクセント句が生成される。ステップＳ13で、単語番号ｉがインクリメントされる。そうした後に上記ステップＳ3に戻って、次の単語番号ｉの処理に移行する。そして、上記ステップＳ3において、単語番号ｉが入力テキストの単語数Ｎ1よりも大きいと判別されと、アクセント句生成処理動作を終了する。
【００４７】
以下、通常のテキスト「今日は天気です」が入力された場合を例に、上述したアクセント句生成処理動作について具体的に説明する。先ず、テキスト「今日は天気です」に対してテキスト解析が行なわれ、処理結果「今日(名詞)/ は(助詞)/ 天気(名詞)/ です(助動詞)」が得られる。この場合には、上記テキスト解析処理によって、入力テキスト「今日は天気です」は４つの単語(Ｎ1＝４)に区切られる。
【００４８】
次に、１番目の単語「今日」が読み出される。そして、この単語「今日」には連続する仮名列はないので、アクセント句を形成するか否かが判別される。そして、後方に助詞が続くのでアクセント句は形成されないと判定されて、２番目の単語「は」が読み出される。そして、前の単語「今日」との連結を考慮しても連続する仮名列がないので、アクセント句を形成するか否かが判別される。そして、前の単語「今日」との結合で「今日は」という文節になるため、アクセント句を形成すると判別される。ここで、連続する仮名列はなく分岐確率の計算処理を行っていないため分岐確率は「０」となり、第１アクセント句生成部２３によって、テキスト解析結果に基づいてアクセント句が生成される。
【００４９】
次に、３番目の単語「天気」に対する処理が１番目の単語「今日」の場合と同様に処理される。次に、４番目の単語「です」が読み出される。そして、この単語「です」には、連続する仮名列(「で」と「す」)とがあるので、「で」と「す」との仮名連鎖分岐確率と解析尤度分岐確率とが求められる。また、求められた仮名連鎖分岐確率値と解析尤度分岐確率値とに基づいて、分岐確率が計算される。この場合、仮名連鎖分岐確率値と解析尤度分岐確率値との両者共に小さいために、単語「です」の分岐確率の値は小さくなる。さらに、アクセント句「天気です」が形成されると判断される。そして、上記分岐確率の値は小さいためにαより小さいと判断されて、第１アクセント句生成部２３によるテキスト解析結果に基づくアクセント句の生成が行なわれるのである。そして、単語番号ｉの内容が単語数「４」より大きくなると、テキスト「今日は天気です」によるアクセント句生成部判定処理動作を終了する。尚、上述の例においては２連鎖の仮名列を例に説明しているが、３連鎖以上であっても同様である。
【００５０】
次に、話し言葉によるテキスト「なーんちゃってぇー」が入力された場合を例に挙げて、上述したアクセント句生成処理動作について具体的に説明する。先ず、テキスト「なーんちゃってぇー」に対してテキスト解析が行なわれ、処理結果「なー(助詞：終助詞)/ ん(助詞：格助詞)/ ちゃっ(動詞：５段ワ行)/ て(助詞：接続助詞)/ ぇ(未知語)/ ー(未知語)」が得られる。この場合は、上記テキスト解析処理によって、入力テキスト「なーんちゃってぇー」は６つの単語に区切られる。
【００５１】
次に、１番目の単語「なー」が読み出される。そして、この単語「なー」には、連続する仮名列(「な」と「ー」)とがあるため、「な」と「ー」との仮名連鎖分岐確率と解析尤度分岐確率とが求められる。その場合、「な」と「ー」との連鎖は話し言葉特有のものであるために、仮名連鎖分岐確率Ｒ(な,ー)の値は大きくなっている。また、文頭が付属語で始まる場合はテキスト解析の信頼性が低いと考えられるために、解析尤度分岐確率は大きくなっている。そして、求められた仮名連鎖分岐確率値と解析尤度分岐確率値とに基づいて、分岐確率が計算される。この場合、仮名連鎖分岐確率値と解析尤度分岐確率値との両者共に大きいため、単語「なー」の分岐確率の値は大きくなる。
【００５２】
さらに、後続の単語「ん」とまとまってアクセント句が形成されるため、当該単語「なー」だけではアクセント句が形成されないと判断される。次に、２番目の単語「ん」に対する処理が１番目の単語「なー」の場合と同様に処理される。そして、アクセント句を形成するか否かを判別する際に、後続の「ちゃっ」という動詞との間にアクセント句の切れ目がないと判断され、「なーん」だけではアクセント句は形成しないと判別される。このことは、「なーん」や「ちゃっ」の分岐確率がある程度高いことから判断される。以下、３番目の単語「ちゃっ」から６番目の単語「ー」に対して同様の処理が行われ、何れの単語も分岐確率が高いことからアクセント句を形成することはないと判断される。結局、入力テキスト「なーんちゃってぇー」に対するテキスト解析によって区切られた単語は、夫々分岐確率が高いことから「なんーちゃってぇー」という一つのアクセント句が形成されることになる。
【００５３】
このようにして形成された一つのアクセント句は、上記分岐確率が大きいためにαより大きいと判断されて、第２アクセント生成部２４によって、テキスト解析の結果を用いずにアクセント句が生成されるのである。したがって、第１アクセント生成部２３によって、テキスト解析の誤解析結果を用いてアクセント句を生成することによる不自然なアクセントの生成を避けることができるのである。
【００５４】
次に、上記第２アクセント句生成部２４によって実行されるテキスト解析結果を用いないアクセント句生成処理について詳細に説明する。図５に、第２アクセント句生成部２４によるアクセント句生成処理動作のフローチャートを示す。図２に示すアクセント句生成処理動作における上記ステップＳ11において、アクセント句候補「なーんちゃってぇー」が第２アクセント生成部２４に送出されるとアクセント句生成処理動作がスタートする。
【００５５】
ステップＳ21で、入力アクセント句候補のモーラ番号ｊに初期値「１」がセットされる。ステップＳ22で、入力アクセント句候補「なーんちゃってぇー」からｊ番目のモーラに該当する文字が読み出されて変数Ｍjに代入される。ステップＳ23で、仮名連鎖Ｍ(j-1),Ｍjに基づいて、文字Ｍjの部分で声立て成分が開始される確率(以下、声立て確率と言う)が仮名連鎖情報テーブルを用いて求められ、変数ａ1に代入される。ここで、上記仮名連鎖情報テーブルは、連続する二つの仮名文字の間で声立て成分が開始される確率を予め大量のテキストデータに基づいて求めたものである。アクセント句生成判定部２２で用いられる上記仮名連鎖分岐確率テーブルは、その確率値(分岐確率値)は話し言葉である確率値である。これに対して、仮名連鎖情報テーブルの確率値は、上記声立て確率値であることだけが異なるのである。したがって、上記仮名連鎖情報テーブルの確率値が大きければ、第２文字Ｍjで声立て成分が開始される可能性が高いのである。例えば、入力アクセント句候補「なーんちゃってぇー」における「ん」と「ちゃ」との場合には、大量のテキストデータ中において「ん」と「ちゃ」との間で声立て成分が開始される場合は少ないので、その声立て確率値は低くなるのである。
【００５６】
ステップＳ24で、仮名Ｍjに続く文字列に基づいて、図２に示すアクセント句生成処理動作における上記ステップＳ7において参照された解析尤度分岐確率の値が検索され、その逆数の値が変数ａ2に代入される。ここで、上記解析尤度分岐確率が高いと言うことはテキスト解析結果の信頼性が低いことを意味しているので、解析尤度分岐確率の値が大きければ文字Ｍjが声立て成分の開始位置となる可能性は低くなる。例えば、解析尤度を計る尺度として品詞情報を例に説明すると、未知語と解析された仮名文字列は、テキスト解析結果が正しい確率は低いので声立て成分の開始位置となる可能性も低い。これに対して、代名詞,副詞等と解析された平仮名は、テキスト解析結果が正しい確率は高いので声立て成分の開始位置となる可能性も高いのである。
【００５７】
入力アクセント句候補の仮名文字連鎖「なーん」の場合は、文頭であるにも拘らず助詞＋助詞(つまり、文頭の付属語)と解析されているので、解析尤度分岐確率の値は高くなる。したがって、その逆数であるａ2の値は小さくなるのである。
【００５８】
ステップＳ25で、入力アクセント句候補のモーラ数に基づく声立て成分開始確率が変数ａ3に代入される。入力アクセント句候補のモーラ数が多ければ当該アクセント句候補の先頭で声立て成分を開始する必要性は高くなるので、先頭文字における上記声立て確率はモーラ数に対して単調増加の関数になる。そこで、文字Ｍjが入力アクセント句候補の先頭文字である場合には、上記関数に基づいて上記声立て確率が得られる。例えば、上記入力アクセント句候補「なーんちゃってぇー」の場合には７モーラであるから、「な」で声立て成分が開始される可能性が高くなる。尚、当該文字Ｍjが入力アクセント句候補の先頭文字でない場合には、変数ａ3には「０」が代入される。
【００５９】
ステップＳ26で、文字Ｍjが入力アクセント句候補中において占める位置に基づく声立て成分の開始確率が変数ａ4に代入される。注目文字Ｍjが入力アクセント句候補の先頭であれば声立て成分が開始される可能性が高くなり、末尾に近づく程低くなるので、先頭からの位置に対する上記声立て確率は単調減少の関数になる。したがって、この関数に基づいて、注目文字Ｍjにおける上記声立て確率が求められるのである。すなわち、上記入力アクセント句候補「なーんちゃってぇー」の場合には、「な」で声立て成分が開始される確率は高いが、「ちゃ」で声立て成分が開始される確率は低くなる。
【００６０】
ステップＳ27で、上述のようにして上記ステップＳ23〜ステップＳ26において求められた変数ａ1〜ａ4に重み係数ｂ1〜ｂ4が乗じられて加算され、変数Ａに代入される。ステップＳ28で、変数Ａの値が所定値βよりも大きいか否かが判別される。その結果、Ａ＞βであればステップＳ29に進み、Ａ≦βであればステップＳ30に進む。ステップＳ29で、文字列Ｍ1〜Ｍ(j-1)に対して声立て成分が与えられる。そうした後にステップＳ31に進む。ステップＳ30で、文字列Ｍ1〜Ｍ(j-1)に対して声立て成分が与えられない。
【００６１】
ステップＳ31で、上記モーラ番号ｊが、上記入力アクセント句候補の総モーラ数Ｎ2よりも小さいか否かが判別される。その結果、総モーラ数Ｎ2よりも小さければステップＳ32に進み、総モーラ数Ｎ2以上であればアクセント句生成処理動作を終了する。ステップＳ32で、モーラ番号ｊがインクリメントされる。そうした後、上記ステップＳ22に戻り、次のモーラに該当する文字に対する処理に移行する。そして、上記ステップＳ31においてモーラ番号ｊが総モーラ数Ｎ2以上であると判別されると、アクセント句生成処理動作を終了するのである。
【００６２】
このように、上記第２アクセント句生成部２４は、入力アクセント句候補の仮名連鎖に基づく上記声立て確率、１/解析尤度分岐確率、モーラ数に基づく上記声立て確立、アクセント句候補中に占める位置に基づく上記声立て確立に基づいて、入力アクセント句候補に対して新たに声立て成分開始位置を設定するか否かを判定するようにしている。したがって、話し言葉のテキストに基づくアクセント句候補「なーんちゃってぇー」が入力された場合には、文字列「ちゃっ」に関する仮名連鎖に基づく上記声立て確率,１/解析尤度分岐確率,モーラ数に基づく上記声立て確立およびアクセント句候補中に占める位置に基づく上記声立て確立の値は何れも小さく、文字列「ちゃっ」で声立て成分が開始されることはない。こうして、声立て成分が２つに別れて不自然なピッチパターンの要因にはなることが抑制されるのである。
【００６３】
上述したように、本実施の形態においては、テキスト解析部２１によるテキスト解析結果に基づいてアクセント句を生成する第１アクセント句生成部２３に加えて、上記テキスト解析結果に依存せずにアクセント句を生成する第２アクセント句生成部２４を設けている。そして、アクセント句生成判定部２２によって、上記テキスト解析結果に基づいて、入力テキストが書き言葉である場合には、アクセント句の生成を第１アクセント句生成部２３で行なうと判定する。一方、話し言葉である場合には、第２アクセント句生成部２４で行なうと判定するようにしている。
【００６４】
したがって、入力テキストが、文法に則っていない話し言葉「なーんちゃってぇー」である場合には、第２アクセント句生成部２４によって、上記テキスト解析結果に依存せずにアクセント句を生成することができる。その結果、テキスト解析部２１による誤ったテキスト解析結果に基づいてアクセント句が生成された場合のように「ちゃっ」のところで次の声立て成分が開始されることはなく、不自然なピッチパターンが生成されることを防止できるのである。
【００６５】
その際に、上記アクセント句生成判定部２２は、２つの仮名文字の連鎖と第２アクセント句生成部２４での処理に分岐すべき確率とを対応付けた仮名連鎖分岐確率テーブルと、品詞条件とその品詞条件を満たす場合に第２アクセント句生成部２４での処理に分岐すべき確率とを対応付けた解析尤度分岐確率テーブルとを参照して、第１アクセント句生成部２３で処理するか第２アクセント句生成部２４で処理するかを判定するようにしている。したがって、話し言葉特有の仮名文字列情報および品詞条件に基づいて、的確に第２アクセント句生成部２４で処理するか否かを判定することができるのである。
【００６６】
また、上記第２アクセント句生成部２４は、上記アクセント句生成判定部２２から入力されたアクセント句候補の仮名連鎖に基づく上記声立て確率,１/解析尤度分岐確率,モーラ数に基づく上記声立て確立,アクセント句候補中に占める位置に基づく上記声立て確立に基づいて、入力アクセント句候補に対して新たに声立て成分開始位置を設定するか否かを判定するようにしている。したがって、例えば話し言葉のように文法では規定できないテキストが入力された場合でも、誤ったテキスト解析結果に基づいて不自然な声立てが与えられることが抑制されて、自然な韻律が生成されるのである。
【００６７】
尚、上記実施の形態においては、アクセント句の生成を第１アクセント句生成部２３で行なうか第２アクセント句生成部２４で行なうかのアクセント句生成判定部２２による判定を、書き言葉であるか話し言葉であるかによって行う場合を例に説明しているが、この発明はこれに限定されるものではない。要は、テキスト解析によって誤解析が生ずるような文法では規定できない文章を第２アクセント句生成部２４で処理すると判定すればよいのである。
【００６８】
上述したような話し言葉によるテキスト入力は、携帯端末器によるメール文の入力時によく行われる。そして、上記携帯端末器においては、画面における表示文字数に制限があるため、受信したメール文を合成音声によって出力することが望ましい。そこで、上記実施の形態で述べたような音声合成装置を上記携帯端末器に搭載することによって、携帯端末器の機能を大幅に向上することができるのである。
【００６９】
ところで、上記実施の形態におけるテキスト解析部２１,アクセント句生成判定部２２,第１アクセント句生成部２３および第２アクセント句生成部２４による上記テキスト解析手段,アクセント句生成判定手段,第１アクセント句生成手段および第２アクセント句生成手段としての機能は、プログラム記録媒体に記録された音声合成処理プログラムによって実現される。上記実施の形態における上記プログラム記録媒体は、ＲＯＭ(リード・オンリ・メモリ)でなるプログラムメディアである。または、外部補助記憶装置に装着されて読み出されるプログラムメディアであってもよい。尚、何れの場合においても、上記プログラムメディアから音声合成処理プログラムを読み出すプログラム読み出し手段は、上記プログラムメディアに直接アクセスして読み出す構成を有していてもよいし、ＲＡＭ(ランダム・アクセス・メモリ)に設けられたプログラム記憶エリア(図示せず)にダウンロードし、上記プログラム記憶エリアにアクセスして読み出す構成を有していてもよい。尚、上記プログラムメディアからＲＡＭの上記プログラム記憶エリアにダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。
【００７０】
ここで、上記プログラムメディアとは、本体側と分離可能に構成され、磁気テープやカセットテープ等のテープ系、フロッピーディスク,ハードディスク等の磁気ディスクやＣＤ(コンパクトディスク)‐ＲＯＭ,ＭＯ(光磁気)ディスク,ＭＤ(ミニディスク),ＤＶＤ(ディジタルビデオディスク)等の光ディスクのディスク系、ＩＣ(集積回路)カードや光カード等のカード系、マスクＲＯＭ,ＥＰＲＯＭ（紫外線消去型ＲＯＭ),ＥＥＰＲＯＭ(電気的消去型ＲＯＭ),フラッシュＲＯＭ等の半導体メモリ系を含めた、固定的にプログラムを坦持する媒体である。
【００７１】
また、上記実施の形態における音声合成装置は、モデムを備えてインターネットを含む通信ネットワークと接続可能な構成を有している場合には、上記プログラムメディアは、通信ネットワークからのダウンロード等によって流動的にプログラムを坦持する媒体であっても差し支えない。尚、その場合における上記通信ネットワークからダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。あるいは、別の記録媒体からインストールされるものとする。
【００７２】
尚、上記記録媒体に記録されるものはプログラムのみに限定されるものではなく、データも記録することが可能である。
【００７３】
【発明の効果】
以上より明らかなように、第１の発明の音声合成装置は、テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成する第１アクセント句生成手段と上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成する第２アクセント句生成手段とを有し、アクセント句生成判定手段によって、アクセント句の生成を上記第１アクセント句生成手段で行うか第２アクセント句生成手段で行うかを判定するので、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句を、上記第２アクセント句生成手段によって、テキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【００７４】
したがって、この発明によれば、話し言葉のように文法では規定できないテキストに対して自然なピッチパターンを付与することが可能になり、不自然な韻律を抑制することが可能になる。
【００７５】
さらに、上記アクセント句生成判定手段は、上記判定の基準として、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖情報、および、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度情報の少なくとも一つを用いるように成したので、話し言葉のように文法では規定できないテキストに基づくアクセント句の生成は上記第２アクセント句生成手段によって行うべきと、的確に判定することができる。
【００７６】
また、第１の実施例は、上記第２アクセント句生成手段を、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報,テキスト解析尤度情報,アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定するようにしたので、テキスト解析結果のうちの品詞付き単語に囚われることなく正しくアクセント句を生成することができる。したがって、話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成を抑制して自然な韻律を生成することができる。
【００７７】
また、第２の実施例は、上記第２アクセント句生成手段によって、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率である仮名連鎖情報、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であるテキスト解析尤度情報、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であるアクセント句候補のモーラ数、および、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率であるアクセント句候補中の位置、の少なくとも一つを用いて、生成するアクセント句における声立て成分の開始位置が設定される。したがって、話し言葉のように文法では規定できないような入力テキストが与えられても、不自然なピッチパターンの生成を抑制してより自然な韻律を生成することができる。
【００７８】
また、第２の発明の音声合成方法は、入力テキストに基づくアクセント句の生成を、テキスト解析結果のうちの品詞付き単語に基づいて生成するか上記テキスト解析結果基づいて且つ上記品詞付き単語に囚われることなく生成するかを、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表す仮名連鎖分岐確率、および、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表すテキスト解析尤度分岐確率、の少なくとも一つを用いて予め判定し、その判定結果に従って上記アクセント句を生成するので、例えば話し言葉のようにテキスト解析の際に誤解析され易い入力テキストに関するアクセント句を、テキスト解析結果のうちの上記品詞付き単語に囚われることなく生成することが可能になる。
【００７９】
また、第３の発明の携帯端末器は、話し言葉のように文法では規定できな入力テキストに対して自然なアクセント句を与えることができる上記第１の発明の音声合成装置を搭載したので、日常会話で使う言葉で書かれたメール文を受信した場合でも合成音声によって正確に出力することが可能になり、携帯端末器の操作性を向上することができる。
【００８０】
また、第４の発明の音声合成プログラムは、コンピューターを、上記第１の発明におけるテキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第１アクセント句生成手段および第２アクセント句生成手段として機能させる。また、第５の発明のプログラム記録媒体は、上記第４の発明の音声合成プログラムを記録している。したがって、上記第１の発明の場合と同様に、話し言葉のようにテキスト解析手段で誤解析され易い入力テキストに関するアクセント句を、上記第２アクセント句生成手段によってテキスト解析結果のうちの品詞付き単語に囚われることなく生成することが可能になる。
【図面の簡単な説明】
【図１】この発明の音声合成装置におけるブロック図である。
【図２】図１に示す音声合成装置によって行なわれるアクセント句生成処理動作のフローチャートである。
【図３】仮名連鎖分岐確率テーブルの一例を示す図である。
【図４】解析尤度分岐確率テーブルの一例を示す図である。
【図５】図１における第２アクセント句生成部によって行われるアクセント句生成処理動作のフローチャートである。
【図６】ピッチパターンを求める過程を示す図である。
【図７】図１における第１アクセント句生成部によって話し言葉に基づいてピッチパターンを生成する過程を示す図である。
【図８】図１における第２アクセント句生成部によって話し言葉に基づいてピッチパターンを生成する過程を示す図である。
【図９】従来の音声合成装置のブロック図である。
【図１０】図９とは異なる従来の音声合成装置のブロック図である。
【符号の説明】
２１…テキスト解析部、
２２…アクセント句生成判定部、
２３…第１アクセント句生成部、
２４…第２アクセント句生成部、
２５…韻律生成部、
２６…音声合成部。

Claims

入力テキストを解析するテキスト解析手段と、上記テキスト解析結果に基づいて韻律情報を生成する韻律生成手段と、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成手段を有する音声合成装置において、
上記テキスト解析結果のうちの品詞付き単語に基づいてアクセント句を生成して上記韻律生成手段に送出する第１アクセント句生成手段と、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなくアクセント句を生成して上記韻律生成手段に送出する第２アクセント句生成手段と、
上記テキスト解析結果に基づいて、上記第１アクセント句生成手段と第２アクセント句生成手段との何れによってアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定手段
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴とする音声合成装置。
請求項１に記載の音声合成装置において、
上記第２アクセント句生成手段は、生成するアクセント句における声立て成分の開始位置を、仮名連鎖情報 , テキスト解析尤度情報 , アクセント句候補のモーラ数およびアクセント句候補中の位置の少なくとも一つを用いて設定する
ことを特徴とする音声合成装置。
請求項２に記載の音声合成装置において、
上記仮名連鎖情報は、テキストデータに基づいて予め求められた連続する二つの仮名文字の間で声立て成分が開始される確率であり、
上記テキスト解析尤度情報は、上記テキスト解析尤度分岐確率の逆数の値で与えられる声立て成分が開始される確率であり、
上記アクセント句候補のモーラ数は、アクセント句候補の先頭文字に上記アクセント句候補モーラ数に応じて与えられる声立て成分が開始される確率であり、
上記アクセント句候補中の位置は、上記アクセント句候補中で文字が占める位置に基づいて与えられる声立て成分が開始される確率である
ことを特徴とする音声合成装置。
入力テキストを解析し、このテキスト解析結果に基づいて韻律情報を生成し、上記テキスト解析結果および韻律情報に基づいて音声を合成する音声合成方法において、
上記テキスト解析結果のうちの品詞付き単語に基づいて、上記韻律情報を生成する際に用いる第１アクセント句を生成する第１アクセント句生成ステップと、
上記テキスト解析結果に基づいて且つ上記品詞付き単語に囚われることなく、上記韻律情報を生成する際に用いる第２アクセント句を生成する第２アクセント句生成ステップと、
上記テキスト解析結果に基づいて、上記第１アクセント句と第２アクセント句とのうちの何れのアクセント句を生成するかを、仮名連鎖分岐確率およびテキスト解析尤度分岐確率の少なくとも一つを用いて判定するアクセント句生成判定ステップ
を備え、
上記仮名連鎖分岐確率は、仮名文字連鎖が話し言葉のテキストコーパスに属する確率であって、上記第２アクセント句生成手段によるアクセント句生成への分岐確率を表しており、
上記テキスト解析尤度分岐確率は、品詞条件に応じて予め設定されて、上記第２アクセント句生成部によるアクセント句生成への分岐確率を表している
ことを特徴とする音声合成方法。
請求項１乃至請求項３の何れか一つに記載の音声合成装置を搭載したことを特徴とする携帯端末器。
コンピューターを、
請求項１における、テキスト解析手段,韻律生成手段,音声合成手段,アクセント句生成判定手段,第１アクセント句生成手段および第２アクセント句生成手段
として機能させることを特徴とする音声合成プログラム。
請求項６に記載の音声合成プログラムが記録されたことを特徴とするコンピュータ読出し可能なプログラム記録媒体。