[go: up one dir, main page]

JPH03119396A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH03119396A
JPH03119396A JP1258490A JP25849089A JPH03119396A JP H03119396 A JPH03119396 A JP H03119396A JP 1258490 A JP1258490 A JP 1258490A JP 25849089 A JP25849089 A JP 25849089A JP H03119396 A JPH03119396 A JP H03119396A
Authority
JP
Japan
Prior art keywords
pitch pattern
generates
rule
speech synthesis
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1258490A
Other languages
English (en)
Inventor
Tetsunori Kobayashi
哲則 小林
Makoto Akaha
誠 赤羽
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1258490A priority Critical patent/JPH03119396A/ja
Publication of JPH03119396A publication Critical patent/JPH03119396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A産業上の利用分野 本発明は音声合成装置関し、特に規則合成方式による音
声合成装置に適用して好適なものである。
B発明の概要 本発明は、音声合成装置において、ゆらぎ成分を付加し
てピッチパターンを生成することにより、違和感のない
合成音を得ることができる。
C従来の技術 従来、規則合成方式による音声合成装置においては、入
力された文字の系列を解析した後、所定の規則に従って
パラメータを合成することにより、いかなる言葉でも音
声合成し得るようになされている。
すなわち、規則合成方式による音声合成装置は、入力さ
れた文字の系列を解析した後、所定の規則に従って、各
文節ごとにアクセントを検出し、各文節の並びから、文
字系列全体としての抑揚、ボース等を表現するピッチパ
ラメータを合成する。
さらに音声合成装置は、同様に所定の規則に従つて各文
節を例えばCvC単位に分割した後、そのスペクトラム
を表現する合成パラメータを生成する。
これにより、ピッチパラメータ及び合成パラメータに基
づいて合成音を発声するようになされている。
D発明が解決しようとする問題点 ところが、従来の規則合成方式による音声合成装置で音
声を合成した場合、母音の部分がブザー音のように発声
され、実際の人間の音声に比して不自然で、究めて聞き
づらい問題があった。
本発明は以上の点を考慮してなされたもので、実際の人
間の音声に比して違和感のない合成音を発声することが
できる音声合成装置を提案しようとするものである。
E問題点を解決するための手段 かかる問題点を解決するため本発明においては、入力さ
れた文字の系列を解析して、単語、文節の境界及び基本
アクセントを検出する文章解析部2と、文章解析部2の
検出結果に基づいて、所定の音韻規則及び韻律規則に従
って、合成パラメータ及び基本ピッチパターンを生成し
た後、基本ピッチパターンにゆらぎ成分を付加してピッ
チパターンを合成する音声合成規則部3と、合成パラメ
ータ及びピッチパターンに基づいて、合成音を生成する
音声合成部4とを備えるようにする。
F作用 基本ピッチパターンにゆらぎ成分を付加してピッチパタ
ーンを合成した後、当該ピッチパターン及び合成パラメ
ータに基づいて合成音を生成すれば、人間の音声に近い
違和感のない合成音を得ることができる。
G実施例 以下図面について、本発明の一実施例を詳述する。
第1図において、1は全体として演算処理装置構成の音
声合成装置の概略構成を示し、文章解析部2、音声合成
規則部3及び音声合成部4に分割される。
文章解析部2は、所定の入力装置から入力されたテキス
ト入力(文字の系列で表された文章等でなる)を所定の
辞書を基準にして解析し、仮名文字列に変換した後、単
語、文節毎に分解する。
すなわち日本語においては、英語のように単語が分かち
書きされていないことから、例えば[米国産業界Jのよ
うな言葉は、「米国/産業・界」、「米/国産/業界」
のように2種類区分化し得る。
このため文章解析部2は、辞書を参考にしながら、言葉
の連続関係及び単語の統計的性質を利用して、テキスト
入力を単語、文節毎に分解するようになされ、これによ
り単語、文節の境界を検出するようになされている。
さらに文章解析部2は、各単語毎に基本アクセントを検
出した後、音声合成規則部3に出力する。
音声合成規則部3は、日本語の特徴に基づいて設定され
た所定の音韻規則に従って、文章解析部2の検出結果及
びテキスト入力を処理するようになされている。
すなわち、日本語の自然な音声は、言語学的特性に基づ
いて区別すると、5000〜6000の発声の単位に区
分することができる。
例えば、「さくら」という単語を発声の単位に区分する
と、r saJ + r kur」+ rra」の3つ
のCvC単位に分割することができる。
さらに日本語は、単語が連続する場合、連なった後ろの
語の語頭音節が濁音化したり(すなわち続濁でなる)、
語頭以外のガ行音が鼻音化したりして、単語単体の場合
と発声が変化する特徴がある。
従って音声合成規則部3は、これら日本語の特徴に従っ
て音韻規則が設定されるようになされ、当該規則に従っ
てテキスト入力を音韻記号列(すなわち上述のr sa
J + r kur」+ rra、1等の連続する列で
なる)に変換するようになされている。
さらに音声合成規則部3は、当該音韻記号列に基づいて
、所定の記憶手段から各CVC単位の発声音のスペクト
ラムを表すデータをロードする。
ここで当該音声合成装置1は、L S P (line
 5pectru+* pair)の手法を用いて合成
音を発声するようになされ、所定の記憶手段からロード
されるデータは、各CVC単位で表される合成音を生成
する際に用いられるパラメータのデータでなる。
さらに音声合成規則部3は、CvC単位でパラメータの
データが得られると、続いて合成音のスペクトルが滑ら
かに変化するように、CvC単位間についてパラメータ
を補間する。
音声合成規則部3は、所定の記憶手段からロードされた
データ及び補間されたデータをテキスト入力に応じた順
序(以下このデータを合成パラメータと呼ぶ)で合成し
、かくして抑揚のない状態で、テキスト入力を読み上げ
た音声を表す合成パラメータを得ることができる。
さらに音声合成規則部3は、所定の韻律規則に基づいて
、テキスト入力を適当な長さで分割して、切れ目(すな
わちポーズでなる)を検出する。
かくして第2図に示すように、例えばテキスト入力とし
て文章「きれいな花を山田さんからもらいました」が入
力された場合は(第2図(A))、当該テキスト入力は
、「きれいな」、「はな」、「やまださんから」、「も
らいました」に分解された後、「はな」及び「やまださ
んから」間にポーズが検出される(第2図(B))。
さらに音声合成規則部3は、韻律規則及び各単語の基本
アクセントに基づいて、各文節のアクセントを検出する
すなわち日本語の文節単体のアクセントは、感覚的に仮
名文字を単位として(以下モーラと呼ぶ)高低の2レベ
ルで表現することができる。
このとき、文節の内容等に応じて、文節のアクセント位
置を区別することができる。
例えば、端、箸、橋は、2モーラの単語で、それぞれア
クセントのない0型、アクセントの位置が先頭のモーラ
にある1型、アクセントの位置が2モーラ目にある2型
に分類することができる。
かくしてこの実施例において音声合成規則部3は、テキ
スト入力の各文節を、1型、2型、0型、4型と分類し
く第2図(C))これにより文節単位でアクセント及び
ポーズを検出する。
さらに音声合成規則部3は、アクセント及びポーズの検
出結果に基づいて、テキスト入力全体の抑揚を表す基本
ピッチパターンを生成する。
すなわち日本語においては、文節のアクセントは、感覚
的に2レベルで表し得るのに対し、実際の抑揚は、アク
セントの位置から徐々に低下する特徴がある(第2図(
D))。
さらに日本語においては、文節が連続して1つの文章に
なると、ポーズから続くポーズに向かって、抑揚が徐々
に低下する特徴がある(第2図(E))。
従って音声合成規則部3は、かかる日本語の特徴に基づ
いて、テキスト入力全体の抑揚を表すパラメータを各モ
ーラ毎に生成した後、人間が発声した場合と同様に抑揚
が滑らかに変化するように、モーラ間に補間によりパラ
メータを設定する。
かくして音声合成規則部3は、テキスト入力に応じた順
序で、各モーラのパラメータ及び補間したパラメータを
合成しく以下基本ピッチパターンと呼ぶ)、かくしてテ
キスト入力を読み上げた音声の抑揚を表す基本ピッチパ
ターン(第2図(F))を得ることができる。
第3図に示すように音声合成規則部3は、ゆらぎ付加部
5を有し、当該ゆらぎ付加部5でゆらぎ成分を生成した
後、基本ピッチパターンに重畳してピッチパターンを生
成する。
すなわちゆらぎ付加部5は、乱数発生部6で、発生確立
が一様分布の乱数を発生した後、当該乱数をデータ変換
部8に出力する。
データ変換部8は、リードオンリメモリ回路で構成され
、入力された乱数のデータをアドレスにして格納された
データを出力する。
このときデータ変換部8は、切り換え操作に応動して、
アドレス領域を切り換えるようになされ、これにより第
4図に示すように、入力された乱数の値に対して、出力
データの値を切り換え得るようになされ、入力された一
様分布の乱数をガンマ分布(記号L1で示す)又は正規
分布(記号L2で示す)の乱数に変換する。
第5図に示すようにフィルタ回路10は、遅延オペレー
タz −+で表される遅延回路12及び14を直列接続
するようになされ、データ変換部8から出力される乱数
データを遅延回路12に与えるようになされている。
さらにフィルタ回路10は、遅延回路12の入出力デー
タ及び遅延回路の14の出力データを、重み付は回路1
6.18.20で1/3に重み付けした後、加算回路2
2で加算して出力する。
これにより、加算回路22を介して、データ変換部8か
ら出力される乱数に追従して値が滑らかに変化するゆら
ぎ成分を得ることができる。
第6図に示すようにゆらぎ付加部5は、加算部24にお
いて、基本ピッチパターン(第6図(A))に当該ゆら
ぎ成分(第6図(B))を付加し、これにより基本ピッ
チパターンに追従してレベルが変化しながら、かつゆら
ぎ成分の分だけレベルがなめらかに変動するピッチパタ
ーン(第6図(C))を生成する。
音声合成部4は、LSPの手法を用いて音声を合成する
ようになされた音声合成フィルタを有し、合成パラメー
タ及びピッチパターンに基づいて合成音を生成する。
これにより、合成パラメータで決まるスペクトラムで、
ピッチパターンの変化に追従して抑揚の変化する合成音
を得ることができる。
従って合成音の抑揚は、基本ピッチパターンに追従しな
がら、ゆらぎ成分に追従して細かく変化する。
従って、合成音においては、ゆらぎ成分付加したことに
より、従来に比して人間の音声に近づけることができ、
その分違和感のない合成音を得ることができる。
さらに、ゆらぎ成分を付加したことにより、ゆらぎ成分
のレベルの分布を一様分布、ガンマ分布等切り換えて、
合成音の艶、響き、深みを切り換えることができ、これ
により所望の音質の合成音を選択出力することができる
以上の構成において、所定の入力装置から入力されたテ
キスト入力は、文章解析部2で、所定の辞書を基準にし
て解析され、単語、文節の境界及び基本アクセントが検
出される。
単語、文節の境界及び基本アクセントの検出結果は、音
声合成規則部3で、所定の音韻規則に従って処理され、
抑揚のない状態でテキスト入力を読み上げた音声を表す
合成パラメータが生成される。
さらに単語、文節の境界及び基本アクセントの検出結果
は、音声合成規則部3で、所定の韻律規則に従って処理
され、テキスト入力全体の抑揚を表す基本ピッチパター
ンが生成される。
これに対してゆらぎ付加部5で、ガンマ分布又は正規分
布の乱数が発生され、当該乱数の値に追従してレベルが
変化するゆらぎ成分が生成される。
ゆらぎ成分は、基本ピッチパターンに付加され、これに
よりピッチパターンが生成される。
ピッチパターンは、合成パラメータと共に音声合成部4
に出力され、ここでピッチパターン及び合成パラメータ
に基づいて合成音が生成される。
以上の構成によれば、基本ピッチパターンにゆらぎ成分
を付加してピッチパターンを生成したことにより、基本
ピッチパターンに追従しながら、ゆらぎ成分に追従して
細かく抑揚の変化する合成音を得ることができ、これに
より従来に比して実際の人間の音声に近い、違和感のな
い合成音を得ることができる。
なお上述の実施例においては、ガンマ分布又は正規分布
の乱数を発生して、当該乱数の値に追従してレベルが変
化するゆらぎ成分を付加する場合について述べたが、本
発明はこれに限らず、デルタ分布等の乱数等、種々の分
布の乱数からゆらぎ成分を生成するようにしてもよい。
さらに上述の実施例においては、−様分布の乱数をガン
マ分布又は正規分布の乱数に変換する場合について述べ
たが、本発明はこれに限らず、直接−様分布の乱数から
ゆらぎ成分を生成するようにしてもよい。
さらに上述の実施例においては、2次のフィルタ回路を
用いて、データ変換部8から出力される乱数に追従して
、レベルが滑らかに変化するゆらぎ成分を生成する場合
について述べたが、本発明は2次のフィルタ回路を用い
る場合に限らず、種々の次数のフィルタ回路を広く用い
ることができる。
さらに上述の実施例においては、LSP音声合成用の音
声合成フィルタを用いる場合について述べたが、本発明
はこれに限らず、種々の方法を広く適用することができ
る。
を示すブロック図、第2図はその動作の説明に供する路
線図、第3図はゆらぎ付加部を示すブロック図、第4図
はデータ変換部の動作の説明に供する特性曲線図、第5
図はフィルタ回路を示すブロック図、第6図はゆらぎ付
加部の動作の説明に供する信号波形図である。
l・・・・・・音声合成装置、2・・・・・・文章解析
部、3・・・・・・音声合成規則部、4・・・・・・音
声合成部、5・・・・・・ゆらぎ付加部。
H発明の効果 上述のように本発明によれば、ゆらぎ成分を付加してピ
ッチパターンを生成したことにより、ゆらぎ成分に追従
して細かく抑揚の変化する合成音を得ることができ、か
くして従来に比して実際の人間の音声に近い、違和感の
ない合成音を生成することができる音声合成装置を得る
ことができる。

Claims (1)

  1. 【特許請求の範囲】 入力された文字の系列を解析して、単語、文節の境界及
    び基本アクセントを検出する文章解析部と、 上記文章解析部の検出結果に基づいて、所定の音韻規則
    及び韻律規則に従つて、合成パラメータ及び基本ピッチ
    パターンを生成した後、上記基本ピッチパターンにゆら
    ぎ成分を付加してピッチパターンを合成する音声合成規
    則部と、 上記合成パラメータ及びピッチパターンに基づいて、合
    成音を生成する音声合成部と を具えることを特徴とする音声合成装置。
JP1258490A 1989-10-03 1989-10-03 音声合成装置 Pending JPH03119396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1258490A JPH03119396A (ja) 1989-10-03 1989-10-03 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258490A JPH03119396A (ja) 1989-10-03 1989-10-03 音声合成装置

Publications (1)

Publication Number Publication Date
JPH03119396A true JPH03119396A (ja) 1991-05-21

Family

ID=17320933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258490A Pending JPH03119396A (ja) 1989-10-03 1989-10-03 音声合成装置

Country Status (1)

Country Link
JP (1) JPH03119396A (ja)

Similar Documents

Publication Publication Date Title
EP0427485B1 (en) Speech synthesis apparatus and method
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JPH086591A (ja) 音声出力装置
JPH04331997A (ja) 音声合成装置のアクセント成分制御方式
JPH0632020B2 (ja) 音声合成方法および装置
JPH03119396A (ja) 音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3614874B2 (ja) 音声合成装置及び方法
JP3235747B2 (ja) 音声合成装置及び音声合成方法
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH0756590A (ja) 音声合成装置、音声合成方法及び記録媒体
JPH03269599A (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JPH01321496A (ja) 音声合成装置
JPH056191A (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH037994A (ja) 歌音声合成データの作成装置
JPH0594196A (ja) 音声合成装置
JP2002297174A (ja) テキスト音声合成装置
JPH0764586A (ja) 音声合成装置
JPH07121191A (ja) 音声出力装置
JPH0727392B2 (ja) 音声合成装置
JPH06161493A (ja) 音声合成装置の長音処理方式
JPH0363696A (ja) テキスト音声合成装置
JPH0439698A (ja) 音声合成装置