[go: up one dir, main page]

JPH0772897A - 音声合成方法および装置 - Google Patents

音声合成方法および装置

Info

Publication number
JPH0772897A
JPH0772897A JP5217337A JP21733793A JPH0772897A JP H0772897 A JPH0772897 A JP H0772897A JP 5217337 A JP5217337 A JP 5217337A JP 21733793 A JP21733793 A JP 21733793A JP H0772897 A JPH0772897 A JP H0772897A
Authority
JP
Japan
Prior art keywords
waveform
voice
speech
waveforms
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5217337A
Other languages
English (en)
Inventor
Tomohisa Hirokawa
智久 広川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5217337A priority Critical patent/JPH0772897A/ja
Publication of JPH0772897A publication Critical patent/JPH0772897A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音声波形素片の接続点において大きな波形不
連続は生ぜず、滑らかにスペクトル変化する波形接続が
なされる雑音の発生の極く少ない音声合成方法および装
置を提供する。 【構成】 複数の音声波形を接続して合成音声を得る音
声合成装置において、先行する音声波形の終端の波形お
よび後続する音声波形の先端の波形を音声波形バッファ
4、5内の波形切り出し部においてピッチ長の2倍の長
さを有する窓関数により切り出し、これら切り出された
波形を補間波形生成部8において重み付けを行ないなが
ら窓関数の中心位置を合わせて加算し、先行する音声波
形と後続する音声波形とを波形接続部9において補間波
形を介して接続する音声合成方法および装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成方法および
装置に関し、特に、音声波形を接続して所望の合成音声
を得る音声合成方法および装置に関する。
【0002】
【従来の技術】任意の音声を合成することができる規則
による音声合成は、従来、LPC(Linear Pr
edictive Coding)技術を使用するもの
が一般的であった。その理由は、LPC分析合成方式が
声道情報と音源情報の独立性を仮定しているところか
ら、これらを分離して取り扱うことができ、種々のイン
トネーションを有する音声を比較的少数の音声単位から
合成することができるからである。
【0003】ところが、音声について、声道情報と音源
情報との間には、本来、密接不可分な関係がある。それ
にもかかわらず、両者を独立であるものと仮定した結
果、これに起因して音声合成時に両者のスペクトルの不
整合が生じ、異常振幅、鼻づまり音の発生その他の品質
劣化を生ずるに到った。そこで、声道情報と音源情報と
を分離せず、更に分析合成方法自体が合成音声を劣化す
る原因とならないために、原波形をそのまま音声合成に
使用する方法が研究開発されている。この方法は、大量
の原音声データから、発声された音韻環境情報、基本周
波数情報、継続時間情報、振幅情報その他の音声情報と
共に、音声波形素片を切り出してこれを音声波形素片フ
ァイルとして蓄積し、蓄積された音声波形素片ファイル
の内から所望の音韻条件、韻律条件に最も適合する音声
波形素片を選択、接続することにより任意の音声を合成
するというものである。
【0004】
【発明が解決しようとする課題】しかし、上述の如くし
て得られた音声波形素片を単に接続して合成音を作成す
ると、接続点において音声波形に不連続が生じ、これが
結果的にクリック音の原因となる。この問題を解決する
ために、音声波形の切り出し開始位置を、音韻境界の近
傍であって音声波形データが零を越えた直後とし、切り
出し終了位置を、音韻境界の近傍であって音声波形デー
タが零を越える直前とする方法が考えられる。この場
合、音声波形自体の不連続は避けられるが、ピッチ構造
に不連続が生ずることから、今度はこれが雑音の原因と
なる。ピッチ構造を維持したまま接続するには、音声波
形データにピッチ毎に切り出し位置を予め設定しておく
必要がある。しかし、この様にしても、異なる音声波形
データを単純に接続した場合、スペクトルの連続性が保
証される訳ではなく、雑音の生ずることが多かった。
【0005】この発明は、音声波形接続の際に接続され
る音声波形間において補間処理を行い、音声波形素片の
接続点において大きな波形不連続、スペクトルギャップ
が生じない様にして雑音の発生を未然に防止する音声合
成方法および装置を提供するものである。
【0006】
【課題を解決するための手段】複数の音声波形を接続し
て合成音声を得る音声合成方法において、先行する音声
波形の終端の波形および後続する音声波形の先端の波形
をピッチ長の2倍の長さを有する窓関数により切り出
し、切り出された両波形を重み付けを行ないながら窓関
数の中心位置を合わせて加算することにより補間波形を
生成し、先行する音声波形と後続する音声波形とを補間
波形を介して接続する音声合成方法を構成した。
【0007】そして、上述の音声合成方法において、複
数の補間波形を生成し、これら補間波形をピッチ間隔だ
けずらしながら加算する音声合成方法を構成した。ま
た、複数の音声波形を接続して合成音声を得る音声合成
装置において、先行する音声波形の終端の波形および後
続する音声波形の先端の波形をピッチ長の2倍の長さを
有する窓関数により切り出す波形切り出し部を音声波形
バッファ4、5内に具備し、これら切り出された波形を
重み付けを行ないながら窓関数の中心位置を合わせて加
算する補間波形生成部8を具備し、先行する音声波形と
後続する音声波形とを補間波形を介して接続する波形デ
ータ接続部9を具備する音声合成装置をも構成した。
【0008】
【実施例】この発明の実施例を図を参照して説明する。
図1はこの発明の音声合成処理のフロー図、図2はこの
発明の音声合成装置のブロック図、図3は接続される音
声波形素片および生成される補間波形を示す図である。
【0009】ここで、特に図3を参照してこの発明の概
要を説明する。(A)は先行する音声波形素片を示し、
(E)は先行する音声波形素片に接続されるべき後続す
る音声波形素片を示す。(B)は窓関数により切り出さ
れた先行する音声波形素片の終端のピッチ波形を示し、
(D)は窓関数により切り出された後続する音声波形素
片の先頭のピッチ波形を示す。
【0010】(C)は(B)、(D)の波形を重み付け
しながら加算することにより生成された補間波形を示
す。補間ピッチ波形数をm=2とした場合であり、2個
の補間波形が生成されている。(F)は接続合成された
音声波形を示す。この接続された音声波形は、(A)に
示される先行する音声波形素片、(C)に示される2個
の補間波形、(E)に示される後続する音声波形素片
を、図3においてそのまま垂直下方に平行移動して重ね
合わせることにより形成されたものである。
【0011】以下、この発明の実施例を更に詳細に説明
する。図2において、1は接続されるべき音声波形素片
が番号の形式により入力される入力端子である。2は制
御部、3は音声波形素片ファイルである。音声波形素片
ファイル3には、音声波形素片と番号とが対応してファ
イルされている。4および5は音声波形バッファであ
り、両者共に音声波形素片ファイルから読みだされた音
声波形素片を一時的に蓄積し、音声波形素片の切り出し
を実施するところである。6および7はピッチ波形バッ
ファである。8は補間波形生成部、9は波形データ接続
部、10は出力端子である。以下、この発明の音声合成
装置の動作について説明する。
【0012】先ず、接続されるべき音声波形素片の番号
列が入力端子1から入力される。すると、制御部2にお
いては、これら入力された番号を解析し、対応する音声
波形素片を音声波形素片ファイル3から順次に読みだ
し、これらを音声波形バッファ4および音声波形バッフ
ァ5に蓄積する。相互に接続される音声波形素片の内の
先行する音声波形素片は音声波形バッファ4に蓄積さ
れ、後続する音声波形素片は音声波形バッファ5に蓄積
される。そして、音声波形素片のそれぞれには予めピッ
チマークを付与しておく。ピッチマークは、基本周波数
以上、即ち256Hz程度のカットオフ周波数を有する
低域通過フィルタに原音声波形を通し、原音声波形の低
域通過フィルタを通過した後の波形のローカルピーク位
置のそれぞれに付与する。この様にして付与されたピッ
チマークの間隔は音声波形素片のピッチ間隔を良好に代
表する。また、音声波形素片の切り出し開始位置および
終了位置は、ピッチマークに同期して決定される。
【0013】次いで、音声波形バッファ4において、こ
こに蓄積される先行する音声波形素片の最後尾のピッチ
マークを中心として、ピッチ長の2倍の窓長を有する窓
関数により波形データが切り出され、これをピッチ波形
バッファ6に送り込む。同様にして、音声波形バッファ
5において、ここに蓄積される後続する音声波形素片の
先頭のピッチマークを中心としてピッチ波形が切り出さ
れ、これをピッチ波形バッファ7に送り込む。窓関数は
種々の形状のものが考えられるが、cosin波形状の
もの、例えばHanning窓が原波形を維持する上に
おいて有効と考えられる。図3(B)および図3(D)
には、それぞれ、ピッチ長の2倍の窓長を有する窓関数
およびこれにより切り出された波形データが示されてい
る。
【0014】補間波形を生成するには、補間波形生成部
8において、ピッチ波形バッファ6およびピッチ波形バ
ッファ7からピッチ波形データを入力し、これらについ
て重み付けを行ないながら加算処理を施すことにより補
間波形を生成する。この補間波形生成処理は、窓関数に
より切り出された先行する音声波形素片の最後尾ピッチ
波形をx(i)、後続する音声波形素片の先頭ピッチ波
形をy(j)、生成されるピッチ波形をz(k)とする
と、 z(k)=wm ×x (i)+(1−wm )×y(j) (1) で表わされる。ここで、wm は重み関数であり、生成す
る補間ピッチ波形数をmとすればn番目の重み関数は wm =n/(m+1) (2) で表される。(1)式はそれぞれのピッチ波形の中心を
一致させて加算する。そして、生成する補間ピッチ波形
数mはこれを1とすることもできる。
【0015】波形データ接続部9には、補間波形生成部
8において上述の如くに生成された補間波形が入力され
ると共に、当該補間波形を生成する元の波形である先行
する音声波形素片データが音声波形バッファ4から入力
され、そして後続する音声波形素片データが音声波形バ
ッファ5から入力される。そして、先行する音声波形と
後続する音声波形とを補間波形を介して接続することに
より合成音声を生成する。
【0016】
【発明の効果】以上の通りであって、この発明は、音声
波形素片を接続する際に、性質の異なる2つの音声波形
素片に対して、先行する音声波形素片の終端の波形およ
び後続する音声波形素片の先端の波形を切り出し、切り
出された両波形を重み付けを行ないながら加算すること
により補間波形を生成し、先行する音声波形と後続する
音声波形とを補間波形を介して接続するものである。従
って、音声波形素片の接続点において大きな波形不連続
は生じないし、滑らかにスペクトル変化する波形接続が
なされるので、雑音の発生は極く少ない。
【図面の簡単な説明】
【図1】この発明の処理フローを示す図。
【図2】この発明のブロック図。
【図3】接続される音声波形および生成される補間ピッ
チ波形を示す図。
【符号の説明】
1 入力端子 2 制御部 3 音声波形素片ファイル 4 音声波形バッファ 5 音声波形バッファ 6 ピッチ波形バッファ 7 ピッチ波形バッファ 8 補間波形生成部 9 波形データ接続部 10 出力端子

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数の音声波形を接続して合成音声を得
    る音声合成方法において、先行する音声波形の終端の波
    形および後続する音声波形の先端の波形をピッチ長の2
    倍の長さを有する窓関数により切り出し、切り出された
    両波形を重み付けを行ないながら窓関数の中心位置を合
    わせて加算することにより補間波形を生成し、先行する
    音声波形と後続する音声波形とを補間波形を介して接続
    することを特徴とする音声合成方法。
  2. 【請求項2】 請求項1に記載される音声合成方法にお
    いて、複数の補間波形を生成し、これら補間波形をピッ
    チ間隔だけずらしながら加算することを特徴とする音声
    合成方法。
  3. 【請求項3】 複数の音声波形を接続して合成音声を得
    る音声合成装置において、先行する音声波形の終端の波
    形および後続する音声波形の先端の波形をピッチ長の2
    倍の長さを有する窓関数により切り出す波形切り出し部
    を具備し、これら切り出された波形を重み付けを行ない
    ながら窓関数の中心位置を合わせて加算する補間波形生
    成部を具備し、先行する音声波形と後続する音声波形と
    を補間波形を介して接続する波形接続部を具備すること
    を特徴とする音声合成装置。
JP5217337A 1993-09-01 1993-09-01 音声合成方法および装置 Pending JPH0772897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5217337A JPH0772897A (ja) 1993-09-01 1993-09-01 音声合成方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5217337A JPH0772897A (ja) 1993-09-01 1993-09-01 音声合成方法および装置

Publications (1)

Publication Number Publication Date
JPH0772897A true JPH0772897A (ja) 1995-03-17

Family

ID=16702600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5217337A Pending JPH0772897A (ja) 1993-09-01 1993-09-01 音声合成方法および装置

Country Status (1)

Country Link
JP (1) JPH0772897A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003005342A1 (fr) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Procede et appareil de couplage de signaux
JP2008176672A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd ブロックデータ合成装置
JP2009237015A (ja) * 2008-03-26 2009-10-15 Nippon Hoso Kyokai <Nhk> 音声素片接続装置及びプログラム
US20100260354A1 (en) * 2009-04-13 2010-10-14 Sony Coporation Noise reducing apparatus and noise reducing method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003005342A1 (fr) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Procede et appareil de couplage de signaux
US7739112B2 (en) 2001-07-02 2010-06-15 Kabushiki Kaisha Kenwood Signal coupling method and apparatus
JP2008176672A (ja) * 2007-01-22 2008-07-31 Fujitsu Ltd ブロックデータ合成装置
JP2009237015A (ja) * 2008-03-26 2009-10-15 Nippon Hoso Kyokai <Nhk> 音声素片接続装置及びプログラム
US20100260354A1 (en) * 2009-04-13 2010-10-14 Sony Coporation Noise reducing apparatus and noise reducing method
US8331583B2 (en) * 2009-04-13 2012-12-11 Sony Corporation Noise reducing apparatus and noise reducing method

Similar Documents

Publication Publication Date Title
JP2782147B2 (ja) 波形編集型音声合成装置
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
US5864812A (en) Speech synthesizing method and apparatus for combining natural speech segments and synthesized speech segments
JPS62160495A (ja) 音声合成装置
JPH03501896A (ja) 波形の加算重畳による音声合成のための処理装置
JPS63285598A (ja) 音素接続形パラメ−タ規則合成方式
JPH031200A (ja) 規則型音声合成装置
EP0813184B1 (en) Method for audio synthesis
US5787398A (en) Apparatus for synthesizing speech by varying pitch
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JPH08254993A (ja) 音声合成装置
KR100457414B1 (ko) 음성합성방법, 음성합성장치 및 기록매체
JP3450237B2 (ja) 音声合成装置および方法
JP2761552B2 (ja) 音声合成方法
JPH0772897A (ja) 音声合成方法および装置
JPH09319391A (ja) 音声合成方法
EP1543503B1 (en) Method for controlling duration in speech synthesis
JP2005523478A (ja) 音声を合成する方法
JP3089940B2 (ja) 音声合成装置
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JPH09510554A (ja) 言語合成
JP2002244693A (ja) 音声合成装置および音声合成方法
JPH08160991A (ja) 音声素片作成方法および音声合成方法、装置
JPH0836397A (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置