[go: up one dir, main page]

JPH04281499A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH04281499A
JPH04281499A JP3044928A JP4492891A JPH04281499A JP H04281499 A JPH04281499 A JP H04281499A JP 3044928 A JP3044928 A JP 3044928A JP 4492891 A JP4492891 A JP 4492891A JP H04281499 A JPH04281499 A JP H04281499A
Authority
JP
Japan
Prior art keywords
speech
waveform
waveforms
representative
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3044928A
Other languages
English (en)
Other versions
JP2709198B2 (ja
Inventor
Kenzo Ito
憲三 伊藤
Yamato Sato
大和 佐藤
Tomohisa Hirokawa
広川 智久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3044928A priority Critical patent/JP2709198B2/ja
Publication of JPH04281499A publication Critical patent/JPH04281499A/ja
Application granted granted Critical
Publication of JP2709198B2 publication Critical patent/JP2709198B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は規則によって任意の音
声語を合成する方法、音声信号を情報圧縮して符号化し
、伝送、又は蓄積し、その圧縮音声信号を再合成する方
法に適用され、波形情報から音声を合成する音声合成方
法に関する。
【0002】
【従来の技術】音声の波形情報を全て記憶装置に蓄積し
ておき、この記憶装置を利用して音声合成をする音声合
成方式を実現するためには、記憶装置が大規模となる。 任意の音声語を合成する方式では、記憶容量の削減や、
多彩な合成音を出力するために、従来においては音声波
形から抽出した音声の特徴パラメータだけを記憶装置に
記憶し、必要に応じて特徴パラメータを読みだして合成
音を作成する、いわゆるパラメータ編集合成方式が主に
用いられていた。また、品質の高い合成音を得る目的で
、波形情報をそのまま蓄積しておく、波形編集合成方式
も用いられていた。
【0003】しかし、上記のパラメータ編集合成方式で
は、多彩なパラメータ制御が容易な反面、得られる合成
音の品質は肉声の音声に比較すると大きな隔たりがあっ
た。また、波形編集合成方式では、品質の良い合成音が
得られる反面、大容量の記憶装置が必要であった(例え
ば、特願昭63−115721)。音声波形の全てを記
憶しておくのではなく、音声区間の代表波形のみを用い
る方法として、線形予測分析で得られる残差信号に対し
て適用した例(特願昭56−179915)が有るが、
これは積極的にピッチに同期した波形補間法は用いてい
ない。また、ピッチに同期した波形補間法は、CV(子
音−母音)/VC(母音−子音)のセグメント間の接続
に利用されている例(三留他、昭和56年5月、日本音
響学会講演論文集、p431)があるが、合成単位全体
に対して、情報圧縮と高品質化を目的にした合成方式は
今までに無い。
【0004】この発明の目的は波形を合成して音声語を
得る方法において、記憶容量を大幅に削減可能とし、し
かも、高い品質の合成音を得ることができ、また、音声
を高能率で情報圧縮して伝送蓄積したものから高品質の
合成音を得ることができる音声合成方法を提供すること
にある。
【0005】
【課題を解決するための手段】この発明によれば、音声
波形の異なる時点から抽出した複数個の代表波形から、
与えられたピッチ周期と持続時間とに従ってその代表波
形間の音声波形を、これら代表波形を用いて補間をして
連続音声を再合成する。前述したように、波形編集型音
声合成方式で高品質の合成音を得るためには、あらかじ
め合成に必要な音声波形を記憶装置に蓄積しておく必要
があるが、パラメータを蓄積しておく方式に比較すると
、記憶装置の規模が非常に大きくなり、経済化や小規模
化を実現するには波形情報の効率的な削減策が必要であ
った。また従来技術では、合成音声の品質を劣化させる
ことなくピッチ周期や持続時間の制御、つまり合成音声
の高低や発話速度の制御を行うことは非常に困難であっ
た。この発明では、この音声波形を音声のピッチ周期に
着目して、選択された代表波形のみを用いる方法で能率
的に圧縮し、合成の際に聴覚的に歪が検知されないよう
に処理再生するものであり、記憶容量削減効果と共に、
ピッチ周期や持続時間が変化した音声を高品質に合成で
きる。
【0006】
【実施例】図1にこの発明を波形編集合成方法に適用し
た一実施例を示す。この音声合成は分析および蓄積過程
と合成過程との2段階がある。まず、音声の分析過程で
は、分析部11において音声入力端子12から原音声信
号とラベリング情報入力端子13から音韻ラベリング情
報とが最適波形ピーク位置探索回路14に入力される。 入力された原音声信号は視察によって音韻毎に区分化さ
れ、音韻記号と位置情報とが付加される。
【0007】次に、ピーク近傍波形切り出し回路15で
各音韻毎に、3個程度の代表波形に対してその近傍のピ
ーク位置を検索し、この位置情報を中心とする波形を切
り出し、これを代表波形としてその位置情報や音韻情報
等と共に記憶装置16に蓄積する。例えば図2Aに示す
ように1つの音韻を構成する原音声波形列P1 P2 
P3 …Pm …が入力され、これらから図2Bに示す
ように異なる時点の3個の代表波形P1 、Pm 、P
n が抽出される。
【0008】音声合成過程では、合成部21において、
テキスト入力端子22から合成テキストがテキスト解析
部23に入力され、合成テキストが解析されて音韻系列
に変換され、波形読み出し回路24でその音韻系列から
必要な音声波形が記憶装置16から読みだし、ピッチ同
期補間回路25へ供給する。ピッチ同期補間回路25は
韻律情報生成回路26から与えられる合成ピッチ周期と
接続時間とに応じてその代表波形間の音声波形をその合
成ピッチ周期と同期して補間して一ピッチ毎に重ね合わ
せて得る。このときのピッチ毎の重ね合わせ窓形状は、
台形窓や余弦関数窓などが使える。
【0009】例えば図2Bに示す代表波形P1 、Pm
 が読み出され合成ピッチ周期TP 、持続時間Lが与
えられた場合、代表波形P1 とPm との間の時間を
Lとし、周期TP ごとに両波形から次のように補間さ
れ、合成波形P1m(0) 、P1m(1) 、P1m
(2) …P1m(k) の合成波形を得る。     P1m(i) =P1 ×α(i)+Pm ×
β(i)                  (1)
ここで、P1m(0) =P1 ,P1m(k) =P
m であり、α(i)及びβ(i)は代表波形P1 及
びPm に対する重み係数でそれぞれ式(2)と(3)
で表わされる。
【0010】     α(i)=0.5×〔1+cos {π×(L
−Ti)/L}〕    (2)    β(i)=1
−α(i)                    
                (3)ここで、iは
合成波形番号、TiはP1m(0) からP1m(i)
 の時間間隔、Lは合成波形P1 とPm における時
間間隔を示す。このようにして各代表波形内が補間され
た合成波形は音韻毎の接続及び合成回路27で連続する
音声として出力される。
【0011】以上の処理において、代表波形の選択方法
には、例えば当該音韻区間を複数のサブ区間に分割し、
その各サブ区間毎に波形ピークを求め、その波形を代表
波形とする方法や、当該音韻区間のスペクトル情報ある
いは波形情報の動特性などを目安に選択する方法、つま
りその音韻区間内で最大のピークを求め、その前側、後
側において、順次隣接波形の差分を見て大きく変化した
部分の波形と前記最大ピーク波形とを代表波形とする方
法などが考えられる。また、重み係数α(i)は、式(
4)のような簡単な線形関数も使用できる。
【0012】       α(i)=(L−Ti)/L      
                (4)この実施例で
は、音韻を単位とする音声合成方式を例として説明した
が、音節などその他の合成単位に基づく音声合成でも利
用可能であることは明らかである。更にこの発明は音声
の高能率符号化における音声合成にも適用することがで
きる。つまり、図2Bにおける代表波形のみを符号化し
て伝送、又は記憶し、伝送路又は記憶装置における情報
圧縮を計り、受信側又は記憶読み出し側で前述したこの
発明方法に従って音声合成することで分析合成音が得ら
れる。さらに、波形編集音声合成の場合は、全合成単位
について得られた全体の代表波形をベクトル量子化手法
などのクラスタリング技術を用いることで、いくつかの
類似の代表波形をさらに1つの波形で代表させ、情報圧
縮率を高めることもできる。
【0013】上述では1つの音韻について3つの代表波
形を求めたが、1つ以上の代表波形を求めればよく、1
つの代表波形の場合は合成すべき音韻についてその隣接
する音韻の代表波形間を上述のように補間すれはよい。
【0014】
【発明の効果】以上説明したように、この発明によれば
代表波形を用いることにより音声波形情報を能率良く圧
縮再生できるため、波形編集形音声合成方式において記
憶容量を大幅に削減でき、かつ伝送/蓄積で高能率符号
化することができ、しかも、高品質の合成音を得ること
が可能である。また、波形の補間処理をピッチ周期に同
期して行い、かつ接続時間を選ぶことにより原音声の品
質を劣化させることなく発声速度や音声の高低の制御が
可能である。
【図面の簡単な説明】
【図1】この発明方法の一実施例を示す構成図。
【図2】原波形、代表波形、合成波形の例を示す図。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  音声単位を接続して連続音声を合成す
    る方法において、音声波形の異なる時点から抽出した複
    数個の代表波形から、与えられたピッチ周期と持続時間
    とに従ってその代表波形間の音声波形をこれら代表波形
    の補間をして連続音声を合成することを特徴とする音声
    合成方法。
JP3044928A 1991-03-11 1991-03-11 音声合成方法 Expired - Fee Related JP2709198B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3044928A JP2709198B2 (ja) 1991-03-11 1991-03-11 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3044928A JP2709198B2 (ja) 1991-03-11 1991-03-11 音声合成方法

Publications (2)

Publication Number Publication Date
JPH04281499A true JPH04281499A (ja) 1992-10-07
JP2709198B2 JP2709198B2 (ja) 1998-02-04

Family

ID=12705138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3044928A Expired - Fee Related JP2709198B2 (ja) 1991-03-11 1991-03-11 音声合成方法

Country Status (1)

Country Link
JP (1) JP2709198B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56168700A (en) * 1980-05-30 1981-12-24 Nippon Electric Co Waveform edition type voice synthesizer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56168700A (en) * 1980-05-30 1981-12-24 Nippon Electric Co Waveform edition type voice synthesizer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor

Also Published As

Publication number Publication date
JP2709198B2 (ja) 1998-02-04

Similar Documents

Publication Publication Date Title
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
JP3891309B2 (ja) 音声再生速度変換装置
US4601052A (en) Voice analysis composing method
JPH04281499A (ja) 音声合成方法
JPS642960B2 (ja)
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPH0854895A (ja) 再生装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPH11311997A (ja) 音声再生速度変換装置及びその方法
JPH09198088A (ja) 声質変換再生器
JPH0235320B2 (ja)
JPS62100027A (ja) 音声符号化方式
JPH09258796A (ja) 音声合成方法
KR970003092B1 (ko) 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법
JP2000099094A (ja) 時系列信号処理装置
JPH0477320B2 (ja)
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体
JPH0690638B2 (ja) 音声分析方式
JPS58105198A (ja) 音声分析合成方法
JP2861005B2 (ja) 音声蓄積再生装置
JPS61128299A (ja) 音声処理装置
JPH10333698A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、及び記録媒体
JPH10187180A (ja) 楽音発生装置
JPS6240719B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees