JP3495275B2

JP3495275B2 - 音声合成装置

Info

Publication number: JP3495275B2
Application number: JP36981498A
Authority: JP
Inventors: 充海老原; 泰石川
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1998-12-25
Filing date: 1998-12-25
Publication date: 2004-02-09
Anticipated expiration: 2018-12-25
Also published as: JP2000194388A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、入力された任意
のテキストを音声へ変換する音声合成装置に関するもの
である。

【０００２】

【従来の技術】音声合成技術、中でも規則合成技術は任
意の文字列からなるテキストを音声に変換して提示する
技術であり、音声による情報サービス、電子メールの読
み上げ、身障者向け朗読器、新聞校閲などの用途に用い
られている。

【０００３】一般的な規則合成技術に基づいたテキスト
音声変換システムの構成は、古井「デジタル音声処理」
（東京大学出版会１９８５）の１４６ページに示され
る。システムは文章解析部、音声規則合成部、音声合成
部の３つのモジュールからなる。

【０００４】文章解析部では、辞書を参照して入力した
日本語テキストを形態素と呼ばれる単位に分割する形態
素解析処理を行う。形態素には読み、アクセント型、品
詞等が付与される。

【０００５】音声規則合成部は、さらに音響処理部と韻
律生成部から成る。文章解析部で得られた読みとアクセ
ントを基に、音響処理部ではＬＳＰやメルケプストラム
等の音声波形を分析して得られる特徴量、あるいは音声
波形そのものなどで構成される音響パラメータを生成
し、韻律生成部では韻律規則に基づいてピッチ、ポー
ズ、継続時間長などの韻律パラメータを生成する。

【０００６】音声合成部では上記音響パラメータと上記
韻律パラメータを基に合成音声を生成し、出力する。音
響パラメータがＬＳＰ等の特徴量の場合には、ボコーダ
ーと呼ばれる分析合成手法に基づいて合成音声を生成
し、音声波形の場合はＰＳＯＬＡ（Pitch Synchronous
OverLap-and-Add）と呼ばれる方式で合成を行う。

【０００７】ＰＳＯＬＡ方式は波形を直接利用をするこ
とで自然性の高い音声合成が可能となるが、波形情報は
ＬＳＰ等の音響パラメータに比べて情報量が大きいた
め、記憶容量が多大となる。そこで波形情報をベクトル
量子化などによって圧縮して記憶する方法が検討されて
いる。このような従来技術として特開平５−７３１００
号公報「音声合成方式及びその装置」（以下、文献１と
する）が挙げられる。

【０００８】図１７は、文献１で示される手法に基づく
音声合成装置の一構成例（以下、第１の従来例）であ
る。１はテキスト、２は言語処理部、３は音素列、４は
アクセント情報、５は韻律生成部、６はピッチ周波数、
１１は音声素片データベース、２４はコードブック、１
０は素片読み出し部、７は音声素片、１６はコードブッ
ク参照部、１３は合成パラメータ、１４は合成部、１５
は合成音声である。

【０００９】以下に、第１の従来例による音声合成装置
について説明する。言語処理部２は、入力されたテキス
ト１から読みを表す音素列３とアクセント情報４を得
る。素片読み出し部１０は、音素列３にしたがって音声
素片７を音声素片データベース１１から読み出す。読み
出された音声素片７は事前のベクトル量子化により得ら
れたものであり、波形系列またはスペクトル系列に対応
するコード列が記録されている。

【００１０】コードブック２４は音声波形のスペクトル
データから既存のクラスタリング手法により分割された
パターン（コードベクトル）とコードの組からなる。コ
ードベクトルはスペクトル情報または元の波形情報のい
ずれでも構わない。コードブック参照部１６では、先の
音声素片７におけるコード列からコードブック２４を参
照して、スペクトル情報または波形情報からなる合成パ
ラメータ１３を得る。韻律生成部５はアクセント情報４
を基に合成音声のピッチ６を規則により生成する。

【００１１】合成部１４は合成パラメータ１３とピッチ
６から合成音声１５を生成する。合成部１４は、合成パ
ラメータ１３がスペクトル情報ならデジタルフィルタに
よる合成手法、波形情報ならＰＳＯＬＡ手法に基づく。

【００１２】

【発明が解決しようとする課題】第１の従来技術ではボ
コーダー方式に比べて自然性の高い合成音声を得る事が
可能である。しかし、有声音声区間において同一フレー
ム内で同じピッチ波形が繰り返されることにより、合成
音の自然性が損なわれるという問題がある。これは単一
の波形の繰り返しにより、自然音声波形の持つゆらぎ成
分が失われ、合成音のブザー性が顕著となり不自然とな
るためである。このような問題点を解消する為に、音声
波形を定常的周期成分と、ゆらぎを含む非定常成分とに
分離し、別々に制御して合成音声波形を生成する手法も
提案されている。このような従来技術として特願平４−
３５８２００号公報記載の「音声合成装置」（以下、文
献２とする）に開示されている技術がある。

【００１３】図１８は、文献２で示される手法に基づく
音声合成装置の一構成例（以下、第２の従来例）であ
る。３０は１ピッチ波形格納部、３１はピッチ格納部、
３２は非定常波形格納部、３３は１ピッチ波形、６はピ
ッチ、３４は非定常波形、３５は移動加算部、３６は定
常合成音声、３７は単純加算部、１５は合成音声であ
る。

【００１４】以下に、第２の従来例による音声合成装置
について説明する。１ピッチ波形格納部３０は自然音声
を帯域分割して得られた低域音声波形を１ピッチ毎に１
ピッチ波形３３として格納する。非定常波形格納部３２
は先の帯域分割で得られた高域音声波形を非定常波形３
４として記憶する。移動加算部３５はピッチ格納部３１
から求めたピッチ６間隔で１ピッチ波形３３の移動加算
を行う。単純加算部３７は移動加算部３５で得られた定
常合成音声３６と非定常波形格納部３２から読み出した
非定常波形３４を加算し、これを合成音声１５として出
力する。

【００１５】第２の従来技術は音声波形のゆらぎ成分に
着目した波形利用による音声合成を目的としている。し
かし、ピッチに同期した波形処理を低周波数帯域でしか
行わない為に高品質の合成音が得られないという問題が
あり、更に波形情報を丸ごと保存する為に記憶容量が多
大になる。

【００１６】本発明の目的は、かかる問題を克服し、１
ピッチ波形を低周波成分と高周波成分に分離して制御す
ることで合成音の自然性に影響をおよぼすゆらぎ成分の
生成が可能となり、またコードブック利用の方式により
少ない記憶容量で高品質な合成音声が可能な音声合成装
置を提供することである。

【００１７】

【課題を解決するための手段】この発明に係る音声合成
装置は、音声素片を記憶する音声素片データベースと、
有声音波形を低周波成分と高周波成分に分離した時の低
周波成分波形のベクトル量子化コードブックである低周
波成分コードブックと、有声音波形を低周波成分と高周
波成分に分離した時の高周波成分波形のベクトル量子化
コードブックである高周波成分コードブックと、入力さ
れたテキストから音素列およびアクセント情報を得る言
語処理部と、音素列にしたがって音声素片を音声素片デ
ータベースから読み出す素片読み出し部と、素片読み出
し部の読み出した音声素片に基づいて、低周波成分コー
ドブック及び高周波成分コードブックの各々から低周波
成分波形及び高周波成分波形を選択するコードブック参
照部と、選択された低周波成分波形と高周波成分波形と
を加算し合成パラメータを得る加算部と、アクセント情
報にしたがってピッチ周波数を生成する韻律生成部と、
合成パラメータとピッチ周波数とに基づいて合成音声を
生成する合成部とを備えている。

【００１８】また、コードブック参照部は、高周波成分
コードブックから１ピッチ毎に異なる高周波成分波形を
選択する。

【００１９】また、加算部は、低周波成分波形を時間軸
に配置する際、基準位置に対して、高周波成分波形の配
置位置を１ピッチ毎に変化させて、低周波成分波形と高
周波成分波形とを加算する移動加算部である。

【００２０】また、加算部は、低周波成分波形の基準位
置に対する高周波成分波形の配置位置の平均変化幅を、
入力ピッチまたはパワーに応じて変化させて、低周波成
分波形と高周波成分波形とを加算する韻律制御移動加算
部である。

【００２１】また、加算部は、加算される低周波成分波
形と高周波成分波形の振幅比率を、１ピッチ毎に変化さ
せ、低周波成分波形と高周波成分波形とを加算する振幅
比率制御加算部である。

【００２２】また、加算部は、低周波成分波形と高周波
成分波形の振幅比率を、入力ピッチまたはパワーに応じ
て変化させ、低周波成分波形と高周波成分波形とを加算
する振幅比率ピッチ制御移動加算部である。

【００２３】また、この発明に係る他の音声合成装置
は、音声素片およびコードブック出現頻度を記憶する頻
度情報付き音声素片データベースと、有声音波形ベクト
ル量子化コードブックであるコードブックと、入力され
たテキストから音素列およびアクセント情報を得る言語
処理部と、頻度情報付き音声素片データベースに記載さ
れている音声素片を出現頻度と共に読み出す素片読み出
し部と、音声素片に対して、出現頻度に応じてコードブ
ックを参照し、合成パラメータを得るコードブック参照
部と、アクセント情報にしたがってピッチ周波数を生成
する韻律生成部と、合成パラメータとピッチ周波数とに
基づいて合成音声を生成する合成部とを備えている。

【００２４】また、コードブック参照部は、音声素片に
記載される出現頻度からコードベクトルの出現比率を求
め、音声素片に記述されたコードの中で出現比率の上位
から複数個を選んでコードブックを参照し、読み出され
て得た各波形を出現比率に応じた重み付けをして加算
し、合成パラメータを得るコードブック参照部である。

【００２５】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、頻度情報付き音
声素片データベースは、音声素片と共に低周波コードベ
クトルの出現頻度および高周波コードベクトルの出現頻
度を記憶し、コードブック参照部は、音声素片に記載
される出現頻度から低周波コードベクトルおよび高周波
コードベクトルの出現比率を求め、音声素片に記述され
たコードの内で出現比率の上位から複数個を選んで低周
波コードブックおよび高周波コードブックを参照し、読
み出されて得た各波形を出現比率に応じた重み付けをし
て加算し、合成パラメータを得るコードブック参照部で
ある。

【００２６】また、この発明に係る他の音声合成装置
は、音声素片列をコードブックのコードベクトル線形和
表現で記憶した線形和表現音声素片データベースと、有
声音波形ベクトル量子化コードブックであるコードブッ
クと、入力されたテキストから音素列およびアクセント
情報を得る言語処理部と、音素列にしたがって音声素片
列を線形和表現音声素片データベースから読み出す素片
読み出し部と、音声素片列に対して、線形和表現音声素
片データベースに記憶されている係数とコードブックを
参照して得た波形から線形和を求め、合成パラメータを
得るコードブック参照部と、アクセント情報にしたがっ
てピッチ周波数を生成する韻律生成部と、合成パラメー
タとピッチ周波数とに基づいて合成音声を生成する合成
部とを備えている。

【００２７】また、乱数を発生する乱数発生器をさらに
有し、コードブック参照部は、線形和表現音声素片デー
タベースに記憶されている係数に乱数発生器による乱数
を加算し、係数とコードブックを参照して得た波形から
線形和を求め、合成パラメータを得る乱数利用コードブ
ック参照部である。

【００２８】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、線形和表現音声
素片データベースは、音声素片列を低周波成分コードブ
ックおよび高周波成分コードブックのコードベクトル線
形和表現で記憶し、コードブック参照部は、線形和表現
音声素片データベースに記憶されている係数と低周波成
分コードブックおよび高周波成分コードブックを参照し
て得た波形から線形和を求め合成パラメータを得る。

【００２９】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、乱数利用コード
ブック参照部は、線形和表現音声素片データベースに記
憶されている係数に乱数発生器による乱数を加算し、係
数と低周波成分コードブックおよび高周波成分コードブ
ックを参照して得た波形から線形和を求め合成パラメー
タを得る。

【００３０】さらに、コードブックは、有声音波形を低
周波成分と高周波成分に分離した時の低周波成分波形の
ベクトル量子化コードブックである低周波成分コードブ
ックと、同じく、有声音波形を低周波成分と高周波成分
に分離した時の高周波成分波形のベクトル量子化コード
ブックである高周波成分コードブックとからなり、乱数
利用コードブック参照部は、線形和表現音声素片データ
ベースに記憶されている高周波成分コードの係数に乱数
発生器による乱数を加算し、係数と低周波成分コードブ
ックおよび高周波成分コードブックを参照して得た波形
から線形和を求め合成パラメータを得る。

【００３１】

【発明の実施の形態】実施の形態１．図１はこの発明の
音声合成装置を示すブロック図である。図において、１
はテキスト、２は言語処理部、３は音素列、４はアクセ
ント情報、５は韻律生成部、６はピッチ周波数、１１は
音声素片データベース、８は低周波成分コードブック、
９は高周波成分コードブック、１０は素片読み出し部、
７は音声素片、１２はコードブック参照部および加算部
としてのコードブック参照加算部、１３は合成パラメー
タ、１４は合成部、１５は合成音声である。

【００３２】次ぎに動作について説明する。言語処理部
２は、入力されたテキスト１から読みを表す音素列３と
アクセント情報４を出力する。素片読み出し部１０は、
音素列３にしたがって音声素片７を音声素片データベー
ス１１から読み出す。読み出された音声素片７はＶＣＶ
（母音−子音−母音）またＣＶ（子音−母音）などの単
位からなり、事前のベクトル量子化により得られたもの
であり、低周波成分波形系列と高周波成分波形系列のそ
れぞれに対応するコード列が記録されている。音声素片
の作成方法は後に説明する。

【００３３】低周波成分コードブック８は、低周波成分
音声波形のスペクトルデータから既存のクラスタリング
手法により分割されたパターン（コードベクトル）とコ
ードの組からなる。一方、高周波成分コードブック９
は、高周波成分音声波形のスペクトルデータから同様の
手法で得た分割されたパターン（コードベクトル）とコ
ードの組からなる。低周波成分コードブック８および高
周波成分コードブック９の各コードベクトルには、１ピ
ッチ長の音声波形を利用する。コードブックの作成方法
は後程説明する。コードブック参照加算部１２では、先
の音声素片７におけるコード列から低周波成分コードブ
ック８および高周波成分コードブック９を参照して、１
ピッチ分の低周波成分波形および高周波成分波形を抽出
する。ここでの参照および選択方法は後程説明する。

【００３４】そして低周波成分波形と高周波成分波形と
を加算し、１ピッチ分の波形情報からなる合成パラメー
タ１３を得る。韻律生成部５は、アクセント情報４を基
に合成音声のピッチ６を韻律規則により生成する。合成
部１４は合成パラメータ１３とピッチ６からＰＳＯＬＡ
方式に基づき合成音声１５を生成する。

【００３５】ここで、低周波成分コードブック８および
高周波成分コードブック９と、音声素片データベース１
１の作成方法について説明する。まず、有声区間音声を
１ピッチ長分切り出す。次ぎに１ピッチ波形について、
ある帯域分割周波数により、高周波成分波形と低周波成
分波形とに分離する。例えば８［ｋＨｚ］サンプリング
の音声データである場合、３［ｋＨｚ］による帯域制限
を行うローパスフィルターおよびハイパスフィルターを
作成し、これに前述の１ピッチ波形を通すことで低周波
成分波形と高周波成分波形とに分離する。そして、低周
波成分波形、高周波成分波形それぞれを収集し、クラス
タリング手法により低周波成分コードブック８、高周波
成分コードブック９を作成する。コードブックサイズに
ついては低周波成分コードブック８と高周波成分コード
ブック９とも同じ値、例えば２５０ずつとする。

【００３６】又、これらのコードブックを用いた、ベク
トル量子化による音声素片データベース１１の作成方法
も説明する。ベクトル量子化は低周波成分と高周波成分
について別々に行い、各音素列毎に得られたコード列を
フレーム単位で記述していく。ここで、低周波成分につ
いてはフレーム毎に代表波形１ピッチ分のみについての
ベクトル量子化を行うが、高周波成分についてはフレー
ム内の全てのピッチ波形についてベクトル量子化を行
い、得られたコード列をすべてフレーム毎に記述する。
このようにして、１つの音声素片は図２のようになる。

【００３７】また、コードブック参照加算部１２での１
ピッチ毎の素片選択は、以下のように行う。まず音声素
片データベース１１の１フレーム毎の低周波成分コード
は１つだけなので、そのコードに対応する波形を低周波
成分コードブック８から選択する。次ぎに高周波成分波
形についてはコードが複数存在する場合には、フレーム
の先頭から１ピッチ毎にコードを選び、それに対応する
波形を高周波波形コードブック９から選択する。

【００３８】図２を用いて説明すれば、音声素片／ａ／
において第１フレーム内の最初のピッチ区間について
は、高周波成分コードの２０１を選択し、次のピッチ区
間は２、その次ぎは２０１に戻る。そして第２フレーム
からは１０２、５１３、５１２の順で選択する。１ピッ
チ毎の低周波成分波形と高周波成分波形との和を１ピッ
チ波形とする。すなわち、この方法により同一フレーム
内でも高周波成分のみが異なるピッチ波形の生成が可能
となる。

【００３９】本実施の形態によれば、このような構成を
とることにより、ゆらぎの大きい高周波成分と低周波成
分とを別々に制御することができ、ピッチ同期の波形利
用の合成方式においてゆらぎ成分の生成を可能とし、よ
り自然性の高い合成音声の提供が可能となる。

【００４０】実施の形態２．図３はこの発明の音声合成
装置の他の例を示すブロック図である。なお、上述実施
の形態１と同様の構成要素およびデータについては、同
じ符号を付けて説明を省略する。本実施の形態における
音声合成装置は、実施の形態１と同様の言語処理部２、
韻律生成部５、素片読み出し部１０、音声素片データベ
ース１１、低周波成分コードブック８、高周波成分コー
ドブック９および合成部１４に加えて、コードブック参
照部１６、移動加算部１９を具備した構成を有してい
る。

【００４１】コードブック参照部１６は、入力される音
声素片７におけるコード列から低周波成分コードブック
８および高周波成分コードブック９を参照して１ピッチ
単位の低周波成分波形１７および高周波成分波形１８を
抽出する。移動加算部１９は、低周波成分波形１７の基
準位置に対して、高周波成分波形１８を加算する位置を
１回ごとにずらして加算し、それを１ピッチ波形情報か
らなる合成パラメータ１３として出力する。

【００４２】次ぎに動作について説明する。言語処理部
２は、入力されたテキスト１から読みを表す音素列３と
アクセント情報４を得る。素片読み出し部１０は、音素
列３にしたがって音声素片７を音声素片データベース１
１から読み出す。読み出された音声素片７はＶＣＶまた
ＣＶなどの単位からなり、事前のベクトル量子化により
得られたものであり、低周波成分波形系列と高周波成分
波形系列のそれぞれに対応するコード列が記録されてい
る。ただし、各フレームとも低周波コードと高周波コー
ドは一つずつとする。すなわちベクトル量子化はフレー
ム同期で、フレーム中の代表波形１つに対して行う。

【００４３】低周波成分コードブック８と高周波成分コ
ードブック９の構成および作成法は実施の形態１と同じ
とする。コードブック参照部１６では、先の音声素片７
におけるコード列から低周波成分コードブック８および
高周波成分コードブック９を参照して、１ピッチ分の低
周波成分波形１７および高周波成分波形１８を抽出す
る。移動加算部１９では前記低周波成分波形１７と前記
高周波成分波形１８とを加算し、波形情報からなる合成
パラメータ１３を得る。加算方法は後に説明する。

【００４４】韻律生成部５はアクセント情報４を基に合
成音声のピッチ６を韻律規則により生成する。合成部１
４は合成パラメータ１３とピッチ６からＰＳＯＬＡ方式
に基づき合成音声１５を生成する。

【００４５】ここで、コードブック参照部１６と移動加
算部１９の動作について説明する。まず音声素片データ
ベースの１フレーム毎の低周波成分コードに対応する波
形を低周波成分コードブックから選択する。次ぎに高周
波成分波形についても同じくコードが単一となり、それ
に対応する波形を高周波成分コードブックから選択す
る。

【００４６】加算方式を図４を用いて説明すれば、１ピ
ッチ長の低周波成分波形はピッチ同期の基準位置に、ピ
ッチ間隔で配置される。これは図においては上の波形が
ピッチ周期（Ｔ１，Ｔ２，Ｔ３）間隔で配置されること
で示される。それに対して、１ピッチ長の高周波成分波
形は先の基準位置に対して数サンプルずれた位置にピッ
チ同期で配置する。例えばフレームの１番目の高周波成
分波形は基準位置＋ｔ１、２番目のピッチ波形は基準位
置＋ｔ２、３番目の波形は−ｔ３となっている。こうし
て１フレーム分の波形を得る。すなわち、この方法によ
り同一フレーム内でも高周波成分の配置の相違により、
ピッチ波形間に波形ゆらぎを生成することが可能とな
る。

【００４７】本実施の形態によれば、このような構成を
とることにより、ゆらぎの大きい高周波成分と低周波成
分とを別々に制御することができ、ピッチ同期の波形利
用の合成方式において、より自然性の高い合成音声の提
供が可能となる。

【００４８】実施の形態３．図５はこの発明の音声合成
装置の他の例を示すブロック図である。なお、上述実施
の形態１および実施の形態２と同様の構成要素およびデ
ータについては、同じ符号を付けて説明を省略する。本
実施の形態における音声合成装置は、実施の形態１と同
様の言語処理部２、韻律生成部５、素片読み出し部１
０、音声素片データベース１１、低周波成分コードブッ
ク８、高周波成分コードブック９および合成部１４、実
施の形態２と同様のコードブック参照部１６に加えて、
韻律制御移動加算部２０を具備した構成を有している。
韻律制御移動加算部２０は、低周波成分波形１７の基準
位置に対して、高周波成分波形１８を加算する位置の、
韻律生成部５で得たピッチ６に応じて平均変動幅を変え
て、１回ごとにずらして加算し、それを１ピッチ波形情
報からなる合成パラメータ１３として出力する。

【００４９】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって音声素片７を音声素片データベース１１か
ら読み出す。読み出された音声素片７はＶＣＶまたＣＶ
などの単位からなり、事前のベクトル量子化により得ら
れたものであり、低周波成分波形系列と高周波成分波形
系列のそれぞれに対応するコード列が記録されている。
ただし、各フレームとも低周波コードと高周波コードは
一つずつとする。すなわちベクトル量子化はフレーム同
期で、フレーム中の代表波形１つに対して行う。

【００５０】低周波成分コードブック８と高周波成分コ
ードブック９の構成および作成法は実施の形態１と同じ
とする。コードブック参照部１６では、先の音声素片７
におけるコード列から低周波成分コードブック８および
高周波成分コードブック９を参照して、１ピッチ分の低
周波成分波形１７および高周波成分波形１８を抽出す
る。韻律制御移動加算部２０では前記低周波成分波形１
７と前記高周波成分波形１８との加算位置の平均変化幅
をピッチ６により制御して加算し、１ピッチ波形情報か
らなる合成パラメータ１３を得る。加算方法は後に説明
する。合成部１４は合成パラメータ１３とピッチ６から
ＰＳＯＬＡ方式に基づき合成音声１５を生成する。

【００５１】ここで、韻律制御移動加算部２０の動作に
ついて説明する。まず音声素片データベースの１フレー
ム毎の低周波成分コードに対応する波形を低周波波形コ
ードブック８から選択する。次ぎに高周波成分波形につ
いても同じくコードが単一となり、それに対応する波形
を高周波成分コードブック９から選択する。そして、１
ピッチ長の低周波成分波形の基準位置に対する図４にお
ける高周波成分波形の配置位置を、韻律生成部５で生成
したピッチ６により制御する。例えば、ピッチ６の値を
α［Ｈｚ］とした時に、基準位置と高周波成分波形配置
位置との変化幅を１／α倍する。これは、低ピッチの音
声波形ほど波形ゆらぎが大きいという知見に基づくもの
である。

【００５２】加算方式を図４を用いて説明すれば、１ピ
ッチ長の低周波成分波形はピッチ同期の基準位置に、ピ
ッチ間隔で配置される。それに対して、１ピッチ長の高
周波成分波形は先の基準位置に対して数サンプルずれた
位置にピッチ同期で配置する。平均変化幅をｋとした場
合、例えばフレーム１、２、３番目の高周波成分波形の
基準位置からのずれｔ１，ｔ２，ｔ３はそれぞれｋ／α
に比例した値となる。こうして１ピッチ分の波形を得
る。すなわち、この方法により同一フレーム内でも高周
波成分の配置の相違により、ピッチ波形間に波形ゆらぎ
を生成することが可能となる。

【００５３】本実施の形態によれば、このような構成を
とることにより、ゆらぎの大きい高周波成分と低周波成
分とを別々に制御することができ、ピッチ同期の波形利
用の合成方式においてゆらぎ成分の生成を可能とし、な
お且つゆらぎの変動量を相関性の高いピッチによって制
御することで、より自然性の高い合成音声の提供が可能
となる。

【００５４】実施の形態４．図６はこの発明の音声合成
装置の他の例を示すブロック図である。なお、上述実施
の形態１および実施の形態２と同様の構成要素およびデ
ータについては、同じ符号を付けて説明を省略する。本
実施の形態における音声合成装置は、実施の形態１と同
様の言語処理部２、韻律生成部５、素片読み出し部１
０、音声素片データベース１１、低周波成分コードブッ
ク８、高周波成分コードブック９および合成部１４、実
施の形態２と同様のコードブック参照部１６に加えて、
振幅制御波形加算部２１を具備した構成を有している。
振幅比率制御加算部２１は、低周波成分波形１７と高周
波成分波形１８の振幅の加算比率を変えて加算し、それ
を１ピッチ波形情報からなる合成パラメータ１３として
出力する。

【００５５】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって音声素片７を音声素片データベース１１か
ら読み出す。読み出された音声素片７はＶＣＶまたＣＶ
などの単位からなり、事前のベクトル量子化により得ら
れたものであり、低周波成分波形系列と高周波成分波形
系列のそれぞれに対応するコード列が記録されている。
ただし、各フレームとも低周波コードと高周波コードは
一つずつとする。すなわちベクトル量子化はフレーム同
期で、フレーム中の代表波形１つに対して行う。

【００５６】低周波成分コードブック８と高周波成分コ
ードブック９の構成および作成法は実施の形態１と同じ
とする。コードブック参照部１６では、先の音声素片７
におけるコード列から低周波成分コードブック８および
高周波成分コードブック９を参照して、１ピッチ分の低
周波成分波形１７および高周波成分波形１８を抽出す
る。振幅比率制御加算部２１では前記低周波成分波形１
７と前記高周波成分波形１８とを、それらの振幅比率を
１ピッチ毎に変更して加算し、１ピッチ波形情報からな
る合成パラメータ１３を得る。合成部１４は合成パラメ
ータ１３とピッチ６からＰＳＯＬＡ方式に基づき合成音
声１５を生成する。

【００５７】本実施の形態によれば、このような構成を
とることにより、ゆらぎの大きい高周波成分と低周波成
分とを別々に制御することができ、ピッチ同期の波形利
用の合成方式において高周波成分波形と低周波成分波形
の振幅比率を１ピッチ毎に変更することによりゆらぎの
制御を行うことで、より自然性の高い合成音声の提供が
可能となる。

【００５８】実施の形態５．図７はこの発明の音声合成
装置の他の例を示すブロック図である。なお、上述実施
の形態１および実施の形態２と同様の構成要素およびデ
ータについては、同じ符号を付けて説明を省略する。本
実施の形態における音声合成装置は、実施の形態１と同
様の言語処理部２、韻律生成部５、素片読み出し部１
０、音声素片データベース１１、低周波成分コードブッ
ク８、高周波成分コードブック９および合成部１４、実
施の形態２と同様のコードブック参照部１６に加えて、
振幅比率ピッチ制御加算部２２を具備した構成を有して
いる。振幅比率ピッチ制御加算部２２は、低周波成分波
形１７と高周波成分波形１８の振幅の加算比率を、韻律
生成部５で得たピッチ６に応じて変えて加算し、それを
１ピッチ波形情報からなる合成パラメータ１３として出
力する。

【００５９】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって音声素片７を音声素片データベース１１か
ら読み出す。読み出された音声素片７はＶＣＶまたＣＶ
などの単位からなり、事前のベクトル量子化により得ら
れたものであり、低周波成分波形系列と高周波成分波形
系列のそれぞれに対応するコード列が記録されている。
ただし、各フレームとも低周波コードと高周波コードは
一つずつとする。すなわちベクトル量子化はフレーム同
期で、フレーム中の代表波形１つに対して行う。

【００６０】低周波成分コードブック８と高周波成分コ
ードブック９の構成および作成法は実施の形態１と同じ
とする。コードブック参照部１６では、先の音声素片７
におけるコード列から低周波成分コードブック８および
高周波成分コードブック９を参照して、１ピッチ分の低
周波成分波形１７および高周波成分波形１８を抽出す
る。振幅比率ピッチ制御加算部２２では前記低周波成分
波形１７と前記高周波成分波形１８とを、それらの振幅
比率をピッチ６により制御して加算し、１ピッチ波形情
報からなる合成パラメータ１３を得る。加算方法は後に
説明する。合成部１４は合成パラメータ１３とピッチ６
からＰＳＯＬＡ方式に基づき合成音声１５を生成する。

【００６１】ここで、振幅比率ピッチ制御加算部２２の
動作について説明する。まず選択された１ピッチ長の高
周波成分波形の振幅比率をβ（０＜β＜１）とし、低周
波波形をｘｌ、高周波成分波形をｘｈとした場合に、
（１）式で示される波形の重みづけ加算を行う。（１−β）・ｘｌ＋ β・ｘｈ（１）この時、ピッチ６の値とβと関係は反比例となるように
設定する。これは、低ピッチの音声波形ほど波形ゆらぎ
が大きいという知見に基づくものであり、その為に高周
波成分の比率を上げるものである。こうして１ピッチ分
の波形を得る。すなわち、この方法によりピッチの値に
よって波形ゆらぎの制御が可能となる。

【００６２】本実施の形態によれば、このような構成を
とることにより、ゆらぎの大きい高周波成分と低周波成
分とを別々に制御することができ、ピッチ同期の波形利
用の合成方式において振幅比率をゆらぎと相関性の高い
ピッチによって制御することで、より自然性の高い合成
音声の提供が可能となる。

【００６３】実施の形態６．図８はこの発明の音声合成
装置の他の例を示すブロック図である。なお、上述実施
の形態１および従来例１と同様の構成要素およびデータ
については、同じ符号を付けて説明を省略する。本実施
の形態における音声合成装置は、実施の形態１と同様の
言語処理部２、韻律生成部５および合成部１４、従来例
１と同様のコードブック参照部１６およびコードブック
２４に加えて、頻度情報付き音声素片データベース２３
および素片読み出し部１０を具備した構成を有してい
る。頻度情報付き音声素片データベース２３は、事前の
ベクトル量子化の際に記述されたコードブックのコード
とのその出現頻度の系列からなる。素片読み出し部１０
は、音素列３におけるコードの頻度から音声素片７に記
述するコード列を決定する。

【００６４】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって頻度情報付き音声素片データベース２３を
参照する。頻度情報付き音声素片データベース２３は図
９に示されるような構造となっており、音素列３に対応
する頻度情報付き音声素片の系列を読み出す。頻度情報
は元となる音声データベース中の全音素系列と、コード
ブックとの間で１ピッチ波形のベクトル量子化を行い、
同一音素系列中でコードブック中のコードベクトルが選
択される回数を記録することにより実現する。図９の例
では、音声素片／ａ／の第１フレームにおいて、コード
１０１の出現頻度数が３０、コード１００が１５、コー
ド５４が５となっている。

【００６５】次ぎに素片読み出し部１０の中で、音声素
片における各フレーム毎のコードを一意に決定し、それ
を音声素片７として出力する。決定方法としては、フレ
ーム毎のコード出現頻度からコード出現率を求め、その
率が閾値を越すコードが複数存在すれば、１ピッチ毎に
コードを変更するように記述する。

【００６６】コードブック参照部１６では、先の音声素
片７におけるコード列からコードブック２４を参照し
て、波形情報からなる合成パラメータ１３を得る。韻律
生成部５はアクセント情報４を基に合成音声のピッチ６
を韻律規則により生成する。合成部１４は合成パラメー
タ１３とピッチ６からＰＳＯＬＡ方式に基づき合成音声
１５を生成する。

【００６７】本実施の形態によれば、このような構成を
とることにより、ピッチ同期の波形利用の合成方式にお
いて、コードブックの出現頻度を考慮した音声素片を用
意することにより、フレーム毎単一コードの音声素片に
比べ、より多様な波形合成を可能とし、より自然性の高
い合成音声の提供が可能となる。

【００６８】実施の形態７．図１０はこの発明の音声合
成装置の他の例を示すブロック図である。なお、上述実
施の形態１および実施の形態６と同様の構成要素および
データについては、同じ符号を付けて説明を省略する。
本実施の形態における音声合成装置は、実施の形態１と
同様の言語処理部２、韻律生成部５および合成部１４、
実施の形態６と同様のコードブック参照部１６、コード
ブック２４および頻度情報付き音声素片データベース２
３に加えて、素片読み出し重み付け選択部２５を具備し
た構成を有している。素片読み出し重み付け選択部２５
は、音素列３におけるコードの頻度から重み係数を決定
し、音声素片７に記述されたコード列をその重み付けと
共に出力する。

【００６９】次ぎに動作について説明する。言語処理部
２は、入力されたテキスト１から読みを表す音素列３と
アクセント情報４を得る。素片読み出し重み付け選択部
２５は音素列３にしたがって頻度情報付き音声素片デー
タベース２３を参照する。頻度情報付き音声素片データ
ベース２３は構成は実施の形態６と同様とする。素片読
み出し重み付け選択部２５の中で、音声素片における各
フレーム毎のコードを全て選択する。そして各コードの
出現頻度から判定される出現率を重み係数とし、各コー
ドに乗する。そして、それを音声素片７として出力す
る。

【００７０】コードブック参照部１６では、先の音声素
片７におけるコード列からコードブック２４を参照し、
複数のピッチ波形に出現率から求められた重み係数を乗
じて加算する。こうして求められた１ピッチ長の波形情
報からなる合成パラメータ１３を得る。韻律生成部５は
アクセント情報４を基に合成音声のピッチ６を韻律規則
により生成する。合成部１４は合成パラメータ１３とピ
ッチ６からＰＳＯＬＡ方式に基づき合成音声１５を生成
する。

【００７１】本実施の形態によれば、このような構成を
とることにより、出現頻度を考慮した素片選択および重
みづけ加算をすることでフレーム毎単一コードの音声素
片に比べ、より詳細な波形合成を可能とし、より自然性
の高い合成音声の提供が可能となる。

【００７２】実施の形態８．図１１はこの発明の音声合
成装置の他の例を示すブロック図である。なお、上述実
施の形態１、実施の形態６および実施の形態７と同様の
構成要素およびデータについては、同じ符号を付けて説
明を省略する。本実施の形態における音声合成装置は、
実施の形態１と同様の言語処理部２、韻律生成部５、低
周波成分コードブック８、高周波成分コードブック９お
よび合成部１４、実施の形態６と同様のコードブック参
照部１６、コードブック２４および頻度情報付き音声素
片データベース２３に加えて、素片読み出し重み付け選
択部２５を具備した構成を有している。素片読み出し重
み付け選択部２５は、音素列３における低周波成分およ
び高周波成分のコードの頻度から重み係数を決定し、音
声素片７に記述されたコード列をその重み付けと共に出
力する。

【００７３】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し重み付け選択部２
５は音素列３にしたがって頻度情報付き音声素片データ
ベース２３を参照する。頻度情報付き音声素片データベ
ース２３は構成は実施の形態６と同様とする。素片読み
出し重み付け選択部２５の中で、音声素片における各フ
レーム毎のコードを全て選択する。そして各コードの出
現頻度から判定される出現率を重み係数とし、各コード
に乗する。そして、それを音声素片７として出力する。

【００７４】コードブック参照部１６では、先の音声素
片７におけるコード列から低周波成分コードブック８お
よび高周波成分コードブック９を参照し、複数の１ピッ
チ長の低周波成分波形および高周波成分波形に出現率か
ら求められた重み係数を乗じて加算する。こうして求め
られた１ピッチ長の波形情報からなる合成パラメータ１
３を得る。韻律生成部５はアクセント情報４を基に合成
音声のピッチ６を韻律規則により生成する。合成部１４
は合成パラメータ１３とピッチ６からＰＳＯＬＡ方式に
基づき合成音声１５を生成する。

【００７５】本実施の形態によれば、このような構成を
とることにより、出現頻度を考慮した素片選択および重
みづけ加算をすることでフレーム毎単一コードの音声素
片に比べ、より詳細で、低周波成分と高周波成分とを分
離することでゆらぎを考慮した波形合成を可能とし、よ
り自然性の高い合成音声の提供が可能となる。

【００７６】実施の形態９．図１２はこの発明の音声合
成装置の他の例を示すブロック図である。なお、上述実
施の形態１および従来例１と同様の構成要素およびデー
タについては、同じ符号を付けて説明を省略する。本実
施の形態における音声合成装置は、実施の形態１と同様
の言語処理部２、韻律生成部５、素片読み出し部１０お
よび合成部１４、従来例１と同様のコードブック２４に
加えて、線形和表現音声素片データベース２６およびコ
ードブック参照部１６を具備した構成を有している。線
形和表現音声素片データベース２６は、事前のベクトル
量子化の際に記述されたコードブックのコードを線形和
で表現した系列からなる。コードブック参照部１６は音
声素片７に記述されているコード列からコードブック２
４のコードベクトルを参照し、コードベクトルの線形和
を合成パラメータ１３として出力する。

【００７７】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって線形和表現音声素片データベース２６を参
照する。線形和表現音声素片データベース２６は図１５
に示されるような構造となっており、音素列３に対応す
る線形和表現形式の音声素片の系列を読み出す。線形和
表現は音声素片データベースについて、コードブック中
の２つのコードベクトルＸ，Ｙにより、（αＸ＋βＹ）
が量子化歪み最小となるような１ピッチ波形のベクトル
量子化を行い、２つのコードと係数α、βを記録するこ
とにより実現する。図１５では音声素片／ａ／の第１フ
レームはＸに対応するコードが１０１、Ｙに対応するコ
ードが１００であり、係数αおよびβはそれぞれ０．
６、０．４となる。

【００７８】コードブック参照部１６では、先の音声素
片７におけるコード列からコードブック２４を参照し
て、２つのコードベクトルＸ，Ｙを読みだし、先の係数
を用いて、（αＸ＋βＹ）という重み付けをした１ピッ
チ波形を求め、これを合成パラメータ１３として得る。
韻律生成部５はアクセント情報４を基に合成音声のピッ
チ６を韻律規則により生成する。合成部１４は合成パラ
メータ１３とピッチ６からＰＳＯＬＡ方式に基づき合成
音声１５を生成する。

【００７９】本実施例によれば、このような構成をとる
ことにより、フレーム毎単一コードの音声素片に比べ、
より詳細な波形合成を可能とし、より自然性の高い合成
音声の提供が可能となる。

【００８０】実施の形態１０．図１３はこの発明の音声
合成装置の他の例を示すブロック図である。なお、上述
実施の形態１および実施の形態９と同様の構成要素およ
びデータについては、同じ符号を付けて説明を省略す
る。本実施の形態における音声合成装置は、実施の形態
１と同様の言語処理部２、韻律生成部５、素片読み出し
部１０および合成部１４、実施の形態９と同様のコード
ブック２４、線形和表現音声素片データベース２６に加
えて乱数発生器２７、乱数利用コードブック参照部２９
を具備した構成を有している。乱数利用コードブック参
照部２９は音声素片７に記述された係数に、乱数発生器
２７で発生させた乱数２８を加算し、合成パラメータを
作成する。

【００８１】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって線形和表現音声素片データベース２６を参
照する。線形和表現音声素片データベース２６の構成は
実施の形態９と同様とする。

【００８２】乱数利用コードブック参照部２９では、先
の音声素片７におけるコード列からコードブック２４を
参照して、２つのコードベクトルＸ，Ｙを読みだす。そ
して乱数発生器２７で発生させた乱数２８を音声素片７
に記述された係数α、βに加算し、新たな係数α’、
β’とし、（α’Ｘ＋β’Ｙ）という重み付けをした１
ピッチ波形を求め、これを合成パラメータ１３として得
る。韻律生成部５はアクセント情報４を基に合成音声の
ピッチ６を韻律規則により生成する。合成部１４は合成
パラメータ１３とピッチ６からＰＳＯＬＡ方式に基づき
合成音声１５を生成する。

【００８３】本実施例によれば、このような構成をとる
ことにより、フレーム毎単一コードの音声素片に比べ、
より詳細な波形合成を可能とし、さらに乱数を利用する
ことでゆらぎの影響を取り入れた、より自然性の高い合
成音声の提供が可能となる。

【００８４】実施の形態１１．図１４はこの発明の音声
合成装置の他の例を示すブロック図である。なお、上述
実施の形態１および従来例１と同様の構成要素およびデ
ータについては、同じ符号を付けて説明を省略する。本
実施の形態における音声合成装置は、実施の形態１と同
様の言語処理部２、韻律生成部５、素片読み出し部１
０、低周波成分コードブック８、高周波成分コードブッ
ク９および合成部１４、実施の形態９と同様の線形和表
現音声素片データベース２６およびコードブック参照部
１６を具備した構成を有している。頻度情報付き音声素
片データベース２３は、事前のベクトル量子化の際に記
述された低周波成分波形、高周波成分波形のそれぞれの
コードブックのコードを線形和で表現した系列からな
る。コードブック参照部１６は音声素片７に記述されて
いるコード列から低周波波形コードブック８および高周
波成分コードブック９のコードベクトルを参照し、コー
ドベクトルの線形和を合成パラメータ１３として出力す
る。

【００８５】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって線形和表現音声素片データベース２６を参
照する。線形和表現音声素片データベース２６は図１５
に示されるような構造を低周波成分波形と高周波成分波
形の両方についてとる。コードブック参照部１６では、
先の音声素片７におけるコード列から低周波波形コード
ブック８および高周波成分コードブック８を参照し、
（αＸ＋βＹ）という重み付け形式で１ピッチ長の低周
波成分波形と高周波成分波形を求め、これを合成パラメ
ータ１３として得る。韻律生成部５はアクセント情報４
を基に合成音声のピッチ６を韻律規則により生成する。
合成部１４は合成パラメータ１３とピッチ６からＰＳＯ
ＬＡ方式に基づき合成音声１５を生成する。

【００８６】本実施例によれば、このような構成をとる
ことにより、フレーム毎単一コードの音声素片に比べ、
より詳細な波形合成を可能とし、低周波成分と高周波成
分とを分離することでゆらぎを考慮した波形合成を可能
とし、より自然性の高い合成音声の提供が可能となる。

【００８７】実施の形態１２．図１６はこの発明の音声
合成装置の他の例を示すブロック図である。なお、上述
実施の形態１、１０、１１と同様の構成要素およびデー
タについては、同じ符号を付けて説明を省略する。本実
施の形態における音声合成装置は、実施の形態１と同様
の言語処理部２、韻律生成部５、素片読み出し部１０お
よび合成部１４、低周波成分コードブック８、高周波成
分コードブック９、実施の形態９における線形和表現音
声素片データベース２６および実施の形態１０における
乱数利用コードブック参照部２９および乱数発生器２７
を具備した構成を有している。乱数利用コードブック参
照部２９は音声素片７に記述されているコード列から低
周波成分コードブック８および高周波成分コードブック
９のコードベクトルを参照し、音声素片７に記述された
係数に、乱数発生器２７で発生させた乱数２８を加算
し、線形和を合成パラメータ１３として出力する。

【００８８】次ぎに動作について説明する。言語処理部
２は入力されたテキスト１から読みを表す音素列３とア
クセント情報４を得る。素片読み出し部１０は音素列３
にしたがって線形和表現音声素片データベース２６を参
照する。線形和表現音声素片データベース２６は図１５
に示されるような構造を低周波成分と高周波成分の両方
についてとる。乱数利用コードブック参照部２９では、
先の音声素片７におけるコード列から低周波成分コード
ブック８および高周波成分コードブック８を参照して、
両コードブックから２つのコードベクトルを読みだす。
そして乱数発生器２７で発生させた乱数２８を音声素片
７に記述された係数α、βに加算し、新たな係数α’、
β’とし、（α’Ｘ＋β’Ｙ）という重み付け形式で１
ピッチ長の低周波成分波形と高周波成分波形を求め、こ
れを合成パラメータ１３として得る。韻律生成部５はア
クセント情報４を基に合成音声のピッチ６を韻律規則に
より生成する。合成部１４は合成パラメータ１３とピッ
チ６からＰＳＯＬＡ方式に基づき合成音声１５を生成す
る。

【００８９】本実施例によれば、このような構成をとる
ことにより、フレーム毎単一コードの音声素片に比べ、
より詳細な波形合成を可能とし、低周波成分と高周波成
分とを分離し、さらに乱数を利用することでゆらぎの影
響を取り入れた、より自然性の高い合成音声の提供が可
能となる。

【００９０】実施の形態１３．本実施の形態において
は、概略実施の形態１２と同様の構成を成す。本実施の
形態の動作について説明する。言語処理部２は入力され
たテキスト１から読みを表す音素列３とアクセント情報
４を得る。素片読み出し部１０は音素列３にしたがって
線形和表現音声素片データベース２６を参照する。線形
和表現音声素片データベース２６は図１５に示されるよ
うな構造を低周波成分と高周波成分の両方についてと
る。乱数利用コードブック参照部２９では、先の音声素
片７におけるコード列から低周波成分コードブック８お
よび高周波成分コードブック８を参照して、両コードブ
ックから２つのコードベクトルを読みだす。そして高周
波成分についての音声素片７の係数α、βについて乱数
発生器２７で発生させた乱数２８を加算して新たな係数
α’、β’とし、低周波成分については（αＸ＋β
Ｙ）、高周波成分については（α’Ｘ＋β’Ｙ）という
重み付け形式で１ピッチ長の低周波成分波形と高周波成
分波形を求め、これを合成パラメータ１３として得る。
韻律生成部５はアクセント情報４を基に合成音声のピッ
チ６を韻律規則により生成する。合成部１４は合成パラ
メータ１３とピッチ６からＰＳＯＬＡ方式に基づき合成
音声１５を生成する。

【００９１】本実施例によれば、このような構成をとる
ことにより、フレーム毎単一コードの音声素片に比べ、
より詳細な波形合成を可能とし、低周波成分と高周波成
分とを分離し、さらにゆらぎの影響が強い高周波成分に
ついて乱数を利用することで、より自然性の高い合成音
声の提供が可能となる。

【００９２】尚、実施の形態１〜１３における低周波成
分コードブック８および高周波成分コードブック９、ま
たはコードブック２４は、１ピッチ長音声波形の代りに
それのスペクトル、又はＬＳＰ、メルケプストラムなど
のスペクトルパラメータをコードベクトルとすることも
でき、合成部１４はボコーダー方式による音声合成を行
うことも可能である。

【００９３】また、実施の形態１〜５、８、１１〜１３
における低周波成分コードブック８および高周波成分コ
ードブック９は、コードブック作成時の帯域制限周波数
を固定とするのではなく、原音声のピッチ長に応じて可
変的変更することを可能とする。

【００９４】さらに、実施の形態１〜５、８、１１〜１
３における低周波成分コードブック８および高周波成分
コードブック９は、コードブックサイズを同じくする必
要はなく、高周波成分コードブック９のサイズを低周波
成分コードブック８のそれより少なくするなど、異なる
ように構成してもよい。

【００９５】さらにまた、実施の形態１〜５における高
周波成分コードブック９は、各コードベクトルが代表ピ
ッチとともに記録され、コードブック参照では代表ピッ
チが目標ピッチに最も近い高周波成分コードを選択する
こともできる。

【００９６】また、実施の形態１〜５における素片読み
だし部１０の読み出した高周波成分コードの決定は、同
じコードを続けて選択しないようランダムに行うことで
も実現可能である。

【００９７】さらに、実施の形態１における音声素片デ
ータベース１１は、作成の際に低周波成分についてもす
べてのフレーム内ピッチ波形についてベクトル量子化を
行い、得られたコード列をすべてフレーム毎に記述する
ことができ、素片読み出し部１０は、高周波成分波形同
様に低周波成分波形を１ピッチ毎に選択することも可能
である。

【００９８】さらにまた、実施の形態１〜５における音
声素片データベース１１は、高周波成分コードの記述は
行わず、別途、音韻種類とそれに対応づけられた高周波
成分コードとのマトリックスが含まれ、素片読み出し部
１０は、入力された音韻によりマトリックスを検索し、
音韻対応コードの中でランダムに決定し、高周波成分コ
ードを決定することもできる。

【００９９】また、実施の形態１〜５における音声素片
データベース１１は、高周波成分コードの記述は行わ
ず、別途、音韻種類および代表ピッチにより対応づけら
れた高周波成分コードとのマトリックスが含まれ、素片
読み出し部１０は、入力された音韻と目標ピッチにより
マトリックスを検索し、高周波成分コードを決定するこ
ともできる。

【０１００】さらに、実施の形態２〜５における音声素
片データベース１１は、高周波コードの記述はフレーム
毎に複数個のコードとすることも可能であり、コードブ
ック参照部は１ピッチ別に別の高周波波形を選択するこ
ともできる。

【０１０１】さらにまた、実施の形態４における振幅比
率の変更としては、乱数発生器による制御が考えられ
る。

【０１０２】また、実施の形態４における振幅比率制御
加算部２１および実施の形態５における振幅比率ピッチ
制御加算部２２は、振幅の加算比率を入力音声素片の音
韻種類により決定することも可能である。

【０１０３】さらに、実施の形態３の韻律制御移動加算
部２０は、ピッチ周波数６の代わりに韻律生成部５で韻
律規則により決定されるパワーにより決定することがで
きる。すなわち、パワーが小さいほど高周波成分波形の
加算位置の平均変動率が増加するように構成することが
できる。

【０１０４】さらにまた、実施の形態５の振幅比率ピッ
チ制御加算部２２は、ピッチ周波数２２の代わりに韻律
生成部５で韻律規則により決定されるパワーにより決定
することができる。すなわち、パワーが小さいほど高周
波波形成分の振幅比率が増加するように構成することが
できる。

【０１０５】また、実施の形態６〜８における頻度情報
付き音声素片データベース２３は、あるコードの出現頻
度が一定の閾値を下回る場合に、あるいはあるコードの
出現頻度が総出現頻度に対して一定値を下回る場合に、
そのコードを記述から除くこともできる。

【０１０６】さらに、実施の形態９〜１３における線形
和表現音声素片データベース２６は、二項の和ではな
く、三項以上の和からなる線形式で表現するものを含む
こともできる。

【０１０７】

【発明の効果】この発明に係る音声合成装置は、音声素
片を記憶する音声素片データベースと、有声音波形を低
周波成分と高周波成分に分離した時の低周波成分波形の
ベクトル量子化コードブックである低周波成分コードブ
ックと、有声音波形を低周波成分と高周波成分に分離し
た時の高周波成分波形のベクトル量子化コードブックで
ある高周波成分コードブックと、入力されたテキストか
ら音素列およびアクセント情報を得る言語処理部と、音
素列にしたがって音声素片を音声素片データベースから
読み出す素片読み出し部と、素片読み出し部の読み出し
た音声素片に基づいて、低周波成分コードブック及び高
周波成分コードブックの各々から低周波成分波形及び高
周波成分波形を選択するコードブック参照部と、選択さ
れた低周波成分波形と高周波成分波形とを加算し合成パ
ラメータを得る加算部と、アクセント情報にしたがって
ピッチ周波数を生成する韻律生成部と、合成パラメータ
とピッチ周波数とに基づいて合成音声を生成する合成部
とを備えている。そのため、ピッチ同期の波形利用の合
成方式において、従来の波形コードブックを低周波成分
と高周波成分とに分離することにより、ゆらぎの大きい
高周波成分と低周波成分とを別々に制御することがで
き、より自然性の高い合成音声の提供が可能となる。

【０１０８】また、コードブック参照部は、高周波成分
コードブックから１ピッチ毎に異なる高周波成分波形を
選択する。そのため、ピッチ同期の波形利用の合成方式
において、ピッチ区間毎に高周波成分の１ピッチ波形選
択を行うことでゆらぎ成分の生成を可能とし、より自然
性の高い合成音声の提供が可能となる。

【０１０９】また、加算部は、低周波成分波形を時間軸
に配置する際、基準位置に対して、高周波成分波形の配
置位置を１ピッチ毎に変化させて、低周波成分波形と高
周波成分波形とを加算する移動加算部である。そのた
め、ピッチ同期の波形利用の合成方式において、ピッチ
区間毎に低周波成分波形に対する高周波成分波形の配置
位置を変動することにより、ゆらぎ成分の生成を可能と
し、より自然性の高い合成音声の提供が可能となる。

【０１１０】また、加算部は、低周波成分波形の基準位
置に対する高周波成分波形の配置位置の平均変化幅を、
入力ピッチまたはパワーに応じて変化させて、低周波成
分波形と高周波成分波形とを加算する韻律制御移動加算
部である。そのため、ピッチ同期の波形利用の合成方式
において、ピッチ区間毎に低周波成分波形に対する高周
波成分波形の配置位置を変動することにより、ゆらぎ成
分の生成を可能とし、その配置位置の変動量をゆらぎと
の相関性の高いピッチによって制御することで、より自
然性の高い合成音声の提供が可能となる。

【０１１１】また、加算部は、加算される低周波成分波
形と高周波成分波形の振幅比率を、１ピッチ毎に変化さ
せ、低周波成分波形と高周波成分波形とを加算する振幅
比率制御加算部である。そのため、ピッチ同期の波形利
用の合成方式において、高周波成分と低周波成分の振幅
比率を１ピッチ毎に変更することにより、ゆらぎの生成
を可能とし、より自然性の高い合成音声の提供が可能と
なる。

【０１１２】また、加算部は、低周波成分波形と高周波
成分波形の振幅比率を、入力ピッチまたはパワーに応じ
て変化させ、低周波成分波形と高周波成分波形とを加算
する振幅比率ピッチ制御移動加算部である。そのため、
ピッチ同期の波形利用の合成方式において、高周波成分
と低周波成分の振幅比率を１ピッチ毎に変更することに
より、ゆらぎの生成を可能とし、その振幅比率をゆらぎ
との相関性の高いピッチによって制御することで、より
自然性の高い合成音声の提供が可能となる。

【０１１３】また、この発明に係る他の音声合成装置
は、音声素片およびコードブック出現頻度を記憶する頻
度情報付き音声素片データベースと、有声音波形ベクト
ル量子化コードブックであるコードブックと、入力され
たテキストから音素列およびアクセント情報を得る言語
処理部と、頻度情報付き音声素片データベースに記載さ
れている音声素片を出現頻度と共に読み出す素片読み出
し部と、音声素片に対して、出現頻度に応じてコードブ
ックを参照し、合成パラメータを得るコードブック参照
部と、アクセント情報にしたがってピッチ周波数を生成
する韻律生成部と、合成パラメータとピッチ周波数とに
基づいて合成音声を生成する合成部とを備えている。そ
のため、ピッチ同期の波形利用の合成方式において、コ
ードブックの出現頻度を考慮した音声素片を用意するこ
とにより、フレーム毎単一コードの音声素片に比べ、よ
り多様な波形合成を可能とし、より自然性の高い合成音
声の提供が可能となる。

【０１１４】また、コードブック参照部は、音声素片に
記載される出現頻度からコードベクトルの出現比率を求
め、音声素片に記述されたコードの中で出現比率の上位
から複数個を選んでコードブックを参照し、読み出され
て得た各波形を出現比率に応じた重み付けをして加算
し、合成パラメータを得るコードブック参照部である。
そのため、ピッチ同期の波形利用の合成方式において、
コードブックの出現頻度を考慮した音声素片を用意し、
さらにその出現頻度に応じた１ピッチ波形の重みづけ加
算をすることで、フレーム毎単一コードの音声素片に比
べ、より詳細な波形合成を可能とし、より自然性の高い
合成音声の提供が可能となる。

【０１１５】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、頻度情報付き音
声素片データベースは、音声素片と共に低周波コードベ
クトルの出現頻度および高周波コードベクトルの出現頻
度を記憶し、コードブック参照部は、音声素片に記載
される出現頻度から低周波コードベクトルおよび高周波
コードベクトルの出現比率を求め、音声素片に記述され
たコードの内で出現比率の上位から複数個を選んで低周
波コードブックおよび高周波コードブックを参照し、読
み出されて得た各波形を出現比率に応じた重み付けをし
て加算し、合成パラメータを得るコードブック参照部で
ある。そのため、ピッチ同期の波形利用の合成方式にお
いて、高周波成分と低周波成分についてコードブックの
出現頻度を考慮した音声素片を用意し、さらにその出現
頻度に応じた１ピッチ波形の重みづけ加算をすること
で、フレーム毎単一コードの音声素片に比べ、より詳細
で、低周波成分と高周波成分とを分離することでゆらぎ
を考慮した波形合成を可能とし、より自然性の高い合成
音声の提供が可能となる。

【０１１６】また、この発明に係る他の音声合成装置
は、音声素片列をコードブックのコードベクトル線形和
表現で記憶した線形和表現音声素片データベースと、有
声音波形ベクトル量子化コードブックであるコードブッ
クと、入力されたテキストから音素列およびアクセント
情報を得る言語処理部と、音素列にしたがって音声素片
列を線形和表現音声素片データベースから読み出す素片
読み出し部と、音声素片列に対して、線形和表現音声素
片データベースに記憶されている係数とコードブックを
参照して得た波形から線形和を求め、合成パラメータを
得るコードブック参照部と、アクセント情報にしたがっ
てピッチ周波数を生成する韻律生成部と、合成パラメー
タとピッチ周波数とに基づいて合成音声を生成する合成
部とを備えている。そのため、ピッチ同期の波形利用の
合成方式において、複数のコードベクトルの線形和表現
からなる音声素片を用意することにより、フレーム毎単
一コードの音声素片に比べ、より詳細な波形合成を可能
とし、より自然性の高い合成音声の提供が可能となる。

【０１１７】また、乱数を発生する乱数発生器をさらに
有し、コードブック参照部は、線形和表現音声素片デー
タベースに記憶されている係数に乱数発生器による乱数
を加算し、係数とコードブックを参照して得た波形から
線形和を求め、合成パラメータを得る乱数利用コードブ
ック参照部である。そのため、ピッチ同期の波形利用の
合成方式において、複数のコードベクトルの線形和表現
からなる音声素片を用意することにより、フレーム毎単
一コードの音声素片に比べ、より詳細な波形合成を可能
とし、さらに乱数を利用することでゆらぎの影響を取り
入れた、より自然性の高い合成音声の提供が可能とな
る。

【０１１８】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、線形和表現音声
素片データベースは、音声素片列を低周波成分コードブ
ックおよび高周波成分コードブックのコードベクトル線
形和表現で記憶し、コードブック参照部は、線形和表現
音声素片データベースに記憶されている係数と低周波成
分コードブックおよび高周波成分コードブックを参照し
て得た波形から線形和を求め合成パラメータを得る。そ
のため、ピッチ同期の波形利用の合成方式において、複
数のコードベクトルの線形和表現からなる音声素片を用
意することにより、フレーム毎単一コードの音声素片に
比べ、より詳細な波形合成を可能とし、低周波成分と高
周波成分とを分離することでゆらぎを考慮した波形合成
を可能とし、より自然性の高い合成音声の提供が可能と
なる。

【０１１９】また、コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、乱数利用コード
ブック参照部は、線形和表現音声素片データベースに記
憶されている係数に乱数発生器による乱数を加算し、係
数と低周波成分コードブックおよび高周波成分コードブ
ックを参照して得た波形から線形和を求め合成パラメー
タを得る。そのため、ピッチ同期の波形利用の合成方式
において、複数のコードベクトルの線形和表現からなる
音声素片を用意することにより、フレーム毎単一コード
の音声素片に比べ、より詳細な波形合成を可能とし、低
周波成分と高周波成分とを分離し、さらに乱数を利用す
ることでゆらぎの影響を取り入れた、より自然性の高い
合成音声の提供が可能となる。

【０１２０】さらに、コードブックは、有声音波形を低
周波成分と高周波成分に分離した時の低周波成分波形の
ベクトル量子化コードブックである低周波成分コードブ
ックと、同じく、有声音波形を低周波成分と高周波成分
に分離した時の高周波成分波形のベクトル量子化コード
ブックである高周波成分コードブックとからなり、乱数
利用コードブック参照部は、線形和表現音声素片データ
ベースに記憶されている高周波成分コードの係数に乱数
発生器による乱数を加算し、係数と低周波成分コードブ
ックおよび高周波成分コードブックを参照して得た波形
から線形和を求め合成パラメータを得る。そのため、ピ
ッチ同期の波形利用の合成方式において、複数のコード
ベクトルの線形和表現からなる音声素片を用意すること
により、フレーム毎単一コードの音声素片に比べ、より
詳細な波形合成を可能とし、低周波成分と高周波成分と
を分離し、さらにゆらぎの影響が強い高周波成分につい
て乱数を利用することで、より自然性の高い合成音声の
提供が可能となる。

【図面の簡単な説明】

【図１】この発明の音声合成装置を示すブロック図で
ある。

【図２】音声素片データベースの内容例を示した図で
ある。

【図３】この発明の音声合成装置の他の例を示すブロ
ック図である。

【図４】移動加算部、および韻律制御移動加算部の加
算方式の例を示した説明図である。

【図５】この発明の音声合成装置の他の例を示すブロ
ック図である。

【図６】この発明の音声合成装置の他の例を示すブロ
ック図である。

【図７】この発明の音声合成装置の他の例を示すブロ
ック図である。

【図８】この発明の音声合成装置の他の例を示すブロ
ック図である。

【図９】頻度情報付き音声素片データベースの内容例
を示した図である。

【図１０】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１１】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１２】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１３】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１４】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１５】線形和表現音声素片データベースの内容例
を示した図である。

【図１６】この発明の音声合成装置の他の例を示すブ
ロック図である。

【図１７】従来の音声合成装置の一構成例を示すブロ
ック図である。

【図１８】従来の音声合成装置の他の例を示すブロッ
ク図である。

【符号の説明】

２言語処理部、５韻律生成部、８低周波成分コー
ドブック、９高周波成分コードブック、１０素片読
み出し部、１１音声素片データベース、１２コードブ
ック参照加算部（コードブック参照部）、１４合成
部、１６コードブック参照部、１９移動加算部、２
０韻律制御移動加算部、２１振幅比率制御加算部、
２２振幅比率ピッチ制御加算部、２３頻度情報付き
音声素片データベース、２４コードブック、２５素
片読み出し重み付け選択部、２６線形和表現音声素片デ
ータベース、２７乱数発生器。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平７−141000（ＪＰ，Ａ) 特開平９−204192（ＪＰ，Ａ) 特開平10−247097（ＪＰ，Ａ) 特開平８−335096（ＪＰ，Ａ) 特開平10−143196（ＪＰ，Ａ) 特開平５−73100（ＪＰ，Ａ) 特開平７−20894（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 13/08 G10L 13/06

Claims

(57)【特許請求の範囲】

【請求項１】音声素片を記憶する音声素片データベー
スと、有声音波形を低周波成分と高周波成分に分離した時の低
周波成分波形のベクトル量子化コードブックである低周
波成分コードブックと、有声音波形を低周波成分と高周波成分に分離した時の高
周波成分波形のベクトル量子化コードブックである高周
波成分コードブックと、入力されたテキストから音素列およびアクセント情報を
得る言語処理部と、上記音素列にしたがって上記音声素片を上記音声素片デ
ータベースから読み出す素片読み出し部と、上記素片読み出し部の読み出した上記音声素片に基づい
て、上記低周波成分コードブック及び上記高周波成分コ
ードブックの各々から低周波成分波形及び高周波成分波
形を選択するコードブック参照部と、選択された上記低周波成分波形と上記高周波成分波形と
を加算し合成パラメータを得る加算部と、上記アクセント情報にしたがってピッチ周波数を生成す
る韻律生成部と、上記合成パラメータと上記ピッチ周波数とに基づいて合
成音声を生成する合成部とを備えたことを特徴とする音
声合成装置。
【請求項２】上記コードブック参照部は、上記高周波
成分コードブックから１ピッチ毎に異なる上記高周波成
分波形を選択することを特徴とする請求項１記載の音声
合成装置。
【請求項３】上記加算部は、上記低周波成分波形を時
間軸に配置する際、基準位置に対して、上記高周波成分
波形の配置位置を１ピッチ毎に変化させて、該低周波成
分波形と該高周波成分波形とを加算する移動加算部であ
ることを特徴とする請求項１または２記載の音声合成装
置。
【請求項４】上記加算部は、上記低周波成分波形の基
準位置に対する上記高周波成分波形の配置位置の平均変
化幅を、入力ピッチまたはパワーに応じて変化させて、
該低周波成分波形と該高周波成分波形とを加算する韻律
制御移動加算部であることを特徴とする請求項１または
２記載の音声合成装置。
【請求項５】上記加算部は、加算される上記低周波成
分波形と上記高周波成分波形の振幅比率を、１ピッチ毎
に変化させ、該低周波成分波形と該高周波成分波形とを
加算する振幅比率制御加算部であることを特徴とする請
求項１または２記載の音声合成装置。
【請求項６】上記加算部は、上記低周波成分波形と上
記高周波成分波形の振幅比率を、入力ピッチまたはパワ
ーに応じて変化させ、該低周波成分波形と該高周波成分
波形とを加算する振幅比率ピッチ制御移動加算部である
ことを特徴とする請求項１または２記載の音声合成装
置。
【請求項７】音声素片と有声音波形ベクトル量子化に
よるコードブックのコード出現頻度とを記憶する頻度情
報付き音声素片データベースと、有声音波形ベクトル量子化コードブックであるコードブ
ックと、入力されたテキストから音素列およびアクセント情報を
得る言語処理部と、上記頻度情報付き音声素片データベースに記載されてい
る上記音声素片を上記出現頻度と共に読み出す素片読み
出し部と、上記音声素片について、上記コードブックを参照して、
上記出現頻度に基づいて合成パラメータを得るコードブ
ック参照部と、上記アクセント情報にしたがってピッチ周波数を生成す
る韻律生成部と、上記合成パラメータと上記ピッチ周波数とに基づいて合
成音声を生成する合成部とを備えたことを特徴とする音
声合成装置。
【請求項８】上記コードブック参照部は、上記音声素
片に記載される上記出現頻度からコードベクトルの出現
比率を求め、音声素片に記述されたコードの中で該出現
比率の上位から複数個を選んで上記コードブックを参照
し、読み出されて得た各波形を出現比率に応じた重み付
けをして加算し、合成パラメータを得るコードブック参
照部であることを特徴とする請求項７記載の音声合成装
置。
【請求項９】上記コードブックは、有声音波形を低周
波成分と高周波成分に分離した時の低周波成分波形のベ
クトル量子化コードブックである低周波成分コードブッ
クと、有声音波形を低周波成分と高周波成分に分離した
時の高周波成分波形のベクトル量子化コードブックであ
る高周波成分コードブックとからなり、上記頻度情報付き音声素片データベースは、上記音声素
片と共に低周波コードベクトルの出現頻度および高周波
コードベクトルの出現頻度を記憶し、上記コードブック参照部は、上記音声素片に記載される
上記出現頻度から低周波コードベクトルおよび高周波コ
ードベクトルの出現比率を求め、音声素片に記述された
コードの内で該出現比率の上位から複数個を選んで上記
低周波コードブックおよび高周波コードブックを参照
し、読み出されて得た各波形を出現比率に応じた重み付
けをして加算し、合成パラメータを得るコードブック参
照部であることを特徴とする請求項７記載の音声合成装
置。
【請求項１０】音声素片列をコードブックのコードベ
クトル線形和表現で記憶した線形和表現音声素片データ
ベースと、有声音波形ベクトル量子化コードブックであるコードブ
ックと、入力されたテキストから音素列およびアクセント情報を
得る言語処理部と、上記音素列にしたがって上記音声素片列を上記線形和表
現音声素片データベースから読み出す素片読み出し部
と、上記音声素片列に対して、上記線形和表現音声素片デー
タベースに記憶されている係数とコードブックを参照し
て得た波形から線形和を求め、合成パラメータを得るコ
ードブック参照部と、上記アクセント情報にしたがってピッチ周波数を生成す
る韻律生成部と、上記合成パラメータと上記ピッチ周波数とに基づいて合
成音声を生成する合成部とを備え、乱数を発生する乱数発生器をさらに有し、上記コードブック参照部は、上記線形和表現音声素片デ
ータベースに記憶されている係数に上記乱数発生器によ
る乱数を加算し、係数とコードブックを参照して得た波
形から線形和を求め、合成パラメータを得る乱数利用コ
ードブック参照部であることを特徴とする音声合成装
置。
【請求項１１】音声素片列をコードブックのコードベ
クトル線形和表現で記憶した線形和表現音声素片データ
ベースと、有声音波形ベクトル量子化コードブックであるコードブ
ックと、入力されたテキストから音素列およびアクセント情報を
得る言語処理部と、上記音素列にしたがって上記音声素片列を上記線形和表
現音声素片データベースから読み出す素片読み出し部
と、上記音声素片列に対して、上記線形和表現音声素片デー
タベースに記憶されている係数とコードブックを参照し
て得た波形から線形和を求め、合成パラメータを得るコ
ードブック参照部と、上記アクセント情報にしたがってピッチ周波数を生成す
る韻律生成部と、上記合成パラメータと上記ピッチ周波数とに基づいて合
成音声を生成する合成部とを備え、上記コードブックは、有声音波形を低周波成分と高周波
成分に分離した時の低周波成分波形のベクトル量子化コ
ードブックである低周波成分コードブックと、有声音波
形を低周波成分と高周波成分に分離した時の高周波成分
波形のベクトル量子化コードブックである高周波成分コ
ードブックとからなり、上記線形和表現音声素片データベースは、音声素片列を
上記低周波成分コードブックおよび上記高周波成分コー
ドブックのコードベクトル線形和表現で記憶し、上記コードブック参照部は、上記線形和表現音声素片デ
ータベースに記憶されている係数と低周波成分コードブ
ックおよび高周波成分コードブックを参照して得た波形
から線形和を求め合成パラメータを得ることを特徴とす
る音声合成装置。
【請求項１２】上記コードブックは、有声音波形を低
周波成分と高周波成分に分離した時の低周波成分波形の
ベクトル量子化コードブックである低周波成分コードブ
ックと、有声音波形を低周波成分と高周波成分に分離し
た時の高周波成分波形のベクトル量子化コードブックで
ある高周波成分コードブックとからなり、上記乱数利用コードブック参照部は、上記線形和表現音
声素片データベースに記憶されている係数に上記乱数発
生器による乱数を加算し、係数と低周波成分コードブッ
クおよび高周波成分コードブックを参照して得た波形か
ら線形和を求め合成パラメータを得ることを特徴とする
請求項１０記載の音声合成装置。
【請求項１３】上記コードブックは、有声音波形を低
周波成分と高周波成分に分離した時の低周波成分波形の
ベクトル量子化コードブックである低周波成分コードブ
ックと、同じく、有声音波形を低周波成分と高周波成分
に分離した時の高周波成分波形のベクトル量子化コード
ブックである高周波成分コードブックとからなり、上記乱数利用コードブック参照部は、上記線形和表現音
声素片データベースに記憶されている高周波成分コード
の係数に上記乱数発生器による乱数を加算し、係数と低
周波成分コードブックおよび高周波成分コードブックを
参照して得た波形から線形和を求め合成パラメータを得
ることを特徴とする請求項１０記載の音声合成装置。