[go: up one dir, main page]

CN100416651C - 混合参数模式的语音合成系统及方法 - Google Patents

混合参数模式的语音合成系统及方法 Download PDF

Info

Publication number
CN100416651C
CN100416651C CNB2005100051451A CN200510005145A CN100416651C CN 100416651 C CN100416651 C CN 100416651C CN B2005100051451 A CNB2005100051451 A CN B2005100051451A CN 200510005145 A CN200510005145 A CN 200510005145A CN 100416651 C CN100416651 C CN 100416651C
Authority
CN
China
Prior art keywords
indirect
parameter group
parameter
unit
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100051451A
Other languages
English (en)
Other versions
CN1811913A (zh
Inventor
鲁弘茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sunplus Technology Co Ltd
Original Assignee
Sunplus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sunplus Technology Co Ltd filed Critical Sunplus Technology Co Ltd
Priority to CNB2005100051451A priority Critical patent/CN100416651C/zh
Publication of CN1811913A publication Critical patent/CN1811913A/zh
Application granted granted Critical
Publication of CN100416651C publication Critical patent/CN100416651C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

一种混合参数模式的语音合成系统包括样本单元语料库、间接单元语料库、合成参数资料库及语音合成器。样本单元语料库储存多个样本语音单元;间接单元语料库储存部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;合成参数资料库储存各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一个基本参数组或间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的对应的部分合成语音的间接参数序列;语音合成器用以从该合成参数资料库取出一输入文字的合成语音的参数序列,从而根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。

Description

混合参数模式的语音合成系统及方法
技术领域
本发明涉及一种语音合成系统,特别是涉及一种混合参数模式的语音合成系统。
背景技术
在语音合成方案中,如果想要合成的语料是固定的,通常为了提升合成的品质,在实际中可以先将合成参数调节到最佳,之后将所有的参数储存起来。如图1所示的语音合成系统,在一合成参数资料库11中储存有各种合成语音的参数序列111,其中,每一参数序列111包含了其合成语音的至少一参数组112,每一参数组112包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等,当想要合成一输入文字W时,语音合成器12从该合成参数资料库11中取出此输入文字W的合成语音的参数序列111,根据此参数序列111的每一参数组112所包含的语音单元的代码ux,从一储存有预先录制的样本语音单元Ux的样本单元语料库13中取出对应的样本语音单元Ux,从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元Ux合成而输出合成语音信号s(t)。
举例而言,当输入文字W为“addition”时,语音合成器12从该合成参数资料库11中取出“addition”的合成语音的参数序列{(u1,…)(u2,…)(u3,…)(u4,…)(u5,…)},其中,(ui,…)为一参数组,ui为语音单元的代码,而根据此参数序列的每一参数组所包含的语音单元的代码u1~u5,从样本单元语料库13中取出对应的样本语音单元U1~U5(分别为a、di、t、io、n的发音),而将其合成而输出合成语音信号s(t)=synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5),其中,synth()代表合成器,&代表语音信号在时间上的连接。
在前述的语音合成系统中,由于语音信号的统计特性并不是一个均匀分布,例如,某一种特定发音模式会常常出现,所以直接在合成参数资料库11储存合成参数的做法显然缺乏效率,而有必要对其进行改善。
发明内容
本发明的主要目的在于提供一种混合参数模式的语音合成系统,从而能降低合成参数所需的存储空间,并且增加样本单元语料库的样本语音。
根据本发明的一个方面,提出一种混合参数模式的语音合成系统,其包括一样本单元语料库、一间接单元语料库、一合成参数资料库及一语音合成器。该样本单元语料库储存预先录制的多个样本语音单元;该间接单元语料库储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;该合成参数资料库储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组或间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列;该语音合成器用以从该合成参数资料库中取出一输入文字的合成语音的参数序列,以根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。
根据本发明的另一方面,提出一种在一语音合成系统中的混合参数模式的语音合成方法,该方法包括步骤:(A)根据一输入文字,从该合成参数资料库中取出此输入文字的合成语音的参数序列;(B)根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列;以及(C)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,以根据此合并的基本参数组进行语音合成。
附图说明
图1为公知的语音合成系统的结构图。
图2为本发明的混合参数模式的语音合成系统的结构图。
图3为本发明的混合参数模式的语音合成方法的流程图。
图4显示语音合成的一范例。
具体实施方式
有关本发明的混合参数模式的语音合成系统,请先参照图2所示的系统结构图,其主要包括:一合成参数资料库21、一语音合成器22、一样本单元语料库23及一间接单元语料库24。其中,前述合成参数资料库21中储存有各种合成语音的参数序列211,每一参数序列211包含了其合成语音的至少一参数组。前述样本单元语料库23储存有预先录制的多个样本语音单元U1~Ux。前述间接单元语料库24储存有各种部分合成语音的间接参数序列241,其中,本发明以统计方法将常用的合成参数序列(对应一部分合成语音)视为一个间接单元,并将这些常用的合成参数序列储存为一间接参数序列241,每一间接参数序列241包含了其部分合成语音的多个基本参数组212、及/或其它间接参数组213,每一基本参数组212包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等。
藉由提供该间接单元语料库24,前述合成参数资料库21的合成语音的参数序列211所包含参数组可为一基本参数组212或一间接参数组213,每一基本参数组212包含所要选取的语音单元Ux的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等,每一间接参数组213代表在该间接单元语料库24中的一对应的部分合成语音的间接参数序列241。因此,在合成参数资料库21中,对于一包含有对应于间接参数序列241的部分合成语音的合成语音而言,其所储存的参数序列211是由基本参数组212及对应该间接参数序列241的间接参数组213所构成,而非全由基本参数组212所构成,因此可减少合成参数资料库21的资料量。
前述语音合成器22为一信号处理器,如图3所示,当想要合成一输入文字W时(步骤S31),语音合成器22从该合成参数资料库21中取出此输入文字W的合成语音的参数序列211(步骤S32),其中,参数序列211中的参数组如存在于样本单元语料库23中,则此参数组为基本参数组212,否则为间接参数组213。而根据此参数序列211的每一间接参数组213,从间接单元语料库24中取出对应的部分合成语音的间接参数序列241(步骤S33),并将此间接参数序列241所包含的基本参数组212并入前述参数序列211的基本参数组212中(步骤S34),再依此合并的基本参数组212所包含的语音单元的代码ux,从样本单元语料库23中取出对应的样本语音单元Ux,从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元Ux合成而输出合成语音信号s(t)(步骤S35)。
如图4的范例所示,当想要合成的输入文字为“addition”时,语音合成器22从该合成参数资料库21中取出“addition”的合成语音的参数序列{(u1,…)(u2,…)(u9,…)},由于此参数序列中的语音单元的代码u9不存在于样本单元语料库23中,因此可知(u9,…)为一间接参数组213,而从间接单元语料库24中取出对应的部分合成语音(“tion”)的间接参数序列{(u3,…)(u4,…)(u5,…)},并将此间接参数序列241所包含的基本参数组(u3,…)、(u4,…)及(u5,…)并入前述参数序列211的基本参数组(u1,…)及(u2,…)中,再根据此合并的基本参数组(u1,…)、(u2,…)、(u3,…)、(u4,…)及(u5,…)所包含的语音单元的代码u1~u5,从样本单元语料库23中取出对应的样本语音单元U1~U5,从而在对应的语音单元能量变化、语音单元时长变化、及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号s(t)=synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5),其中,synth()代表合成器,&代表语音信号在时间上的连接。
由前述的说明及范例可知,本发明将常用的部分合成语音的参数予以组成一间接参数序列,并将其储存下来成为间接单元语料库24。在实际应用时,系统先判断合成语音的参数序列中的参数组是否为一间接参数组,若此参数组为基本参数组时,直接到样本单元语料库23直接提取样本语音单元,并根据其参数组的元素合成;假设此参数组为一间接参数组时,则先根据间接单元语料库24将其还原成为基本参数序列,之后才根据基本参数组的方式合成成为语音信号。据此,对于许多部分相同的合成语音信号而言,例如“addition”及“insertion”,相同的部分(“tion”)将以间接参数序列的形式存在于间接单元语料库24,而在合成参数资料库21只需储存简单的间接参数组,因而可以降低合成参数所需的储存空间,并且增加样本单元语料库的样本语音,此外,间接参数序列241中也可以包含其它间接参数组,以重复前述的方式将其还原成为基本参数序列,如此,可进一步强化本发明的效果。
上述实施例仅为了方便说明而举例而已,本发明所申请的保护范围应以权利要求书中所述为准,而非仅限于上述实施例。

Claims (10)

1. 一种混合参数模式的语音合成系统,包括:
一样本单元语料库,其储存预先录制的多个语音单元;
一间接单元语料库,其储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;
一合成参数资料库,储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列;以及
一语音合成器,用以从该合成参数资料库中取出一输入文字的合成语音的参数序列,从而根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。
2. 根据权利要求1所述的系统,其中,该语音合成器根据合并的基本参数组所包含的语音单元的代码,而从该样本单元语料库中取出对应的样本语音单元,以将所有取出的语音单元合成而输出合成语音信号。
3. 根据权利要求1所述的系统,其中,每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。
4. 如权利要求3所述的系统,其中,该语音合成器在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号。
5. 根据权利要求1所述的系统,其中,每一间接参数序列还包含其它间接参数组。
6. 一种在一语音合成系统中的混合参数模式的语音合成方法,该语音合成系统包括一样本单元语料库、一间接单元语料库及一合成参数资料库,该样本单元语料库储存有预先录制的多个语音单元,该间接单元语料库储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组,该合成参数资料库储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列,该方法包括:
(I)根据一输入文字,从该合成参数资料库中取出此输入文字的合成语音的参数序列;
(II)根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列;以及
(III)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,以根据此合并的基本参数组进行语音合成。
7. 根据权利要求6所述的方法,其中,在步骤(III)中,进行语音合成是根据合并的基本参数组所包含的语音单元的代码,从该样本单元语料库中取出对应的样本语音单元,而将所有取出的语音单元合成而输出合成语音信号。
8. 根据权利要求6所述的方法,其中,每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。
9. 根据权利要求8所述的方法,其中,在步骤(III)中,进行语音合成是在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号。
10. 根据权利要求6所述的方法,其中,每一间接参数序列还包含其它间接参数组。
CNB2005100051451A 2005-01-28 2005-01-28 混合参数模式的语音合成系统及方法 Expired - Fee Related CN100416651C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100051451A CN100416651C (zh) 2005-01-28 2005-01-28 混合参数模式的语音合成系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100051451A CN100416651C (zh) 2005-01-28 2005-01-28 混合参数模式的语音合成系统及方法

Publications (2)

Publication Number Publication Date
CN1811913A CN1811913A (zh) 2006-08-02
CN100416651C true CN100416651C (zh) 2008-09-03

Family

ID=36844796

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100051451A Expired - Fee Related CN100416651C (zh) 2005-01-28 2005-01-28 混合参数模式的语音合成系统及方法

Country Status (1)

Country Link
CN (1) CN100416651C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110517662A (zh) * 2019-07-12 2019-11-29 云知声智能科技股份有限公司 一种智能语音播报的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471025A (zh) * 2002-07-25 2004-01-28 摩托罗拉公司 使用韵律控制的中文文本至语音拼接合成系统及方法
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471025A (zh) * 2002-07-25 2004-01-28 摩托罗拉公司 使用韵律控制的中文文本至语音拼接合成系统及方法
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム

Also Published As

Publication number Publication date
CN1811913A (zh) 2006-08-02

Similar Documents

Publication Publication Date Title
JP5293460B2 (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
JP5471858B2 (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
CN109389968B (zh) 基于双音节混搭的波形拼接方法、装置、设备及存储介质
CN105845125B (zh) 语音合成方法和语音合成装置
CN102687197B (zh) 声音识别用词典制作装置、声音识别装置及声音合成装置
EP1071074A3 (en) Speech synthesis employing prosody templates
CN108831437A (zh) 一种歌声生成方法、装置、终端和存储介质
US20050256716A1 (en) System and method for generating customized text-to-speech voices
CN105261355A (zh) 一种语音合成方法和装置
CN1758330A (zh) 用于通过交互式话音响应系统防止语音理解的方法和设备
CN113053357B (zh) 语音合成方法、装置、设备和计算机可读存储介质
CN101901598A (zh) 一种哼唱合成方法和系统
CN105513607A (zh) 一种谱曲作词的方法和装置
CN100416651C (zh) 混合参数模式的语音合成系统及方法
JP2013164609A (ja) 歌唱合成用データベース生成装置、およびピッチカーブ生成装置
KR102643902B1 (ko) 회의록 관리 방법 및 장치
CN105719641B (zh) 用于波形拼接语音合成的选音方法和装置
CN105890612A (zh) 一种导航过程中的语音提示方法及装置
CN1238805C (zh) 用于压缩语音库的方法和装置
TWI260582B (en) Speech synthesizer with mixed parameter mode and method thereof
JP4286583B2 (ja) 波形辞書作成支援システムおよびプログラム
CN104395956A (zh) 声音合成的方法和系统
CN104464717A (zh) 声音合成装置
US9905218B2 (en) Method and apparatus for exemplary diphone synthesizer
EP1668630A1 (en) Improvements to an utterance waveform corpus

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080903

Termination date: 20160128

EXPY Termination of patent right or utility model