CN100416651C - 混合参数模式的语音合成系统及方法 - Google Patents
混合参数模式的语音合成系统及方法 Download PDFInfo
- Publication number
- CN100416651C CN100416651C CNB2005100051451A CN200510005145A CN100416651C CN 100416651 C CN100416651 C CN 100416651C CN B2005100051451 A CNB2005100051451 A CN B2005100051451A CN 200510005145 A CN200510005145 A CN 200510005145A CN 100416651 C CN100416651 C CN 100416651C
- Authority
- CN
- China
- Prior art keywords
- indirect
- parameter group
- parameter
- unit
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
一种混合参数模式的语音合成系统包括样本单元语料库、间接单元语料库、合成参数资料库及语音合成器。样本单元语料库储存多个样本语音单元;间接单元语料库储存部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;合成参数资料库储存各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一个基本参数组或间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的对应的部分合成语音的间接参数序列;语音合成器用以从该合成参数资料库取出一输入文字的合成语音的参数序列,从而根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。
Description
技术领域
本发明涉及一种语音合成系统,特别是涉及一种混合参数模式的语音合成系统。
背景技术
在语音合成方案中,如果想要合成的语料是固定的,通常为了提升合成的品质,在实际中可以先将合成参数调节到最佳,之后将所有的参数储存起来。如图1所示的语音合成系统,在一合成参数资料库11中储存有各种合成语音的参数序列111,其中,每一参数序列111包含了其合成语音的至少一参数组112,每一参数组112包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等,当想要合成一输入文字W时,语音合成器12从该合成参数资料库11中取出此输入文字W的合成语音的参数序列111,根据此参数序列111的每一参数组112所包含的语音单元的代码ux,从一储存有预先录制的样本语音单元Ux的样本单元语料库13中取出对应的样本语音单元Ux,从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元Ux合成而输出合成语音信号s(t)。
举例而言,当输入文字W为“addition”时,语音合成器12从该合成参数资料库11中取出“addition”的合成语音的参数序列{(u1,…)(u2,…)(u3,…)(u4,…)(u5,…)},其中,(ui,…)为一参数组,ui为语音单元的代码,而根据此参数序列的每一参数组所包含的语音单元的代码u1~u5,从样本单元语料库13中取出对应的样本语音单元U1~U5(分别为a、di、t、io、n的发音),而将其合成而输出合成语音信号s(t)=synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5),其中,synth()代表合成器,&代表语音信号在时间上的连接。
在前述的语音合成系统中,由于语音信号的统计特性并不是一个均匀分布,例如,某一种特定发音模式会常常出现,所以直接在合成参数资料库11储存合成参数的做法显然缺乏效率,而有必要对其进行改善。
发明内容
本发明的主要目的在于提供一种混合参数模式的语音合成系统,从而能降低合成参数所需的存储空间,并且增加样本单元语料库的样本语音。
根据本发明的一个方面,提出一种混合参数模式的语音合成系统,其包括一样本单元语料库、一间接单元语料库、一合成参数资料库及一语音合成器。该样本单元语料库储存预先录制的多个样本语音单元;该间接单元语料库储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;该合成参数资料库储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组或间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列;该语音合成器用以从该合成参数资料库中取出一输入文字的合成语音的参数序列,以根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。
根据本发明的另一方面,提出一种在一语音合成系统中的混合参数模式的语音合成方法,该方法包括步骤:(A)根据一输入文字,从该合成参数资料库中取出此输入文字的合成语音的参数序列;(B)根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列;以及(C)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,以根据此合并的基本参数组进行语音合成。
附图说明
图1为公知的语音合成系统的结构图。
图2为本发明的混合参数模式的语音合成系统的结构图。
图3为本发明的混合参数模式的语音合成方法的流程图。
图4显示语音合成的一范例。
具体实施方式
有关本发明的混合参数模式的语音合成系统,请先参照图2所示的系统结构图,其主要包括:一合成参数资料库21、一语音合成器22、一样本单元语料库23及一间接单元语料库24。其中,前述合成参数资料库21中储存有各种合成语音的参数序列211,每一参数序列211包含了其合成语音的至少一参数组。前述样本单元语料库23储存有预先录制的多个样本语音单元U1~Ux。前述间接单元语料库24储存有各种部分合成语音的间接参数序列241,其中,本发明以统计方法将常用的合成参数序列(对应一部分合成语音)视为一个间接单元,并将这些常用的合成参数序列储存为一间接参数序列241,每一间接参数序列241包含了其部分合成语音的多个基本参数组212、及/或其它间接参数组213,每一基本参数组212包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等。
藉由提供该间接单元语料库24,前述合成参数资料库21的合成语音的参数序列211所包含参数组可为一基本参数组212或一间接参数组213,每一基本参数组212包含所要选取的语音单元Ux的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等,每一间接参数组213代表在该间接单元语料库24中的一对应的部分合成语音的间接参数序列241。因此,在合成参数资料库21中,对于一包含有对应于间接参数序列241的部分合成语音的合成语音而言,其所储存的参数序列211是由基本参数组212及对应该间接参数序列241的间接参数组213所构成,而非全由基本参数组212所构成,因此可减少合成参数资料库21的资料量。
前述语音合成器22为一信号处理器,如图3所示,当想要合成一输入文字W时(步骤S31),语音合成器22从该合成参数资料库21中取出此输入文字W的合成语音的参数序列211(步骤S32),其中,参数序列211中的参数组如存在于样本单元语料库23中,则此参数组为基本参数组212,否则为间接参数组213。而根据此参数序列211的每一间接参数组213,从间接单元语料库24中取出对应的部分合成语音的间接参数序列241(步骤S33),并将此间接参数序列241所包含的基本参数组212并入前述参数序列211的基本参数组212中(步骤S34),再依此合并的基本参数组212所包含的语音单元的代码ux,从样本单元语料库23中取出对应的样本语音单元Ux,从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元Ux合成而输出合成语音信号s(t)(步骤S35)。
如图4的范例所示,当想要合成的输入文字为“addition”时,语音合成器22从该合成参数资料库21中取出“addition”的合成语音的参数序列{(u1,…)(u2,…)(u9,…)},由于此参数序列中的语音单元的代码u9不存在于样本单元语料库23中,因此可知(u9,…)为一间接参数组213,而从间接单元语料库24中取出对应的部分合成语音(“tion”)的间接参数序列{(u3,…)(u4,…)(u5,…)},并将此间接参数序列241所包含的基本参数组(u3,…)、(u4,…)及(u5,…)并入前述参数序列211的基本参数组(u1,…)及(u2,…)中,再根据此合并的基本参数组(u1,…)、(u2,…)、(u3,…)、(u4,…)及(u5,…)所包含的语音单元的代码u1~u5,从样本单元语料库23中取出对应的样本语音单元U1~U5,从而在对应的语音单元能量变化、语音单元时长变化、及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号s(t)=synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5),其中,synth()代表合成器,&代表语音信号在时间上的连接。
由前述的说明及范例可知,本发明将常用的部分合成语音的参数予以组成一间接参数序列,并将其储存下来成为间接单元语料库24。在实际应用时,系统先判断合成语音的参数序列中的参数组是否为一间接参数组,若此参数组为基本参数组时,直接到样本单元语料库23直接提取样本语音单元,并根据其参数组的元素合成;假设此参数组为一间接参数组时,则先根据间接单元语料库24将其还原成为基本参数序列,之后才根据基本参数组的方式合成成为语音信号。据此,对于许多部分相同的合成语音信号而言,例如“addition”及“insertion”,相同的部分(“tion”)将以间接参数序列的形式存在于间接单元语料库24,而在合成参数资料库21只需储存简单的间接参数组,因而可以降低合成参数所需的储存空间,并且增加样本单元语料库的样本语音,此外,间接参数序列241中也可以包含其它间接参数组,以重复前述的方式将其还原成为基本参数序列,如此,可进一步强化本发明的效果。
上述实施例仅为了方便说明而举例而已,本发明所申请的保护范围应以权利要求书中所述为准,而非仅限于上述实施例。
Claims (10)
1. 一种混合参数模式的语音合成系统,包括:
一样本单元语料库,其储存预先录制的多个语音单元;
一间接单元语料库,其储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组;
一合成参数资料库,储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列;以及
一语音合成器,用以从该合成参数资料库中取出一输入文字的合成语音的参数序列,从而根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列,以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,而根据此合并的基本参数组进行语音合成。
2. 根据权利要求1所述的系统,其中,该语音合成器根据合并的基本参数组所包含的语音单元的代码,而从该样本单元语料库中取出对应的样本语音单元,以将所有取出的语音单元合成而输出合成语音信号。
3. 根据权利要求1所述的系统,其中,每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。
4. 如权利要求3所述的系统,其中,该语音合成器在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号。
5. 根据权利要求1所述的系统,其中,每一间接参数序列还包含其它间接参数组。
6. 一种在一语音合成系统中的混合参数模式的语音合成方法,该语音合成系统包括一样本单元语料库、一间接单元语料库及一合成参数资料库,该样本单元语料库储存有预先录制的多个语音单元,该间接单元语料库储存有各种部分合成语音的间接参数序列,每一间接参数序列包含了其部分合成语音的多个基本参数组,该合成参数资料库储存有各种合成语音的参数序列,每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组,每一基本参数组包含所要选取的语音单元的代码,每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列,该方法包括:
(I)根据一输入文字,从该合成参数资料库中取出此输入文字的合成语音的参数序列;
(II)根据该参数序列的每一间接参数组,从该间接单元语料库中取出对应的部分合成语音的间接参数序列;以及
(III)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中,以根据此合并的基本参数组进行语音合成。
7. 根据权利要求6所述的方法,其中,在步骤(III)中,进行语音合成是根据合并的基本参数组所包含的语音单元的代码,从该样本单元语料库中取出对应的样本语音单元,而将所有取出的语音单元合成而输出合成语音信号。
8. 根据权利要求6所述的方法,其中,每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。
9. 根据权利要求8所述的方法,其中,在步骤(III)中,进行语音合成是在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下,将所有取出的语音单元合成而输出合成语音信号。
10. 根据权利要求6所述的方法,其中,每一间接参数序列还包含其它间接参数组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100051451A CN100416651C (zh) | 2005-01-28 | 2005-01-28 | 混合参数模式的语音合成系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100051451A CN100416651C (zh) | 2005-01-28 | 2005-01-28 | 混合参数模式的语音合成系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1811913A CN1811913A (zh) | 2006-08-02 |
CN100416651C true CN100416651C (zh) | 2008-09-03 |
Family
ID=36844796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100051451A Expired - Fee Related CN100416651C (zh) | 2005-01-28 | 2005-01-28 | 混合参数模式的语音合成系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100416651C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517662A (zh) * | 2019-07-12 | 2019-11-29 | 云知声智能科技股份有限公司 | 一种智能语音播报的方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471025A (zh) * | 2002-07-25 | 2004-01-28 | 摩托罗拉公司 | 使用韵律控制的中文文本至语音拼接合成系统及方法 |
WO2004109659A1 (ja) * | 2003-06-05 | 2004-12-16 | Kabushiki Kaisha Kenwood | 音声合成装置、音声合成方法及びプログラム |
-
2005
- 2005-01-28 CN CNB2005100051451A patent/CN100416651C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471025A (zh) * | 2002-07-25 | 2004-01-28 | 摩托罗拉公司 | 使用韵律控制的中文文本至语音拼接合成系统及方法 |
WO2004109659A1 (ja) * | 2003-06-05 | 2004-12-16 | Kabushiki Kaisha Kenwood | 音声合成装置、音声合成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN1811913A (zh) | 2006-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
CN109389968B (zh) | 基于双音节混搭的波形拼接方法、装置、设备及存储介质 | |
CN105845125B (zh) | 语音合成方法和语音合成装置 | |
CN102687197B (zh) | 声音识别用词典制作装置、声音识别装置及声音合成装置 | |
EP1071074A3 (en) | Speech synthesis employing prosody templates | |
CN108831437A (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
US20050256716A1 (en) | System and method for generating customized text-to-speech voices | |
CN105261355A (zh) | 一种语音合成方法和装置 | |
CN1758330A (zh) | 用于通过交互式话音响应系统防止语音理解的方法和设备 | |
CN113053357B (zh) | 语音合成方法、装置、设备和计算机可读存储介质 | |
CN101901598A (zh) | 一种哼唱合成方法和系统 | |
CN105513607A (zh) | 一种谱曲作词的方法和装置 | |
CN100416651C (zh) | 混合参数模式的语音合成系统及方法 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
KR102643902B1 (ko) | 회의록 관리 방법 및 장치 | |
CN105719641B (zh) | 用于波形拼接语音合成的选音方法和装置 | |
CN105890612A (zh) | 一种导航过程中的语音提示方法及装置 | |
CN1238805C (zh) | 用于压缩语音库的方法和装置 | |
TWI260582B (en) | Speech synthesizer with mixed parameter mode and method thereof | |
JP4286583B2 (ja) | 波形辞書作成支援システムおよびプログラム | |
CN104395956A (zh) | 声音合成的方法和系统 | |
CN104464717A (zh) | 声音合成装置 | |
US9905218B2 (en) | Method and apparatus for exemplary diphone synthesizer | |
EP1668630A1 (en) | Improvements to an utterance waveform corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080903 Termination date: 20160128 |
|
EXPY | Termination of patent right or utility model |