CN100416651C

CN100416651C - 混合参数模式的语音合成系统及方法

Info

Publication number: CN100416651C
Application number: CNB2005100051451A
Authority: CN
Inventors: 鲁弘茂
Original assignee: Sunplus Technology Co Ltd
Current assignee: Sunplus Technology Co Ltd
Priority date: 2005-01-28
Filing date: 2005-01-28
Publication date: 2008-09-03
Anticipated expiration: 2025-01-28
Also published as: CN1811913A

Abstract

一种混合参数模式的语音合成系统包括样本单元语料库、间接单元语料库、合成参数资料库及语音合成器。样本单元语料库储存多个样本语音单元；间接单元语料库储存部分合成语音的间接参数序列，每一间接参数序列包含了其部分合成语音的多个基本参数组；合成参数资料库储存各种合成语音的参数序列，每一参数序列包含了其合成语音的至少一个基本参数组或间接参数组，每一基本参数组包含所要选取的语音单元的代码，每一间接参数组代表在该间接单元语料库中的对应的部分合成语音的间接参数序列；语音合成器用以从该合成参数资料库取出一输入文字的合成语音的参数序列，从而根据该参数序列的每一间接参数组，从该间接单元语料库中取出对应的部分合成语音的间接参数序列，以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中，而根据此合并的基本参数组进行语音合成。

Description

混合参数模式的语音合成系统及方法

技术领域

本发明涉及一种语音合成系统，特别是涉及一种混合参数模式的语音合成系统。

背景技术

在语音合成方案中，如果想要合成的语料是固定的，通常为了提升合成的品质，在实际中可以先将合成参数调节到最佳，之后将所有的参数储存起来。如图1所示的语音合成系统，在一合成参数资料库11中储存有各种合成语音的参数序列111，其中，每一参数序列111包含了其合成语音的至少一参数组112，每一参数组112包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等，当想要合成一输入文字W时，语音合成器12从该合成参数资料库11中取出此输入文字W的合成语音的参数序列111，根据此参数序列111的每一参数组112所包含的语音单元的代码ux，从一储存有预先录制的样本语音单元Ux的样本单元语料库13中取出对应的样本语音单元Ux，从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下，将所有取出的语音单元Ux合成而输出合成语音信号s(t)。

举例而言，当输入文字W为“addition”时，语音合成器12从该合成参数资料库11中取出“addition”的合成语音的参数序列{(u1，…)(u2，…)(u3，…)(u4，…)(u5，…)}，其中，(ui，…)为一参数组，ui为语音单元的代码，而根据此参数序列的每一参数组所包含的语音单元的代码u1~u5，从样本单元语料库13中取出对应的样本语音单元U1~U5(分别为a、di、t、io、n的发音)，而将其合成而输出合成语音信号s(t)＝synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5)，其中，synth()代表合成器，&代表语音信号在时间上的连接。

在前述的语音合成系统中，由于语音信号的统计特性并不是一个均匀分布，例如，某一种特定发音模式会常常出现，所以直接在合成参数资料库11储存合成参数的做法显然缺乏效率，而有必要对其进行改善。

发明内容

本发明的主要目的在于提供一种混合参数模式的语音合成系统，从而能降低合成参数所需的存储空间，并且增加样本单元语料库的样本语音。

根据本发明的一个方面，提出一种混合参数模式的语音合成系统，其包括一样本单元语料库、一间接单元语料库、一合成参数资料库及一语音合成器。该样本单元语料库储存预先录制的多个样本语音单元；该间接单元语料库储存有各种部分合成语音的间接参数序列，每一间接参数序列包含了其部分合成语音的多个基本参数组；该合成参数资料库储存有各种合成语音的参数序列，每一参数序列包含了其合成语音的至少一基本参数组或间接参数组，每一基本参数组包含所要选取的语音单元的代码，每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列；该语音合成器用以从该合成参数资料库中取出一输入文字的合成语音的参数序列，以根据该参数序列的每一间接参数组，从该间接单元语料库中取出对应的部分合成语音的间接参数序列，以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中，而根据此合并的基本参数组进行语音合成。

根据本发明的另一方面，提出一种在一语音合成系统中的混合参数模式的语音合成方法，该方法包括步骤：(A)根据一输入文字，从该合成参数资料库中取出此输入文字的合成语音的参数序列；(B)根据该参数序列的每一间接参数组，从该间接单元语料库中取出对应的部分合成语音的间接参数序列；以及(C)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中，以根据此合并的基本参数组进行语音合成。

附图说明

图1为公知的语音合成系统的结构图。

图2为本发明的混合参数模式的语音合成系统的结构图。

图3为本发明的混合参数模式的语音合成方法的流程图。

图4显示语音合成的一范例。

具体实施方式

有关本发明的混合参数模式的语音合成系统，请先参照图2所示的系统结构图，其主要包括：一合成参数资料库21、一语音合成器22、一样本单元语料库23及一间接单元语料库24。其中，前述合成参数资料库21中储存有各种合成语音的参数序列211，每一参数序列211包含了其合成语音的至少一参数组。前述样本单元语料库23储存有预先录制的多个样本语音单元U1~Ux。前述间接单元语料库24储存有各种部分合成语音的间接参数序列241，其中，本发明以统计方法将常用的合成参数序列(对应一部分合成语音)视为一个间接单元，并将这些常用的合成参数序列储存为一间接参数序列241，每一间接参数序列241包含了其部分合成语音的多个基本参数组212、及/或其它间接参数组213，每一基本参数组212包含所要选取的语音单元的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等。

藉由提供该间接单元语料库24，前述合成参数资料库21的合成语音的参数序列211所包含参数组可为一基本参数组212或一间接参数组213，每一基本参数组212包含所要选取的语音单元Ux的代码ux、语音单元能量变化、语音单元时长变化及语音单元音调变化等，每一间接参数组213代表在该间接单元语料库24中的一对应的部分合成语音的间接参数序列241。因此，在合成参数资料库21中，对于一包含有对应于间接参数序列241的部分合成语音的合成语音而言，其所储存的参数序列211是由基本参数组212及对应该间接参数序列241的间接参数组213所构成，而非全由基本参数组212所构成，因此可减少合成参数资料库21的资料量。

前述语音合成器22为一信号处理器，如图3所示，当想要合成一输入文字W时(步骤S31)，语音合成器22从该合成参数资料库21中取出此输入文字W的合成语音的参数序列211(步骤S32)，其中，参数序列211中的参数组如存在于样本单元语料库23中，则此参数组为基本参数组212，否则为间接参数组213。而根据此参数序列211的每一间接参数组213，从间接单元语料库24中取出对应的部分合成语音的间接参数序列241(步骤S33)，并将此间接参数序列241所包含的基本参数组212并入前述参数序列211的基本参数组212中(步骤S34)，再依此合并的基本参数组212所包含的语音单元的代码ux，从样本单元语料库23中取出对应的样本语音单元Ux，从而在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下，将所有取出的语音单元Ux合成而输出合成语音信号s(t)(步骤S35)。

如图4的范例所示，当想要合成的输入文字为“addition”时，语音合成器22从该合成参数资料库21中取出“addition”的合成语音的参数序列{(u1，…)(u2，…)(u9，…)}，由于此参数序列中的语音单元的代码u9不存在于样本单元语料库23中，因此可知(u9，…)为一间接参数组213，而从间接单元语料库24中取出对应的部分合成语音(“tion”)的间接参数序列{(u3，…)(u4，…)(u5，…)}，并将此间接参数序列241所包含的基本参数组(u3，…)、(u4，…)及(u5，…)并入前述参数序列211的基本参数组(u1，…)及(u2，…)中，再根据此合并的基本参数组(u1，…)、(u2，…)、(u3，…)、(u4，…)及(u5，…)所包含的语音单元的代码u1~u5，从样本单元语料库23中取出对应的样本语音单元U1~U5，从而在对应的语音单元能量变化、语音单元时长变化、及语音单元音调变化等参数的调整下，将所有取出的语音单元合成而输出合成语音信号s(t)＝synth(U1)&synth(U2)&synth(U3)&synth(U4)&synth(U5)，其中，synth()代表合成器，&代表语音信号在时间上的连接。

由前述的说明及范例可知，本发明将常用的部分合成语音的参数予以组成一间接参数序列，并将其储存下来成为间接单元语料库24。在实际应用时，系统先判断合成语音的参数序列中的参数组是否为一间接参数组，若此参数组为基本参数组时，直接到样本单元语料库23直接提取样本语音单元，并根据其参数组的元素合成；假设此参数组为一间接参数组时，则先根据间接单元语料库24将其还原成为基本参数序列，之后才根据基本参数组的方式合成成为语音信号。据此，对于许多部分相同的合成语音信号而言，例如“addition”及“insertion”，相同的部分(“tion”)将以间接参数序列的形式存在于间接单元语料库24，而在合成参数资料库21只需储存简单的间接参数组，因而可以降低合成参数所需的储存空间，并且增加样本单元语料库的样本语音，此外，间接参数序列241中也可以包含其它间接参数组，以重复前述的方式将其还原成为基本参数序列，如此，可进一步强化本发明的效果。

上述实施例仅为了方便说明而举例而已，本发明所申请的保护范围应以权利要求书中所述为准，而非仅限于上述实施例。

Claims

1. 一种混合参数模式的语音合成系统，包括：

一样本单元语料库，其储存预先录制的多个语音单元；

一间接单元语料库，其储存有各种部分合成语音的间接参数序列，每一间接参数序列包含了其部分合成语音的多个基本参数组；

一合成参数资料库，储存有各种合成语音的参数序列，每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组，每一基本参数组包含所要选取的语音单元的代码，每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列；以及

一语音合成器，用以从该合成参数资料库中取出一输入文字的合成语音的参数序列，从而根据该参数序列的每一间接参数组，从该间接单元语料库中取出对应的部分合成语音的间接参数序列，以将此间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中，而根据此合并的基本参数组进行语音合成。

2. 根据权利要求1所述的系统，其中，该语音合成器根据合并的基本参数组所包含的语音单元的代码，而从该样本单元语料库中取出对应的样本语音单元，以将所有取出的语音单元合成而输出合成语音信号。

3. 根据权利要求1所述的系统，其中，每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。

4. 如权利要求3所述的系统，其中，该语音合成器在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下，将所有取出的语音单元合成而输出合成语音信号。

5. 根据权利要求1所述的系统，其中，每一间接参数序列还包含其它间接参数组。

6. 一种在一语音合成系统中的混合参数模式的语音合成方法，该语音合成系统包括一样本单元语料库、一间接单元语料库及一合成参数资料库，该样本单元语料库储存有预先录制的多个语音单元，该间接单元语料库储存有各种部分合成语音的间接参数序列，每一间接参数序列包含了其部分合成语音的多个基本参数组，该合成参数资料库储存有各种合成语音的参数序列，每一参数序列包含了其合成语音的至少一基本参数组及至少一间接参数组，每一基本参数组包含所要选取的语音单元的代码，每一间接参数组代表在该间接单元语料库中的一对应的部分合成语音的间接参数序列，该方法包括：

(I)根据一输入文字，从该合成参数资料库中取出此输入文字的合成语音的参数序列；

(II)根据该参数序列的每一间接参数组，从该间接单元语料库中取出对应的部分合成语音的间接参数序列；以及

(III)将该间接参数序列所包含的基本参数组并入该参数序列所包含的基本参数组中，以根据此合并的基本参数组进行语音合成。

7. 根据权利要求6所述的方法，其中，在步骤(III)中，进行语音合成是根据合并的基本参数组所包含的语音单元的代码，从该样本单元语料库中取出对应的样本语音单元，而将所有取出的语音单元合成而输出合成语音信号。

8. 根据权利要求6所述的方法，其中，每一基本参数组还包含语音单元能量变化、语音单元时长变化及语音单元音调变化。

9. 根据权利要求8所述的方法，其中，在步骤(III)中，进行语音合成是在对应的语音单元能量变化、语音单元时长变化及语音单元音调变化等参数的调整下，将所有取出的语音单元合成而输出合成语音信号。

10. 根据权利要求6所述的方法，其中，每一间接参数序列还包含其它间接参数组。