HK1008599A1 - Waveform speech synthesis - Google Patents
Waveform speech synthesis Download PDFInfo
- Publication number
- HK1008599A1 HK1008599A1 HK98109487A HK98109487A HK1008599A1 HK 1008599 A1 HK1008599 A1 HK 1008599A1 HK 98109487 A HK98109487 A HK 98109487A HK 98109487 A HK98109487 A HK 98109487A HK 1008599 A1 HK1008599 A1 HK 1008599A1
- Authority
- HK
- Hong Kong
- Prior art keywords
- sequence
- waveform
- extension
- samples
- pitch
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Manufacture Of Motors, Generators (AREA)
Claims (7)
- Procédé de synthèse vocale, comprenant les étapes suivantes :- on récupère une première séquence d'échantillons numériques correspondant à une première forme d'onde souhaitée et des premières données d'accentuation définissant des instants d'excitation de la forme d'onde,- on récupère une seconde séquence d'échantillons numériques correspondant à une seconde forme d'onde souhaitée et des secondes données d'accentuation définissant des instants d'excitation de la forme d'onde,- on forme une région de recouvrement par synthèse, à partir d'au moins une séquence, d'une séquence d'extension, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de l'autre séquence respective,- on forme, pour la région de recouvrement, des sommes pondérées d'échantillons de la ou des séquence(s) d'origine et d'échantillons de la ou des séquence(s) d'extension.
- Procédé de synthèse vocale, comprenant les étapes suivantes :- on récupère une première séquence d'échantillons numériques correspondant à une première forme d'onde souhaitée et des premières données d'accentuation définissant des instants d'excitation de la forme d'onde,- on récupère une seconde séquence d'échantillons numériques correspondant à une seconde forme d'onde souhaitée et des secondes données d'accentuation définissant des instants d'excitation de la seconde forme d'onde,- on synthétise, à partir de la première séquence, une séquence d'extension à la fin de la première séquence, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de la seconde séquence,- on synthétise, à partir de la seconde séquence, une séquence d'extension au début de la seconde séquence, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de la première séquence,- d'où il résulte que les première et seconde séquences d'extension définissent une région de recouvrement,- on forme, pour la région de recouvrement, des sommes pondérées d'échantillons de la première séquence et d'échantillons de la seconde séquence d'extension et des sommes pondérées d'échantillons de la seconde séquence et d'échantillons de la première séquence d'extension.
- Procédé selon la revendication 2, dans lequel la première séquence comporte, en fin, une portion correspondant à un son particulier et la seconde séquence comporte, en début, une portion correspondant au même son, et comprenant l'étape consistant à, avant la synthèse, enlever des échantillons de la fin de ladite portion de la première forme d'onde et du début de la dite portion de la seconde forme d'onde.
- Procédé selon l'une des revendications 1 à 3, dans lequel chaque étape de synthèse comporte l'extraction, de la séquence concernée, d'une sous-séquence d'échantillons, la multiplication de la sous-séquence par une fonction fenêtre et l'addition répétée des sous-séquences avec des décalages correspondant aux instants d'excitation de l'autre des première et seconde séquences.
- Procédé selon la revendication 4, dans lequel la fonction fenêtre est centrée sur l'instant antépénultième d'excitation de la première séquence et sur le second instant d'excitation de la seconde séquence et présente une largeur égale à deux fois le minimum de périodes d'accentuation choisies des première et seconde séquences, une période d'accentuation étant définie comme étant l'intervalle entre des instants d'excitation.
- Procédé selon l'une quelconque des revendications précédentes, comportant les étapes selon lesquelles, avant de former les sommes pondérées, on compare, sur la région de recouvrement, la première séquence et son extension avec la seconde séquence et son extension pour obtenir une valeur de décalage qui rende maximale la corrélation entre elles, on règle les secondes données d'accentuation selon la quantité déterminée de décalage et on répète la synthèse de la seconde séquence d'extension.
- Synthétiseur vocal comprenant- des moyens (1) de stockage de séquences d'échantillons numériques correspondant à des portions de forme d'onde et de données d'accentuation définissant des instants d'excitation de ces formes d'onde,- des moyens de commande (2) pouvant être commandés pour récupérer, depuis les moyens de stockage (1), des séquences d'échantillons numériques correspondant à des portions souhaitées de formes d'onde et les données d'accentuation correspondantes définissant des instants d'excitation des formes d'onde, et- des moyens (5) pour raccorder les séquences récupérées, les moyens de raccordement étant agencés pour, en fonctionnement, (a) synthétiser, à partir d'au moins la première d'une paire de séquences récupérées, une séquence d'extension pour étendre cette séquence dans une région de recouvrement avec l'autre séquence de la paire, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de cette autre séquence et (b) pour former, pour la région de recouvrement, des sommes pondérées d'échantillons de la ou des séquences d'origine et d'échantillons de la ou des séquences d'extension.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP95302474 | 1995-04-12 | ||
EP95302474.2 | 1995-04-12 | ||
PCT/GB1996/000817 WO1996032711A1 (fr) | 1995-04-12 | 1996-04-03 | Synthese vocale de formes d'ondes |
Publications (2)
Publication Number | Publication Date |
---|---|
HK1008599A1 true HK1008599A1 (en) | 1999-05-14 |
HK1008599B HK1008599B (en) | 2002-06-07 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
NO974701L (no) | 1997-10-10 |
CA2189666C (fr) | 2002-08-20 |
EP0820626B1 (fr) | 2001-10-10 |
AU5159696A (en) | 1996-10-30 |
CA2189666A1 (fr) | 1996-10-17 |
WO1996032711A1 (fr) | 1996-10-17 |
NZ304418A (en) | 1998-02-26 |
CN1145926C (zh) | 2004-04-14 |
DE69615832T2 (de) | 2002-04-25 |
AU707489B2 (en) | 1999-07-08 |
EP0820626A1 (fr) | 1998-01-28 |
CN1181149A (zh) | 1998-05-06 |
JP4112613B2 (ja) | 2008-07-02 |
NO974701D0 (no) | 1997-10-10 |
JPH11503535A (ja) | 1999-03-26 |
MX9707759A (es) | 1997-11-29 |
DE69615832D1 (de) | 2001-11-15 |
US6067519A (en) | 2000-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0820626B1 (fr) | Synthese vocale de formes d'ondes | |
EP1220195B1 (fr) | Dispositif et méthode de synthèse de voix chantée et programme pour réaliser ladite méthode | |
US5740320A (en) | Text-to-speech synthesis by concatenation using or modifying clustered phoneme waveforms on basis of cluster parameter centroids | |
EP1035537B1 (fr) | Identification de régions de recouvrement d'unités pour un système de synthèse de parole par concaténation | |
EP0706170A2 (fr) | Procédé de synthèse de la parole par concaténation et recouvrement partiel de formes d'ondes | |
EP1347440A2 (fr) | Synthétiseur de parole par formants utilisant une concaténation de demi-syllabes avec transition par fondu enchaíné indépendant dans les domaines des coefficients de filtre et de source | |
US8108216B2 (en) | Speech synthesis system and speech synthesis method | |
JPH0833744B2 (ja) | 音声合成装置 | |
EP0813733B1 (fr) | Synthese de la parole | |
EP0561752B1 (fr) | Méthode et arrangement pour la synthèse du langage | |
JP2600384B2 (ja) | 音声合成方法 | |
HK1008599B (en) | Waveform speech synthesis | |
US5729657A (en) | Time compression/expansion of phonemes based on the information carrying elements of the phonemes | |
JPH0247700A (ja) | 音声合成方法および装置 | |
EP0912975B1 (fr) | Procede servant a effectuer la synthese de consonnes sourdes | |
MXPA97007759A (en) | Synthesis of discourse in the form of on | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JPS5888798A (ja) | 音声合成方式 | |
JP3853923B2 (ja) | 音声合成装置 | |
JPH04253100A (ja) | 音声合成装置の音源データ生成方法 | |
JPH0679235B2 (ja) | 音声合成装置 | |
JPS63208099A (ja) | 音声合成装置 | |
MXPA97006349A (en) | Speech synthesis | |
JP2000010580A (ja) | 音声合成方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PF | Patent in force | ||
PC | Patent ceased (i.e. patent has lapsed due to the failure to pay the renewal fee) |
Effective date: 20130403 |