[go: up one dir, main page]

HK1008599A1 - Waveform speech synthesis - Google Patents

Waveform speech synthesis Download PDF

Info

Publication number
HK1008599A1
HK1008599A1 HK98109487A HK98109487A HK1008599A1 HK 1008599 A1 HK1008599 A1 HK 1008599A1 HK 98109487 A HK98109487 A HK 98109487A HK 98109487 A HK98109487 A HK 98109487A HK 1008599 A1 HK1008599 A1 HK 1008599A1
Authority
HK
Hong Kong
Prior art keywords
sequence
waveform
extension
samples
pitch
Prior art date
Application number
HK98109487A
Other languages
German (de)
English (en)
Chinese (zh)
Other versions
HK1008599B (en
Inventor
Lowry Andrew
Original Assignee
British Telecommunications Public Limited Company
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications Public Limited Company filed Critical British Telecommunications Public Limited Company
Publication of HK1008599A1 publication Critical patent/HK1008599A1/en
Publication of HK1008599B publication Critical patent/HK1008599B/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Manufacture Of Motors, Generators (AREA)

Claims (7)

  1. Procédé de synthèse vocale, comprenant les étapes suivantes :
    - on récupère une première séquence d'échantillons numériques correspondant à une première forme d'onde souhaitée et des premières données d'accentuation définissant des instants d'excitation de la forme d'onde,
    - on récupère une seconde séquence d'échantillons numériques correspondant à une seconde forme d'onde souhaitée et des secondes données d'accentuation définissant des instants d'excitation de la forme d'onde,
    - on forme une région de recouvrement par synthèse, à partir d'au moins une séquence, d'une séquence d'extension, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de l'autre séquence respective,
    - on forme, pour la région de recouvrement, des sommes pondérées d'échantillons de la ou des séquence(s) d'origine et d'échantillons de la ou des séquence(s) d'extension.
  2. Procédé de synthèse vocale, comprenant les étapes suivantes :
    - on récupère une première séquence d'échantillons numériques correspondant à une première forme d'onde souhaitée et des premières données d'accentuation définissant des instants d'excitation de la forme d'onde,
    - on récupère une seconde séquence d'échantillons numériques correspondant à une seconde forme d'onde souhaitée et des secondes données d'accentuation définissant des instants d'excitation de la seconde forme d'onde,
    - on synthétise, à partir de la première séquence, une séquence d'extension à la fin de la première séquence, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de la seconde séquence,
    - on synthétise, à partir de la seconde séquence, une séquence d'extension au début de la seconde séquence, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de la première séquence,
    - d'où il résulte que les première et seconde séquences d'extension définissent une région de recouvrement,
    - on forme, pour la région de recouvrement, des sommes pondérées d'échantillons de la première séquence et d'échantillons de la seconde séquence d'extension et des sommes pondérées d'échantillons de la seconde séquence et d'échantillons de la première séquence d'extension.
  3. Procédé selon la revendication 2, dans lequel la première séquence comporte, en fin, une portion correspondant à un son particulier et la seconde séquence comporte, en début, une portion correspondant au même son, et comprenant l'étape consistant à, avant la synthèse, enlever des échantillons de la fin de ladite portion de la première forme d'onde et du début de la dite portion de la seconde forme d'onde.
  4. Procédé selon l'une des revendications 1 à 3, dans lequel chaque étape de synthèse comporte l'extraction, de la séquence concernée, d'une sous-séquence d'échantillons, la multiplication de la sous-séquence par une fonction fenêtre et l'addition répétée des sous-séquences avec des décalages correspondant aux instants d'excitation de l'autre des première et seconde séquences.
  5. Procédé selon la revendication 4, dans lequel la fonction fenêtre est centrée sur l'instant antépénultième d'excitation de la première séquence et sur le second instant d'excitation de la seconde séquence et présente une largeur égale à deux fois le minimum de périodes d'accentuation choisies des première et seconde séquences, une période d'accentuation étant définie comme étant l'intervalle entre des instants d'excitation.
  6. Procédé selon l'une quelconque des revendications précédentes, comportant les étapes selon lesquelles, avant de former les sommes pondérées, on compare, sur la région de recouvrement, la première séquence et son extension avec la seconde séquence et son extension pour obtenir une valeur de décalage qui rende maximale la corrélation entre elles, on règle les secondes données d'accentuation selon la quantité déterminée de décalage et on répète la synthèse de la seconde séquence d'extension.
  7. Synthétiseur vocal comprenant
    - des moyens (1) de stockage de séquences d'échantillons numériques correspondant à des portions de forme d'onde et de données d'accentuation définissant des instants d'excitation de ces formes d'onde,
    - des moyens de commande (2) pouvant être commandés pour récupérer, depuis les moyens de stockage (1), des séquences d'échantillons numériques correspondant à des portions souhaitées de formes d'onde et les données d'accentuation correspondantes définissant des instants d'excitation des formes d'onde, et
    - des moyens (5) pour raccorder les séquences récupérées, les moyens de raccordement étant agencés pour, en fonctionnement, (a) synthétiser, à partir d'au moins la première d'une paire de séquences récupérées, une séquence d'extension pour étendre cette séquence dans une région de recouvrement avec l'autre séquence de la paire, la séquence d'extension ayant une accentuation qui est réglée pour être synchrone avec les instants d'excitation de cette autre séquence et (b) pour former, pour la région de recouvrement, des sommes pondérées d'échantillons de la ou des séquences d'origine et d'échantillons de la ou des séquences d'extension.
HK98109487.4A 1995-04-12 1996-04-03 Waveform speech synthesis HK1008599B (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP95302474 1995-04-12
EP95302474.2 1995-04-12
PCT/GB1996/000817 WO1996032711A1 (fr) 1995-04-12 1996-04-03 Synthese vocale de formes d'ondes

Publications (2)

Publication Number Publication Date
HK1008599A1 true HK1008599A1 (en) 1999-05-14
HK1008599B HK1008599B (en) 2002-06-07

Family

ID=

Also Published As

Publication number Publication date
NO974701L (no) 1997-10-10
CA2189666C (fr) 2002-08-20
EP0820626B1 (fr) 2001-10-10
AU5159696A (en) 1996-10-30
CA2189666A1 (fr) 1996-10-17
WO1996032711A1 (fr) 1996-10-17
NZ304418A (en) 1998-02-26
CN1145926C (zh) 2004-04-14
DE69615832T2 (de) 2002-04-25
AU707489B2 (en) 1999-07-08
EP0820626A1 (fr) 1998-01-28
CN1181149A (zh) 1998-05-06
JP4112613B2 (ja) 2008-07-02
NO974701D0 (no) 1997-10-10
JPH11503535A (ja) 1999-03-26
MX9707759A (es) 1997-11-29
DE69615832D1 (de) 2001-11-15
US6067519A (en) 2000-05-23

Similar Documents

Publication Publication Date Title
EP0820626B1 (fr) Synthese vocale de formes d'ondes
EP1220195B1 (fr) Dispositif et méthode de synthèse de voix chantée et programme pour réaliser ladite méthode
US5740320A (en) Text-to-speech synthesis by concatenation using or modifying clustered phoneme waveforms on basis of cluster parameter centroids
EP1035537B1 (fr) Identification de régions de recouvrement d'unités pour un système de synthèse de parole par concaténation
EP0706170A2 (fr) Procédé de synthèse de la parole par concaténation et recouvrement partiel de formes d'ondes
EP1347440A2 (fr) Synthétiseur de parole par formants utilisant une concaténation de demi-syllabes avec transition par fondu enchaíné indépendant dans les domaines des coefficients de filtre et de source
US8108216B2 (en) Speech synthesis system and speech synthesis method
JPH0833744B2 (ja) 音声合成装置
EP0813733B1 (fr) Synthese de la parole
EP0561752B1 (fr) Méthode et arrangement pour la synthèse du langage
JP2600384B2 (ja) 音声合成方法
HK1008599B (en) Waveform speech synthesis
US5729657A (en) Time compression/expansion of phonemes based on the information carrying elements of the phonemes
JPH0247700A (ja) 音声合成方法および装置
EP0912975B1 (fr) Procede servant a effectuer la synthese de consonnes sourdes
MXPA97007759A (en) Synthesis of discourse in the form of on
JP3081300B2 (ja) 残差駆動型音声合成装置
JPS5888798A (ja) 音声合成方式
JP3853923B2 (ja) 音声合成装置
JPH04253100A (ja) 音声合成装置の音源データ生成方法
JPH0679235B2 (ja) 音声合成装置
JPS63208099A (ja) 音声合成装置
MXPA97006349A (en) Speech synthesis
JP2000010580A (ja) 音声合成方法及び装置

Legal Events

Date Code Title Description
PF Patent in force
PC Patent ceased (i.e. patent has lapsed due to the failure to pay the renewal fee)

Effective date: 20130403