[go: up one dir, main page]

EP1344211A1 - Device and method for differentiated speech output - Google Patents

Device and method for differentiated speech output

Info

Publication number
EP1344211A1
EP1344211A1 EP01991746A EP01991746A EP1344211A1 EP 1344211 A1 EP1344211 A1 EP 1344211A1 EP 01991746 A EP01991746 A EP 01991746A EP 01991746 A EP01991746 A EP 01991746A EP 1344211 A1 EP1344211 A1 EP 1344211A1
Authority
EP
European Patent Office
Prior art keywords
speech
output
parameters
voice
parameter set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP01991746A
Other languages
German (de)
French (fr)
Other versions
EP1344211B1 (en
Inventor
Georg Obert
Klaus Bengler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayerische Motoren Werke AG
Original Assignee
Bayerische Motoren Werke AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayerische Motoren Werke AG filed Critical Bayerische Motoren Werke AG
Publication of EP1344211A1 publication Critical patent/EP1344211A1/en
Application granted granted Critical
Publication of EP1344211B1 publication Critical patent/EP1344211B1/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser

Definitions

  • the present invention relates to a device for differentiated speech output or speech generation and an associated method, systems for use with the speech output device and combinations of a speech output device with at least two systems, in particular for use in a vehicle.
  • a voice output module is directly assigned to each of these systems.
  • PCM pulse code modulation
  • MPEG subsequent compression
  • Other systems use speech synthesis methods, which form words and sentences mainly by assembling syllable segments (phonemes) (signal manipulation).
  • Methods are also known which are based on a full synthesis of the language.
  • methods are known which implement the human vocal tract as an electrical equivalent and work with a tone generator and several downstream filters (source-filter model).
  • a device that works according to this process is a so-called formant synthesizer (eg KLATTALK).
  • KLATTALK formant synthesizer
  • Such a formant synthesizer has the advantage that the voice characteristics can be influenced.
  • the object of the invention is to provide a device and an associated method with which a differentiated speech output is possible, as well as systems for use with the speech output device and combinations of a speech output device with at least two systems, in particular for use in vehicles.
  • the invention has the advantage that speech outputs for different systems are possible with a single speech output device or speech synthesis device, each system being identifiable by voice characteristic differences.
  • a parameter set is assigned to each system, which is used by the speech synthesis device in a speech output by this system.
  • a first parameter set for an on-board computer a second parameter set for a navigation system, a third parameter set for traffic information, a fourth parameter set for a TTS system (Text to Speach system), such as e-mail, and one or more further parameter sets 'provided for additional systems.
  • TTS system Text to Speach system
  • the speech synthesis device generates the speech output, for example with a soft female voice, e.g. B. for voice output of a navigation system, or with a hard male bass voice, e.g. B. for voice output of traffic reports.
  • a soft female voice e.g. B. for voice output of a navigation system
  • a hard male bass voice e.g. B. for voice output of traffic reports.
  • a method and a device for a full synthesis of speech is used, preferably a formant synthesizer.
  • the control parameters for the synthesizer are divided into classes.
  • a class of dynamic parameters controls the articulation, like the movement of the speech tract when speaking.
  • a second class of static parameters controls speaker-characteristic features, such as the generator basic frequency and fixed formants, which are used in a child, a woman or a male speaker are formed by the different geometric dimensions of the speech tract.
  • the device according to the invention and the method according to the invention can be used in particular in systems of a vehicle.
  • Each system has two options for voice output to control the voice output.
  • the first way of voice output involves sending an output of control commands for voice articulation, the sequence of control parameters for words, sentences and sentence sequences being stored in the system.
  • the second option for controlling the speech output is via a second output, which switches over a parameter set that is decisive for the speaker characteristic.
  • the generator and formant parameters are also changed dynamically. This makes it possible to achieve audible differences in the prosody, such as the duration and / or emphasis on syllable segments and / or the sentence melody.
  • prosodic modulation depending on e.g. B. from a traffic situation or a traffic situation can be used for the voice output of announcement texts.
  • the explosiveness of information can be expressed by modulating the voice.
  • the invention has the advantage that, for. B. in a vehicle only a single voice generator with a small parameter memory from multiple information sources can be controlled.
  • the information sources can be equipped with different voice characteristics.
  • a vocal tract synthesis device shows that the method is speaker-independent and no high-quality studio recordings are required.
  • emotional expression in the voice can also be given according to the invention.
  • the voice characteristics can be changed very easily using pre-made parameter templates.
  • the procedure is also suitable for converting free texts into speech (Text to Speech), e.g. B. reading aloud email.
  • FIG. 1 shows a basic illustration of a preferred embodiment of the invention for differentiated speech output with a plurality of systems according to the invention.
  • the preferred embodiment of the invention shown in FIG. 1 has a speech output unit 1 with a speech synthesis device 10, which in the example is a vocal tract synthesis module and is based on full speech synthesis.
  • a speech synthesis device 10 which in the example is a vocal tract synthesis module and is based on full speech synthesis.
  • the speech synthesis device 10 is connected to an amplifier 12, the output 14 of which supplies an audio signal which outputs speech via a loudspeaker (not shown).
  • the speech synthesis device 10 is assigned N parameter sets 21, 22 to 2N, which in the example shown are stored in a memory 20 of the speech output unit 1.
  • N systems 31, 32 to 3N are shown, each of which is connected to the voice output unit 1 via a data connection, such as individual lines, a bus system or data channels.
  • Each system can carry out a voice output via the voice output unit.
  • an on-board computer 31 with an associated parameter set for the on-board Computer 21 a navigation system 32 with an associated parameter set for navigation 22, a traffic information system 33 with an associated parameter set for traffic information 23, an e-mail system such as TTS system 34 with an associated parameter set for e-mail 24.
  • Additional systems 3N with a respective assigned parameter set 2N can be provided.
  • a parameter set 23 can also be provided for traffic reports, for example, with which a hard male bass voice is used in the speech output.
  • the sequence of the speech outputs can take place in succession according to the receipt of the order for the speech output from the systems.
  • Information with a higher priority e.g. Traffic information in dangerous situations such as wrong-way drivers is first output by voice output.
  • Information with the highest priority e.g. Information is immediately output from the on-board computer about malfunctions of the vehicle or the onset of slippery road surfaces, whereby an ongoing voice output can be interrupted. The interrupted speech output can then be completed or repeated.
  • the invention has the advantage that systems with an acoustic display provide the driver with information from various systems without distracting him from his task, as is the case with visual displays. Costs can be saved by using a speech synthesis device that can be used by various on-board computers. Compared to previously used language-producing methods in navigation systems, for example, the storage space requirement can be reduced.
  • the invention can be used particularly advantageously in motor vehicles.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

The invention relates to a device and to a method for differentiated speech output. The systems available in a motor vehicle, such as on-board computer, navigation system and others can be linked with a speech output device. The speech output of different systems can be differentiated by voice characteristics.

Description

Vorrichtung und Verfahren zur differenzierten SprachausgabeDevice and method for differentiated speech output
Die vorliegende Erfindung betrifft eine Vorrichtung zur differenzierten Sprachausga- be bzw Spracherzeugung und ein zugehöriges Verfahren, Systeme zur Verwendung mit der Sprachausgabevorrichtung und Kombinationen einer Sprachausgabevorrichtung mit mindestens zwei Systemen, insbesondere zum Einsatz in einem Fahrzeug.The present invention relates to a device for differentiated speech output or speech generation and an associated method, systems for use with the speech output device and combinations of a speech output device with at least two systems, in particular for use in a vehicle.
In Fahrzeugen werden einzelne Systeme eingesetzt, die über eine akustische Mensch-Maschine-Schnittstelle zur Sprachausgabe verfügen. Bei diesen Systemen ist jeweils ein Sprachausgabemodul direkt zugeordnet. Die verwendeten sprachproduzierenden Verfahren beruhen meist auf Puls-Code-Modulation (= PCM), wobei eine nachfolgende Komprimierung (z. B. MPEG) angeschlossen sein kann. Andere Systeme verwenden Sprachsyntheseverfahren, die hauptsächlich über das Zusam- menstellen von Silbensegmenten (Phoneme) Worte und Sätze bilden (Signalmanipulation).Individual systems are used in vehicles that have an acoustic human-machine interface for voice output. A voice output module is directly assigned to each of these systems. The language-producing methods used are mostly based on pulse code modulation (= PCM), whereby subsequent compression (e.g. MPEG) can be connected. Other systems use speech synthesis methods, which form words and sentences mainly by assembling syllable segments (phonemes) (signal manipulation).
Bei den genannten Sprachausgabeverfahren besteht auch eine Sprecherabhängigkeit, die es erfordert, bei Erweiterung des Wort- oder Textumfanges immer wieder den gleichen menschlichen Sprecher für Aufnahmen zu bemühen. Des weiteren erfordern PCM-Verfahren genauso wie eine qualitativ hochwertige Phonemsynthese durch Signalmanipulation erheblichen Speicherplatz, um Texte oder Silbensegmente abzulegen. Bei beiden Verfahren nimmt der Speicherplatz noch erheblich zu, wenn unterschiedliche Landessprachen ausgegeben werden sollen.There is also a speaker dependency in the aforementioned speech output methods, which requires that the same human speaker be used for recordings when expanding the scope of the word or text. Furthermore, just like high-quality phoneme synthesis through signal manipulation, PCM methods require considerable storage space in order to store texts or syllable segments. With both methods, the storage space increases considerably if different national languages are to be output.
Weiterhin sind Verfahren bekannt, die auf einer Vollsynthese der Sprache beruhen. Bekannt sind insbesondere Verfahren, die den menschlichen Vokaltrakt als elektrische Entsprechung umsetzen und mit einem Tongenerator und mehreren nachgeschalteten Filtern arbeiten (Quelle-Filter-Modell). Ein nach diesem Verfahren arbei- tendes Gerät ist ein sog. Formantsynthetisator (z. B. KLATTALK). Ein solcher Formantsynthetisator hat den Vorteil, daß die stimmcharakteristischen Eigenschaften beeinflußbar sind. Der Erfindung liegt die Aufgabe zugrunde, eine Vorrichtung und ein zugehöriges Verfahren bereitzustellen, mit denen eine differenzierte Sprachausgabe möglich ist, sowie Systeme zur Verwendung mit der Sprachausgabevorrichtung und Kombinationen einer Sprachausgabevorrichtung mit mindestens zwei Systemen, insbesonde- re zur Verwendung in Fahrzeugen bereitzustellen.Methods are also known which are based on a full synthesis of the language. In particular, methods are known which implement the human vocal tract as an electrical equivalent and work with a tone generator and several downstream filters (source-filter model). A device that works according to this process is a so-called formant synthesizer (eg KLATTALK). Such a formant synthesizer has the advantage that the voice characteristics can be influenced. The object of the invention is to provide a device and an associated method with which a differentiated speech output is possible, as well as systems for use with the speech output device and combinations of a speech output device with at least two systems, in particular for use in vehicles.
Diese Aufgabe wird mit den Merkmalen der Patentansprüche gelöst.This object is achieved with the features of the claims.
Die Erfindung hat den Vorteil, daß mit einer einzigen Sprachausgabeeinrichtung bzw Sprachsyntheseeinrichtung Sprachausgaben für verschiedene Systeme möglich sind, wobei jedes System durch stimmcharakteristische Unterschiede identifizierbar ist.The invention has the advantage that speech outputs for different systems are possible with a single speech output device or speech synthesis device, each system being identifiable by voice characteristic differences.
Gemäß einer bevorzugten Ausführungsform der Erfindung ist für jedes System ein Parametersatz zugeordnet, der von der Sprachsyntheseeinrichtung bei einer Sprachausgabe von diesem System verwendet wird. Beispielsweise wird ein erster Parametersatz für einen Bordcomputer, ein zweiter Parametersatz für ein Navigationssystem, ein dritter Parametersatz für Verkehrsinformationen, ein vierter Parametersatz für ein TTS-System (Text to Speach-System), wie E-Mail und ein oder meh- rere weitere Parametersätze' für zusätzliche Systeme bereitgestellt.According to a preferred embodiment of the invention, a parameter set is assigned to each system, which is used by the speech synthesis device in a speech output by this system. For example, a first parameter set for an on-board computer, a second parameter set for a navigation system, a third parameter set for traffic information, a fourth parameter set for a TTS system (Text to Speach system), such as e-mail, and one or more further parameter sets 'provided for additional systems.
Abhängig von dem zugeordneten Parametersatz erzeugt die Sprachsyntheseeinrichtung die Sprachausgabe beispielsweise mit einer weichen weiblichen Stimme, z. B. für Sprachausgaben eines Navigationssystems, oder mit einer harten männlichen Baßstimme, z. B. für die Sprachausgabe von Verkehrsmeldungen.Depending on the assigned parameter set, the speech synthesis device generates the speech output, for example with a soft female voice, e.g. B. for voice output of a navigation system, or with a hard male bass voice, e.g. B. for voice output of traffic reports.
Gemäß einer bevorzugten Ausführungsform der Erfindung wird ein Verfahren und eine Vorrichtung für eine Vollsynthese der Sprache verwendet, vorzugsweise ein Formantsynthetisator. Dabei werden die Steuerparameter für den Synthetisator in Klassen geteilt. Eine Klasse von dynamischen Parametern steuert die Artikulation, wie die Bewegung des Sprachtraktes beim Sprechen. Eine zweite Klasse von statischen Parametern steuert sprechercharakteristische Merkmale, wie die Generatorgrundfrequenz und feststehende Formanten, die bei einem Kind, einer Frau oder einem männlichen Sprecher durch die unterschiedliche geometrische Dimension des Sprachtraktes gebildet werden.According to a preferred embodiment of the invention, a method and a device for a full synthesis of speech is used, preferably a formant synthesizer. The control parameters for the synthesizer are divided into classes. A class of dynamic parameters controls the articulation, like the movement of the speech tract when speaking. A second class of static parameters controls speaker-characteristic features, such as the generator basic frequency and fixed formants, which are used in a child, a woman or a male speaker are formed by the different geometric dimensions of the speech tract.
Bei einem erweiterten Modell des Formantsynthetisators ist eine getrennte Generie- rung von stimmhaften und stimmlosen Lauten möglich. Dabei können durch weitere Parameter zusätzliche Resonatoren oder Dämpfungsglieder eingeschaltet oder die dynamischen Parameter für die Artikulation beeinflußt werden.With an extended model of the formant synthesizer, a separate generation of voiced and unvoiced sounds is possible. Additional resonators or attenuators can be switched on by further parameters or the dynamic parameters for the articulation can be influenced.
Die erfindungsgemäße Vorrichtung bzw. das erfindungsgemäße Verfahren ist ins- besondere einsetzbar in Systemen eines Fahrzeuges. Jedes System hat für eine Sprachausgabe zwei Möglichkeiten, die Sprachausgabe zu steuern. Die erste Möglichkeit der Sprachausgabe umfaßt das Senden einer Ausgabe von Steuerbefehlen für die Sprachartikulation, wobei die Abfolge der Steuerparameter für Wörter, Sätze und Satzfolgen im System abgespeichert sind. Die zweite Möglichkeit zur Steuerung der Sprachausgabe erfolgt über eine zweite Ausgabe, die einen Parametersatz umschaltet, der für die Sprechercharakteristik bestimmend ist.The device according to the invention and the method according to the invention can be used in particular in systems of a vehicle. Each system has two options for voice output to control the voice output. The first way of voice output involves sending an output of control commands for voice articulation, the sequence of control parameters for words, sentences and sentence sequences being stored in the system. The second option for controlling the speech output is via a second output, which switches over a parameter set that is decisive for the speaker characteristic.
Alternativ oder zusätzlich ist es auch möglich, diesen Parameterdatensatz direkt im System zu speichern und bei einer erforderlichen Sprachausgabe den Parameterda- tensatz in die Sprachsyntheseeinrichtung zu laden.As an alternative or in addition, it is also possible to store this parameter data record directly in the system and to load the parameter data record into the speech synthesis device when speech is required.
Gemäß einer weiteren bevorzugten Ausführungsform, die alternativ oder zusätzlich zu den vorstehenden Ausführungsformen einsetzbar ist, können zur Unterscheidung der Informationsquellen, d. h. der Systeme, die eine Sprachausgabe durchführen, die Generator- und Formantparameter zusätzlich dynamisch geändert werden. Dadurch können hörbare Unterschiede in der Prosodie erreicht werden, wie die Dauer und/oder Betonung von Silbensegmenten und/oder der Satzmelodie. Im speziellen kann eine prosodische Modulation in Abhängigkeit z. B. von einer Verkehrslage o- der einer Verkehrssituation für die Sprachausgabe von Ansagetexten genutzt wer- den. Schließlich kann die Brisanz einer Information durch Modulation der Stimme ausgedrückt werden.According to a further preferred embodiment, which can be used as an alternative or in addition to the above embodiments, to differentiate the sources of information, i. H. of the systems that perform a speech output, the generator and formant parameters are also changed dynamically. This makes it possible to achieve audible differences in the prosody, such as the duration and / or emphasis on syllable segments and / or the sentence melody. In particular, prosodic modulation depending on e.g. B. from a traffic situation or a traffic situation can be used for the voice output of announcement texts. Finally, the explosiveness of information can be expressed by modulating the voice.
Die Erfindung hat den Vorteil, daß z. B. in einem Fahrzeug nur ein einziger Sprachgenerator mit kleinem Parameterspeicher von mehreren Informationsquellen ange- steuert werden kann. Die Informationsquellen können dabei mit unterschiedlichen Stimmcharakteristiken ausgestattet werden.The invention has the advantage that, for. B. in a vehicle only a single voice generator with a small parameter memory from multiple information sources can be controlled. The information sources can be equipped with different voice characteristics.
Bei dem Einsatz einer Vollsyntheseeinrichtung, z. B. einer Vokaltrakt- Syntheseeinrichtung ergibt sich, daß das Verfahren sprecherunabhängig ist und keine hochwertigen Studioaufzeichnungen benötigt werden.When using a full synthesis device, e.g. B. a vocal tract synthesis device shows that the method is speaker-independent and no high-quality studio recordings are required.
Bei einem erweiterten Formantsynthetisator kann erfindungsgemäß auch emotionaler Ausdruck in der Stimme mitgegeben werden.With an extended formant synthesizer, emotional expression in the voice can also be given according to the invention.
Durch vorgefertigte Parameterschablonen kann sehr einfach die Stimmcharakteristik verändert werden. Das Verfahren eignet sich auch für die Umsetzung freier Texte in Sprache (Text to Speech), z. B. das Vorlesen von E-Mail.The voice characteristics can be changed very easily using pre-made parameter templates. The procedure is also suitable for converting free texts into speech (Text to Speech), e.g. B. reading aloud email.
Die Erfindung wird nachstehend anhand eines Ausführungsbeispiels und der Zeichnung näher erläutert.The invention is explained below with reference to an embodiment and the drawing.
Fig. 1 zeigt eine Prinzipdarstellung einer bevorzugten Ausführungsform der Erfindung zur differenzierten Sprachausgabe mit mehreren erfindungsgemäßen Syste- men.1 shows a basic illustration of a preferred embodiment of the invention for differentiated speech output with a plurality of systems according to the invention.
Die in Fig. 1 dargestellte bevorzugte Ausführungsform der Erfindung weist eine Sprachausgabeeinheit 1 mit einer Sprachsyntheseeinrichtung 10 auf, die in dem Beispiel ein Vokaltraktsynthesemodul ist und auf einer Vollsynthese der Sprache beruht. Beispielsweise kann ein Formantsynthetisator wie KLATTALK eingesetzt werden. Die Sprachsyntheseeinrichtung 10 ist mit einem Verstärker 12 verbunden, dessen Ausgang 14 ein Audiosignal liefert, das über einen Lautsprecher (nicht dargestellt) Sprache ausgibt. Der Sprachsyntheseeinrichtung 10 sind N Parametersätze 21 , 22 bis 2N zugeordnet, die in dem gezeigten Beispiel in einem Speicher 20 der Sprachausgabeeinheit 1 gespeichert sind. Weiterhin sind N Systeme 31 , 32 bis 3N gezeigt, die jeweils über eine Datenverbindung, wie einzelne Leitungen, ein Bussystem oder Datenkanäle, mit der Sprachausgabeeinheit 1 verbunden sind. Jedes System kann über die Sprachausgabeeinheit eine Sprachausgabe durchführen. Im einzelnen ist ein Bordcomputer 31 mit einem zugehörigen Parametersatz für den Bord- Computer 21 , ein Navigationssystem 32 mit einem zugehörigen Parametersatz für die Navigation 22, ein Verkehrsinformationssystem 33 mit einem zugehörigen Parametersatz für die Verkehrsinformation 23, ein E-Mail-System wie TTS-System 34 mit einem zugehörigen Parametersatz für E-Mail 24 vorhanden. Es können weitere Systeme 3N mit einem jeweiligen zugeordneten Parametersatz 2N vorgesehen werden. In dem gezeigten Beispiel ist es möglich, unter Verwendung einer einzigen Sprachausgabeeinheit 1 das Navigationssystem 32 zum Beispiel mit einer weichen weiblichen Stimme sprechen zu lassen, die durch den Parametersatz für das Navigationssystem 22 bestimmt ist. Weiter kann beispielsweise für Verkehrsmeldungen ein Parametersatz 23 vorgesehen sein, mit dem eine harte männliche Baßstimme bei der Sprachausgabe verwendet wird.The preferred embodiment of the invention shown in FIG. 1 has a speech output unit 1 with a speech synthesis device 10, which in the example is a vocal tract synthesis module and is based on full speech synthesis. For example, a formant synthesizer like KLATTALK can be used. The speech synthesis device 10 is connected to an amplifier 12, the output 14 of which supplies an audio signal which outputs speech via a loudspeaker (not shown). The speech synthesis device 10 is assigned N parameter sets 21, 22 to 2N, which in the example shown are stored in a memory 20 of the speech output unit 1. Furthermore, N systems 31, 32 to 3N are shown, each of which is connected to the voice output unit 1 via a data connection, such as individual lines, a bus system or data channels. Each system can carry out a voice output via the voice output unit. Specifically, an on-board computer 31 with an associated parameter set for the on-board Computer 21, a navigation system 32 with an associated parameter set for navigation 22, a traffic information system 33 with an associated parameter set for traffic information 23, an e-mail system such as TTS system 34 with an associated parameter set for e-mail 24. Additional systems 3N with a respective assigned parameter set 2N can be provided. In the example shown, it is possible, using a single speech output unit 1, to have the navigation system 32 speak, for example, with a soft female voice, which is determined by the parameter set for the navigation system 22. A parameter set 23 can also be provided for traffic reports, for example, with which a hard male bass voice is used in the speech output.
Die Reihenfolge der Sprachausgaben kann zeitlich nacheinander erfolgen entsprechend dem Eingang des Auftrags zur Sprachausgabe von den Systemen. Vorzugs- weise werden Informationen mit höherer Priorität, z.B. Verkehrsinformationen bei Gefahrsituationen wie Falschfahrer zuerst per Sprachausgabe ausgegeben. Besonders bevorzugt werden Informationen mit höchster Priorität, z.B. Informationen vom Bordcomputer über Fehlfunktionen des Fahrzeuges oder einsetzende Fahrbahnglätte sofort ausgegeben, wobei eine laufende Sprachausgabe unterbrochen werden kann. Die unterbrochene Sprachausgabe kann anschließend zu Ende geführt oder wiederholt werden.The sequence of the speech outputs can take place in succession according to the receipt of the order for the speech output from the systems. Information with a higher priority, e.g. Traffic information in dangerous situations such as wrong-way drivers is first output by voice output. Information with the highest priority, e.g. Information is immediately output from the on-board computer about malfunctions of the vehicle or the onset of slippery road surfaces, whereby an ongoing voice output can be interrupted. The interrupted speech output can then be completed or repeated.
Die Erfindung hat den Vorteil, daß Systeme mit akustischer Anzeige dem Fahrer, ohne ihn von seiner Aufgabe abzulenken, wie das bei visuellen Anzeigen der Fall ist, Auskunft von verschiedenen Systemen bereitzustellen. Durch den Einsatz einer Sprachsyntheseeinrichtung, die von verschiedenen Bordcomputern verwendbar ist, lassen sich Kosten sparen. Gegenüber bisher verwendeten sprachproduzierenden Verfahren bei beispielsweise Navigationssystemen läßt sich der Speicherplatzbedarf verringern.The invention has the advantage that systems with an acoustic display provide the driver with information from various systems without distracting him from his task, as is the case with visual displays. Costs can be saved by using a speech synthesis device that can be used by various on-board computers. Compared to previously used language-producing methods in navigation systems, for example, the storage space requirement can be reduced.
Die Erfindung ist insbesondere in vorteilhafter Weise einsetzbar in Kraftfahrzeugen. The invention can be used particularly advantageously in motor vehicles.

Claims

Patentansprüche claims
1. Vorrichtung zur differenzierten Sprachausgabe (1), die mit einem ersten System (31) und mindestens einem weiteren System (32, 33 bis 3N) verbindbar ist, wobei der Sprachausgabe des ersten Systems (31) eine erste Stimmcharakteristik zugeordnet ist und der weiteren Sprachausgabe des weiteren Systems (32, 33 bis 3N) eine weitere Stimmcharakteristik zugeordnet ist, die sich von der ersten Stimmcharakteristik hörbar unterscheidet.1. A device for differentiated speech output (1), which can be connected to a first system (31) and at least one further system (32, 33 to 3N), the speech output of the first system (31) being assigned a first voice characteristic and the further one A further voice characteristic is assigned to the voice output of the further system (32, 33 to 3N), which audibly differs from the first voice characteristic.
2. Vorrichtung nach Anspruch 1 mit einer Sprachsyntheseeinrichtung (10), die Steuerparameter erhält, die eine erste Klasse von dynamischen Parametern und eine zweite Klasse von statischen Parametern aufweisen, wobei die dynamischen Parameter die Artikulation, entsprechend der Bewegung eines Sprachtraktes, und die statischen Parameter die stimmcharakteristischen Merkmale steuert .2. Device according to claim 1 with a speech synthesis device (10) which receives control parameters which have a first class of dynamic parameters and a second class of static parameters, the dynamic parameters being the articulation corresponding to the movement of a speech tract and the static parameters controls the characteristics of the voice.
3. Vorrichtung nach Anspruch 2, wobei die statischen Parameter eine Generatorgrundfrequenz und/oder feststehende Formanten aufweisen, die vorzugsweise der unterschiedlichen geometrischen Dimension des Sprachtraktes bei einem Kind, einer Frau oder einem männlichen Sprecher entsprechen.3. The device according to claim 2, wherein the static parameters have a generator basic frequency and / or fixed formants, which preferably correspond to the different geometric dimension of the speech tract in a child, a woman or a male speaker.
4. Vorrichtung nach Anspruch 3, wobei Generator- und/oder Formantparameter für die Sprachausgabe von verschiedenen Systemen änderbar sind und vorzugsweise hörbare Unterschiede in der Prosodie wie der Dauer und/oder Betonung von Silbensegmenten und/oder der Satzmelodie bewirkt werden.4. The device according to claim 3, wherein generator and / or formant parameters for the speech output of different systems can be changed and preferably audible differences in the prosody such as the duration and / or emphasis of syllable segments and / or the sentence melody are effected.
5. Vorrichtung nach einem der Ansprüche 2 bis 4, wobei die Sprachsyntheseeinrichtung (10) ein Formantsynthetisator ist, mit dem die stimmcharakteristischen Eigenschaften beeinflußbar sind. 5. Device according to one of claims 2 to 4, wherein the speech synthesis device (10) is a formant synthesizer with which the voice characteristic properties can be influenced.
6. Vorrichtung nach Anspruch 5, wobei der Formantsynthetisator geeignet ist, stimmhafte und stimmlose Laute getrennt zu generieren, und wobei insbesondere durch weitere Parameter zusätzliche Resonatoren oder Dämpfungsglieder ein- schaltbar sind und/oder die dynamischen Parameter für die Artikulation beeinflußbar sind.6. The device according to claim 5, wherein the formant synthesizer is suitable for generating voiced and unvoiced sounds separately, and in particular additional resonators or attenuators can be switched on by further parameters and / or the dynamic parameters for the articulation can be influenced.
7. Vorrichtung nach einem der Ansprüche 2 bis 6, wobei die dynamischen Parameter entsprechend der Abfolge von Wörtern, Sätzen und Satzfolgen in jedem System abgespeichert sind.7. Device according to one of claims 2 to 6, wherein the dynamic parameters corresponding to the sequence of words, sentences and sentence sequences are stored in each system.
8. Vorrichtung nach einem der Ansprüche 2 bis 7, wobei die statischen Parameter als Parametersatz in jedem System gespeichert sind und bei einer erforderlichen Sprachausgabe dieser Parametersatz zur Sprachsyntheseeinrichtung (10) übertragen wird.8. Device according to one of claims 2 to 7, wherein the static parameters are stored as a parameter set in each system and this parameter set is transmitted to the speech synthesis device (10) when speech is required.
9. Vorrichtung nach einem der Ansprüche 2 bis 7, wobei die statischen Parameter für die Systeme als zugeordnete Parametersätze in einem Speicher (20) der Sprachausgabevorrichtung gespeichert sind und abhängig von einem Auswahlsig- nal eines Systems ein zugeordneter Parametersatz von der Sprachsyntheseeinrichtung (10) für die Sprachausgabe verwendet wird.9. Device according to one of claims 2 to 7, wherein the static parameters for the systems are stored as assigned parameter sets in a memory (20) of the speech output device and, depending on a selection signal of a system, an assigned parameter set from the speech synthesis device (10) for the speech output is used.
10. Vorrichtung nach einem der Ansprüche 2 bis 9, wobei die Sprachsyntheseeinrichtung (10) mit einem Verstärker (12) verbunden ist und über einen Audioaus- gang (14) des Verstärkers (12) eine Sprachausgabe erfolgt .10. Device according to one of claims 2 to 9, wherein the speech synthesis device (10) is connected to an amplifier (12) and a voice output takes place via an audio output (14) of the amplifier (12).
11. System zur Verwendung mit einer Vorrichtung nach einem der Ansprüche 1 bis 10, mit einem ersten Ausgang zur Ausgabe von dynamischen Parametern und einem zweiten Ausgang zum Ausgeben eines Auswahlsignals zum Umschalten ei- nes Parametersatzes in der Sprachausgabevorrichtung (10). 11. System for use with a device according to one of claims 1 to 10, with a first output for outputting dynamic parameters and a second output for outputting a selection signal for switching over a parameter set in the speech output device (10).
12. System zur Verwendung mit einer Vorrichtung nach einem der Ansprüche 1 bis 10, mit einem Ausgang zur Ausgabe von dynamischen Parametern und statischen Parametern vorzugsweise als ein Parametersatz an die Sprachausgabevorrichtung (10).12. System for use with a device according to one of claims 1 to 10, with an output for output of dynamic parameters and static parameters, preferably as a parameter set to the speech output device (10).
13. Kombination einer Vorrichtung nach einem der Ansprüche 1 bis 10 mit mindestens einem ersten und einem weiteren System, wie ein Bordcomputer (31), ein Navigationssystem (32), ein Verkehrsinformationssystem (33), ein E-Mail-System (34), oder ein Informationssystem (3N), vorzugsweise zur Verwendung in einem Fahrzeug.13. Combination of a device according to one of claims 1 to 10 with at least a first and a further system, such as an on-board computer (31), a navigation system (32), a traffic information system (33), an e-mail system (34), or an information system (3N), preferably for use in a vehicle.
14. Verfahren zur differenzierten Sprachausgabe unter Verwendung einer Vorrichtung nach einem der Ansprüche 1 bis 10. 14. A method for differentiated speech output using a device according to one of claims 1 to 10.
EP01991746A 2000-12-20 2001-11-21 Device and method for differentiated speech output Expired - Lifetime EP1344211B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10063503A DE10063503A1 (en) 2000-12-20 2000-12-20 Device and method for differentiated speech output
DE10063503 2000-12-20
PCT/EP2001/013488 WO2002050815A1 (en) 2000-12-20 2001-11-21 Device and method for differentiated speech output

Publications (2)

Publication Number Publication Date
EP1344211A1 true EP1344211A1 (en) 2003-09-17
EP1344211B1 EP1344211B1 (en) 2011-02-16

Family

ID=7667936

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01991746A Expired - Lifetime EP1344211B1 (en) 2000-12-20 2001-11-21 Device and method for differentiated speech output

Country Status (6)

Country Link
US (1) US7698139B2 (en)
EP (1) EP1344211B1 (en)
JP (1) JP2004516515A (en)
DE (2) DE10063503A1 (en)
ES (1) ES2357700T3 (en)
WO (1) WO2002050815A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2412046A (en) * 2004-03-11 2005-09-14 Seiko Epson Corp Semiconductor device having a TTS system to which is applied a voice parameter set
DE102005063077B4 (en) * 2005-12-29 2011-05-05 Airbus Operations Gmbh Record digital cockpit ground communication on an accident-protected voice recorder
ATE456845T1 (en) * 2006-06-02 2010-02-15 Koninkl Philips Electronics Nv LANGUAGE DIFFERENTIATION
DE102008019071A1 (en) * 2008-04-15 2009-10-29 Continental Automotive Gmbh Method for displaying information, particularly in motor vehicle, involves occurring display of acoustic paraverbal information for display of information, particularly base information
JP7133149B2 (en) * 2018-11-27 2022-09-08 トヨタ自動車株式会社 Automatic driving device, car navigation device and driving support system
JP7336862B2 (en) * 2019-03-28 2023-09-01 株式会社ホンダアクセス Vehicle navigation system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5667470A (en) * 1979-11-07 1981-06-06 Canon Inc Voice desk-top calculator
US5559927A (en) * 1992-08-19 1996-09-24 Clynes; Manfred Computer system producing emotionally-expressive speech messages
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
JPH08328573A (en) * 1995-05-29 1996-12-13 Sanyo Electric Co Ltd Karaoke (sing-along machine) device, audio reproducing device and recording medium used by the above
US5924068A (en) * 1997-02-04 1999-07-13 Matsushita Electric Industrial Co. Ltd. Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion
JP3287281B2 (en) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 Message processing device
JP3502247B2 (en) * 1997-10-28 2004-03-02 ヤマハ株式会社 Voice converter
DE19908137A1 (en) * 1998-10-16 2000-06-15 Volkswagen Ag Method and device for automatic control of at least one device by voice dialog
US20020087655A1 (en) * 1999-01-27 2002-07-04 Thomas E. Bridgman Information system for mobile users
GB9925297D0 (en) * 1999-10-27 1999-12-29 Ibm Voice processing system
US6181996B1 (en) * 1999-11-18 2001-01-30 International Business Machines Corporation System for controlling vehicle information user interfaces
US6539354B1 (en) * 2000-03-24 2003-03-25 Fluent Speech Technologies, Inc. Methods and devices for producing and using synthetic visual speech based on natural coarticulation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0250815A1 *

Also Published As

Publication number Publication date
EP1344211B1 (en) 2011-02-16
DE50115798D1 (en) 2011-03-31
US20030225575A1 (en) 2003-12-04
DE10063503A1 (en) 2002-07-04
US7698139B2 (en) 2010-04-13
WO2002050815A1 (en) 2002-06-27
ES2357700T3 (en) 2011-04-28
JP2004516515A (en) 2004-06-03

Similar Documents

Publication Publication Date Title
DE69821673T2 (en) Method and apparatus for editing synthetic voice messages, and storage means with the method
DE69031165T2 (en) SYSTEM AND METHOD FOR TEXT-LANGUAGE IMPLEMENTATION WITH THE CONTEXT-DEPENDENT VOCALALLOPHONE
DE60112512T2 (en) Coding of expression in speech synthesis
EP1892700A1 (en) Method for speech recognition and speech reproduction
EP1105867B1 (en) Method and device for the concatenation of audiosegments, taking into account coarticulation
EP1282897B1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
EP1121684B1 (en) Method and device for information and/or messages by means of speech
EP1344211B1 (en) Device and method for differentiated speech output
EP0058130B1 (en) Method for speech synthesizing with unlimited vocabulary, and arrangement for realizing the same
EP2380171A2 (en) Method and device for processing acoustic voice signals
EP1110203B1 (en) Device and method for digital voice processing
DE19503419A1 (en) Method and device for outputting digitally coded traffic reports using synthetically generated speech
DE69607928T2 (en) METHOD AND DEVICE FOR PROVIDING AND USING DIPHONES FOR MULTI-LANGUAGE TEXT-BY-LANGUAGE SYSTEMS
WO2008064742A1 (en) Method for the rendition of text information by speech in a vehicle
DE10033104C2 (en) Methods for generating statistics of phone durations and methods for determining the duration of individual phones for speech synthesis
EP2592623B1 (en) Technique for outputting an acoustic signal by means of a navigation system
DE19837661C2 (en) Method and device for co-articulating concatenation of audio segments
DE69329375T2 (en) Method for realizing tone curves for voice messages and method for speech synthesis and device for its application
DE3232835A1 (en) Method and circuit group arrangement for speech synthesis
WO2000031722A1 (en) Method for controlling duration in speech synthesis
EP3144929A1 (en) Synthetic generation of a naturally-sounding speech signal
DE1922170A1 (en) Speech synthesis system
EP1212748A1 (en) Digital speech synthesis method with intonation reproduction
DE102023116308A1 (en) Method for adapting an audio content to a competency profile of a user of a motor vehicle, computer program and/or computer-readable medium, data processing device, motor vehicle
DE102017213246A1 (en) Method, apparatus and computer program for generating auditory messages

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20030425

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

RBV Designated contracting states (corrected)

Designated state(s): DE ES FR GB IT SE

17Q First examination report despatched

Effective date: 20070808

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE ES FR GB IT SE

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REF Corresponds to:

Ref document number: 50115798

Country of ref document: DE

Date of ref document: 20110331

Kind code of ref document: P

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 50115798

Country of ref document: DE

Effective date: 20110331

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2357700

Country of ref document: ES

Kind code of ref document: T3

Effective date: 20110428

REG Reference to a national code

Ref country code: SE

Ref legal event code: TRGR

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20111117

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 50115798

Country of ref document: DE

Effective date: 20111117

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 15

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 16

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 17

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20201126

Year of fee payment: 20

Ref country code: GB

Payment date: 20201123

Year of fee payment: 20

Ref country code: ES

Payment date: 20201214

Year of fee payment: 20

Ref country code: FR

Payment date: 20201119

Year of fee payment: 20

Ref country code: IT

Payment date: 20201130

Year of fee payment: 20

Ref country code: SE

Payment date: 20201123

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50115798

Country of ref document: DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20211120

REG Reference to a national code

Ref country code: SE

Ref legal event code: EUG

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20211120

REG Reference to a national code

Ref country code: ES

Ref legal event code: FD2A

Effective date: 20220228

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20211122

P01 Opt-out of the competence of the unified patent court (upc) registered

Effective date: 20230502