[go: up one dir, main page]

DE2214521A1 - Speech synthesis circuit - Google Patents

Speech synthesis circuit

Info

Publication number
DE2214521A1
DE2214521A1 DE19722214521 DE2214521A DE2214521A1 DE 2214521 A1 DE2214521 A1 DE 2214521A1 DE 19722214521 DE19722214521 DE 19722214521 DE 2214521 A DE2214521 A DE 2214521A DE 2214521 A1 DE2214521 A1 DE 2214521A1
Authority
DE
Germany
Prior art keywords
frequency
auxiliary
generators
information
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19722214521
Other languages
German (de)
Inventor
C Dechaux
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of DE2214521A1 publication Critical patent/DE2214521A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

In a synthesiser which, for each sampling period, reconstitutes a language element by means of three sinusoidal components obtained with the help of variable-frequency generators and variable-attenuators, those components are simultaneously subject to predetermined rephasing operations carried out at an auxiliary frequency identified with the pitch frequency (or frequency of vibration of the voice) at the time of emission of vowels or voiced consonants. This auxiliary frequency is delivered by a further variable-frequency generator. In addition, the signal representing the sum of these components is amplitude-modulated by a modulating signal at the auxiliary frequency.

Description

THOMSON - CSP
173» Bd. Haussmann
Paris 8e /!Frankreich
THOMSON - CSP
173 “Vol. Haussmann
Paris 8e /! France

Unser Zeichen: T 1160Our reference: T 1160

SprachsyntheseschaltungSpeech synthesis circuit

Die Erfindung bezieht sich auf eine Sprachsyntheseschaltung, die eine digitale Information empfängt, welche mit einer Folgeperiode T, die einer Abtastperiode T enspricht, eine Information ausdrückt, die nachfolgend Hauptinformation genannt wird und es ermöglicht, ein Sprachelement annähernd dadurch wieder herzustellen, daß für jede Abtastperiode eine bestimmte Anzahl ρ von Sinussignalen addiert werden, deren Frequenz und Amplitude die Hauptinformation bilden und die hier "Hauptkomponenten" genannt werden, wobei ρ gleich einer festen Zahl η oder kleiner als diese ist. Die zuvor angegebene Hauptinformationsart ist in der PR-PS 2 044 290 angegeben. Kurz gesagt ist eine Hauptkomponente ein zeitlicher Abschnitt eines Formanten, wobei ein Formant als eine zeitliche Folge von · Spektralkomponenten gleicher oder benachbarter FrequenzenThe invention relates to a speech synthesis circuit that receives digital information which is with a following period T corresponding to a sampling period T expresses information that is the following main information and makes it possible to restore a speech element approximately by that for each sampling period a certain number ρ of sinusoidal signals are added, the frequency and amplitude of which is the main information and which are called "main components" here, where ρ is a fixed number η or less than this is. The main type of information given above is given in PR-PS 2 044 290. In short is a main component a temporal segment of a formant, where a formant is a temporal sequence of Spectral components of the same or neighboring frequencies

Lei/GlLei / Gl

209 8 41 /081 2209 8 41/081 2

_2_ ' 22H521_ 2 _ '22H521

definiert ist, der einem (absoluten oder relativen) Energiemaximum in dem Sprachspektrum entspricht. Die Formantenabschnitte, die für jede Abtastung der Sprache übertragen v/erden, v/erden aufgrund von Kriterien bestimmt, die in der zuvor angegebenen Patentschrift dargelegt sind. Die Analyse des Schalls erfolgt mit Hilfe einer Filterbatterie, und die Frequenzen der Hauptkomponenten werden nur mit einer gewissen Annäherung übertragen.is defined, which corresponds to an (absolute or relative) energy maximum in the speech spectrum. the Formant sections for each sample of speech transfer v / earth, v / earth determined on the basis of criteria, as set out in the aforementioned patent. The sound is analyzed with Using a filter battery, and the frequencies of the main components are only approximate transfer.

Das Ziel der Erfindung ist die Schaffung einer Sprachsyntheseschaltung dieser Art, bei der es durch Verwendung einer Hilfsinformation möglich ist, die sprechende Person in gewissem Maße zu identifizieren.The aim of the invention is to provide a speech synthesis circuit of this kind, in which it is possible by using auxiliary information, the speaking Identify person to some extent.

Diese Hilfsinformation ist die in der angelsächsischen Literatur "pitch information" genannte Information, die hier Stimmhöheninformation genannt wird. Diese Information ist während der Abgabe von Vokalen und stimmhaften Konsonanten ("voiced" in der angelsächsischen Literatur) durch eine Frequenz gebildet, welche die Schwingungsfrequenz der Stimmbänder der sprechenden Person ist und kürzer "Stimmhöhenfrequenz" genannt werden soll; sie liegt im allgemeinen zwischen 80 und 350 Hz, Die sich auf die Vokale und stimmhaften Konsonanten beziehenden Spektralkomponenten sind Harmonische dieser Stimmhöhenfrequenz, was bei den stummen Konsonanten ("unvoiced" in der angelsächsischen Literatur) nicht der Fall ist.This auxiliary information is the information called "pitch information" in Anglo-Saxon literature, which is called pitch information here. This information is during the delivery of vowels and voiced consonants ("voiced" in Anglo-Saxon literature) formed by a frequency which is the frequency of vibration of the speaking person's vocal cords and for short is called "pitch frequency" target; it is generally between 80 and 350 Hz, relating to the vowels and voiced consonants Spectral components are harmonics of this pitch frequency, as is the case with mute consonants ("unvoiced" in Anglo-Saxon literature) is not the case.

Es sind bereits verschiedene Anordnungen für die sendeseitige Messung der Stimmhöhenfrequenz beschrieben worden. Ein entsprechendes Literaturverzeichnis findet sich in dem Buch "Speech Analysis, Synthesis and Perception" vonVarious arrangements for the measurement of the pitch frequency on the transmitter side have already been described. A corresponding bibliography can be found in the book "Speech Analysis, Synthesis and Perception" by

209841/0812209841/0812

J.L. Flanagan, Springer-Verlag, Berlin-Heidelberg-New York, 1965.J.L. Flanagan, Springer-Verlag, Berlin-Heidelberg-New York, 1965.

Die einfachsten Anordnungen dieser Art arbeiten mit Spitzenwertdetektoren: Das Sprachsignal wird einem Bandfilter oder, der höheren Sicherheit wegen, zwei Bandfiltern zugeführt, wodurch normalerweise ein Signal geliefert wird, das bei der Abgabe von Vokalen oder stimmhaften Konsonanten mit der Stimmhöhenfrequenz amplitudenmoduliert ist. Auf jedes dieser Bandfilter folgt ein Amplitudendetektor, dem wiederum ein Spitzenwertdetektor nachgeschaltet ist, wobei die Frequenz der Spitzenwerte der Stimmhöhenfrequenz entspricht, wenn diese in dem Signal in Erscheinung tritt; andernfalls liefert die Meßanordnung eine sehr stark schwankende Ausgangsfrequenz.The simplest arrangements of this kind work with peak value detectors: the speech signal becomes one Band filter or, for the sake of greater security, two band filters, which normally produce a signal that is delivered when vowels or voiced consonants are emitted with the pitch frequency is amplitude modulated. Each of these band filters is followed by an amplitude detector, which in turn is followed by a peak value detector is connected downstream, where the frequency of the peak values corresponds to the pitch frequency, when this appears in the signal; otherwise the measuring arrangement delivers a very strongly fluctuating one Output frequency.

Bei zahlreichen Systemen zur digitalen Sprachübertragung wird die von der Meßanordnung gelieferte Frequenz, die hier Hilfsfrequenz genannt wird, dauernd auf einem Hilfskanal übertragen, unabhängig davon, ob sie mit der Stiramhöhenfrequenz identisch ist oder nicht; man überträgt jedoch außerdem ein Sondersignal, dessen Bildung einen komplizierten Materialaufwand erfordert und das anzeigt, ob die Hilfsfrequenz die Stimmhöhenfrequenz ist. Wenn dies zutrifft, erfolgt die Sprachsynthese mit Hilfe eines Generators, der Harmonische dieser Frequenz erzeugt, die offensichtlich nur bis auf die Quantisierungen genau wiederhergestellt wird; andernfalls v/ird die Hilfsfrequenz nicht verwendet, und die Synthese erfolgt mit Hilfe eines Rauschgenerators.In numerous systems for digital voice transmission, the frequency supplied by the measuring arrangement, the is called the auxiliary frequency here, continuously on an auxiliary channel transmitted regardless of whether they are with the Stiramhöhe frequency is identical or not; However, one also transmits a special signal, the formation of which is one requires complicated material and that indicates whether the auxiliary frequency is the pitch frequency. if If this is the case, the speech synthesis takes place with the help of a generator that generates harmonics of this frequency, which is obviously only restored down to the exact quantizations; otherwise it becomes the auxiliary frequency not used, and the synthesis is done with the help of a noise generator.

Bei der in der zuvor erwähnten französischen Patentschrift beschriebenen Sprachsyntheseschaltung, bei derIn the speech synthesis circuit described in the aforementioned French patent, in which

2098A1/08122098A1 / 0812

22H52122H521

die Synthese nach einem völlig anderen Prinzip mit Hilfe einer kleinen Anzahl von "Hauptkomponenten" erfolgt, wird die Stimmhöheninformation nicht verwendet. the synthesis according to a completely different principle with the help of a small number of "main components" the pitch information is not used.

Die Erfindung ermöglicht die Ausnutzung der Stimmhöheninformation durch gleichzeitige Rückstellungen auf vorbestimmte Phasen für alle Hauptkomponenten, wobei diese Rückstellungen auf vorbestimmte Phasen mit der Stimmhöhenfrequenz erfolgen; dadurch ist es möglich, das Summensignal der Hauptkomponenten mit dieser Frequenz periodisch zu machen.The invention enables the pitch information to be used by means of simultaneous resetting on predetermined phases for all main components, these provisions on predetermined phases be done with the pitch frequency; this makes it possible to use the sum signal of the main components to make this frequency periodic.

Nach der Erfindung ist eine Sprachsyntheseschaltung zur synthetischen Spracherzeugung aufgrund einer periodischen Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement bezieht und durch die Frequenzen und Amplituden von ρ sinusförmigen Hauptkomponenten gebildet ist, wobei ρ eine veränderliche Zahl ist, die höchstens gleich einer festen Zahl η >1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen, die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Hauptkomponenten gesteuert werden, und mit einer Addierschaltung, welche die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch gekennzeichnet, daß zur Verwendung einer Hilfsinformation, die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten die Schwingungsfrequenz der Stimmbänder der sprechenden Person ('Btimmhöhenfrequenz") ist, eine Anordnung zur Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobeiAccording to the invention is a speech synthesis circuit for synthetic speech generation based on a periodic Information that contains main information relating to a language element and through which Frequencies and amplitudes of ρ is formed by sinusoidal principal components, where ρ is a variable Is a number that is at most equal to a fixed number η> 1, with η frequency-variable generators and η amplitude adjustment arrangements, which are each assigned to one of the η generators, the η generators and Amplitude adjusting arrangements controlled by the main information for the restoration of the main components and with an adder circuit which is the sum of the restored principal components thereby characterized in that for the use of auxiliary information, which is formed by an auxiliary frequency that occurs during the transmission of vowels and voiced consonants the vibration frequency of the vocal cords of the speaking person ("Btimmhöhenfrequenz") is an arrangement for Resetting of each of the restored main components to a predetermined phase is provided, wherein

2098A 1 /08122098A 1/0812

die Rückstellungen auf die vorbestimmten Phasen für die Haupt !componenten gleichzeitig stattfinden und von der Hilfsinformation so gesteuert werden, daß sie mit der Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.the provisions on the predetermined phases for the Main components take place simultaneously and from the Auxiliary information can be controlled so that it is compatible with the Auxiliary frequency take place at least when the auxiliary frequency is the pitch frequency.

Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt, deren einzige Figur das Blockschaltbild einer bevorzugten Ausführungsform einer Sprachsyntheseschaltung nach der Erfindung zeigt.An embodiment of the invention is shown in the drawing, the only figure of which is the block diagram shows a preferred embodiment of a speech synthesis circuit according to the invention.

Die Zeichnung zeigt die Informationsquelle 1, die zur Speisung der Sprachsyntheseschaltung bestimmt ist.The drawing shows the information source 1, which is used for Feeding the speech synthesis circuit is intended.

Diese Informationsquelle kann beispielsweise die letzte Stufe einer Empfangsanordnung sein, welche die für die Sprachsynthesesehaltung notwendigen Informationen in Form von parallelen Binärsignalen liefert. Jede der aufeinanderfolgenden Informationen wird an den Ausgängen der Informationsquelle 1 für eine Periode T aufrecht erhalten, die der Analyseperiode gleich ist.This information source can be, for example, the last stage of a receiving arrangement, which is for the Speech synthesis attitude necessary information in In the form of parallel binary signals. Each of the successive pieces of information is at the outputs of the information source 1 is maintained for a period T which is equal to the analysis period.

Es ist hier angenommen, daß die maximale Anzahl η von Hauptkomponenten 3 beträgt.It is assumed here that the maximum number η of main components is three.

Die Informationsquelle 1 hat also sieben Mehrfachausgänge (von denen jeder Draht einer Binärziffer entspricht), nämlich die Ausgänge 11, 12 und 13, welche die Frequenzen F.., Pp bzw. F-Z der Hauptkomponenten liefern, die Ausgänge 21, 22, und 23, welche die entsprechenden Aplituden A^, Ap bzw. A^ liefern, und schließlich den Ausgang 10, der die Hilfsfrequenz f liefert." Wie noch zu sehen sein wird, ist es überflüssig, dem Gerät ein Sondersignal zu liefern, das anzeigt, ob die Hilfsfrequenz während des Empfangs die Stimmböhenfrequenz ist oder nicht.Information source 1 has seven multiple outputs (each wire corresponds to a binary digit), namely the outputs 11, 12 and 13, which supply the frequencies F .., Pp and F-Z of the main components, the outputs 21, 22, and 23, which have the corresponding aplitudes A ^, Ap or A ^ deliver, and finally the output 10, the supplies the auxiliary frequency f. "As will be seen, it is superfluous to supply the device with a special signal, that indicates whether the auxiliary frequency is the vocal pitch frequency during reception or not.

209841/0812209841/0812

22U52122U521

Die Ausgänge 11, 12, 13 sind jeweils mit einer von drei Codeumsetzerschaltungen 31» 32 bzw. 33 verbunden, welche den die Frequenzen F1, Fp, F, darstellenden Digitalinformationen (die im allgemeinen durch die Identifizierungsnummer eines Analysefilters gegeben sind) die folgenden Zahlen zuordnen:The outputs 11, 12, 13 are each connected to one of three code converter circuits 31 »32 and 33, respectively, which add the following numbers to the digital information representing the frequencies F 1 , Fp, F (which is generally given by the identification number of an analysis filter) assign:

F Fr> J?F Fr> J?

N1 = ^ N = N = N 1 = ^ N = N =

wobei F eine Frequenz ist, die sehr viel höher als das sendeseitig analysierte Tonfrequenzband (beispielsweise bis 3500 Hz) ist, während q eine feste ganze Zahl ist, beispielsweise in der Größenordnung von 10.where F is a frequency much higher than that Audio frequency band analyzed by the transmitter (for example to 3500 Hz), while q is a fixed integer, for example on the order of 10.

Drei mit Zählung arbeitende veränderliche Frequenzteiler 41, 42, 43 empfangen die Impulse eines Taktgebers 2 mit der Frequenz F . Diese Frequenzteiler sind jeweils mit Mehrfach-Steuereingängen versehen, die an die Ausgänge der Codeumsetzerschaltungen 31, 32 bzw. 33 angeschlossen sind, und ihre Ausgänge sind mit den Frequenzsteuereingängen 61, 62 bzw. 63 von drei Signalgeneratoren 51, 52 bzw. 53 verbunden, denen sie Impulse der Frequenz 2qF., 2qFp bzw. 2qF, zuführen.Three counting variable frequency dividers 41, 42, 43 receive the pulses from a clock 2 with the frequency F. These frequency dividers are each provided with multiple control inputs that are connected to the outputs of the transcoder circuits 31, 32 and 33 are connected, and their outputs are connected to the Frequency control inputs 61, 62 and 63 of three signal generators 51, 52 and 53 respectively, to which they receive pulses of the frequency 2qF., 2qFp or 2qF.

Jeder dieser drei Generatoren ist in an sich bekannter Weise so ausgeführt, daß er im wesentlichen ein Verschieberegister mit q Stufen enthält, dessen Ausgang mit dem Eingang über einen Negator verbunden ist, der eine Ziffer "1" in eine Ziffer "0" und umgekehrt umformt. Die q Stufen sind jeweils mit Hilfsausgängen versehen, die mit einer Schaltung verbunden sind, die ein von einer Spannungsquelle gespeistes Widerstandsnetzwerk enthält. Das Verschieberegister wird anfänglich in geeigneter Weise gefüllt, beispielsweise mit q Ziffern "O". Der InhaltEach of these three generators is designed in a manner known per se so that it is essentially a shift register with q contains stages, the output of which is connected to the input via an inverter, which has a digit "1" converted into a digit "0" and vice versa. The q stages are each provided with auxiliary outputs that are marked with a Circuit are connected which contains a resistor network fed by a voltage source. The shift register is initially filled in a suitable manner, for example with q digits "O". The content

209 8 Λ 1 /081 2209 8 Λ 1/081 2

22U52122U521

des Verschieberegisters ändert sich mit jedem Fortschalteimpuls, und die Stellung der Ziffern "1" in dem Verschieberegister bestimmt die Widerstände, die zur Bildung des Ausgangssignals des Generators beitragen. Dieses Ausgangssignal ist also durch eine Treppenspannung gebildet. Das Widerstandsnetzwerk ist so berechnet, daß für jeweils 2q Fortschalteimpulse, die mit einer festen Folgeperiode geliefert werden, die Hüllkurve des Ausgangssignals (bis auf eine Gleich-Stromkomponente) einen Zyklus einer Sinusschwingung darstellt.of the shift register changes with each increment pulse, and the position of the digits "1" in the shift register determines the resistances which contribute to the formation of the output signal of the generator. This output signal is thus formed by a staircase voltage. The resistor network is calculated in such a way that for every 2q incremental pulses that are supplied with a fixed subsequent period, the envelope curve of the output signal (except for a direct current component) represents one cycle of a sinusoidal oscillation.

Für eine periodische Folge von Fortschalteimpulsen liefert' der Generator ein Treppensignal, das eine be- , stimmte Anzahl von Zyklen enthält, und dieses Treppensignal braucht nur durch ein Tiefpaßfilter geschickt zu werden, damit es in ein sinusförmiges Signal umgeformt wird, während die Gleichstromkomponente normalerweise verloren geht, beispielsweise durch die vorgenommenen Verstärkungen.For a periodic sequence of incremental pulses the generator delivers a staircase signal which contains a certain number of cycles, and this staircase signal only needs to be passed through a low-pass filter so that it is converted into a sinusoidal signal while the DC component is normally lost, for example due to the Reinforcements.

Derartige Generatoren sind in dem Aufsatz "Digital Generation of Low-Frequency Sine Waves" von Anthony C. Davies in der Zeitschrift "IEEE Transactions of Instrumentation and Measurement", Band IM 18, Nr. 2, Juni 1969, Seiten 97 bis 105 beschrieben. Solche Generatoren und ganz allgemein alle Sinusgeneratoren, bei denen ein Widerstandsnetzwerk verwendet wird, das durch ein Verschieberegister umgeschaltet wird, werden hier "Verschieberegister-Widerstandsnetzwerk—Generatoren" genannt.Such generators are described in the article "Digital Generation of Low-Frequency Sine Waves" by Anthony C. Davies in IEEE Transactions of Instrumentation and Measurement, Volume IM 18, No. 2, June 1969, Pages 97 to 105 described. Such generators and, in general, all sine wave generators where a Resistance network is used, which is switched by a shift register, are referred to here as "shift register-resistor network - generators" called.

Unter diesen Voraussetzungen sind in dem Schaltbild die Eingänge 61, 62 und 63 der Generatoren 51, 52 bzw. 53 die Eingänge der Fortschalteanordnung der darin enthaltenen Verschieberegister.Under these conditions, the circuit diagram shows the Inputs 61, 62 and 63 of the generators 51, 52 and 53 the inputs of the incremental arrangement of the contained therein Shift register.

2098^1/08122098 ^ 1/0812

Es ist leicht zu erkennen, daß unter diesen Bedingungen die drei Generatoren jeweils Ausgangsspannungen liefern, deren Hüllkurven (bis auf eine Gleichstromkomponente) Abschnitte von Sinuskurven mit der Frequenz P., Fp bzw. F, sind.It is easy to see that under these conditions the three generators each deliver output voltages, their envelopes (except for a direct current component) Sections of sine waves with the frequency P., Fp or F, are.

Es ist auch leicht zu erkennen, daß der Inhalt des Verschieberegisters in einem gegebenen Zeitpunkt die Phase des sinusförmigen Signals in diesem Zeitpunkt bestimmt.It is also easy to see that the contents of the shift register at a given point in time are the Phase of the sinusoidal signal is determined at this point in time.

Die drei Generatoren haben ferner Eingänge 71, 72 bzw. 73, welche die Nullrückstellung aller Stufen ihrer Verschieberegister ermöglichen, wobei dieser Zustand des entsprechenden Verschieberegisters der Phase +270° des sinusförmigen Signals entspricht.The three generators also have inputs 71, 72 and 73, respectively, which reset all stages of their shift registers enable, this state of the corresponding shift register of phase + 270 ° des corresponds to a sinusoidal signal.

Die drei Generatoren speisen jeweils eines von drei veränderlichen Dämpfungsgliedern 81, 82 bzw. 83, deren Steuereingänge mit den Ausgängen 21, 22 bzw. 23 der Informationsquelle 1 über einen von drei Digital-Analog-Umsetzern 91j 92 bzw. 93 verbunden sind.The three generators each feed one of three variable ones Attenuators 81, 82 and 83, the control inputs with the outputs 21, 22 and 23 of the Information source 1 via one of three digital-to-analog converters 91j 92 or 93 are connected.

Hier ist folgendes zu bemerken: Wenn für eine gegebene Abtastperiode ρ kleiner als η oder sogar Null (Schweigeperioden) ist, läßt sich diese Information leicht durch eine Information der Amplitude 0 auf den Kanälen ausdrücken, was dem Nichtvorhandensein von Hauptkomponenten entspricht, so daß es bedeutungslos ist, wie sich die entsprechenden Generatoren in der betreffenden Periode verhalten, da ihre eventuellen Ausgangssignale dann durch die einstellbaren Dämpfungsglieder gesperrt werden.The following should be noted here: If for a given sampling period ρ is less than η or even zero (periods of silence) this information can easily be expressed by information of amplitude 0 on the channels which corresponds to the absence of principal components, so that it is meaningless how the corresponding generators behave in the period concerned, as their possible output signals then be blocked by the adjustable attenuators.

Die Ausgangssignale der Dämpungsglieder 81, 82 und 83The output signals of the attenuators 81, 82 and 83

2 0 9 8 Λ 1/08122 0 9 8 Λ 1/0812

werden in einer Addierschaltung 55 addiert. Die am Ausgang der Addierschaltung 55 erscheinenden Signale haben infolge einer Kopplungskapazität, die an einem beliebigen geeigneten Punkt eingefügt ist, ihre Gleichstromkomponenten verloren. Der Ausgang der Addierschaltung 55 speist den Trägerfreqüenzeingang eines Amplitudenmodulators 65» dessen Ausgang mit dem Eingang eines das Ausgangssignal der Sprachsyntheseschaltung darstellenden elektroakustischen Wandlers 85 über ein Tiefpaßfilter 75 verbunden ist.are added in an adding circuit 55. The on Output of the adder 55 appearing signals have due to a coupling capacitance that is at a inserted at any suitable point, its DC components are lost. The output of the adder circuit 55 feeds the carrier frequency input of an amplitude modulator 65 »its output with the input one is the output signal of the speech synthesis circuit representative electroacoustic transducer 85 is connected via a low-pass filter 75.

Die Hilfsfrequenz wird bei dieser bevorzugten Ausführungsform der Sprachsyntheseschaltung nicht nur für die zuvor erwähnten Rückstellungen auf vorbestimrate Phasen verwendet, sondern auch für eine (im Modulator 65 erfol- m gende)Araplitudenmodulation des Ausgangssignals der Addierschaltung 55» und zwar in der Weise, daß der Augenblickswert des Modulationssignals mit der Frequenz f bei den Rückstellungen auf vorbestimrate Phasen durch ein Minimum geht. Der dadurch erhaltene Gesamteffekt ist sehr befriedigend.The auxiliary frequency is used in this preferred embodiment of the speech synthesis circuit not only for the above-mentioned provisions to vorbestimrate phases, but also a (in the modulator 65 successes m constricting) Araplitudenmodulation of the output signal of the adder circuit 55 'and in such a manner that the instantaneous value of the modulation signal with the frequency f goes through a minimum in the resets to vorbestimrate phases. The overall effect obtained in this way is very satisfactory.

Bei dem angegebenen Ausführungsbeispiel wird die Phase jeder Hauptkomponente auf den gleichen festen Wert zurückgestellt, der dem Inhalt 0 in allen Stufen jedes Verschieberegisters entspricht.In the specified embodiment, the phase of each main component is reset to the same fixed value, which corresponds to the content 0 in all stages of each shift register.

Schließlich wird bei diesem Ausführungsbeispiel an den Schaltungen nichts geändert, wenn die Hilfsfrequenz nicht die Höhenfrequenz ist, wodurch das zuvor erwähnte Sondersignal entfällt. Die erratischen Frequenzen, die nacheinander die Hilfsfrequenz bei der Abgabe von stummen Konsonanten bilden, führen zu Phasenrückstellungen und zu einer Amplitudenmodulation, die sich erratisch vonFinally, in this exemplary embodiment, nothing is changed in the circuits when the auxiliary frequency is not the treble frequency, which means that the aforementioned special signal is not required. The erratic frequencies that successively form the auxiliary frequency for the delivery of silent consonants, lead to phase reset and to an amplitude modulation that varies erratically from

2098A1/08122098A1 / 0812

22U521 - ίο -22U521 - ίο -

einer Syntheseperiode zur nächsten ändern, und es ist festgestellt worden, daß der dadurch für die Synthese von stummen Konsonanten erhaltene Höreffekt eine bessere Qualität hatte, als sie erhalten wird, wenn die Phasenrückstellungen und die Amplitudenmodulation für die Synthese von stummen Konsonanten unterdrückt werden. Dadurch werden außerdem die Schaltungen vereinfacht.change from one synthesis period to the next, and it has been found that this allows for synthesis The hearing effect obtained from silent consonants was of better quality than that obtained when the phase reset and the amplitude modulation for the synthesis of silent consonants can be suppressed. This also simplifies the circuits.

Somit speist bei der dargestellten Schaltung der Ausgang 10 der Informationsquelle 1 die Erzeugung eines Signals der Frequenz f eine Schaltung von gleicher Art, wie sie hinsichtlich der Frequenz für die treppenförmigen Signale mit den Frequenzen F.., Fp, F., verwendet wird.Thus, in the circuit shown, the output 10 of the information source 1 feeds the generation of a Signal of frequency f a circuit of the same type as in terms of frequency for the staircase Signals with the frequencies F .., Fp, F., used will.

Diese Schaltung enthält eine Codeumsetzerschaltung 30, auf die ein einstellbarer Frequenzteiler 40 und ein Generator 50 folgen.This circuit includes a code converter circuit 30, This is followed by an adjustable frequency divider 40 and a generator 50.

Da jedoch die Frequenz f unter den Frequenzen der Mehrzahl der Hauptkomponenten liegt, erfolgt die 'Zuführung von Impulsen zu dem einstellbaren Frequenzteiler 40 durch einen festen Frequenzteiler 90, der seinerseits von dem Taktgeber 2 gespeist wird.However, since the frequency f is below the frequencies of the majority of the main components, the 'supply takes place of pulses to the adjustable frequency divider 40 through a fixed frequency divider 90, which in turn is fed by the clock 2.

Das von dem Generator 50 gelieferte Ausgangssignal mit der Frequenz f wird dem Modulationseingang des Modulators 65 zugeführt. Bei diesem Beispiel ist das Modulationssignal das vom Generator 50 gelieferte treppenförraige Signal, das nicht von seiner Gleichstromkomponente befreit ist, so daß es durch ein Minimum des Wertes 0 geht, wenn das Verschieberegister des Generators 50 nicht mit Nullen gefüllt ist; ferner ist die Modulationstiefe so eingestellt, daß das modulierteThe output signal with the frequency f supplied by the generator 50 becomes the modulation input of the modulator 65 supplied. In this example the modulation signal is the one provided by the generator 50 in the form of a staircase Signal that has not been stripped of its direct current component, so that it passes through a minimum of the Value 0 goes when the shift register of generator 50 is not filled with zeros; further is the Modulation depth set so that the modulated

209841/0812209841/0812

Signal gleichzeitig mit dem Modulationssignal zu Null wird. Das Ausgangssignal des Modulators 65 geht dann durch das Tiefpaßfilter 75, welches das Ausgangssignal des Modulators 65 glättet und dadurch die Unstetigkeiten zum Verschwinden bringt, die von den Treppenstufen sowohl des Modulationssignals als auch des modulierten Signals stammen.Signal at the same time as the modulation signal to zero will. The output of the modulator 65 then goes through the low pass filter 75, which the output of the modulator 65 smooths and thereby makes the discontinuities disappear, both of the stairs the modulation signal as well as the modulated signal originate.

Die Nulldurchgänge des Ausgangssignals des Generators werden mit Hilfe einer Decodierschaltung festgestellt, die hier nur aus einem einfachen llWeder~Noch"-Gatter besteht, das zwei Eingänge hat, die mit den beiden äußersten Stufen des Verschieberegisters im Generator 50 verbunden sind. Es läßt sich nämlich leicht nachprüfen, daß dieses Verschieberegister nur dann gleichzeitig eine Null in jeder dieser beiden äußersten Stufen aufweisen kann, wenn alle Stufen im Zustand 0 sind. Das Ausgangssignal des Gatters 35 wird den Eingängen 71, 72 und 73 der Generatoren 51, 52 bzw. 53 zugeführt und bewirkt dadurch die Rückstellungen auf die vorbestimmte Phase in den gewünschten Augenblicken.The zero crossings of the output signal of the generator are determined with the aid of a decoding circuit, which here consists only of a simple II neither - nor "gate which has two inputs which are connected to the two outermost stages of the shift register in generator 50. It can be namely easily verified that this V e rschieberegister can simultaneously have a zero in each of these two extreme steps only if all the stages in the state 0 is. the output of gate 35 will be the inputs 71, 72 and 73 of the generators 51, 52 or 53 and thereby causes the resets to the predetermined phase at the desired moments.

Eine Weiterbildung, durch welche die Wiederherstellung der Vokale und der stimmhaften Konsonanten verbessert wird, besteht darin, daß als Modulationssignal ein periodisches Signal der Periode 0=1/f verwendet wird, von dem ein Zyklus durch zwei sinusförmige Halbzyklen (bis auf die Gleichstromkomponenten, welche ihnen den Miniraalwert Null erteilen) mit der Dauer 0/4 für den Anstieg von Null bis zum Maximum und der Dauer 3 0/4 für den Wiederabfall vom Maximum auf Null gebildet ist.A training that improves the restoration of vowels and voiced consonants is that a periodic signal of period 0 = 1 / f is used as the modulation signal, of which one cycle is divided by two sinusoidal half-cycles (except for the direct current components that cause them to Give a minimum value of zero) with a duration of 0/4 for the Increase from zero to maximum and duration 3 0/4 is formed for the relapse from the maximum to zero.

Aufgrund dieser Unsymmetrie kann man dann nicht mehr einen Generator verwenden, dessen Verschieberegister q Stufen enthält, um ein Signal der Frequenz f mit HilfeBecause of this asymmetry, it is no longer possible to use a generator whose shift register q Includes stages to help a signal of frequency f

209841 /0812209841/0812

22H52122H521

von Portschalteimpulsen der Folgefrequenz 2 q f zu erhalten.of port switching pulses of the repetition frequency 2 q f.

Man kann jedoch beispielsweise einen gleichartigen Generator verwenden, dessen Verschieberegister 2 q Stufen enthält und anfänglich mit einer Ziffer "1" und (2q-1) Ziffern »0» gefüllt wird, wobei die Schleife zwischen dem Eingang und dem Ausgang des Verschieberegisters keinen Negator enthält.However, one can use a similar generator, for example, whose shift register 2 q Contains stages and is initially filled with a digit "1" and (2q-1) digits »0», the loop does not contain an inverter between the input and the output of the shift register.

Man verwendet dann ein Netzwerk von 2q Widerständen, von denen jeder wahlweise für eine Stelle der Ziffer "1" an die Spannungsquelle angeschlossen wird, wodurch es möglich ist, einem Zyklus des treppenförmigen Signals jede gewünschte Form zu erteilen.A network of 2q resistors is then used, each of which can optionally be used for one digit of the number "1" is connected to the voltage source, which makes it possible to cycle the staircase signal to give any desired shape.

Eine gegebene Phase der Hüllkurve des Ausgangssignals wird dadurch angezeigt, daß in einer gegebenen Stufe die einzige im Verschieberegister umlaufende Ziffer "1" festgestellt wird, und der Ausgang dieser Stufe kann direkt die Rückstellungen auf die vorbestimmte Phase steuern.A given phase of the envelope of the output signal is indicated by being in a given stage the only number "1" circulating in the shift register is determined, and the output of this stage can directly control the provisions to the predetermined phase.

Eine andere Lösung besteht darin, daß der Generator von Pig. 1 beibehalten wird, und daß ihm Portschalteimpulse zugeführt werden, deren Frequenz für die ansteigenden Abschnitte des Signals (Übergang des Verschieberegisters vom Zustand "lauter 0" zum Zustand "lauter 1") dreimal größer als für die abfallenden Signalabschnitte (Rückkehr in den Zustand "lauter 0") ist.Another solution is to use the Pig. 1 is retained, and that it port switching pulses are supplied, the frequency of which for the rising sections of the signal (transition of the shift register from the state "louder 0" to the state "louder 1") three times greater than for the falling ones Signal sections (return to the "louder 0" state).

2 0 9 8 Λ 1/08122 0 9 8 Λ 1/0812

Claims (3)

PatentansprücheClaims 1J Sprachsyntheseschaltung zur synthetischen Spracherzeugung auf Grund einer periodischen Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement be-* zieht und durch die Frequenzen und Amplituden von ρ sinusförmigen Hauptlcomponenten gebildet ist, wobei ρ eine veränderliche Zahl ist, die höchstens gleich einer festen Zahl n>1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen, die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Haupt !componenten gesteuert werden, und mit einer Addierschaltung, welche* die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch gekennzeichnet, daß zur Verwendung einer Hilfsinformation, die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten die Schwingungsfrequenz der Stimmbänder der entsprechenden Person ("Stimmhöhenfrequenz11) ist, eine Anordnung zur Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobei die Rückstellungen auf die vorbestimmten Phasen für die Hauptkomponenten gleichzeitig stattfinden und von der Hilfsinformation so gesteuert werden, daß sie mit der Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.1J Speech synthesis circuit for synthetic speech generation on the basis of periodic information that contains main information relating to a speech element and is formed by the frequencies and amplitudes of ρ sinusoidal main components, where ρ is a variable number that is at most equal to a fixed one Number n> 1, with η variable-frequency generators and η amplitude adjustment devices, which are each assigned to one of the η generators, the η generators and amplitude adjustment devices being controlled by the main information for the restoration of the main components, and with an adder circuit, which components Sum of the restored main components, characterized in that for the use of auxiliary information which is formed by an auxiliary frequency which, during the transmission of vowels and voiced consonants, the oscillation frequency of the vocal cords of the corresponding person ("vocal pitch frequencies z 11 ), an arrangement is provided for resetting each of the restored main components to a predetermined phase, the resets to the predetermined phases for the main components taking place simultaneously and being controlled by the auxiliary information so that they take place at the auxiliary frequency at least when the auxiliary frequency is the pitch frequency. 2. Sprachsyntheseschaltung nach Anspruch 1, dadurch gekennzeichnet, daß die Rückstellungen auf vorbestimmte Phasen mit der Hilfsfrequenz unabhängig davon durchgeführt werden, ob diese die Stimmhöhenfrequenz ist oder nicht, daß eine Amplitudenmodulationsanordnung für die2. Speech synthesis circuit according to claim 1, characterized in that that the resets to predetermined phases with the auxiliary frequency carried out independently whether this is the pitch frequency or not, that an amplitude modulation arrangement for the 209841 /0812209841/0812 Amplitudenmodulation des Summensignals der Hauptkomponenten durch ein Modulationssignal mit der Hilfsfrequenz vorgesehen ist, und daß die Rückstellungen auf vorbestimmte Phasen dann erfolgen, wenn der Augenblickswert des Modulationssignals durch ein Minimum geht.Amplitude modulation of the sum signal of the main components is provided by a modulation signal at the auxiliary frequency, and that the resets then take place on predetermined phases when the instantaneous value of the modulation signal has passed a minimum goes. 3. Sprachsyntheseschaltung nach Anspruch 2, gekennzeichnet durch einen frequenzveränderlichen Hilfsgenerator, der von der Hilfsinformation so gesteuert wird, daß er ein Signal mit der Hilfsfrequenz liefert, und daß jeder der η Generatoren und der Hilfsgenerator ein Verschieberegister-Widerstandsnetzwerks-Generator ist, wobei das Verschieberegister jedes der η Generatoren einen Phasensteuereingang aufweist, der die Rückstellung des Verschieberegisters in einen vorbestimmten Zustand ermöglicht, daß die Phasenrückstellanordnung durch den Hilfsgenerator und durch eine Decodieranordnung, die dann ein Steuersignal liefert, wenn das Verschieberegister des Hilfsgenerators sich in einem vorbestimmten Zustand befindet, gebildet ist, daß der Ausgang der Decodieranordnung mit den Phasensteuereingängen verbunden ist, und daß die Amplitudenmodulationsanordnung durch den Hilfsgenerator und durch einen Amplitudenmodulator, dessen Trägereingang mit dem Ausgang der Addierschaltung und dessen Modulationseingang mit dem Ausgang des Hilfsgenerators verbunden sind, gebildet ist.3. Speech synthesis circuit according to claim 2, characterized by a variable frequency auxiliary generator that is controlled by the auxiliary information so that it is a Signal with the auxiliary frequency supplies, and that each of the η generators and the auxiliary generator is a shift register resistor network generator is, wherein the shift register of each of the η generators has a phase control input that the resetting of the Shift register in a predetermined state enables the phase reset arrangement by the Auxiliary generator and by a decoding arrangement, which then supplies a control signal when the shift register of the auxiliary generator is in a predetermined state, is formed that the output of the Decoding arrangement is connected to the phase control inputs, and that the amplitude modulation arrangement by the auxiliary generator and by an amplitude modulator, whose carrier input with the output the adding circuit and its modulation input are connected to the output of the auxiliary generator is. 209841/0812209841/0812
DE19722214521 1971-03-26 1972-03-24 Speech synthesis circuit Pending DE2214521A1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7110824A FR2130952A5 (en) 1971-03-26 1971-03-26

Publications (1)

Publication Number Publication Date
DE2214521A1 true DE2214521A1 (en) 1972-10-05

Family

ID=9074226

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19722214521 Pending DE2214521A1 (en) 1971-03-26 1972-03-24 Speech synthesis circuit

Country Status (10)

Country Link
US (1) US3830977A (en)
AU (1) AU463038B2 (en)
BE (1) BE781116A (en)
DE (1) DE2214521A1 (en)
FR (1) FR2130952A5 (en)
GB (1) GB1364775A (en)
IT (1) IT952370B (en)
NL (1) NL7203873A (en)
SE (1) SE375178B (en)
ZA (1) ZA721392B (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1541429A (en) * 1975-12-19 1979-02-28 Int Computers Ltd Speech synthesising apparatus
US4051331A (en) * 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4566117A (en) * 1982-10-04 1986-01-21 Motorola, Inc. Speech synthesis system
US5140639A (en) * 1990-08-13 1992-08-18 First Byte Speech generation using variable frequency oscillators
WO2014202770A1 (en) 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3268660A (en) * 1963-02-12 1966-08-23 Bell Telephone Labor Inc Synthesis of artificial speech
US3394228A (en) * 1965-06-03 1968-07-23 Bell Telephone Labor Inc Apparatus for spectral scaling of speech
US3491205A (en) * 1966-09-29 1970-01-20 Philco Ford Corp Plural formant speech synthesizer
US3499991A (en) * 1967-08-01 1970-03-10 Philco Ford Corp Voice-excited vocoder
GB1225142A (en) * 1967-11-29 1971-03-17

Also Published As

Publication number Publication date
BE781116A (en) 1972-07-17
US3830977A (en) 1974-08-20
IT952370B (en) 1973-07-20
FR2130952A5 (en) 1972-11-10
NL7203873A (en) 1972-09-28
AU463038B2 (en) 1975-06-26
ZA721392B (en) 1972-11-29
AU4037572A (en) 1973-09-27
GB1364775A (en) 1974-08-29
SE375178B (en) 1975-04-07

Similar Documents

Publication Publication Date Title
DE2229149A1 (en) Method of transmitting speech
DE2162486A1 (en) Digitally controlled pulse generator
DE2401452A1 (en) TWO CHANNEL A / D CONVERTER
DE2840596A1 (en) VOICE SYNTHESIZER
DE1296175B (en) Arrangement for the numerical encryption of analog signals
DE2530380A1 (en) VOICE SYNTHETIZER SYSTEM
DE2805478C2 (en) Circuit arrangement for the discrimination of speech signals
DE2644478A1 (en) DIFFERENTIAL PHASE TOUCH MODULATOR
DE2523625A1 (en) DIGITAL FILTER
DE2850059A1 (en) DIGITAL / ANALOG CONVERTER
DE2214521A1 (en) Speech synthesis circuit
CH647112A5 (en) CIRCUIT ARRANGEMENT FOR OBTAINING A CONTROL VOLTAGE PROPORTIONAL TO THE PULSE DENSITY OF A PULSE SEQUENCE.
DE2051589A1 (en) Arrangement for the synthesis of a signal
DE2850240C2 (en) Method for determining the quantization distortion in a telephone system operating with pulse code modulation and device for carrying out this method
DE1902376B2 (en) Electronic musical instrument
DE2062589C3 (en) Method for determining the fundamental frequency of an at least temporarily periodic signal
DE3124194A1 (en) "FREQUENCY DETECTION"
DE2613930A1 (en) Regulator circuit for digital phase control - uses two counters with constant frequency pulse source to minimise errors due to variable time parameters and degraded pulse shape
DE1122581B (en) Method and circuit arrangement for the approximate simulation of the short-term spectra of speech signals transmitted according to the vocoder method
DE2624636B2 (en) Delta modulation coding arrangement
DE2429744C3 (en) Circuit for the synthesis of signals of a certain, given bandwidth
DE2227476C2 (en) Method and arrangement for generating quasi-synthetic speech in a vocoder
DE1937258C3 (en) Device for generating the Fourier transform of a function
DE3045018C2 (en)
DE2834751C2 (en)

Legal Events

Date Code Title Description
OHN Withdrawal