[go: up one dir, main page]

DE69033011T2 - DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION - Google Patents

DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION

Info

Publication number
DE69033011T2
DE69033011T2 DE69033011T DE69033011T DE69033011T2 DE 69033011 T2 DE69033011 T2 DE 69033011T2 DE 69033011 T DE69033011 T DE 69033011T DE 69033011 T DE69033011 T DE 69033011T DE 69033011 T2 DE69033011 T2 DE 69033011T2
Authority
DE
Germany
Prior art keywords
filter
component
signal
speech
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69033011T
Other languages
German (de)
Other versions
DE69033011D1 (en
Inventor
Ira Gerson
Mark Jasiuk
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of DE69033011D1 publication Critical patent/DE69033011D1/en
Application granted granted Critical
Publication of DE69033011T2 publication Critical patent/DE69033011T2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

An adaptive spectral postfilter (108) in a synthesized speech platform has a denominator characteristic that corresponds to a preceding LPC filter stage (106) and a numerator characteristic that is developed as a function of the denominator characteristic through application of spectral smoothing techniques. This allows the numerator to track the denominator without the introduction of spectral distortion that would otherwise affect the processing in an adverse way.

Description

Technisches GebietTechnical area

Diese Erfindung bezieht sich im allgemeinen auf Sprachcodierer und im besonderen auf digitale Sprachcodierer, die Nachfilter verwenden, um die Sprachqualität zu verbessern.This invention relates generally to speech coders and more particularly to digital speech coders that use post-filters to improve speech quality.

Hintergrund der ErfindungBackground of the invention

Sprachcodierer und -decoder sind in der Technik bekannt. Einige Sprachcodierer wandeln analoge Stimmabtastwerte in digitalisierte Darstellungen um und stellen nachfolgend die spektrale Sprachinformation durch die Verwendung linearer Vorhersagecodierung dar (siehe z. B. Dokument EP-A-0 294 020). Andere Sprachcodierer verbessern die gewöhnlichen linearen Vorhersagecodierungstechniken (LPC) durch Bereitstellen eines Erregersignals, welches in Beziehung zu dem ursprünglichen Stimmsignal steht.Speech coders and decoders are well known in the art. Some speech coders convert analog voice samples into digitized representations and subsequently represent the spectral speech information by using linear predictive coding (see e.g. document EP-A-0 294 020). Other speech coders improve upon conventional linear predictive coding (LPC) techniques by providing an excitation signal related to the original voice signal.

Das US-Patent Nr. 4,817,157 beschreibt einen digitalen Sprachcodierer und -decoder, der eine verbesserte Vektorerregerquelle hat, wobei auf ein Codebuch von Codebucherregervektoren zugegriffen wird, um ein Codebucherregersignal auszuwählen, welches für die verfügbare Information am besten geeignet ist, und der verwendet wird, um ein synthetisiertes Sprachsignal von einem LPC-Filter zu liefern, welches das Original gut darstellt.US Patent No. 4,817,157 describes a digital speech coder and decoder having an improved vector excitation source, accessing a codebook of codebook excitation vectors to select a codebook excitation signal that is best suited to the available information and used to provide a synthesized speech signal from an LPC filter that closely represents the original.

Sobald das synthetisierte Sprachsignal entwickelt worden ist, werden häufig Verschiedene Nach-LPC-Filter Verwendet, um das Signal weiter zu konditionieren. Eines dieser Filter ist ein adaptives Spektral-Nachfilter (welches typischerweise eingesetzt wird, um die Wahrnehmungsqualität der synthetischen Sprache zu verbessern), und ein anderes ist ein Nach-Anhebungsfilter (welches Helligkeit zu dem synthetischen Sprachergebnis beiträgt).Once the synthesized speech signal has been developed, various post-LPC filters are often used to further condition the signal. One of these filters is an adaptive spectral post-filter (which is typically used to improve the perceptual quality of the synthetic speech), and another is a post-emphasis filter (which adds brightness to the synthetic speech result).

Ein adaptives Spektral-Nachfilter besitzt typischerweise die allgemeine Form: An adaptive spectral postfilter typically has the general form:

wobei 0 &le; &eta; &le; &nu; < 1where 0 ? ? ? &nu; < 1

und 1/1 - A(z) das zugeordnete LPC-Filter darstellt.and 1/1 - A(z) represents the associated LPC filter.

Der Term im Nenner in der o. g. Nachfilterdarstellung betont die Formanten (Teiltonkomponenten) in dem synthetischen Signalspektrum, während die Spektraltäler gedämpft werden. (Für die beiden Extremfälle gilt: das Setzen von &nu; = 0 resultiert in einem Allpassfilter, während das Setzen von &nu; = 1 in einem Nennerterm resultiert, welcher derselbe wie das zugeordnete LPC-Filter ist.) Der Zählerterm Versucht die allgemeine Spektralform, die durch den Nenner eingeführt ist, zu begrenzen. In Anwendungen nach dem Stand der Technik ist &nu; oft auf ungefähr 0,8 und &eta; auf 0,5 gesetzt.The denominator term in the above post-filter representation emphasizes the formants (partials) in the synthetic signal spectrum while attenuating the spectral valleys. (For the two extreme cases, setting ν = 0 results in an all-pass filter, while setting ν = 1 results in a denominator term that is the same as the associated LPC filter.) The numerator term attempts to constrain the general spectral shape introduced by the denominator. In state-of-the-art applications, ν is often set to approximately 0.8 and η to 0.5.

In der Praxis ist das Zählerpolynom nur teilweise bei der Nachführung der Spektralform des Nenners erfolgreich (tatsächlich kippen die spektralen Eigenschaften des Filters mit der Zeit), und die Diskrepanz offenbart sich typischerweise selbst als eine zeitveränderlichen Modulation der nachgefilterten Sprachhelligkeit.In practice, the numerator polynomial is only partially successful in tracking the spectral shape of the denominator (in fact, the spectral properties of the filter tilt over time), and the discrepancy typically reveals itself as a time-varying modulation of the postfiltered speech brightness.

Demgemäß besteht ein Bedarf für ein Verfahren der Nachfilterung synthetisierter Sprache, welches sowohl die Wahrnehmungsqualität der synthetischen brache verbessert als auch gleichzeitig schädliche Auswirkungen auf die Sprachhelligkeit minimiert. Vorzugsweise soll die Sprachhelligkeit selbst besser als bisher gesteuert werden.Accordingly, there is a need for a method of post-filtering synthesized speech that both improves the perceptual quality of the synthetic speech and at the same time minimizes harmful effects on speech brightness. Preferably, speech brightness itself should be controlled better than before.

Zusammenfassung der ErfindungSummary of the invention

Gemäß der vorliegenden Erfindung wird ein Verfahren zur Erzeugung eines synthetisierten Sprachsignals bereitgestellt, welches die folgenden Schritte umfaßt:According to the present invention, there is provided a method for generating a synthesized speech signal, which comprises the following steps:

Bereitstellung eines Erregersignals an ein lineares Vohersagecodierungs-(LPC)Filter; Bereitstellung eines synthetisierten Sprachsignals von dem LPC-Filter; Bereitstellung eines Sprachsynthese-Nachfilters, welches eine erste Komponente und eine zweite Komponente erfordert; Bereitstellung der ersten Komponente, die einen ersten Satz von Koeffizienten enthält; wobei das Verfahren durch die folgenden Schritte gekennzeichnet ist: Umwandlung wenigstens einiger dieses ersten Satzes von Koeffizienten in einen Autokorrelationsdomänensatz von Parametern; spektrale Glättung des Autokorrelationsdomänensatzes von Parametern, um einen modifizierten ersten Satz von Koeffizienten bereitzustellen; Benutzung des modifizierten ersten Satzes von Koeffizienten, um die zweite Komponente zur Benutzung durch das Sprachsynthese-Nachfilter bereitzustellen; Filterung des synthetisierten Sprachsignals in dem Sprachsynthese-Nachfilter durch Benutzung der ersten Komponente und der zweiten Komponente, um ein gefiltertes synthetisiertes Sprachsignal bereitzustellen, wobei die zweite Komponente angepaßt nachfolgt und eine allgemeine Spektralform der ersten Komponente begrenzt; und akkustische Wiedergabe des gefilterten synthetisierten Sprachsignals.Providing an excitation signal to a linear predictive coding (LPC) filter; providing a synthesized speech signal from the LPC filter; providing a speech synthesis post-filter requiring a first component and a second component; providing the first component including a first set of coefficients; the method being characterized by the steps of: converting at least some of said first set of coefficients into an autocorrelation domain set of parameters; spectrally smoothing the autocorrelation domain set of parameters to provide a modified first set of coefficients; using the modified first set of coefficients to provide the second component for using the speech synthesis post-filter; filtering the synthesized speech signal in the speech synthesis post-filter using the first component and the second component to provide a filtered synthesized speech signal, the second component adaptively following and delimiting a general spectral shape of the first component; and acoustically reproducing the filtered synthesized speech signal.

In einer ersten Ausführungsform werden Z-Transformations- (filter) Koeffizienten, die die erste Komponente darstellen, in die Autokorrelationsdomäne umgewandelt. Eine spektrale Glättungstechnik, die eine Bandbreitenerweiterungsfunktion verwendet, wird dann auf die Autokorrelationssequenz angewendet, und die Polynomkoeffizienten der zweiten Komponente werden von der modifiziert Autokorrelationssequenz über die Levinson-Rekursion berechnet. Die erste Komponente wird dann als Nenner und die zweite Komponente als Zähler benutzt, in der oben angegebenen Filtercharakteristik.In a first embodiment, Z-transform (filter) coefficients representing the first component are converted to the autocorrelation domain. A spectral smoothing technique using a bandwidth expansion function is then applied to the autocorrelation sequence, and the polynomial coefficients of the second component are calculated from the modified autocorrelation sequence via Levinson recursion. The first component is then used as the denominator and the second component as the numerator in the filter characteristic given above.

Über diesen Prozeß wird das Zählerpolynom durch eine spektral geglättete Version des A(z/&nu;) Polynoms ersetzt. Die Bandbreitenerweiterung der Formante verändert die geglättete spektrale Hüllkurve nicht. Deshalb minimiert die spektral geglättete bandbreitenerweiterte Version des A(z/&nu;) Polynoms effektiv die zeitveränderliche Spektralneigung und gestattet dem Zähler der allgemeinen Spektralform des Nenners angepaßt nachzufolgen und diese zu begrenzen.Through this process, the numerator polynomial is replaced by a spectrally smoothed version of the A(z/ν) polynomial. The bandwidth expansion of the formant does not alter the smoothed spectral envelope. Therefore, the spectrally smoothed bandwidth expanded version of the A(z/ν) polynomial effectively minimizes the time-varying spectral slope and allows the numerator to closely track and limit the general spectral shape of the denominator.

In einer anderen Ausführungsform kann ein zusätzliches Nach- Anhebungsfilter verwendet werden, um mehr Kontrolle über nachgefilterte Sprachhelligkeit zu bieten. Dieses Filter ist ein Filter erster Ordnung der FormIn another embodiment, an additional post-emphasis filter may be used to provide more control over post-filtered speech brightness. This filter is a first order filter of the form

(z) = 1 -uz&supmin;¹,(z) = 1 -uz⊃min;¹,

wobei typischerweise 0,2 &le; u &le; 0,5 ist.where typically 0.2 ≤ u ≤ 0.5.

Eine beispielhafte Ausführungsform der Erfindung wird nun unter Bezugnahme auf die angefügten Zeichnungen beschrieben.An exemplary embodiment of the invention will now be described with reference to the accompanying drawings.

Kurzbeschreibung der ZeichnungenShort description of the drawings

Fig. 1 umfaßt eine diagrammartige Blockdarstellung eines Funkgerätes, welches gemäß der Erfindung konfiguriert ist; undFig. 1 comprises a diagrammatic block representation of a radio device configured in accordance with the invention; and

Fig. 2 ist ein Flußbild, welches die Charakterisierung eines adaptiven Spektral-Nachfilters gemäß der vorliegenden Erfindung darstellt.Figure 2 is a flow chart illustrating the characterization of an adaptive spectral postfilter according to the present invention.

Bester Weg zur Ausführung der ErfindungBest way to carry out the invention

Das US-Patent Nr. 4,817,157, mit dem Titel "Digital Speech Coder Having Improved Vector Excitation Source" (Digitaler Spachcodierer mit verbesserter Vektorerregerquelle), am 28. März 1989 für Ira Gerson erteilt, beschreibt besonders detailliert einen digitalen Sprachcodierer und -decoder. Wie in der o. g. Referenz detailliert angegeben ist, kann diese Erfindung in einem Sprachcodierer (oder Decoder) ausgeführt sein, die einen geeigneten digitalen Signalprozessor verwendet, wie beispielsweise ein Gerät der Motorola DSP56000 Familie.U.S. Patent No. 4,817,157, entitled "Digital Speech Coder Having Improved Vector Excitation Source," issued March 28, 1989 to Ira Gerson, describes in particular detail a digital speech coder and decoder. As detailed in the above reference, this invention may be embodied in a speech coder (or decoder) using a suitable digital signal processor, such as a device in the Motorola DSP56000 family.

In Fig. 1 ist ein die Erfindung verkörperndes Funkgerät 100 gezeigt, welches eine Antenne 102 zum Empfang eines sprachcodierten Funkfrequenz-(RF)Signals 101 enthält. Eine RF-Einheit 103 verarbeitet das empfangene Signal, um die spracheodierte Information wiederzugewinnen. Diese Information wird an einen Parameterdecoder 105 bereitgestellt, der Steuerparameter für verschiedene nachfolgende Prozesse entwickelt. Eine Erregerquelle 104, wie sie oben beschrieben ist, nutzt die an sie bereitgestellten Parameter, um ein Erregersignal zu erzeugen. Das resultierende Erregersignal von der Erregerquelle 104 wird an ein LPC-Filter 106 geliefert, das ein synthetisiertes Sprachsignal gemäß der codierten Information hervorbringt. Das synthetisierte Sprachsignal wird dann tonhöhen-nachgefiltert 107 und spektral nachgefiltert 108, um die Qualität der rekonstruierten Sprache zu verbessern. Wenn gewünscht, kann auch ein Nach-Anhebungsfilter 109 enthalten sein, um das resultierende Sprachsignal weiter zu verbessern. (Zusätzliche, das Spektral-Nachfilter 108 und das Nach-Anhebungsfilter 109 betreffende Details werden unten bereitgestellt.)In Fig. 1, a radio device 100 embodying the invention is shown, which has an antenna 102 for receiving a voice-coded radio frequency (RF) signal 101. An RF unit 103 processes the received signal to recover the speech encoded information. This information is provided to a parameter decoder 105 which develops control parameters for various subsequent processes. An excitation source 104, as described above, uses the parameters provided to it to generate an excitation signal. The resulting excitation signal from the excitation source 104 is provided to an LPC filter 106 which produces a synthesized speech signal according to the encoded information. The synthesized speech signal is then pitch post-filtered 107 and spectrally post-filtered 108 to improve the quality of the reconstructed speech. If desired, a post-emphasis filter 109 may also be included to further enhance the resulting speech signal. (Additional details concerning the spectral post-filter 108 and the post-emphasis filter 109 are provided below.)

Das Sprachsignal wird dann in einer Audioverarbeitungseinheit 111 verarbeitet und hörbar durch einen Tonwandler wiedergegeben. Die Erregungsquelle 104, das LPC-Filter 106, das Tonhöhennachfilter 107, das angepaßte Spektral-Nachfilter 108 und das Nach-Anhebungsfilter 109 können alle durch eine Programmierung eines DSP 113 bereitgestellt werden.The speech signal is then processed in an audio processing unit 111 and reproduced audibly by a sound transducer. The excitation source 104, the LPC filter 106, the pitch post-filter 107, the matched spectral post-filter 108 and the post-emphasis filter 109 can all be provided by programming a DSP 113.

Gemäß dieser Erfindung ist das adaptive spektrale Nachfilter 108 gekennzeichnet durch eine erste Komponente (einen Nenner, der sich auf die Filtercharakteristiken des LPC-Filters 106 bezieht) und eine zweite Komponente (einen Zähler, der der allgemeinen Spektralform des Nenners folgt, um diese zu begrenzen). Die allgemeine Form eines solchen Filters ist in einem Artikel mit dem Titel "Real-Time Vector APC Speech Coding at 4800 bps With Adaptive Postfiltering" (Echtzeit Vektor-APC-Sprachcodierung bei 4800 bps mit adaptiver Nachfilterung), von Chen und Gersho beschrieben, der in der Ausgabe vom April 1987 des Protokolls der Internationalen Konferenz für Akustik und Signalverarbeitung auf den Seiten 2185-2188 erschienen ist.According to this invention, the adaptive spectral postfilter 108 is characterized by a first component (a denominator related to the filter characteristics of the LPC filter 106) and a second component (a numerator that follows the general spectral shape of the denominator to limit it). The general form of such a filter is described in an article entitled "Real-Time Vector APC Speech Coding at 4800 bps With Adaptive Postfiltering". Vector APC speech coding at 4800 bps with adaptive post-filtering) by Chen and Gersho, which appeared in the April 1987 issue of the Proceedings of the International Conference on Acoustics and Signal Processing, pages 2185-2188.

Gemäß dieser Erfindung ist der Zähler durch Anwendung spektraler Glättungstechniken auf das Nennerpolynom entwickelt. Diese Techniken sind in einem Artikel mit dem Titel "Spectral Smoothing Technique in PARCOR Speech Analysis - Synthesis", von Tohkura, Itakura und Hashimoto beschrieben, welcher erschienen ist in der Ausgabe vom Dezember 1978 der I. E. E. E. Sitzungsberichte über Akustik, Sprache und Signalverarbeitung (I. E. E. E. Transactions on Acoustics, Speech, and Signal Processing).According to this invention, the numerator is developed by applying spectral smoothing techniques to the denominator polynomial. These techniques are described in an article entitled "Spectral Smoothing Technique in PARCOR Speech Analysis - Synthesis," by Tohkura, Itakura, and Hashimoto, which appeared in the December 1978 issue of I. E. E. E. Transactions on Acoustics, Speech, and Signal Processing.

In einer Ausführungsform sind die Z-Transformationskoeffizienten, die den Nenner darstellen, in die Autokorrelationsdomäne konvertiert. (Beispiele einer solchen Umwandlung können in Markel, J. D.; Gray, A. H., Jr.; Linear Prediction of Speech [Lineare Vorhersage von Sprache]; Springer-Verlag, Berlin, Heidelberg, New York, 1976 gefunden werden.) Die Funktion der spektralen Glättungstechnik und Bandbreitenerweiterung wird dann auf die Autokorrelationssequenz angewendet, mit den Zählerpolynomkoeffizienten, die über die Levinson-Rekursion aus der modifizierten Autokorrelationssequenz berechnet werden. In einer Ausführungsform werden die Autokorrelationskoeffizienten mit den nachfolgenden Faktoren multipliziert, um die resultierenden Zählerkoeffizienten bereitzustellen:In one embodiment, the Z-transform coefficients representing the denominator are converted to the autocorrelation domain. (Examples of such a conversion can be found in Markel, J. D.; Gray, A. H., Jr.; Linear Prediction of Speech; Springer-Verlag, Berlin, Heidelberg, New York, 1976.) The spectral smoothing and bandwidth expansion function is then applied to the autocorrelation sequence, with the numerator polynomial coefficients calculated via Levinson recursion from the modified autocorrelation sequence. In one embodiment, the autocorrelation coefficients are multiplied by the following factors to provide the resulting numerator coefficients:

Autokorrelationsverzögerung Spektraler GlättungsfaktorAutocorrelation delay Spectral smoothing factor

0 1,00000000 1.0000000

1 0,92307691 0.9230769

2 0,72527472 0.7252747

3 0,48351643 0.4835164

4 0,27197804 0.2719780

5 0,12798965 0.1279896

6 4,9773753E-026 4,9773753E-02

7 1,5718028E-027 1,5718028E-02

8 3,9295070E-038 3,9295070E-03

9 7,4847753E-049 7,4847753E-04

10 1,0206513E-0410 1,0206513E-04

Der Nenner und der Zähler werden dann benutzt, um das angepaßte spektrale Nachfilter 108 zu charakterisieren.The denominator and numerator are then used to characterize the matched spectral postfilter 108.

Es würde natürlich auch möglich sein, die LPC-Filterinformation direkt zu nutzen, und daraus den Zählerterm durch ein ähnliches Verfahren zu entwickeln, da die LPC-Filterinformation genutzt wird, um den Nennerterm wie oben beschrieben zu entwickeln.It would of course also be possible to use the LPC filter information directly and develop the numerator term from it by a similar procedure, since the LPC filter information is used to develop the denominator term as described above.

Über dieses Verfahren wird das Zählerpolynom durch eine spektral geglättete Version des Nennerpolynoms bereitgestellt. Die spektral geglättete bandbreitenerweiterte Version des Nennerpolynoms minimiert die zeitveränderliche Spektralneigung effektiv und gestattet dem Zähler, der allgemeinen Spektralform des Nenners angepaßt zu folgen und diese zu begrenzen. Basierend auf Hörtests wurde ein Bandbreitenerweiterungsfaktor (welcher den Grad der Glättung spezifiziert, die auf den Nenner ausgeführt wird) von ungefähr 1.200 Hz genutzt.Through this method, the numerator polynomial is provided by a spectrally smoothed version of the denominator polynomial. The spectrally smoothed bandwidth-extended version of the denominator polynomial effectively minimizes the time-varying spectral slope and allows the numerator to closely follow and limit the general spectral shape of the denominator. Based on listening tests, a bandwidth-extension factor (which specifies the amount of smoothing performed on the denominator) of approximately 1,200 Hz was used.

Das Flußbild in Fig. 2 hilft, das nun beschriebene Verfahren der Nachfiltercharakterisierung zu verstehen. Wie vorher erläutert wurde, ist das angepaßte spektrale Nachfilter durch eine erste Komponente, oder einer Nenner, und eine zweite Komponente, oder einen Zähler, gekennzeichnet. Die erste Komponente wird im Block 202 bereitgestellt und kann ausgedrückt werden durch:The flow chart in Fig. 2 helps to understand the postfilter characterization process now described. As previously explained, the matched spectral postfilter is characterized by a first component, or denominator, and a second component, or numerator. The first component is provided in block 202 and can be expressed by:

1 - A(z/&nu;).1 - A(z/ν).

In dem nachfolgenden Schritt 203 werden die Z-Transformationskoeffizienten in die Autokorrelationsdomäne konvertiert. Im Block 204 wird eine Funktion spektraler Glättung und Bandbreitenerweiterung auf die Autokorrelationssequenz angewendet, und in dem nachfolgenden Block 205 werden die Zählerpolynomkoeffizienten (zweite Komponente) aus der Autokorrelationssequenz berechnet, die in dem vorhergehenden Schritt 204 durch die Verwendung der Levinson-Rekursion modifiziert wurde. Der Zähler, oder die zweite Komponente, kann ausgedrückt werden durch:In the subsequent step 203, the Z-transform coefficients are converted to the autocorrelation domain. In block 204, a spectral smoothing and bandwidth expansion function is applied to the autocorrelation sequence, and in the subsequent block 205, the numerator polynomial coefficients (second component) are calculated from the autocorrelation sequence modified in the previous step 204 by using Levinson recursion. The numerator, or second component, can be expressed by:

1 - B(z).1 - B(z).

Schließlich werden im Schritt 206 die ersten und zweiten Komponenten (Nenner und Zähler) benutzt, um das angepaßte spektrale Nachfilter zu kennzeichnen, welches dargestellt werden kann als: Finally, in step 206, the first and second components (denominator and numerator) are used to characterize the matched spectral postfilter, which can be represented as:

Das Nach-Anhebungsfilter 109 kann bereitgestellt werden, um mehr Kontrolle über die nachgefilterte Sprachhelligkeit zu bieten. Dieses Filter ist ein Filter erster Ordnung der FormThe post-emphasis filter 109 may be provided to provide more control over the post-filtered speech brightness. This filter is a first order filter of the form

(z) = 1 - uz&supmin;¹(z) = 1 - uz⊃min;¹

Claims (6)

1. Verfahren zur Erzeugung eines synthetisierten Sprachsignals, die folgenden Schritte umfassend:1. A method for generating a synthesized speech signal, comprising the following steps: A) Bereitstellung eines Erregersignals an ein lineares Vorhersagecodierungsfilter;A) Providing an excitation signal to a linear predictive coding filter; B) Bereitstellung eines synthetisierten Sprachsignals von dem linearen Vohersagecodierungsfilter;B) providing a synthesized speech signal from the linear predictive coding filter; C) Bereitstellung eines Sprachsynthese-Nachfilters, das eine erste Komponente und eine zweite Komponente erfordert;C) providing a speech synthesis post-filter requiring a first component and a second component ; D) Bereitstellung der ersten Komponente, die einen ersten Satz von Koeffizienten enthält;D) providing the first component containing a first set of coefficients; E) Umwandlung wenigstens einiger Koeffizienten von diesem ersten Satz Von Koeffizienten in einen Autokorrelationsdomänensatz von Parametern;E) converting at least some coefficients of this first set of coefficients into an autocorrelation domain set of parameters; F) spektrale Glättung des Autokorrelationsdomänensatzes von Parametern, um einen modifizierten ersten Satz von Koeffizienten bereitzustellen;F) spectral smoothing of the autocorrelation domain set of parameters to provide a modified first set of coefficients; G) Benutzung des modifizierten ersten Satzes von Koeffizienten, um die zweite Komponente, für die Benutzung durch das Sprachsynthese-Nachfilter bereitzustellen;G) using the modified first set of coefficients to provide the second component for use by the speech synthesis post-filter; H) Filterung des synthetisierten Sprachsignals in dem Sprachsynthese-Nachfilter, welches die erste Komponente und die zweite Komponente benutzt, um ein gefiltertes synthetisiertes Sprachsignal bereitzustellen und;H) filtering the synthesized speech signal in the speech synthesis post-filter using the first component and the second component to provide a filtered synthesized speech signal and; I) hörbare Wiedergabe des gefilterten synthetisierten Sprachsignals.I) audible reproduction of the filtered synthesized speech signal. 2. Verfahren zur Erzeugung eines synthetisierten Sprachsignals nach Anspruch 1, weiter die folgenden Schritte umfassend:2. A method for generating a synthesized speech signal according to claim 1, further comprising the following steps: A) Empfang eines Funkfrequenz-(RF) Signals, welches codierte Sprachinformationen enthält;A) Receiving a radio frequency (RF) signal containing encoded voice information; B) Wiedergewinnung eines Erregersignals aus den codierten Sprachinformationen;B) recovery of an excitation signal from the coded speech information; C) Bereitstellung des Erregersignals an ein lineares Vorhersagecodierungs-(LPC) Filter;C) providing the excitation signal to a linear predictive coding (LPC) filter; und wobei eine erste Komponente für die Benutzung durch das Sprachsynthese-Nachfilter vorhanden ist.and wherein a first component is provided for use by the speech synthesis post-filter. 3. Verfahren nach Anspruch 1 oder 2, wobei das LPC-Filter wenigstens teilweise definiert ist durch den Ausdruck:3. The method of claim 1 or 2, wherein the LPC filter is at least partially defined by the expression: 1/1 - A(z)1/1 - A(z) 4. Verfahren nach Anspruch 1 oder 2, wobei die erste Komponente des Sprachsynthese-Nachfilters von der Form ist:4. The method of claim 1 or 2, wherein the first component of the speech synthesis post-filter is of the form: 1 - A(z/&nu;)1 - A(z/&nu;) wenn es in der Z-Transformationsschreibweise dargstellt ist.when it is represented in Z-transform notation . 5. Verfahren nach Anspruch 1 oder 2, weiter die folgenden Schritte enthaltend:5. The method of claim 1 or 2, further comprising the following steps: A) Filterung des synthetisierten Sprachsignals in einem Nach-Anhebungsfilter, das in Z-Transformationsschreibweise im wesentlichen definiert ist durch:A) Filtering the synthesized speech signal in a post-emphasis filter, which in Z-transform notation is essentially defined by: (z) = 1 - uz&supmin;¹(z) = 1 - uz⊃min;¹ wobei 0,2 &le; u &le; 0,5.where 0.2 ≤ u ≤ 0.5. 6. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Schritt der Berechnung den Schritt der Multiplikation enthält.6. A method according to any preceding claim, wherein the step of calculating includes the step of multiplying.
DE69033011T 1989-10-17 1990-09-17 DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION Expired - Lifetime DE69033011T2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US42292689A 1989-10-17 1989-10-17
PCT/US1990/005190 WO1991006093A1 (en) 1989-10-17 1990-09-17 Digital speech decoder having a postfilter with reduced spectral distortion

Publications (2)

Publication Number Publication Date
DE69033011D1 DE69033011D1 (en) 1999-04-22
DE69033011T2 true DE69033011T2 (en) 2001-10-04

Family

ID=23676980

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69033011T Expired - Lifetime DE69033011T2 (en) 1989-10-17 1990-09-17 DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION

Country Status (8)

Country Link
EP (1) EP0570362B1 (en)
JP (1) JP3158434B2 (en)
CN (1) CN1078371C (en)
AT (1) ATE177867T1 (en)
AU (1) AU635342B2 (en)
DE (1) DE69033011T2 (en)
ES (1) ES2131498T3 (en)
WO (1) WO1991006093A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729247A1 (en) * 1995-01-06 1996-07-12 Matra Communication SYNTHETIC ANALYSIS-SPEECH CODING METHOD
FR2729246A1 (en) * 1995-01-06 1996-07-12 Matra Communication SYNTHETIC ANALYSIS-SPEECH CODING METHOD
FR2729244B1 (en) * 1995-01-06 1997-03-28 Matra Communication SYNTHESIS ANALYSIS SPEECH CODING METHOD
JP2993396B2 (en) * 1995-05-12 1999-12-20 三菱電機株式会社 Voice processing filter and voice synthesizer
DE19643900C1 (en) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Audio signal post filter, especially for speech signals
US6137844A (en) * 1998-02-02 2000-10-24 Oki Telecom, Inc. Digital filter for noise and error removal in transmitted analog signals

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
JP2535833B2 (en) * 1986-07-03 1996-09-18 日本電気株式会社 Integrated circuit
US4852169A (en) * 1986-12-16 1989-07-25 GTE Laboratories, Incorporation Method for enhancing the quality of coded speech
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source

Also Published As

Publication number Publication date
EP0570362A4 (en) 1993-07-01
AU635342B2 (en) 1993-03-18
CN1051101A (en) 1991-05-01
WO1991006093A1 (en) 1991-05-02
DE69033011D1 (en) 1999-04-22
ES2131498T3 (en) 1999-08-01
ATE177867T1 (en) 1999-04-15
AU6411490A (en) 1991-05-16
CN1078371C (en) 2002-01-23
EP0570362A1 (en) 1993-11-24
EP0570362B1 (en) 1999-03-17
JPH05500573A (en) 1993-02-04
JP3158434B2 (en) 2001-04-23

Similar Documents

Publication Publication Date Title
DE69604526T2 (en) Method for adjusting the noise masking level in an analysis-by-synthesis speech coder with a perceptual short-term filter
DE69608947T2 (en) Method of analyzing an audio frequency signal by linear prediction, and application to a method of encoding and decoding an audio frequency signal
DE69615839T2 (en) speech
DE69618422T2 (en) Speech decoding method and portable terminal
DE69613910T2 (en) Adaptive speech compression system based on a codebook
DE69916321T2 (en) CODING OF AN IMPROVEMENT FEATURE FOR INCREASING PERFORMANCE IN THE CODING OF COMMUNICATION SIGNALS
DE69529672T2 (en) LANGUAGE CODING SYSTEM
DE60218385T2 (en) Post-filtering of coded speech in the frequency domain
DE60011051T2 (en) CELP TRANS CODING
DE69910240T2 (en) DEVICE AND METHOD FOR RESTORING THE HIGH FREQUENCY PART OF AN OVER-SAMPLE SYNTHETIZED BROADBAND SIGNAL
EP1825461B1 (en) Method and apparatus for artificially expanding the bandwidth of voice signals
DE69634055T2 (en) Method for coding acoustic signals
DE69023402T2 (en) Speech coding and decoding methods.
EP1979901B1 (en) Method and arrangements for audio signal encoding
DE69934608T3 (en) ADAPTIVE COMPENSATION OF SPECTRAL DISTORTION OF A SYNTHETIZED LANGUAGE RESIDUE
DE69132885T2 (en) Low delay, 32 kbit / s CELP encoding for a broadband voice signal
DE69730779T2 (en) Improvements in or relating to speech coding
DE69521164T2 (en) System for coding and decoding signals
DE69317958T2 (en) Low delay audio signal encoder using analysis-by-synthesis techniques
DE69729527T2 (en) Method and device for coding speech signals
DE69329569T2 (en) Digital coding of speech signals
DE19647298A1 (en) Digital speech coder excitation data determining method
DE60028500T2 (en) speech decoding
DE69420682T2 (en) Speech decoder
DE3019823C2 (en)

Legal Events

Date Code Title Description
8332 No legal effect for de
8328 Change in the person/name/address of the agent

Free format text: MARKUS A. RICHARDT, DR. LOTHAR PFEIFER, 65203 WIESBADEN

8370 Indication related to discontinuation of the patent is to be deleted
8328 Change in the person/name/address of the agent

Free format text: SCHUMACHER & WILLSAU, PATENTANWALTSSOZIETAET, 80335 MUENCHEN