DE69033011T2 - DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION - Google Patents
DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTIONInfo
- Publication number
- DE69033011T2 DE69033011T2 DE69033011T DE69033011T DE69033011T2 DE 69033011 T2 DE69033011 T2 DE 69033011T2 DE 69033011 T DE69033011 T DE 69033011T DE 69033011 T DE69033011 T DE 69033011T DE 69033011 T2 DE69033011 T2 DE 69033011T2
- Authority
- DE
- Germany
- Prior art keywords
- filter
- component
- signal
- speech
- post
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 32
- 238000001914 filtration Methods 0.000 title claims description 6
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000009499 grossing Methods 0.000 claims abstract description 10
- 230000005284 excitation Effects 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 238000011084 recovery Methods 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 abstract description 7
- 230000002411 adverse Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
Diese Erfindung bezieht sich im allgemeinen auf Sprachcodierer und im besonderen auf digitale Sprachcodierer, die Nachfilter verwenden, um die Sprachqualität zu verbessern.This invention relates generally to speech coders and more particularly to digital speech coders that use post-filters to improve speech quality.
Sprachcodierer und -decoder sind in der Technik bekannt. Einige Sprachcodierer wandeln analoge Stimmabtastwerte in digitalisierte Darstellungen um und stellen nachfolgend die spektrale Sprachinformation durch die Verwendung linearer Vorhersagecodierung dar (siehe z. B. Dokument EP-A-0 294 020). Andere Sprachcodierer verbessern die gewöhnlichen linearen Vorhersagecodierungstechniken (LPC) durch Bereitstellen eines Erregersignals, welches in Beziehung zu dem ursprünglichen Stimmsignal steht.Speech coders and decoders are well known in the art. Some speech coders convert analog voice samples into digitized representations and subsequently represent the spectral speech information by using linear predictive coding (see e.g. document EP-A-0 294 020). Other speech coders improve upon conventional linear predictive coding (LPC) techniques by providing an excitation signal related to the original voice signal.
Das US-Patent Nr. 4,817,157 beschreibt einen digitalen Sprachcodierer und -decoder, der eine verbesserte Vektorerregerquelle hat, wobei auf ein Codebuch von Codebucherregervektoren zugegriffen wird, um ein Codebucherregersignal auszuwählen, welches für die verfügbare Information am besten geeignet ist, und der verwendet wird, um ein synthetisiertes Sprachsignal von einem LPC-Filter zu liefern, welches das Original gut darstellt.US Patent No. 4,817,157 describes a digital speech coder and decoder having an improved vector excitation source, accessing a codebook of codebook excitation vectors to select a codebook excitation signal that is best suited to the available information and used to provide a synthesized speech signal from an LPC filter that closely represents the original.
Sobald das synthetisierte Sprachsignal entwickelt worden ist, werden häufig Verschiedene Nach-LPC-Filter Verwendet, um das Signal weiter zu konditionieren. Eines dieser Filter ist ein adaptives Spektral-Nachfilter (welches typischerweise eingesetzt wird, um die Wahrnehmungsqualität der synthetischen Sprache zu verbessern), und ein anderes ist ein Nach-Anhebungsfilter (welches Helligkeit zu dem synthetischen Sprachergebnis beiträgt).Once the synthesized speech signal has been developed, various post-LPC filters are often used to further condition the signal. One of these filters is an adaptive spectral post-filter (which is typically used to improve the perceptual quality of the synthetic speech), and another is a post-emphasis filter (which adds brightness to the synthetic speech result).
Ein adaptives Spektral-Nachfilter besitzt typischerweise die allgemeine Form: An adaptive spectral postfilter typically has the general form:
wobei 0 ≤ η ≤ ν < 1where 0 ? ? ? ν < 1
und 1/1 - A(z) das zugeordnete LPC-Filter darstellt.and 1/1 - A(z) represents the associated LPC filter.
Der Term im Nenner in der o. g. Nachfilterdarstellung betont die Formanten (Teiltonkomponenten) in dem synthetischen Signalspektrum, während die Spektraltäler gedämpft werden. (Für die beiden Extremfälle gilt: das Setzen von ν = 0 resultiert in einem Allpassfilter, während das Setzen von ν = 1 in einem Nennerterm resultiert, welcher derselbe wie das zugeordnete LPC-Filter ist.) Der Zählerterm Versucht die allgemeine Spektralform, die durch den Nenner eingeführt ist, zu begrenzen. In Anwendungen nach dem Stand der Technik ist ν oft auf ungefähr 0,8 und η auf 0,5 gesetzt.The denominator term in the above post-filter representation emphasizes the formants (partials) in the synthetic signal spectrum while attenuating the spectral valleys. (For the two extreme cases, setting ν = 0 results in an all-pass filter, while setting ν = 1 results in a denominator term that is the same as the associated LPC filter.) The numerator term attempts to constrain the general spectral shape introduced by the denominator. In state-of-the-art applications, ν is often set to approximately 0.8 and η to 0.5.
In der Praxis ist das Zählerpolynom nur teilweise bei der Nachführung der Spektralform des Nenners erfolgreich (tatsächlich kippen die spektralen Eigenschaften des Filters mit der Zeit), und die Diskrepanz offenbart sich typischerweise selbst als eine zeitveränderlichen Modulation der nachgefilterten Sprachhelligkeit.In practice, the numerator polynomial is only partially successful in tracking the spectral shape of the denominator (in fact, the spectral properties of the filter tilt over time), and the discrepancy typically reveals itself as a time-varying modulation of the postfiltered speech brightness.
Demgemäß besteht ein Bedarf für ein Verfahren der Nachfilterung synthetisierter Sprache, welches sowohl die Wahrnehmungsqualität der synthetischen brache verbessert als auch gleichzeitig schädliche Auswirkungen auf die Sprachhelligkeit minimiert. Vorzugsweise soll die Sprachhelligkeit selbst besser als bisher gesteuert werden.Accordingly, there is a need for a method of post-filtering synthesized speech that both improves the perceptual quality of the synthetic speech and at the same time minimizes harmful effects on speech brightness. Preferably, speech brightness itself should be controlled better than before.
Gemäß der vorliegenden Erfindung wird ein Verfahren zur Erzeugung eines synthetisierten Sprachsignals bereitgestellt, welches die folgenden Schritte umfaßt:According to the present invention, there is provided a method for generating a synthesized speech signal, which comprises the following steps:
Bereitstellung eines Erregersignals an ein lineares Vohersagecodierungs-(LPC)Filter; Bereitstellung eines synthetisierten Sprachsignals von dem LPC-Filter; Bereitstellung eines Sprachsynthese-Nachfilters, welches eine erste Komponente und eine zweite Komponente erfordert; Bereitstellung der ersten Komponente, die einen ersten Satz von Koeffizienten enthält; wobei das Verfahren durch die folgenden Schritte gekennzeichnet ist: Umwandlung wenigstens einiger dieses ersten Satzes von Koeffizienten in einen Autokorrelationsdomänensatz von Parametern; spektrale Glättung des Autokorrelationsdomänensatzes von Parametern, um einen modifizierten ersten Satz von Koeffizienten bereitzustellen; Benutzung des modifizierten ersten Satzes von Koeffizienten, um die zweite Komponente zur Benutzung durch das Sprachsynthese-Nachfilter bereitzustellen; Filterung des synthetisierten Sprachsignals in dem Sprachsynthese-Nachfilter durch Benutzung der ersten Komponente und der zweiten Komponente, um ein gefiltertes synthetisiertes Sprachsignal bereitzustellen, wobei die zweite Komponente angepaßt nachfolgt und eine allgemeine Spektralform der ersten Komponente begrenzt; und akkustische Wiedergabe des gefilterten synthetisierten Sprachsignals.Providing an excitation signal to a linear predictive coding (LPC) filter; providing a synthesized speech signal from the LPC filter; providing a speech synthesis post-filter requiring a first component and a second component; providing the first component including a first set of coefficients; the method being characterized by the steps of: converting at least some of said first set of coefficients into an autocorrelation domain set of parameters; spectrally smoothing the autocorrelation domain set of parameters to provide a modified first set of coefficients; using the modified first set of coefficients to provide the second component for using the speech synthesis post-filter; filtering the synthesized speech signal in the speech synthesis post-filter using the first component and the second component to provide a filtered synthesized speech signal, the second component adaptively following and delimiting a general spectral shape of the first component; and acoustically reproducing the filtered synthesized speech signal.
In einer ersten Ausführungsform werden Z-Transformations- (filter) Koeffizienten, die die erste Komponente darstellen, in die Autokorrelationsdomäne umgewandelt. Eine spektrale Glättungstechnik, die eine Bandbreitenerweiterungsfunktion verwendet, wird dann auf die Autokorrelationssequenz angewendet, und die Polynomkoeffizienten der zweiten Komponente werden von der modifiziert Autokorrelationssequenz über die Levinson-Rekursion berechnet. Die erste Komponente wird dann als Nenner und die zweite Komponente als Zähler benutzt, in der oben angegebenen Filtercharakteristik.In a first embodiment, Z-transform (filter) coefficients representing the first component are converted to the autocorrelation domain. A spectral smoothing technique using a bandwidth expansion function is then applied to the autocorrelation sequence, and the polynomial coefficients of the second component are calculated from the modified autocorrelation sequence via Levinson recursion. The first component is then used as the denominator and the second component as the numerator in the filter characteristic given above.
Über diesen Prozeß wird das Zählerpolynom durch eine spektral geglättete Version des A(z/ν) Polynoms ersetzt. Die Bandbreitenerweiterung der Formante verändert die geglättete spektrale Hüllkurve nicht. Deshalb minimiert die spektral geglättete bandbreitenerweiterte Version des A(z/ν) Polynoms effektiv die zeitveränderliche Spektralneigung und gestattet dem Zähler der allgemeinen Spektralform des Nenners angepaßt nachzufolgen und diese zu begrenzen.Through this process, the numerator polynomial is replaced by a spectrally smoothed version of the A(z/ν) polynomial. The bandwidth expansion of the formant does not alter the smoothed spectral envelope. Therefore, the spectrally smoothed bandwidth expanded version of the A(z/ν) polynomial effectively minimizes the time-varying spectral slope and allows the numerator to closely track and limit the general spectral shape of the denominator.
In einer anderen Ausführungsform kann ein zusätzliches Nach- Anhebungsfilter verwendet werden, um mehr Kontrolle über nachgefilterte Sprachhelligkeit zu bieten. Dieses Filter ist ein Filter erster Ordnung der FormIn another embodiment, an additional post-emphasis filter may be used to provide more control over post-filtered speech brightness. This filter is a first order filter of the form
(z) = 1 -uz&supmin;¹,(z) = 1 -uz⊃min;¹,
wobei typischerweise 0,2 ≤ u ≤ 0,5 ist.where typically 0.2 ≤ u ≤ 0.5.
Eine beispielhafte Ausführungsform der Erfindung wird nun unter Bezugnahme auf die angefügten Zeichnungen beschrieben.An exemplary embodiment of the invention will now be described with reference to the accompanying drawings.
Fig. 1 umfaßt eine diagrammartige Blockdarstellung eines Funkgerätes, welches gemäß der Erfindung konfiguriert ist; undFig. 1 comprises a diagrammatic block representation of a radio device configured in accordance with the invention; and
Fig. 2 ist ein Flußbild, welches die Charakterisierung eines adaptiven Spektral-Nachfilters gemäß der vorliegenden Erfindung darstellt.Figure 2 is a flow chart illustrating the characterization of an adaptive spectral postfilter according to the present invention.
Das US-Patent Nr. 4,817,157, mit dem Titel "Digital Speech Coder Having Improved Vector Excitation Source" (Digitaler Spachcodierer mit verbesserter Vektorerregerquelle), am 28. März 1989 für Ira Gerson erteilt, beschreibt besonders detailliert einen digitalen Sprachcodierer und -decoder. Wie in der o. g. Referenz detailliert angegeben ist, kann diese Erfindung in einem Sprachcodierer (oder Decoder) ausgeführt sein, die einen geeigneten digitalen Signalprozessor verwendet, wie beispielsweise ein Gerät der Motorola DSP56000 Familie.U.S. Patent No. 4,817,157, entitled "Digital Speech Coder Having Improved Vector Excitation Source," issued March 28, 1989 to Ira Gerson, describes in particular detail a digital speech coder and decoder. As detailed in the above reference, this invention may be embodied in a speech coder (or decoder) using a suitable digital signal processor, such as a device in the Motorola DSP56000 family.
In Fig. 1 ist ein die Erfindung verkörperndes Funkgerät 100 gezeigt, welches eine Antenne 102 zum Empfang eines sprachcodierten Funkfrequenz-(RF)Signals 101 enthält. Eine RF-Einheit 103 verarbeitet das empfangene Signal, um die spracheodierte Information wiederzugewinnen. Diese Information wird an einen Parameterdecoder 105 bereitgestellt, der Steuerparameter für verschiedene nachfolgende Prozesse entwickelt. Eine Erregerquelle 104, wie sie oben beschrieben ist, nutzt die an sie bereitgestellten Parameter, um ein Erregersignal zu erzeugen. Das resultierende Erregersignal von der Erregerquelle 104 wird an ein LPC-Filter 106 geliefert, das ein synthetisiertes Sprachsignal gemäß der codierten Information hervorbringt. Das synthetisierte Sprachsignal wird dann tonhöhen-nachgefiltert 107 und spektral nachgefiltert 108, um die Qualität der rekonstruierten Sprache zu verbessern. Wenn gewünscht, kann auch ein Nach-Anhebungsfilter 109 enthalten sein, um das resultierende Sprachsignal weiter zu verbessern. (Zusätzliche, das Spektral-Nachfilter 108 und das Nach-Anhebungsfilter 109 betreffende Details werden unten bereitgestellt.)In Fig. 1, a radio device 100 embodying the invention is shown, which has an antenna 102 for receiving a voice-coded radio frequency (RF) signal 101. An RF unit 103 processes the received signal to recover the speech encoded information. This information is provided to a parameter decoder 105 which develops control parameters for various subsequent processes. An excitation source 104, as described above, uses the parameters provided to it to generate an excitation signal. The resulting excitation signal from the excitation source 104 is provided to an LPC filter 106 which produces a synthesized speech signal according to the encoded information. The synthesized speech signal is then pitch post-filtered 107 and spectrally post-filtered 108 to improve the quality of the reconstructed speech. If desired, a post-emphasis filter 109 may also be included to further enhance the resulting speech signal. (Additional details concerning the spectral post-filter 108 and the post-emphasis filter 109 are provided below.)
Das Sprachsignal wird dann in einer Audioverarbeitungseinheit 111 verarbeitet und hörbar durch einen Tonwandler wiedergegeben. Die Erregungsquelle 104, das LPC-Filter 106, das Tonhöhennachfilter 107, das angepaßte Spektral-Nachfilter 108 und das Nach-Anhebungsfilter 109 können alle durch eine Programmierung eines DSP 113 bereitgestellt werden.The speech signal is then processed in an audio processing unit 111 and reproduced audibly by a sound transducer. The excitation source 104, the LPC filter 106, the pitch post-filter 107, the matched spectral post-filter 108 and the post-emphasis filter 109 can all be provided by programming a DSP 113.
Gemäß dieser Erfindung ist das adaptive spektrale Nachfilter 108 gekennzeichnet durch eine erste Komponente (einen Nenner, der sich auf die Filtercharakteristiken des LPC-Filters 106 bezieht) und eine zweite Komponente (einen Zähler, der der allgemeinen Spektralform des Nenners folgt, um diese zu begrenzen). Die allgemeine Form eines solchen Filters ist in einem Artikel mit dem Titel "Real-Time Vector APC Speech Coding at 4800 bps With Adaptive Postfiltering" (Echtzeit Vektor-APC-Sprachcodierung bei 4800 bps mit adaptiver Nachfilterung), von Chen und Gersho beschrieben, der in der Ausgabe vom April 1987 des Protokolls der Internationalen Konferenz für Akustik und Signalverarbeitung auf den Seiten 2185-2188 erschienen ist.According to this invention, the adaptive spectral postfilter 108 is characterized by a first component (a denominator related to the filter characteristics of the LPC filter 106) and a second component (a numerator that follows the general spectral shape of the denominator to limit it). The general form of such a filter is described in an article entitled "Real-Time Vector APC Speech Coding at 4800 bps With Adaptive Postfiltering". Vector APC speech coding at 4800 bps with adaptive post-filtering) by Chen and Gersho, which appeared in the April 1987 issue of the Proceedings of the International Conference on Acoustics and Signal Processing, pages 2185-2188.
Gemäß dieser Erfindung ist der Zähler durch Anwendung spektraler Glättungstechniken auf das Nennerpolynom entwickelt. Diese Techniken sind in einem Artikel mit dem Titel "Spectral Smoothing Technique in PARCOR Speech Analysis - Synthesis", von Tohkura, Itakura und Hashimoto beschrieben, welcher erschienen ist in der Ausgabe vom Dezember 1978 der I. E. E. E. Sitzungsberichte über Akustik, Sprache und Signalverarbeitung (I. E. E. E. Transactions on Acoustics, Speech, and Signal Processing).According to this invention, the numerator is developed by applying spectral smoothing techniques to the denominator polynomial. These techniques are described in an article entitled "Spectral Smoothing Technique in PARCOR Speech Analysis - Synthesis," by Tohkura, Itakura, and Hashimoto, which appeared in the December 1978 issue of I. E. E. E. Transactions on Acoustics, Speech, and Signal Processing.
In einer Ausführungsform sind die Z-Transformationskoeffizienten, die den Nenner darstellen, in die Autokorrelationsdomäne konvertiert. (Beispiele einer solchen Umwandlung können in Markel, J. D.; Gray, A. H., Jr.; Linear Prediction of Speech [Lineare Vorhersage von Sprache]; Springer-Verlag, Berlin, Heidelberg, New York, 1976 gefunden werden.) Die Funktion der spektralen Glättungstechnik und Bandbreitenerweiterung wird dann auf die Autokorrelationssequenz angewendet, mit den Zählerpolynomkoeffizienten, die über die Levinson-Rekursion aus der modifizierten Autokorrelationssequenz berechnet werden. In einer Ausführungsform werden die Autokorrelationskoeffizienten mit den nachfolgenden Faktoren multipliziert, um die resultierenden Zählerkoeffizienten bereitzustellen:In one embodiment, the Z-transform coefficients representing the denominator are converted to the autocorrelation domain. (Examples of such a conversion can be found in Markel, J. D.; Gray, A. H., Jr.; Linear Prediction of Speech; Springer-Verlag, Berlin, Heidelberg, New York, 1976.) The spectral smoothing and bandwidth expansion function is then applied to the autocorrelation sequence, with the numerator polynomial coefficients calculated via Levinson recursion from the modified autocorrelation sequence. In one embodiment, the autocorrelation coefficients are multiplied by the following factors to provide the resulting numerator coefficients:
0 1,00000000 1.0000000
1 0,92307691 0.9230769
2 0,72527472 0.7252747
3 0,48351643 0.4835164
4 0,27197804 0.2719780
5 0,12798965 0.1279896
6 4,9773753E-026 4,9773753E-02
7 1,5718028E-027 1,5718028E-02
8 3,9295070E-038 3,9295070E-03
9 7,4847753E-049 7,4847753E-04
10 1,0206513E-0410 1,0206513E-04
Der Nenner und der Zähler werden dann benutzt, um das angepaßte spektrale Nachfilter 108 zu charakterisieren.The denominator and numerator are then used to characterize the matched spectral postfilter 108.
Es würde natürlich auch möglich sein, die LPC-Filterinformation direkt zu nutzen, und daraus den Zählerterm durch ein ähnliches Verfahren zu entwickeln, da die LPC-Filterinformation genutzt wird, um den Nennerterm wie oben beschrieben zu entwickeln.It would of course also be possible to use the LPC filter information directly and develop the numerator term from it by a similar procedure, since the LPC filter information is used to develop the denominator term as described above.
Über dieses Verfahren wird das Zählerpolynom durch eine spektral geglättete Version des Nennerpolynoms bereitgestellt. Die spektral geglättete bandbreitenerweiterte Version des Nennerpolynoms minimiert die zeitveränderliche Spektralneigung effektiv und gestattet dem Zähler, der allgemeinen Spektralform des Nenners angepaßt zu folgen und diese zu begrenzen. Basierend auf Hörtests wurde ein Bandbreitenerweiterungsfaktor (welcher den Grad der Glättung spezifiziert, die auf den Nenner ausgeführt wird) von ungefähr 1.200 Hz genutzt.Through this method, the numerator polynomial is provided by a spectrally smoothed version of the denominator polynomial. The spectrally smoothed bandwidth-extended version of the denominator polynomial effectively minimizes the time-varying spectral slope and allows the numerator to closely follow and limit the general spectral shape of the denominator. Based on listening tests, a bandwidth-extension factor (which specifies the amount of smoothing performed on the denominator) of approximately 1,200 Hz was used.
Das Flußbild in Fig. 2 hilft, das nun beschriebene Verfahren der Nachfiltercharakterisierung zu verstehen. Wie vorher erläutert wurde, ist das angepaßte spektrale Nachfilter durch eine erste Komponente, oder einer Nenner, und eine zweite Komponente, oder einen Zähler, gekennzeichnet. Die erste Komponente wird im Block 202 bereitgestellt und kann ausgedrückt werden durch:The flow chart in Fig. 2 helps to understand the postfilter characterization process now described. As previously explained, the matched spectral postfilter is characterized by a first component, or denominator, and a second component, or numerator. The first component is provided in block 202 and can be expressed by:
1 - A(z/ν).1 - A(z/ν).
In dem nachfolgenden Schritt 203 werden die Z-Transformationskoeffizienten in die Autokorrelationsdomäne konvertiert. Im Block 204 wird eine Funktion spektraler Glättung und Bandbreitenerweiterung auf die Autokorrelationssequenz angewendet, und in dem nachfolgenden Block 205 werden die Zählerpolynomkoeffizienten (zweite Komponente) aus der Autokorrelationssequenz berechnet, die in dem vorhergehenden Schritt 204 durch die Verwendung der Levinson-Rekursion modifiziert wurde. Der Zähler, oder die zweite Komponente, kann ausgedrückt werden durch:In the subsequent step 203, the Z-transform coefficients are converted to the autocorrelation domain. In block 204, a spectral smoothing and bandwidth expansion function is applied to the autocorrelation sequence, and in the subsequent block 205, the numerator polynomial coefficients (second component) are calculated from the autocorrelation sequence modified in the previous step 204 by using Levinson recursion. The numerator, or second component, can be expressed by:
1 - B(z).1 - B(z).
Schließlich werden im Schritt 206 die ersten und zweiten Komponenten (Nenner und Zähler) benutzt, um das angepaßte spektrale Nachfilter zu kennzeichnen, welches dargestellt werden kann als: Finally, in step 206, the first and second components (denominator and numerator) are used to characterize the matched spectral postfilter, which can be represented as:
Das Nach-Anhebungsfilter 109 kann bereitgestellt werden, um mehr Kontrolle über die nachgefilterte Sprachhelligkeit zu bieten. Dieses Filter ist ein Filter erster Ordnung der FormThe post-emphasis filter 109 may be provided to provide more control over the post-filtered speech brightness. This filter is a first order filter of the form
(z) = 1 - uz&supmin;¹(z) = 1 - uz⊃min;¹
Claims (6)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US42292689A | 1989-10-17 | 1989-10-17 | |
PCT/US1990/005190 WO1991006093A1 (en) | 1989-10-17 | 1990-09-17 | Digital speech decoder having a postfilter with reduced spectral distortion |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69033011D1 DE69033011D1 (en) | 1999-04-22 |
DE69033011T2 true DE69033011T2 (en) | 2001-10-04 |
Family
ID=23676980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69033011T Expired - Lifetime DE69033011T2 (en) | 1989-10-17 | 1990-09-17 | DIGITAL VOICE DECODER USING A RE-FILTERING WITH A REDUCED SPECTRAL DISTORTION |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP0570362B1 (en) |
JP (1) | JP3158434B2 (en) |
CN (1) | CN1078371C (en) |
AT (1) | ATE177867T1 (en) |
AU (1) | AU635342B2 (en) |
DE (1) | DE69033011T2 (en) |
ES (1) | ES2131498T3 (en) |
WO (1) | WO1991006093A1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729247A1 (en) * | 1995-01-06 | 1996-07-12 | Matra Communication | SYNTHETIC ANALYSIS-SPEECH CODING METHOD |
FR2729246A1 (en) * | 1995-01-06 | 1996-07-12 | Matra Communication | SYNTHETIC ANALYSIS-SPEECH CODING METHOD |
FR2729244B1 (en) * | 1995-01-06 | 1997-03-28 | Matra Communication | SYNTHESIS ANALYSIS SPEECH CODING METHOD |
JP2993396B2 (en) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | Voice processing filter and voice synthesizer |
DE19643900C1 (en) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Audio signal post filter, especially for speech signals |
US6137844A (en) * | 1998-02-02 | 2000-10-24 | Oki Telecom, Inc. | Digital filter for noise and error removal in transmitted analog signals |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4301329A (en) * | 1978-01-09 | 1981-11-17 | Nippon Electric Co., Ltd. | Speech analysis and synthesis apparatus |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
JP2535833B2 (en) * | 1986-07-03 | 1996-09-18 | 日本電気株式会社 | Integrated circuit |
US4852169A (en) * | 1986-12-16 | 1989-07-25 | GTE Laboratories, Incorporation | Method for enhancing the quality of coded speech |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
-
1990
- 1990-09-17 DE DE69033011T patent/DE69033011T2/en not_active Expired - Lifetime
- 1990-09-17 AT AT90913916T patent/ATE177867T1/en not_active IP Right Cessation
- 1990-09-17 WO PCT/US1990/005190 patent/WO1991006093A1/en active IP Right Grant
- 1990-09-17 ES ES90913916T patent/ES2131498T3/en not_active Expired - Lifetime
- 1990-09-17 JP JP51307390A patent/JP3158434B2/en not_active Expired - Lifetime
- 1990-09-17 EP EP90913916A patent/EP0570362B1/en not_active Expired - Lifetime
- 1990-09-17 AU AU64114/90A patent/AU635342B2/en not_active Expired
- 1990-10-15 CN CN90108435.2A patent/CN1078371C/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0570362A4 (en) | 1993-07-01 |
AU635342B2 (en) | 1993-03-18 |
CN1051101A (en) | 1991-05-01 |
WO1991006093A1 (en) | 1991-05-02 |
DE69033011D1 (en) | 1999-04-22 |
ES2131498T3 (en) | 1999-08-01 |
ATE177867T1 (en) | 1999-04-15 |
AU6411490A (en) | 1991-05-16 |
CN1078371C (en) | 2002-01-23 |
EP0570362A1 (en) | 1993-11-24 |
EP0570362B1 (en) | 1999-03-17 |
JPH05500573A (en) | 1993-02-04 |
JP3158434B2 (en) | 2001-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69604526T2 (en) | Method for adjusting the noise masking level in an analysis-by-synthesis speech coder with a perceptual short-term filter | |
DE69608947T2 (en) | Method of analyzing an audio frequency signal by linear prediction, and application to a method of encoding and decoding an audio frequency signal | |
DE69615839T2 (en) | speech | |
DE69618422T2 (en) | Speech decoding method and portable terminal | |
DE69613910T2 (en) | Adaptive speech compression system based on a codebook | |
DE69916321T2 (en) | CODING OF AN IMPROVEMENT FEATURE FOR INCREASING PERFORMANCE IN THE CODING OF COMMUNICATION SIGNALS | |
DE69529672T2 (en) | LANGUAGE CODING SYSTEM | |
DE60218385T2 (en) | Post-filtering of coded speech in the frequency domain | |
DE60011051T2 (en) | CELP TRANS CODING | |
DE69910240T2 (en) | DEVICE AND METHOD FOR RESTORING THE HIGH FREQUENCY PART OF AN OVER-SAMPLE SYNTHETIZED BROADBAND SIGNAL | |
EP1825461B1 (en) | Method and apparatus for artificially expanding the bandwidth of voice signals | |
DE69634055T2 (en) | Method for coding acoustic signals | |
DE69023402T2 (en) | Speech coding and decoding methods. | |
EP1979901B1 (en) | Method and arrangements for audio signal encoding | |
DE69934608T3 (en) | ADAPTIVE COMPENSATION OF SPECTRAL DISTORTION OF A SYNTHETIZED LANGUAGE RESIDUE | |
DE69132885T2 (en) | Low delay, 32 kbit / s CELP encoding for a broadband voice signal | |
DE69730779T2 (en) | Improvements in or relating to speech coding | |
DE69521164T2 (en) | System for coding and decoding signals | |
DE69317958T2 (en) | Low delay audio signal encoder using analysis-by-synthesis techniques | |
DE69729527T2 (en) | Method and device for coding speech signals | |
DE69329569T2 (en) | Digital coding of speech signals | |
DE19647298A1 (en) | Digital speech coder excitation data determining method | |
DE60028500T2 (en) | speech decoding | |
DE69420682T2 (en) | Speech decoder | |
DE3019823C2 (en) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8332 | No legal effect for de | ||
8328 | Change in the person/name/address of the agent |
Free format text: MARKUS A. RICHARDT, DR. LOTHAR PFEIFER, 65203 WIESBADEN |
|
8370 | Indication related to discontinuation of the patent is to be deleted | ||
8328 | Change in the person/name/address of the agent |
Free format text: SCHUMACHER & WILLSAU, PATENTANWALTSSOZIETAET, 80335 MUENCHEN |