[go: up one dir, main page]

DE19845888A1 - Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder - Google Patents

Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder

Info

Publication number
DE19845888A1
DE19845888A1 DE19845888A DE19845888A DE19845888A1 DE 19845888 A1 DE19845888 A1 DE 19845888A1 DE 19845888 A DE19845888 A DE 19845888A DE 19845888 A DE19845888 A DE 19845888A DE 19845888 A1 DE19845888 A1 DE 19845888A1
Authority
DE
Germany
Prior art keywords
values
code
speech
speech signal
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19845888A
Other languages
English (en)
Inventor
Torsten Prange
Andreas Engelsberg
Christian Mittendorf
Torsten Mlasko
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE19845888A priority Critical patent/DE19845888A1/de
Priority to US09/807,015 priority patent/US7269552B1/en
Priority to JP2000575120A priority patent/JP4860818B2/ja
Priority to PCT/DE1999/002633 priority patent/WO2000021076A1/de
Priority to ES99953567T priority patent/ES2187207T3/es
Priority to DE59903354T priority patent/DE59903354D1/de
Priority to AT99953567T priority patent/ATE227458T1/de
Priority to EP99953567A priority patent/EP1119846B1/de
Publication of DE19845888A1 publication Critical patent/DE19845888A1/de
Priority to JP2010173653A priority patent/JP2010256932A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

Zur Codierung oder Decodierung von Sprachsignalabtastwerten werden die in den Codebüchern/Codetabellen enthaltenen Werte zur Generierung der Sprachsignalparameter in quantisierter Form abgelegt. DOLLAR A Ohne Verschlechterung der Sprachqualität kann die Verarbeitung mit Prozessoren mit Ganzzahlverarbeitung durchgeführt werden.

Description

Stand der Technik
Die Erfindung geht aus von einem Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten.
Im Standard zur Codierung Audiovisueller Objekte nach MPEG-4 sind in ISO/IEC 14496-3 FCD, Subpart 2 parametrische Coder beschrieben, insbesondere der HVXC-Coder (Harmonic Vector Excitation Coding) zur Codierung von Sprache bei extrem niedrigen Bitraten. Dieser Standard enthält zur Generierung der LPC-Koeffizienten, der spektralen Einhüllenden des Sprachsignals und der stimmlosen Abschnitte mehrere Tabellen, die im Gleitkommaformat vorliegen.
Im Subpart 3 dieses Standards wird der CELP-Coder (Code Excited Linear Prediction) zur Codierung von Sprache bei mittleren bis niedrigen Bitraten beschrieben. Dieser Standard enthält zur Generierung der LPC-Koeffizienten und der Gain-Werte mehrere Tabellen, die im Gleitkommaformat vorliegen.
Zur Codierung solcher Sprachsignale wird häufig die "Analyse durch Synthese"-Methode verwendet (ANT Nachrichtentechnische Berichte Heft 5, Nov. 1988, Seiten 93 bis 105). Bei den erwähnten Sprachcodierverfahren werden in Codebüchern, d. h. in den Tabellen, Werte abgespeichert, die für die Generierung der Signalparameter und damit für die Koeffizienten der Sprachsynthesefilter verwendet werden. Über eine Indexsteuerung werden die in den Codebüchern abgespeicherten Werte ausgelesen.
Vorteile der Erfindung
Durch die Maßnahmen des Anspruchs 1, d. h. insbesondere durch die Quantisierung der Werte in den Codebüchern, werden die vorliegenden Daten in ihrer Genauigkeit (Quantisierung) beschränkt, so daß die Codebucheinträge mit einer endlichen Wortbreite dargestellt werden können. Somit kann ihre Portierung auf digitale Signalprozessoren mit Ganzzahlarithmetik erfolgen, ohne die durch Standards, insbesondere gemäß ISO/IEC 14496-3, vorgegebenen Qualitätsanforderungen zu verletzen. Im Gegensatz zur Erfindung liegen in den erwähnten Arbeitsversionen der Standards die Werte für die Codebücher unquantisiert im Gleitkommaformat vor und können nur mit sehr aufwendigen und speicherintensiven Verfahren direkt verarbeitet werden. Trotz der Genauigkeitsbeschränkung der Tabellenwerte ist bei der Erfindung eine gleiche subjektive Qualität nach der Sprachdecodierung zu erzielen. Mit den Maßnahmen der Erfindung ist eine leichte und standardkonforme Portierung des Codes auf unterschiedliche Rechnerplattformen möglich, ohne Beeinflußung der subjektiven Qualität des Coders. Da reduzierte Wortbreiten verwendet werden, ist eine beträchtliche Einsparung von Speicherkapazität, insbesondere in Form von ROMS möglich. Die Erfindung ist bei unterschiedlichen Sprachsignalcodierverfahren einsetzbar, beispielsweise für HVXC-Coder/Decoder oder CELP- Coder/Decoder.
Zeichnungen
Anhand der Zeichnungen werden Ausführungsbeispiele der Erfindung näher erläutert. Es zeigen
Fig. 1 ein vereinfachtes Blockschaltbild eines HVXC- Sprachdecoders,
Fig. 2 ein vereinfachtes Blockschaltbild eines CELP- Sprachdecoders.
Beschreibung von Ausführungsbeispielen
Bevor auf die eigentliche Quantisierung eingegangen wird, wird zunächst ein Sprachdecoder vorgestellt, bei dem die erfindungsgemäße Quantisierung eingesetzt wird.
Bei dem HVXC-Sprachdecoder nach Fig. 1 werden die übertragenen Sprachparameter, nämlich die LPC-Parameter, die stimmhaft/stimmlos-Entscheidung des Encoders und die Anregungsparameter, die in einem Übertragungsrahmen von 20 ms Dauer untergebracht sind, aus dem Bitstrom gelesen und als Eingangssignale an den Eingängen 1, 2 und 3 angeliefert. Die LPC-Parameter enthalten Indizes, aus denen der inverse LSP-Vektorquantisierer 16 die LSP-Parameter (Line Spectral Pairs) regeneriert. Dazu werden die LSP-Codebücher 4 (CbLsp) und 5 (CbLsp4) mit den LPC-Parametern indiziert und die LSP- Parameter ausgelesen. In Abhängigkeit der stimmhaft/stimmlos-Entscheidung dieses Rahmens erfolgt gegebenenfalls die Interpolation - Baugruppe 6 - zwischen den LSP-Parametern des vergangenen und aktuellen Rahmens, womit eine Aktualisierung dieser Werte in einem Raster von 2,5 ms erreicht wird. Im Anschluß daran erfolgt die Umwandlung in LPC-Parameter, die als Koeffizienten in das LPC-Synthesefilter - Baugruppen 7 und 8 - eingehen.
Parallel zu dieser Berechnung und in Abhängigkeit der stimmhaft/stimmlos-Entscheidung werden die Vektoren für die spektrale Einhüllende (stimmhafter Rahmen), AM-Codebücher 9 (CbAm) und 10 (CbAm4) bzw. die Vektoren für das stochastische Anregungssignal (stimmloser Rahmen, CELP- Codebücher 11 (CbCelp) und 12 (CbCelp4)) gelesen. Die Regenerierung der spektralen Einhüllenden und des Anregungssignals erfolgt mit den inversen Vektorquantisierern 13 und 14. Nach der harmonischen Synthese (stimmhaft) - Baugruppe 15 - erfolgt die Filterung der Sprachdaten im LPC-Synthesefilter. Die Ausgangsdaten aus dem stimmhaften - Baugruppe 7 - und dem stimmlosen - Baugruppe 8 - Synthesefilter werden abschließend addiert, womit das rekonstruierte Sprachsignal für einen Rahmen von 20 ms vorliegt.
Da sich, wie zuvor erläutert, Werte für die Codebücher in Gleitkommadarstellung nicht für Fixpunkt-DSPs eignen, weil die erforderlichen Wortbreiten zu groß wären (Speicherbedarf, interne Wortbreiten und Arithmetik, ROM), erfolgt die Umsetzung der Tabellenwerte für die Codebücher, die zuvor aus den Sprachsignalabtastwerten analysiert wurden, in eine guantisierte Form bei resultierender äquivalenter Sprachqualität. Die hierfür erforderlichen Wortbreiten für die einzelnen Tabellenwerte werden in verschiedenen Hörtests ermittelt.
Die Quantisierung erfolgt auf eine Wortbreite, die in verschiedenen Tests ermittelt wird. In der folgenden Darstellung wird diese Wortbreite allgemein mit wordlength bezeichnet. Diese Größe wird in Bits ausgedrückt.
Eine vorzeichenbehaftete ganze Zahl mit wordlength Bits umfaßt einen Wertebereich von -2wordlength-1 bis 2wordlength-1 -1. Die Quantisierung der Kodebücher erfolgt damit auf die nachfolgend gezeigte Art. Den Ausgangspunkt stellen die in "study on ISO/IEC 14496-3 FCD, Subpart 3", definierten Kodebücher dar. Das Kodebuch cb wird für dieses Dokument wie folgt definiert: cb = {a0, a1, . . ., an, . . ., am} mit 0 ≦ n ≦ m und an ∈ R. Zur Quantisierung der einzelnen Elemente sind die folgenden Schritte erforderlich:
1. Ermittlung des Wertebereichs der Kodebücher
Um eine gut angepaßte Quantisierung zu erhalten, werden die Elemente eines jeden Kodebuchs so skaliert, daß der zur Verfügung stehende Wertebereich möglichst komplett ausgenutzt wird. Dazu muß der Wertebereich der Elemente zwischen
liegen. Um dies zu erreichen, wird das Maximum der positiven und der negativen Elemente (max_pos bzw. max_neg) eines jeden Kodebuchs ermittelt. Diese ergeben sich aus

max_pos = max({an cb|an 0}) bzw. max_neg = min({an cb|an < 0}),
mit 0 ≦ n ≦ m.
In Abhängigkeit der Größe von maxyos bzw. max neg, ergeben sich die folgenden Schritte:
max_pos < (1-2-(wordlength-1)) oder max_neg < -1
max_pos und max_neg werden mit 1/2 multipliziert. Erfüllt das Resultat immer noch die unter (a) gestellte Bedingung, dann muß der Vorgang wiederholt werden, bis die Bedingung nicht mehr zutrifft. Die Anzahl der Multiplikationen mit 1/2 wird gezählt und in der Variablen scale abgelegt.
max_pos ≦ (1-2-(wordlength-1)) oder max_neg ≧ -1
max_pos und max_neg werden mit 2 multipliziert. Erfüllt das Resultat immer noch die unter (b) gestellte Bedingung, dann muß der Vorgang wiederholt werden, bis die Bedingung nicht mehr zutrifft. Die Anzahl der Multiplikationen mit 2 wird gezählt und in der Variablen scale abgelegt.
2. Skalierung der Elemente von cb auf den Bereich zwischen -1 und (1-2-(wordlength-1))
In Abhängigkeit der unter 1.) getroffenen Entscheidung erfolgt die Skalierung aller Kodebucheinträge auf den genannten Bereich:
Nach diesem Schritt liegen die Einträge von jedem Kodebuch im folgenden Wertebereich: -1 ≦ bn ≦ (1-2-(wordlength-1)), mit 0 ≦ n ≦ m.
3. Skalierung auf wordlength Bits
Zur Skalierung auf den erforderlichen Wertebereich, erfolgt die Multiplikation mit 2wordlength-1. Damit liegen die Werte der Kodebücher cn im Bereich zwischen -2wordlength-1 und 2wordlength-1 -1.
4. Runden
Bevor die Nachkommastellen abgeschnitten werden, erfolgt die Rundung der ermittelten Einträge. Dazu wird in Abhängigkeit des Vorzeichens +0,5 bzw. -0,5 addiert. Dieses geschieht in der folgenden Form:
cn ≧ 0 : dn = cn + 0,5
cn < 0 : dn = cn - 0,5.
Hierbei ist zu beachten, daß der maximal zulässige Wertebereich nicht überschritten wird. Dieser liegt in dem Bereich, wie unter 2.) angegeben.
5. Abtrennen der Nachkommastellen
Die endgültige Quantisierung erfolgt durch das Abtrennen der Nachkommastellen. Damit erhält man die quantisierten Werte.
Versuche haben gezeigt, daß mit der Festlegung der Variablen wordlength auf 16 eine vom Original nicht zu unterscheidende Sprachqualität erhalten wird.
Eine weitere Ausgestaltung der Erfindung wird in Zusammenhang mit Fig. 2 erläutert. Dort ist das Blockschaltbild eines CELP-Decoders dargestellt. Zunächst werden die zur Decodierung eines Rahmens notwendigen Elemente wie zuvor aus einem übertragenen Bitstrom gelesen. Dabei handelt es sich um die LPC Indizes, die Erregungsparameter (Lag und Shape Index) sowie die Amplituden Indizes (Gain Indices). Angeliefert werden diese Parameter (Elemente) an den Decodereingängen 17 bis 21. Die Erregungsparameter setzen sich aus den Parametern für das adaptive Codebuch (Lag) 22 zur Generierung periodischer Signalkomponenten (stimmhaft) und den Parametern für die festen Codebücher (Shape Index) 23a . . . 23n zusammen.
Die Einträge der festen Codebücher 23a . . . 23n und des adaptiven Codebuchs 22 werden jeweils mit einem Skalierungsfaktor (Gain) über den Gain-Decoder 24 multipliziert. Dieser Skalierungsfaktorwird unter Zuhilfenahme der Gain Indizes, die am Eingang 21 anliegen, und der Gain-VQ (Vektorquantisierung)-Tabellen, die in den Codebüchern 25 abgelegt sind, rekonstruiert. Der endgültige Erregungsvektor setzt sich aus der Summe der festen und des adaptiven Codebuchvektors zusammen.
Bei der Nutzung des Vektorquantisieres VQ repräsentieren die LPC-Indizes die vektorquantisierten LSP-Parameter (Line Spectral Pairs). Die Vektoren der ersten und zweiten Stufe der inversen Vektorquantisierung der LSP-Parameter erhält man durch Auslesen der LSP-VQ-Tabellenwerte, die in den Codebüchern 26 abgespeichert sind. Die endgültige Rekonstruktion der LPC-Parameter erfolgt im LPC-Parameter- Decoder 27. Innerhalb eines jeden Rahmens erfolgt für jeden Unterrahmen die Interpolation - Baugruppe 28 - zwischen den LSP-Parametern des vergangenen und des aktuellen Rahmens. Die in LPC-Parameter umgewandelten LSP-Parameter gehen als Koeffizienten in das LPC-Synthesefilter 29 ein. Dort erfolgt die Rekonstruktion der Sprachdaten durch Filterung des Erregungssignals. Zur Verbesserung der Sprachqualität kann das rekonstruierte Sprachsignal noch in einem Postfilter 30 gefiltert werden.
Die LSP-VQ-Tabellenwerte sowie die Gain-VQ-Tabellenwerte für die Codebücher 25 und 26, die zuvor aus den Sprachsignalabtastwerten analysiert wurden, liegen normalerweise in einer Gleitkommadarstellung vor, die wie zuvor erläutert für eine Fixpunkt-DSP Verarbeitung nicht geeignet ist. Es erfolgt aus den gleichen Gründen wie beim HVXC-Decoder (Fig. 1) eine Umwandlung der Tabellenwerte in eine quantisierte Form. Die Verfahrensschritte bei dieser Quantisierung wie insbesondere die Ermittlung des Wertebereichs für die Codebücher erfolgt wie bei der zuvor erläuterten Quantisierung.
Die bisherigen Ausführungsbeispiele der Erfindung wurden anhand von Sprachdecodern erläutert. Natürlich kann die Erfindung auch bei entsprechenden Codern (Encodern) eingesetzt werden, die Codebücher verwenden. Auch dort können die Codebucheinträge für die Aufbereitung von Spachsignalen für die Übertragung zuvor quantisiert werden. Beispiele von solchen Encodern, deren Codebucheinträge zuvor quantisiert werden können sind aus EP 0545 386 A2, US 5,208,862, US 5,487,128, US 5,199,076 oder US 5,261,027 bekannt.

Claims (12)

1. Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten insbesondere unter Verwendung der Analyse durch Synthese-Methode mit folgenden Schritten:
  • 1. die für die Generierung der Sprachsignalparameter verwendeten zuvor aus den Sprachsignalabtastwerten analysierten Werte werden vor ihrer Abspeicherung in Codebüchern/Codetabellen quantisiert,
  • 2. die Quantisierung der Werte erfolgt auf eine Wortbreite, die zu keinen merklichen Verlusten der Sprachqualität führt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Wortbreiten der in den Codebüchern/Codetabellen abgelegten Werte durch Hörtests ermittelt werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Werte eines jeden Codebuches/einer jeden Codetabelle so skaliert werden, daß der zur Verfügung stehende Wertebereich möglichst komplett ausgenutzt wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß zur Skalierung das Maximum der positiven und negativen Werte eines jeden Codebuchs/Codetabelle ermittelt wird, daß im Falle des Überschreitens des zur Verfügung stehenden Wertebereiches eine Multiplikation der Werte mit einem Faktor kleiner als Eins, vorzugsweise 0,5, vorgenommen wird und daß diese Multiplikation so oft wiederholt wird, bis alle Elemente im Wertebereich liegen.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Anzahl der wiederholten Multiplikationen als Skalierfaktor für alle Codebuch-/Tabelleneinträge verwendet wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß eine Skalierung der Codebuch-/Tabelleneinträge auf die Bits des erforderlichen Wertebereiches vorgenommen wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß für eine endgültige Quantisierung eine Rundung und eine nachfolgende Abschneidung von Nachkommastellen erfolgt.
8. Verfahren nach einem der Ansprüche 1-7, dadurch gekennzeichnet, daß die Wortbreite der quantisierten Werte zu 16 Bit gewählt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die Verarbeitung der quantisierten Codebuch-/Tabelleneinträge mittels digitaler Signalverarbeitung im Ganzzahlformat vorgenommen wird.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß für einen HVXC (Harmonic Vector Excitation Coding) - Sprachcoder/Sprachdecoder die LPC- Koeffizienten, die spektralen Einhüllenden des Sprachsignal und der stimmlosen Abschnitte des Sprachsignals in quantisierter Form in den entsprechenden Codebüchern/­ Tabellen abgelegt werden.
11. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß für einen CELP (Code Excited Linear Prediction) - Sprachcoder/-decoder die Werte für die LSP (Line Spectral Pairs) -VQ-Vektorquantisierungs-Codebuch-/­ Tabelleneinträge sowie die der Gain-VQ Tabelleneinträge in quantisierter Form abgelegt werden.
12. Coder oder Decoder für die Verarbeitung von Sprachsignalabtastwerten unter Verwendung der Analyse durch Synthese-Methode mit folgenden Maßnahmen: die in den Codebüchern/Codetabellen (4, 5, 9, 10,11, 12, 25, 26) enthaltenen Werte zur Generierung der Sprachsignalparameter sind in quantisierter Form abgelegt, wobei die Wortbreite so gewählt ist, daß keine merklichen Verluste der Sprachqualität auftreten.
DE19845888A 1998-10-06 1998-10-06 Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder Withdrawn DE19845888A1 (de)

Priority Applications (9)

Application Number Priority Date Filing Date Title
DE19845888A DE19845888A1 (de) 1998-10-06 1998-10-06 Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder
US09/807,015 US7269552B1 (en) 1998-10-06 1999-08-21 Quantizing speech signal codewords to reduce memory requirements
JP2000575120A JP4860818B2 (ja) 1998-10-06 1999-08-21 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器
PCT/DE1999/002633 WO2000021076A1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder
ES99953567T ES2187207T3 (es) 1998-10-06 1999-08-21 Procedimiento para la codificacion y decodificacion de valores de muestreo de señales de voz asi como codificador o decodificador.
DE59903354T DE59903354D1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder
AT99953567T ATE227458T1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder
EP99953567A EP1119846B1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder
JP2010173653A JP2010256932A (ja) 1998-10-06 2010-08-02 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19845888A DE19845888A1 (de) 1998-10-06 1998-10-06 Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder

Publications (1)

Publication Number Publication Date
DE19845888A1 true DE19845888A1 (de) 2000-05-11

Family

ID=7883505

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19845888A Withdrawn DE19845888A1 (de) 1998-10-06 1998-10-06 Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder
DE59903354T Expired - Lifetime DE59903354D1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE59903354T Expired - Lifetime DE59903354D1 (de) 1998-10-06 1999-08-21 Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder

Country Status (7)

Country Link
US (1) US7269552B1 (de)
EP (1) EP1119846B1 (de)
JP (2) JP4860818B2 (de)
AT (1) ATE227458T1 (de)
DE (2) DE19845888A1 (de)
ES (1) ES2187207T3 (de)
WO (1) WO2000021076A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6393394B1 (en) * 1999-07-19 2002-05-21 Qualcomm Incorporated Method and apparatus for interleaving line spectral information quantization methods in a speech coder
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
CA2021514C (en) * 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JPH03226121A (ja) * 1990-01-31 1991-10-07 Fujitsu Ltd データ変換回路
EP0443548B1 (de) * 1990-02-22 2003-07-23 Nec Corporation Sprachcodierer
JP3194930B2 (ja) * 1990-02-22 2001-08-06 日本電気株式会社 音声符号化装置
JP2898377B2 (ja) * 1990-08-29 1999-05-31 沖電気工業株式会社 コード励振線形予測符号化器及び復号化器
JP3100082B2 (ja) * 1990-09-18 2000-10-16 富士通株式会社 音声符号化・復号化方式
CA2051304C (en) * 1990-09-18 1996-03-05 Tomohiko Taniguchi Speech coding and decoding system
JPH04190399A (ja) * 1990-11-26 1992-07-08 Oki Electric Ind Co Ltd Vselp符号化方式
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JP3290704B2 (ja) * 1991-07-23 2002-06-10 株式会社東芝 ベクトル量子化方式
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5257215A (en) * 1992-03-31 1993-10-26 Intel Corporation Floating point and integer number conversions in a floating point adder
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5313554A (en) * 1992-06-16 1994-05-17 At&T Bell Laboratories Backward gain adaptation method in code excited linear prediction coders
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5546395A (en) * 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
CN1131508C (zh) * 1993-05-05 2003-12-17 皇家菲利浦电子有限公司 包括至少一个编码器的传输系统
CA2131674A1 (en) * 1993-09-10 1995-03-11 Kalyan Ganesan High performance error control coding in channel encoders and decoders
JPH0784753A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd 固定小数点型ディジタル・シグナル・プロセッサ
US5570454A (en) * 1994-06-09 1996-10-29 Hughes Electronics Method for processing speech signals as block floating point numbers in a CELP-based coder using a fixed point processor
JPH08286700A (ja) * 1995-04-14 1996-11-01 Hitachi Ltd 音声符号化装置
US5806034A (en) * 1995-08-02 1998-09-08 Itt Corporation Speaker independent speech recognition method utilizing multiple training iterations
GB9520445D0 (en) * 1995-10-06 1995-12-06 British Telecomm Convolutional codes
US5646618A (en) * 1995-11-13 1997-07-08 Intel Corporation Decoding one or more variable-length encoded signals using a single table lookup
US5889891A (en) * 1995-11-21 1999-03-30 Regents Of The University Of California Universal codebook vector quantization with constrained storage
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
JPH1078799A (ja) * 1996-09-04 1998-03-24 Fujitsu Ltd コードブック
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps

Also Published As

Publication number Publication date
EP1119846A1 (de) 2001-08-01
ES2187207T3 (es) 2003-05-16
ATE227458T1 (de) 2002-11-15
US7269552B1 (en) 2007-09-11
JP2002527777A (ja) 2002-08-27
DE59903354D1 (de) 2002-12-12
EP1119846B1 (de) 2002-11-06
WO2000021076A1 (de) 2000-04-13
JP4860818B2 (ja) 2012-01-25
JP2010256932A (ja) 2010-11-11

Similar Documents

Publication Publication Date Title
DE69634179T2 (de) Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE3856211T2 (de) Verfahren zur adaptiven Filterung von Sprach- und Audiosignalen
DE69227401T2 (de) Verfahren zum Kodieren und Dekodieren von Sprachsignalen
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE69900786T2 (de) Sprachkodierung
DE69815242T2 (de) Verfahren zur Quantisierung der LPC Parameter mittels geschalteter prädiktiver Quantisierung
DE69309557T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE602004007786T2 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE69625874T2 (de) Verfahren und Vorrichtung zur Wiedergabe von Sprachsignalen, zur Dekodierung, zur Sprachsynthese und tragbares Funkendgerät
DE69619054T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
EP2022043B1 (de) Informationssignalcodierung
DE69726525T2 (de) Verfahren und Vorrichtung zur Vektorquantisierung und zur Sprachkodierung
DE19647298C2 (de) Kodiersystem
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE69620560T2 (de) Kodierverfahren eines Sprach- oder Musiksignals mittels Quantisierung harmonischer Komponenten sowie im Anschluss daran Quantisierung der Residuen
DE69426860T2 (de) Sprachcodierer und Verfahren zum Suchen von Codebüchern
DE69902480T2 (de) Verfahren zur quantisierung der parameter eines sprachkodierers
DE69033510T2 (de) Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE60028500T2 (de) Sprachdekodierung
DE69708191T2 (de) Vorrichtung zur Signalkodierung
DE60305907T2 (de) Verfahren zur modellierung von beträgen der oberwellen in der sprache
DE69720527T2 (de) Verfahren zur kodierung eines sprachsignals
EP1388146B1 (de) Verfahren zur codierung und zur übertragung von sprachsignalen
DE10004862B4 (de) Ein schnelles Suchverfahren für LSP-Quantisierung

Legal Events

Date Code Title Description
8141 Disposal/no request for examination
8110 Request for examination paragraph 44
8170 Reinstatement of the former position
R016 Response to examination communication
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee