DE19845888A1 - Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder - Google Patents
Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. DecoderInfo
- Publication number
- DE19845888A1 DE19845888A1 DE19845888A DE19845888A DE19845888A1 DE 19845888 A1 DE19845888 A1 DE 19845888A1 DE 19845888 A DE19845888 A DE 19845888A DE 19845888 A DE19845888 A DE 19845888A DE 19845888 A1 DE19845888 A1 DE 19845888A1
- Authority
- DE
- Germany
- Prior art keywords
- values
- code
- speech
- speech signal
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
Zur Codierung oder Decodierung von Sprachsignalabtastwerten werden die in den Codebüchern/Codetabellen enthaltenen Werte zur Generierung der Sprachsignalparameter in quantisierter Form abgelegt. DOLLAR A Ohne Verschlechterung der Sprachqualität kann die Verarbeitung mit Prozessoren mit Ganzzahlverarbeitung durchgeführt werden.
Description
Die Erfindung geht aus von einem Verfahren zur Codierung
oder Decodierung von Sprachsignalabtastwerten.
Im Standard zur Codierung Audiovisueller Objekte nach MPEG-4
sind in ISO/IEC 14496-3 FCD, Subpart 2 parametrische Coder
beschrieben, insbesondere der HVXC-Coder (Harmonic Vector
Excitation Coding) zur Codierung von Sprache bei extrem
niedrigen Bitraten. Dieser Standard enthält zur Generierung
der LPC-Koeffizienten, der spektralen Einhüllenden des
Sprachsignals und der stimmlosen Abschnitte mehrere Tabellen,
die im Gleitkommaformat vorliegen.
Im Subpart 3 dieses Standards wird der CELP-Coder (Code
Excited Linear Prediction) zur Codierung von Sprache bei
mittleren bis niedrigen Bitraten beschrieben. Dieser
Standard enthält zur Generierung der LPC-Koeffizienten und
der Gain-Werte mehrere Tabellen, die im Gleitkommaformat
vorliegen.
Zur Codierung solcher Sprachsignale wird häufig die "Analyse
durch Synthese"-Methode verwendet (ANT
Nachrichtentechnische Berichte Heft 5, Nov. 1988, Seiten 93
bis 105). Bei den erwähnten Sprachcodierverfahren werden in
Codebüchern, d. h. in den Tabellen, Werte abgespeichert, die
für die Generierung der Signalparameter und damit für die
Koeffizienten der Sprachsynthesefilter verwendet werden.
Über eine Indexsteuerung werden die in den Codebüchern
abgespeicherten Werte ausgelesen.
Durch die Maßnahmen des Anspruchs 1, d. h. insbesondere durch
die Quantisierung der Werte in den Codebüchern, werden die
vorliegenden Daten in ihrer Genauigkeit (Quantisierung)
beschränkt, so daß die Codebucheinträge mit einer endlichen
Wortbreite dargestellt werden können. Somit kann ihre
Portierung auf digitale Signalprozessoren mit
Ganzzahlarithmetik erfolgen, ohne die durch Standards,
insbesondere gemäß ISO/IEC 14496-3, vorgegebenen
Qualitätsanforderungen zu verletzen. Im Gegensatz zur
Erfindung liegen in den erwähnten Arbeitsversionen der
Standards die Werte für die Codebücher unquantisiert im
Gleitkommaformat vor und können nur mit sehr aufwendigen und
speicherintensiven Verfahren direkt verarbeitet werden.
Trotz der Genauigkeitsbeschränkung der Tabellenwerte ist bei
der Erfindung eine gleiche subjektive Qualität nach der
Sprachdecodierung zu erzielen. Mit den Maßnahmen der
Erfindung ist eine leichte und standardkonforme Portierung
des Codes auf unterschiedliche Rechnerplattformen möglich,
ohne Beeinflußung der subjektiven Qualität des Coders. Da
reduzierte Wortbreiten verwendet werden, ist eine
beträchtliche Einsparung von Speicherkapazität, insbesondere
in Form von ROMS möglich. Die Erfindung ist bei
unterschiedlichen Sprachsignalcodierverfahren einsetzbar,
beispielsweise für HVXC-Coder/Decoder oder CELP-
Coder/Decoder.
Anhand der Zeichnungen werden Ausführungsbeispiele der
Erfindung näher erläutert. Es zeigen
Fig. 1 ein vereinfachtes Blockschaltbild eines HVXC-
Sprachdecoders,
Fig. 2 ein vereinfachtes Blockschaltbild eines CELP-
Sprachdecoders.
Bevor auf die eigentliche Quantisierung eingegangen wird,
wird zunächst ein Sprachdecoder vorgestellt, bei dem die
erfindungsgemäße Quantisierung eingesetzt wird.
Bei dem HVXC-Sprachdecoder nach Fig. 1 werden die
übertragenen Sprachparameter, nämlich die LPC-Parameter, die
stimmhaft/stimmlos-Entscheidung des Encoders und die
Anregungsparameter, die in einem Übertragungsrahmen von 20
ms Dauer untergebracht sind, aus dem Bitstrom gelesen und
als Eingangssignale an den Eingängen 1, 2 und 3 angeliefert.
Die LPC-Parameter enthalten Indizes, aus denen der inverse
LSP-Vektorquantisierer 16 die LSP-Parameter (Line Spectral
Pairs) regeneriert. Dazu werden die LSP-Codebücher 4 (CbLsp)
und 5 (CbLsp4) mit den LPC-Parametern indiziert und die LSP-
Parameter ausgelesen. In Abhängigkeit der
stimmhaft/stimmlos-Entscheidung dieses Rahmens erfolgt
gegebenenfalls die Interpolation - Baugruppe 6 - zwischen
den LSP-Parametern des vergangenen und aktuellen Rahmens,
womit eine Aktualisierung dieser Werte in einem Raster von
2,5 ms erreicht wird. Im Anschluß daran erfolgt die
Umwandlung in LPC-Parameter, die als Koeffizienten in das
LPC-Synthesefilter - Baugruppen 7 und 8 - eingehen.
Parallel zu dieser Berechnung und in Abhängigkeit der
stimmhaft/stimmlos-Entscheidung werden die Vektoren für die
spektrale Einhüllende (stimmhafter Rahmen), AM-Codebücher 9
(CbAm) und 10 (CbAm4) bzw. die Vektoren für das
stochastische Anregungssignal (stimmloser Rahmen, CELP-
Codebücher 11 (CbCelp) und 12 (CbCelp4)) gelesen. Die
Regenerierung der spektralen Einhüllenden und des
Anregungssignals erfolgt mit den inversen
Vektorquantisierern 13 und 14. Nach der harmonischen
Synthese (stimmhaft) - Baugruppe 15 - erfolgt die Filterung
der Sprachdaten im LPC-Synthesefilter. Die Ausgangsdaten aus
dem stimmhaften - Baugruppe 7 - und dem stimmlosen -
Baugruppe 8 - Synthesefilter werden abschließend addiert,
womit das rekonstruierte Sprachsignal für einen Rahmen von
20 ms vorliegt.
Da sich, wie zuvor erläutert, Werte für die Codebücher in
Gleitkommadarstellung nicht für
Fixpunkt-DSPs eignen, weil die erforderlichen Wortbreiten
zu groß wären (Speicherbedarf, interne Wortbreiten und
Arithmetik, ROM), erfolgt die Umsetzung der Tabellenwerte
für die Codebücher, die zuvor aus den
Sprachsignalabtastwerten analysiert wurden, in eine
guantisierte Form bei resultierender äquivalenter
Sprachqualität. Die hierfür erforderlichen Wortbreiten für
die einzelnen Tabellenwerte werden in verschiedenen Hörtests
ermittelt.
Die Quantisierung erfolgt auf eine Wortbreite, die in
verschiedenen Tests ermittelt wird. In der folgenden
Darstellung wird diese Wortbreite allgemein mit wordlength
bezeichnet. Diese Größe wird in Bits ausgedrückt.
Eine vorzeichenbehaftete ganze Zahl mit wordlength Bits
umfaßt einen Wertebereich von -2wordlength-1 bis 2wordlength-1 -1.
Die Quantisierung der Kodebücher erfolgt damit auf die
nachfolgend gezeigte Art. Den Ausgangspunkt stellen die in
"study on ISO/IEC 14496-3 FCD, Subpart 3", definierten
Kodebücher dar. Das Kodebuch cb wird für dieses Dokument wie
folgt definiert: cb = {a0, a1, . . ., an, . . ., am} mit 0 ≦ n ≦ m und an ∈ R.
Zur Quantisierung der einzelnen Elemente sind die folgenden
Schritte erforderlich:
Um eine gut angepaßte Quantisierung zu erhalten, werden die
Elemente eines jeden Kodebuchs so skaliert, daß der zur
Verfügung stehende Wertebereich möglichst komplett
ausgenutzt wird. Dazu muß der Wertebereich der Elemente
zwischen
liegen. Um dies zu erreichen, wird das Maximum der positiven
und der negativen Elemente (max_pos bzw. max_neg) eines
jeden Kodebuchs ermittelt. Diese ergeben sich aus
max_pos = max({an ∈ cb|an ≧ 0}) bzw. max_neg = min({an ∈ cb|an < 0}),
max_pos = max({an ∈ cb|an ≧ 0}) bzw. max_neg = min({an ∈ cb|an < 0}),
mit 0 ≦ n ≦ m.
In Abhängigkeit der Größe von maxyos bzw. max neg, ergeben
sich die folgenden Schritte:
max_pos < (1-2-(wordlength-1)) oder max_neg < -1
max_pos und max_neg werden mit 1/2 multipliziert. Erfüllt das
Resultat immer noch die unter (a) gestellte Bedingung, dann
muß der Vorgang wiederholt werden, bis die Bedingung nicht
mehr zutrifft. Die Anzahl der Multiplikationen mit 1/2 wird
gezählt und in der Variablen scale abgelegt.
max_pos ≦ (1-2-(wordlength-1)) oder max_neg ≧ -1
max_pos und max_neg werden mit 2 multipliziert. Erfüllt das
Resultat immer noch die unter (b) gestellte Bedingung, dann
muß der Vorgang wiederholt werden, bis die Bedingung nicht
mehr zutrifft. Die Anzahl der Multiplikationen mit 2 wird
gezählt und in der Variablen scale abgelegt.
In Abhängigkeit der unter 1.) getroffenen Entscheidung
erfolgt die Skalierung aller Kodebucheinträge auf den
genannten Bereich:
Nach diesem Schritt liegen die Einträge von jedem Kodebuch
im folgenden Wertebereich: -1 ≦ bn ≦ (1-2-(wordlength-1)), mit
0 ≦ n ≦ m.
Zur Skalierung auf den erforderlichen Wertebereich, erfolgt
die Multiplikation mit 2wordlength-1. Damit liegen die Werte der
Kodebücher cn im Bereich zwischen -2wordlength-1 und 2wordlength-1 -1.
Bevor die Nachkommastellen abgeschnitten werden, erfolgt die
Rundung der ermittelten Einträge. Dazu wird in Abhängigkeit
des Vorzeichens +0,5 bzw. -0,5 addiert. Dieses geschieht in
der folgenden Form:
cn ≧ 0 : dn = cn + 0,5
cn < 0 : dn = cn - 0,5.
cn < 0 : dn = cn - 0,5.
Hierbei ist zu beachten, daß der maximal zulässige
Wertebereich nicht überschritten wird. Dieser liegt in dem
Bereich, wie unter 2.) angegeben.
Die endgültige Quantisierung erfolgt durch das Abtrennen der
Nachkommastellen. Damit erhält man die quantisierten Werte.
Versuche haben gezeigt, daß mit der Festlegung der Variablen
wordlength auf 16 eine vom Original nicht zu unterscheidende
Sprachqualität erhalten wird.
Eine weitere Ausgestaltung der Erfindung wird in
Zusammenhang mit Fig. 2 erläutert. Dort ist das
Blockschaltbild eines CELP-Decoders dargestellt.
Zunächst werden die zur Decodierung eines Rahmens
notwendigen Elemente wie zuvor aus einem übertragenen
Bitstrom gelesen. Dabei handelt es sich um die LPC Indizes,
die Erregungsparameter (Lag und Shape Index) sowie die
Amplituden Indizes (Gain Indices). Angeliefert werden diese
Parameter (Elemente) an den Decodereingängen 17 bis 21. Die
Erregungsparameter setzen sich aus den Parametern für das
adaptive Codebuch (Lag) 22 zur Generierung periodischer
Signalkomponenten (stimmhaft) und den Parametern für die
festen Codebücher (Shape Index) 23a . . . 23n zusammen.
Die Einträge der festen Codebücher 23a . . . 23n und des
adaptiven Codebuchs 22 werden jeweils mit einem
Skalierungsfaktor (Gain) über den Gain-Decoder 24
multipliziert. Dieser Skalierungsfaktorwird unter
Zuhilfenahme der Gain Indizes, die am Eingang 21 anliegen,
und der Gain-VQ (Vektorquantisierung)-Tabellen, die in den
Codebüchern 25 abgelegt sind, rekonstruiert. Der endgültige
Erregungsvektor setzt sich aus der Summe der festen und des
adaptiven Codebuchvektors zusammen.
Bei der Nutzung des Vektorquantisieres VQ repräsentieren die
LPC-Indizes die vektorquantisierten LSP-Parameter (Line
Spectral Pairs). Die Vektoren der ersten und zweiten Stufe
der inversen Vektorquantisierung der LSP-Parameter erhält
man durch Auslesen der LSP-VQ-Tabellenwerte, die in den
Codebüchern 26 abgespeichert sind. Die endgültige
Rekonstruktion der LPC-Parameter erfolgt im LPC-Parameter-
Decoder 27. Innerhalb eines jeden Rahmens erfolgt für jeden
Unterrahmen die Interpolation - Baugruppe 28 - zwischen den
LSP-Parametern des vergangenen und des aktuellen Rahmens.
Die in LPC-Parameter umgewandelten LSP-Parameter gehen als
Koeffizienten in das LPC-Synthesefilter 29 ein. Dort erfolgt
die Rekonstruktion der Sprachdaten durch Filterung des
Erregungssignals. Zur Verbesserung der Sprachqualität kann
das rekonstruierte Sprachsignal noch in einem Postfilter 30
gefiltert werden.
Die LSP-VQ-Tabellenwerte sowie die Gain-VQ-Tabellenwerte für
die Codebücher 25 und 26, die zuvor aus den
Sprachsignalabtastwerten analysiert wurden, liegen
normalerweise in einer Gleitkommadarstellung vor, die wie
zuvor erläutert für eine Fixpunkt-DSP Verarbeitung nicht
geeignet ist. Es erfolgt aus den gleichen Gründen wie beim
HVXC-Decoder (Fig. 1) eine Umwandlung der Tabellenwerte in
eine quantisierte Form. Die Verfahrensschritte bei dieser
Quantisierung wie insbesondere die Ermittlung des
Wertebereichs für die Codebücher erfolgt wie bei der zuvor
erläuterten Quantisierung.
Die bisherigen Ausführungsbeispiele der Erfindung wurden
anhand von Sprachdecodern erläutert. Natürlich kann die
Erfindung auch bei entsprechenden Codern (Encodern)
eingesetzt werden, die Codebücher verwenden. Auch dort
können die Codebucheinträge für die Aufbereitung von
Spachsignalen für die Übertragung zuvor quantisiert werden.
Beispiele von solchen Encodern, deren Codebucheinträge zuvor
quantisiert werden können sind aus EP 0545 386 A2, US
5,208,862, US 5,487,128, US 5,199,076 oder US 5,261,027
bekannt.
Claims (12)
1. Verfahren zur Codierung oder Decodierung von
Sprachsignalabtastwerten insbesondere unter Verwendung der
Analyse durch Synthese-Methode mit folgenden Schritten:
- 1. die für die Generierung der Sprachsignalparameter verwendeten zuvor aus den Sprachsignalabtastwerten analysierten Werte werden vor ihrer Abspeicherung in Codebüchern/Codetabellen quantisiert,
- 2. die Quantisierung der Werte erfolgt auf eine Wortbreite, die zu keinen merklichen Verlusten der Sprachqualität führt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die Wortbreiten der in den Codebüchern/Codetabellen
abgelegten Werte durch Hörtests ermittelt werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,
daß die Werte eines jeden Codebuches/einer jeden
Codetabelle so skaliert werden, daß der zur Verfügung
stehende Wertebereich möglichst komplett ausgenutzt wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß
zur Skalierung das Maximum der positiven und negativen Werte
eines jeden Codebuchs/Codetabelle ermittelt wird, daß im
Falle des Überschreitens des zur Verfügung stehenden
Wertebereiches eine Multiplikation der Werte mit einem
Faktor kleiner als Eins, vorzugsweise 0,5, vorgenommen wird
und daß diese Multiplikation so oft wiederholt wird, bis
alle Elemente im Wertebereich liegen.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß
die Anzahl der wiederholten Multiplikationen als
Skalierfaktor für alle Codebuch-/Tabelleneinträge verwendet
wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß
eine Skalierung der Codebuch-/Tabelleneinträge auf die Bits
des erforderlichen Wertebereiches vorgenommen wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß
für eine endgültige Quantisierung eine Rundung und eine
nachfolgende Abschneidung von Nachkommastellen erfolgt.
8. Verfahren nach einem der Ansprüche 1-7, dadurch
gekennzeichnet, daß die Wortbreite der quantisierten Werte
zu 16 Bit gewählt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch
gekennzeichnet, daß die Verarbeitung der quantisierten
Codebuch-/Tabelleneinträge mittels digitaler
Signalverarbeitung im Ganzzahlformat vorgenommen wird.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch
gekennzeichnet, daß für einen HVXC (Harmonic Vector
Excitation Coding) - Sprachcoder/Sprachdecoder die LPC-
Koeffizienten, die spektralen Einhüllenden des Sprachsignal
und der stimmlosen Abschnitte des Sprachsignals in
quantisierter Form in den entsprechenden Codebüchern/
Tabellen abgelegt werden.
11. Verfahren nach einem der Ansprüche 1 bis 7, dadurch
gekennzeichnet, daß für einen CELP (Code Excited Linear
Prediction) - Sprachcoder/-decoder die Werte für die LSP
(Line Spectral Pairs) -VQ-Vektorquantisierungs-Codebuch-/
Tabelleneinträge sowie die der Gain-VQ Tabelleneinträge in
quantisierter Form abgelegt werden.
12. Coder oder Decoder für die Verarbeitung von
Sprachsignalabtastwerten unter Verwendung der Analyse durch
Synthese-Methode mit folgenden Maßnahmen:
die in den Codebüchern/Codetabellen (4, 5, 9, 10,11, 12, 25, 26)
enthaltenen Werte zur Generierung der Sprachsignalparameter
sind in quantisierter Form abgelegt, wobei die Wortbreite so
gewählt ist, daß keine merklichen Verluste der
Sprachqualität auftreten.
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19845888A DE19845888A1 (de) | 1998-10-06 | 1998-10-06 | Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder |
US09/807,015 US7269552B1 (en) | 1998-10-06 | 1999-08-21 | Quantizing speech signal codewords to reduce memory requirements |
JP2000575120A JP4860818B2 (ja) | 1998-10-06 | 1999-08-21 | 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器 |
PCT/DE1999/002633 WO2000021076A1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
ES99953567T ES2187207T3 (es) | 1998-10-06 | 1999-08-21 | Procedimiento para la codificacion y decodificacion de valores de muestreo de señales de voz asi como codificador o decodificador. |
DE59903354T DE59903354D1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
AT99953567T ATE227458T1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
EP99953567A EP1119846B1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
JP2010173653A JP2010256932A (ja) | 1998-10-06 | 2010-08-02 | 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19845888A DE19845888A1 (de) | 1998-10-06 | 1998-10-06 | Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19845888A1 true DE19845888A1 (de) | 2000-05-11 |
Family
ID=7883505
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19845888A Withdrawn DE19845888A1 (de) | 1998-10-06 | 1998-10-06 | Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder |
DE59903354T Expired - Lifetime DE59903354D1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE59903354T Expired - Lifetime DE59903354D1 (de) | 1998-10-06 | 1999-08-21 | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder |
Country Status (7)
Country | Link |
---|---|
US (1) | US7269552B1 (de) |
EP (1) | EP1119846B1 (de) |
JP (2) | JP4860818B2 (de) |
AT (1) | ATE227458T1 (de) |
DE (2) | DE19845888A1 (de) |
ES (1) | ES2187207T3 (de) |
WO (1) | WO2000021076A1 (de) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6393394B1 (en) * | 1999-07-19 | 2002-05-21 | Qualcomm Incorporated | Method and apparatus for interleaving line spectral information quantization methods in a speech coder |
CN101335004B (zh) * | 2007-11-02 | 2010-04-21 | 华为技术有限公司 | 一种多级量化的方法及装置 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JPH03226121A (ja) * | 1990-01-31 | 1991-10-07 | Fujitsu Ltd | データ変換回路 |
EP0443548B1 (de) * | 1990-02-22 | 2003-07-23 | Nec Corporation | Sprachcodierer |
JP3194930B2 (ja) * | 1990-02-22 | 2001-08-06 | 日本電気株式会社 | 音声符号化装置 |
JP2898377B2 (ja) * | 1990-08-29 | 1999-05-31 | 沖電気工業株式会社 | コード励振線形予測符号化器及び復号化器 |
JP3100082B2 (ja) * | 1990-09-18 | 2000-10-16 | 富士通株式会社 | 音声符号化・復号化方式 |
CA2051304C (en) * | 1990-09-18 | 1996-03-05 | Tomohiko Taniguchi | Speech coding and decoding system |
JPH04190399A (ja) * | 1990-11-26 | 1992-07-08 | Oki Electric Ind Co Ltd | Vselp符号化方式 |
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
JP3290704B2 (ja) * | 1991-07-23 | 2002-06-10 | 株式会社東芝 | ベクトル量子化方式 |
JP3089769B2 (ja) | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5257215A (en) * | 1992-03-31 | 1993-10-26 | Intel Corporation | Floating point and integer number conversions in a floating point adder |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5313554A (en) * | 1992-06-16 | 1994-05-17 | At&T Bell Laboratories | Backward gain adaptation method in code excited linear prediction coders |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5546395A (en) * | 1993-01-08 | 1996-08-13 | Multi-Tech Systems, Inc. | Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem |
CN1131508C (zh) * | 1993-05-05 | 2003-12-17 | 皇家菲利浦电子有限公司 | 包括至少一个编码器的传输系统 |
CA2131674A1 (en) * | 1993-09-10 | 1995-03-11 | Kalyan Ganesan | High performance error control coding in channel encoders and decoders |
JPH0784753A (ja) * | 1993-09-20 | 1995-03-31 | Fujitsu Ltd | 固定小数点型ディジタル・シグナル・プロセッサ |
US5570454A (en) * | 1994-06-09 | 1996-10-29 | Hughes Electronics | Method for processing speech signals as block floating point numbers in a CELP-based coder using a fixed point processor |
JPH08286700A (ja) * | 1995-04-14 | 1996-11-01 | Hitachi Ltd | 音声符号化装置 |
US5806034A (en) * | 1995-08-02 | 1998-09-08 | Itt Corporation | Speaker independent speech recognition method utilizing multiple training iterations |
GB9520445D0 (en) * | 1995-10-06 | 1995-12-06 | British Telecomm | Convolutional codes |
US5646618A (en) * | 1995-11-13 | 1997-07-08 | Intel Corporation | Decoding one or more variable-length encoded signals using a single table lookup |
US5889891A (en) * | 1995-11-21 | 1999-03-30 | Regents Of The University Of California | Universal codebook vector quantization with constrained storage |
US5797121A (en) * | 1995-12-26 | 1998-08-18 | Motorola, Inc. | Method and apparatus for implementing vector quantization of speech parameters |
JPH1078799A (ja) * | 1996-09-04 | 1998-03-24 | Fujitsu Ltd | コードブック |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
-
1998
- 1998-10-06 DE DE19845888A patent/DE19845888A1/de not_active Withdrawn
-
1999
- 1999-08-21 EP EP99953567A patent/EP1119846B1/de not_active Expired - Lifetime
- 1999-08-21 JP JP2000575120A patent/JP4860818B2/ja not_active Expired - Fee Related
- 1999-08-21 ES ES99953567T patent/ES2187207T3/es not_active Expired - Lifetime
- 1999-08-21 AT AT99953567T patent/ATE227458T1/de active
- 1999-08-21 WO PCT/DE1999/002633 patent/WO2000021076A1/de active IP Right Grant
- 1999-08-21 DE DE59903354T patent/DE59903354D1/de not_active Expired - Lifetime
- 1999-08-21 US US09/807,015 patent/US7269552B1/en not_active Expired - Lifetime
-
2010
- 2010-08-02 JP JP2010173653A patent/JP2010256932A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP1119846A1 (de) | 2001-08-01 |
ES2187207T3 (es) | 2003-05-16 |
ATE227458T1 (de) | 2002-11-15 |
US7269552B1 (en) | 2007-09-11 |
JP2002527777A (ja) | 2002-08-27 |
DE59903354D1 (de) | 2002-12-12 |
EP1119846B1 (de) | 2002-11-06 |
WO2000021076A1 (de) | 2000-04-13 |
JP4860818B2 (ja) | 2012-01-25 |
JP2010256932A (ja) | 2010-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69634179T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung | |
DE60006271T2 (de) | Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung | |
DE3856211T2 (de) | Verfahren zur adaptiven Filterung von Sprach- und Audiosignalen | |
DE69227401T2 (de) | Verfahren zum Kodieren und Dekodieren von Sprachsignalen | |
DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
DE69900786T2 (de) | Sprachkodierung | |
DE69815242T2 (de) | Verfahren zur Quantisierung der LPC Parameter mittels geschalteter prädiktiver Quantisierung | |
DE69309557T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE602004007786T2 (de) | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate | |
DE69625874T2 (de) | Verfahren und Vorrichtung zur Wiedergabe von Sprachsignalen, zur Dekodierung, zur Sprachsynthese und tragbares Funkendgerät | |
DE69619054T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
EP2022043B1 (de) | Informationssignalcodierung | |
DE69726525T2 (de) | Verfahren und Vorrichtung zur Vektorquantisierung und zur Sprachkodierung | |
DE19647298C2 (de) | Kodiersystem | |
DE69729527T2 (de) | Verfahren und Vorrichtung zur Kodierung von Sprachsignalen | |
DE69620560T2 (de) | Kodierverfahren eines Sprach- oder Musiksignals mittels Quantisierung harmonischer Komponenten sowie im Anschluss daran Quantisierung der Residuen | |
DE69426860T2 (de) | Sprachcodierer und Verfahren zum Suchen von Codebüchern | |
DE69902480T2 (de) | Verfahren zur quantisierung der parameter eines sprachkodierers | |
DE69033510T2 (de) | Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
DE60028500T2 (de) | Sprachdekodierung | |
DE69708191T2 (de) | Vorrichtung zur Signalkodierung | |
DE60305907T2 (de) | Verfahren zur modellierung von beträgen der oberwellen in der sprache | |
DE69720527T2 (de) | Verfahren zur kodierung eines sprachsignals | |
EP1388146B1 (de) | Verfahren zur codierung und zur übertragung von sprachsignalen | |
DE10004862B4 (de) | Ein schnelles Suchverfahren für LSP-Quantisierung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8141 | Disposal/no request for examination | ||
8110 | Request for examination paragraph 44 | ||
8170 | Reinstatement of the former position | ||
R016 | Response to examination communication | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |