DE9218980U1 - Fehlerschutz für Mehrmoden-Sprachcoder - Google Patents
Fehlerschutz für Mehrmoden-SprachcoderInfo
- Publication number
- DE9218980U1 DE9218980U1 DE9218980U DE9218980U DE9218980U1 DE 9218980 U1 DE9218980 U1 DE 9218980U1 DE 9218980 U DE9218980 U DE 9218980U DE 9218980 U DE9218980 U DE 9218980U DE 9218980 U1 DE9218980 U1 DE 9218980U1
- Authority
- DE
- Germany
- Prior art keywords
- speech
- bits
- output
- coder
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 claims description 23
- 230000007774 longterm Effects 0.000 claims description 15
- 230000005284 excitation Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 12
- 238000003491 array Methods 0.000 abstract 1
- 230000005540 biological transmission Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/35—Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
- Communication Control (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
Diese Erfindung bezieht sich allgemein auf die Übertragung digitaler Daten und insbesondere auf Sprachcoder und ist
hauptsächlich auf ein Verfahren gerichtet, das einen Fehlerschutz dafür geeigneter Bits vorsieht.
Die Zweiwege-Funkkommunikation mit Sprachsignalen ist ein
bedeutendes Hilfsmittel der modernen Gesellschaft.
Organisationen, die mit Polizeiarbeit, öffentlicher Sicherheit und dem Transportwesen zu tun haben, sind die Hauptanwender von
Sprachkommunikation, nicht zu vergessen die militärischen Anwender. Mit steigenden Anforderungen zur Plazierung von
Übertragungsfrequenzen im zur Verfugung stehenden Funkfrequenzspektrum ist zur Maximierung der Effizienz des
Spektrums viel Forschung durchgeführt worden.
Ein Weg zur Erhöhung der Effizienz des Spektrums liegt in der Kompression von Sprachsignalen vor der Übertragung. Diese
Kompressionen, die in der Fachwelt gut bekannt sind, reduzieren die Bandbreitenanforderungen für die Übertragung von
Sprachsignalen und ermöglichen die Zuweisung von mehr Funkfrequenz-Kommunikationskanälen innerhalb eines gegebenen
Frequenzbereichs. Algorithmen zur Sprachkompression können analog ebenso zur Speicherung digitaler Sprache angewendet
werden.
Bei der zunehmenden Bedeutung digitaler Kommunikation haben
Kompressionsverfahren für digitale Systeme viel Beachtung erhalten. Kompressionsverfahren für digitalisierte Sprache
werden allgemein als Sprachcoder bezeichnet. Das US-Patent Nr. 4 933 957 von Bottau u.a. beschreibt ein
Sprachcodierverfahren und -system für niedrige Bitraten beispielhaft für den Fachmann.
Ein Beispiel für ein verbreitetes Sprachcodierverfahren ist die lineare prediktive Codierung (LPC). Bei der LPC wird versucht,
die menschliche Sprache durch Herleitung geeigneter Modelle für den menschlichen Vokaltrakt und für die Anregung des
Vokaltraktes anzunähern. Da die Sprache ein Signaltyp mit vielen Wiederholungen ist, kann die erforderliche
Informationsmenge für eine exakte Wiedergabe des Sprachsignalverlaufs durch den Decoder stark reduziert werden.
Je nach Art der übertragenen Sprache sind einige Bits für die Wahrnehmung der rekonstruierten Sprache wichtiger als andere.
Vom Decoder muß wie bei jedem digitalen Signal eine Entscheidung getroffen werden, ob ursprünglich ein logisches
"1"-Signal oder ein logisches "0"-Signal übertragen wurde. Um die Wahrscheinlichkeit zu erhöhen, daß der Decoder die
richtigen Entscheidungen trifft, wird häufig das in der Fachwelt bekannte Prinzip der Fehlersteuerungscodierung
angewandt. Es macht natürlich keinen Sinn, digitale Sprache für die Übertragung zu komprimieren, nur um anschließend eine große
Anzahl von Fehlersteuerungsbits hinzuzuaddieren. Dabei muß man einen Kompromiß anstreben, bei dem gleichzeitig versucht wird,
die Effektivität eines gegebenen Sprachkompressionsalgorithmus zu maximieren und die Qualität der Sprache durch Sicherstellung
eines fehlerfreien Empfangs der kritischen Bits zu gewährleisten. Bei einer Vielzahl von
Datenübertragungsverfahren, die keine Sprachcodierungsanwendung betreffen, können die kritischen Bits bekanntlich erkannt
werden.
Es ist dementsprechend die Aufgabe der Erfindung Fehlerschutz für die Übertragung kritischer Bits zur Verfügung zu stellen,
bei der die schutzbedürftigen kritischen Bits eine Untermenge der Eingangsbit darstellen können, und zwar beispielsweise in
der Art, daß die Bits codiert werden, die den Typ des Sprachsignalverlaufs bezeichnen. Die jeweils schutzbedürftigen
Bits können ebenso in Abhängigkeit von den zu erwarteden Eigenschaften des Kommunikationskanals festgelegt werden.
Dieses und andere Erfordernisse werden durch das erfindungsgemäße Verfahren für den Fehlerschutz von
Informationsbit gelöst. Dieses Verfahren umfaßt eine Zuführung von Eingangsdatenbits, von denen zumindest einige geschützt
werden müssen, eine Sortierung der Eingangsdatenbits in Abhängigkeit von Information, die aus einer Untermenge der
Eingangsdatenbits hergeleitet wird, und eine Anwendung eines Fehlersteuerungscodierverfahrens auf zumindest einige der
sortierten Bits.
Fig. 1 ist eine Darstellung eines typischen Sprachsignalverlaufs;
Fig.2A ist ein Blockdiagramm eines VSELP-Sprachcoders;
Fig.2B stellt detaillierter die VSELP-Codebücher dar, die in
der bevorzugten Ausführungsform verwendet werden;
Fig. 3 ist ein Blockdiagramm eines Codiersystems, das dazu verwendet werden kann, das erfindungsgemäße
Verfahren zu implementieren;
Fig. 4 ist die grafische Darstellung der decodierten Bitfehlerrate
über der Bitposition für variable Coderaten des Faltungscoders; und
Fig. 5 zeigt die Verwendung eines Vor-Decoders zur Auswahl eines geeigneten Nach-Decoders.
In Fig. 1 ist ein typischer Sprachsignalverlauf dargestellt. Allgemein kann die menschliche Sprache als entweder "stimmhaft"
oder "stimmlos" klassifiziert werden. Bei stimmhafter Sprache wird der Vokaltrakt durch einen wahrnehmbaren, periodischen
Reiz angeregt. Stimmhafte Sprache wird allgemein mit der stimmhaften Aussprache von langen Vokalklängen assoziiert, wie
z.B. die langen "a", "i", und "o"-Klänge in dem Wort "radio". Konsonantenklänge, die keine bedeutenden periodischen
Anregungen enthalten, werden als stimmlos angesehen.
Fig. 1 verdeutlicht ebenso die Tatsache, daß stimmhafte Sprache beobachtbare Periodizitäten aufweist. Dabei gibt es
Langzeitperiodizitäten, wie sie im Segment 102 zu sehen sind, und kurzzeitige Korrelationen, wie diejenigen von Segment 101.
Diese Eigenschaften der Sprachsignalverlaufscharakteristik sich selbst zu erkennen zu geben, laufen vom Standpunkt der
Wahrscheinlichkeitsanalyse aus betrachtet auf relativ hohe Kurzzeit- und Langzeitkorrelationen hinaus, die eine lineare
Vorhersage zu einem guten Sprachcodierkonzept machen. Im folgenden wird der Zusammenhang zwischen diesen Korrelationen
und LPC-Verfahren genauer betrachtet.
Fig. 2A stellt das Blockdiagramm eines von Vektorsummen angeregten linearen Prediktions-(VSELP) Sprachcoders dar.
Sprachsignale, auch stimmhafte, weisen sowohl stochastische (zufällige) als auch periodische Eigenschaften auf. Die
Vokaltraktanregung wird in einem VSELP-System aus einer Kombination eines ersten Signalverlaufsvektors, der von einer
festgelegten Menge von Anregungsvektoren des sogenannten Codebuchs (201) ausgewählt wird, und eines zweiten Vektors
modelliert, der aufgrund eines bestimmten Anteils des Signalverlaufs, der bisher codierten Sprache ausgewählt wird.
Diese bisher codierte Sprache wird in einem Langzeitvorhersagespeicher (202) gespeichert.
Die Information zur Langzeitvorhersage (202) ist bei der Codierung stimmhafter Sprache, bei der Langzeitkorrelationen
vorherrschen, besonders nützlich. Vektoren (201), die aus einem Codebuch hergeleitet werden, helfen bei der Codierung des
Sprachsignalverlaufs sowohl von stimmhafter als auch stimmloser Sprache. Um den Sprachsignalverlauf an die schwankenden
Eigenschaften der stimmhaften Sprache anpassen zu können, werden sowohl die Codebuchvektoren (201) als auch die
Langzeitvorhersagevektoren (202) durch die Anwendung eines multiplikativen Verstärkungsfaktors {204 und 205) skaliert.
Die skalierten Vektoren werden summiert (207) und die sich daraus ergebende Anregung wird einem LPC-Filter (208)
zugeführt. In der bevorzugten Ausführungsform ist das LPC-
Filter ein" HR (infinit impulse response) Filter, das in einem
DSP (digital signal processor) implementiert ist. Das LPC-Filter (208) ist in erster Linie dafür vorgesehen, den
Vokaltrakt zu modellieren, dem die Anregung zugeführt wird. Eine ümprograminierung der Koeffizienten des LPC-Filters (208)
zur Optimierung der Ausgabe des Sprachcoders kann in periodischen Abständen wiederholt werden. Dazu wird die Ausgabe
des Sprachcoders mit digitalisierter Sprache (210) verglichen und der sich dabei herausstellende Fehler wird (211) durch eine
veränderte Vektorauswahl sowohl beim Codebuch (201) als auch beim Langzeitprediktor (202) minimiert.
In der bevorzugten Ausführungsform arbeitet der Sprachcoder mit
einer Datenrate von 5,9 kb pro Sekunde (kbps) bei einer Rahmenlänge von 20 Millisekunden (ms). Die Länge der Rahmen
oder Pakete wird den Periodendauern der Sprache angenähert, über die zumindest einige Parameter normalerweise relativ
konstant bleiben. Beispiele für diese relativ konstanten Parameter sind die Koeffizienten des LPC-Filters und der
Sprachtyp. Die Sprachtypen der bevorzugten Ausführungsform sind
stimmlos, leicht stimmhaft, mäßig stimmhaft und stark stimmhaft. Der 20 ms-Rahmen wird in vier 5 ms Unterrahmen
unterteilt, um die Parameter anzupassen, die sich in kürzeren Abständen im Sprachsignalverlauf ändern. Zu diesen
unbeständigeren Parametern gehören die Information über die Vektoranregung und die multiplikativen Verstärkungsfaktoren.
In der Praxis enthält ein Rahmen 118 Informationsbits. Wie aber
zuvor schon angesprochen, sind nicht alle Bits gleich wichtig. Der Langzeitvorhersagevektor fügt wenig zu der Codierung
stimmloser Sprache hinzu, er ist aber sehr wichtig für die exakte Rekonstruktion des Sprachsignalverlaufs beim stark
stimmhaften Sprachtyp. Wegen dieser Schwankung in der Bedeutung
ermöglicht'die Erfindung, Bits des Sprachcoders mit einem
Fehlerschutz zu versehen, der aufgrund des Sprachtyps ausgewählt wird, um so den gesuchten Kompromiß zwischen der
gewünschten Fehlersteuerungscodierung der Informationsbits und der unerwünschten Bandbreitenausweitung zu erreichen, die durch
das Hinzufügen zu vieler Zusatzbits entstehen würde.
Fig. 2B zeigt detaillierter die verschiedenen Codebücher der bevorzugten Ausführungsform. Wie schon angesprochen, fügt der
Langzeitvorhersagevektor nur wenig zur Codierung stimmloser Sprache hinzu. Deshalb werden beim stimmlosen Typ an dessen
Stelle Vektoren aus den beiden VSELP-Codebücher (214 und 215) ausgewählt. Wenn der sprachcodierte Sprachsignalverlauf aber
leicht, mäßig oder stark stimmhaft ist, dann wird der wichtige Langzeitvorhersage-Vektor (212) zusammen mit einem einzigen
Vektor eines VSELP-Codebuchs (213) übertragen. Natürlich hat jeder Vektor, wie in dem einfacheren obigen Beispiel, auch
einen dazugehörigen multiplikativen Verstärkungswert (220 bis 223), der dem entsprechenden Multiplizierer (216 bis 219)
zugeführt wird, um die Amplituden für eine optimale Sprachcodierung einzustellen. Wie zuvor werden die ausgewählten
Vektoren summiert (224) und dem LPC-Filter zugeführt.
In der bevorzugten Ausführungsform wird die Faltungscodierung
für die Erzeugung des Fehlerschutzes verwendet. Faltungscoder und -decoder sind in der Fachwelt gut bekannt und zudem sehr
leicht zu implementieren, insbesondere wenn dem Entwickler die Möglichkeiten eines DSP zur Verfügung stehen. Dies macht die
Verwendung des bekannten Blockcodierers oder sogar einer Kombination von beiden zur Erzeugung des notwendigen
Fehlerschutzes selbstverständlich nicht überflüssig.
Fig. 3 zeigt in Form eines Blockdiagramms das Codiersystem der Erfindung. Die 118 Bit der Rahmendaten werden dem Eingang des
Datentrenners (301) zugeführt. In Abhängigkeit vom Sprachtyp plaziert der Datentrenner (301) diejenigen Bits, die für den
jeweiligen Sprachtyp als besonders wichtig angesehen werden, in einem Speicherbereich, der Klasse !-Bereich (302) genannt wird.
Die wichtigen Bits, die dem Klasse I-Bereich (302) zugeordnet werden, werden in der Reihenfolge von den wichtigsten zu den
unwichtigsten Bits angeordnet. Die Datenbits, die für den jeweiligen Sprachtyp als nicht wichtig angesehen werden, werden
in einem Speicherbereich plaziert, der als Klasse II-Bereich (303) bezeichnet wird. Diese Bits werden keiner
Fehlersteuerungscodierung unterworfen.
Die Bits des Klasse !-Bereiches (3 02) werden dem Eingang eines
Faltungscoders (304) zugeführt. Der Coder (304) der bevorzugten
Ausführungsform ist zwischen einem Coder mit der Coderate 1/3
und einem Coder mit der Coderate 1/2 umschaltbar. Häufig wird so ein Coder als Mehrcoderaten-Coder bezeichnet. Es ist in der
Fachwelt gut bekannt, daß Daten, die mit Faltungscodes der Coderate 1/3 codiert werden, eine niedrigere decodierte
Bitfehlerrate aufweisen, als Daten, die mit einem Code der Coderate 1/2 codiert wurden. Die niedrigere Bitfehlerrate wird
natürlich auf Kosten von mehr Zusatzbits erreicht. Fig. 4 verdeutlicht eine bekannte Besonderheit von FaItungscodes. Die
beste wiedergewonnene Bitfehlerrate tritt bei den Bits auf, die entweder nahe zu dem ersten codierten Bit oder dem letzten
codierten Bit sind. Da die ersten Bits am besten geschützt werden, werden die Sprachtypbits an dieser Stelle plaziert.
Da die Sprachcoderbits vorzugsweise immer an derselben Position liegen und in derselben Art codiert werden, kann ein einzelner
Vor-Decoder (501), wie in Fig. 5 dargestellt, verwendet werden,
um diese Bits zu decodieren. Die dabei decodierte Typinformation kann verwendet werden, um den geeigneten NachDecoder
{503 bis 506) auszuwählen {502), und damit sicherzustellen, daß der passende, typabhängige Sortierungsund
Codieralgorithmus zur Decodierung der geschützten Datenbits des Sprachcoders verwendet wird.
Bei digitalen Sprachübertragungssystemen haben einige übertragende Bits eine höhere Wahrscheinlichkeit von
Decodierfehlern als andere Bits, prinzipiell aufgrund ihrer Position im Kanal. Im TDM (time-divison multiplex)-Systemen
kann die Decodierfehlerwahrscheinlichkeit einzelner Bits von der Nähe der Bits zu einer übertragenen Synchronisatxonssequenz
abhängen.
In Fig. 3 wird der Eingang eines Interleavers {305) mit dem Ausgang des Coders {304) ebenso wie dem Ausgang des Klasse II-Bereiches
(303) verbunden. Der Interleaver (3 05) kombiniert einfach die codierten und nicht codierten Bits zur Übertragung
des resultierenden Datenstroms.
Claims (5)
1. Ein Sprachcoder für die Erzeugung codierter Sprache, wobei
die Sprache entweder stimmhaft oder stimmlos ist, der Sprachcoder umfaßt:
ein linear predekives Codierungs-(LPC)-Filter (208) mit einem Eingang zum Empfang einer Anregung und einem Ausgang zur
Verfügungstellung eines Sprachannäherungssignals, wobei das Sprachannäherungssignal Datenbits umfaßt, die stimmhafte
Sprache darstellen;
einen Komparator (209) mit einem Eingang, der mit dem Ausgang des LPC-Filters (208) verbunden ist, um das
Sprachannäherungssignal zu empfangen, und einem Ausgang, wobei der Komparator das Sprachannäherungssignal mit digitalisierter
Sprache (210) vergleicht und ein Fehlersignal am Ausgang zur Verfügung stellt, daß der Differenz zwischen der
digitalisierten Sprache und dem Sprachannäherungssignal entspricht;
einen Langzeitprediktor (202, 212) mit einem Eingang, der mit dem Komparator (209) verbunden ist, und einem Ausgang, wobei
der Langzeitprediktor am Ausgang einen Langzeitvorhersagevektor als Reaktion auf das Fehlersignal zur Verfügung stellt, welches
er nur dann am Eingang empfängt, wenn es sich bei der Sprache um stimmhafte Sprache handelt;
ein oder mehrere Codebücher (201, 213-215), wobei jedes jeweils einen Eingang und jeweils einen Ausgang hat, um den jeweiligen
Codebuchvektor zur Verfügugung zu stellen, dabei stellt das
eine oder die mehreren Codebücher jeweils einen Codebuchvektor
von einem Codebuch des einen oder der mehreren Codebücher als Reaktion auf das Fehlersignal zur Verfugung, wenn es sich bei
der Sprache um stimmhafte Sprache handelt, wobei das eine oder die mehreren Codebücher mehr als einen Codebuchvektor von mehr
als jeweils einem Codebuch als Reaktion auf das Fehlersignal zur Verfugung stellen, wenn es sich bei der Sprache um
stimmlose Sprache handelt;
einen Addierer (207, 224), der eine Vielzahl von Eingängen hat, die mit dem Ausgang des Langzeitprediktors verbunden sind und
jeweils mit den Ausgängen der Codebücher, wobei der Addierer den Langzeitvorhersagevektor und die jeweiligen
Codebuchvektoren aufsummiert, um die Anregung zu erzeugen, dabei hat der Addierer einen Ausgang, der mit dem Eingang des
LPC-Filters (208) verbunden ist, um die Anregung dem LPC-Filter
zur Verfügung zu stellen;
einen Coderschaltkreis, der mit dem Ausgang des LPC-Filters verbunden ist, um das Sprachannäherungssignal zu empfangen,
wobei der Coderschaltkreis umfaßt:
einen Datentrenner (3 01) mit einem Eingang, um das Sprachannäherungssignal zu empfangen, und einen Ausgang,
wobei der Datentrenner die Datenbits, die stimmhafter Sprache entsprechen, in wichtigere und unwichtigere Bits
als Reaktion auf die Sprache, die stimmhafte ist, aufteilt;
einen ersten Speicher (302), der einen Eingang hat, der mit dem Ausgang des Datentrenners verbunden ist, um die
wichtigeren Bits zu empfangen, und einen Ausgang, wobei der Speicher die wichtigeren Bits speichert;
einen zweiten Speicher (3 03) mit einem Eingang, der mit dem
Ausgang des Datentrenners (301) verbunden ist, um die weniger wichtigen Bits zu empfangen, und einen Ausgang,
wobei der zweite Speicher die weniger wichtigen Bits speichert;
einen Faltungscoder (304) mit einem Eingang, der mit dem Ausgang des ersten Speichers (302) verbunden ist und einen
Ausgang, wobei der Faltungscoder die wichtigeren Bits codiert, um codierte Datenbits am Ausgang zu erzeugen; und
einen Interleaver (305) mit einem ersten Eingang, der mit
dem Ausgang des Faltungscoders (304) verbunden ist, um die codierten Datenbits zu empfangen, einen zweiten Eingang,
der mit dem Ausgang des zweiten Speichers (303) verbunden ist, um die weniger wichtigen Daten zu empfangen, und einen
Ausgang, wobei der Interleaver die codierten Datenbits und die weniger wichtigen Datenbits kombiniert, um die codierte
Sprache zu erzeugen.
2. Einen Sprachcoder nach Anspruch 1, wobei der Coder einen Mehrcoderatenfaltungscoder umfaßt.
3. Einen Sprachcoder nach Anspruch 1, wobei der Coder einen Faltungscoder umfaßt, der umschaltbar ist von einem Coder mit
der Coderate 1/3 zu einem Coder mit der Coderate 1/2.
4. Einen Sprachcoder nach Anspruch 1, wobei die wichtigsten Bits die Bits umfassen, welche den Sprachtyp der Sprache
festlegen.
5. Einen Sprachcoder nach Anspruch 4, wobei der Coder die wichtigsten Datenbits seriell codiert, beginnend mit einem
ersten zu codierenden Bit und endend mit einem letzten zu codierenden Bit, und wobei die Bits, die den Sprachtyp
festlegen, .in der Nähe des ersten zu codierenden Bits codiert werden.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US75524191A | 1991-09-05 | 1991-09-05 | |
EP92917101A EP0556354B1 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für vielfachmodensprachkodierer |
Publications (1)
Publication Number | Publication Date |
---|---|
DE9218980U1 true DE9218980U1 (de) | 1996-08-22 |
Family
ID=25038293
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE9218980U Expired - Lifetime DE9218980U1 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für Mehrmoden-Sprachcoder |
DE69232166T Expired - Lifetime DE69232166T2 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für vielfachmodensprachkodierer |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69232166T Expired - Lifetime DE69232166T2 (de) | 1991-09-05 | 1992-08-03 | Fehlerschutz für vielfachmodensprachkodierer |
Country Status (8)
Country | Link |
---|---|
US (1) | US5642368A (de) |
EP (2) | EP0556354B1 (de) |
JP (1) | JP3396480B2 (de) |
AT (1) | ATE208082T1 (de) |
DE (2) | DE9218980U1 (de) |
DK (1) | DK0556354T3 (de) |
ES (1) | ES2167318T3 (de) |
WO (1) | WO1993005502A1 (de) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
JP3616432B2 (ja) * | 1995-07-27 | 2005-02-02 | 日本電気株式会社 | 音声符号化装置 |
GB9520445D0 (en) * | 1995-10-06 | 1995-12-06 | British Telecomm | Convolutional codes |
EP0856185B1 (de) * | 1995-10-20 | 2003-08-13 | America Online, Inc. | Kompressionsystem für sich wiederholende töne |
FI116181B (fi) | 1997-02-07 | 2005-09-30 | Nokia Corp | Virheenkorjausta ja virheentunnistusta hyödyntävä informaationkoodausm enetelmä ja laitteet |
AU7655298A (en) * | 1997-07-02 | 1999-01-25 | Alcatel Alsthom Compagnie Generale D'electricite | Device for transmitting a coded adpcm voice signal |
US6000054A (en) * | 1997-11-03 | 1999-12-07 | Motorola, Inc. | Method and apparatus for encoding and decoding binary information using restricted coded modulation and parallel concatenated convolution codes |
US6141638A (en) * | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
JP2000201132A (ja) * | 1998-11-06 | 2000-07-18 | Matsushita Electric Ind Co Ltd | 送受信装置 |
US7337110B2 (en) * | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
EP1815463A1 (de) * | 2004-11-05 | 2007-08-08 | Koninklijke Philips Electronics N.V. | Effiziente audiokodierung unter verwendung von signaleigenschaften |
JP4246792B2 (ja) * | 2007-05-14 | 2009-04-02 | パナソニック株式会社 | 声質変換装置および声質変換方法 |
EP2538388B1 (de) | 2011-06-20 | 2015-04-01 | Alcatel Lucent | Verfahren und Anordnung zur Bildmodellerstellung |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4802171A (en) * | 1987-06-04 | 1989-01-31 | Motorola, Inc. | Method for error correction in digitally encoded speech |
US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
US5070503A (en) * | 1988-03-09 | 1991-12-03 | Canon Kabushiki Kaisha | Digital information transmitting and receiving system |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
US5073940A (en) * | 1989-11-24 | 1991-12-17 | General Electric Company | Method for protecting multi-pulse coders from fading and random pattern bit errors |
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
DE9006717U1 (de) * | 1990-06-15 | 1991-10-10 | Philips Patentverwaltung GmbH, 22335 Hamburg | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen |
US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5255339A (en) * | 1991-07-19 | 1993-10-19 | Motorola, Inc. | Low bit rate vocoder means and method |
-
1992
- 1992-08-03 EP EP92917101A patent/EP0556354B1/de not_active Expired - Lifetime
- 1992-08-03 EP EP20010102282 patent/EP1130576A1/de not_active Withdrawn
- 1992-08-03 AT AT92917101T patent/ATE208082T1/de active
- 1992-08-03 DE DE9218980U patent/DE9218980U1/de not_active Expired - Lifetime
- 1992-08-03 DE DE69232166T patent/DE69232166T2/de not_active Expired - Lifetime
- 1992-08-03 ES ES92917101T patent/ES2167318T3/es not_active Expired - Lifetime
- 1992-08-03 JP JP50517493A patent/JP3396480B2/ja not_active Expired - Lifetime
- 1992-08-03 DK DK92917101T patent/DK0556354T3/da active
- 1992-08-03 WO PCT/US1992/006352 patent/WO1993005502A1/en active IP Right Grant
-
1995
- 1995-10-11 US US08/541,738 patent/US5642368A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ES2167318T3 (es) | 2002-05-16 |
DE69232166D1 (de) | 2001-12-06 |
US5642368A (en) | 1997-06-24 |
DE69232166T2 (de) | 2002-06-06 |
EP0556354A4 (de) | 1995-07-26 |
EP0556354A1 (de) | 1993-08-25 |
JPH06502930A (ja) | 1994-03-31 |
EP0556354B1 (de) | 2001-10-31 |
EP1130576A1 (de) | 2001-09-05 |
WO1993005502A1 (en) | 1993-03-18 |
DK0556354T3 (da) | 2001-12-17 |
JP3396480B2 (ja) | 2003-04-14 |
ATE208082T1 (de) | 2001-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69604729T2 (de) | Verfahren zur sprachkodierung mittels linearer prädiktion und anregung durch algebraische kodes | |
DE69836624T2 (de) | Audiokodierer und -dekodierer | |
DE69331079T2 (de) | CELP-Vocoder | |
DE69900786T2 (de) | Sprachkodierung | |
DE19604273C5 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
DE69133058T2 (de) | Verfahren zur Kodierung von Sprachsignalen | |
DE69531471T2 (de) | Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung | |
DE69932460T2 (de) | Sprachkodierer/dekodierer | |
DE69331886T2 (de) | Kodierung mit Modulation, Fehlerkontrolle, Gewichtung und Bitzuordnung | |
DE69837822T2 (de) | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen | |
DE69613360T2 (de) | Linear-prädiktiver analyse-durch-synthese sprachkodierer | |
DE4135070C1 (de) | ||
DE9218980U1 (de) | Fehlerschutz für Mehrmoden-Sprachcoder | |
DE69615870T2 (de) | Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen | |
DE68913691T2 (de) | System zur Sprachcodierung und -decodierung. | |
DE69827313T2 (de) | Verfahren zur Kodierung des Zufallskomponenten-Vektors in einem ACELP-Kodierer | |
DE10004862B4 (de) | Ein schnelles Suchverfahren für LSP-Quantisierung | |
EP1155498B1 (de) | Vorrichtung und verfahren zum erzeugen eines datenstroms und vorrichtung und verfahren zum lesen eines datenstroms | |
DE4430864A1 (de) | Verfahren zum unbemerktem Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines quellencodierten, datenreduzierten Audiosignals | |
DE69922388T2 (de) | Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer | |
DE69823398T2 (de) | Mehrimpuls-angeregter Sprachkodierer/-dekodierer | |
DE4231918C1 (de) | Verfahren für die Codierung von Sprachsignalen | |
EP0697123B1 (de) | Verfahren zur aufbereitung von daten, insbesondere von codierten sprachsignalparametern | |
EP0697124B1 (de) | Vektorcodierverfahren, insbesondere für sprachsignale | |
DE4229372C2 (de) | Verfahren zum Übertragen oder Speichern der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung |