DE69024033T2 - Kodierungssystem mit variabler Bitrate. - Google Patents
Kodierungssystem mit variabler Bitrate.Info
- Publication number
- DE69024033T2 DE69024033T2 DE69024033T DE69024033T DE69024033T2 DE 69024033 T2 DE69024033 T2 DE 69024033T2 DE 69024033 T DE69024033 T DE 69024033T DE 69024033 T DE69024033 T DE 69024033T DE 69024033 T2 DE69024033 T2 DE 69024033T2
- Authority
- DE
- Germany
- Prior art keywords
- band
- signal
- bit rate
- cell
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 18
- 230000006866 deterioration Effects 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 9
- 230000000873 masking effect Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000002542 deteriorative effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein variables Bitraten-Codierungssystem zur Verwendung in einem Paket-Kommunikationssystem oder einem ATM-Kommunikationssystem.
- Ein Paket-Kommunikationssystem wurde verwirklicht, das Sprachsignale nach Codierung in Pakete unterteilt und eine Kommunikation Paket für Paket durchführt. Das Paket-Kommunikationssystem kann Signale von verschiedenen Medien, wie beispielsweise Sprache, Bild und Daten in der gleichen Weise bearbeiten. Zusätzlich hat das System einen Vorteil, daß es Signale lediglich eines tonvorhandenen Bereiches mittels des Stoßimpulses eines Sprachsignales übertragen kann, um so einen wirksamen Gebrauch der Übertragungsleitung sicherzustellen. Demgemäß wird der Paket-Kommunikation und der ATM-Kommunikation als einem Weg zum Ausführen von ISDN und BISDN Beachtung geschenkt, und Forschung und Entwicklung für diese Technologien wurden aktiv durchgeführt.
- Wenn bei der Paket-Kommunikation eine Überbelegung oder Blockierung in einem Netzwerk auftritt oder eine Paketverzögerung groß ist, werden Pakete aufgegeben, was die Sprachqualität verschlechtert. Wenn insbesondere das die adaptive Voraussage verwendende ADPCM als ein Codiersystem verwendet wird, wird die Verschlechterung zu der Zeit eines Paketverlustes groß. Ein eingebettetes DPCM wurde als ein Codiersystem mit weniger Verschlechterung zu der Zeit eines Paketverlustes in "Embeded DPCM for Variable Bit Rate Transmission", IEEE Trans. COM-28, 7, Seiten 1040-1046 (Juli 1980) (im folgenden als Dokument 1 bezeichnet) vorgeschlagen.
- In CCITT SGXV III, "Annex to Question X/XV (Sprach- Paketbildung) Algorithm and Protocol for Speech Packetization" (TD131, Genf 6-17 Juni 1988) (im folgenden als Dokument 2 bezeichnet) empfahl das CCITT voraussichtlich das eingebettete ADPCM als das G727 und das Sprachpaketprotokoll als G764 als "Codiersystem für Sprachpaket-Kommunikation".
- Die Fig. 14 und 15 sind Blockdiagramme, die die Strukturen eines Codierabschnittes und eines Decodierabschnittes in dem voraussichtlich empfohlenen G727- System veranschaulichen. Bei dem in Fig. 14 gezeigten Codierer ist der Eingang ein durch einen u-PCM- oder A-PCM-Codec digitalisiertes Sprachsignal. Eine PCM-Formatumsetzungsschaltung 610 setzt einen u-PCM- oder einen A-PCM-Öode in einen linearen PCM-Code um. Ein Bezugszeichen "630" bezeichnet einen adaptiven Quantisierer und "670" bezeichnet einen adaptiven Prädiktor. Ein Subtrahierer 620 berechnet die Differenz zwischen dem Eingangssignal und einem Voraussagesignal, das Ausgangssignal des adaptiven Prädiktors 670, und sendet die Differenz zu dem adaptiven Quantisierer 630. Der Quantisierer 630 quantisiert das empfangene Voraussagedifferenzsignal und liefert das Ergebnis als einen ADPCM-Code. Eine Eitmaskierschaltung 640 maskiert die niedrigeren Bits des ADPCM-Ausgangscodes durch die Maximalzahl der aufgebbaren Bits und verschiebt dann den Code nach rechts. Das Ausgangssignal der Bitmaskierschaltung 640 wird als ein Kernbit zu einem adaptiven inversen Quantisierer 650 gespeist, der seinerseits die inverse Quantisierung des Kernbits durchführt. Das Ausgangssignal des adaptiven inversen Quantisierers 650 wird zu dem adaptiven Prädiktor 670 und zu einem Addierer 660 gespeist. Der Addierer 660 addiert das Ausgangssignal des adaptiven inversen Quantisierers 650 und das Ausgangssignal des adaptiven Prädiktors 670, um so ein lokal decodiertes Signal zu liefern. Der adaptive Prädiktor 670, der ein adaptives Filter mit Zwei- Bit-Polen und Sechs-Bit-Nullpunkten ist, bereitet das Voraussagesignal aus dem lokal decodierten Signal und dem empfangenen, invers quantisierten Voraussagedifferenzsignal vor.
- Die Anzahl der Bits des adaptiven Quantisierers 630 und die Anzahl der Kernbits, die rückzukoppeln sind, hängen von dem zu verwendenden Algorithmus ab. Beispielsweise bedeutet-der 32-Kbps (4, 2)-Algorithmus, daß die Quantisierung vier Bits umfaßt und die Kernbits zwei Bits sind.
- in Fig. 14 bildet der adaptive Quantisierer 630 einen Mitkopplungspfad, während die Bitmaskierschaltung 640, der adaptive inverse Quantisierer 650 und der adaptive Prädiktor 670 einen Rückkopplungspfad bilden.
- Der Betrieb des Decodierers in Fig. 15 wird im folgenden beschrieben. Dieser Decodierer umfaßt wie der Codierer einen Rückkopplungspfad aus einer Bitmaskierschaltung 680, einem adaptiven inversen Rückkopplungsquantisierer 690 und einem adaptiven Prädiktor 710 sowie einen Mitkopplungspfad aus einem adaptiven inversen Mitkopplungsquantisierer 720 und einer PCM-Formatumsetzungsschaltung 740. Der Rückkopplungspfad in dem Decodierer hat die gleiche Struktur wie derjenige in dem Codierer. Die Bitmaskierschaltung 680 maskiert die niedrigeren Bits des empfangenen ADPCM-Codes, ausschließlich der oberen Kernbits, verschiebt dann den Code nach rechts, so daß lediglich die Kernbits zu dem adaptiven inversen Rückkopplungsquantisierer 690 gesandt sind. Dieser adaptive inverse Quantisierer 690 führt die inverse Quantisierung der Kernbits durch. Der adaptive Prädiktor 710 empfängt das invers quantisierte Voraussagedifferenzsignal oder das Ausgangssignal des adaptiven Quantisierers 690 und das lokal decodierte Signal oder das Ausgangssignal eines Addierers 70. Die Bitaufgabe in dem Netzwerk wird von den niedrigeren Bits des ADPCM-Codes ausgeführt, um so eine Übertragung der Kernbits zu gewährleisten. Demgemäß liefert die Bitmaskierschaltung 680 auf der Decodiererseite das gleiche Ausgangssignal wie die Bitmaskierschaltung 640 auf der Codiererseite. Mit anderen Worten, die adaptiven inversen Quantisierer 690 und 650 auf jeweils der Decodierer- und Codiererseite haben exakt das gleiche Ausgangssignal, und in ähnlicher Weise haben die adaptiven Prädiktoren 710 und 670 das gleiche Ausgangssignal.
- Der adaptive inverse Mitkopplungsquantisierer 720 führt die inverse Quantisierung der Kernbits des ADPCM-Ausgangscodes und derjenigen Bits, die ohne Aufgabe zurückbleiben, aus. Ein Addierer 730 addiert das Ausgangssignal des adaptiven inversen Mitkopplungsquantisierers 720 und das Ausgangssignal des adaptiven Prädiktors 710, um so ein decodiertes Signal zu liefern. Das decodierte Signal wird dann zu der PCM-Formatumsetzungsschaltung 740 gesandt, die ihrerseits den linearen PCM-Code in einen u-PCM- oder einen A-PCM-Code umsetzt. Eine Synchroncodiereinstellschaltung 750 ist vorgesehen, um das Auftreten eines Fehlers in der Synchron-Tandemverbindung zu vermeiden.
- Bei Aufgabe von Bits des Ausgangscodes in dem normalen ADPCM, nicht vom eingebetteten Typ, weicht das invers quantisierte Voraussagedifferenzsignal zwischen dem Codierer und dem Decodierer ab. Als ein Ergebnis ist das adaptive Verarbeiten des Quantisierers und Prädiktors in dem Codierer asynchron mit demjenigen in dem Decodierer, und der auf der Bitaufgabe beruhende Fehler wird erneut durch ein Synthesefilter gefiltert, um so die bitaufgabe-orientierte Verschlechterung zu steigern.
- Da in dem oben erwähnten eingebetteten ADPCM lediglich die Kernbits zu dem Prädiktor rückgekoppelt sind, kann kein Asynchronbetrieb zwischen dem Codierer und dem Decodierer auftreten, selbst wenn diejenigen niedrigeren Bits ausschließlich der Kernbits in dem Netzwerk aufgegeben sind. Da weiterhin das Voraussagesignal auf der Codiererseite das gleiche wie das auf der Decodiererseite ist, wird das Quantisierungsrauschen entsprechend der Anzahl von aufgegebenen Bits einfach direkt zu dem codierten Signal addiert, um so die Verschlechterung der auf der Bitaufgabe beruhenden Sprachqualität zu unterdrücken.
- Das Dokument 2 erläutert, wie ein Sprachpaket unter bester Verwendung der oben beschriebenen Eigenschaft gebildet wird, und das Protokoll.
- Fig. 16 veranschaulicht ein in Dokument 2 offenbartes Paketformat. In dieser Figur ist ein Bit 1 ein LSB, und ein Bit 8 ist ein MSB. Ein "PD" (Protokoll-Diskriminator) dient zum Unterscheiden eines Sprachpaketes von anderen Paketen. Ein "BDI" (Blockabfallindikator) zeigt die Anzahl von Blocks, die bei der Paketbildung aufgegeben werden können, einen Anfangsstatus und die Anzahl von Blocks, die an jedem Knoten des Netzwerkes aufgegeben werden können, an. Der "Block" ist hier eine 128- Bit-Information, die durch Sammeln eines Rahmens von codierten Sprachausgangssignalen Bit für Bit erworben ist, wobei der Rahmen für das Codieren 16 ms (128 Abtastungen oder Proben) beträgt. Ein "TS" (Zeitstempel) zeigt eine Ansammlung von Verzögerungen, die an jedem Knoten in dem Netzwerk verursacht sind. Ein "CT" (Codiertyp) ist ein Feld, das einer Sprachcodiermethode zugeordnet ist, die beim Vorbereiten von Paketen verwendet ist.
- Ein "SEQ" (Sequenzzahl) ist eine Zahl, die die Sequenz von Paketen wiedergibt, und wird verwendet, wenn ein Paketverlust eintritt. Ein "NS" (Rauschen) ist ein Feld, das den Pegel des Mintergrundrauschens anzeigt. NON-DROPPABLE OCTETS bzw. nicht-abfallbare Oktetts, ein Block für Kernbits des eingebetteten ADPCM-Ausgangssignales, ist ein Feld für Information, das in dem Netzwerk nicht aufgegeben werden kann. OPTIONAL DROPPABLE BLOCKS bzw. wahlweise aufgebbare Blöcke, ein Block der niedrigeren Bits des eingebetteten ADPCM, ist ein Informationsfeld, das aufgegeben werden kann, wenn dies durch ein System an dem Netzwerk gefordert wird. Ein Schicht-2-Vorsatz und ein Schicht-2-Nachsatz sind jeweils an dem Beginn und Ende jedes Paketes angebracht.
- Gemaß dem Protokoll des Paketnetzwerkes, das ein Paket verwendet, das ein in Fig. 16 gezeigtes Format hat, wird die Paketaufgabe durch Aufgeben der OPTIONAL DROPPABLE BLOCKS durchgeführt.
- Das Obige ist die Paketaufgabe-Kompensiermethode, die das herkömmliche eingebettete ADPCM und Paketformat verwendet. Mit der Verwendung dieser Methode wird die Qualität nicht verschlechtert, wie dies oben beschrieben ist, wenn eine Informationsaufgabe innerhalb eines Paketes, d.h. Bit für Bit, eintritt. Wenn die Aufgabe jedoch Paket für Paket erfolgt, gibt das Verfahren auch die Kernbits des eingebetteten ADPCM auf, um so die Qualität zu verschlechtern. Die Paketaufgabe resultiert in einem vollständigen Verlust von Signalen für einen Rahmen (16 ms) und macht eine Wiedergabe der ursprünglichen Sprache unmöglich. Dieser Zustand endet nicht in einem Rahmen, sondern kann für einen anderen Rahmen fortgesetzt sein, da der Codierer und der Decodierer asynchron arbeiten. Eine der Kompensationsmethoden für eine Paket-für-Paket-Aufgabe ist die Wiedergabe der verlorenen Bits durch Interpolation mit den Paketen vor und nach dem aufgegebenen Paket. Da das Voraussagedifferenzsignal oder das Ausgangssignal des ADPCM ein Signal ist, bei dem die Korrelation entfernt ist, liefert selbst die Interpolation, die eine um einen Rahmen (128 Abtastungen bzw. Proben) getrennte Abtastung oder Probe verwendet, kaum irgendeinen Interpolationseffekt, um so in einer unvermeidbaren Verschlechterung der Qualität zu resultieren.
- Das herkömmliche Codiersystem, das das eingebettete ADPCM verwendet, gibt auch die Kernbits des eingebetteten ADPCM auf, wenn eine Paket-für-Paket-Aufgabe eingetreten ist, um so die Wiedergabe des ursprünglichen Sprachsignales unmöglich zu machen und die Qualität aufgrund der asynchronen Funktionen des Codierers und Decodierers merklich zu verschlechtern.
- Weiterhin wurde keine Positive Berücksichtigung für die chronologische Änderung in der Bitrate noch eine ausreichende Berücksichtigung dafür gegeben, wie die Bitrate zu steuern und wie eine Zelle mit einer festen Länge aufzubauen ist. Da die Menge an Information eines Sprachsignales sich mit der Zeit ändert, verändert das eingebettete ADPCM, das mit einer festen Bitrate arbeitet, die Qualität der codierten Sprache, um ein unbequemes Rauschen und Abfälle der Codierwirksamkeit zu liefern.
- Wir anerkennen die Offenbarung in EP-A-084 125 eines statistischen Multiplexers, der ein aufgespaltenes Bandcodieren für Stimm- und Datensignale verwendet, wobei jedem Eingangsport eine Unterbank von Filtern und eine Unterbank von Quantisierern für jeweilige Bänder zugeordnet ist, wie dies im Oberbegriff des Patentanspruches 1 weiter unten definiert ist. Weiterhin offenbart die EP-A-139 803 die Rekonstruktion von verlorenen (aufgegebenen) Zellen bei Empfang eines digitalen Signales.
- Es ist eine Aufgabe der vorliegenden Erfindung, ein variables Bitraten-Codiersystem vorzusehen, das weniger Verschlechterung der Qualität bezüglich einer Paketfür-Paket-Aufgabe hat, um so eine stabile Qualität sicherzustellen, und das eine hohe Codierwirksamkeit aufweist.
- Die vorliegende Erfindung schafft ein Gerät, wie dieses im Patentanspruch 1 definiert ist, und ein Verfahren, wie dieses im Patentanspruch 5 definiert ist.
- Ein variables Bitraten-Codiersystem gemäß der vorliegenden Erfindung umfaßt auf einer Senderseite eine Einrichtung zum Teilen einer Folge von Signalen, wie beispielsweise Sprachsignalen, in Signale einer Vielzahl von Bandbereichen, eine Einrichtung zum Codieren der geteilten Signale für jeweilige Bandbereiche durch die Teilereinrichtung zum Berechnen einer Leistung der Signale von jedem Bandbereich, eine Einrichtung zum Andern einer Gesamtsumme einer Anzahl von Bits zum Codieren der Signale für jeden Bandbereich und einer Zahl der Codierbits für jeden Bandbereich aufgrund der Leistung für jeden Rahmen mit einer konstanten Länge oder einer variablen Länge und eine Einrichtung zum Aufbauen der Signale für jeden durch die Codiereinrichtung codierten Bandbereich und der Anzahl von Bits zum Codieren der Signale für jeden Bandbereich in eine Informationseinheit mit einer konstanten Länge, genannt eine Zelle, oder in eine Informationseinheit mit einer variablen Länge, genannt ein Paket, und hat weiterhin auf der Empfängerseite eine Einrichtung zum Zerlegen der Zelle oder des Pakets, eine Einrichtung zum Identifizieren einer aufgegebenen Zelle oder eines aufgegebenen Pakets, eine Einrichtung zum Decodieren der Signale für jeden Bandbereich, eine Einrichtung zum Zusammensetzen der decodierten Signale für jeden Bandbereich in ein Signal eines vollen Bandbereiches und eine Einrichtung zum Wiedergeben der aufgegebenen Zelle oder des aufgegebenen Pakets, um einen Spalt zu füllen, der durch die aufgegebene Zelle oder das aufgegebene Paket verursacht ist.
- Die Teilereinrichtung dividiert ein Eingangssignal in Signale einer Vielzahl von Frequenzbandbereichen, und die Codiereinrichtung quantisiert und codiert die Signale jedes Bandbereiches. Zu dieser Zeit führt die Bitzahl-Änderungseinrichtung eine Zuordnung der Codierbits für jedes Band Rahmen für Rahmen aufgrund der Leistung jedes Bandbereichsignales durch, die durch die Leistungsberechnungseinrichtung gewonnen ist. Diese Einrichtung schließt die Korrelation oder Redundanz des Eingangssignales aus, um so ein hochwirksames Codieren des Eingangssignales zu gewährleisten. Zu der gleichen Zeit wird das SNR des decodierten Signales auf der Empfängerseite mittels der Einrichtung zum Ändern der Gesamtzahl der Codierbits für jeden Bandbereich aufgrund der Leistung jedes Bandbereichssignales vorausgesagt, und die Bitrate wird durch diese Einrichtung derart gesteuert, daß das SNR konstant gemacht ist. Es ist daher möglich, die Qualität des decodierten Signales konstant beizubehalten. Zusätzlich wird die Bitrate gemäß einer chronologischen Änderung in der Eigenschaft des Eingangssignales verändert, was die Codierwirksamkeit weiter steigert.
- Dann werden die codierten Signale für jeden Bandbereich und die Signale, die die Anzahl von Codierbits für die Signale jedes Bandbereiches darstellen, einem Multiplexierprozeß (Aufbauen einer Zelle oder Paketbildung) unterworfen, und die sich ergebenden Signale werden auf einen Übertragungspfad gesandt. Zu dieser Zeit kann jeder Zelle oder jedem Paket Priorität gegeben sein oder nicht. Im Unterschied zu dem herkömmlichen ADPCM, der eine Voraussage mittels alter Signale macht und eine synchrone adaptive Steuerung von Quantisierern durch die Codierer und Decodierer durchführt, codiert das vorliegende System unabhängig Signale einer Vielzahl von Frequenzen Rahmen für Rahmen. Was immer für eine Zelle oder ein Paket aufgegeben wird, beeinträchtigt daher die Aufgabe nicht die nächste Zelle oder das nächste Paket. Dies kann wirksam die Verschlechterung der Qualität aufgrund der Zellenaufgabe reduzieren.
- Diese Erfindung kann vollständiger aus der folgenden Detailbeschreibung bevorzugter Ausführungsbeispiele, die nur als Beispiel angesehen werden, im Zusammenhang mit den begleitenden Zeichnungen verstanden werden, in welchen:
- Fig. 1 ein Blockdiagramm ist, das die Struktur eines Codierabschnittes und eines variablen Bitraten-Codiergerätes gemäß einem Ausführungsbeispiel der vorliegenden Erfindung zeigt,
- Fig. 2 ein Blockdiagramm ist, das ein Beispiel für die Struktur einer QMF-Bank in Fig. 1 zeigt,
- Fig. 3 ein Diagramm ist, das das Format eines Informationsabschnittes einer Zelle zeigt,
- Fig. 4 ein schematisches Flußdiagramm ist, um den allgemeinen Betrieb eines Codierers zu erläutern,
- Fig. 5 ein detailliertes Flußdiagramm ist, das den Betrieb eines Bitraten-Steuerabschnittes in Fig. 1 veranschaulicht,
- Fig. 6 ein detailliertes Flußdiagramm ist, das den Betrieb einer Bitzuordnungs-Rechenschaltung in Fig. 1 veranschaulicht,
- Fig. 7 ein detailliertes Flußdiagramm ist, das erläutert, wie eine Bitzuordnung kompensiert wird,
- Fig. 8 ein Blockdiagramm eines Decodierabschnittes ist,
- Fig. 9 ein Flußdiagramm ist, das den Betrieb einer Zellenaufgabe-Detektorschaltung veranschaulicht,
- Fig. 10 ein Diagramm ist, um zu erläutern, wie eine Zellaufgabe erfaßt wird,
- Fig. 11 ein Blockdiagramm ist, das die Struktur eines in Fig. 8 gezeigten Interpolationsabschnittes veranschaulicht,
- Fig. 12A bis 12E Beispiele von Wellenformen zum Erläutern der Interpolation zeigen,
- Fig. 13 ein Diagramm ist, das eine Glättungsfensterfunktion veranschaulicht
- Fig. 14 ein Blockdiagramm eines Codierabschnittes eines herkömmlichen eingebetteten ADPCM ist,
- Fig. 15 ein Blockdiagramm eines Decodierabschnittes des herkömmlichen eingebetteten ADPCM ist, und
- Fig. 16 ein Diagramm ist, das ein herkömmliches Paketformat veranschaulicht.
- In Fig. 1 ist eine Folge von Digitalsignalen in einen Eingangsanschluß 100 eingegeben, und vorbestimmte Proben oder Abtastungen der Folge von Signalen werden in einem Eingangspuffer 101 gespeichert. Eine Filterbank 102 teilt die Folge von Eingangssignalen in eine Vielzahl von Frequenzbandbereichen. Als eine hervorragende Filterbank, die nicht die Umfaltverzerrung des Spektrums verursacht, ist eine QMF-(Quadratur-Spiegel-Filter-)Bank bekannt, die bei dem vorliegenden Ausführungsbeispiel verwendet wird, um einen Signalbandbereich bis zu 4 kHz in 8 gleiche Bandbereiche zu trennen.
- In Fig. 2, die ein Blockdiagramm darstellt, das als Beispiel die Struktur der QMF-Bank veranschaulicht, sind ein Hochpaßfilter 201 und ein Tiefpaßfilter 202 in der QMF-Bank vorgesehen. Diese Filter 201 und 202 werden jeweils durch ein 32stes FIR-Filter gebildet. Ein anderes Hochpaßfilter 204 und ein Tiefpaßfilter 205 werden jeweils durch ein 16stes FIR-Filter gebildet. Ein Ändern der Reihenfolge des erststufigen Filters, des zweitstufigen Filters und des drittstufigen Filters voneinander kann einen derartigen Effekt bewirken, daß die Größe der Verzögerungen, die auf der Filterberechnung beruhen, ohne Verschlechterung der Filterkennlinie durch Ausnutzung der Tatsache reduziert wird, daß die Neigung des Spektrums eines Sprachsignales zwischen den niedrigen und hohen Bändern verschieden ist. Die Koeffizienten der Filter sind ausgelegt, um eine Umfaltverzerrung des Spektrums zu vermeiden. (Einzelheiten des Filteraufbaues sind aufgezeigt in N. S. Jayant P. Nr. 11: "Digieat Coding of Waveforms", PRENTICE-HALL, INC. (Dokument 3), wobei von einer Detailbeschreibung hier abgesehen wird.)
- In Fig. 1 dient eine Normierschaltung 101 zum Normieren des Signales jedes Bandbereiches oder des Ausgangssignales der QMF-Bank 102 als ein Vorprozeß der Quantisierung. Ein einfaches praktisches Beispiel der Normierschaltung ist eine Schaltung, die das Signal jedes Bandbereiches durch einen RMS (quadratischen Mittelwert) für jeden Bandbereich teilt. Ein Quantisierer 104 dient zum Quantisieren des normierten Signales jedes Bandbereiches durch eine vorbestimmte Bitzahl und wird durch eine Nachschlagtabelle gebildet. Eine Bandleistungsrechenschaltung 105 ist vorgesehen, um die Leistung des Signales jedes Bandbereiches zu berechnen. Wenn angenommen wird, daß die Folge der Signale des i-ten Bandbereiches durch Xi(n), mit i = 1, 2, ..., 8, gegeben ist, so berechnet die Schaltung 105 einen RMS- Wert i mittels der folgenden Gleichung (1) und gibt dann das Ergebnis aus:
- wobei N das Intervall ist, über dem der RMS berechnet ist.
- Ein Quantisierer 106 quantisiert den RMS-Wert i jedes- Bandbereiches von der Leistungsrechenschaltung 105 mit einer vorbestimmten Bitzahl und gibt den sich ergebenden Code zu einem Zellenaufbauabschnitt 111 und einem inversen Quantisierer 107 ab. Der inverse Quantisierer 107 liefert einen Wert i, der der invers quantisierte Code von i ist. Die Normierschaltung 103, ein Bitraten-Steuerabschnitt 108 und eine Bitzuordnungsrechenschaltung 109 verwenden i, das durch den Decodierer gewonnen ist, als einen RMS-Wert jedes Bandbereiches. Dies kann vollständig eine Verschlechterung der Kennlinie aufgrund einer Fehlanpassung zwischen den Quantisierbitzahlen oder Normierparametern zwischen den Codierer- und Decodiererseiten verhindern.
- Der Bitratensteuerabschnitt 108 steuert die Bitrate so, daß die Qualität des durch den Decodierer zu decodierenden Signales aufgrund der Leistung des Signales des Bandbereiches stabil ist und die Größe der Codes von dem Codierer konstant wird. (Die Detailbeschreibung von diesem Bitratensteuerabschnitt wird weiter unten gegeben.)
- Die Bitzuordnungsrechenschaltung 109 berechnet die Quantität der zu den Quantisierern der einzelnen Bandbereiche zuzuordnen Bits aufgrund der Leistung der Signale der einzelnen Bandbereiche und der Bitrate von dem Bitratensteuerabschnitt 108. Die Einzelheiten der Schaltung 109 werden ebenfalls weiter unten beschrieben.
- Eine Zeitstempelrechenschaltung 110 berechnet die Vorsatzunterrahmenzahl eines in einer Zelle zu übertragenden Rahmens. Das heißt, die Rechenschaltung 110 berechnet die Anzahl von in einer Zelle zu übertragenden Unterrahmen. Unter der Annahme, daß der Zeitstempel für den i-ten Rahmen (Zelle) durch Ts(i), der Zeitstempel für den (i-1)-ten Rahmen (Zelle) durch Ts(i-1) und die Unterrahmenzahl durch Ns(i-1) gegeben sind, dann kann Ts (i) aus der folgenden Gleichung berechnet werden:
- Ts (i) = Ts (i-1) + Ns (i-1) ... (2)
- Der Zellenaufbauabschnitt 111 baut eine Zelle für die Folge von Codes jedes Bandbereichsignales, den RMS-Wert jedes Bandbereichsignales, die Unterrahmenzahl in einer Zelle und den Zeitstempel in dem in Fig. 3 gezeigten Format.
- In dem Format in Fig. 3 beträgt die Gesamtzellenlänge 52 Bytes, von denen 48 Bytes durch einen Informationsabschnitt eingenommen sind, der aus einem 1-Byte-Zeitstempel, einer 1-Byte-Unterrahmenzahl, einer 4-Byte- Bandbereichsleistung und einem 42-Byte-Bandbereichssignal besteht.
- Fig. 4 ist ein schematisches Flußdiagramm, das den allgemeinen Betrieb des Codierers veranschaulicht.
- Zunächst werden als der Initialisierungsprozeß (P1), der Eingangspuffer, die QMF-Bank und der Zeitstempel gelöscht und die Anfangswerte werden für das Ziel-SNR, die maximale Unterrahmenzahl und die Unterrahmenlänge gesetzt.
- Dann werden Prozeßroutinen eines Eingangsgewinnungsprozesses (P2), QMF-Filterprozesses (P3), Bandbereichsleistungsberechnungsprozesses (P4) und Bitratensteuerprozesses (P5) Unterrahmen für Unterrahmen wiederholt, bis das Ziel-SNR erreicht ist.
- Sodann wird ein Prozeß zum Berechnen der Bitzuordnung für jeden Bandbereich (P6) ausgeführt. Nach der Ausführung eines Prozesses des Quantisierens jedes Bandbereichssignales aufgrund der Bitzuordnung (P7) wird ein Zellenaufbauprozeß (P8) ausgeführt.
- Die obige Sequenz von Prozessen wird wiederholt für jeden Rahmen (Zelle) ausgeführt.
- Das heißt, der Bitratensteuerprozeß (P5) wird gemäß dem in Fig. 5 gegebenen Detailflußdiagramm durchgeführt, das die folgenden Schritte enthält, die durch den Bitratensteuerabschnitt ausgeführt sind.
- Zunächst werden als der Initialisierungsschritt (S1) das Ziel-SNRd, die maximale Unterrahmenzahl Nsmax je Zelle und die Unterrahmenlänge Ls gesetzt. Sodann wird I = 2 als der Anfangswert für die Unterrahmenzahl I gesetzt (S2) . Anschließend wird die Zahl der Eingangsproben oder -abtastungen für das QMF auf I × Ls gesetzt, das dann zu dem Eingangspuffer gesandt wird (S3). Anschließend wird der RAMS-Wert i jedes Bandbereiches, gewonnen durch die Leistungsrechenschaltung, ausgelesen (S4), und die mittlere Bitrate R je Abtastung oder Probe, die zum Übertragen der Folge von Signalen der zu codierenden I × Ls-Proben in einer Zelle erforderlich ist, wird durch die folgende Gleichung (3) berechnet (S5):
- R = B/I × Ls ...(3)
- wobei B die gesamte Bitzahl ist, die Übertragungscodes des Bandbereichssignales zugewiesen ist, und wobei B = 42 × 8 = 336 in dem in Fig. 3 gezeigten Format vorliegt.
- SNR des durch den Decodierer zu decodierenden Signales wird aus der folgenden Gleichung mittels des RMS-Wertes i jedes Bandbereiches und der mittleren Bitrate R vorausgesetzt (S6):
- wobei Mb die Anzahl der unterteilten Abschnitte eines Bandbereiches ist: Mb = 8 in diesem Ausführungsbeispiel.
- Die obige SNR-Voraussagegleichung beruht auf dem Ergebnis des theoretischen Analysierens des quadratischen Mittelwertes des Codierfehlers in dem Fall der optimalen Bitzuordnung, die in dem Unterbandcodiersystem gegeben ist. Tabelle 1 ist eine Liste der durch Gleichung (4) vorausgesagten Werte im Vergleich mit den Werten des SNR, die durch Computersimulation gewonnen sind. Diese Tabelle zeigt, daß die vorausgesagten Werte sehr nahe bei den SNR-Werten liegen, die durch das tatsächliche Signal codierend erhalten sind. In Tabelle 1 ist die Bitrate auf 16 Kbps eingestellt. Tabelle 1 Rahmennummer Vorausgesagtes SNR SNR durch Simülation
- Nach der Voraussage von SNR wird SNR mit dem Ziel-SNRd verglichen (S7). Wenn SNR größer als SNRd ist, wird die Unterrahmennummer um Eins nach Prüfen, daß die Unterrahmennummer I gleich oder niedriger als die maximale Unterrahmennummer Nsmax ist, um Eins inkrementiert, dann kehrt der Fluß zu (1) des Flußdiagrammes zurück (S8). Die obige Sequenz der Prozesse wird wiederholt, bis SNR gleich oder niedriger als SNRd ist, und die Bitrate je Abtastung und die Unterrahmennummer (I - 1), die unmittelbar vor der Bedingung SNR > SNRd erfüllt ist, werden ausgegeben (S9). Wenn die Unterrahmennummer Nsmax überschreitet, werden die Bitrate je Abtastung und die Unterrahmennummer I = Nsmax ausgegeben (S10).
- Die obige Bitratensteuerungsmethode, die die Bitraten durch Erhöhen der Anzahl von zu codierenden Eingangsproben ändert, während SNR vorausgesagt wird, hat die folgenden drei Hauptvorteile.
- (1) Eine konstante Qualität kann immer beibehalten werden.
- (2) Codierte Daten können richtig in eine Zelle mit einer festen Länge gebracht werden.
- (3) Die Codierwirksamkeit ist hoch, da die Bitrate entsprechend der chronologischen Änderung in der Eigenschaft des Eingangssignales verändert wird.
- Das in Fig. 6 gezeigte Flußdiagramm, das durch die oben beschriebene Bitzuordnungsrechenschaltung 109 ausgeführt ist, wird unten beschrieben.
- Zunächst werden der RMS-Wert i als die Leistung jedes Bandbereiches und die Bitrate R je Probe von dem inversen Quantisierer 107 und dem Bitratensteuerabschnitt 108 abgerufen (S61). Sodann wird die Größe der Bitzuordnung, Rk, für jeden Bandbereich aus der folgenden Gleichung (5) berechnet (S62).
- Diese Gleichung dient zum Gewinnen der optimalen Bitzuordnung, um den quadratischen Mittelwert des decodierten Fehlers zu eliminieren, und ist in N.S. Jayant und P No. 11: "Digital Coding of Waveforms", PRENTICE-HALL, NJ (Dokument 4) offenbart.
- Die Größe der durch die Gleichung (5) berechneten Bitzuordnung Rk ist eine reelle Zahl. In einem Fall, in welchem ein skalarer Quantisierer verwendet wird, um das Signal jedes Bandbereiches zu quantisieren, sollte jedoch Rk eine ganze Zahl sein, so daß sie entsprechend kompensiert wird (S63).
- Fig. 7 ist ein Flußdiagramm, das ein Ausführungsbeispiel der Rk-Kompensiermethode veranschaulicht.
- Nachdem Rk unter das Dezimalkomma gerundet wurde, um eine ganze Zahl zu sein (S631), wird die Zahl der verbleibenden Bits, Rr, die auf der Gewinnung der ganzen Zahl beruht, durch die folgende Gleichung (6) berechnet (S632).
- Dann werden die verbleibenden Bits Rr Bit für Bit in der Reihenfolge der Bandbereiche mit der größeren Leistung oder Potenz zu demjenigen mit der kleineren Leistung oder Potenz wiederzugeordnet (S633). Die Bit- Wiederzuordnung in der Reihenfolge von größerer Leistung oder Potenz zu kleinerer Leistung oder Potenz kann den decodierten Fehler vermindern.
- Das Obige ist die Beschreibung des Codiererabschnittes.
- Der Decodiererabschnitt wird im folgenden beschrieben.
- Fig. 8 zeigt ein Blockdiagramm des Decodierabschnittes eines Codiergerätes, auf die ein variables Bitraten- Codiersystem gemäß einem Ausführungsbeispiel der vorliegenden Erfindung angewandt ist.
- In Fig. 8 dient ein Zellenzerlegungsabschnitt 301 zum Zerlegen der Zelle mit dem Format in Fig. 3 in einzelne Daten, wie beispielsweise dem Zeitstempel, Bandbereichsleistung und Bandbereichssignal. Ein inverser Quantisierer 302, der zum inversen Quantisieren des Signales jedes Bandbereiches vorgesehen ist, kann wie der Quantisierer 104 in Fig. 1 durch eine Nachschlagtabelle realisiert werden.
- Eine inverse Normierschaltung 303 multipliziert das Ausgangssignal des inversen Quantisierers 302 mit dem RMS-Wert i jedes Bandbereiches. Eine Bitzuordnungsrechenschaltung 305 ähnlich der Bitzuordnungsrechenschaltung 109 in Fig. 1 berechnet die Größe der jedem Bandbereich zugeordneten Bits mittels des RMS-Wertes k (K = 1, 2, ..., Mb) für jeden Bandbereich und die Unterrahmenzahl Ns je Zelle. Zuerst wird eine mittlere Bitrate R je Abtastung gemäß der Gleichung (3) berechnet, und die Größe der Bitzuordnung Rk (K = 1, 2, ..., Mb) für jeden Bandbereich wird gemäß der Gleichung (5) berechnet.
- Eine Zellenaufgabe-Erfassungsschaltung 306 erfaßt, ob eine Zellenaufgabe vorliegt oder nicht, mittels des übertragenen Zeitstempels Ts und Unterrahmennummer Ns.
- Fig. 9 ist ein Flußdiagramm, das veranschaulicht, wie die Erfassung durchgeführt wird. Diese Erfassungsmethode wird im folgenden anhand der Fig. 9 zusammen mit der Fig. 10 erläutert.
- Zunächst werden der Zeitstempel und die Unterrahmennummer abgerufen (S1), und diese Werte Ts und Ns für zwei Zellen werden immer gehalten (S2).
- Sodann wird ein erwarteter Wert T des vorliegenden (Zeit n) Zeitstempels wie folgt berechnet, indem der Zeitstempel Ts(n-1) und die Unterrahmennummer Ns(n-1) der Zelle verwendet wird, die eine Stunde älter als die gerade angekommene Zelle ist (S3).
- T = Ts (n-1) + Ns (n-1)
- Dann wird T mit dem Zeitstempel Ts(n) verglichen (S4), und die Zelle wird aufgegeben, wenn sie aneinander angepaßt sind. Wenn sie nicht miteinander übereinstimmen, wird beurteilt, daß die Zellenaufgabe unmittelbar vor der vorliegenden Zelle aufgetreten ist. Da beispielsweise in dem Fall von Fig. 10 die folgenden Gleichungen (7) erfüllt sind, wird entschieden, daß "keine Aufgabe" eingetreten ist.
- Ts (n-1) = 1
- Ns (n-1) = m
- T = Ts (n-1) + Ns (N-1) = m + 1 ... (7)
- = Ts (n)
- Wieder in bezug auf Fig. 8 erlaubt es eine Vorinterpolationsverarbeitungsschaltung 307 jedem Bandbereichssignal zu einem QMF-Bankabschnitt 308 überbrückt zu werden, wenn keine Aufgabe eingetreten ist, und liefert "0" anstelle jedes Bandbereichssignales zu dem QMF- Bankabschnitt 308, wenn eine Zellenaufgabe eingetreten ist. Dieser QMF-Bankabschnitt 308, der das Signal eines geteilten Bandbereiches empfängt und ein Signal eines vollen Bandes ausgibt, hat die in Fig. 2 gezeigte Struktur, wobei jedoch Eingang und Ausgänge umgekehrt sind. Ein decodiertes oder rekonstruiertes Signal von dem QMF-Bankabschnitt 308 wird zu einem Interpolationsabschnitt 309 bei der nächsten Stufe gesandt, der eine Interpolation des Signalverlustes durchführt, der auf der Zellaufgabe beruht.
- Fig. 11 ist ein Blockdiagramm, das ein Ausführungsbeispiel des Interpolationsabschnittes veranschaulicht, und die Fig. 12A bis 12e zeigen beispielsweise Signalwellenformen, die den Fortschritt der Interpolation veranschaulichen.
- In Fig. 11 wird das von einem Eingangsanschluß 400 kommende rekonstruierte Signal zu einem Ausgangsanschluß 301 in dem Fall von keiner Zellenaufgabe gemäß einem von einem Anschluß 409 eingespeisten Zellenaufgabesignal überbrückt. In dem Fall einer Zellenaufgabe wird die Interpolation wie folgt ausgeführt.
- Zunächst wird das rekonstruierte Signal einer Zelle unmittelbar vor der Aufgabe von einem Puffer 401 abgerufen und zu einem LPC-Analyseabschnitt 402 gesandt. Dieser Abschnitt 402 führt eine LPC-Analyse mittels der "Autokorrelationsmethode" oder der "Kovarianzmethode" durch, um Voraussagekoeffizienten α&sub1;, α&sub2;, ..., αp (P ist eine Voraussageordnungszahl und hier auf 8 eingestellt) und ein Voraussagerestsignal e(n) zu gewinnen. Da diese LPC-Analyse in Einzelheiten in "Digital Signal Processing of Speech" geschrieben von R.W. Shafer und übersetzt von Suzuki, Corona Co., Ltd. (Dokument 5) beschrieben ist, wird dessen Beschreibung weggelassen.
- Eine Übertragungsfunktion H(z) des Voraussagefilters wird durch die folgende Gleichung (8) ausgedrückt.
- Dann wird das Voraussagerestsignal e(n) einer Schritt- oder Steigungsanalyse in einem Schritt- oder Steigungsanalyseabschnitt 403 unterworfen, um eine Verstärkung g und ein Voraussagerestsignal ep(n) zu gewinnen. Obwohl die Schrittanalyse auch im Dokument 5 diskutiert ist, werden Tp und g in diesem Beispiel wie folgt gewonnen.
- Indem der letzte Abtastpunkt eines Rahmens in dem rekonstruierten Signal der Zelle (Rahmen) unmittelbar vor der Aufgabe auf n = N gesetzt wird, wird eine Fehlerfunktion E(Tp) in der folgenden Gleichung (9) definiert.
- wobei L das Intervall für eine Bewertung eines Fehlers ist und hier auf L = 70 gesetzt ist.
- Als die Schrittperiode Tp wird diejenige gewonnen, die das obige E(Tp) minimiert. Die Schrittverstärkung g wird aus der folgenden Gleichung (10) nach der Gewinnung von Tp berechnet.
- Die Voraussagerestsignale e(n) und ep(n) werden aus den folgenden Gleichungen (11) und (12) berechnet, und ep(n) wird in einem Puffer 404 angesammelt.
- wobei x(n) ein Signal von dem Puffer 401 ist.
- Die Voraussagerestsignale ep(n) für Tp Proben von dem letzten werden von dem Puffer 404 in einen Anregungssignalerzeugungsabschnitt 405 ausgelesen, und die mit der Schrittverstärkung g multiplizierten Restsignale werden wiederholt zusammen verkettet, um so das in Fig. 12C gezeigte Anregungssignal zu liefern.
- Dann wird dieses Anregungssignal in ein Zusammensetzfilter 406 eingegeben, das ein inverser Typ des Voraussagefilters ist, das in der obigen Gleichung (8) verwendet ist und Signale der aufgegebenen Zelle werden zusammengesetzt. Das zusammengesetzte Signal wird zu einer Glättungsschaltung 407 gesandt, wo es einem Glättungsprozeß mit dem rekonstruierten Signal einer Zelle vor der aufgegebenen Zelle oder rekonstruierten Signalen von denjenigen Zellen vor und nach der aufgegebenen Zelle unterworfen wird. Der Glättungsprozeß wird gemäß der folgenden Gleichung (13) ausgeführt, wobei x(n) das rekonstruierte Signale der vorhergehenden Zelle, (n das zusammengesetzte Signal und y(n) das geglättete Ausgangssignal bedeuten.
- y(n) = {1-W(n)}x(n) + w(n) (n) ... (13)
- W(n) in dieser Gleichung ist eine Glättungsfensterfunktion und wird durch den einen Verlauf (Funktionsgraph) wiedergegeben, der in Fig. 13 gezeigt ist.
- Die Interpolation in dem obigen Ausführungsbeispiel kann durch eine Interpolation des Pegels des Anregungssignales ersetzt werden. Die letztere Methode liefert einen derartigen Effekt, daß selbst dann, wenn ein nicht kontinuierlicher Punkt in dem Pegel des Anregungssignales zwischen den Zellen vor und nach der aufgegebenen Zelle vorliegt, ein Durchsetzen des Signales durch das Zusammensetzfilter den nicht kontinuierlichen Punkt glätten kann, um so eine Wellenform zu erhalten, auf der der nicht kontinuierliche Punkt kaum in dem Pegel der Sprache bemerkbar ist. Diese Methode liefert weiterhin einen Effekt derart, daß die Verschlechterung des rekonstruierten Signales aufgrund der Zellaufgabe kaum bemerkbar ist, da die Kontinuität zwischen den Zellen vor und nach der aufgegebenen Zelle durch die Glättungsschaltung gesteigert ist.
- Eine Computersimulation wurde unter den Bedingungen durchgeführt, daß in dem-obigen Ausführungsbeispiel die Anzahl der Bandbereiche 8 beträgt, die Unterrahmenlänge durch 24 Proben gegeben ist, die maximale Unterrahmenzahl 12 ist und das Ziel-SNR 22 dB ist. Die Ergebnisse zeigten hervorragende Eigenschaften: die mittlere Bitrate betrug 21 Kbps, eine höhere Qualität als 32 Kbps ADPCM, und die Verschlechterung des rekonstruierten Signales, das gewonnen wird, wenn das Zellaufgabeverhältnis 5 % beträgt, wurde kaum bemerkt.
- Gemäß der vorliegenden Erfindung kann die Qualität des rekonstruierten Signales konstant gehalten werden, da die Codierbitrate Rahmen für Rahmen gesteuert wird, und eine höhere Codierwirksamkeit kann infolge einer Änderung in der Codierrate gemäß der Entropie (Menge an Information) des Eingangssignales erhalten werden.
- Da zusätzlich die Codierbits der einzelnen Frequenzbandbereiche auf der Grundlage der Leistung bzw. Potenz der Signale der jeweiligen Bandbereiche zugeordnet sind, wird das SNR des wiedergewonnenen Signales verbessert, was ein rekonstruiertes Signal hoher Qualität ergibt. Da die Gesamtsumme der codierten Daten so gesteuert ist, daß sie innerhalb einer Zelle mit einer festen Länge liegt, tritt eine Reduktion in der Wirksamkeit aufgrund übermäßig unzureichend codierter Daten nicht auf.
- Infolge des unabhängigen Codierens der Signale einer Vielzahl von Frequenzbandbereichen Rahmen für Rahmen dauert weiterhin gemäß der vorliegenden Erfindung die Verschlechterung aufgrund der Zellenaufgabe nicht fort und kann so lediglich in der aufgegebenen Zelle im Unterschied zu dem Fall von ADPCM oder eingebettetem ADPCM gehalten werden, welches die Voraussage und Quantisierung mittels alter Signale steuert. Unabhängig davon, welche Zelle aufgegeben wurde, ist der Einfluß der Aufgabe klein, was es unnötig macht, die Prioritätssteuerung der Zellen durchzuführen. Dies kann die Struktur des Systems vereinfachen. Weiterhin kann die Interpolation eine Wiedergabe der aufgegebenen Zelle ohne leicht bemerkbare Verschlechterung der Qualität erlauben.
Claims (8)
1. Variables Bitraten-Codiergerät mit einem Codierer
(100-112) zum Codieren eines Eingangssignales und
einen Decodierer (300-310) zum Decodieren des
codierten Sigftales, wobei der Codierer umfaßt:
eine Filterbankeinrichtung (102) zum Teilen des
Eingangssignales in eine Vielzahl von
Frequenzbändern und zum Ausgeben einer Vielzahl von
Bandsignalen,
eine erste Quantisiereinrichtung (104) zum
Quantisieren der Bandsignale mit vorbestimmten
Bitzahlen, eine Bandleistungsrecheneinrichtung (105) zum
Berechnen der Signalleistung jedes Bandes,
eine Einrichtung zum Zuordnen von Taktsignalen
(110),
und eine Zellenaufbaueinrichtung (111),
gekennzeichnet durch:
eine Eingangspuffereinrichtung (101) zum
Empfangen des Eingangssignales als eine Folge von
Digitalsignalen, um eine Folge einer vorbestimmten
Anzahl von Abtastproben anzusammeln,
eine Normiereinrichtung (103) zum Normieren
eines Signales für jedes Band von der
Filterbankeinrichtung (102),
eine zweite Quantisiereinrichtung (106) zum
Quantisieren eines quadratischen Mittelwertes RMS
jedes Bandes von der Bandleistungsrecheneinrichtung
mit einer vorbestimmten Bitzahl,
eine inverse Quantisiereinrichtung (107) zum
inversen Quantisieren eines Codes des RMS-Wertes und
zum Ausgeben eines sich ergebenden Wertes,
eine Bitratensteuereinrichtung (108) zum Steuern
einer Bitrate aufgrund der Leistung jedes
Bandsignales derart, daß die Vielzahl der durch den
Decodierer zu decodierenden Signale konstant ist und
die Anzahl der Codes von dem Codierer konstant
gehalten werden können,
eine Bitzuordnungsrecheneinrichtung (109) zum
Berechnen der Anzahl von zu der
Quantisiereinrichtung für jedes Band aufgrund der Leistung jedes
Bandsignales und des Bitratenausganges von der
Bitratensteuereinrichtung zuzuordnenden Bits,
und eine Zeitstempelrecheneinrichtung (110), die
die Taktsignalzuordnungseinrichtung bildet, um die
Anzahl von in einer Zelle zu übertragenden
Unterrahmen zu berechnen,
und dadurch, daß die Zellaufbaueinrichtung (111)
zum Aufbauen jeder Zelle aus einer Folge von Codes
jedes Bandsignales, eines Codes des RMS-Wertes
jedes Bandsignales, der Anzahl von Unterrahmen je
Zelle und dem Zeitstempel in einem vorbestimmten
Format angeordnet ist.
2. Variables Bitraten-Codiergerät nach Anspruch 1, bei
dem der Decodierer aufweist:
eine Zellenzerlegungseinrichtung (301) zum
Zerlegen einer durch den Codierer codierten
Zelleneinheit in Signale für jedes Band und einen
Zeitstempel und zum Verarbeiten der zerlegten Bandsignale
und zum anschließenden Rekombinieren der
Bandsignale,
eine Zellenaufgabeerfassungseinrichtung (306)
zum Erfassen einer Zellenaufgabe aufgrund eines
Zeitstempels und einer Unterrahmenzahl, bestimmt
aus jeder zerlegten Zelleneinheit, und
eine Interpolationseinrichtung (309) zum
Interpolieren von Bandsignalen, wenn eine Zellenaufgabe
durch die Zellenaufgabe-Erfassungseinrichtung
erfaßt ist, und zum Ausgeben eines rekonstruierten
Signales aufgrund von durch die
Zellenzerlegungseinrichtung verarbeiteten Bandsignalen, wenn keine
Zellenaufgabe erfaßt wird, und aufgrund von
interpolierten Signalen, wenn eine Zellenaufgabe erfaßt
wird.
3. Variables Bitraten-Codiergerät nach Anspruch 1 oder
2, bei dem die Zeitstempelrecheneinrichtung einen
Zeitstempel Ts(i) eines -ten Rahmens aus der
folgenden Gleichung (2) zu der Zeit eines Berechnens
der Anzahl von je Zelle zu übertragenden
Unterrahmen, die durch die Bitratensteuereinrichtung (108)
ausgegeben ist, berechnet:
Ts(i) = Ts(i-1) + Ns(i-1) ... (2)
wobei Ts(i-1) dem Zeitstempel eines (i-1)-ten
Rahmens bedeutet und Ns(i-1) die Anzahl der
Unterrahmen ist.
4. Variables Bitraten-Codiergerät nach Anspruch 1, 2
oder 3, bei dem die inverse Quantisiereinrichtung
(107), die Normiereinrichtung (103), die
Bitratensteuereinrichtung
(108) und die
Bitzuordnungsrecheneinrichtung (109) den RMS-Wert jedes Bandes
verwenden, der durch den Decodierer gewonnen ist,
um eine Verschlechterung einer Kennlinie infolge
einer Fehlanpassung von Quantisierungsbitzahlen
zwischen dem Codierer und dem Decodierer und von
Normierungsparametern dazwischen zu verhindern.
5. Variables Bitraten-Codierverfahren, mit:
einem Prozeßschritt (P1) des Löschens eines
Eingangspuffers, einer Quadratur-Spiegel-Filter-(QMF)-
Bank und eines Zeitstempels und eines Setzens von
Anfangswerten auf eine maximale Unterrahmenzahl und
eine Unterrahmenlänge als Initialisierung,
einem Prozeßschritt (P2) des Gewinnens einer
Folge von Eingangssignalen Unterrahmen für
Unterrahmen,
einem Prozeßschritt (P3) zum QMF-Filtern,
einem Prozeßschritt (P4) des Berechnens der
Signalleistung von jedem Frequenzband einer Vielzahl
von Frequenzbändern der Eingangssignale,
einem Prozeßschritt (P5) des Wiederholens einer
Bitratensteuerung, bis ein Ziel-Rauschabstand
erreicht ist,
einem Prozeßschritt (P6) des Berechnens einer
Bitzuordnung zu jedem Band,
einem Prozeßschritt (P7) des Quantisierens eines
Signales jedes Bandes aufgrund der Bitzuordnung,
und
einem Prozeßschritt (P8) des Aufbauens einer
Zelle,
dadurch gekennzeichnet, daß der
Bitratensteuerprozeß (P5)-Schritt aufweist:
einen Anfangseinstellschritt (S1) zum Einstellen
eines Ziel-Rauschabstandes SNRd, einer maximalen
Unterrahmenzahl Nsmax und einer Unterrahmenlänge Ls,
einen Initialisierungsschritt (S2) für eine
Unterrahmenzahl I,
einen ersten Schritt (S3) zum Einstellen einer
Zahl von Eingangsabtastproben,
einen zweiten Schritt (S4) zum Lesen einer
Bandleistung aus einem Bandleistungsrechenabschnitt,
einen dritten Schritt (S5) zum Berechnen einer
Bitrate je Abtastprobe,
einen vierten Schritt (S6) des Voraussagens
eines Rauschabstandes SNR,
einen fünften Schritt (S7) des Vergleichens des
vorausgesagten SNR mit dem gesetzten Ziel-SNRd,
einen Schritt (S8) des wiederholten Ausführens
des ersten bis fünften Schrittes in einer Anzahl
gleich der größten Unterrahmenzahl Nsmax,
einen Schritt (S9) des Ausgebens der Bitrate und
der Unterrahmenzahl je Abtastprobe, und
einen Schritt (S10) des Ausgebens der Zahl der
Eingangsabtastproben zu einem Eingangspuffer, und
dadurch, daß die Schritte (S1-S10) des
Bitratensteuerprozeßschrittes (P5) Rahmen für Rahmen
wiederholt werden.
6. Variables Bitraten-Codierverfahren nach Anspruch 5,
bei dem der Bitzuordnungsrechenprozeßschritt (P6)
die folgenden Schritte aufweist:
Lesen einer Bitrate je Bandleistungsabtastprobe
(S61),
Berechnen einer Bitzuordnung RR jedes Bandes
(S62), und
Kompensieren für die Bitzuordnung RR (S63).
7. Variables Bitraten-Codierverfahren nach Anspruch 6,
bei dem der Schritt (S62) des Berechnens der
Bitzuordnung RR jedes Bandes durch Berechnen von RR
gemäß der folgenden Gleichung durchgeführt wird:
welche gleichwertig zu der folgenden Gleichung mit
K = R und Mb = 8 ist:
8. Variables Bitraten-Codierverfahren nach Anspruch 6
oder 7, bei dem der Schritt (S63) des Kompensierens
der Bitzuordnung RR die folgenden Schritte
aufweist:
Berechnen einer ganzen Zahl aus RR' = INT[RR]
(S631),
Berechnen einer verbleibenden Bitzahl Rr, die
aus der Gewinnung der ganzen Zahl beruht, gemäß der
Gleichung:
und Runden von Rr unter eine Dezimalstelle, um eine
ganze Zahl (S632) zu liefern,
erneutes Zuordnen der verbleibenden Bitzahl Rr
Bit für Bit in der Reihenfolge abnehmender
Bandleistung (S633), und
Wiederholen eines Wiederzuordnungsschrittes in
einer vorbestimmten Anzahl (S634).
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1318762A JPH03181232A (ja) | 1989-12-11 | 1989-12-11 | 可変レート符号化方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69024033D1 DE69024033D1 (de) | 1996-01-18 |
DE69024033T2 true DE69024033T2 (de) | 1996-05-02 |
Family
ID=18102658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69024033T Expired - Fee Related DE69024033T2 (de) | 1989-12-11 | 1990-12-11 | Kodierungssystem mit variabler Bitrate. |
Country Status (5)
Country | Link |
---|---|
US (1) | US5214741A (de) |
EP (1) | EP0433015B1 (de) |
JP (1) | JPH03181232A (de) |
CA (1) | CA2031801A1 (de) |
DE (1) | DE69024033T2 (de) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69233794D1 (de) * | 1991-06-11 | 2010-09-23 | Qualcomm Inc | Vocoder mit veränderlicher Bitrate |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
TW235392B (de) * | 1992-06-02 | 1994-12-01 | Philips Electronics Nv | |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
KR100188912B1 (ko) * | 1992-09-21 | 1999-06-01 | 윤종용 | 서브밴드코딩의 비트재할당 방법 |
JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
KR100289856B1 (ko) * | 1993-07-12 | 2001-05-15 | 이데이 노부유끼 | 화상 신호 재생 방법 및 화상 신호 재생 장치 |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3237089B2 (ja) * | 1994-07-28 | 2001-12-10 | 株式会社日立製作所 | 音響信号符号化復号方法 |
TW271524B (de) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
KR0136460B1 (ko) * | 1994-12-24 | 1998-05-15 | 이헌조 | 가변비트율 부호화 장치의 데이타 인터리빙방법 |
JP3264822B2 (ja) * | 1995-04-05 | 2002-03-11 | 三菱電機株式会社 | 移動体通信機器 |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
US6111870A (en) * | 1996-11-07 | 2000-08-29 | Interdigital Technology Corporation | Method and apparatus for compressing and transmitting high speed data |
US6091773A (en) * | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
FR2785126B1 (fr) * | 1998-10-26 | 2001-06-08 | Cit Alcatel | Procede de transmission de communications dans un systeme de telecommunication, notamment a satellite mobile |
US6553210B1 (en) * | 1999-08-03 | 2003-04-22 | Alliedsignal Inc. | Single antenna for receipt of signals from multiple communications systems |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
JP2002330075A (ja) * | 2001-05-07 | 2002-11-15 | Matsushita Electric Ind Co Ltd | サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム |
JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
US7330596B2 (en) * | 2002-07-17 | 2008-02-12 | Ricoh Company, Ltd. | Image decoding technique for suppressing tile boundary distortion |
JP4618676B2 (ja) * | 2005-04-28 | 2011-01-26 | 株式会社リコー | 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体 |
BRPI0813178B1 (pt) * | 2007-06-15 | 2020-05-12 | France Telecom | Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio |
WO2012157932A2 (en) | 2011-05-13 | 2012-11-22 | Samsung Electronics Co., Ltd. | Bit allocating, audio encoding and decoding |
CN102543090B (zh) * | 2011-12-31 | 2013-12-04 | 深圳市茂碧信息科技有限公司 | 一种应用于变速率语音和音频编码的码率自动控制系统 |
WO2020006291A1 (en) * | 2018-06-28 | 2020-01-02 | Apple Inc. | Priority-based video encoding and transmission |
KR20240033186A (ko) | 2018-06-28 | 2024-03-12 | 애플 인크. | 비디오 인코딩 시스템 |
US11451788B2 (en) | 2018-06-28 | 2022-09-20 | Apple Inc. | Rate control for low latency video encoding and transmission |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3471648A (en) * | 1966-07-28 | 1969-10-07 | Bell Telephone Labor Inc | Vocoder utilizing companding to reduce background noise caused by quantizing errors |
US4386237A (en) * | 1980-12-22 | 1983-05-31 | Intelsat | NIC Processor using variable precision block quantization |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
EP0139803B1 (de) * | 1983-10-28 | 1987-10-14 | International Business Machines Corporation | Verfahren zur Wiederherstellung von verlorengegangenen Informationen in einem digitalen Sprachübertragungssystem und Übertragungssystem welches dieses Verfahren anwendet |
WO1986003873A1 (en) * | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
IL76283A0 (en) * | 1985-09-03 | 1986-01-31 | Ibm | Process and system for coding signals |
US4748620A (en) * | 1986-02-28 | 1988-05-31 | American Telephone And Telegraph Company, At&T Bell Laboratories | Time stamp and packet virtual sequence numbering for reconstructing information signals from packets |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5020058A (en) * | 1989-01-23 | 1991-05-28 | Stratacom, Inc. | Packet voice/data communication system having protocol independent repetitive packet suppression |
-
1989
- 1989-12-11 JP JP1318762A patent/JPH03181232A/ja active Pending
-
1990
- 1990-12-07 CA CA002031801A patent/CA2031801A1/en not_active Abandoned
- 1990-12-10 US US07/625,061 patent/US5214741A/en not_active Expired - Fee Related
- 1990-12-11 DE DE69024033T patent/DE69024033T2/de not_active Expired - Fee Related
- 1990-12-11 EP EP90313439A patent/EP0433015B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0433015B1 (de) | 1995-12-06 |
JPH03181232A (ja) | 1991-08-07 |
DE69024033D1 (de) | 1996-01-18 |
EP0433015A3 (en) | 1992-08-19 |
US5214741A (en) | 1993-05-25 |
EP0433015A2 (de) | 1991-06-19 |
CA2031801A1 (en) | 1991-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69024033T2 (de) | Kodierungssystem mit variabler Bitrate. | |
DE3688980T2 (de) | Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens. | |
DE3883519T2 (de) | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. | |
DE69834010T2 (de) | Skalierbares stereo Tonkodierungs- und Tondekodierungsverfahren und Vorrichtung dafür | |
DE68911287T2 (de) | Codierer/decodierer. | |
DE69020269T2 (de) | Sprachkodierungsgerät mit mehreren Kodierungsverfahren. | |
EP0201679B1 (de) | Verfahren zur Bilddatenreduktion für digitale Fernsehsignale | |
DE3883799T2 (de) | Codierungseinrichtung zur Sprachübertragung. | |
DE69738056T2 (de) | Übertragung eines Bitstromsignals | |
EP0910928B1 (de) | Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion | |
DE60021083T2 (de) | Verfahren zur verbesserung der kodierungseffizienz eines audiosignals | |
DE69331079T2 (de) | CELP-Vocoder | |
DE3639753C2 (de) | ||
DE60110679T2 (de) | Wahrnehmungs-Codierung von Audiosignalen unter Verwendung von getrennter Irrelevanzreduktion und Redundanzreduktion | |
DE60307252T2 (de) | Einrichtungen, verfahren und programme zur kodierung und dekodierung | |
DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
DE69515907T2 (de) | Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem | |
DE60038082T2 (de) | Audio Teilbandkodierer mit differentiell kodierten Skalenfaktoren | |
DE69319855T2 (de) | Verfahren und Vorrichtung zur Bilddatencodierung | |
DE69932959T2 (de) | Verlustfreies Kodierungs- und Dekodierungsverfahren | |
DE69534140T2 (de) | Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren | |
DE60121592T2 (de) | Kodierung und dekodierung eines digitalen signals | |
EP0555016A2 (de) | Dynamische Bitverteilung für dreidimensionale Teilbandbildkodierung | |
DE60015448T2 (de) | Teilband-Audiokodiersystem | |
DE69826529T2 (de) | Schnelle datenrahmen-optimierung in einem audio-kodierer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8320 | Willingness to grant licences declared (paragraph 23) | ||
8339 | Ceased/non-payment of the annual fee |