[go: up one dir, main page]

DE69724126T2 - Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer - Google Patents

Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer Download PDF

Info

Publication number
DE69724126T2
DE69724126T2 DE69724126T DE69724126T DE69724126T2 DE 69724126 T2 DE69724126 T2 DE 69724126T2 DE 69724126 T DE69724126 T DE 69724126T DE 69724126 T DE69724126 T DE 69724126T DE 69724126 T2 DE69724126 T2 DE 69724126T2
Authority
DE
Germany
Prior art keywords
quantization
unit
audio signal
vector
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69724126T
Other languages
English (en)
Other versions
DE69724126D1 (de
Inventor
Takeshi Kobe-shi NORIMATSU
Shuji Neyagawa-shi MIYASAKA
Yoshihisa Katano-shi MAKATO
Mineo Katano-shi TSUSHIMA
Tomokazu Toyonaka-shi ISHIKAWA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of DE69724126D1 publication Critical patent/DE69724126D1/de
Application granted granted Critical
Publication of DE69724126T2 publication Critical patent/DE69724126T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf Codiervorrichtungen und Verfahren, in welchen eine Merkmalsmenge, die von einem Audiosignal wie z. B. einem Sprachsignal oder einem Musiksignal erhalten wird, insbesondere einem Signal, das durch Transformieren eines Audiosignals aus dem Zeitbereich in den Frequenzbereich unter Verwendung eines Verfahren wie der orthogonalen Transformation erhalten wird, effizient codiert wird, so dass sie im Vergleich zum ursprünglichen Audiosignal mit weniger codierten Strömen ausgedrückt wird, und auf Decodiervorrichtungen und Verfahren, die eine Struktur aufweisen, die zur Decodierung eines breitbandigen Audiosignals mit hoher Qualität unter Verwendung aller oder nur eines Teils der codierten Ströme fähig ist.
  • Stand der Technik
  • Es sind verschiedene Verfahren zum effizienten Codieren und Decodieren von Audiosignalen vorgeschlagen worden. Insbesondere für ein Audiosignal mit einem Frequenzband, das 20 kHz überschreitet, wie z. B. ein Musiksignal, wurde in den letzten Jahren ein MPEG-Audiovertahren vorgeschlagen. In dem Codierungsverfahren, das vom MPEG-Verfahren repräsentiert wird, wird ein digitales Audiosignal auf der Zeitachse unter Verwendung einer orthogonalen Transformation, wie z. B. einer Cosinustransformation, in Daten auf der Frequenzachse transformiert, wobei die Daten auf der Frequenzachse unter Verwendung der auditiven Empfindlichkeitscharakteristik von Menschen aus auditiv wichtigen Daten codiert werden, während auditiv unwichtige Daten und redundante Daten nicht codiert werden. Um ein Audiosignal mit einer Datenmenge auszudrücken, die deutlich kleiner ist als die Datenmenge des ursprünglichen digitalen Signals, gibt es ein Codierungsverfahren, das ein Vektorquantisierungsverfahren verwendet, wie z. B. TC-WVQ. MPEG-Audio und TC-WVQ sind beschrieben in "ISO/IEC standard IS-11172-3" bzw. "T. Moriya, H. Suga: An 8 Kbits transform coder for noisy channels, Proc. ICASSP 89, S. 196–199". Im folgenden wird die Struktur einer herkömmlichen Audiocodiervorrichtung unter Ver wendung der 37 erläutert. In 37 bezeichnet das Bezugszeichen 1601 eine FFT-Einheit, die ein Eingangssignal frequenz-transformiert, 1602 bezeichnet eine adaptive Bitzuweisungs-Berechnungseinheit, die ein spezifisches Band des frequenz-transformierten Eingangssignals codiert, 1603 bezeichnet eine Teilband-Teilungseinheit, die das Eingangssignal in mehrere Bänder unterteilt, 1604 bezeichnet eine Maßstabsfaktor-Normalisierungseinheit, die die mehreren Bandkomponenten normalisiert, und 1605 bezeichnet eine Skalarquantisierungseinheit.
  • Es folgt eine Beschreibung der Operation. Es wird ein Eingangssignal in die FFT-Einheit 1601 und die Teilband-Teilungseinheit 1603 eingegeben. In der FFT-Einheit 1601 wird das Eingangssignal einer Frequenztransformation unterworfen und in die adaptive Bitzuweisungseinheit 1602 eingegeben. In der adaptiven Bitzuweisungseinheit 1602 wird auf der Grundlage der minimalen Hörgrenze, die entsprechend der auditiven Charakteristik von Menschen definiert ist, und der Maskierungscharakteristik berechnet, wie groß die einer spezifischen Bandkomponente zugewiesene Datenmenge sein muss, wobei die Datenmengenzuweisung für jedes Band als Index codiert wird.
  • Andererseits wird in der Teilband-Teilungseinheit 1603 das Eingangssignal z. B. in 32 Bänder unterteilt, um ausgegeben zu werden. In der Skalenfaktornormalisierungseinheit 1604 wird für jede Bandkomponente, die in der Teilbanddivisionseinheit 1603 erhalten wird, eine Normalisierung mit einem repräsentativen Wert ausgeführt. Der normalisierte Wert wird als Index quantisiert. In der Skalarquantisierungseinheit 1605 wird auf der Grundlage der von der adaptiven Bitzuweisungsberechnungseinheit 1602 berechneten Bitzuweisung das Ausgangssignal von der Skalenfaktornormalisierungseinheit 1604 skalarquantisiert, wobei der quantisierte Wert als Index codiert wird.
  • Inzwischen wurden verschiedene Verfahren zum effizienten Codieren eines akustischen Signals vorgeschlagen. Insbesondere in den letzten Jahren wird ein Signal mit einem Frequenzband von etwa 20 kHz, wie z. B. ein Musiksignal, unter Verwendung des MPEG-Audioverfahrens oder dergleichen codiert. In den Verfahren, die vom MPEG-Verfahren repräsentiert werden, wird ein digitales Audiosignal auf der Zeitachse unter Verwendung einer orthogonalen Transformation auf die Frequenzachse transformiert, wobei den Daten auf der Frequenzachse Datenmengen zuge wiesen werden, mit einer Priorität für auditiv wichtige Daten, während die auditive Empfindlichkeitscharakteristik von Menschen berücksichtigt wird. Um ein Signal mit einer Datenmenge auszudrücken, die deutlich kleiner ist als die Datenmenge des ursprünglichen digitalen Signals, wird ein Codierungsverfahren verwendet, das ein Vektorquantisierungsverfahren nutzt, wie z. B. TCWVQ (Transformationscodierung für gewichtete Vektorquantisierung). MPEG-Audio und TCWVQ sind beschrieben in "ISO/IEC standard IS-11172-3" bzw. "T. Moriya, N. Suga: An 8 Kbits transform coder for noisy channels, Proc. ICASSP 89, S. 196–199".
  • In der herkömmlichen Audiosignalcodiervorrichtung, die wie oben beschrieben konstruiert ist, ist es üblich, dass das MPEG-Audioverfahren verwendet wird, so dass die Codierung mit einer Datenmenge von 64.000 Bits/s für jeden Kanal ausgeführt wird. Mit einer Datenmenge, die kleiner ist als diese, werden die reproduzierbare Frequenzbandbreite und die subjektive Qualität des decodierten Audiosignals manchmal erheblich beeinträchtigt. Der Grund hierfür ist folgender. Wie in dem in 37 gezeigten Beispiel werden die codierten Daten grob in drei Hauptteile unterteilt, nämlich die Bitzuweisung, den Bandrepräsentativwert und dem quantisierten Wert. Wenn somit das Kompressionsverhältnis hoch ist, wird dem quantisierten Wert keine ausreichende Datenmenge zugewiesen. Ferner ist es in der herkömmlichen Audiosignalcodiervorrichtung üblich, dass ein Codierer und ein Decodierer so konstruiert sind, dass eine zu codierende Datenmenge und die zu decodierende Datenmenge gleich groß sind. In einem Verfahren, bei dem eine Datenmenge von 128.000 Bits/s codiert wird, wird z. B. eine Datenmenge von 128.000 Bits im Decodieren decodiert.
  • In den herkömmlichen Audiosignalcodierungs- und -decodiervorrichtungen muss jedoch die Codierung und die Decodierung mit einer festen Datengröße ausgeführt werden, um eine gute Tonqualität zu erhalten, weshalb es unmöglich ist, einen Ton mit hoher Qualität bei einem hohen Kompressionsverhältnis zu erhalten.
  • Grant Davidson und Allen Gersho offenbaren in einem Artikel mit dem Titel "Multiple-stage vector excitation coding speech waveforms", veröffentlicht in 1988 IEEE, S. 163ff, Codierungsverfahren von Sprachwellenformen. Gemäß diesem Vorschlag wird eine Sprache repräsentiert durch Anlegen einer Sequenz von Anregungsvektoren an einen zeitveränderlichen LPC-Sprachproduktionsfilter, wobei jeder Vektor unter Verwendung einer wahrnehmungsbasierten Leistungsmessung aus einem Codebuch ausgewählt wird. Der Lösungsansatz umfasst die schrittweise Näherung des Eingangssprachvektors in mehreren kaskadierten VQ-Stufen, wobei der Eingangsvektor für jede Stufe der Quantisierungsfehlervektor von der vorangehenden Stufe ist.
  • Die vorliegende Erfindung dient dazu, die obenerwähnten Probleme zu lösen, und hat als Aufgabe, Audiosignalcodierungs- und -decodiervorrichtungen sowie Audiosignalcodierungs- und -decodierungsverfahren zu schaffen, in welchen eine hohe Qualität und ein breites Wiedergabefrequenzband selbst dann erhalten werden, wenn die Codierung und Decodierung mit einer kleinen Datenmenge ausgeführt wird, und in welchen ferner die Datenmenge bei der Codierung und Decodierung veränderlich sein kann und nicht fest ist.
  • Ferner wird in der herkömmlichen Audiosignalcodiervorrichtung die Quantisierung ausgeführt, indem ein Codeindex ausgegeben wird, der einem Code entspricht, der einen minimalen auditiven Abstand zwischen jedem in einem Codeblock enthaltenen Code und einem Audiomerkmalsvektor bereitstellt. Wenn jedoch die Anzahl der im Codebuch enthaltenen Codes groß ist, nimmt der Berechnungsaufwand deutlich zu, wenn ein optimaler Code wiedergewonnen wird. Wenn ferner die vom Codebuch besessene Datenmenge groß ist, ist eine große Menge an Speicher erforderlich, wenn die Codiervorrichtung mittels Hardware konstruiert wird, wobei dies unwirtschaftlich ist. Ferner werden auf der Empfangsseite eine Wiedergewinnung und eine Speichergröße, die den Codeindizes entsprechen, benötigt.
  • Die vorliegende Erfindung dient dazu, die obenerwähnten Probleme zu lösen, und hat als Aufgabe, eine Audiosignalcodiervorrichtung zu schaffen, die die Häufigkeit der Codewiedergewinnung reduziert und ein Audiosignal mit einem Codebuch mit einer kleineren Anzahl von Codes effizient quantisiert, sowie eine Audiosignaldecodiervorrichtung zu schaffen, die das Audiosignal decodieren kann.
  • Offenbarung der Erfindung
  • Ein Audiosignalcodierungsverfahren gemäß der vorliegenden Erfindung (Anspruch 1) ist ein Verfahren zum Codieren einer Datenmenge durch Vektorquantisierung unter Verwendung eines mehrstufigen Quantisierungsverfahrens mit einem ersten Vektorquantisierungsvorgang zur Vektorquantisierung einer Signalfolge einer Frequenzcharakteristik, die erhalten wird durch Frequenztransformation eines Eingangsaudiosignals, und einem zweiten Vektorquantisierungsvorgang zur Vektorquantisierung einer Quantisierungsfehlerkomponente in dem ersten Vektorquantisierungsvorgang: wobei auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur eines Menschen zeigenden auditiven Empfindlichkeitscharakteristik ein Frequenzblock mit einer hohen Wichtigkeit für die Quantisierung aus Frequenzblöcken der Quantisierungsfehlerkomponente in dem ersten Vektorquantisierungsvorgang ausgewählt wird und, in dem zweiten Vektorquantisierungsvorgang die Quantisierungsfehlerkomponente des ersten Quantisierungsvorgangs unter Berücksichtigung des ausgewählten Frequenzblocks quantisiert wird.
  • Ein Audiosignalcodierungsverfahren gemäß der vorliegenden Erfindung (Anspruch 2) ist ein Verfahren zum Codieren einer Datenmenge durch Vektorquantisierung unter Verwendung eines mehrstufigen Quantisierungsverfahrens mit einem erststufigen Vektorquantisierungsvorgang zur Vektorquantisierung einer Signalfolge einer Frequenzcharakteristik, die durch Frequenztransformation eines Eingangsaudiosignals erhalten wird, und zweiten und weiteren Stufen von Vektorquantisierungsvorgängen zur Vektorquantisierung einer Quantisierungsfehlerkomponente in den Vektorquantisierungsvorgängen vorheriger Stufen: wobei, unter den mehreren Stufen von Quantisierungsvorgängen gemäß dem mehrstufigen Quantisierungsverfahren, zumindest ein Vektorquantisierungsvorgang eine Vektorquantisierung durchführt unter Verwendung von Gewichtungskoeftizienten bezüglich der Frequenz als Gewichtungskoeffizienten zur Quantisierung, die auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik berechnet werden; und auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik ein Frequenzblock mit hoher Wichtigkeit für die Quantisierung aus Frequenzblöcken der Quantisierungsfehlerkomponente in dem erststufigen Vektorquantisierungsvorgang ausgewählt wird und in dem zweitstufigen Vektorquantisierungsvorgang die Quantisierungsfehlerkomponente des erststufigen Quantisierungsvorgangs unter Berücksichtigung des ausgewählten Frequenzblocks quantisiert wird.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 3) umfasst: eine Zeit-nach-Frequenz-Transformationseinheit zum Transformieren eines Eingangsaudiosignals in ein Frequenzbereichssignal; eine Spektralhüllkurvenberechnungseinheit zum Berechnen einer Spektralhüllkurve des Eingangsaudiosignals; eine Normalisierungseinheit zum Normalisieren des in der Zeit-nach-Frequenz-Transformationseinheit erhaltenen Frequenzbereichssignals mit der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve, um dadurch ein Restsignal zu erhalten; eine Hörgewichtungs-Berechnungseinheit zum Berechnen von Gewichtungskoeffizienten bezüglich der Frequenz, auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik; und eine mehrstufige Quantisierungseinheit mit mehreren Stufen von in Kolonnen verschalteten Vektorquantisierungseinheiten, in die das normalisierte Restsignal eingegeben wird, wobei zumindest eine der Vektorquantisierungseinheiten eine Quantisierung unter Verwendung der in der Gewichtungseinheit erhaltenen Gewichtungskoeffizienten durchführt.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 4) ist eine Audiosignalcodiervorrichtung nach Anspruch 3, wobei mehrere Quantisierungseinheiten unter den mehrfachen Stufen der mehrstufigen Quantisierungseinheit eine Quantisierung durchführen unter Verwendung der in der Gewichtungseinheit erhaltenen Gewichtungskoeffizienten, und die Hörgewichtungs-Berechnungseinheit individuelle Gewichtungskoeffizienten berechnet, die durch die entsprechenden mehrfachen Stufen der Quantisierungseinheiten zu verwenden sind.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 5) ist eine Audiosignalcodiervorrichtung nach Anspruch 4, wobei die mehrstufige Quantisierungseinheit umfasst: eine Erststufenquantisierungseinheit zum Quantisieren des durch die Normalisierungseinheit normalisierten Restsignals unter Verwendung der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen; eine Zweitstufenquantisierungseinheit zum Quantisieren eines Quantisierungsfehlersignals von der Erststufenquantisierungseinheit unter Verwendung von auf Grundlage der Korrelation zwischen der Spektralhüllkurve und des Quantisierungsfehlersignals der Erststufenquantisierungseinheit berechneten Gewichtungskoeffizienten als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen; und eine Drittstufenquantisierungseinheit zum Quantisieren eines Quantisierungsfehlersignals von der Zweitstufenquantisierungseinheit unter Verwendung von Gewichtungskoeffizienten, die erhalten werden durch Einstellen der durch die Hörgewichtungs-Berechnungseinheit gemäß dem durch die Zeit-nach-Frequenz-Transformationseinheit in das Frequenzbereichssignal transformierten Eingangssignal und der auditiven Charakteristik berechneten Gewichtungskoeffizienten auf Grundlage der Spektralhüllkurve des Quantisierungsfehlersignals der Zweitstufenquantisierungseinheit, und des durch die Normalisierungseinheit normalisierten Restsignals als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 6) umfasst eine Zeit-nach-Frequenz-Transformationseinheit (103) zum Transformieren eines Eingangsaudiosignals in ein Frequenzbereichssignal; eine Spektralhüllkurvenberechnungseinheit zum Berechnen einer Spektralhüllkurve des Eingangsaudiosignals; eine Normalisierungseinheit zum Normalisieren des in der Zeit-nach-Frequenz-Transformationseinheit erhaltenen Frequenzbereichssignals, mit der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve, um dadurch ein Restsignal zu erhalten; einen ersten Vektorquantisierer zum Quantisieren des durch die Normalisierungseinheit normalisierten Restsignals; eine auditive Auswahleinrichtung zum Auswählen eines Frequenzblocks mit einer hohen Wichtigkeit für die Quantisierung unter Frequenzblöcken der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik; und einen zweiten Quantisierer zum Quantisieren der Vektorfehlerkomponente des ersten Vektorquantisierers unter Berücksichtigung des durch die auditive Auswahleinrichtung ausgewählten Frequenzblocks.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 7) ist eine Audiosignalcodiervorrichtung nach Anspruch 6 wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals, und einer Umkehrcharakteristik der minimalen Hörgrenzencharakteristik erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 8) ist eine Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock unter Verwendung eines durch Multiplizieren des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals und einer Umkehrcharakteristik der minimalen Hörgrenzencharakteristik erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab auswählt.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 9) ist eine Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals und einer Umkehrcharakteristik einer Charakteristik, die durch Addieren der minimalen Hörgrenzencharakteristik und einer aus dem Eingangssignal berechneten Maskierungscharakteristik erhalten wird, erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 10) ist eine Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals, und einer Umkehrcharakteristik einer Charakteristik, die durch Addieren der minimalen Hörgrenzencharakteristik und einer Maskierungscharakteristik erhalten wird, die aus dem Einganssignal berechnet wird und gemäß dem durch die Normalisierungseinheit normalisierten Restsignal dem in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignal, und dem Quantisierungsfehlersignal der Erststufenquantisierungseinheit korrigiert wird, erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 11) ist eine Vorrichtung zum Codieren einer Datenmenge durch Vektorquantisierung unter Verwendung einer mehrstufigen Quantisierungseinrichtung mit einem ersten Vektorquantisierer zum Vektorquantisieren einer durch Frequenztransformation eines Eingangsaudiosignals erhaltenen Signalfolge einer Frequenzcharakteristik, und einem zweiten Vektorquantisierer zum Vektorquantisieren einer Quantisierungsfehlerkomponente des ersten Vektorquantisierers: wobei die mehrstufige Quantisierungseinrichtung die Signalfolge der Frequenzcharakteristik in zumindest zwei Frequenzbändern entsprechende Koeffizientenströme aufteilt, und jeder der Vektorquantisierer unabhängig eine Quantisierung durchführt unter Verwendung einer Vielzahl von Teilvektorquantisierern, die entsprechend den jeweiligen Koeffizientenströmen vorbereitet sind.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 12) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, die ferner eine Normalisierungseinrichtung zum Normalisieren der Signalfolge der Frequenzcharakteristik umfasst.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 13) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung ein Frequenzband mit einer hohen Energieadditionssumme des Quantisierungsfehlers aus den Frequenzbändern der zu quantisierenden Signalfolge der Frequenzcharakteristik auswählt, und das ausgewählte Band dann quantisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 14) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung in geeigneter Weise ein Frequenzband aus den Frequenzbändern der zu quantisierenden Signalfolge der Frequenzcharakteristik auswählt auf Grundlage der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik, wobei das ausgewählte Frequenzband eine hohe Energieadditionssumme des durch Zuweisen eines hohen Wertes zu einem Band mit einer hohen Wichtigkeit der auditiven Empfindlichkeitscharakteristik gewichteten Quantisierungsfehlers, und die Quantisierungseinrichtung dann das ausgewählte Band quantisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 15) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung einen als Gesamtbandquantisierungseinheit dienenden Vektorquantisierer aufweist, der zumindest einmalig alle Frequenzbänder der zu quantisierenden Signalfolge der Frequenzcharakteristik quantisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 16) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung so aufgebaut ist, dass der Erststufenvektorquantisierer einen Quantisierungsfehler in der Vektorquantisierung unter Verwendung eines Vektorquantisierungsverfahrens mit einem Codebuch berechnet und des weiteren der Zweitstufenquantisierer den berechneten Quantisierungsfehler vektorquantisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 17) ist eine Audiosignalcodiervorrichtung nach Anspruch 16, wobei Codevektoren, deren Codes teilweise oder in ihrer Gesamtheit invertiert sind, als das Vektorquantisierungsverfahren zur Codewiedergewinnung verwendet werden.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 18) ist eine Audiosignalcodiervorrichtung nach Anspruch 16, weiterhin umfassend eine Normalisierungseinrichtung zum Normalisieren der Signalfolge der Frequenzcharakteristik, wobei eine Berechnung von zur Wiedergewinnung eines optimalen Codes in der Vektorquantisierung verwendete Distanzen durchgeführt wird durch Berechnen von Distanzen unter Verwendung von normalisierten Komponenten des durch die Normalisierungseinheit bearbeiteten Einganssignals als Gewichtungen, und Extrahieren eines Codes mit minimaler Distanz.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 19) ist eine Audiosignalcodiervorrichtung nach Anspruch 18, wobei die Distanzen berechnet werden, wobei als Gewichtungen sowohl die normalisierten Komponenten der durch die Normalisierungseinrichtung bearbeiteten Signalfolge der Frequenzcharakteristik als auch ein Wert in Anbetracht der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik verwendet werden, und ein Code mit einer minimalen Distanz extrahiert wird.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 20) ist eine Audiosignalcodiervorrichtung nach Anspruch 12, wobei die Normalisierungseinrichtung eine Frequenzkonturnormalisierungseinheit aufweist, die die Kontur der Signalfolge der Frequenzcharakteristik normalisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 21) ist eine Audiosignalcodiervorrichtung nach Anspruch 12, wobei die Normalisierungseinrichtung eine Bandamplituden-Normalisierungseinheit aufweist, die die Signalfolge der Frequenzcharakteristik in eine Vielzahl von Komponenten mit kontinuierlichen Einheitsbändern aufteilt, und die Signalfolge durch Aufteilen eines jeden Einheitsbands mit einem einzelnen Wert normalisiert.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 22) ist eine Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung einen Vektorquantisierer zum Quantisieren der jeweiligen Koeffizientenströme der Signalfolge der Frequenzcharakteristik in unabhängiger Weise durch Teilvektorquantisierer enthält, und einen als Gesamtbandquantisierungseinheit dienenden Vektorquantisierer enthält, der zumindest einmalig alle Frequenzbänder des zu quantisierenden Eingangssignals quantisiert.
  • Eine Audiosignalcodienvorrichtung gemäß der vorliegenden Erfindung (Anspruch 23) ist eine Audiosignalcodiervorrichtung nach Anspruch 22, wobei die Quantisierungseinrichtung einen ersten Vektorquantisierer mit einem Teilvektorquantisierer eines niedrigen Bands, einem Teilvektorquantisierer eines mittleren Bands und einem Teilvektorquantisierer eines hohen Bands und einen zweiten Vektorquantisierer, der hinter den ersten Quantisierer geschaltet ist, und einen dritten Vektorquantisierer, der hinter den zweiten Quantisierer geschaltet ist, umfasst; die in die Quantisierungseinrichtung eingegebene Signalfolge der Frequenzcharakteristik in drei Bänder aufgeteilt ist und, unabhängig voneinander, die Signalfolge der Frequenzcharakteristik einer Niederbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des niedrigen Bands, die Signalfolge der Frequenzcharakteristik einer Mittelbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des mittleren Bands und die Signalfolge der Frequenzcharakteristik einer Hochbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des hohen Bandes quantisiert wird; ein Quantisierungsfehler bezüglich der Signalfolge der Frequenzcharakteristik in jedem der den ersten Vektorquantisierer bildenden Teilvektorquantisierer berechnet wird, und der Quantisierungsfehler in den nachfolgenden zweiten Vektorquantisierer eingegeben wird; der zweite Vektorquantisierer eine Quantisierung für eine durch den zweiten Vektorquantisierer zu quantisierende Bandbreite durchführt, einen Quantisierungsfehler bezüglich der Eingabe des zwei ten Vektorquantisierers berechnet und diese in den dritten Vektorquantisierer eingibt; und der dritte Vektorquantisierer eine Quantisierung für eine durch den dritten Vektorquantisierer zu quantisierende Bandbreite durchführt.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 24) ist eine Audiosignalcodiervorrichtung nach Anspruch 23, des weiteren umfassend eine zwischen dem ersten Vektorquantisierer. und dem zweiten Vektorquantisierer angeordnete erste Quantisierungsbandauswahleinheit und eine zwischen dem zweiten Vektorquantisierer und dem dritten Vektorquantisierer angeordnete zweite Quantisierungsbandauswahleinheit; wobei das Ausgangssignal des ersten Vektorquantisierers in die erste Quantisierungsbandauswahleinheit eingegeben wird und ein durch den zweiten Vektorquantisierer zu quantisierendes Band in der ersten Quantisierungsbandauswahleinheit ausgewählt wird; der zweite Vektorquantisierer eine Quantisierung für eine durch den zweiten Vektorquantisierer zu quantisierende Bandbreite durchführt, bezüglich der Quantisierungsfehler der durch die erste Quantisierungsbandauswahleinheit entschiedenen ersten drei Vektorquantisierer, einen Quantisierungsfehler bezüglich des Eingangssignals des zweiten Vektorquantisierers berechnet, und diesen in die zweite Quantisierungsbandauswahleinheit eingibt; die zweite Quantisierungsbandauswahleinheit ein durch den dritten Vektorquantisierer zu quantisierendes Band auswählt; und der dritte Vektorquantisierer eine Quantisierung für ein durch die zweite Quantisierungsbandauswahleinheit entschiedenes Band durchführt.
  • Eine Audiosignalcodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 25) ist eine Audiosignalcodiervorrichtung nach Anspruch 23, wobei, anstelle des ersten Vektorquantisierers, der zweite Vektorquantiesierer oder der dritte Vektorquantisierer aufgebaut ist unter Verwendung des Teilvektorquantisierers des niedrigen Bands, des Teilvektorquantisierers des mittleren Bands, und des Teilvektorquantisierers des hohen Bands.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 26) ist eine Vorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 11 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingangsaudiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit zum Durchführen einer inversen Quantisierung unter Verwendung zumindest eines Teils der durch die Quantisierungseinrichtung der Audiosignalcodiervorrichtung ausgegebenen Codes und einer Umkehrfrequenztransformationseinheit zum Transformieren einer von der Umkehrquantisierungseinheit ausgegebenen Signalfolge der Frequenzcharakteristik in ein dem ursprünglichen Audioeingangssignal entsprechendes Signal.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 27) ist eine Vorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 12 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingangsaudiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit zum Widergeben einer Signalfolge der Frequenzcharakteristik; einer Umkehrnormalisierungseinheit zum Widergeben normalisierter Komponenten auf Grundlage der durch die Audiosignalcodiervorrichtung ausgegebenen Codes, wobei die durch die Umkehrquantisierungseinheit ausgegebene Signalfolge der Frequenzcharakteristik verwendet und die Signalfolge der Frequenzcharakteristik und die normalisierten Komponenten multipliziert werden; und einer Umkehrfrequenztransformationseinheit zum Empfangen des Ausgangssignals von der Umkehrnormalisierungseinheit und zum Transformieren der Signalfolge der Frequenzcharakteristik in ein dem ursprünglichen Audiosignal entsprechendes Signal.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 28) ist eine Vorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 22 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Audiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit, die eine inverse Quantisierung unter Verwendung der Ausgangscodes durchführt, wenn die Codes durch alle der die Quantisierungseinrichtung in der Audiosignalcodiervorrichtung bildenden Vektorquantisierer oder von einigen dieser ausgegeben werden.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 29) ist eine Audiosignaldecodiervorrichtung nach Anspruch 28, wobei: die Umkehrquantisierungseinheit eine inverse Quantisierung der quantisierten Codes in einem vorbestimmten Band durch abwechselndes Ausführen einer inversen Quantisierung quantisierter Codes in einer nächsten Stufe, und einer inversen Quantisierung quantisierter Codes in einem von dem vorbestimmten Band verschiedenen Band durchführt; die Umkehrquantisierungseinheit die inverse Quantisierung der quantisierten Codes in den verschiedenen Bändern fortlaufend durchführt, wenn keine quantisierten Codes während der inversen Quantisierung in der nächsten Stufe vorhanden sind; und die Umkehrquantisierungseinheit die inverse Quantisierung der quantisierten Codes in der nächsten Stufe fortlaufend durchführt, wenn keine quantisierten Codes in den verschiedenen Bändern vorhanden sind.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 30) ist eine Vorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 23 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingabeaudiosignals entsprechenden Signals mit: einer Umkehrquantisierungseinheit, die eine inverse Quantisierung unter Verwendung ausschließlich solcher Codes durchführt, die von dem Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegeben werden, obwohl alle oder einige der den ersten Vektorquantisierer bildenden drei Teilvektorquantisierer in der Audiosignalcodiervorrichtung Codes ausgeben.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 31) ist eine Audiosignaldecodiervorrichtung nach Anspruch 30, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von durch den zweiten Vektorquantisierer ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes durchführt.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 32) ist eine Audiosignaldecodiervorrichtung nach Anspruch 31, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Venrwendung von durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes und den durch den zweiten Vektorquantisierer ausgegebenen Codes durchführt.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 33) ist eine Audiosignaldecodiervorrichtung nach Anspruch 32, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von durch den dritten Vektorquantisierer ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes, den durch den zweiten Vektorquantisierer ausgegebenen Codes und den durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes durchführt.
  • Eine Audiosignaldecodiervorrichtung gemäß der vorliegenden Erfindung (Anspruch 34) ist eine Audiosignaldecodiervorrichtung nach Anspruch 33, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von den durch den Teilvektorquantisierer des hohen Bandes als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des Vektorquantisierers ausgegebenen Codes, den durch den zweiten Vektorquantisierer ausgegebenen Code, den durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes und den durch den dritten Vektorquantisierer ausgegebenen Codes durchführt.
  • Kurzbeschreibung der Zeichnungen
  • 1 ist ein Diagramm, das die Gesamtstruktur der Audiosignalcodierungs- und – decodiervorrichtungen gemäß einer ersten Ausführungsform der vorliegenden Erfindung zeigt.
  • 2 ist ein Blockschaltbild, das ein Beispiel einer Normalisierungseinheit als Bestandteil der obenbeschriebenen Audiosignalcodiervorrichtung zeigt.
  • 3 ist ein Blockschaltbild, das ein Beispiel einer Frequenzkontur-Normalisierungseinheit als Bestandteil der obenbeschriebenen Audiosignalcodiervorrichtung zeigt.
  • 4 ist ein Diagramm, das die genaue Struktur einer Quantisierungseinheit in der Codiervorrichtung zeigt.
  • 5 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung zeigt.
  • 6 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer dritten Ausführungsform der vorliegenden Erfindung zeigt.
  • 7 ist ein Blockschaltbild, das die genaue Strukturen einer Quantisierungseinheit und einer auditiven Auswahleinheit in jeder Stufe der in 6 gezeigten Audiosignalcodiervorrichtung zeigt.
  • 8 ist ein Diagramm zur Erläuterung der Quantisierungsoperation des Vektorquantisierers.
  • 9 ist ein Diagramm, das ein Fehlersignal zi, eine Spektralhüllkurve I1 und eine minimale Hörgrenzencharakteristik hi zeigt.
  • 10 ist ein Blockschaltbild, das die genauen Strukturen anderer Beispiele jeder Quantisierungseinheit und auditiven Auswahleinheit zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind.
  • 11 ist ein Blockschaltbild, das die genauen Strukturen weiterer Beispiele jeder Quantisierungseinheit und auditiven Auswahleinheit zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind.
  • 12 ist ein Blockschaltbild, das die genauen Strukturen weiterer Beispiele jeder Quantisierungseinheit und auditiven Auswahleinheit zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind.
  • 13 ist ein Diagramm, das ein Beispiel der Auswahl eines Frequenzblocks mit der höchsten Wichtigkeit (Länge W) zeigt.
  • 14 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung zeigt.
  • 15 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer fünften Ausführungsform der vorliegenden Erfindung zeigt.
  • 16 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer sechsten Ausführungsform der vorliegenden Erfindung zeigt.
  • 17 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer siebten Ausführungsform der vorliegenden Erfindung zeigt.
  • 18 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer achten Ausführungsform der vorliegenden Erfindung zeigt.
  • 19 ist ein Diagramm zur Erläuterung der genauen Operation der Quantisierung in jeder Quantisierungseinheit, die in der Codiervorrichtung 1 enthalten ist, gemäß irgendeiner der ersten bis achten Ausführungsformen.
  • 20 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 21 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 22 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 23 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 24 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 25 ist ein Diagramm zur Erläuterung einer Audiodecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung.
  • 26 ist ein Diagramm zur Erläuterung der genauen Operation einer Umkehrquantisierungseinheit als Bestandteil der Audiosignaldecodiervorrichtung.
  • 27 ist ein Diagramm zur Erläuterung der genauen Operation einer Umkehrnormalisierungseinheit als Bestandteil der Audiosignaldecodiervorrichtung.
  • 28 ist ein Diagramm zur Erläuterung der genauen Operation einer Frequenzkontur-Umkehrnormalisierungseinheit als Bestandteil der Audiosignaldecodiervorrichtung.
  • Beste Ausführungsarten der Erfindung
  • Ausführungsform 1
  • 1 ist ein Diagramm, dass die Gesamtstruktur der Audiosignalcodier- und -decodiervorrichtungen gemäß einer ersten Ausführungsform der Erfindung zeigt. In 1 bezeichnet das Bezugszeichen 1 eine Codiervorrichtung, während 2 eine Decodiervorrichtung bezeichnet. In der Codiervorrichtung 1 bezeichnet das Bezugszeichen 101 eine Rahmenteilungseinheit, die ein Eingangssignal in eine vorgeschriebene Anzahl von Rahmen unterteilt; 102 bezeichnet eine Fenstermultiplikationseinheit, die das Eingangssignal und eine Fensterfunktion auf der Zeitachse multipliziert; 103 bezeichnet eine MDCT-Einheit, die eine modifizierte diskrete Cosinustransformation für die Zeit-nach-Frequenz-Umsetzung eines Signals auf der Zeitachse in ein Signal auf der Frequenzachse durchführt; 104 bezeichnet eine Normalisierungseinheit, die sowohl das von der Rahmenteilungseinheit ausgegebene Zeitachsensignal 101 als auch die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten empfängt und die MDCT-Koeffizienten normalisiert; und 105 bezeichnet eine Quantisierungseinheit, die die normalisierten MDCT-Koeffizienten empfängt und diese quantisiert. Obwohl in dieser Ausführungsform für die Zeit-nach-Frequenz-Transformation die MDCT verwendet wird, kann auch die diskrete Fourier-Transformation (DFT) verwendet werden.
  • In der Decodiervorrichtung 2 bezeichnet das Bezugszeichen 106 eine Umkehrquantisierungseinheit, die ein von der Codiervorrichtung 1 ausgegebenes Signal empfängt und dieses Signal invers quantisiert; 107 bezeichnet eine Umkehrnormalisie rungseinheit, die den Ausgang der Umkehrquantisierungseinheit 106 invers normalisiert; 108 bezeichnet eine Umkehr-MDCT-Einheit, die eine modifizierte diskrete Cosinustransformation für den Ausgang von der Umkehrnormalisierungseinheit 107 durchführt; 109 bezeichnet eine Fenstermultiplikationseinheit; und 110 bezeichnet eine Rahmenüberlappungseinheit.
  • Es folgt eine Beschreibung der Operation der Audiosignalcodier- und -decodiervorrichtungen, die wie oben beschrieben konstruiert sind.
  • Es wird angenommen, dass das in die Codiervorrichtung 1 eingegebene Signal eine digitale Signalsequenz ist, die zeitlich kontinuierlich ist. Zum Beispiel ist es ein digitales Signal, das durch 16-Bit-Quantisierung bei einer Abtastfrequenz von 48 kHz erhalten wird. Dieses Eingangssignal wird in der Rahmenunterteilungseinheit 101 akkumuliert, bis eine vorgegebene vorgeschriebene Abtastwertanzahl erreicht ist, und wird ausgegeben, wenn die akkumulierte Abtastwertanzahl eine definierte Rahmenlänge erreicht. Hierbei beträgt die Rahmenlänge der Rahmenunterteilungseinheit 101 z. B. 128, 256, 512, 1024, 2048 oder 4096 Abtastwerte. In der Rahmenunterteilungseinheit 101 ist es ferner möglich, das Signal mit der Rahmenlänge auszugeben, die entsprechend dem Merkmal des Eingangssignals veränderlich ist. Ferner ist die Rahmenunterteilungseinheit 101 so konstruiert, dass sie eine Ausgabe für jede spezifizierte Verschiebungslänge durchführt. In dem Fall z. B., in dem die Rahmenlänge 4096 Abtastwerte beträgt, gibt die Rahmenunterteilungseinheit 101 dann, wenn eine Verschiebungslänge gleich der Hälfte der Rahmenlänge gesetzt ist, jedes Mal dann, wenn die Rahmenlänge 2048 Abtastwerte erreicht, die letzten 4096 Abtastwerte aus. Selbst wenn die Rahmenlänge oder die Abtastfrequenz variiert, ist es selbstverständlich möglich, die Struktur zu erhalten, in der die Verschiebungslänge auf die Hälfte der Rahmenlänge gesetzt ist.
  • Der Ausgang der Rahmenunterteilungseinheit 101 wird in die Fenstermultiplikationseinheit 102 und in die Normalisierungseinheit 104 eingegeben. In der Fenstermultiplikationseinheit 102 wird das Ausgangssignal von der Rahmenunterteilungseinheit 101 mit einer Fensterfunktion auf der Zeitachse multipliziert, wobei das Ergebnis aus der Fenstermultiplikationseinheit 102 ausgegeben wird. Diese Vorgehensweise wird z. B. durch die Formel (1) gezeigt.
    Figure 00200001
    wobei xi der Ausgang von der Rahmenunterteilungseinheit 101 ist, hi die Fensterfunktion ist, und hxi der Ausgang von der Fenstermultiplikationseinheit 102 ist. Ferner ist i das Suffix der Zeit. Die Fensterfunktion hi, die in Formel (1) gezeigt ist, ist ein Beispiel, wobei die Fensterfunktion nicht auf diejenige beschränkt ist, die in der Formel (1) gezeigt ist. Die Auswahl der Fensterfunktion hängt von der Eigenart des Eingangssignals, der Rahmenlänge der Rahmenunterteilungseinheit 101 und den Formen der Fensterfunktionen in den Rahmen ab, die zeitlich vor und nach dem verarbeiteten Rahmen angeordnet sind. Unter der Annahme, dass z. B. die Rahmenlänge der Rahmenunterteilungseinheit 101 gleich N ist, wird als Merkmal der Signaleingabe in die Fenstermultiplikationseinheit 102 die mittlere Leistung der eingegebenen Signale bei jeweils N/4 berechnet, wobei dann, wenn die mittlere Leistung deutlich variiert, die in der Formel (1) gezeigte Berechnung mit einer Rahmenlänge kürzer als N ausgeführt wird. Ferner ist es wünschenswert, die Fensterfunktion in geeigneter Weise zu wählen, entsprechend der Form der Fensterfunktion des vorangehenden Rahmens und der Form der Fensterfunktion des nachfolgenden Rahmens, so dass die Form der Fensterfunktion des aktuellen Rahmens nicht verzerrt wird.
  • Als Nächstes wird der Ausgang der Fenstermultiplikationseinheit 102 in die MDCT-Einheit 103 eingegeben, wo eine modifizierte diskrete Cosinustransformation ausgeführt wird, wobei die MDCT-Koeffizienten ausgegeben werden. Eine allgemeine Formel der modifizierten diskreten Cosinustransformation wird durch Formel (2) dargestellt.
  • Figure 00200002
  • Unter der Annahme, dass die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten in der Formel (2) durch yk ausgedrückt werden, weist der Ausgang von der MDCT-Einheit 103 die Frequenzcharakteristiken auf, und entspricht linear einer unteren Frequenzkomponente, wenn die Variable k von yk näher an 0 heranrückt, während er einer höheren Frequenzkomponente entspricht, wenn die Variable k ausgehend von 0 näher an N/2-1 heranrückt. Die Normalisierungseinheit 104 empfängt sowohl das von der Rahmenunterteilungseinheit 101 ausgegebene Zeitachsensignal als auch die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten und normalisiert die MDCT-Koeffizienten unter Verwendung mehrerer Parameter. Das Normalisieren der MDCT-Koeffizienten entspricht dem Unterdrücken von Variationen in den Werten der MDCT-Koeffizienten, wobei die Werte zwischen der Niedrigbandkomponente und der Hochbandkomponente deutlich verschieden sind. Wenn z. B. die Niedrigbandkomponente deutlich größer ist als die Hochbandkomponente, wird ein Parameter mit einem großen Wert in der Niedrigbandkomponente und einem kleinen Wert in der Hochbandkomponente ausgewählt, wobei die MDCT-Koeffizienten mittels dieses Parameters unterteilt werden, um die Variationen der MDCT-Koeffizienten zu unterdrücken. In der Normalisierungseinheit 104 werden die Indizes codiert, die die für die Normalisierung verwendeten Parameter ausdrücken.
  • Die Quantisierungseinheit 105 empfängt die MDCT-Koeffizienten, die von der Normalisierungseinheit 104 normalisiert worden sind, und quantisiert die MDCT-Koeffizienten. Die Quantisierungseinheit 105 codiert die Indizes, die die für die Quantisierung verwendeten Parameter ausdrücken.
  • Andererseits wird in der Decodiervorrichtung 2 die Decodierung unter Verwendung der Indizes von der Normalisierungseinheit 104 in der Codiervorrichtung 1 und der Indizes von der Quantisierungseinheit 105 ausgeführt. In der Umkehrquantisierungseinheit 106 werden die normalisierten MDCT-Koeffizienten unter Verwendung der Indizes von der Quantisierungseinheit 105 reproduziert. In der Umkehrquantisierungseinheit 106 kann die Reproduktion der MDCT-Koeffizienten unter Verwendung aller oder einiger der Indizes ausgeführt werden. Selbstverständlich ist der Ausgang von der Normalisierungseinheit 104 und der Ausgang von der Umkehrquantisierungseinheit 106 nicht immer identisch mit denjenigen vor der Quantisierung, da die Quantisierung mittels der Quantisierungseinheit 105 mit Quantisierungsfehlern be haftet ist.
  • In der Umkehrnormalisierungseinheit 107 werden die für die Normalisierung in der Codiervorrichtung 101 verwendeten Parameter aus den von der Normalisierungseinheit 104 der Codiervorrichtung 1 ausgegebenen Indizes wieder hergestellt, wobei der Ausgang der Umkehrquantisierungseinheit 106 mit diesen Parametern multipliziert wird, um die MDCT-Koeffizienten wiederherzustellen. In der Umkehr-MDCT-Einheit 108 werden die von der Umkehrnormalisierungseinheit 107 ausgegebenen MDCT-Koeffizienten einer Umkehr-MDCT unterworfen, wodurch das Frequenzbereichssignal in das Zeitbereichssignal zurückverwandelt wird. Die Umkehr-MDCT-Berechnung wird z. B. durch die Formel (3) dargestellt.
    Figure 00220001
    wobei yyk die MDCT-Koeffizienten sind, die in der Umkehrnormalisierungseinheit 107 wiederhergestellt werden, und xx(k) die inversen MDCT-Koeffizienten sind, die von der Umkehr-MDCT-Einheit 108 ausgegeben werden.
  • Die Fenstermultiplikationseinheit 109 führt eine Fenstermultiplikation unter Verwendung des Ausgangs xx(k) von der Umkehr-MDCT-Einheit 108 durch. Die Fenstermultiplikation wird unter Verwendung des selben Fensters ausgeführt, das von der Fenstermultiplikationseinheit 102 der Codiervorrichtung P1 verwendet wird, wobei ein Prozess ausgeführt wird, der z. B. durch die Formel (4) dargestellt wird. z(i) = xx(i)·hi (4)wobei zi der Ausgang von der Fenstermultiplikationseinheit 109 ist.
  • Die Rahmenüberlappungseinheit 110 reproduziert das Audiosignal unter Vetwendung des Ausgangs von der Fenstermultiplikationseinheit 109. Da der Ausgang von der Fenstermultiplikationseinheit 109 ein zeitlich überlappendes Signal ist, erzeugt die Rahmenüberlappungseinheit 110 ein Ausgangssignal der Decodiervorrichtung P2 z. B. unter Verwendung der Formel (5). out(i) = zm(i) + zm–1(i + SHIFT) (5)wobei zm(i) das i-te Ausgangssignal z(i) von der Fenstermultiplikationseinheit 109 im m-ten Zeitrahmen ist, zm – 1 (i) das i-te Ausgangssignal von der Fenstermultiplikationseinheit 109 im (m – 1)-ten Zeitrahmen ist, SHIFT die Abtastwertzahl ist, die der Verschiebungslänge der Codiervorrichtung entspricht, und out(i) das Ausgangssignal der Decodiervorrichtung 2 im m-ten Zeitrahmen der Rahmenüberlappungseinheit 110 ist.
  • Ein Beispiel der Normalisierungseinheit 104 wird unter Verwendung der 2 im Folgenden genauer beschrieben. In 2 bezeichnet das Bezugszeichen 201 eine Frequenzkonturnormalisierungseinheit, die die Ausgänge von der Rahmenunterteilungseinheit 101 und der MDCT-Einheit 103 empfängt; und 202 bezeichnet eine Bandamplitudennormalisierungseinheit, die den Ausgang von der Frequenzkonturnormalisierungseinheit 201 empfängt und eine Normalisierung mit Bezug auf eine Bandtabelle 203 durchführt.
  • Es folgt eine Beschreibung der Operation. Die Frequenzkonturnormalisierungseinheit 201 berechnet einen Frequenzkontur, d. h. eine grobe Form der Frequenz, unter Verwendung der Daten auf der Zeitachse, die von der Rahmenunterteilungseinheit 101 ausgegeben werden, und teilt die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten durch diesen. Die für das Ausdrücken der Frequenzkontur verwendeten Parameter werden als Indizes codiert. Die Bandamplitudennormalisierungseinheit 202 empfängt das Ausgangssignal von der Frequenzkonturnormalisierungseinheit 201 und führt eine Normalisierung für jedes in der Bandtabelle 203 gezeigte Band durch. Unter der Annahme, dass z. B. die von der Frequenzkonturnormalisierungseinheit 201 ausgegebenen MDCT-Koeffizienten dct(i) (i = 0 bis 2047) sind und die Bandtabelle 203 z. B. so beschaffen ist, wie in der Tabelle 1 gezeigt ist, wird ein mittlerer Wert der Amplitude in jedem Band z. B. unter Verwendung der Formel (6) berechnet. Tabelle 1
    Figure 00240001
    Figure 00250001
    wobei bjlow und bjhigh der Niedrigstbandindex i bzw. der Höchstbandindex i sind, zu denen dct(i) in dem in der Bandtabelle 203 gezeigten j-ten Band gehört. Ferner ist p die Norm in der Abstandsberechnung, die gleich 2 sein soll, während avej das Mittel der Amplitude in jeder Bandnummer j ist. Die Bandamplitudennormalisierungseinheit 202 quantisierf avej um gavej zu erhalten, und normalisiert dieses unter Verwendung z. B. der Formel (7). n_dct(i) = dct(i)/gavej bjlow ≤ i ≤ bjhigh (7)
  • Um avej zu quantisierten, kann die Skalarquantisierung verwendet werden, oder es kann eine Vektorquantisierung unter Verwendung des Codebuches ausgeführt werden. Die Bandamplitudennormalisierungseinheit 202 codiert die Indizes der für den Ausdruck von gavej verwendeten Parameter.
  • Obwohl die Normalisierungseinheit 104 in der Codiervorrichtung 1 unter Verwendung sowohl der Frequenzkonturnormalisierungseinheit 201 als auch der Bandamplitudennormalisierungseinheit 202 konstruiert ist, wie in 2 gezeigt ist, kann sie unter Verwendung entweder der Frequenzkonturnormalisierungseinheit 201 oder der Bandamplitudennormalisierungseinheit 202 konstruiert sein. Wenn ferner keine signifikante Variation zwischen der Niedrigbandkomponente und der Hochbandkomponente der von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten vorliegt, kann der Ausgang von der MDCT-Einheit 103 direkt ohne Verwendung der Einheiten 201 und 202 in die Quantisierungseinheit 105 eingegeben werden.
  • Die Frequenzkonturnormalisierungseinheit 201, die in 2 gezeigt ist, wird unter Verwendung der 3 im Folgenden genauer beschrieben. In 3 bezeichnet das Bezugszeichen 301 eine Linearvorhersage-Analyseeinheit, die den Ausgang von der Rahmenteilungseinheit 101 empfängt und eine Linearvorhersageanalyse durch führt; 302 bezeichnet eine Konturquantisierungseinheit, die den in der Linearvorhersageanalyseeinheit 301 erhaltenen Koeffizienten quantisiert; und 303 bezeichnet eine Hüllkurvencharakteristik-Normalisierungseinheit, die die MDCT-Koeffizienten mittels der Spektralhüllkurve normalisiert.
  • Es folgt eine Beschreibung der Operation der Frequenzkonturnormalisierungseinheit 201. Die Linearvorhersageanalyseeinheit 301 empfängt das Audiosignal auf der Zeitachse von der Rahmenteilungseinheit 101, führt eine Linearvorhersagecodierung (LPC) durch und berechnet Linearvorhersagekoeffizienten (LPC-Koeffizienten). Die Linearvorhersagekoeffizienten können im Allgemeinen erhalten werden durch Berechnen einer Autokorrelationsfunktion eines fenstermultiplizierten Signals, 'wie z. B. eines Humming-Fensters, und Lösen einer normalen Gleichung oder dergleichen. Die Linearvorhersagekoeffizienten, sie so berechnet worden sind, werden in Linearspektralpaarkoeffizienten (LSP-Koeffizienten) oder dergleichen umgesetzt und in der Konturquantisierungseinheit 302 quantisiert. Als Quantisierungsverfahren kann eine Vektorquantisierung oder eine Skalarquantisierung verwendet werden. Anschließend wird die Frequenzübertragungscharakteristik (Spektralhüllkurve), ausgedrückt durch die von der Konturquantisierungseinheit 302 quantisierten Parameter, in der Hüllkurvencharakteristiknormalisierungseinheit 303 berechnet, wobei die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten durch die zu normalisierende Charakteristik geteilt werden. Genauer, wenn die Linearvorhersagekoeffizienten äquivalent zu den von der Konturquantisierungseinheit 302 quantisierten Parametern gleich glpc(i) sind, wird die Frequenzübertragungscharakteristik, die von der Hüllkurvencharakteristiknormalisierungseinheit 303 berechnet wird, mit der Formel (8) erhalten.
    Figure 00260001
    wobei ORDER gleich 10 bis 40 sein soll und fft() eine Hochgeschwindigkeits-Fouriertransformation bezeichnet. Unter Verwendung der berechneten Frequenzübertragungscharakteristik env(i) füllt die Hüllkurvencharakteristiknormalisierungs einheit 303 z. B. unter Verwendung der folgenden Formel (9) eine Normalisierung durch. fact(i) = mdct(i)/env(i) (9)wobei mdct(i) das Ausgangssignal von der MDCT-Einheit 103 ist, und fdct(i) das normalisierte Ausgangssignal von der Hüllkurvencharakteristiknormalisierungseinheit 303 ist. Durch die obenerwähnten Prozessschritte wird der Prozess der Normalisierung des MDCT-Koeffizientenstroms abgeschlossen.
  • Als Nächstes wird die Quantisierungseinheit 105 in der Codiervorrichtung 1 unter Verwendung der 4 genauer beschrieben. In 4 bezeichnet das Bezugszeichen 4005 eine mehrstufige Quantisierungseinheit, die die Vektorquantisierung der Frequenzcharakteristik-Signalsequenz (MDCT-Koeffizientenstrom), der von der Normalisierungseinheit 104 nivelliert worden ist, durchführt. Die mehrstufige Quantisierungseinheit 4005 enthält einen Erststufenquantisierer 40051, einen Zweitstufenquantisierer 40052, ... einen N-te-Stufe-Quantisierer 40053, die in einer Spalte verbunden sind. Ferner bezeichnet 40006 eine auditive Gewichtungsberechnungseinheit, die die von der MDCT-Einheit 103 ausgegebenen MDCT-Koeffizienten und die in der Hüllkurvencharakteristiknormalisierungseinheit 303 erhaltene Spektralhüllkurve empfängt und auf der Grundlage der auditiven Empfindlichkeitscharakteristik einen Gewichtungskoeffizienten bereitstellt, der für die Quantisierung in der mehrstufigen Quantisierungseinheit 4005 verwendet wird.
  • In der auditiven Gewichtungsberechnungseinheit 4006 werden der von der MDCT-Einheit 103 ausgegebene MDCT-Koeffizientenstrom und die in der Hüllkurvencharakteristiknormalisierungseinheit 303 erhaltene LPC-Spektralhüllkurve eingegeben, wobei mit Bezug auf das Spektrum der von der MDCT-Einheit 103 ausgegebenen Frequenzcharakteristiksignalsequenz auf der Grundlage der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart der Menschen ist, wie z. B. die minimale Hörgrenzencharakteristik und die auditive Maskierungscharakteristik, ein Charakteristiksignal in Bezug auf die auditive Empfindlichkeitscharakteristik berechnet wird und ferner ein Gewichtungskoeffizient, der für die Quantisierung verwendet wird, auf der Grundlage des Charakteristiksignals und der Spektralhüllkurve erhalten wird.
  • Die normalisierten MDCT-Koeffizienten, die von der Normalisierungseinheit 104 ausgegeben werden, werden im Erststufenquantisierer 40051 in der mehrstufigen Quantisierungseinheit 4005 unter Verwendung des von der auditiven Gewichtungsberechnungseinheit 4006 erhaltenen Gewichtungskoeffizienten quantisiert, wobei eine Quantisierungsfehlerkomponente auf Grund der Quantisierung im Erststufenquantisierer 4051 im Zweitstufenquantisierer 4052 in der mehrstufigen Quantisierungseinheit 4005 unter Verwendung des von der auditiven Gewichtungsberechnungseinheit 4006 erhaltenen Gewichtungskoeffizienten quantisiert wird. Anschließend wird in derselben Weise wie oben in jeder Stufe der mehrstufigen Quantisierungseinheit eine Quantisierungsfehlerkomponente auf Grund der Quantisierung im Quantisierer der vorangehenden Stufe quantisiert. Die Codierung des Audiosignals ist abgeschlossen, wenn eine Quantisierungsfehlerkomponente auf Grund der Quantisierung im Quantisierer der (N-1)-ten Stufe im Quantisierer der N-ten Stufe 40053 unter Verwendung des von der auditiven Gewichtungsberechnungseinheit 4006 erhaltenen Gewichtungskoeffizienten quantisiert worden ist.
  • Wie oben beschrieben worden ist, wird gemäß der Audiosignalcodiervorrichtung der ersten Ausführungsform eine Vektorquantisierung in mehreren Stufen der Vektorquantisierer 4005140053 in der mehrstufigen Quantisierungseinrichtung 4005 unter Verwendung eines Gewichtungskoeffizienten auf der Frequenz, der in der auditiven Gewichtungsberechnungseinheit 4006 auf der Grundlage des Spektrums des Eingangsaudiosignals, der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, und der LPC-Spektralhüllkurve berechnet worden ist, als Gewichtung für die Quantisierung ausgeführt. Somit kann eine effiziente Quantisierung unter Verwendung der auditiven Eigenart von Menschen ausgeführt werden.
  • In der in 4 gezeigten Audiosignalcodiervorrichtung verwendet die auditive Gewichtungsberechnungseinheit 4006 die LPC-Spektralhüllkurve für die Berechnung des Gewichtungskoeffizienten. Sie kann jedoch den Gewichtungskoeffizienten unter Verwendung nur des Spektrums des Eingangsaudiosignals und der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, berechnen.
  • Ferner führen in der in 4 gezeigten Audiosignalcodiervorrichtung alle der mehreren Stufen von Vektorquantisierern in der mehrstufigen Quantisierungseinrichtung 4005 eine Quantisierung unter Verwendung des Gewichtungskoeffizienten durch, der in der auditiven Gewichtungsberechnungseinheit 4006 auf der Grundlage der auditiven Empfindlichkeitscharakteristik erhalten worden ist. Solange jedoch irgendeine der mehreren Stufen von Vektorquantisierern in der mehrstufigen Quantisierungseinrichtung 4005 eine Quantisierung unter Verwendung des Gewichtungskoeffizienten auf der Grundlage der auditiven Empfindlichkeitscharakteristik durchführt, kann eine effiziente Quantisierung im Vergleich zu dem Fall ausgeführt werden, indem ein solcher Gewichtungskoeffizient auf der Grundlage der auditiven Empfindlichkeitscharakteristik nicht verwendet wird.
  • Ausführungsform 2
  • 5 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer zweiten Ausführungsform der Erfindung zeigt. In dieser Ausführungsform ist nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden von derjenigen der obenerwähnten Ausführungsform, weshalb nur die Struktur der Quantisierungseinheit im Folgenden beschrieben wird. In der 5 bezeichnet das Bezugszeichen 50061 eine erste auditive Gewichtungsberechnungseinheit, die einen Gewichtungskoeffizienten bereitstellt, der vom Erststufenquantisierer 40051 in der mehrstufigen Quantisierungseinrichtung 5005 zu verwenden ist, auf der Grundlage des Spektrums des Eingangsaudiosignals, der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, und der LPC-Spektralhüllkurve; 50062 bezeichnet eine zweite auditive Gewichtungsberechnungseinheit, die einen Gewichtungskoeffizienten bereitstellt, der vom Zweitstufenquantisierer 40052 in der mehrstufigen Quantisierungseinrichtung 4005 zu verwenden ist, auf der Grundlage des Spektrums des Eingangsaudiosignals, der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, und der LPC-Spektralhüllkurve; und 50063 bezeichnet eine dritte auditive Gewichtungsberechnungseinheit, die einen Gewichtungskoeffizienten bereitstellt, der von dem N-te-Stufen-Quantisierer 40053 in der mehrstufigen Quantisierungseinrichtung 4005 zu verwenden ist, auf der Grundlage des Spektrums des Eingangsaudiosignals, der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, und der LPC-Spektralhüllkurve.
  • In der Audiosignalcodiervorrichtung gemäß der ersten Ausführungsform führen alle der mehreren Stufen von Vektorquantisierern in der mehrstufigen Quantisierungseinrichtung 4005 eine Quantisierung unter Verwendung desselben Gewichtungskoeffizienten durch, der in der auditiven Gewichtungsberechnungseinheit 4006 erhalten wird. In der Audiosignalcodiervorrichtung gemäß dieser zweiten Ausführungsform führen jedoch die mehreren Stufen von Vektorquantisierern in der mehrstufigen Quantisierungseinrichtung 4005 eine Quantisierung unter Verwendung individueller Gewichtungskoeffizienten durch, die in den ersten bis dritten auditiven Gewichtungsberechnungseinheiten 50061, 50062 bzw. 50063 erhalten werden. In dieser Audiosignalcodiervorrichtung gemäß der zweiten Ausführungsform ist es möglich, eine Quantisierung mittels Gewichtung gemäß der Frequenzgewichtungscharakteristik, die in den auditiven Gewichtungseinheiten 50061 bis 50063 auf der Grundlage der auditiven Eigenart erhalten worden ist, durchzuführen, so dass ein Fehler auf Grund der Quantisierung in jeder Stufe der mehrstufigen Quantisierungseinrichtung 4005 minimiert wird. Zum Beispiel wird ein Gewichtungskoeffizient auf der Grundlage der Spektralhüllkurve in der ersten auditiven Gewichtungseinheit 50061 berechnet, ein Gewichtungskoeftizient auf der Grundlage der minimalen Hörgrenzencharakteristik in der zweiten auditiven Gewichtungseinheit 50062 berechnet, und ein Gewichtungskoeffizient auf der Grundlage der auditiven Maskierungscharakteristik in der dritten auditiven Gewichtungseinheit 50063 berechnet.
  • Da gemäß der Audiosignalcodiervorrichtung der zweiten Ausführungsform, wie oben beschrieben worden ist, die mehreren Stufen von Quantisierern 40051 bis 40053 in der mehrstufigen Quantisierungseinrichtung 4005 eine Quantisierung unter Verwendung der individuellen Gewichtungskoeffizienten durchführen, die in den auditiven Gewichtungsberechnungseinheiten 50061 bis 50063 erhalten werden, kann eine effiziente Quantisierung durch effektive Nutzung der auditiven Eigenart von Menschen durchgeführt werden.
  • Ausführungsform 3
  • 6 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer dritten Ausführungsform der Erfindung zeigt. In dieser Ausführungsform ist nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden von derjenigen der obenerwähnten Ausführungsform, weshalb im Fol genden nur die Struktur der Quantisierungseinheit beschrieben wird. In 6 bezeichnet das Bezugszeichen 6021 eine Erststufenquantisierungseinheit, die ein normalisiertes MDCT-Signal vektorquantisiert; 60023 bezeichnet eine Zweitstufenquantisierungseinheit, die ein Quantisierungsfehlersignal, das durch die Quantisierung in der Erststufenquantisierungseinheit 6021 hervorgerufen wird, quantisiert; und 6022 bezeichnet ein auditives Auswahlmittel, dass aus dem durch die Quantisierung in der Erststufenquantisierungseinheit 60021 hervorgerufenen Quantisierungsfehler ein Frequenzband mit höchster Wichtigkeit, das in der Zweitstufenquantisierungseinheit 60023 quantisiert werden soll, auf der Grundlage der auditiven Empfindlichkeitscharakteristik auswählt.
  • Es folgt eine Beschreibung der Operation. Die normalisierten MDCT-Koeffizienten werden in der Erststufenquantisierungseinheit 6021 einer Vektorquantisierung unterworfen. In der auditiven Auswahleinrichtung 6022 wird ein Frequenzband, in welchem ein Fehlersignal auf Grund der Vektorquantisierung groß ist, auf der Grundlage des auditiven Maßstabs festgelegt, wobei ein Block desselben extrahiert wird. In der Zweitstufenquantisierungseinheit 60023 wird das Fehlersignal des ausgewählten Blocks einer Vektorquantisierung unterworfen. Die in dem jeweiligen Quantisierungseinheiten erhaltenen Ergebnisse werden als Indizes ausgegeben.
  • 7 ist ein Blockschaltbild, das die Erst- und Zweitstufenquantisierungseinheiten und die auditive Auswahleinheit genauer zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind. In 7 bezeichnet das Bezugszeichen 7031 einen ersten Vektorquantisierer, der die normalisierten MDCT-Koeffizienten vektorquantisiert; und 70032 bezeichnet einen Umkehrquantisierer, der das Quantisierungsergebnis des ersten Quantisierers 7031 invers quantisiert, wobei ein Quantisierungsfehlersignal zi auf Grund der Quantisierung durch den ersten Quantisierer 70031 erhalten wird durch Erhalten einer Differenz zwischen dem Ausgang des Umkehrquantisierers 70032 und einem Restsignal si. Das Bezugszeichen 70033 bezeichnet eine auditive Empfindlichkeitscharakteristik hi, die die auditive Eigenart von Menschen aufweist, wobei hier die minimale Hörgrenzencharakteristik verwendet wird. Das Bezugszeichen 70035 bezeichnet eine Auswahlvorrichtung, die ein vom zweiten Vektorquantisierer 70036 zu quantisierendes Frequenzband aus dem Quantisierungsfehlersignal zi auf Grund der Quantisierung durch den ersten Quantisierer 70031 auswählt. Das Bezugszeichen 70034 bezeichnet eine Auswahlmaß stabberechnungseinheit, die einen Auswahlmaßstab für die Auswahloperation der Auswahlvorrichtung 70035 auf der Grundlage des Fehlersignals zi, der LPC-Spektralhüllkurve li und der auditiven Empfindlichkeitscharakteristik hi berechnet.
  • Im Folgenden wird die Auswahloperation der auditiven Auswahleinheit genauer beschrieben.
  • Im ersten Vektorquantisierer 70031 wird zuerst ein Restsignal in einem Rahmen, der N Stücke von Elementen umfasst, in mehrere Teilvektoren mittels eines Vektorteilers in dem in 8(a) gezeigten ersten Vektorquantisierer 70031 unterteilt, wobei die jeweiligen Teilvektoren einer Vektorquantisierung durch die N Stücke von Quantisierern 1-N im ersten Vektorquantisierer 70031 unterworfen werden. Das Verfahren der Vektorunterteilung und der Quantisierung ist folgendes. Wie in 8(b) gezeigt ist, werden N Stücke von Elementen, die in aufsteigender Reihenfolge der Frequenz angeordnet sind, in NS Stücke von Teilblöcke in gleichen Intervallen unterteilt, wobei die NS Stücke von Teilvektoren, die N/NS Stücke von Elementen umfassen, wie z. B. ein Teilvektor, der nur die ersten Elemente in den jeweiligen Teilblöcken umfasst, ein Teilvektor, der nur die zweiten Elemente derselben umfasst, ..., erzeugt werden, und wobei die Vektorquantisierung für jeden Teilvektor ausgeführt wird. Die Teilungszahl und dergleichen werden auf der Grundlage der angeforderten Codierungsrate festgelegt.
  • Nach der Vektorquantisierung wird der quantisierte Code mittels des Umkehrquantisierers 70032 invers quantisiert, um eine Differenz vom Eingangssignal zu erhalten, wodurch ein Fehlersignal zi im ersten Vektorquantisierer 70031 bereitgestellt wird, wie in 9(a) gezeigt ist.
  • Anschließend wird in der Auswahlvorrichtung 70035 aus dem Fehlersignal Zi ein Frequenzblock, der vom zweiten Quantisierer 70036 genauer quantisiert werden soll, auf der Grundlage des Ergebnisses ausgewählt, das von der Auswahlskalaberechnungseinheit 70034 ausgewählt worden ist.
  • In der Auswahlskalenberechnungseinheit 70034 wird unter Verwendung des Fehlersignals Zi, der LPC-Spektralhüllkurve li, wie in 9(b) gezeigt, die in der LPC-Analyseeinheit erhalten wird, und der auditiven Empfindlichkeitscharakteristik hi für jedes Element im Rahmen, der in N Elemente auf der Frequenzachse unterteilt ist, g = (zi*li)/hiberechnet.
  • Als auditive Empfindlichkeitscharakteristik hi wird z. B. die in 9(c) gezeigte minimale Hörgrenzencharakteristik verwendet. Dies ist eine Charakteristik, die einen Bereich aufweist, der von Menschen nicht gehört werden kann und experimentell ermittelt worden ist. Es kann somit gesagt werden, dass 1/hi, was die inverse Zahl der auditiven Empfindlichkeitscharakteristik hi ist, die auditive Wichtigkeit von Menschen anzeigt. Außerdem kann gesagt werden, dass der Wert g, der durch Multiplizieren des Fehlersignals zi, der Spektralhüllkurve li und der inversen Zahl der auditiven Empfindlichkeitscharakteristik hi erhalten wird, die Wichtigkeit der genaue Quantisierung bei der Frequenz anzeigt.
  • 10 ist ein Blockschaltbild, das ändere Beispiele der Erst- und Zweitstufenquantisierungseinheiten und der auditiven Auswahleinheit zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind. In 10 bezeichnen die gleichen Bezugszeichen wie in 7 die gleichen oder entsprechende Teile. In dem in 10 gezeigten Beispiel wird der Auswahlmaßstab (Wichtigkeit) g unter Verwendung der Spektralhüllkurve li und der auditiven Empfindlichkeitscharakteristik hi erhalten, ohne das Fehlersignal zi zu verwenden, indem g = li/hiberechnet wird.
  • 11 ist ein Blockschaltbild, das weitere Beispiele der Erst- und Zweitstufenquantisierungseinheiten und der auditiven Auswahleinheit genauer zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind. In 11 bezeichnen die gleichen Bezugszeichen wie in 7 gleiche oder entsprechende Teile, wobei das Bezugszeichen 11042 eine Maskierungsgrößenberechnungseinheit bezeichnet, die eine mittels der auditiven Maskierungscharakteristik zu maskierende Größe aus dem Spektrum der Eingangsaudiofrequenz zeigt, die in der Zeit-Nach-Frequenz- Transformationseinheit MDCT-transformiert worden ist.
  • In dem in 11 gezeigten Beispiel wird die auditive Empfindlichkeitscharakteristik hi auf folgende Weise Rahmen für Rahmen erhalten. Das heißt, die Maskierungscharakteristik wird aus der Frequenzspektralverteilung des Eingangssignals berechnet, wobei die minimale Hörgrenzencharakteristik zur Maskierungscharakteristik addiert wird, um somit die auditive Empfindlichkeitscharakteristik hi des Rahmens zu erhalten. Die Operation der Auswahlmaßstabberrechnungseinheit 70034 ist identisch mit derjenigen, die mit Bezug auf 10 beschrieben worden ist.
  • 12 ist ein Blockschaltbild, das weitere Beispiele der Erst- und Zweitstufenquantisierungseinheiten und der auditiven Auswahleinheit genauer zeigt, die in der in 6 gezeigten Audiosignalcodiervorrichtung enthalten sind. In 11 bezeichnen die gleichen Bezugszeichen wie in 7 gleiche oder entsprechende Teile, wobei das Bezugszeichen 12004 eine Maskierungsgrößenberechnungseinheit bezeichnet, die die in der Maskierungsgrößenberechnungseinheit 110042 erhaltene Maskierungscharakteristik unter Verwendung der Spektralhüllkurve li, des Restsignals si und des Fehlersignals zi korrigiert.
  • In dem in 12 gezeigten Beispiel wird die auditive Empfindlichkeitscharakteristik hi auf folgende Weise Rahmen für Rahmen erhalten. Anfangs wird die Maskierungscharakteristik aus der Frequenzspektralverteilung des Eingangssignals in der Maskierungsgrößenberechnungseinheit 110042 berechnet. Anschließend wird in der Maskierungsgrößenberechnungseinheit 120043 die berechnete Maskierungscharakteristik gemäß der Spektralhüllkurve li, dem Restsignal si und dem Fehlersignal zi korrigiert. Die Hörempfindlichkeitscharakteristik hi des Rahmens wird erhalten durch Addieren der minimalen Hörgrenzencharakteristik zur korrigierten Maskierungscharakteristik. Ein Beispiel eines Verfahrens zum Korrigieren der Maskierungscharakteristik wird im Folgenden beschrieben.
  • Anfangs wird eine Frequenz (fm) erhalten, bei der die Charakteristik der Maskierungsgröße Mi, die bereits berechnet worden ist, den Maximalwert erreicht. Anschließend wird anhand der Spektralintensität der Frequenz fm am Eingang und der Größe des Quantisierungsfehlerspektrums ermittelt, wie genau das Signal mit der Frequenz fm reproduziert wird. Zum Beispiel gilt γ = 1 – (Verstärkung des Quantisierungsfehlers von fm)/(Verstärkung von fm am Eingang)
  • Wenn der Wert von γ nahe 1 liegt, ist es nicht notwendig, die bereits erhaltene Maskierungscharakteristik zu transformieren. Wenn er jedoch nahe 0 liegt, wird die Maskierungscharakteristik korrigiert, so dass sie verringert wird. Zum Beispiel kann die Maskierungscharakteristik transformiert werden durch Transformieren derselben mittels Anheben derselben auf eine höhere Leistung mit dem Koeffizienten γ , wie folgt. hi = Miγ (31)
  • Es folgt eine Beschreibung der Operation der Auswahlvorrichtung 70035.
  • In der Auswahlvorrichtung 70035 wird jedes der kontinuierlichen Elemente in einem Rahmen mit einem Fenster (Länge W) multipliziert, wobei ein Frequenzblock ausgewählt wird, in welchem ein Wert G, der erhalten wird durch Akkumulieren der Werte der Wichtigkeit g innerhalb des Fensters, das Maximum erreicht. 13 ist ein Diagramm, das ein Beispiel zeigt, in welchem ein Frequenzblock (Länge W) der höchsten Wichtigkeit ausgewählt wird. Zur Vereinfachung sollte die Länge des Fensters auf ganzzahlige Vielfache von N/NS gesetzt sein (13 zeigt eine Länge, die kein ganzzahliges Vielfaches ist). Während das Fenster um N/NS Stücke verschoben wird, wird der akkumulierte Wert G der Wichtigkeit g innerhalb des Fensterrahmens berechnet, wobei ein Frequenzblock ausgewählt wird, der eine Länge W aufweist, die den maximalen Wert von G ergibt.
  • Im zweiten Vektorquantisierer 70032 wird der ausgewählte Block im Fensterrahmen der Vektorquantisierung unterworfen. Obwohl die Operation des zweiten Vektorquantisierer 70032 identisch ist mit derjenigen des ersten Vektorquantisierers 70031, da nur der von der Auswahlvorrichtung 70035 aus dem Fehlersignal zi ausgewählte Frequenzblock wie oben beschrieben quantisiert wird, ist die Anzahl der Elemente in dem Rahmen, der vektorquantisiert werden soll, klein.
  • Schließlich wird im Fall der Verwendung des Codes des Spektralhüllkurvenkoeffizienten, der Codes, die den Quantisierungsergebnissen der jeweiligen Vektorquan tisierer entsprechen, und des Auswahlmaßstabs g, der in irgendeiner der in den 7, 11 und 12 gezeigten Strukturen erhalten wird, eine Information, die zeigt, von welchem Element der von der Auswahlvorrichtung 70035 ausgewählte Block startet, als ein Index ausgegeben.
  • Da andererseits im Fall der Verwendung des Auswahlmaßstabs g, der in der in 10 gezeigten Struktur erhalten wird, nur die Spektralhüllkurve li und die auditive Empfindlichkeitscharakteristik hi verwendet werden, kann die Information, d. h. von welchem Element der ausgewählte Block startet, erhalten werden anhand des Codes des Spektralhüllkurvenkoeffizienten und der im Voraus bekannten auditiven Empfindlichkeitscharakteristik hi, wenn die Umkehrquantisierung ausgeführt wird. Es ist daher nicht notwendig, die Information bezüglich der Blockauswahl als Index auszugeben, was zu einem Vorteil bezüglich der Komprimierbarkeit führt.
  • Wie oben beschrieben worden ist, wird gemäß der Audiosignalcodiervorrichtung der dritten Ausführungsform auf der Grundlage des Spektrums des eingegebenen Audiosignals und der auditiven Empfindlichkeitscharakteristik, die die auditive Eigenart von Menschen aufweist, einen Frequenzblock mit höchster Wichtigkeit für die Quantisierung aus den Frequenzblöcken der Quantisierungsfehlerkomponente im ersten Vektorquantisierer ausgewählt, wobei die Quantisierungsfehlerkomponente des ersten Quantisierers bezüglich des ausgewählten Blocks im zweiten Vektorquantisierer quantisiert wird, wodurch eine effiziente Quantisierung unter Verwendung der auditiven Eigenart von Menschen durchgeführt werden kann. Wenn ferner in den in den 7, 11 und 12 gezeigten Strukturen der Frequenzblock mit der höchsten Wichtigkeit für die Quantisierung ausgewählt wird, wird die Wichtigkeit auf der Grundlage des Quantisierungsfehlers im ersten Vektorquantisierer berechnet. Somit wird vermieden, dass ein Abschnitt, der im ersten Vektorquantisierer bevorzugt quantisiert worden ist, erneut quantisiert wird und ein Fehler invers erzeugt wird, wodurch eine Quantisierung durchgeführt wird, die eine hohe Qualität aufrechterhält.
  • Wenn ferner die Wichtigkeit g in der in 10 gezeigten Struktur erhalten wird, im Vergleich zum Fall des Erhaltens der Wichtigkeit g in der in irgendeiner der 7, 11 und 12 gezeigten Strukturen, wird die Anzahl der auszugebenden Indizes verringert, was zu einem erhöhten Kompressionsverhältnis führt.
  • In dieser Ausführungsform besitzt die Quantisierungseinheit die zweistufige Struktur, die die Erststufenquantisierungseinheit 60021 und die Zweitstufenquantisierungseinheit 60023 umfasst, wobei das auditive Auswahlmittel 60022 zwischen der Erststufenquantisierungseinheit 60021 und der Zweitstufenquantisierungseinheit 60023 angeordnet ist. Die Quantisierungseinheit kann jedoch eine mehrstufige Struktur von drei oder mehr Stufen aufweisen, wobei die auditive Auswahleinrichtung zwischen den jeweiligen Quantisierungseinheiten angeordnet sein kann. Auch bei dieser Struktur, wie in der obenerwähnten dritten Ausführungsform, kann eine effiziente Quantisierung unter Verwendung der auditiven Eigenart von Menschen durchgeführt werden.
  • Ausführungsform 4
  • 14 ist ein Blockschaltbild, das eine Struktur einer Audiosignalcodiervorrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung zeigt. In dieser Ausführungsform ist nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden von derjenigen der obenerwähnten Ausführungsform, weshalb im Folgenden nur die Struktur der Quantisierungseinheit beschrieben wird. In der Figur bezeichnet das Bezugszeichen 140011 einen Erststufenquantisierer, der das MDCT-Signal si, das von der Normalisierungseinheit 104 ausgegeben wird, unter Verwendung des Spektralhüllkurvenwertes li als Gewichtungskoeffizient vektorquantisiert. Das Bezugszeichen 140012 bezeichnet einen Umkehrquantisierer, der das Quantisierungsergebnis des Erststufenquantisierers 140011 invers quantisiert, wobei ein Quantisierungsfehlersignal zi der Quantisierung vom Erststufenquantisierer 140011 erhalten wird durch Nehmen einer Differenz zwischen dem Ausgang dieses Umkehrquantisierers 140012 und eines von der Normalisierungseinheit 104 ausgegebenen Restsignals. Das Bezugszeichen 140013 bezeichnet einen Zweitstufenquantisierer, der das Quantisierungsfehlersignal zi der Quantisierung durch den Erststufenquantisierer 140011 unter Verwendung des in einer später beschriebenen Gewichtungsberechnungseinheit 140017 erhaltenen Berechnungsergebnisses als Gewichtungskoeffizient vektorquantisiert. Das Bezugszeichen 140014 bezeichnet einen Umkehrquantisierer, der das Quantisiererergebnis des Zweitstufenquantisierers 140013 invers quantisiert, wobei ein Quantisierungsfehlersignal z2i der Quantisierung durch den Zweitstufenquantisierer 140013 erhalten wird, indem eine Differenz zwischen dem Ausgang dieses Umkehrquantisierers 140014 und dem Quantisierungsfehlersignal der Quantisierung durch den Erststufenquantisierer 140011 genommen wird. Das Bezugszeichen 140015 bezeichnet einen Drittstufenquantisierer, der das Quantisierungsfehlersignal z2i der Quantisierung durch den Zweitstufenquantisierer 140013 unter Verwendung des in der auditiven Gewichtungsberechnungseinheit 4006 erhaltenen Berechnungsergebnisses als Gewichtungskoeffizient vektorquantisiert. Das Bezugszeichen 140016 bezeichnet eine Korrelationsberechnungseinheit, die eine Korrelation zwischen dem Quantisiererfehlersignal zi der Quantisierung durch den Erststufenquantisierer 140011 und dem Spektralhüllkurvenwert li berechnet. Das Bezugszeichen 140017 bezeichnet eine Gewichtungsberechnungseinheit, die den Gewichtungskoeffizienten berechnet, der in der Quantisierung von dem Zweitstufenquantisierer 140013 verwendet wird.
  • Es folgt eine Beschreibung der Operation. In der Audiosignalcodiervorrichtung gemäß dieser vierten Ausführungsform werden drei Stufen von Quantisierern verwendet, wobei die Vektorquantisierung unter Verwendung verschiedener Gewichtungen in den jeweiligen Quantisierern ausgeführt wird.
  • Anfangs wird im Erststufenquantisierer 140013 das eingegebene Restsignal si einer Vektorquantisierung unter Verwendung des LPC-Spektralhüllkurvenwertes li, der in der Konturquantisierungseinheit 302 erhalten wird, als Gewichtungskoeffizient unterworfen. Somit wird ein Abschnitt, in dem die Spektralenergie groß (konzentriert) ist, einer Gewichtung unterworfen, was zu einer Wirkung führt, bei der ein auditiv wichtiger Abschnitt mit höherer Effizient quantisiert wird. Als Erststufenvektorquantisierer 140013 kann z. B. ein Quantisierer verwendet werden, der identisch ist mit dem ersten Vektorquantisierer 70031 gemäß der dritten Ausführungsform.
  • Das Quantisierungsergebnis wird im Umkehrquantisierer 140012 invers quantisiert, wobei aus einer Differenz zwischen diesem und dem Eingangsrestsignal si ein Fehlersignal zi auf Grund der Quantisierung erhalten wird.
  • Dieses Fehlersignal zi wird durch den Zweitstufenquantisierer 140013 weiter vektorquantisiert. Hierbei wird auf der Grundlage der Korrelation zwischen der LPC-Spektralhüllkurve li und dem Fehlersignal zi von der Korrelationsberechnungseinheit 140016 und der Gewichtungsberechnungseinheit 140017 ein Gewichtungskoeffizient berechnet.
  • Genauer wird in der Korrelationsberechnungseinheit 140016 α = (ΣIi*zi)/(ΣIi*li)berechnet. Dieses α nimmt einen Wert in 0 < α < 1 an und zeigt die Korrelation zwischen diesen an. Wenn α nahe bei 0 liegt, zeigt dies an, dass die Erststufenquantisierung auf der Grundlage der Gewichtung der Spektralhüllkurve genau ausgeführt worden ist. Wenn α nahe bei 1 liegt, zeigt dies an, dass die Quantisierung noch nicht genau ausgeführt worden ist. Unter Verwendung dieses α als Koeffizient für die Anpassung des Gewichtungsgrades der Spektralhüllkurve li wird somit liα (32)erhalten, wobei dies als Gewichtungskoeffizient für die Vektorquantisierung verwendet wird. Die Quantisierungsgenauigkeit wird verbessert durch Durchführen einer erneuten Gewichtung unter Verwendung der Spektralhüllkurve gemäß der Genauigkeit der Erststufenquantisierung und der anschließenden Durchführung der Quantisierung wie oben erwähnt.
  • Das Quantisierungsergebnis vom Zweitstufenquantisierer 140013 wird im Umkehrquantisierer 140014 in ähnlicher Weise quantisiert, wobei ein Fehlersignal z2i extrahiert wird. Dieses Fehlersignal z2i wird vom Drittstufenquantisierer 140015 vektorquantisiert. Der auditive Gewichtungskoeffizient zu diesem Zeitpunkt wird von der Gewichtungsberechnungsvorrichtung A19 in der auditiven Gewichtungsberechnungseinheit 14006 berechnet. Zum Beispiel werden unter Verwendung des Fehlersignals z2i, der LPC-Spektralhüllkurve li und des Restsignals si N = Σz2i*li S = Σsi*li β = 1 – (N/S) erhalten.
  • Andererseits wird in der auditiven Maskierungsberechnungsvorrichtung 140018 in der auditiven Gewichtungsberechnungseinheit 14006 die auditive Maskierungscharakteristik mi z. B. entsprechend einem auditiven Modell berechnet, das in einem MPEG-Audiostandardverfahren verwendet wird. Diese wird mit der obenbeschriebenen minimalen Hörgrenzencharakteristik hi überlappt, um die endgültige Maskierungscharakteristik Mi zu erhalten.
  • Anschließend wird die endgültige Maskierungscharakteristik Mi unter Verwendung des in der Gewichtungsberechnungseinheit 140019 berechneten Koeffizienten β auf eine höhere Leistung angehoben, wobei die inverse Zahl dieses Wertes mit I multipliziert wird, um I/Miβ (33)zu erhalten, wobei dies als Gewichtungskoeffizient für die Drittstufenvektorquantisierung verwendet wird.
  • Wie oben beschrieben worden ist, führen in der Audiosignalcodiervorrichtung gemäß der vierten Ausführungsform die mehreren Quantisierer 140011, 140013 und 140015 eine Quantisierung unter Verwendung verschiedener Gewichtungskoeffizienten durch, einschließlich der Gewichtung hinsichtlich der auditiven Empfindlichkeitscharakteristik, wodurch eine effiziente Quantisierung durchgeführt werden kann, indem die auditive Eigenart von Menschen effektiv genutzt wird.
  • Ausführungsform 5
  • 15 ist ein Blockschaltbild, das die Struktur einer Audiosignalcodiervorrichtung gemäß einer fünften Ausführungsform der vorliegenden Erfindung zeigt.
  • Die Audiosignalcodiervorrichtung gemäß dieser fünften Ausführungsform ist eine Kombination aus der in 6 gezeigten dritten Ausführungsform und der in 4 gezeigten ersten Ausführungsform, wobei in der Audiosignalcodiervorrichtung gemäß der in 6 gezeigten dritten Ausführungsform ein Gewichtungskoeffizient, der erhalten wird unter der Verwendung der auditiven Empfindlichkeitscharakteristik in der auditiven Gewichtungsberechnungseinheit 4006, verwendet wird, wenn die Quantisierung in jeder Quantisierungseinheit ausgeführt wird. Da die Audiosignalcodiervorrichtung gemäß dieser fünften Ausführungsform so konstruiert ist, werden sowohl die Wirkungen, die von der ersten Ausführungsform bereitgestellt werden, als auch diejenigen, die von der dritten Ausführungsform bereitgestellt werden, erhalten.
  • Ferner kann in ähnlicher Weise die in 6 gezeigte dritte Ausführungsform mit der Struktur gemäß der zweiten Ausführungsform oder der vierten Ausführungsform kombiniert werden, wobei eine Audiosignalcodiervorrichtung, die durch jede Kombination erhalten wird, beide Wirkungen zur Verfügung stellen kann, die von der zweiten Ausführungsform und von der dritten Ausführungsform geschaffen werden, oder beide Wirkungen bereitstellen kann, die von der vierten Ausführungsform und der dritten Ausführungsform geschaffen werden.
  • Obwohl in den obenenrwähnten ersten bis fünften Ausführungsformen die mehrstufige Quantisierungseinheit zwei oder drei Stufen von Quantisierungseinheiten aufweist, muss nicht erwähnt werden, dass die Anzahl der Stufen der Quantisierungseinheit gleich vier oder größer sein kann.
  • Ferner ist die Reihenfolge der Gewichtungskoeffizienten, die für die Vektorquantisierung in den jeweiligen Stufen der mehrstufigen Quantisierungseinheit verwendet werden, nicht auf diejenige beschränkt, die in den obenerwähnten Ausführungsformen beschrieben worden ist. Zum Beispiel können die Gewichtungskoeffizienten hinsichtlich der auditiven Empfindlichkeitscharakteristik in der ersten Stufe verwendet werden, während die LPC-Spektralhüllkurve in und nach der zweiten Stufe verwendet werden kann.
  • Ausführungsform 6
  • 16 ist ein Blockschaltbild, das eine Audiosignalcodiervorrichtung gemäß einer sechsten Ausführungsform der vorliegenden Erfindung zeigt. Da in dieser Ausführungsform nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden ist von derjenigen der obenerwähnten Ausführungsform, wird im Fol genden nur die Struktur der Quantisierungseinheit beschrieben.
  • In 16 bezeichnet das Bezugszeichen 401 eine erste Teilquantisierungseinheit 401, während 402 eine zweite Teilquantisierungseinheit bezeichnet, die einen Ausgang von der ersten Teilquantisierungseinheit 401 empfängt, und 403 eine dritte Teilquantisierungseinheit bezeichnet, die den Ausgang von der zweiten Teilquantisierungseinheit 402 empfängt.
  • Es folgt eine Beschreibung der Operation der Quantisierungseinheit 105. Ein in die erste Teilquantisierungseinheit 401 eingegebenes Signal wird von der Normalisierungseinheit 104 der Codiervorrichtung ausgegeben, d. h. normalisierte MDCT-Koeffizienten. In der Struktur ohne Normalisierungseinheit 104 ist dies jedoch der Ausgang von der MDCT-Einheit 103. In der ersten Teilquantisierungseinheit 401 werden die eingegebenen MDCT-Koeffizienten einer Skalarquantisierung oder einer Vektorquantisierung unterworfen, wobei Indizes, die die für die Quantisierung verwendeten Parameter ausdrücken, codiert werden. Ferner werden Quantisierungsfehler bezüglich der eingegebenen MDCT-Koeffizienten aufgrund der Quantisierung berechnet, wobei diese an die zweite Teilquantisierungseinheit 402 ausgegeben werden. In der ersten Teilquantisierungseinheit 401 können alle MDCT-Koeffizienten quantisiert werden, oder es kann nur ein Teil dieser quantisiert werden. Wenn nur ein Teil derselben quantisiert wird, werden selbstverständlich die Quantisierungsfehler in den Bändern, die von der ersten Teilquantisierungseinheit 401 nicht quantisiert werden, Eingangs-MDCT-Koeffizienten der nicht quantifizierten Bänder.
  • Anschließend empfängt die zweite Teilquantisierungseinheit 402 die Quantisierungsfehler der MDCT-Koeffizienten, die in der ersten Teilquantisierungseinheit 401 erhalten worden sind, und quantisiert diese. Für diese Quantisierung können ähnlich der ersten Teilquantisierungseinheit 401 eine Skalarquantisierung oder eine Vektorquantisierung verwendet werden. Die zweite Teilquantisierungseinheit 402 codiert die für die Quantisierung verwendeten Parameter als Indizes. Ferner berechnet sie Quantisierungsfehler auf Grund der Quantisierung und gibt diese an die dritte Teilquantisierungseinheit 403 aus. Diese dritte Teilquantisierungseinheit 403 ist in der Struktur identisch mit der zweiten Teilquantisierungseinheit.
  • Die Anzahlen von MDCT-Koeffizienten, d. h. die Bandbreiten, die von de ersten Teilquantisierungseinheit 401, der zweiten Teilquantisierungseinheit 402 und der dritten Teilquantisierungseinheit 403 zu quantisieren sind, sind nicht unbedingt gleich, wobei die zu quantisierenden Bänder nicht unbedingt gleich sind. Unter Berücksichtigung der auditiven Charakteristik von Menschen ist es wünschenswert, dass sowohl die zweite Teilquantisierungseinheit 402 als auch die dritte Teilquantisierungseinheit 403 so eingestellt werden, dass sie das Band der MDCT-Koeffizienten quantisieren, die die Niedrigfrequenzkomponente aufweisen.
  • Wie oben beschrieben worden ist, ist gemäß der sechsten Ausführungsform der Erfindung dann, wenn die Quantisierung durchgeführt wird, die Quantisierungseinheit in Stufen vorgesehen, wobei die Bandbreite, die von der Quantisierungseinheit quantisiert werden soll, zwischen den benachbarten Stufen variiert, wodurch Koeffizienten in einem willkürlichen Band unter den Eingangs-MDCT-Koeffizienten, z. B. Koeffizienten, die der Niedrigfrequenzkomponente entsprechen, die für Menschen auditiv wichtig ist, quantisiert werden. Selbst wenn daher ein Audiosignal mit einer niedrigen Bitrate, d. h. einem hohen Kompressionsverhältnis, codiert wird, ist es möglich, auf der Empfangsseite eine hochwertige Audioreproduktion durchzuführen.
  • Ausführungsform 7
  • Als Nächstes wird unter Verwendung der 17 eine Audiosignalcodiervorrichtung gemäß einer siebten Ausführungsform der Erfindung beschrieben. Da in dieser Ausführungsform nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden ist von derjenigen der obenerwähnten Ausführungsform, wird im Folgenden nur die Struktur der Quantisierungseinheit erläutert. In 17 bezeichnet das Bezugszeichen 501 eine erste Teilquantisierungseinheit (Vektorquantisierer), 502 bezeichnet eine zweite Teilquantisierungseinheit, und 503 bezeichnet eine dritte Teilquantisierungseinheit. Diese siebte Ausführungsform unterscheidet sich in der Struktur von der sechsten Ausführungsform dadurch, dass die erste Quantisierungseinheit 501 die eingegebenen MDCT-Koeffizienten in drei Bänder unterteilt und die jeweiligen Bänder unabhängig quantisiert. Wenn im Allgemeinen die Quantisierung unter Verwendung eines Verfahrens der Vektorquantisierung ausgeführt wird, werden Vektoren gebildet durch Extrahieren bestimmter Elemente aus den eingegebenen MDCT-Koeffizienten, wodurch eine Vektorquantisierung durchgeführt wird. In der ersten Teilquantisierungseinheit 501 gemäß dieser siebten Ausführungsform wird dann, wenn Vektoren erzeugt werden durch Extrahieren bestimmter Elemente aus den eingegebenen MDCT-Koeffizienten, die Quantisierung des niedrigen Bandes unter Verwendung nur der Elemente im niedrigen Band durchgeführt, die Quantisierung des Zwischenbandes unter Verwendung nur der Elemente im Zwischenband durchgeführt, und die Quantisierung des hohen Bandes nur unter Verwendung der Elemente im hohen Band durchgeführt, wodurch die jeweiligen Bänder einer Vektorquantisierung unterworfen werden. Die erste Teilquantisierungseinheit 501 scheint aus drei unterteilten Vektorquantisierern zu bestehen.
  • Obwohl in dieser siebten Ausführungsform ein Verfahren der Unterteilung der zu quantisierenden Bänder in drei Bändern, nämlich ein niedriges Band, ein Zwischenband und ein hohes Band, als Beispiel beschrieben worden ist, kann die Anzahl der unterteilten Bänder eine andere als drei sein. Ferner kann bezüglich der zweiten Teilquantisierungseinheit 502 und der dritten Teilquantisierungseinheit 503 sowie der ersten Quantisierungseinheit 501 das zu quantisierende Band in mehrere Bänder unterteilt werden.
  • Wie oben beschrieben worden ist, werden gemäß der siebten Ausführungsform der Erfindung dann, wenn die Quantisierung ausgeführt wird, die eingegebenen MDCT-Koeffizienten in drei Bänder unterteilt und unabhängig quantisiert, so dass der Prozess der Quantisierung des auditiv wichtigen Bandes mit Priorität in der erstmaligen Quantisierung durchgeführt werden kann. Ferner werden in den nachfolgenden Quantisierungseinheiten 502 und 502 die MDCT-Koeffizienten in diesem Band einer weiteren Quantisierung durch Stufen unterworfen, wodurch der Quantisierungsfehler weiter reduziert wird und am Empfangsende eine höherwertige Audioreproduktion verwirklicht wird.
  • Ausführungsform 8
  • Eine Audiosignalcodiervorrichtung gemäß einer achten Ausführungsform der Erfindung wird unter Verwendung der 18 im Folgenden beschrieben. Da in dieser Ausführungsform nur die Struktur der Quantisierungseinheit 105 in der Codiervorrichtung 1 verschieden ist von derjenigen der obenerwähnten ersten Ausführungsform, wird im Folgenden nur die Struktur der Quantisierungseinheit erläutert. In
  • 18 bezeichnet das Bezugszeichen 601 eine erste Teilquantisierungseinheit, 602 bezeichnet eine erste Quantisierungsbandauswahleinheit, 603 bezeichnet eine zweite Teilquantisierungseinheit, 604 bezeichnet eine zweite Quantisierungsbandauswahleinheit, und 605 bezeichnet eine dritte Teilquantisierungseinheit. Diese achte Ausführungsform unterscheidet sich in der Struktur von den sechsten und siebten Ausführungsformen dadurch, dass die erste Quantisierungsbandauswahleinheit 602 und die zweite Quantisierungsbandauswahleinheit 604 hinzugefügt sind.
  • Im Folgenden wird die Operation beschrieben. Die erste Quantisierungsbandauswahleinheit 602 berechnet ein Band, von dem die MDCT-Koeffizienten durch die zweite Teilquantisierungseinheit 602 zu quantisieren sind, unter Verwendung des Quantisierungsfehlers, der von der ersten Teilquantisierungseinheit 601 ausgegeben wird.
  • Zum Beispiel wird j, das esum(j) in Formel (10) maximiert, berechnet, wobei ein Band quantisiert wird, das von j*OFFSET bis j*OFFSET + BANDBREITE reicht.
    Figure 00450001
    wobei OFFSET die Konstante ist und BANDBREITE die gesamte Abtastung ist, die einer von der zweiten Teilquantisierungseinheit 603 zu quantisierenden Bandbreite entspricht. Die erste Quantisierungsbandauswahleinheit 602 codiert z. B. j, das den maximalen Wert in Formel (10) ergibt, als Index. Die zweite Teilquantisierungseinheit 603 quantisiert das von der ersten Quantisierungsbandauswahleinheit 602 ausgewählte Band. Die zweite Quantisierungsbandauswahleinheit 604 ist mit derselben Struktur implementiert wie die erste Auswahleinheit, mit der Ausnahme, dass ihr Eingang der Quantisierungsfehlerausgang von der zweiten Teilquantisierungseinheit 603 ist, wobei das von der zweiten Quantisierungsbandauswahleinheit 604 ausgewählte Band in die dritte Teilquantisierungseinheit 605 eingegeben wird.
  • Obwohl in der ersten Quantisierungsbandauswahleinheit 602 und der zweiten Quantisierungsbandauswahleinheit 604 ein von der nächsten Quantisierungseinheit zu quantisierendes Band unter Verwendung der Formel (10) ausgewählt wird, kann es unter Verwendung eines Wertes berechnet werden, der erhalten wird durch Multiplizieren eines für die Normalisierung durch die Normalisierungseinheit 104 verwendeten Wertes und eines Wertes bezüglich der auditiven Empfindlichkeitscharakteristik von Menschen relativ zu Frequenzen, wie in Formel (11) gezeigt ist.
    Figure 00460001
    wobei env(i) erhalten wird durch Dividieren des Ausgangs der MDCT-Einheit 103 mit dem Ausgang der Normalisierungseinheit 104, und zxc(i) die Tabelle bezüglich der auditiven Empfindlichkeitscharakteristik von Menschen relativ zu Frequenzen ist, wobei ein Beispiel desselben im Graphen 2 gezeigt ist. In der Formel (11) kann zxc(i) immer gleich 1 sein, so dass es nicht berücksichtigt wird.
  • (Graph 2)
    Figure 00470001
  • Ferner ist es nicht notwendig, mehrere Stufen von Quantisierungsbandauswahleinheiten vorzusehen, d. h. es braucht nur die erste Quantisierungsbandauswahleinheit 602 oder die zweite Quantisierungsbandauswahleinheit 604 verwendet werden.
  • Wie oben beschrieben worden ist, ist gemäß der achten Ausführungsform dann, wenn die Quantisierung in mehrere Stufen durchgeführt wird, eine Quantisierungsbandauswahleinheit zwischen benachbarten Stufen von Quantisierungseinheiten angeordnet, um das zu quantisierende Band veränderlich zu machen. Dadurch kann das zu quantisierende Band gemäß dem Eingangssignal verändert werden, wobei der Freiheitsgrad bei der Quantisierung erhöht wird.
  • Es folgt eine Beschreibung der genauen Operation durch ein Quantisierungsverfahren der Quantisierungseinheit, die in der Codiervorrichtung 1 gemäß irgendeiner der ersten bis achten Ausführungsformen enthalten ist, unter Verwendung der 1 und der 19. Aus den normalisierten MDCT-Koeffizienten 1401, die in jede Teilquantisierungseinheit eingegeben werden, werden einige von diesen gemäß einer Regel extrahiert, um Tonquellenteilvektoren 1403 zu bilden. Unter der Annahme, dass die Koeffizientenströme, die erhalten werden durch Teilen der in die Normalisierungseinheit 104 einzugebenden MDCT-Koeffizienten mit den von der Normalisierungseinheit 104 normalisierten MDCT-Koeffizienten 1401, normalisierte Komponenten 1402 sind, werden einige dieser Komponenten gemäß der gleichen Regel extrahiert wird beim Extrahieren der Tonquellenteilvektoren aus den MDCT-Koeffizienten 1401, um somit Gewichtungsteilvektoren 1404 zu bilden. Die Regel zum Extrahieren der Tonquellenteilvektoren 1403 und der Gewichtungsteilvektoren 1404 aus dem MDCT-Koeffizienten 1401 bzw. den normalisierten Komponenten 1402 ist z. B. in der Formel (14) gezeigt.
    Figure 00480001
    wobei das j-te Element des i-ten Tonquellenteilvektors der Teilvektori(j) ist, die MDCT-Koeffizienten der Vektor() sind, die Gesamtelementzahl der MDCT-Koeffizienten 1401 gleich TOTAL ist, die Elementanzahl der Tonquellenteilvektoren 1403 gleich CR ist, und VTOTAL auf einen Wert gleich oder größer als TOTAL gesetzt ist und VTOTAL/CR eine ganze Zahl sein sollte. Wenn z. B. TOTAL gleich 2048 ist, gilt CR = 19 und VTOTAL = 2052, oder CR = 23 und VTOTAL = 2070, oder CR = 21 und VTOTAL = 2079. Die Gewichtungsteilvektoren 19001404 können durch die Prozedur der Formel (14) extrahiert werden. Der Vektorquantisierer 1405 wählt aus den Codevektoren im Codebuch 1409 einen Codevektor mit einem mini malen Abstand zwischen diesem und dem Tonquellenteilvektor 1403 aus, nachdem er durch den Gewichtungsteilvektor 1404 gewichtet worden ist. Anschließend gibt der Quantisierer 1405 den Index des Codevektors mit dem minimalen Abstand, einen Restteilvektor 1404, der den Quantisierungsfehler zwischen den Codevektor mit dem minimalen Abstand und den Eingangstonquellenteilvektor 1403 entspricht, aus. Ein Beispiel einer wirklichen Berechnungsprozedur wird unter der Voraussetzung beschrieben, dass der Vektorquantisierer 1405 aus drei Komponenten besteht: einer Abstandsberechnungseinrichtung 1406, einer Codefestlegungseinrichtung 1407 und einer Resterzeugungseinrichtung 1408. Die Abstandsberechnungseinrichtung 1406 berechnet den Abstand zwischen dem i-ten Tonquellenteilvektor 1403 und dem k-ten Codevektor im Codebuch 1409 unter Verwendung z. B. der Formel (15).
    Figure 00490001
    wobei wj das j-te Element des Gewichtungsteilvektors ist, ck(j) das j-te Element des k-ten Codevektors ist, R und S Normen für die Abstandsberechnung sind, und die Werte von R und S gleich 1, 1,5 und 2 sein sollen. Diese Normen R und S können verschiedene Werte aufweisen. Ferner ist dik der Abstand des k-ten Codevektors vom i-ten Tonquellenteilvektor. Die Codefestlegungseinrichtung 1407 wählt einen Codevektor mit einem minimalen Abstand zwischen den Abständen aus, die durch die Formel (15) oder dergleichen berechnet worden sind, und codiert deren Index. Wenn z. B. diu der minimale Wert ist, ist der für den i-ten zu codierende Teilvektor gleich u. Die Resterzeugungseinrichtung 1408 erzeugt Restteilvektoren 1410 unter Verwendung der Codevektoren, die von der Codefestlegungseinrichtung 1407 ausgewählt worden sind, gemäß der Formel (16). res, (j) = Teilvektor, (j) – Cu(j) (16)wobei das j-te Element des i-ten Restteilvektors 1410 gleich resi(j) ist, und das j-te Element des von der Codefestlegungseinrichtung 1407 ausgewählten Codevektors gleich cu(j) ist. Die Restteilvektoren 1410 werden als MDCT-Koeffizienten, die von den nachfolgenden Teilquantisierungseinheiten zu quantisieren sind, zurückgehal ten, indem der inverse Prozess der Formel 14 oder dergleichen ausgeführt wird. Wenn jedoch ein quantisiertes Band keinen Einfluss auf die nachfolgenden Teilquantisierungseinheiten ausübt, d. h. wenn die nachfolgenden Teilquantisierungseinheiten keine Quantisierung ausführen müssen, sind die Resterzeugungseinrichtung 1408, die Restteilvektoren 1410 und die Erzeugung der MDCT 1411 nicht notwendig. Obwohl die Anzahl der im Codebuch 1409 enthaltenen Codevektoren nicht spezifiziert ist, sollte die Anzahl dann, wenn die Speicherkapazität, die Berechnungszeit und dergleichen betrachtet werden, etwa gleich 64 sein.
  • Als eine weitere Ausführungsform des Vektorquantisierers 1405 steht folgende Struktur zur Verfügung. Das heißt die Abstandberechnungseinrichtung 1406 berechnet den Abstand unter Verwendung der Formel (17).
    Figure 00500001
    wobei K die Gesamtzahl der Codevektoren ist, die für die Codewidergewinnung des Codebuches 1409 verwendet werden.
  • Die Codeentscheidungseinrichtung 1407 wählt k aus, das einen minimalen Wert des Abstands dik ergibt, der in der Formel (17) berechnet wird, und codiert dessen Index. Hierbei ist k ein Wert in einem Bereich von 0 bis 2K-1. Die Resterzeugungseinrichtung 1408 erzeugt die Restuntervektoren 1410 unter Verwendung der Formel (18).
  • Figure 00500002
  • Obwohl die Anzahl der Codevektoren, die im Codebuch 1409 enthalten sind, nicht beschränkt ist, ist es dann, wenn die Speicherkapazität, die Berechnungszeit und dergleichen betrachtet werden, wünschenswert, dass sie etwa 64 beträgt.
  • Obwohl ferner die Gewichtungsuntervektoren 1404 aus dem normalisierten Komponenten 1402 erzeugt werden, ist es möglich, Gewichtungsuntervektoren zu erzeugen durch Multiplizieren der Gewichtungsuntervektoren 1404 mit einem Gewicht im Hinblick auf die auditive Charakteristik von Menschen.
  • Ausführungsform 9
  • Als nächstes wird unter Verwendung der 20 bis 24 eine Audiosignaldecodiervorrichtung gemäß einer neunten Ausführungsform der vorliegenden Erfindung beschrieben. Die von der Codiervorrichtung 1 ausgegebenen Indizes werden grob in die von der Normalisierungseinheit 104 ausgegebenen Indizes und die von der Quantisierungseinheit 105 ausgegebenen Indizes unterteilt. Die von der Normalisierungseinheit 104 ausgegebenen Indizes werden mittels der Umkehrnormalisierungseinheit 107 decodiert, wobei die von der Quantisierungseinheit 105 ausgegebenen Indizes mittels der Umkehrquantisierungseinheit B106 decodiert werden. Die Umkehrquantisierungseinheit 106 kann die Decodierung unter Verwendung nur eines Teils der von der Quantisierungseinheit 105 ausgegebenen Indizes durchführen.
  • Das heißt, unter der Annahme, dass die Quantisierungseinheit 105 die in 17 gezeigte Struktur aufweist, folgt eine Beschreibung des Falles, in welchem die Umkehrquantisierung unter Verwendung der Umkehrquantisierungseinheit mit der Struktur der 20 ausgeführt wird. In 20 bezeichnet das Bezugszeichen 701 eine erste Niedrigbandkomponenten-Umkehrquantisierungseinheit. Die erste Niedrigbandkomponenten-Umkehrquantisierungseinheit 701 führt eine Decodierung unter Verwendung nur der Indizes der Niedrigbandkomponenten des ersten Teilquantisierers 501 durch.
  • Unabhängig von der Menge der von der Codiervorrichtung 1 gesendeten Daten kann somit eine beliebige Menge an Daten des codierten Audiosignals decodiert werden, wodurch die codierte Datenmenge sich von der decodierten Datenmenge unterscheiden kann. Die Menge der zu decodierenden Daten kann entsprechend der Kommunikationsumgebung am Empfangsende variiert werden, wobei eine hohe Tonqualität selbst dann stabil erhalten werden kann, wenn ein gewöhnliches öffentliches Telephonnetz verwendet wird.
  • 21 ist ein Diagramm, das die Struktur der Umkehrquantisierungseinheit zeigt, die in der Audiosignaldecodiervorrichtung enthalten ist, welche verwendet wird, wenn die Umkehrquantisierung in zwei Stufen ausgeführt wird. In 21 bezeichnet das Bezugszeichen 704 eine zweite Umkehrquantisierungseinheit. Diese zweite Umkehrquantisierungseinheit 704 führt eine Decodierung unter Verwendung der Indizes von der zweiten Teilquantisierungseinheit 502 durch. Dementsprechend werden der Ausgang von der ersten Niedrigbandkomponenten-Umkehrquantisierungseinheit 701 und der Ausgang von der zweiten Umkehrquantisierungseinheit 704 addiert, wobei deren Summe von der Umkehrquantisierungseinheit 106 ausgegeben wird. Diese Addition wird für das gleiche Band durchgeführt wie das Band, das von jeder Teilquantisierungseinheit in der Quantisierung quantisiert worden ist.
  • Wie oben beschrieben worden ist, werden Indizes von der ersten Teilquantisierungseinheit (niedriges Band) von der ersten Niedrigbandkomponenten-Umkehrquantisierungseinheit 701 decodiert, wobei dann, wenn die Indizes von der zweiten Teilquantisierungseinheit invers quantisiert werden, der Ausgang von der ersten Niedrigbandkomponenten-Umkehrquantisierungseinheit 701 hierzu addiert wird, wodurch die Umkehrquantisierung in zwei Stufen ausgeführt wird. Das in mehreren Stufen quantisierte Audiosignal kann somit genau decodiert werden, was zu einer höheren Tonqualität führt.
  • Ferner ist 22 ein Diagramm, das die Struktur der Umkehrquantisierungseinheit zeigt, die in der Audiosignaldecodiervorrichtung enthalten ist, in der das zu verarbeitende Objektband erweitert ist, wenn die zweistufige Umkehrquantisierung ausgeführt wird. In 22 bezeichnet das Bezugszeichen 702 eine erste Zwischenbandkomponenten-Umkehrquantisierungseinheit. Diese erste Zwischenbandkomponenten-Umkehrquantisierungseinheit 702 führt eine Decodierung unter Verwendung der Indizes der Zwischenbandkomponenten von der ersten Teilquantisierungseinheit 501 durch. Dementsprechend werden der Ausgang von der ersten Niedrigband komponenten-Umkehrquantisierungseinheit 701, der Ausgang von der zweiten Umkehrquantisierungseinheit 704 und der Ausgang von der ersten Zwischenbandkomponenten-Umkehrquantisierungseinheit 702 addiert, wobei deren Summe von der Umkehrquantisierungseinheit 106 ausgegebenen wird. Diese Addition wird für das gleiche Band durchgeführt wie das Band, das von jeder Teilquantisierungseinheit in der Quantisierung quantisiert worden ist. Das Band des reproduzierten Tons wird somit erweitert, wobei ein Audiosignal mit höherer Qualität reproduziert wird.
  • Ferner ist 23 ein Diagramm, das die Struktur der Umkehrquantisierungseinheit zeigt, die in der Audiosignaldecodiervorrichtung enthalten ist, in der die Umkehrquantisierung in drei Stufen mittels der Umkehrquantisierungseinheit mit der Struktur der 22 ausgeführt wird. In 23 bezeichnet das Bezugszeichen 705 eine dritte Umkehrquantisierungseinheit. Die dritte Umkehrquantisierungseinheit 705 führt eine Decodierung unter Verwendung der Indizes von der dritten Teilquantisierungseinheit 503 durch. Dementsprechend werden der Ausgang von der ersten Niedrigbandkomponenten-Umkehrquantisierungseinheit 701, der Ausgang von der zweiten Umkehrquantisierungseinheit 704, der Ausgang von der ersten Zwischenbandkomponenten-Umkehrquantisierungseinheit 702 und der Ausgang von der dritten Umkehrquantisierungseinheit 705 addiert, wobei deren Summe von der Umkehrquantisierungseinheit 106 ausgegeben wird. Diese Addition wird für das gleiche Band durchgeführt wie das Band, das von jeder Teilquantisierungseinheit in der Quantisierung quantisiert worden ist.
  • Ferner ist 24 eine Diagramm, das die Struktur der Umkehrquantisierungseinheit zeigt, die in der Audiosignaldecodiervorrichtung enthalten ist, in der das zu verarbeitende Objektband erweitert wird, wenn die dreistufige Umkehrquantisierung in der Umkehrquantisierungseinheit mit der Struktur der 23 ausgeführt wird. In 24 bezeichnet das Bezugszeichen 703 eine erste Hochbandkomponenten-Umkehrquantisierungseinheit. Die erste Hochbandkomponenten-Umkehrquantisierungseinheit 703 führt eine Decodierung unter Verwendung der Indizes der Hochbandkomponenten von der ersten Teilquantisierungseinheit 501 durch. Dementsprechend werden der Ausgang von der ersten Niedrigbandkomponenten-Umkehrquantisierungseinheit 701, der Ausgang von der zweiten Umkehrquantisierungseinheit 704, der Ausgang von der ersten Zwischenbandkomponenten-Umkehrquantisierungseinheit 702, der Ausgang von der dritten Umkehrquantisie rungseinheit 705 und der Ausgang von der ersten Hochbandkomponenten-Umkehrquantisierungseinheit 703 addiert, wobei deren Summe von der Umkehrquantisierungseinheit 106 ausgegeben wird. Diese Addition wird für das gleiche Band durchgeführt wie das Band, das von jeder Teilquantisierungseinheit in der Quantisierung quantisiert worden ist.
  • Obwohl diese neunte Ausführungsform für den Fall beschrieben worden ist, in welchem die Decodiereinheit 106 die Daten, die von der Quantisierungseinheit 105 mit der Struktur der 7 quantisiert wurden, invers decodiert, kann eine ähnliche Umkehrquantisierung selbst dann ausgeführt werden, wenn die Quantisierungseinheit 105 die in den 16 oder 18 gezeigte Struktur aufweist.
  • Wenn ferner die Codierung unter Verwendung der Quantisierungseinheit mit der in 17 gezeigten Struktur ausgeführt wird und die Decodierung unter Verwendung der Umkehrquantisierungseinheit mit der in 24 gezeigten Struktur ausgeführt wird, wie in 25 gezeigt ist, werden, nachdem die Niedrigbandindizes von der ersten Teilquantisierungseinheit invers quantisiert worden sind, die Indizes von der zweiten Teilquantisierungseinheit 502 in der nächsten Stufe invers quantisiert, und die Zwischenbandindizes von der ersten Teilquantisierungseinheit invers quantisiert. Auf diese Weise werden die Umkehrquantisierung zum Erweitern des Bandes und die Umkehrquantisierung zum Reduzieren des Quantisierungsfehlers alternierend wiederholt. Wenn jedoch das von der Quantisierungseinheit mit der in 16 gezeigten Struktur codiertes Signal unter Verwendung der Umkehrquantisierungseinheit mit der in 24 gezeigten Struktur decodiert wird, werden die quantisierten Koeffizienten schrittweise durch die Umkehrquantisierungseinheit in der nächsten Stufe quantisiert, da keine unterteilten Bänder vorliegen.
  • Es folgt eine Beschreibung der genauen Operation der Umkehrquantisierungseinheit 107 als Bestandteil der Audiosignaldecodiervorrichtung 2 unter Verwendung der 1 und der 26.
  • Zum Beispiel besteht die Umkehrquantisierungseinheit 107 aus der ersten Niedrigband-Umkehrquantisierungseinheit 701, wenn sie die in 20 gezeigte Umkehrquantisierungseinheit aufweist, und besteht aus zwei Umkehrquantisierungseinheiten, nämlich der ersten Niedrigband-Umkehrquantisierungseinheit 701 und der zwei ten Umkehrquantisierungseinheit 704, wenn sie die in 21 gezeigte Umkehrquantisierungseinheit aufweist.
  • Der Vektorumkehrquantisierer 1501 reproduziert die MDCT-Koeffizienten unter Verwendung der Indizes von der Vektorquantisierungseinheit 105. Wenn die Teilquantisierungseinheit die in 20 gezeigte Struktur aufweist, wird die Umkehrquantisierung wie folgt ausgeführt. Eine Indexnummer wird decodiert, wobei ein Codevektor mit der Nummer aus dem Codebuch 1502 ausgewählt wird. Es wird angenommen, dass der Inhalt des Codebuches 1502 identisch ist mit demjenigen des Codebuches der Codiervorrichtung, Der ausgewählte Codebuchvektor wird als reproduzierter Vektor 1503 ein MDCT-Koeffizient 1504, der mit der Umkehrprozess mit der Formel (14) invers quantifiziert wird.
  • Wenn die Teilquantisierungseinheit die in 21 gezeigte Struktur aufweist, wird die Umkehrquantisierung wie folgt ausgeführt. Es wird eine Indexnummer k decodiert, wobei ein Codevektor mit der in der Formel (19) berechneten Nummer u aus dem Codebuch 1502 ausgewählt wird.
    Figure 00550001
  • Ein reproduzierter Teilvektor wird unter Verwendung der Formel (20) erzeugt.
    Figure 00550002
    wobei das j-te Element des i-ten reproduzierten Teilvektors gleich resi(j) ist.
  • Es folgt eine Beschreibung der genauen Struktur der Umkehrnormalisierungseinheit 107 als Bestandteil der Audiosignaldecodiervorrichtung B2 unter Verwendung der 1 und der 27. In 27 bezeichnet das Bezugszeichen 1201 eine Frequenzkontur-Umkehrquantisierungseinheit, 1202 bezeichnet eine Bandamplituden-Umkehrnormalisierungseinheit, und 1203 bezeichnet eine Bandtabelle. Die Fre quenzkontur-Umkehrnormalisierungseinheit 1201 empfängt die Indizes von der Frequenzkontur-Normalisierungseinheit 1201, reproduziert die Frequenzkontur, und multipliziert den Ausgang der Umkehrquantisierungseinheit 106 mit der Frequenzkontur. Die Bandamplituden-Umkehrnormalisierungseinheit 1202 empfängt die Indizes von der Bandamplitudennormalisierungseinheit 202 und stellt die Amplitude jedes Bandes, das in der Bandtabelle 1203 gezeigt ist, durch Multiplikation wieder her. Unter Annahme, dass der Wert jedes Bandes, das unter Verwendung der Indizes von der Bandamplitudennormalisierungseinheit B202 wiederhergestellt wird, gleich gavej ist, ist die Operation der Bandamplituden-Umkehrnormalisierungseinheit 1202 durch die Formel (12) gegeben. dct(i) = n_dcr(i)·gave, bjlow ≤ i ≤ bjhigh (12)wobei der Ausgang von der Frequenzkontur-Umkehrnormalisierungseinheit 1201 gleich n dct(i) ist und der Ausgang von der Bandamplituden-Umkehrnormalisierungseinheit 1202 gleich dct(i) ist. Außerdem sind die Bandtabelle 1203 und die Bandtabelle 203 identisch.
  • Es folgt eine Beschreibung der genauen Struktur der Frequenzkontur-Umkehrnormalisierungseinheit 1201 als Bestandteil der Audiosignaldecodiervorrichtung 2 unter Verwendung der 28. In 28 bezeichnet das Bezugszeichen 1301 eine Kontur-Umkehrquantisierungseinheit, während 1302 eine Hüllkurvencharakterstik-Umkehrquantisierungseinheit bezeichnet. Die Kontur-Umkehrquantisierungseinheit 1301 stellt Parameter wieder her, die die Frequenzkontur, z. B. lineare Vorhersagekoeffizienten, anzeigen, unter Verwendung der Indizes von der Konturquantisierungseinheit 301 in der Codiervorrichtung. Wenn die wiederhergestellten Koeffizienten Linearvorhersagekoeffizienten sind, werden die quantisierten Hüllkurvencharakteristiken wiederhergesellt durch Berechnen derselben in ähnlicher Weise in Formel (8). Wenn die wiederhergestellten Koeffizienten keine Linearvorhersagekoeffizienten sind, da sie z. B. LSP-Koeffizienten sind, werden die Hüllkurvencharakteristiken wiederhergestellt durch Transformieren derselben in Frequenzcharakteristiken. Die Hüllkurvencharakteristik-Umkehrquantisierungseinheit 1302 multipliziert die wiederhergestellten Hüllkurvencharakteristiken mit dem Ausgang von der Umkehrquantisierungseinheit 106, wie in der Formel (13) gezeigt ist, und gibt das Ergebnis aus. mdct(i) = fdct(i)·env(i) (13)

Claims (36)

  1. Audiosignalcodierungsverfahren zum Codieren einer Datenmenge durch Vektorquantisierung unter Verwendung eines mehrstufigen Quantisierungsverfahrens mit einem ersten Vektorquantisierungsvorgang zur Vektorquantisierung einer Signalfolge einer Frequenzcharacterisitc, die erhalten wird durch Frequenztransformation eines Eingangsaudiosignals, und einem zweiten Vektorquantisierungsvorgang zur Vektorquantisierung einer Quantisierungsfehlerkomponente in dem ersten Vektorquantisierungsvorgang: wobei auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur eines Menschen zeigenden auditiven Empfindlichkeitscharakteristic ein Frequenzblock mit einer hohen Wichtigkeit für die Quantisierung aus Frequenzblöcken der Quantisierungsfehlerkomponente in dem ersten Vektorquantisierungsvorgang ausgewählt wird und, in dem zweiten Vektorquantisierungsvorgang die Quantisierungsfehlerkomponente des ersten Quantisierungsvorgangs unter Berücksichtigung des ausgewählten Frequenzblocks quantisiert wird.
  2. Audiosignalcodierungsverfahren zum Codieren einer Datenmenge durch Vektorquantisierung unter Venrwendung eines mehrstufigen Quantisierungsverfahrens mit einem erststufigen Vektorquantisierungsvorgang zur Vektorquantisierung einer Signalfolge einer Frequenzcharacteristic, die durch Frequenztransformation eines Eingangsaudiosignals erhalten wird, und zweiten und weiteren Stufen von Vektorquantisierungsvorgängen zur Vektorquantisierung einer Quantisierungsfehlerkomponente in den Vektorquantisierungsvorgängen vorheriger Stufen: wobei, unter den mehreren Stufen von Quantisierungsvorgängen gemäß dem mehrstufigen Quantisierungsverfahren, zumindest ein Vektorquantisierungsvorgang eine Vektorquantisierung durchführt unter Verwendung von Gewichtungskoeffizienten bezüglich der Frequenz als Gewichtungskoeffizienten zur Quantisierung, die auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik berechnet werden; und auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik ein Frequenzblock mit hoher Wichtigkeit für die Quantisierung aus Frequenzblöcken der Quantisierungsfehlerkomponente in dem erststufigen Vektorquantisierungsvorgang ausgewählt wird und in dem zweitstufigen Vektorquantisierungsvorgang die Quantisierungsfehlerkomponente des erststufigen Quantisierungsvorgangs unter Berücksichtigung des ausgewählten Frequenzblocks quantisiert wird.
  3. Audiosignalcodiervorrichtung mit: einer Zeit-nach-Frequenz-Transformationseinheit (103) zum Transformieren eines Eingangsaudiosignals in ein Frequenzbereichssignal; eine Spektralhüllkurvenberechnungseinheit zum Berechnen einer Spektralhüllkurve des Eingangsaudiosignals; einer Normalisierungseinheit (104) zum Normalisieren des in der Zeit-nach-Frequenz-Transfromationseinheit (103) erhaltenen Frequenzbereichssignals mit der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve, um dadurch ein Restsignal zu erhalten; einer Höhrgewichtungs-Berechnungseinheit (4006) zum Berechnen von Gewichtungskoeffizienten bezüglich der Frequenz, auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik; und einer mehrstufigen Quantisierungseinheit (4005) mit mehreren Stufen von in Kolonnen verschalteten Vektorquantisierungseinheiten, in die das normalisierte Restsignal eingegeben wird, wobei zumindest eine der Vektorquantisierungseinheiten eine Quantisierung unter Verwendung der in der Gewichtungseinheit erhaltenen Gewichtungskoeffizienten durchführt.
  4. Audiosignalcodiervorrichtung nach Anspruch 3, wobei mehrere Quantisierungseinheiten (40051, 40051, 40053) unter den mehrfachen Stufen der mehrstufigen Quantisierungseinheit (4005) eine Quantisierung durchführen unter Verwendung der in der Gewichtungseinheit (4006) erhaltenen Gewichtungskoeffizienten, und die Höhrgewichtungs-Berechnungseinheit (4006) individuelle Gewichtungskoeftizienten berechnet, die durch die entsprechenden mehrfachen Stufen der Quantisierungseinheiten (4005) zu verwenden sind.
  5. Audiosignalcodiervorrichtung nach Anspruch 4: wobei die mehrstufige Quantisierungseinheit (4005) umfasst: eine Erststufenquantisierungseinheit zum Quantisieren des durch die Normalisierungseinheit normalisierten Restsignals unter Verwendung der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen; eine Zweitstufenquantisierungseinheit zum Quantisieren eines Quantisierungsfehlersignals von der Erststufenquantisierungseinheit unter Verwendung von auf Grundlage der Korellation zwischen der Spektralhüllkurve und des Quantisierungsfehlersignals der Erststufenquantisierungseinheit berechneten Gewichtungskoeffizienten als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen; und eine Drittstufenquantisierungseinheit zum Quantisieren eines Quantisierungsfehlersignals von der Zweitstufenquantisierungseinheit unter Verwendung von Gewichtungskoeffizienten, die erhalten werden durch Einstellen der durch die Höhrgewichtungs-Berechnungseinheit (4006) gemäß dem durch die Zeit-nach-Frequenz-Transformationseinheit (103) in das Frequenzbereichssignal transformierten Eingangssignal und der auditiven Charakteristik berechneten Gewichtungskoeffizienten auf Grundlage der Spektralhüllkurve des Quantisierungsfehlersignals der Zweitstufenquantisierungseinheit, und des durch die Normalisierungseinheit normalisierten Restsignals als Gewichtungskoeffizienten in den entsprechenden Frequenzbereichen.
  6. Audiosignalcodiervorrichtung mit: einer Zeit-nach-Frequenz-Transformationseinheit (103) zum Transformieren eines Eingangsaudiosignals in ein Frequenzbereichssignal; einer Spektralhüllkurvenberechnungseinheit zum Berechnen einer Spektralhüllkurve des Eingangsaudiosignals; einer Normalisierungseinheit (104) zum Normalisieren des in der Zeit-nach-Frequenz-Transformationseinheit (103) erhaltenen Frequenzbereichssignals, mit der in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurve, um dadurch ein Restsignal zu erhalten; einem ersten Vektorquantisierer zum Quantisieren des durch die Normalisierungseinheit (104) normalisierten Restsignals; einer auditiven Auswahleinrichtung zum Auswählen eines Frequenzblocks mit einer hohen Wichtigkeit für die Quantisierung unter Frequenzblöcken der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, auf Grundlage des Spektrums des Eingangsaudiosignals und der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik; und einem zweiten Quantisierer zum Quantisieren der Vektrorfehlerkomponente des ersten Vektroquantisierers unter Berücksichtigung des durch die auditive Auswahleinrichtung ausgewählten Frequenzblocks.
  7. Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals, und einer Umkehrcharakteristik der minimalen Hörgrenzencharakteristik erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  8. Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock unter Verwendung eines durch Multiplizieren des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals und einer Umkehrcharakteristik der minimalen Hörgrenzencharakteristik erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab auswählt.
  9. Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spaktralhüllkurvensignals und einer Umkehrcharakteristik einer Charakteristik, die durch Addieren der minimalen Hörgrenzencharakteristik und einer aus dem Eingangssignal berechneten Maskierungscharakteristik erhalten wird, erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  10. Audiosignalcodiervorrichtung nach Anspruch 6, wobei die auditive Auswahleinrichtung einen Frequenzblock auswählt unter Verwendung eines durch Multiplizieren der Quantisierungsfehlerkomponente des ersten Vektorquantisierers, des in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignals, und einer Umkehrcharakteristik einer Charakteristik, die durch Addieren der minimalen Hörgrenzencharakteristik und einer Maskierungscharakteristik erhalten wird, die aus dem Einganssignal berechnet wird und gemäß dem durch die Normalisierungseinheit normalisierten Restsignal dem in der Spektralhüllkurvenberechnungseinheit erhaltenen Spektralhüllkurvensignal, und dem Quantisierungsfehlersignal der Erststufen-Quantisierungseinheit korrigiert wird, erhaltenen Wertes als ein zu quantisierender Wichtigkeitsmaßstab.
  11. Audiosignalcodiervorrichtung zum Codieren einer Datenmenge durch Vektorquantisierung unter Verwendung einer mehrstufigen Quantisierungseinrichtung (4005) mit einem ersten Vektorquantisierer zum Vektorquantisieren einer durch Frequenztransformation eines Eingangsaudiosignals erhaltenen Signalfolge einer Frequenzcharakteristik, und einem zweiten Vektorquantisierer zum Vektorquantisieren einer Quantisierungsfehlerkomponente des ersten Vektorquantisierers: wobei die mehrstufige Quantisierungseinrichtung (4005) die Signalfolge der Frequenzcharakteristik in zumindest zwei Frequenzbändern entsprechende Koeffizientenströme aufteilt, und jeder der Vektorquantisierer unabhängig eine Quantisierung durchführt unter Verwendung einer Vielzahl von Teilvektorquantisierern, die entsprechend den jeweiligen Koeftizientenströmen vorbereitet sind.
  12. Audiosignalcodiervorrichtung nach Anspruch 11, weiterhin umfassend eine Normalisierungseinrichtung zum Normalisieren der Signalfolge der Frequenzcharakteristik.
  13. Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung ein Frequenzband mit einer hohen Energieadditionssumme des Quantisierungsfehlers aus den Frequenzbändern der zu quantisierenden Signalfolge der Frequenzcharakteristik auswählt, und das ausgewählte Band dann quantisiert.
  14. Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung in geeigneter Weise ein Frequenzband aus den Frequenzbändern der zu quantisierenden Signalfolge der Frequenzcharakteristik auswählt auf Grundlage der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik, wobei das ausgewählte Frequenzband eine hohe Energieadditionssumme des durch Zuweisen eines hohen Wertes zu einem Band mit einer hohen Wichtigkeit der auditiven Empfindlichkeitscharakteristik gewichteten Quantisierungsfehlers, und die Quantisierungseinrichtung dann das ausgewählte Band quantisiert.
  15. Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung einen als Gesamtbandquantisierungseinheit dienenden Vektorquantisierer aufweist, der zumindest einmalig alle Frequenzbänder der zu quantisierenden Signalfolge der Frequenzcharakteristik quantisiert.
  16. Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung so aufgebaut ist, dass der Erststufenvektorquantisierer einen Quantisierungsfehler in der Vektorquantisierung unter Verwendung eines Vektorquantisierungsverfahrens mit einem Codebuch berechnet und des weiteren der Zweitstufenquantisierer den berechneten Quantisierungsfehler vektorquantisiert.
  17. Audiosignalcodiervorrichtung nach Anspruch 16, wobei Codevektoren, deren Codes teilweise oder in ihrer Gesamtheit invertiert sind, als das Vektorquantisierungsverfahren zur Codewiedergewinnung verwendet werden.
  18. Audiosignalcodiervorrichtung nach Anspruch 16, weiterhin umfassend eine Normalisierungseinrichtung zum Normalisieren der Signalfolge der Frequenzcharakteristik, wobei eine Berechnung von zur Wiedergewinnung eines optimalen Codes in der Vektroquantisierung verwendete Distanzen durchgeführt wird durch Berechnen von Distanzen unter Verwendung von normalisierten Komponenten des durch die Normalisierungseinheit bearbeiteten Einganssignals als Gewichtungen, und Extrahieren eines Codes mit minimaler Distanz.
  19. Audiosignalcodiervorrichtung nach Anspruch 18, wobei die Distanzen berechnet werden, wobei als Gewichtungen sowohl die normalisierten Komponenten der durch die Normalisierungseinrichtung bearbeiteten Signalfolge der Frequenzcharakteristik als auch ein Wert in Anbetracht der die auditive Natur von Menschen zeigenden auditiven Empfindlichkeitscharakteristik verwendet werden, und ein Code mit einer minimalen Distanz extrahiert wird.
  20. Audiosignalcodiervorrichtung nach Anspruch 12, wobei die Normalisierungseinrichtung eine Frequenzkonturnormalisierungseinheit aufweist, die die Kontur der Signalfolge der Frequenzcharakteristik normalisiert.
  21. Audiosignalcodiervorrichtung nach Anspruch 12, wobei die Normalisierungseinrichtung eine Bandamplituden-Normalisierungseinheit aufweist, die die Signalfolge der Frequenzcharakteristik in eine Vielzahl von Komponenten mit kontinuierlichen Einheitsbändern aufteilt, und die Signalfolge durch Aufteilen eines jeden Einheitsbands mit einem einzelnen Wert normalisiert.
  22. Audiosignalcodiervorrichtung nach Anspruch 11, wobei die Quantisierungseinrichtung einen Vektorquantisierer zum Quantisieren der jeweiligen Koeffizientenströme der Signalfolge der Frequenzcharakteristik in unabhängiger Weise durch Teilvektorquantisierer enthält, und einen als Gesamtbandquantisierungseinheit dienenden Vektorquantisierer enthält, der zumindest einmalig alle Frequenzbänder des zu quantisierenden Eingangssignals quantisiert.
  23. Audiosignalcodiervorrichtung nach Anspruch 22: wobei die Quantisierungseinrichtung einen ersten Vektorquantisierer mit einem Teilvektorquantisierer eines niedrigen Bands, einem Teilvektorquantisierer eines mittleren Bands und einem Teilvektorquantisierer eines hohen Bands und einen zweiten Vektorquantisierer, der hinter den ersten Quantisierer geschaltet ist, und einen dritten Vektorquantisierer, der hinter den zweiten Quantisierer geschaltet ist, umfasst; die in die Quantisierungseinrichtung eingegebene Signalfolge der Frequenzcharakteristik in drei Bänder aufgeteilt ist und, unabhängig voneinander, die Signalfolge der Frequenzcharakteristik einer Niederbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des niedrigen Bands, die Signalfolge der Frequenzcharakteristik einer Mittelbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des mittleren Bands und die Signalfolge der Frequenzcharakteristik einer Hochbandkomponente unter den drei Bändern durch den Teilvektorquantisierer des hohen Bandes quantisiert wird; ein Quantisierungsfehler bezüglich der Signalfolge der Frequenzcharakteristik in jedem der den ersten Vektorquantisierer bildenden Teilvektorquantisierer berech net wird, und der Quantisierungsfehler in den nachfolgenden zweiten Vektorquantisierer eingegeben wird; der zweite Vektorquantisierer eine Quantisierung für eine durch den zweiten Vektorquantisierer zu quantisierende Bandbreite durchführt, einen Quantisierungsfehler bezüglich der Eingabe des zweiten Vektorquantisierers berechnet und diese in den dritten Vektorquantisierer eingibt; und der dritte Vektorquantisierer eine Quantisierung für eine durch den dritten Vektorquantisierer zu quantisierende Bandbreite durchführt.
  24. Audiosignalcodiervorrichtung nach Anspruch 23, des weiteren umfassend eine zwischen dem ersten Vektorquantisierer und dem zweiten Vektorquantisierer angeordnete erste Quantisierungsbandauswahleinheit und eine zwischen dem zweiten Vektorquantisierer und dem dritten Vektorquantisierer angeordnete zweite Quantisierungsbandauswahleinheit: wobei das Ausgangssignal des ersten Vektorquantisierers in die erste Quantisierungsbandauswahleinheit eingegeben wird und ein durch den zweiten Vektorquantisierer zu quantisierendes Band in der ersten Quantisierungsbandauswahleinheit ausgewählt wird; der zweite Vektorquantisierer eine Quantisierung für eine durch den zweiten Vektorquantisierer zu quantisierende Bandbreite durchführt, bezüglich der Quantisierungsfehler der durch die erste Quantisierungsbandauswahleinheit entschiedenen ersten drei Vektorquantisierer, einen Quantisierungsfehler bezüglich des Eingangssignals des zweiten Vektorquantisierers berechnet, und diesen in die zweite Quantisierungsbandauswahleinheit eingibt; die zweite Quantisierungsbandauswahleinheit ein durch den dritten Vektorquantisierer zu quantisierendes Band auswählt; und der dritte Vektorquantisierer eine Quantisierung für ein durch die zweite Quantisierungsbandauswahleinheit entschiedenes Band durchführt.
  25. Audiosignalcodiervorrichtung nach Anspruch 23, wobei, anstelle des ersten Vektorquantisierers, der zweite Vektorquantiesierer oder der dritte Vektorquantisierer aufgebaut ist unter Verwendung des Teilvektorquantisierers des niedrigen Bands, des Teilvektorquantisierers des mittleren Bands, und des Teilvektorquantisierers des hohen Bands.
  26. Audiosignaldecodiervorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 11 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingangsaudiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit zum Durchführen einer inversen Quantisierung unter Verwendung zumindest eines Teils der durch die Quantisierungseinrichtung der Audiosignalcodiervorrichtung ausgegebenen Codes und einer Umkehrfrequenztransformationseinheit zum Transformieren einer von der Umkehrquantisierungseinheit ausgegebenen Signalfolge der Frequenzcharakteristik in ein dem ursprünglichen Audioeingangssignal entsprechendes Signal.
  27. Audiosignaldecodiervorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 13 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingangsaudiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit zum Widergeben einer Signalfolge der Frequenzcharakteristik; einer Umkehrnormalisierungseinheit zum Widergeben normalisierter Komponenten auf Grundlage der durch die Audiosignalcodiervorrichtung ausgegebenen Codes, wobei die durch die Umkehrquantisierungseinheit ausgegebene Signalfolge der Frequenzcharakteristik verwendet und die Signalfolge der Frequenzcharakteristik und die normalisierten Komponenten multipliziert werden; und einer Umkehrfrequenztransformationseinheit zum Empfangen des Ausgangssignals von der Umkehrnormalisierungseinheit und zum Transformieren der Signalfolge der Frequenzcharakteristik in ein dem ursprünglichen Audiosignal entsprechendes Signal.
  28. Audiosignaldecodiervorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 22 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Audiosignal entsprechenden Signals mit: einer Umkehrquantisierungseinheit, die eine inverse Quantisierung unter Verwendung der Ausgangscodes durchführt, wenn die Codes durch alle der die Quanti sierungseinrichtung in der Audiosignalcodiervorrichtung bildenden Vektorquantisierer oder von einigen dieser ausgegeben werden.
  29. Audiosignaldecodiervorrichtung nach Anspruch 28, wobei: die Umkehrquantisierungseinheit eine inverse Quantisierung der quantisierten Codes in einem vorbestimmten Band durch abwechselndes Ausführen einer inversen Quantisierung quantisierter Codes in einer nächsten Stufe, und einer inversen Quantisierung quantisierter Codes in einem von dem vorbestimmten Band verschiedenen Band durchführt; die Umkehrquantisierungseinheit die inverse Quantisierung der quantisierten Codes in den verschiedenen Bändern fortlaufend durchführt, wenn keine quantisierten Codes während der inversen Quantisierung in der nächsten Stufe vorhanden sind und die Umkehrquantisierungseinheit die inverse Quantisierung der quantisierten Codes in der nächsten Stufe fortlaufend durchführt, wenn keine quantisierten Codes in den verschiedenen Bändern vorhanden sind.
  30. Audiosignaldecodiervorrichtung zum Empfangen von durch die Audiosignalcodiervorrichtung nach Anspruch 23 ausgegebenen Codes als Eingangssignal und zum Decodieren dieser Codes zur Ausgabe eines dem ursprünglichen Eingabeaudiosignals entsprechenden Signals mit: einer Umkehrquantisierungseinheit, die eine inverse Quantisierung unter Verwendung ausschließlich solcher Codes durchführt, die von dem Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegeben werden, obwohl alle oder einige der den ersten Vektorquantisierer bildenden drei Teilvektorquantisierer in der Audiosignalcodiervorrichtung Codes ausgeben.
  31. Audiosignaldecodiervorrichtung nach Anspruch 30, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von durch den zweiten Vektorquantisierer ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes durchführt.
  32. Audiosignaldecodiervorrichtung nach Anspruch 31, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgebenen Codes und den durch den zweiten Vektorquantisierer ausgegebenen Codes durchführt.
  33. Audiosignaldecodiervorrichtung nach Anspruch 32, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von durch den dritten Vektorquantisierer ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes, den durch den zweiten Vektroquantisierer ausgegebenen Codes und den durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes durchführt.
  34. Audiosignaldecodiervorrichtung nach Anspruch 33, wobei die Umkehrquantisierungseinheit eine inverse Quantisierung unter Verwendung von den durch den Teilvektorquantisierer des hohen Bandes als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes zusätzlich zu den durch den Teilvektorquantisierer des niedrigen Bands als Bestandteil des Vektorquantisierers ausgegebenen Codes, den durch den zweiten Vektorquantisierer ausgebenen Code, den durch den Teilvektorquantisierer des mittleren Bands als Bestandteil des ersten Vektorquantisierers ausgegebenen Codes und den durch den dritten Vektorquantisierer ausgebenen Codes durchführt.
  35. Audiosignalcodier- und decodierverfahren zum Empfangen einer durch Frequenztransformation eines Eingangsaudiosignals erhaltenen Signalfolge einer Frequenzcharakteristik, zum Codieren und Ausgeben des Signals und zum Decodieren des ausgegebenen codierten Signals zur Widergewinnung eines dem ursprünglichen Eingangsaudiosignals entsprechenden Signals: wobei die Signalfolge der Frequenzcharakteristik in zumindest zwei Frequenzbändern entsprechenden Koeffizientenströme aufgeteilt wird, und diese Koeffizientenströme unabhängig voneinander quantisiert und ausgegeben werden; und anhand des empfangenen quantisierten Signals Daten eines beliebigen dem Teilband entsprechenden Bands invers quantisiert werden, um dadurch ein dem ursprünglichen Eingansaudiosignal entsprechendes Signal wiederzugewinnen, wobei die Quantisierung stufenweise durchgeführt wird, so dass ein berechneter Quantisierungsfehler weiter quantisiert wird; und die inverse Quantisierung durch abwechselndes Widerholen einer auf eine Bandverbreiterung gerichteten Quantisierung und einer auf eine Vertiefung der Quantisierungsstufen in der Quantisierung gerichteten Quantisierung durchgeführt wird.
  36. Audiosignalcodier- und decodierverfahren nach Anspruch 35, wobei die auf die Bandverbreiterung gerichtete inverse Quantisierung in einer Reihenfolge unter Berücksichtigung der auditiven psychologischen Charakteristik von Menschen ausgeführt wird.
DE69724126T 1996-07-01 1997-07-01 Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer Expired - Fee Related DE69724126T2 (de)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP17129696A JP3246715B2 (ja) 1996-07-01 1996-07-01 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP17129696 1996-07-01
JP9240697 1997-04-10
JP9240697 1997-04-10
JP12584497 1997-05-15
JP12584497 1997-05-15
PCT/JP1997/002271 WO1998000837A1 (fr) 1996-07-01 1997-07-01 Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio

Publications (2)

Publication Number Publication Date
DE69724126D1 DE69724126D1 (de) 2003-09-18
DE69724126T2 true DE69724126T2 (de) 2004-06-09

Family

ID=27307035

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69724126T Expired - Fee Related DE69724126T2 (de) 1996-07-01 1997-07-01 Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer

Country Status (8)

Country Link
US (1) US6826526B1 (de)
EP (1) EP0910067B1 (de)
JP (1) JP3246715B2 (de)
KR (1) KR100283547B1 (de)
CN (1) CN1156822C (de)
DE (1) DE69724126T2 (de)
ES (1) ES2205238T3 (de)
WO (1) WO1998000837A1 (de)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
GB2396538B (en) * 2000-05-16 2004-11-03 Samsung Electronics Co Ltd An apparatus and method for quantizing phase of speech signal using perceptual weighting function
KR100363259B1 (ko) 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
JP4207568B2 (ja) * 2000-12-14 2009-01-14 ソニー株式会社 情報抽出装置および方法、情報合成装置および方法、並びに記録媒体
US7016502B2 (en) 2000-12-22 2006-03-21 Sony Corporation Encoder and decoder
DE10102159C2 (de) 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
AU2003264322A1 (en) * 2003-09-17 2005-04-06 Beijing E-World Technology Co., Ltd. Method and device of multi-resolution vector quantilization for audio encoding and decoding
JP4609097B2 (ja) * 2005-02-08 2011-01-12 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
EP1866914B1 (de) * 2005-04-01 2010-03-03 Qualcomm Incorporated Vorrichtung und Verfahren für die Teilband-Sprachkodierung
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
CN100370834C (zh) * 2005-08-08 2008-02-20 北京中星微电子有限公司 多模图像编解码芯片中的系数缩放计算模块
WO2007043648A1 (ja) * 2005-10-14 2007-04-19 Matsushita Electric Industrial Co., Ltd. 変換符号化装置および変換符号化方法
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
WO2008047795A1 (fr) * 2006-10-17 2008-04-24 Panasonic Corporation Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
US8886612B2 (en) * 2007-10-04 2014-11-11 Core Wireless Licensing S.A.R.L. Method, apparatus and computer program product for providing improved data compression
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8306817B2 (en) * 2008-01-08 2012-11-06 Microsoft Corporation Speech recognition with non-linear noise reduction on Mel-frequency cepstra
JP5262171B2 (ja) * 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
US9031243B2 (en) * 2009-09-28 2015-05-12 iZotope, Inc. Automatic labeling and control of audio algorithms by audio recognition
US20110145325A1 (en) * 2009-12-16 2011-06-16 Alcatel-Lucent Usa Inc. Running an interactive multi-user application at a mobile terminal
US20110145341A1 (en) * 2009-12-16 2011-06-16 Alcatel-Lucent Usa Inc. Server platform to support interactive multi-user applications for mobile clients
US8654859B1 (en) 2009-12-17 2014-02-18 Ambarella, Inc. Low cost rate-distortion computations for video compression
JP5809066B2 (ja) * 2010-01-14 2015-11-10 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声符号化方法
US9135922B2 (en) 2010-08-24 2015-09-15 Lg Electronics Inc. Method for processing audio signals, involves determining codebook index by searching for codebook corresponding to shape vector generated by using location information and spectral coefficients
KR20130112869A (ko) * 2010-09-17 2013-10-14 파나소닉 주식회사 양자화 장치 및 양자화 방법
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
CN103718240B (zh) * 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
JP6407150B2 (ja) * 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
EP2830054A1 (de) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer, Audiodecodierer und zugehörige Verfahren unter Verwendung von Zweikanalverarbeitung in einem intelligenten Lückenfüllkontext
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
KR102280943B1 (ko) * 2014-02-27 2021-07-22 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치
EP2919232A1 (de) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierer, Decodierer und Verfahren zur Codierung und Decodierung
US10515646B2 (en) 2014-03-28 2019-12-24 Samsung Electronics Co., Ltd. Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
ES2982894T3 (es) 2014-05-07 2024-10-18 Industry Univ Cooperation Foundationhanyang Univ Erica Campus Dispositivo para cuantificar el coeficiente predictivo lineal
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2538315A (en) * 2015-05-15 2016-11-16 Horseware Products Ltd A closure system for the front end of a horse rug
JP6475273B2 (ja) * 2017-02-16 2019-02-27 ノキア テクノロジーズ オーユー ベクトル量子化
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
BR112021013726A2 (pt) * 2019-01-13 2021-09-21 Huawei Technologies Co., Ltd. Método implementado por computador para realizar quantização residual, dispositivo eletrônico e meio legível por computador não transitório
KR20210133554A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
CN113408417B (zh) * 2021-06-18 2024-11-29 北京搜狗科技发展有限公司 一种公式识别方法、装置和用于公式识别的装置
CN118861658B (zh) * 2024-07-15 2024-12-27 江苏智慧工场技术研究院有限公司 识别射频数据信号的方法和系统及装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03228433A (ja) 1990-02-02 1991-10-09 Fujitsu Ltd 多段ベクトル量子化方式
JP3114197B2 (ja) 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JPH0815261B2 (ja) 1991-06-06 1996-02-14 松下電器産業株式会社 適応変換ベクトル量子化符号化法
JP3088163B2 (ja) 1991-12-18 2000-09-18 沖電気工業株式会社 Lsp係数の量子化方法
JPH05257498A (ja) * 1992-03-11 1993-10-08 Mitsubishi Electric Corp 音声符号化方式
JPH0677840A (ja) 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JP3239488B2 (ja) 1992-11-30 2001-12-17 三菱電機株式会社 画像帯域分割符号化装置および画像帯域分割符号化方法
US5398069A (en) * 1993-03-26 1995-03-14 Scientific Atlanta Adaptive multi-stage vector quantization
CN1038089C (zh) * 1993-05-31 1998-04-15 索尼公司 信号编码或译码装置及信号编码或译码方法
JPH0764599A (ja) 1993-08-24 1995-03-10 Hitachi Ltd 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08137498A (ja) * 1994-11-04 1996-05-31 Matsushita Electric Ind Co Ltd 音声符号化装置
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
JP3537008B2 (ja) 1995-07-17 2004-06-14 株式会社日立国際電気 音声符号化通信方式とその送受信装置
JPH09127987A (ja) 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP3159012B2 (ja) * 1995-10-26 2001-04-23 日本ビクター株式会社 音響信号の符号化装置及び復号化装置
JPH09281995A (ja) 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US5809459A (en) * 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置

Also Published As

Publication number Publication date
WO1998000837A1 (fr) 1998-01-08
JP3246715B2 (ja) 2002-01-15
CN1156822C (zh) 2004-07-07
CN1222997A (zh) 1999-07-14
EP0910067A1 (de) 1999-04-21
KR100283547B1 (ko) 2001-04-02
DE69724126D1 (de) 2003-09-18
US6826526B1 (en) 2004-11-30
ES2205238T3 (es) 2004-05-01
EP0910067B1 (de) 2003-08-13
KR20000010994A (ko) 2000-02-25
JPH1020898A (ja) 1998-01-23
EP0910067A4 (de) 2000-07-12

Similar Documents

Publication Publication Date Title
DE69724126T2 (de) Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE69529356T2 (de) Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69619054T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69810361T2 (de) Verfahren und Vorrichtung zur mehrkanaligen akustischen Signalkodierung und -dekodierung
DE69133458T2 (de) Verfahren zur Sprachquantisierung und Fehlerkorrektur
DE69227401T2 (de) Verfahren zum Kodieren und Dekodieren von Sprachsignalen
DE69614782T2 (de) Verfahren und Einrichtung zur Wiedergabe von Sprachsignalen und Verfahren zu seiner Übertragung
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE69518452T2 (de) Verfahren für die Transformationskodierung akustischer Signale
DE69029120T2 (de) Stimmenkodierer
DE69521164T2 (de) System zum Kodieren und Dekodieren von Signalen
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69625874T2 (de) Verfahren und Vorrichtung zur Wiedergabe von Sprachsignalen, zur Dekodierung, zur Sprachsynthese und tragbares Funkendgerät
DE69625880T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69214969T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hilfsinformationen zur Ausführung einer Suche in einem Kodebuch mit geringer Dichte
DE69331079T2 (de) CELP-Vocoder
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE3883799T2 (de) Codierungseinrichtung zur Sprachübertragung.
DE69625875T2 (de) Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE60133757T2 (de) Verfahren und vorrichtung zur kodierung von stimmloser sprache

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee