[go: up one dir, main page]

DE69328450T2 - Verfahren und Vorrichtung zur Sprachkodierung - Google Patents

Verfahren und Vorrichtung zur Sprachkodierung

Info

Publication number
DE69328450T2
DE69328450T2 DE69328450T DE69328450T DE69328450T2 DE 69328450 T2 DE69328450 T2 DE 69328450T2 DE 69328450 T DE69328450 T DE 69328450T DE 69328450 T DE69328450 T DE 69328450T DE 69328450 T2 DE69328450 T2 DE 69328450T2
Authority
DE
Germany
Prior art keywords
vector
gain
speech
output
gain factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69328450T
Other languages
English (en)
Other versions
DE69328450D1 (de
Inventor
Shinji Hayashi
Akitoshi Kataoka
Kazunori Mano
Satoshi Miki
Takehiro Moriya
Hitoshi Omuro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27465260&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69328450(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from JP04170895A external-priority patent/JP3087796B2/ja
Priority claimed from JP26519592A external-priority patent/JP2776474B2/ja
Priority claimed from JP4265194A external-priority patent/JP2853824B2/ja
Priority claimed from JP07053493A external-priority patent/JP3148778B2/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of DE69328450D1 publication Critical patent/DE69328450D1/de
Application granted granted Critical
Publication of DE69328450T2 publication Critical patent/DE69328450T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

    Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Sprachcodierungsverfahren und eine zugehörige Vorrichtung zur Durchführung einer hocheffizienten Sprachcodierung zur Verwendung in digitalen Zellentelephonsystemen. Genauer bezieht sich die vorliegende Erfindung auf ein Parametercodierungsverfahren und eine zugehörige Vorrichtung zum Codieren unterschiedlicher Typen von Parametern wie z. B. Spektralhülleninformationen und Leistungsinformationen bzw. Intensitätsinformationen, die im obenerwähnten Sprachcodierungsverfahren und in der zugehörigen Vorrichtung verwendet werden; die vorliegende Erfindung bezieht sich ferner auf ein Mehrstufen-Vektorquantisierungsverfahren und eine zugehörige Vorrichtung für die Durchführung einer Mehrstufen-Vektorquantisierung zur Verwendung im obenerwähnten Sprachcodierungsprozeß und in der zugehörigen Vorrichtung.
  • Stand der Technik
  • Seit kurzem sind auf solchen technischen Gebieten wie z. B. der digitalen Zellenübertragung und dem Sprachspeicherdienst mit dem Ziel der effektiven Nutzung elektrischer Signalform- und Speichermedien verschiedene hocheffiziente Codierungsverfahren in Gebrauch. Unter dieser Verschiedenen Codierungsverfahren stellen die code-erregte Linearprädiktionscodierung (CELP), die vektorsummen-erregte Linearprädiktionscodierung (VSELP) und die Mehrfachimpulscodierung hocheffiziente Codierungsverfahren dar, die Sprache mit einer Codierungsgeschwindigkeit von ungefähr 8 kb/s codieren.
  • Fig. 15 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches CELP-Codierungsverfahren verwendet. Das analoge Sprachsignal wird mit einer Abtastfrequenz von 8 kHz abgetastet, wobei die erzeugten Eingangssprachdaten von einem Eingangsanschluß 1 eingegeben werden. In einem Analyseabschnitt 2 zur Linearprädiktionscodierung (LPC) werden mehrere der vom Eingangsanschluß 1 eingegebenen Eingangssprachdatenabtastwerte zu einem Rahmen in einem Vektor codiert (im folgenden mit "ein Eingangssprachvektor" bezeichnet), wobei die Linearprädiktionsanalyse für diesen Eingangssprachvektor durchgeführt wird und anschließend die LPC-Koeffizienten berechnet werden. In einem LSP-Koeffizientenquantisierungsabschnitt 4 werden die LPC-Koeffizienten quantisiert, woraufhin die LPC-Koeffizienten eines Synthesefilters 3 eingestellt werden, das die Übertragungsfunktion {1/A(z)} besitzt.
  • Ein Adaptivcodebuch 5 wird so gebildet, daß mehrere Schrittweitenperiodenvektoren gespeichert werden, die den Schrittweitenperioden der Sprachintervalle in der Sprache entsprechen. In einem Verstärkungsfaktorabschnitt 6 wird ein Verstärkungsfaktor, der von einem später erläuterten Verzerrungsleistungs-Berechnungsabschnittsabschnitt 13 eingestellt wird, mit dem Schrittweitenperiodenvektor multipliziert, der aus dem Adaptivcodebuch 5 vom Verzerrungsleistungs-Berechnungsabschnitt 13 ausgewählt und ausgegeben wird, und wird anschließend vom Verstärkungsfaktorabschnitt 6 ausgegeben.
  • Mehrere Rauschsignalformvektoren (z. B. Zufallsvektoren), die den stimmlosen Intervallen in der Sprache entsprechen, werden im voraus in einem Zufallscodebuch 7 gespeichert. In einem Verstärkungsfaktorabschnitt 8 wird der vom Verzerrungsleistungs-Berechnungsabschnitt 13 einge stellte Verstärkungsfaktor mit dem Rauschsignalformvektor multipliziert, der vom Verzerrungsleistungs-Berechnungsabschnitt 13 aus dem Zufallscodebuch 7 ausgewählt und ausgegeben wird, und wird vom Verstärkungsfaktorabschnitt 8 ausgegeben.
  • In einem Addierer 9 werden der Ausgangsvektor des Vanstärkungsfaktorabschnitts 6 und der Ausgangsvektor des Verstärkungsfaktorabschnitts 8 addiert, wobei der Ausgangsvektor des Addierers 9 anschließend als Erregungsvektor dem Synthesefilter 3 zugeführt wird. Im Synthesefilter 3 wird der Sprachvektor (im folgenden mit "synthetischer Sprachvektor" bezeichnet) auf der Grundlage des gesetzten LPC-Koeffizienten synthetisiert.
  • Außerdem wird in einem Leistungs- bzw. Intensitätsquantisierungsabschnitt 10 zuerst die Leistung bzw. die Intensität des Eingangssprachvektors berechnet, woraufhin diese Leistung quantisiert wird. Auf diese Weise werden unter Verwendung der quantisierten Leistung des Eingangssprachvektors der Eingangssprachvektor und der Schrittweitenperiodenvektor normiert. In einem Subtrahierer 11 wird der synthetische Sprachvektor vom normierten Eingangssprachvektor, der vom Leistungsquantisierungsabschnitt 10 ausgegeben worden ist, subtrahiert, womit die Verzerrungsdaten berechnet werden.
  • Anschließend werden die Verzerrungsdaten in einem perzeptualen Gewichtungsfilter 12 entsprechend den Koeffizienten gewichtet, die den perzeptualen Eigenschaften von Menschen zugeordnet werden. Das obenerwähnte perzeptuale Gewichtungsfilter 12 verwendet eine Maskierungswirkung der perzeptualen Eigenschaften von Menschen und reduziert die Hörbereiche des quantisierten Zufallsrauschens im Formantenbereich der Sprachdaten.
  • Ein Verzerrungsleistungs-Berechnungsabschnitt 13 berechnet die Leistung der Verzerrungsdaten, die vom perzeptualen Gewichtungsfilter 12 ausgegeben werden, wählt den. Schrittweitenperiodenvektor und den Rauschsignalformvektor, die die Leistung der Verzerrungsdaten minimieren, aus dem Adaptivcodebuch 5 bzw. dem Zufallscodebuch 7 und setzt die Verstärkungsfaktoren in den jeweiligen Verstärkungsfaktorabschnitten 6 und 8. Auf diese Weise werden die Informationen (Codes) und Verstärkungsfaktoren, die entsprechend den LPC-Koeffizienten ausgewählt worden sind, die Leistung des Eingangssprachvektors, des Schrittweitenperiodenvektors und des Rauschsignalformvektors zu Codes aus Bitserien umgesetzt, ausgegeben und anschließend übertragen.
  • Fig. 16 ist ein Blockschaltbild, das ein Konstruktionbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches VSELP-Codierungsverfahren verwendet. In dieser Fig. 16 behalten die Komponenten, die denjenigen der Fig. 15 entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. Wie in Fig. 16 gezeigt, ist der Aufbau dieser Sprachcodierungsvorrichtung, die das VSELP-Codierungsverfahren verwendet, insgesamt derjenigen der obenerwähnter Sprachcodierungsvorrichtung ähnlich, die das CELP-Codierungsverfahren verwendet. Statt jedoch wie im CLP-Codierungsverfahren jeden separaten Verstärkungsfaktor mit dem ausgewählten Schrittweitenperiodenvektor bzw. dem Rauschsignalformvektor zu multiplizieren, verwendet das VSELP- Codierungsverfahren ein Vektorquantisierungsverfahren, das gleichzeitig die Verstärkungsfaktoren ermittelt, die mit dem ausgewählten Schrittweitenperiodenvektor bzw. dem Rauschsignalformvektor multipliziert werden sollen, und setzt diese in die Verstärkungsfaktorabschnitte 15a und 15b eines Verstärkers 15 ein, um die Quantisierungseffizienz zu steigern.
  • Die genauen Einzelheiten des (I) CLP-Codierungsverfahrens, (2) VSELP-Codierungsverfahrens und (3) des Mehrfachimpuls-Codierungsverfahrens können gefunden werden, indem entsprechend Bezug genommen wird auf (I) Schroeder, M. R., u. a., (Code-Excited Linear Prediction (CELP): High-quality Speech at Very Low Rates: Proc. ICASSP '85, 25.1.1, S. 937-940, 1985), (2) Gerson, I. A., u. a., (Vector Sum Excited Linear Prediction (VSELP) Speech Cocing at 8 kps: Proc. ICASSP '90, S9.3, S. 461-464, 1990), und (3) Ozawa, u. a., (9.6-4.8 kbit/s Multi-pass Speech Coding Method Using Pitch Information [übersetzt]: Shingakushi (D-II), J72-D-II, 8, S. 1125-1132, 1989).
  • Außerdem ist ein code-erregtes Linearprädiktionscodierungsverfahren mit geringer Verzögerung (LD-CELP) ein hocheffizientes Codierungsverfahren, das Sprache mit einer Codierungsgeschwindigkeit von 16 kb/s codiert, wobei aufgrund der Verwendung eines Rückwärtsprädiktionsverfahrens in bezug auf die LPC-Koeffizienten und die Leistung des Eingangssprachvektors die Übertragung der LPC-Koeffizientencodes und der Leistungscodes des Eingangssprachvektors nicht erforderlich ist. Fig. 17 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die das herkömmliche LD- CELP-Codierungsverfahren verwendet. In dieser Fig. 17 behalten die Komponenten, die denjenigen der Fig. 15 entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird.
  • In einem LPC-Analyseabschnitt 16 werden die Linearprädiktionsanalyse und die Berechnung der LPC-Koeffizienten des Synthesefilters 3 nicht für die Eingangssprachdaten durchgeführt, die vom Eingangsanschluß 1 eingegeben worden sind und sich in dem Rahmen befinden, der momentan der Quantisierung unterworfen wird. Statt dessen wird eine höhere Linearprädiktionsanalyse der 50. Ordnung durchgeführt, die die Schrittweitenperiodizität der Sprache einschließt, wobei die LPC-Koeffizienten des Analysefilters 3 für den vorher verarbeiteten Ausgangsvektor des Synthesefilters 3 berechnet und ermittelt werden. Auf diese Weise werden die ermittelten LPC-Koeffizienten in den Synthesefilter 3 eingesetzt.
  • In ähnlicher Weise wird bei dieser Sprachcodierungsvorrichtung, nachdem die Berechnung der Leistung der Eingangssprachdaten im Rahmen im Leistungsquantisierungsabschnitt 10 der Quantisierung unterworfen worden sind, die Quantisierung dieser Leistung nicht durchgeführt, wie in der in Fig. 15 gezeigten Sprachcodierungsvorrichtung. Statt dessen wird in einem Verstärkungsfaktor-Anpassungsabschnitt 17 eine Linearprädiktionsanalyse für die vorher verarbeitete Leistung des Ausgangsvektors vom Verstärkungsfaktorabschnitt 8 durchgeführt, wobei die Leistung (mit anderen Worten der vorhergesagte Verstärkungsfaktor), die dem ausgewählten Rauschsignalformvektor in der momentanen Rahmenoperation zur Verfügung gestellt werden soll, berechnet, ermittelt und anschließend in den Vorhersageverstärkungsfaktorabschnitt 18 eingesetzt wird.
  • Folglich wird im Vorhersageverstärkungsfaktorabschnitt 18 der vorhergesagte Verstärkungsfaktor, der vom Verstärkungsfaktor-Anpassungsabschnitt 17 eingestellt worden ist, mit dem Rauschsignalformvektor multipliziert, der vom Verzerrungsleistungs-Berechnungsabschnitt 13 aus dem Zufallscodebuch 7 ausgewählt und ausgegeben worden ist. Anschließend wird der vom Verzerrungsleistungs-Berechnungsabschnitt 13 eingestellte Verstärkungsfaktor mit dem Ausgangsvektor vom Vorhersageverstärkungsfaktorabschnitt 18 im Verstärkungsfaktorabschnitt 8 multipliziert und anschließend ausgegeben. Der Ausgangsvektor des Verstärkungsfaktorabschnitts 8 wird anschließend als Erregungs vektor dem Synthesefilter 3 zugeführt, wobei im Synthesefilter 3 auf der Grundlage der gesetzten LPC-Koeffizienten ein synthetischer Sprachvektor synthetisiert wird.
  • Anschließend wird im Subtrahierer 11 der synthetische Sprachvektor vom Eingangssprachvektor subtrahiert, wobei die Verzerrungsdaten berechnet werden. Nachdem diese Verzerrungsdaten im perzeptualen Gewichtungsfilter 12 unter Verwendung der Koeffizienten, die den menschlichen perzeptualen Eigenschaften zugeordnet sind, gewichtet worden sind, wird die Leistung der aus dem perzeptualen Gewichtungsfilter 12 ausgegebenen Verzerrungsdaten berechnet, der Rauschsignalformvektor, der die Leistung der Verzerrungsdaten minimiert, aus dem Zufallscodebuch 7 ausgewählt und anschließend der Verstärkungsfaktor im Verstärkungsfaktorabschnitt 8 gesetzt. Auf diese Weise werden im Codeausgabeabschnitt 14 die Codes und Verstärkungsfaktoren, die entsprechend den Rauschsignalformvektoren ausgewählt worden sind, in Codes von Bitserien umgesetzt, ausgegeben und anschließend übertragen.
  • Wie oben beschrieben, ist beim herkömmlichen LD-CELP-COdierungsverfahren diese Übertragung der LPC-Koeffizienten und der Leistung des Eingangssprachvektors unnötig, da die im voraus von beiden Sprachcodierungs- und Decodierungsvorrichtungen verarbeiteten synthetischen Sprachvektoren gemeinsam verwendet werden können.
  • Weitere Einzelheiten des LD-CELP-Codierungsverfahrens können gefunden werden unter Bezugnahme auf (2) Chen, J., (High Quality 16 kb/s Speech Coding with a One-Way Delay Less Than 2 ms: Proc. ICASSP '90, 33, S9.1, 1990).
  • Unter den obenerwähnten herkömmlichen Sprachcodierungsverfahren werden bei der CLP-Sprachcodierung die Linearprädiktionsanalyse durchgeführt, die LPC-Koeffizienten des Synthesefilters 3 berechnet und diese LPC-Koeffizienten anschließend nur für die Eingangssprachdaten in dem momentan der Quantisierung unterworfenen Rahmen quantisiert. Es besteht somit der Nachteil, daß, um beim Übertragungsempfänger hochqualitative, decodierte Sprache zu erhalten (im folgenden mit "die decodierte Sprache" bezeichnet), für die LPC-Koeffizientenquantisierung eine große Anzahl von Bits erforderlich ist.
  • Außerdem wird die Leistung des Eingangssprachvektors quantisiert, wobei der als Antwort auf die quantisierte Leistung des Eingangssprachvektors ausgewählte Code als Codierungssignal übertragen wird, wodurch in dem Fall, in dem auf der Übertragungsleitung ein Übertragungsfehler des Codes auftritt, insofern Probleme bestehen, als in den stimmlosen Intervallen der decodierten Sprache eine unerwünschte Sprache erzeugt wird, wobei die gewünschte Sprache häufig unterbrochen wird, wodurch decodierte Sprache mit geringer Qualität erzeugt wird. Außerdem wird die Quantisierung der Leistung des Eingangssprachvektors unter Verwendung einer begrenzten Anzahl von Bits durchgeführt, wodurch in dem Fall, indem die Größe des Eingangssprachvektors klein ist, der Nachteil besteht, daß das Quantisierungsrauschen zunimmt.
  • Ferner wird der Rauschsignalformvektor durch einen Rauschsignalformvektor dargestellt, der in einem Zufallscodebuch 7 gespeichert ist, wobei der als Antwort auf diesen Rauschsignalformvektor ausgewählte Code als Codierungssignal übertragen wird, so daß in dem Fall, in dem auf der Übertragungsleitung ein Übertragungsfehler des Codes auftritt, in der Sprachdecodierungsvorrichtung des Übertragungsempfängers ein völlig anderer Rauschsignalformvektor verwendet wird, wodurch eine decodierte Sprache mit geringer Qualität erzeugt wird.
  • Außerdem verwendet der im Zufallscodebuch zu speichernde Rauschsignalformvektor normalerweise eine Sprachdatenbasis, in der eine große Menge an wirklichen Sprachdaten gespeichert ist, und führt ein Lernen aus, um sich diesen wirklichen Sprachdaten anzupassen. In dem Fall jedoch, in dem der Rauschsignalformvektor durch einen Rauschsignalformvektor eines Zufallscodebuches 7 dargestellt wird, ist eine große Speicherkapazität erforderlich, weshalb die Größe des Codebuches sehr groß wird. Folglich besteht der Nachteil, daß das obenerwähnte Lernen nicht durchgeführt wird und der Rauschsignalformvektor nicht gut an die wirklichen Sprachdaten angepaßt wird.
  • Außerdem werden im obenerwähnten herkömmlichen VSELP-Codierungsverfahren in dem Fall, in dem ein Übertragungsfehler des Codes vorliegt, der dem Verstärkungsfaktor entspricht, der mit dem Schrittweitenperiodenvektor und dem Rauschsignalformvektor zu multiplizieren ist, die gleichzeitig auf der Leitung gesetzt sind, dieser Schrittweitenperiodenvektor und der Rauschsignalformvektor in der Sprachdecodierungsvorrichtung des Übertragungsempfängers mit einem völlig anderen Verstärkungsfaktor multipliziert, wodurch eine decodierte Sprache mit geringer Qualität erzeugt wird.
  • Ferner werden bei den obenerwähnten herkömmlichen CELP und VSELP-Codierungsverfahren der Schrittweitenperiodenvektor und der Rauschsignalformvektor, die die Leistung der Verzerrungsdaten minimieren, aus dem Adaptivcodebuch 5 bzw. dem Zufallscodebuch 7 ausgewählt. Da jedoch die Leistung der Verzerrungsdaten d, wie in einer Formel (1) unten gezeigt, in einer geschlossenen Schleife, die mittels der Strukturelemente 3, 5-9 und 11-13 oder der Strukturelemente 3, 5, 7, 9, 11-13 und 15 gebildet wird, im Verzerrungsleistungs-Berechnungsabschnitt 13 für alle Schrittweitenperiodenvektoren und Rauschsignalformvekto ren, die im Adaptivcodebuch 5 bzw. im Zufallscodebuch 7 gespeichert sind, berechnet werden muß, um den optimalen Schrittweitenperiodenvektor und den optimalen Rauschsignalformvektor auszuwählen, ergeben sich insofern Nachteile, als eine hohe Berechnungskomplexität erforderlich ist.
  • d = X - gHVj ² (1)
  • In der Formel (1) wird der Eingangssprachvektor, dessen Leistung quantisiert ist, durch X dargestellt; der Schrittweitenperiodenvektor oder der Rauschsignalformvektor, die aus dem Adaptivcodebuch 7 bzw. dem Zufallscodebuch 5 ausgewählt werden, werden durch Vj (j = 1 - N; N ist die Codebuchgröße) dargestellt; der in den Verstärkungsfaktorabschnitten 6 und 8 oder in den Verstärkungsfaktorabschnitten 15a und 15b eingestellte Verstärkungsfaktor wird durch g dargestellt; die Impulsantwortkoeffizienten, die in dem Fall, in dem das Synthesefilter 3 und das perzeptuale Gewichtungsfilter 12 von einem FIR-Filter gebildet werden, die Koeffizienten es FIR-Filters darstellen, werden durch H dargestellt; und die Verzerrungsdaten werden durch d dargestellt.
  • Andererseits wird im obenerwähnten herkömmlichen LD-CELP- Codierungsverfahren während der Berechnung der LPC-Koeffizienten des Synthesefilters 3 ein Rückwärtsprädiktionsverfahren verwendet, bei dem die Linearprädiktionsanalyse nur für den vorher verarbeiteten synthetischen Sprachvektor durchgeführt wird. Somit ist im Vergleich zu den in den obenerwähnten CELP- und VSELP-Codierungsverfahren verwendeten Vorwärtsprädiktionsverfahren der Prädiktionsfehler groß. Als Folge hiervon treten bei einer Codierungsgeschwindigkeit von ungefähr 8 kb/s plötzliche Anstiege in der Signalformverzerrung auf, die ihrerseits eine decodierte Sprache von geringer Qualität erzeugen.
  • Bei den obenerwähnten herkömmlichen hocheffizienten Codierungsverfahren werden mehrere Abtastwerte jedes Parametertyps von den Informationen, die sich auf die Spektralhüllkurven, die Leistung und ähnliches beziehen, als ein Rahmen in einem Vektor gesammelt, im jeweiligen Rahmen codiert und anschließend übertragen. Außerdem sind bei den obenerwähnten herkömmlichen hocheffizienten Codierungsverfahren Verfahren zum Erhöhen der Rahmenaktualisierungsperiode und zum Quantisieren der Unterschiede zwischen dem aktuellen Rahmen und dem vorangehenden Rahmen sowie der vorhergesagten Werte bekannt, um die Informationskompressionseffizienz zu steigern.
  • Wenn jedoch die Rahmenaktualisierungsperiode 40 ms oder mehr beträgt, tritt das Problem auf, das die Codierungsverzerrung aufgrund der Unfähigkeit des Systems, Änderungen in den Spektraleigenschaften der Sprachsignalform sowie Schwankungen der Leistung zu verfolgen, zunimmt. Wenn außerdem die Parameter durch Codierungsfehler zerstört werden, werden in der codierten Sprache Verzerrungen über lange Intervalle erzeugt.
  • Wenn andererseits die Unterschiede zwischen den Parametern des aktuellen und der vergangenen Rahmen und die vorhergesagten Werte quantisiert werden, werden selbst im Fall kurzer Rahmenaktualisierungsperioden die Verwendung einer Zeitkontinuität der Parameter und eine Informationskompression möglich. Jedoch besteht der Nachteil, daß die Auswirkungen von vergangenen Codierungsfehlern sich weiterhin über lange Zeitperioden ausbreiten.
  • Ferner wird in den in den Fig. 15 und 16 gezeigten obenerwähnten Sprachcodiererungsvorrichtungen im LSP-Koeffizientenquantisierungsabschnitt 4 eine Quantisierung durchgeführt, nachdem die LPC-Koeffizienten, die im LPC- Analyseabschnitt 2 ermittelt worden sind, in die LSP-Parameter umgesetzt worden sind, wobei die quantisierten LSP-Parameter anschließend wieder zurück in die LPC-Koeffizienten umgesetzt werden. Während diese LSP-Parameter quantisiert werden, bewirkt ein Vektorquantisierungsverfahren die Quantisierung eines Bits oder weniger je Abtastwert. Bei diesem Vektorquantisierungsverfahren wird wie in Fig. 18 gezeigt im Verzerrungs-Berechnungsabschnitt 19 der LSP-Codevektor, der die geringste Verzerrung vom LSP-Parametervektor besitzt, der aus mehreren Abtastwerten der LSP-Parameter zu bilden ist, aus dem Codebuch 20 ausgewählt, wobei dessen Code übertragen wird. Auf diese Weise ist es durch Ausbilden des Codebuchs 20 in Übereinstimmung mit der Quantisierung möglich, die LSP-Parameter mit kleiner Verzerrung zu quantisieren.
  • Da jedoch sowohl die Speicherkapazität des Codebuches 20 als auch die Berechnungskomplexität bei der Berechnung der Verzerrung entsprechend der Exponentialfunktion der Anzahl der Quantisierungsbits zunehmen, ist es schwierig, die Quantisierung einer großen Anzahl von Bits zu bewerkstelligen. Diesbezüglich stellt ein Mehrstufen-Vektorquantisierungsverfahren einen Weg dar, mit dem dieses Problem gelöst werden kann. Das heißt, das Codebuch 20 wird aus mehreren Codebüchern gebildet, wobei im Codierungsabschnitt im LSP-Koeffizientenquantisierungsabschnitt 4 der Quantisierungsfehler, der bei der Vektorquantisierung eines bestimmten Schritts auftritt, als Eingangsvektor bei der Vektorquantisierung des nächsten Schritts Verwendet wird. Im Decodierungsabschnitt des LSP-Koeffizientenquantisierungsabschnitts 4 wird dann der Ausgangsvektor gebildet, indem mehrere der LSP-Codevektoren addiert werden, die aus den mehreren Codebüchern ausgewählt worden sind. Auf diese Weise wird die Vektorquantisierung möglich, während die Speicherkapazität und die Berechnungskomplexität auf realistische Bereiche be schränkt werden. Bei diesem Mehrstufen-Vektorquantisierungsverfahren wird jedoch im Vergleich zum idealen Einstufen-Vektorquantisierungsverfahren eine Verzerrung mit beträchtlichem Anteil beobachtet.
  • Der Grund für die große Verzerrung bei diesem Mehrstufen- Vektorquantisierungsverfahren wird im folgenden mit Bezug auf die Fig. 19 bis 22 erläutert. Erstens, um das Synthesefilter 3 stabil zu erregen, in das der LSP-Parametervektor eingesetzt wird, müssen die Werte der LSP-Parameter ω1 bis ωp, die den LSP-Parametervektor der Dimension p bilden, die durch die folgende Formel (2) gegebene Beziehung erfüllen.
  • 0 < &omega;&sub1; < &omega;&sub2; < ... < &omega;p < &pi; (2)
  • Fig. 19 zeigt einen Fall, in dem ein LSP-Parametervektor zweiter Ordnung, d. h. p = 2, verwendet wird. Die LSP-Parameter müssen gemäß Formel (2) innerhalb des in Fig. 19 gezeigten stabilen Dreieckbereichs A1 liegen. Gemäß den statistischen Eigenschaften von Sprache ist außerdem die Erwartung der LSP-Parameter hoch, die in dem schrägen Bereich liegen, der mit A2 bezeichnet ist.
  • Im folgenden wird mit Bezug auf das in Fig. 20 gezeigte Flußdiagramm der Ablauf der Prozeduren des LSP-Koeffizientenquantisierungsabschnitts 4 im Fall der Durchführung der Vektorquantisierung dieser LSP-Parameter erläutert. Um ferner die Speicherkapazität des Codebuches 20 zu reduzieren, wird der LSP-Codierungsvektor als die Summe von zwei Vektoren dargestellt. Das Codebuch 20 wird somit von einem ersten Codebuch #1 und einem zweiten Codebuch #2 gebildet. In diesem Codierungsabschnitt wird im Schritt SA1 ein erstes 3-Bit-Codebuch #1 ähnlich dem Eingangsvektor gebildet. Auf diese Weise kann ein in Fig. 21 gezeigter, rekonstruierter Vektor V1 erhalten werden. An schließend wird eine zweite Vektorquantisierung des Quantisierungsfehlers durchgeführt, der während der Quantisierung im Schritt SA1 aufgetreten ist. Das heißt, in dem in Fig. 20 gezeigten Schritt SA2 wird die Gruppe der rekonstruierten Vektoren V2, die innerhalb des in Fig. 22 gezeigten kreisförmigen Bereiches liegen (d. h. die Inhalte des zweiten Codebuches #2) zentral mit dem rekonstruierten Vektor V1 kombiniert, der durch die erste Vektorquantisierung ausgewählt worden ist, wodurch ein Ausgangspunkt gebildet wird. Wenn wie in Fig. 22 gezeigt zwei Ausgangsvektoren des Codebuches #1 bzw. des Codebuches #2 addiert werden, kann ein Ausgangspunkt in einem Bereich gebildet werden, der ursprünglich nicht vorhanden war. Folglich wird im Schritt SA3 beurteilt, ob der addierte Vektor stabil oder instabil ist, wobei instabile Vektoren vom Prozeß ausgeschlossen werden. Im Schritt SA1 werden die Verzerrung des Eingangsvektors und der obenerwähnten rekonstruierte Vektor berechnet. Anschließend wird im Schritt SA5 ein Vektor ermittelt, der die obenerwähnte Verzerrung minimiert, wobei dessen Code zum Decodierungsabschnitt des LSP-Koeffizientenquantisierungsabschnitts 4 übertragen wird.
  • Auf diese Weise wird im Decodierungsabschnitt im Schritt SA6 das Codebuch #1 verwendet, um einen ersten Ausgangsvektor zu ermitteln, wobei im Schritt SA7 ein zweiter Ausgangsvektor, der im Codebuch #2 enthalten ist, zu diesem obenerwähnten ersten Ausgangsvektor addiert wird, um den endgültigen Ausgangsvektor zu erhalten.
  • Wie oben erwähnt bestehen bei den herkömmlichen Codierungsprozessen folglich insofern Probleme, als neben dem Ausschließen des instabilen Vektors keine alternativen zur Verfügung stehen, was zu einer Verschwendung von Informationen führt.
  • Ein Artikel mit dem Titel "Multiple Stage Vector Quantization for Speech Coding", von Bing-Hwang Duang und A. H. Gray, J2 (1982, IEEE), bezieht sich auf das Mehrstufen- Vektorquantisierungsverfahren.
  • Zusammenfassung der Erfindung
  • Die Erfindung ist durch die beigefügten Ansprüche definiert.
  • Im Hinblick auf das Obenerwähnte ist es eine erste Aufgabe der vorliegenden. Erfindung, ein Sprachcodierungsverfahren und eine zugehörige Vorrichtung zu schaffen, bei denen selbst in dem Fall, in dem auf der Übertragungsleitung Übertragungsfehler auftreten, eine hochqualitative Sprachcodierung und -decodierung mit einer niedrigen Codierungsgeschwindigkeit möglich ist, die durch die obenerwähnten Fehler kaum beeinträchtigt wird. Außerdem ist es eine zweite Aufgabe der vorliegenden Erfindung, ein Parametercodierungsverfahren und eine zugehörige Vorrichtung zu schaffen, die dann, wenn unterschiedliche Typen von Parametern, wie z. B. diejenigen von Spektralhüllkurveninformationen, Leistungsinformationen und dergleichen, mit niedriger Codierungsgeschwindigkeit codiert werden, die Übertragung von Codierungsfehlern verhindern, eine vergleichsweise kurze Rahmenaktualisierungsperiode beibehalten und fähig sind, die Quantisierungsverzerrung durch Nutzung der Zeitkontinuität der Parameter zu reduzieren. Ferner ist es eine dritte Aufgabe der vorliegenden Erfindung, ein Mehrstufen-Vektorquantisierungsverfahren und eine zugehörige Vorrichtung zu schaffen, die fähig sind, das Aufkommen einer Quantisierungsverzerrung zu unterdrücken, während die Speicherkapazität des Codebuche klein gehalten wird.
  • Um die erste Aufgabe zu lösen, schafft die Vorliegende Erfindung ein Sprachcodierungsverfahren zum Codieren von Sprachdaten, die mehrere Abtastwerte als Einheit einer Rahmenoperation umfassen, wobei: die mehreren Abtastwerte der Sprachdaten durch eine Linearprädiktionsanalyse analysiert werden und somit Prädiktionskoeffizienten berechnet werden und quantisiert werden; die quantisierten Prädiktionskoeffizienten in ein Synthesefilter eingesetzt werden; der synthetisierte Sprachvektor synthetisiert wird, indem das Synthesefilter mit einem Schrittweitenperiodenvektor erregt wird, der aus einem Adaptivcodebuch ausgewählt wird, in dem mehrere Schrittweitenperiodenvektoren gespeichert sind, und der mit einem ersten Verstärkungsfaktor und mit einem Rauschsignalformvektor multipliziert wird, der aus einem Zufallscodebuch ausgewählt wird, in dem mehrere Rauschsignalformvektoren gespeichert sind, und mit einem zweiten Verstärkungsfaktor multipliziert wird; und wobei das Verfahren das Auswählen der ersten und zweiten Verstärkungsfaktoren zum gleichen Zeitpunkt, das Vorsehen eines Multiplizierers zum Multiplizieren des ausgewählten Rauschsignalformvektors mit einem vorhergesagten Verstärkungsfaktor sowie das Vorhersagen des vorhergesagten Verstärkungsfaktors umfaßt, der mit dem Rauschsignalformvektor multipliziert wird, der in einer nachfolgenden Rahmenoperation ausgewählt wird, und auf dem aktuellen Rauschsignalformvektor basiert, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der aktuellen Rahmenoperation multipliziert wird und auf dem vorangehenden Rauschsignalformvektor basiert, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der vorangegangenen Rahmenoperation multipliziert worden ist.
  • Die vorliegende Erfindung schafft ferner eine Sprachcodierungsvorrichtung zum Codieren von Sprachdaten, die mehrere Abtastwerte als Einheit einer Rahmenoperation umfassen, wobei: die mehreren Abtastwerte der Sprachdaten durch eine Linearprädiktionsanalyse analysiert werden und somit Prädiktionskoeffizienten berechnet und quantisiert werden; die quantisierten Prädiktionskoeffizienten in ein Synthesefilter eingesetzt werden; der synthetische Sprachvektor synthetisiert wird, indem das Synthesefilter mit einem Schrittweitenperiodenvektor erregt wird, der aus einem Adaptivcodebuch ausgewählt worden ist, in dem mehrere Schrittweitenperiodenvektoren gespeichert sind, und der mit einem ersten Verstärkungsfaktor und mit einem Rauschsignalformvektor, der aus einem Zufallscodebuch ausgewählt worden ist, in dem mehrere Rauschsignalformvektoren gespeichert sind, multipliziert wird und mit einem zweiten Verstärkungsfaktor multipliziert wird; und wobei die Vorrichtung einen Verstärkungsfaktorvorhersageabschnitt zum Multiplizieren des ausgewählten Rauschsignalformvektors mit einem vorhergesagten Verstärkungsfaktor; einen Verstärkungsfaktorabschnitt zum Multiplizieren des ausgewählten Schrittweitenperiodenvektors und eines aus dem Verstärkungsfaktorvorhersageabschnitt abgeleiteten Ausgangsvektors unter Verwendung des ersten bzw. zweiten Verstärkungsfaktors, eine Verzerrungsberechnungsvorrichtung zum entsprechenden Auswählen des Schrittweitenperiodenvektors und des Rauschsignalformvektors und zum gleichzeitigen Einstellen der ersten und zweiten Verstärkungsfaktoren, so daß eine Quantisierungsverzerrung zwischen einem Eingangssprachvektor, der mehrere Abtastwerte der Sprachdaten enthält, und einem synthetischen Sprachvektor minimiert wird; und eine Verstärkungsfaktor- Anpassungsvorrichtung zum Vorhersagen des vorhergesagten Verstärkungsfaktors umfaßt, der mit dem in der nachfolgenden Rahmenoperation ausgewählten Rauschsignalformvektor multipliziert werden soll und auf dem aktuellen Rauschsignalformvektor, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der aktuellen Rahmenoperation multipliziert wird, und auf dem vorangehenden Rauschsignalformvektor basiert, der in der vorangegangenen Rahmenoperation mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor multipliziert worden ist.
  • Gemäß diesem Verfahren und der zugehörigen Vorrichtung ist selbst in dem Fall, in dem auf der Übertragungsleitung Übertragungsfehler auftreten, eine hochqualitative Sprachcodierung und -decodierung mit einer niedrigen Codierungsgeschwindigkeit möglich, die durch die obenerwähnten Fehler kaum beeinträchtigt wird.
  • Um die zweite Aufgabe zu lösen, schafft die vorliegende Erfindung ein Parametercodierungsverfahren für Sprache zum Quantisieren von Parametern wie z. B. den Spektralhüllkurveninformationen und der Leistungsinformationen in einer Einheit einer Rahmenoperation, die mehrere Abtastwerte von Sprachdaten umfaßt, wobei das Verfahren in einem Codierungsabschnitt, in dem der Parameter quantisiert wird, versehen ist mit den Schritten (a) Darstellen des resultierenden quantisierten Parametervektors durch das gewichtete Mittel eines prospektiven Parametervektors, der aus einem Parameter-Codebuch ausgewählt worden ist, in dem mehrere prospektive Parametervektoren gespeichert sind, in der aktuellen Rahmenoperation und eines Teils des prospektiven Parametervektors, der aus dem Parameter- Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist, (b) Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß eine Quantisierungsverzerrung zwischen dem quantisierten Parametervektor und einem Eingangsparametervektor minimiert wird, und (c) Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und in einem Decodierungsabschnitt versehen ist mit den Schritten (a) Berechnen des gewichteten Mittels des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, und des prospektiven Parametervektors in der vorangegangenen Rahmenoperation, und (b) Ausgeben des resultierenden Vektors.
  • Außerdem schafft die vorliegende Erfindung eine Parametercodierungsvorrichtung für Sprache zum Quantisieren vor Parametern, wie z. B. den Spektralhüllkurveninformationen und der Leistungsinformationen, als Einheit einer Rahmenoperation, die mehrere Abtastwerte von Sprachdaten umfaßt, wobei die Vorrichtung einen Codierungsabschnitt enthält, der versehen ist mit (a) einem Parameter-Codebuch zum Speichern mehrerer Prädiktionsparametervektoren und (b) einem Vektorquantisierungsabschnitt zum Berechnen des gewichteten Mittels des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist, des Teils des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist, Verwenden des resultierenden Vektors als resultierenden, quantisierten Parametervektor der Quantisierung der Prädiktionskoeffizienten, Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß eine Quantisierungsverzerrung zwischen dem quantisierten Parametervektor und einem Eingangsparametervektor minimiert wird, und Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und einem Decodierungsabschnitt zum Berechnen des gewichteten Mittels des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, und des prospektiven Parametervektors in der vorangegangenen Rahmenoperation und Ausgeben des resultierenden Vektors.
  • Gemäß diesem Verfahren und der zugehörigen Vorrichtung stellt der Codierungsabschnitt den resultierenden quanti sierten Parametervektor durch die gewichteten Mittel des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist, und durch den Teil des prospektiven Parametervektors dar, der aus dem Parameter-Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist. Anschließend wählt der Codierungsabschnitt den prospektiven Parametervektor aus dem Parameter-Codebuch aus, so daß die quantisierte Verzerrung zwischen dem quantisierten Parametervektor und dem Eingangsparametervektor minimiert wird. Ferner überträgt der Codierungsabschnitt den Vektorcode, der dem ausgewählten prospektiven Parametervektor entspricht. Außerdem berechnet der Decodierungsabschnitt das gewichtete Mittel des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Parameteroperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, sowie des prospektiven Parametervektors in der vorangegangenen Rahmenoperation und gibt den resultierenden Vektor aus.
  • Da gemäß der vorliegenden Erfindung an den jeweiligen Rahmen übertragen wird nur der Code, der einem Parameter- Codebuch zugeordnet ist, bleibt die Menge der übertragenen Information selbst dann klein, wenn die Rahmenlänge verkürzt ist. Außerdem kann die Quantisierungsverzerrung reduziert werden, wenn die Kontinuität zum vorangegangenen Rahmen hoch ist. Selbst in dem Fall, in dem Codierungsfehler auftreten, ist die Auswirkung der Codierungsfehler klein, da der prospektive Parametervektor in der aktuellen Rahmenoperation auf einen prospektiven Parametervektor in der vorangegangenen Rahmenoperation abgestimmt wird. Außerdem kann sich die Auswirkung der Codierungsfehler in der aktuellen Rahmenoperation nur bis zu zwei Rahmenoperationen nach vorne erstrecken. Wenn Codierungsfehler unter Verwendung eines redundanten Codes detektiert werden können, wird der Parameter mit Fehlern ausgeschlossen, wobei durch Berechnung des obenbeschriebenen Mittels die Wirkung der Fehler ebenfalls reduziert werden kann.
  • Um die dritte Aufgabe zu lösen, schafft die vorliegende Erfindung ein Mehrstufen-Vektorquantisierungsverfahren zum Auswählen des prospektiven Parametervektors aus einem Parameter-Codebuch, so daß die Quantisierungsverzerrung zwischen dem prospektiven Parametervektor und einem Eingangsparametervektor minimiert wird, ein Vektorcode übertragen wird, der dem ausgewählten prospektiven Parametervektor entspricht, und wobei das Verfahren in einem Codierungsabschnitt versehen ist mit den Schritten (a) Darstellen des prospektiven Parametervektors durch die Summe der Unterparametervektoren, die jeweils aus den Stufen der Unterparameter-Codebücher ausgewählt worden sind (b) entsprechendes Auswählen der Unterparametervektoren aus den Stufen der Unterparameter-Codebücher, (c) Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, (d) Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, (e) Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, (f) Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß die Quantisierungsverzerrung minimiert wird, und (g) Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und das in einem Decodierungsabschnitt versehen ist mit den Schritten (a) entsprechendes Auswählen der Unterparametervektoren, die dem übertragenen Vektorcode entsprechen, aus den Stufen der Unterparameter-Codebücher, (b) Addieren der ausge wählten Unterparametervektoren, um dem prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, (c) Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, (d) Umsetzen des prospektiven Parametervektors unter Verwendung der fester Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, und (e) Verwenden des umgesetzten prospektiven Parametervektors als endgültigen prospektiven Parametervektor in der aktuellen Rahmenoperation.
  • Die vorliegende Erfindung schafft ferner eine Mehrstufen- Vektorquantisierungsvorrichtung zum Auswählen des prospektiven Parametervektors aus, einem Parameter-Codebuch, so daß die Quantisierungsverzerrung zwischen dem prospektiven Parametervektor und einem Eingangsparametervektor minimiert wird, und zum Senden eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht, wobei die Vorrichtung versehen ist mit dem Parameter-Codebuch, das Stufen von Unterparameter-Codebüchern umfaßt, in denen die jeweiligen Parametervektoren gespeichert sind, einem Codierungsabschnitt, der einen Vektorquantisierungsabschnitt enthält zum entsprechenden Auswählen der Unterparametervektoren aus den Stufen der Unterparameter-Codebücher, und zum Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Operation zu erhalten, zum Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, zum Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, zum Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß die Quantisierungsverzerrung minimiert wird, und zum Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; sowie einem Decodierungsabschnitt zum wahlweisen Auswählen der Unterparametervektoren, die dem übertragenen Vektorcode entsprechen, aus den Stufen der Unterparameter-Codebücher, zum Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, zum Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, zum Umsetzen des prospektiven Parametervektors unter Verwendung der fester Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, und zum Verwenden des umgesetzten prospektiven Parametervektors als endgültigen prospektiven Parametervektor in der aktuellen Rahmenoperation.
  • Gemäß diesem Verfahren und der zugehörigen Vorrichtung wird der Ausgangspunkt von der zweiten Stufe der Mehrstufen-Vektorquantisierung untersucht, um zu ermitteln, ob er der geeignete Ausgangspunkt ist (es wird ermittelt, ob er stabil oder instabil ist). In dem Fall, in dem festgestellt wird, daß ein Ausgangsvektor in dem Bereich liegt, der ursprünglich nicht vorhanden war, wird dieser Vektor unter Verwendung der festen Regel in einen neuen Ausgangsvektor in dem Bereich umgesetzt, der immer vorhanden war, und wird anschließend quantisiert. Auf diese Weise werden nicht ausgewählte Kombinationen von Codes beseitigt, wobei die Quantisierungsverzerrung reduziert werden kann.
  • Gemäß der vorliegenden Erfindung werden außerdem insta bile, nutzlose Ausgangsvektoren, die nach der ersten Stufe der Mehrstufen-Vektorquantisierung auftreten, unter Verwendung der festen Regel in wirksame Ausgangsvektoren umgesetzt, die anschließend verwendet werden können. Im Ergebnis können Vorteile erhalten werden, wie z. B. eine größere Reduktion der Quantisierungsverzerrung der Informationen von einem Äquivalenzmaß im Vergleich zu den herkömmlichen Verfahren.
  • Kurzbeschreibung der Zeichnung
  • Fig. 1(A) ist ein Blockschaltbild, das einen Teil einer Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
  • Fig. 1(B) ist ein Blockschaltbild, das einen Teil einer Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
  • Fig. 2 ist ein Blockschaltbild, das einen ersten Aufbau eines Vektorquantisierungsabschnitts zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
  • Fig. 3 ist ein Referenzschaubild zur Verwendung bei der Erläuterung eines ersten Beispiels eines Vektorquantisierungsverfahrens, das auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
  • Fig. 4 ist ein Referenzschaubild zur Verwendung bei der Erläuterung eines zweiten Beispiels eines Vektorquantisierungsverfahrens, das auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vor liegenden Erfindung angewendet wird.
  • Fig. 5 ist ein Blockschaltbild, das einen zweiten Aufbau eines Vektorquantisierungsverfahrens zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
  • Fig. 6 ist ein Blockschaltbild, das einen dritten Aufbau eines Vektorquantisierungsverfahrens zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
  • Fig. 7 zeigt ein Beispiel eines Aufbaus des LSP-Codebuches 37.
  • Fig. 8 ist ein Flußdiagramm zur Verwendung bei der Erläuterung eines Mehrstufen-Vektorquantisierungsverfahrens gemäß einer bevorzugten Ausführungsform der vorliegender Erfindung.
  • Fig. 9 zeigt die Umsetzung eines rekonstruierten Vektors gemäß der in Fig. 8 gezeigten bevorzugten Ausführungsform.
  • Fig. 10 ist ein Blockschaltbild, das einen vierten Aufbau eines Vektorquantisierungsabschnitts zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
  • Fig. 11 zeigt ein Beispiel eines Aufbaus eines Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitts 65.
  • Fig. 12 zeigt ein Beispiel der Geräuschabstand-Kennlinie, die über dem Übertragungsleitungs-Fehlerprozentsatz in einer Sprachcodierungsvorrichtung des Standes der Technik angetragen ist, sowie eine entsprechende Kennlinie gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung.
  • Fig. 13 zeigt ein Beispiel eines Aufbaus eines Vektorquantisierungs-Codebuches 31.
  • Fig. 14 zeigt ein Beispiel von Meinungswerten von decodierter Sprache, die über unterschiedlichen Bewertungsbedingungen in einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angetragen sind.
  • Fig. 15 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches CELP-Codierungsverfahren verwendet.
  • Fig. 16 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches VSELP-Codierungsverfahren verwendet.
  • Fig. 17 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches LD-CELP-Codierungsverfahren verwendet.
  • Fig. 18 ist ein Blockschaltbild, das ein Konstruktionbeispiel eines herkömmlichen Vektorquantisierungsabschnitts zeigt.
  • Fig. 19 zeigt den Existenzbereich eines zweidimensionalen LSP-Parameters entsprechend einem herkömmlichen Mehrstufen-Vektorquantisierungsverfahren.
  • Fig. 20 ist ein Flußdiagramm zur Verwendung bei der Erläuterung eines herkömmlichen Mehrstufen-Vektorquantisierungsverfahrens.
  • Fig. 21 zeigt einen rekonstruierten Vektor einer ersten Stufe in dem Fall, in dem die in Fig. 19 gezeigte Vektorquantisierung der LSP-Parameter durchgeführt wird.
  • Fig. 22 zeigt einen Vektor, zu dem ein rekonstruierter Vektor einer zweiten Stufe addiert worden ist, in dem Fall, in dem die in Fig. 19 gezeigte Vektorquantisierung der LSP-Parameter durchgeführt wird.
  • Genaue Beschreibung bevorzugter Ausführungsformen
  • Im folgenden wird mit Bezug auf die Figuren eine genaue Beschreibung der bevorzugten Ausführungsformen gegeben. Die Fig. 1(A) und (B) sind Blockschaltbilder, die eine Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigen. Im folgenden wird mit Bezug auf die Fig. 1(A) und 1(B) eine Übersicht eines Sprachcodierungsverfahrens erläutert. Die Eingangssprachdaten, die durch Abtasten des analogen Sprachsignals mit einer Abtastfrequenz von 8 kHz erzeugt werden, werden von einem Eingangsanschluß 21 eingegeben. Anschließend werden 80 Abtastwerte als ein Rahmen in einem Vektor erhalten und als Eingangssprachvektor in einem Puffer 22 gespeichert. Der Rahmen wird anschließend weiter in zwei Unterrahmen zerlegt, die jeweils eine Einheit von 40 Abtastwerten umfassen. Alle nachfolgenden Prozesse werden in Rahmeneinheiten oder Unterrahmeneinheiten durchgeführt.
  • In einem weichen Begrenzungsabschnitt. 23, wird die Größe des vom Puffer 22 ausgegebenen Eingangssprachvektors unter Verwendung einer Rahmeneinheit geprüft, wobei in dem Fall, in dem der Absolutwert der Größe des Eingangssprachvektors größer ist als ein vorgegebener Schwellenwert, eine Kompression durchgerührt wird. Anschließend wird in einem LPC-Analyseabschnitt 24 eine Linearprädik tionsanalyse durchgeführt, wobei die LPC-Koeffizienten für die Eingangssprachdaten der mehreren Abtastwerte, die vom weichen Begrenzungsabschnitt 23 ausgegeben worden sind, berechnet werden. Anschließend werden in einem LSP- Koeffizientenquantisierungsabschnitt 25 die LPC-Koeffizienten quantisiert und anschließend in ein Synthesefilter 26 eingesetzt.
  • Ein Schrittweitenperiodenvektor und ein Rauschsignalformvektor, die von einem Verzerrungsleistungs-Berechnungsabschnitt 35 ausgewählt worden sind, werden aus einem Adaptivcodebuch-Suchabschnitt 27 bzw. einem Zufallscodebuch- Suchabschnitt 28 ausgegeben, wobei der Rauschsignalformvektor anschließend in einem Vorhersageverstärkungsfaktorabschnitt 30 mit dem vorhergesagten Verstärkungsfaktor multipliziert wird, der von einem Verstärkungsfaktor-Anpassungsabschnitt 29 gesetzt worden ist.
  • Im Verstärkungsfaktor-Anpassungsabschnitt 29 wird die Linearprädiktionsanalyse auf der Grundlage der Leistung des Ausgangsvektors von einem Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 in der aktuellen Rahmenoperation und der gespeicherten Leistung des Ausgangsvektors der Zufallscodebuchkomponente des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31, der in der vorangegangenen Rahmenoperation verwendet worden ist, durchgeführt. Die Leistung (d. h. der vorhergesagte Verstärkungsfaktor), die mit dem Rauschsignalformvektor zu multiplizieren ist, der in der nachfolgenden Rahmenoperation ausgewählt wird, wird anschließend berechnet, ermittelt und in den Vorhersageverstärkungsabschnitt 30 eingesetzt.
  • Anschließend werden im Verzerrungsleistungs-Berechnungsabschnittsabschnitt 35 der ausgewählte Schrittweitenperiodenvektor und der Ausgangsvektor des Vorhersageverstärkungsfaktorabschnitte 30 ermittelt, in den Unterverstär kungsfaktor-Codebüchern 31a und 31b des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31 mit den Verstärkungsfaktoren multipliziert, die von diesen Unterverstärkungsfaktorcodebüchern 31a und 31b ausgegeben werden, und anschließend ausgegeben. Auf diese Weise werden die Ausgangsvektoren der Unterverstärkungsfaktorcodebücher 311 und 31b in einem Addierer 32 addiert, wobei der resultierende Ausgangsvektor des Addierers 32 als Erregungsvektor dem Synthesefilter 26 zugeführt wird. Anschließend wird im Synthesefilter 26 der synthetische Sprachvektor synthetisiert.
  • Als nächstes wird in einem Subtrahierer 33 der synthetische Sprachvektor vom Eingangssprachvektor subtrahiert, wobei die Verzerrungsdaten berechnet werden. Nachdem diese Verzerrungsdaten in einem perzeptualen Gewichtungsfilter 34 entsprechend den Koeffizienten gewichtet worden sind, die den menschlichen perzeptualen Kennlinien entsprechen, wird die Leistung der Verzerrungsdaten, die vom perzeptualen Gewichtungsfilter 34 ausgegeben werden, im Verzerrungsleistungs-Berechnungsabschnittsabschnitt 35 berechnet. Anschließend werden der Schrittweitenperiodenvektor und der Rauschsignalformvektor, die die obenerwähnte Leistung der Verzerrungsdaten minimieren, entsprechend aus dem Adaptivcodebuch-Suchabschnitt 27 und dem Rauschcodebuch-Suchabschnitt 28 ausgewählt, woraufhin die Verstärkungsfaktoren der Unterverstärkungsfaktorcodebücher 31a und 31b zugewiesen werden. Auf diese Weise werden in einem Codeausgabeabschnitt 36 die entsprechenden Codes und Verstärkungsfaktoren, die in Abhängigkeit von den LPC-Koeffizienten ausgewählt worden sind, der Schrittweitenperiodenvektor und der Rauschsignalformvektor in Codes aus Bitserien umgesetzt und, falls nötig, Fehlerkorrekturcodes hinzugefügt, woraufhin diese übertragen werden. Um der Prozeß für den nachfolgenden Rahmen in der Codierungsvorrichtung der vorliegenden Erfindung vorzubereiten, verwendet der lokale Decodierungsabschnitt. LDEC außerdem dieselben Daten, die von der jeweiligen in Fig. 1 gezeigten Strukturkomponente ausgegeben und zur Decodierungsvorrichtung übertragen werden, und synthetisiert einen Sprachdecodierungsvektor.
  • Im folgenden werden die Operationen des LSP-Koeffizientenquantisierungsabschnitts 25 genauer erläutert. Im LPC- Koeffizientenquantisierungsabschnitt 25 werden die im LPC-Analyseabschnitt 24 erhaltenen LPC-Koeffizienten zuerst in LSP-Parameter umgesetzt, quantisiert und anschließend diese quantisierten LSP-Parameter zurück in LPC-Koeffizienten umgesetzt. Die LPC-Koeffizienten, die mittels dieser Serie von Prozessen erhalten werden, sind daher quantisiert; die LPC-Koeffizienten können z. B. unter Verwendung des Newton-Raphson-Verfahrens in LSP-Parameter umgesetzt werden. Da eine kurze Rahmenlänge von 10 ms und eine hohe Korrelation zwischen den jeweiliger Rahmen vorliegt, wird durch Verwenden dieser Eigenschaften eine Quantisierung der LSP-Parameter unter Verwendung eines Vektorquantisierungsverfahrens durchgeführt. In der vorliegenden Erfindung sind die LSP-Parameter durch einen gewichteten Mittelwertsvektor dargestellt, der aus mehreren Vektoren früherer und aktueller Rahmen berechnet wird. Bei den herkömmlichen Differentialcodierungs- und Prädiktionscodierungsverfahren werden die Ausgangsvektoren in der vergangenen Rahmenoperation ohne Veränderung verwendet; in der vorliegenden Erfindung werden jedoch von den Vektoren, die durch Berechnen des gewichteten Mittels gebildet werden, nur diejenigen Vektoren verwendet, die in der unmittelbar vorangehenden Rahmenoperation aktualisiert worden sind. Ferner werden in der vorliegenden Erfindung von den Vektoren, die durch Berechnen des gewichteten Mittels gebildet worden sind, nur diejenigen Vektoren verwendet, die von Codierungsfehlern unbeeinflußt sind, sowie diejenigen Vektoren, bei denen Codie rungsfehler detektiert worden sind und die umgesetzt worden sind. Außerdem ist die vorliegende Erfindung ferner dadurch gekennzeichnet, daß das Verhältnis des gewichteten Mittels entweder ausgewählt oder gesteuert wird.
  • Fig. 2 zeigt eine erste Konstruktion eines Vektorquantisierungsabschnitts, der im LPC-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. Ein LSP-Codevektor Vk-1 (k ist die Rahmennummer), der aus einem LSP-Codebuch 32 in der Rahmenoperation erzeugt worden ist, die der aktuellen Rahmenoperation unmittelbar voranging, wird in einem Multiplizierer 38 mit einem Multiplikationskoeffizienten (1 - g) multipliziert und anschließend einem Eingangsanschluß eines Addierers 39 zugeführt. Eine Marke g stellt eine Konstante dar, die durch das Verhältnis des gewichteten Mittels bestimmt ist.
  • Ein LSP-Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, wird jedem Eingangsanschluß eines Übertragungsschalters 40 zugeführt. Dieser Übertragungsschalter 40 wird als Antwort auf das Verzerrungsberechnungsergebnis von einem Verzerrungsberechnungsabschnitt 41 aktiviert. Der ausgewählte LSP-Codevektor Vk wird zuerst in einem Multiplizierer 42 mit dem Multiplikationskoeffizienten g multipliziert und anschließend dem anderen Eingangsanschluß des Addierers 39 zugeführt. Auf diese Weise werden die Ausgangsvektoren der Multiplizierer 38 und 42 im Addierer 39 summiert, woraufhin der quantisierte LSP-Parametervektor &Omega;k der Rahmennummer k ausgegeben wird. Genauer kann dieser LSP- Parametervektor &Omega;k durch die folgende Formel (3) ausgedrückt werden.
  • &Omega;k = (1 - g) Vk-1 + gVk (3)
  • Anschließend werden im Verzerrungsberechnungsabschnitt 41 die Verzerrungsdaten zwischen einem LSP-Parametervektor &Psi;k der Rahmennummer k vor der Quantisierung und der LSP- Parametervektor &Omega;k der Rahmennummer k nach der Quantisierung berechnet, wobei der Übertragungsschalter 40 so aktiviert ist, daß diese Verzerrungsdaten minimiert werden. Auf diese Weise wird der Code für den LSP-Codevektor Vk, der von der Verzerrungsberechnungsvorrichtung 41 ausgewählt worden ist, als Code S&sub1; ausgegeben. Ferner wird der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugte LSP-Codevektor Vk in der nachfolgenden Rahmenoperation als LSP-Codevektor Vk-1 verwendet, der vom LSP- Codebuch 37 in der vorangegangenen Rahmenoperation erzeugt worden ist.
  • Im folgenden wird mit Bezug auf Fig. 3 ein LSP-Parametervektorquantisierungsverfahren erläutert, das die zwei LSP-Codevektoren verwendet, die jeweils von zwei LSP-Codebüchern in den zwei Rahmenoperationen erzeugt worden sind, die der aktuellen Rahmenoperation vorausgehen. Bei diesem Verfahren werden drei Typen von Codebüchern 37, 4 und 44 entsprechend der Rahmennummer verwendet. Der quantisierte LSP-Parametervektor &Omega;k kann unter Verwendung eines Mittels der drei Vektoren in den Rahmen in der folgenden Formel (4) berechnet werden.
  • Ein LSP-Codevektor Vk-2 stellt den LSP-Codevektor dar, der vom LSP-Codebuch 43 in den zwei Rahmenoperationen vor der aktuellen Rahmenoperation erzeugt worden ist, während ein LSP-Codevektor Vk-1 den LSP-Codevektor darstellt, der vom LSP-Codebuch 44 in der Rahmenoperation erzeugt worden ist, die der aktuellen Rahmenoperation unmittelbar vorausgeht. Als LSP-Codevektor Vk in der Operation des Rahmens k wird aus dem LSP-Codebuch 37 ein LSP-Codevektor ausgewählt, der die Verzerrungsdaten zwischen dem LSP-Parametervektor &Psi;k der Rahmennummer k vor der Quantisierung und dem LSP-Parametervektor &Omega;k der Rahmennummer k (des k-ten Rahmens) nach der Quantisierung minimiert. Der Code, der dem ausgewählten LSP-Codevektor Vk entspricht, wird anschließend als Code 51 ausgegeben. Der LSP-Codevektor Vk-1 kann ferner in der nachfolgenden Rahmenoperation verwendet werden, wobei in ähnlicher Weise der LSP- Codevektor Vk in den nächsten beiden Rahmenoperationen verwendet werden kann. Obwohl der LSP-Codevektor Vk in der k-ten Rahmenoperation ermittelt werden kann, kann außerdem dann, wenn diese Entscheidung verzögert werden kann, die Quantisierungsverzerrung reduziert werden, wenn diese Entscheidung bezüglich der LSP-Parametervektoren &Omega;k+1 und &Omega;k±2 die im nachfolgenden Rahmen und zwei Rahmenoperationen später erscheinen, verzögert wird.
  • Ein weiteres Beispiel eines LSP-Parametervektorquantisierungsverfahrens, das die zwei LSP-Codierungsvektoren verwendet, die jeweils von zwei LSP-Codebüchern in den zwei Rahmenoperationen erzeugt worden sind, die der aktuellen Rahmenoperation vorausgehen, wird im folgenden mit Bezug auf Fig. 4 erläutert. Dieses Vektorquantisierungsverfahren ist dem in Fig. 3 gezeigten Vektorquantisierungsverfahren ähnlich, jedoch wird der quantisierte LSP-Parametervektor &Omega;k der Rahmennummer k unter Verwendung der folgenden Formel (5) ausgedrückt.
  • In diesem Fall werden die LSP-Codierungsvektoren Vk und Uk in der k-ten Rahmenoperation ermittelt, woraufhin deren Codes übertragen werden. Der LSP-Codevektor Uk ist der Ausgangsvektor eines zusätzlichen LSP-Codebuches.
  • In den in den Fig. 3 und 4 gezeigten Beispielen sind ferner die Codebücher 37, 43 und 44 separat dargestellt; es ist jedoch auch möglich, diese Codebücher zu einem gemeinsamen Codebuch zu kombinieren. Bei den in den Fig. 2 bis 4 gezeigten Vektorquantisierungsverfahren ist außerdem der ideale LSP-Parametervektor &Psi;k im voraus vorgegeben, wobei ein Verfahren verwendet wird, das den LSP-Parametervektor &Omega;k ermittelt, der unter Verwendung des in den Parameterdimensionen berechneten Mittels quantisiert worden ist. In bezug auf die LSP-Parameter gibt es jedoch ein Verfahren zum Ermitteln der LSP-Parameter des aktuellen Rahmens durch mehrmaliges Analysieren der Verzerrungsdaten, die von einem Inversionsfilter ausgegeben werden, in den die in einer vorangegangenen Rahmenoperation ermittelten LSP-Parameter eingesetzt werden. Außerdem wird im Parametermittelwertberechnungsverfahren das aus den Koeffizienten der Polynomausdrücke der einzelnen Synthesefilter berechnete Mittel zu den endgültigen Synthesefilterkoeffizienten. Im Fall der Verfahren, die der Mehrfachanalyse folgen, wird das Produkt der Terme der einzelnen Polynomterme zum endgültigen Synthesefilter-Polynomterm.
  • Im folgenden wird ein Vektorquantisierungsverfahren erläutert, bei dem Erhöhungen der Verzerrung insbesondere durch Codierungsfehler, die auf der Übertragungsleitung auftreten, unterdrückt werden können. Bei diesem Vektorquantisierungsverfahren wird der LSP-Codevektor so gewählt, daß die Verzerrungsdaten zwischen einem erwarteter Wert &Omega;*k im lokalen Decodierungsabschnitt LDEC in bezug auf eine Codierungsfehlerrate anstelle des Ausgangsvektors, des LSP-Parametervektors &Omega;k in Fig. 2, und dem Eingangsvektor, dem LSP-Parametervektor &Psi;k, minimiert werden. Dieser erwartete Wert &Omega;*k kann unter Verwendung der folgenden Formel (6) geschätzt werden.
  • &Omega;*k = (1 - m&epsi;)&Omega;k + &Sigma;&epsi;&Omega;&epsi; (6)
  • In der Formel (6) stellt E die Codierungsfehlerrate auf der Übertragungsleitung dar (eine 1-Bit-Fehlerrate), während m die Übertragungsbitzahl je Vektor darstellt. Außerdem stellt in der Formel (6) &Omega;e die m Typen von Vektoren dar, die in dem Fall ausgegeben werden, in dem ein Fehler in nur einem Bit von m Teilen des Übertragungsleitungscodes, der dem LSP-Parametervektor &Omega;k entspricht, auftritt, wobei ein zweiter Term auf der rechten Seite der Gleichung die Summe aus diesen m Typen von Vektoren &Omega;e darstellt.
  • In Fig. 5 ist eine zweite Konstruktion eines Vektorquantisierungsabschnitts gezeigt, der im LPC-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 5 behalten die Komponenten, die den in Fig. 2 gezeigten Komponenten entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. In diesem Vektorquantisierungsabschnitt ist eine Konstante g, die vom Verhältnis des gewichteten Mittels bestimmt wird, nicht fest, vielmehr wird entsprechend dem jeweiligen LSP-Code Vk, der im LSP-Codebuch 37 gespeichert ist, eine Verhältniskonstante gk zugewiesen. In Fig. 5 wird der jeweilige LSP-Codevektor Vk, der vom LSP-Codebuch 37 ausgegeben worden ist, mit dem geeigneten Multiplikationskoeffizienten g&sub1;, g&sub2;, ..., gn-1, gn in den Multiplizieren 45&sub1;, 45&sub2;, ..., 45n-1, 45n multipliziert, in die die jeweilige individuelle Verhältniskonstante gk (k = 0, 1, ..., n) eingesetzt worden ist, und wird anschließend allen Eingangsanschlüssen des Übertragungsschalters 46 zugeführt.
  • Der Verzerrungsberechnungsabschnitt 41 ist so konstruiert, daß der LSP-Codevektor Vk, der die Verzerrungsdaten zwischen dem quantisierten LSP-Parametervektor &Omega;k, der vom Addierer 39 ausgegeben wird, und dem LSP-Parametervektor &Psi;k vor der Quantisierung minimiert, durch Übertragen des Übertragungsschalters 46 ausgewählt wird, wobei der entsprechende Multiplikationskoeffizient gk ausgewählt wird. Außerdem ist der obenerwähnte Aufbau so beschaffen, daß das Verhältnis (1 - gk), das dem Multiplizierer 47 zugeführt wird, gesperrt ist und mittels des Übertragungsschalters 46 geändert wird.
  • Auf diese Weise kann der quantisierte LSP-Parametervektor &Omega;k unter Verwendung der folgenden Formel (7) ausgedrückt werden.
  • &Omega;k = (1 - gk)Vk-1 + gkVk (7)
  • In der Formel (7) ist der Multiplikationskoeffizient gk ein Skalarwert, der dem LSP-Codevektor Vk entspricht; es ist jedoch auch möglich, mehrere der LSP-Codevektoren zu einer Gruppe zusammenzufassen, wobei dieser Skalarwert jedem dieser Typen von Gruppen entspricht. Außerdem ist es möglich, in der umgekehrten Weise vorzugehen, indem an jeder Komponente des LSP-Codevektors der Multiplikationskoeffizient eingesetzt wird. In jedem Fall ist der LSP- Codevektor Vk-1, der vom LSP-Codebuch 37 in der vorangegangenen Rahmenoperation erzeugt worden ist, gegeben, wobei die am besten geeignete Kombination aus dem Verhältnis gk, das das Verhältnis des gewichteten Mittels zwischen dem LSP-Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, und dem LSP-Codevektor Vk-1, der aus dem LSP-Codebuch 44 in der vorangegangenen Rahmenoperation erzeugt werden ist, darstellt, und dem LSP-Codevektor Vk ausgewählt wird, um die Verzerrungsdaten zwischen dem quantisierten LSP-Parametervektor &Omega;k und dem LSP-Parametervektor &Psi;k vor der Quantisierung zu minimieren.
  • Fig. 6 zeigt einen dritten Aufbau eines Vektorquantisierungsabschnitts, der im LSP-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 6 behalten die Komponenten, die denjenigen der Fig. 2 entsprechen, ihre ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. Der in Fig. 6 gezeigte Vektorquantisierungsabschnitt ist dadurch gekennzeichnet, daß der Verhältniswert mehrerer unterschiedlicher Typen von gewichteten Mitteln unabhängig von den LSP-Codevektoren gesetzt wird. Der LSP-Codevektor Vk-1, der vom LSP- Codebuch 37 in der Rahmenoperation unmittelbar vor der aktuellen Rahmenoperation erzeugt worden ist, wird in den Multiplizierern 47 und 48 mit den Multiplikationskoeffizienten (1 - g&sub1;) bzw. (1 - g&sub2;) multipliziert und anschließend den Eingangsanschlüssen Ta und Tb eines Übertragungsschalters 49 zugeführt. Der Übertragungsschalter 49 wird als Antwort auf die Verzerrungsberechnung aktiviert, die sich aus dem Verzerrungsberechnungsabschnitt 41 ergibt, woraufhin der Ausgangsvektor von einem der Multiplizierer 47 oder 48 ausgewählt wird und über einen gemeinsamen Anschluß Tc einem der Eingangsanschlüsse des Addierers 39 zugeführt wird. Andererseits wird der LSP- Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, jedem Eingangsanschluß des Übertragungsschalters 40 zugeführt. Der Übertragungsschalter 40 wird auf dieselbe Weise wie der Übertragungsschalter 49 als Antwort auf das Verzerrungsberechnungsergebnis von der Verzerrungsberechnungsvorrichtung 41 aktiviert. Auf diese Weise wird der ausgewählte LSP-Codevektor Vk in den Multiplizierern 50 und 51 mit den Multiplikationskoeffizienten g&sub1; bzw. g&sub2; multipliziert und anschließend den Eingangsanschlüssen Ta und Tb eines Übertragungsschalters 52 zugeführt. Der Übertragungsschalter 52 wird auf dieselbe Weise wie die Übertragungsschalter 40 und 49 als Antwort auf das Verzerrungsberech nungsergebnis von der Verzerrungsberechnungsvorrichtung 41 aktiviert, wobei der Ausgangsvektor entweder vom Multiplizierer 50 oder 51 ausgewählt wird und über den gemeinsamen Anschluß Tc einem Eingangsanschluß des Addierers 39 zugeführt wird.
  • Auf diese Weise werden die Ausgangsvektoren der Übertragungsschalter 49 und 52 im Addierer 39 summiert, woraufhin der quantisierte LSP-Parametervektor &Omega;k der Rahmennummer k ausgegeben wird. Genauer kann dieser LSP-Parametervektor &Omega;k durch die folgende Formel (8) ausgedrückt werden. In der Formel (8) ist m gleich 1 oder 2.
  • &Omega;k = (1 - gm)Vk-1 + gmVk
  • Anschließend werden im Verzerrungsberechnungsabschnitt 41 die Verzerrungsdaten zwischen dem LSP-Parametervektor &Psi;k der Rahmennummer k vor der Quantisierung und dem LSP-Parametervektor &Omega;k der Rahmennummer k nach der Quantisierung berechnet, wobei die Übertragungsschalter 49 und 52 so aktiviert werden, daß diese Verzerrungsdaten minimiert werden. Als Folge hiervon werden vom Verzerrungsberechnungsabschnitt 41 als Code 51 der Code des ausgewählten LSP-Codevektors Vk und die Auswahlinformationen 52, die anzeigen, welcher Ausgangsvektor der jeweiligen Multiplizierer 47 und 48 bzw. 50 und 51 verwendet wird, ausgegeben.
  • Um die Speicherkapazität des LSP-Codebuches 37 zu verringern, wird ferner der LSP-Codevektor Vk ausgedrückt als Summe zweier Vektoren. Wie z. B. in Fig. 7 gezeigt, wird das LSP-Codebuch 37 aus einem LSP-Codebuch 37a erster Stufe, in dem zehn Vektoren E1 gespeichert worden sind, und einem LSP-Codebuch 37b1 zweiter Stufe gebildet, das zwei separate LSP-Codebücher enthält, ein LSP-Codebuch 37b1 zweiter Stufe niedriger Ordnung und ein LSP-Codebuch 37b2 zweiter Stufe hoher Ordnung, die jeweils fünf Vektoren speichern. Der LSP-Codevektor Vk kann unter Verwendung der folgenden Formeln (9) und (10) ausgedrückt werden.
  • Wenn f < 5,
  • Vk = + E1n + EL2f (9)
  • Wenn f &ge; 5,
  • Vk = E1n + EH2f (10)
  • In den Formeln (9) und (10) ist E1n ein Ausgangsvektor des LSP-Codebuches 25a erster Stufe, wobei n von 1 bis 128 läuft. Mit anderen Worten, im LSP-Codebuch 25a erster Stufe sind 128 Ausgangsvektoren E&sub1; gespeichert. Außerdem ist EL2f ein Ausgangsvektor des LSP-Codebuches 37b1 zweiter Stufe niedriger Ordnung, während EH2f ein Ausgangsvektor des LSP-Codebuches 37b2 zweiter Stufe hoher Ordnung ist.
  • Das (in den Figuren nicht gezeigte) Vektorquantisierungsverfahren, das in diesem Vektorquantisierungsabschnitt verwendet wird, reduziert die Auswirkungen von Codierungsfehlern in dem Fall, in dem diese Fehler im Decodierungsabschnitt detektiert werden. Ähnlich dem in Fig. 2 gezeigten Vektorquantisierungsabschnitt berechnet dieses Verfahren im Codierungsabschnitt den LSP-Vektor Vk, der die Verzerrungsdaten minimiert. In dem Fall, in dem die Codierungsfehler detektiert werden oder entweder im Decodierungsabschnitt im LSP-Codevektor Vk-1 in der vorangehenden Rahmenoperation oder nur im Decodierungsabschnitt im LSP-Codevektor Vk in der aktuellen Rahmenoperation sehr wahrscheinlich sind, berechnet dieses Verfahren einen Ausgangsvektor, indem es das Verhältnis des gewichte ten Mittels der LSP-Vektoren reduziert, die die Fehler enthalten.
  • In dieser Variation wird z. B. in dem Fall, in dem ein Übertragungsleitungsfehler in der Rahmenoperation detektiert wird, die der aktuellen Rahmenoperation unmittelbar vorausgeht, die Information vom vorausgehenden Rahmen vollständig verworfen, wobei der quantisierte LSP-Parametervektor &Omega;k durch die folgende Formel (11) ausgedrückt wird.
  • &Omega;k = Vk (11)
  • Alternativ kann der LSP-Parametervektor &Omega;k durch die folgende Formel (12) ausgedrückt werden, um die Auswirkungen der Übertragungsleitungsfehler vom vorangegangenen Rahmen zu reduzieren.
  • &Omega;k = (1 - gk)Vk-1 + gkVk (12)
  • Im folgenden werden mit Bezug auf das in Fig. 8 gezeigte Flußdiagramm die Prozeduren des in Fig. 6 gezeigten Vektorquantisierungsabschnitts erläutert. Im Schritt SB1 wählt der Verzerrungsberechnungsabschnitt 41 mehrere Ausgangsvektoren E1n ähnlich dem LSP-Parametervektor &Psi;k vom LSP-Codebuch 37a erster Stufe aus, indem er den Übertragungsschalter 40 geeignet aktiviert. Im anschließender Schritt SB2 addiert der Verzerrungsberechnungsabschnitt 41 entsprechend zu jedem der ausgewählten Ausgangsvektoren E1n hoher und niedriger Ordnung die Ausgangsvektoren EL2f und Eg2f, die jeweils vom LSP-Codebuch 37b1 zweiter Stufe niedriger Ordnung und vom LSP-Codebuch 37b2 zweiter Stufe hoher Ordnung des Codebuches 37b zweiter Stufe ausgewählt worden sind, und erzeugt den LSP-Codevektor Vk. Das System rückt anschließend zum Schritt SB3 vor.
  • Im Schritt SB3 beurteilt der Verzerrungsberechnungsabschnitt 41, ob der im Schritt SB2 erhaltene LSP-Codevektor Vk stabil ist. Diese Beurteilung wird durchgeführt, um das Synthesefilter 26 (siehe Fig. 1), in das der obenerwähnte LSP-Codevektor Vk eingesetzt wird, zu stabilisieren und zu aktivieren. Um somit das Synthesefilter 26 zu stabilisieren und zu aktivieren, müssen die Werte der LSP-Parameter &omega;&sub1; bis &omega;p, die die Anzahl p der LSP-Codevektoren Vk bilden, die in der obenerwähnten Formel (2) gezeigte Beziehung erfüllen.
  • Wenn eine instabile Situation vorhanden ist (siehe Code P in Fig. 9), da die Werte der LSP-Parameter &omega;&sub1; bis &omega;p nicht die in Formel (2) gezeigte Beziehung erfüllen, setzt der Verzerrungsberechnungsabschnitt 41 den Ausgangsvektor P in einen neuen Ausgangsvektor P1 um, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch ist, um eine stabile Situation zu erreichen.
  • Anschließend wird der LSP-Codevektor Vk, der entweder stabil ist oder zur Stabilisierung umgesetzt worden ist, entsprechend in den Multiplizierern 50 und 51 mit den Multiplikationskoeffizienten g&sub1; und g&sub2; multipliziert. Der Ausgangsvektor entweder des Multiplizierers 50 oder 51 wird anschließend über den Übertragungsschalter 52 dem anderen Eingangsanschluß des Addierers 39 zugeführt. Andererseits wird der LSP-Codevektor Vk-1, der vom LSP-Codebuch 37 in der Rahmenoperation unmittelbar vor der aktuellen Rahmenoperation erzeugt worden ist, in den Multiplizierern 47 und 48 mit den Multiplikationskoeffizienten (1 - g&sub1;) bzw. (1 - g&sub2;) multipliziert, woraufhin der Ausgangsvektor entweder des Multiplizierers 47 oder 48 über den Übertragungsschalter 49 einem Eingangsanschluß des Addierers 39 zugeführt wird. Auf diese Weise wird im Addierer 39 das gewichtete Mittel der Ausgangsvektoren der Übertragungsschalter 49 und 52 berechnet, wobei der LSP- Parametervektor &Omega;k ausgegeben wird.
  • Im Schritt SB4 berechnet die Verzerrungsberechnungsvorrichtung 41 die Verzerrungsdaten zwischen dem LSP-Parametervektor &Psi;k und dem LSP-Parametervektor &Omega;k, woraufhin der Prozeß zum Schritt SB5 vorrückt. Im Schritt SB5 beurteilt der Verzerrungsberechnungsabschnitt 41, ob die im Schritt SB4 berechneten Verzerrungsdaten minimal sind. In dem Fall, in dem die Beurteilung "NEIN" ergibt, aktiviert der Verzerrungsberechnungsabschnitt 41 einen der Übertragungsschalter 49 oder 51, woraufhin der Prozeß zum Schritt SB2 zurückkehrt. Die obenerwähnten Schritte SB2 bis SB5 werden anschließend in bezug auf mehrere der Ausgangsvektoren E1n wiederholt, die im Schritt SB1 ausgewählt worden sind. Wenn die im Schritt SB4 berechneten Verzerrungsdaten ein Minimum erreichen, ergibt die Beurteilung im Schritt SB5 "JA", woraufhin im Ergebnis der Verzerrungsberechnungsabschnitt 51 den LSP-Codevektor Vk ermittelt, diesen Code als Code S&sub1; ausgibt, die Auswahlinformation S2 ausgibt und diese entsprechend zum Decodierungsabschnitt im Vektorquantisierungsabschnitt überträgt. Der Decodierungsabschnitt umfaßt das LSP-Codebuch 37 und die Übertragungsschalter 40, 49 und 52, die in Fig. 6 gezeigt sind.
  • Nach dem Vorrücken zu Schritt SB6 aktiviert der Decodierungsabschnitt den Übertragungsschalter 40 auf der Grundlage des übertragenen Codes S&sub1; und wählt den Ausgangsvektor E1n aus dem Codebuch 37a erster Stufe. Der Prozeß rückt anschließend zum Schritt SB7 vor. Im Schritt SB7 aktiviert der Decodierungsabschnitt den Übertragungsschalter 40 auf der Grundlage der übertragenen Auswahlinformationen S&sub2;, um entsprechend die Ausgangsvektoren EL2f und EH2f aus dem LSP-Codebuch 37b1 zweiter Stufe niedriger Ordnung und dem LSP-Codebuch 37b2 zweiter Stufe hoher Ordnung des Codebuches 37b zweiter Stufe auszuwählen, ad diert diese jeweils zu den ausgewählten Ausgangsvektoren E1n hoher und niedriger Ordnung und erzeugt somit den LSP-Codevektor Vk. Das System rückt anschließend zum Schritt SB8 vor. Im Schritt SB8 beurteilt der Decodierungsabschnitt, ob der im Schritt SB7 erhaltene LSP-Codevektor Vk stabil ist. Wenn der Decodierungsabschnitt feststellt, daß der LSP-Vektor Vk instabil ist, wie im obigen Schritt SB3, setzt er den Ausgangsvektor P in einen neuen Ausgangsvektor P1 um, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch ist, um eine stabile Situation zu erreichen. Auf diese Weise kann der LSP-Codevektor Vk, der entweder stabil ist oder zur Stabilisierung umgesetzt worden ist, in der nachfolgenden Rahmenoperation als LSP-Codevektor Vk-1 verwendet werden.
  • Das in Fig. 6 gezeigte Mehrstufen-Vektorquantisierungsverfahren ist dadurch gekennzeichnet, daß dann, wenn die Ausgangsvektoren EL2f und EH2f entsprechend aus dem LSP- Codebuch 37b1 zweiter Stufe niedriger Ordnung und dem LSP-Codebuch 37b2 zweiter Stufe hoher Ordnung des Codebuches 37b zweiter Stufe ausgewählt worden sind, summiert werden, in dem Fall, in dem ein instabiler Ausgangsvektor vorliegt, die Ausgangsposition verschoben wird, wobei der Ausgangsvektor P in den Ausgangsvektor P1 umgesetzt wird, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch liegt. In Fig. 22 stellt die diagonale Linie den Satz von Werten dar, bei dem die LSP-Parameter &omega;&sub1; und &omega;2 gleich sind. Die Veränderung der Ausgangsposition in diejenige, die um die gestrichelte Linie L1 symmetrisch liegt, welche zur obenerwähnten diagonalen Linie parallel liegt, verändert somit die Reihenfolge der LSP- Parameter &omega; und erweitert das Intervall der benachbarten LSP-Parameter.
  • Außerdem ist es im obenerwähnten Mehrstufen-Vektorquanti sierungsverfahren wichtig, die notwendigen Umsetzungen vor der Berechnung der Verzerrungsdaten durchzuführen und diese Konversionen sowohl im Codierungs- als auch im Decodierungsabschnitt in genau derselben Reihenfolge durchzuführen. Ferner ist es auch dann, wenn das LSP-Codebuch 37 gelernt wird, erforderlich, die Berechnungen für den Abstand und den Schwerpunkt unter Berücksichtigung der obigen Umsetzungen durchzuführen.
  • Ferner ist im obenerwähnten Mehrstufen-Vektorquantisierungsverfahren ein zweistufiges Beispiel des LSP-Codebuches 37 gegeben, jedoch ist es auch möglich, ein dreistufiges LSP-Codebuch 37 zu verwenden, in welchem die Stabil/Instabil-Beurteilung in der abschließenden Stufe durchgeführt wird. Außerdem ist es möglich, die Beurteilung in jeder Stufe durchzuführen, die der ersten Sture folgt. Die erste Stufe ist immer stabil, so daß es nicht erforderlich ist, die Stabil/Instabil-Beurteilung in dieser Stufe durchzuführen.
  • Fig. 10 zeigt einen vierten Aufbau eines Vektorquantisierungsabschnitts, der im LSP-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 10 behalten die Komponenten, die denjenigen der Fig. 6 entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. Die Addierer 53 bis 55, die Multiplizierer 56 bis 61 und die Übertragungsschalter 62 bis 64 besitzen dieselben Funktionen wie der Addierer 39, der Multiplizierer 47 bzw. der Übertragungsschalter 49. Der in Fig. 10 gezeigte Vektorquantisierungsabschnitt berechnet den LSP-Parametervektor &Omega;k, ausgedrückt in Formel (13), unter Verwendung der gewichteten Mittel mehrerer vergangener LSP-Codevektoren Vk-4 bis Vk-1 und des aktuellen LSP-Codevektors Vk.
  • &Omega;k = g4mVk-4 + g3mVk-3 + g2mVk-2 + g1mVk-1 + gmVk (13)
  • In der Formel 13 sind g4m bis gm die Konstanten der gewichteten Mittel, wobei m gleich 1 oder 2 ist.
  • Ferner sind die Operationen des in Fig. 10 gezeigten Vektorquantisierungsabschnitts den Operationen des in Fig. 6 gezeigten Vektorquantisierungsabschnitts ähnlich, so daß die zugehörige Beschreibung weggelassen wird. Außerdem verwendet der in Fig. 10 gezeigte Vektorquantisierungsabschnitt die LSP-Codierungsvektoren, die sich über vier Rahmenoperationen vor der aktuellen Rahmenoperation zurück erstrecken, wobei jedoch die Verwendung der LSP-Codevektoren von den vergangenen Rahmen nicht besonders beschränkt ist.
  • Im folgenden wird ein Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitt 65 beschrieben, der den Verstärkungsfaktor-Anpassungsabschnitt 29, den Vorhersageverstärkungsfaktorabschnitt 30 und das Vektorquantisierungs- Verstärkungsfaktorcodebuch 31 umfaßt, wie in Fig. 1 gezeigt ist. Fig. 11 zeigt ein genaues Blockschaltbild des Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitts 65. Im Verstärkungsfaktor-Anpassungsabschnitt 29 wird die Linearprädiktionsanalyse für die Leistung des Ausgangsvektors vom Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 in der aktuellen Operation und für die Leistung des Ausgangsvektors der Zufallscodebuchkomponente vom Vektorquantisierungs-Verstärkungsfaktorcodebuch 31, die in der vergangenen Operation verwendet worden ist und im Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 gespeichert ist, durchgeführt. Anschließend wird im Verstärkungsfaktor-Anpassungsabschnitt 29 der vorhergesagte Verstärkungsfaktor, mit dem der Rauschsignalformvektor multipliziert wird, der in der nächsten Rahmenoperation ausgewählt wird, berechnet und zugewiesen, wobei der zugewiesene vorhergesagte Verstärkungsfaktor in den Ver stärkungsfaktor-Anpassungsabschnitt 30 eingesetzt wird.
  • Das Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 ist in Unterverstärkungsfaktorcodebücher 31a und 31b unterteilt, um die Quantisierungseffizienz durch die Vektorquantisierung zu erhöhen und die Auswirkungen auf die decodierte Sprache in dem Fall zu verringern, in dem auf einer Übertragungsleitung ein Fehler des Verstärkungsfaktorcodes auftritt. Die vom Adaptivcodebuch-Suchabschnitt. 27 ausgegebene Schrittweite wird den Unterverstärkungsfaktorcodebüchern 31a und 31b jeweils im Block einer Hälfte zugeführt, wobei die Hälfte des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 den Unterverstärkungsfaktorcodebüchern 31a und 31b jeweils im Block einer Hälfte zugeführt wird. Der mit jedem der Vektoren multiplizierte Verstärkungsfaktor wird vom Verzerrungsleistungs-Berechnungsabschnitt wie in Fig. 1 gezeigt als Block ausgewählt, so daß die Verzerrungsdaten, die die Differenz zwischen einem Eingangssprachvektor und einem synthetisierten Sprachvektor darstellen, insgesamt minimiert werden. Durch Aufteilen des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31 wie oben beschrieben, ist es selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem der Verstärkungscodes auftritt, möglich, den Fehler des einen Verstärkungsfaktorcodes mit dem anderen Verstärkungsfaktorcode zu kompensieren. Dementsprechend ist es möglich, die Wirkung des Fehlers auf der Übertragungsleitung zu verringern. Fig. 12 zeigt ein Beispiel der Geräuschabstand-Kennlinie (SNR) für die Übertragungsfehlerrate im Fall der Darstellung des Verstärkungsfaktors, mit dem der Schrittweitenperiodenvektor bzw. der Rauschsignalformvektor mit dem Ausgangsvektor vom herkömmlichen Verstärkungsfaktor-Codebuch multipliziert werden, sowie in dem Fall der Darstellung von 1 mal der Summe der Ausgangsvektoren von den zwei Unterverstärkungsfaktorcodebüchern. In Fig. 12 zeigt eine Kurve a die Geräuschabstand-Kennlinie gemäß dem herkömmlichen Verstärkungsfaktorcodebuch, während eine Kurve b diejenige gemäß den Unterverstärkungsfaktorcodebüchern dieser Ausführungsform der vorliegenden Erfindung zeigt. In Fig. 12 wird deutlich, daß die Technik der Darstellung des Verstärkungsfaktors durch die Summe von Ausgangsvektoren von zwei Untercodebüchern eine große Toleranz gegenüber Übertragungsfehlern aufweist.
  • Als eine Gegenmaßnahme im Fall des Auftretens des Übertragungsfehlers des Verstärkungsfaktorcodes auf der Übertragungsleitung besteht das Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 aus den Unterverstärkungsfaktorcodebüchern 31a und 31b, die wie in Fig. 13 gezeigt seriell verbunden sind. Der Verstärkungsfaktor, mit dem der Schrittweitenperiodenvektor multipliziert wird, wird ausgewählt aus (gp0, gp1, .... gpM) - Andererseits wird der Verstärkungsfaktor, mit dem der Ausgangsvektor des Vorhersageverstärkungsfaktorabschnitts 30 multipliziert wird, ausgewählt aus (Gc0, Gc1, ..., GcM). Durch den Aufbau der Unterverstärkungsfaktorcodebücher 31a und 31b wie oben beschrieben, wird selbst dann, wenn auf der Übertragungsleitung ein Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 auftritt, der Verstärkungsfaktorcode des Schrittweitenperiodenvektors letztendlich nicht durch den Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 beeinflußt. Im Gegensatz dazu tritt in dem Fall, in dem ein Übertragungsfehler des Verstärkungsfaktorcodes des Schrittweitenperiodenvektors auf der Übertragungsleitung auftritt, der Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 ebenfalls auf. Durch geeignetes Anordnen der Verstärkungsfaktorcodes dieser Verstärkungsfaktoren ist es jedoch möglich, die Auswirkung des Über tragungsfehlers des Verstärkungsfaktorcodes auf der Übertragungsleitung zu verringern.
  • Als nächstes wird eine Vorauswahl beschrieben, die im Adaptivcodebuch-Suchabschnitt 27 und im Zufallscodebuch- Suchabschnitt 28 durchgeführt wird. Im Adaptivcodebuch- Suchabschnitt 27 und im Zufallscodebuch-Suchabschnitt 28 werden der Schrittweitenperiodenvektor und der Rauschsignalformvektor entsprechend aus mehreren Schrittweitenperiodenvektoren und mehreren Rauschsignalformvektoren aasgewählt, die jeweils im Adaptivcodebuch 27 und im Zufallscodebuch 28 gespeichert sind, so daß die Leistung der Verzerrung d', die durch die folgende Formel (14) dargestellt wird, minimiert wird.
  • d' = XT - g'HV'i ² (II)
  • In der Formel (14) stellt XT einen Soll-Eingangssprachvektor dar, der verwendet wird, wenn der optimale Vektor im Adaptivcodebuch-Suchabschnitt 27 und im Zufallscodebuch-Suchabschnitt 28 gesucht wird. Der Soll-Eingangssprachvektor XT wird erhalten durch Subtrahieren eines Nulleingang-Antwortvektors XZ des decodierten Sprachvektors, der in der vorangehenden Rahmenoperation decodiert worden ist und im perzeptualen Gewichtungsfilter 34 perzeptual gewichtet worden ist, vom Eingangssprachvektor XW, der im perzeptualen Gewichtungsfilter 34 perzeptual gewichtet worden ist, wie in Formel (15) gezeigt ist. Der Nulleingang-Antwortvektor XZ ist die Komponente des decodierten Sprachvektors, der bis einen Rahmen vor dem aktuellen Rahmen verarbeitet worden ist, und die den aktuellen Rahmen beeinträchtigt, und wird erhalten durch Eingeben eines Vektors in das Synthesefilter 26, der eine Nullsequenz umfaßt.
  • XT = XW - XZ (15)
  • In der Formel (14) ist ferner V'i (1 = 1, 2, ..., N; N bezeichnet eine Codebuchgröße) der Schrittweitenperiodenvektor oder der Rauschsignalformvektor, der aus dem Adaptivcodebuch 66 oder dem Zufallscodebuch 67 ausgewählt wird, während g' der Verstärkungsfaktor ist, der im Unterverstärkungsfaktorcodebuch 31a oder 31b des in Fig. 1 gezeigten Vektorquantisierungs-Verstärkungsfaktorcodebuches 31 gesetzt wird, H der obenerwähnte Impulsantwortkoeffizient ist und HV'i der synthetisierte Sprachvektor ist.
  • Um den optimalen Schrittweitenperiodenvektor oder Rauschsignalformvektor Vopt für den Soll-Eingangssprachvektor XT zu suchen, wie oben beschrieben, muß die Berechnung der Formel (14) mit Bezug auf die Gesamtheit des Vektors V'i durchgeführt werden. Dementsprechend nimmt die Berechnungskomplexität stark zu. Folglich ist es aufgrund von Hardware-Betrachtungen notwendig, die Berechnungskomplexität zu verringern, um die obenerwähnten Berechnungen durchzuführen. Da insbesondere eine Filterberechnung des synthetischen Sprachvektors HV'i einen Großteil der Berechnungen umfaßt, führt die Verringerung der Filterzeit zu einer Verringerung der Gesamtberechnungskomplexität in allen Suchabschnitten.
  • Daher wird die unten beschriebene Vorauswahl durchgeführt, um die Filterzeit zu verringern. Anfangs kann die obenerwähnte Formel (14) zu der in Formel (16) gezeigten Formel erweitert werden.
  • d' = XT ² - 2g'XTTHV'i + g'HV'i ² (16)
  • Im zweiten Term der Formel (16) wird in dem Fall, in dem ein Korrelationswert zwischen dem Soll-Eingangssprachvektor XT und dem Synthesesprachvektor HV'i groß ist, die Gesamtverzerrung d' klein. Dementsprechend wird der Vektor V'i aus jedem der Codebücher auf der Grundlage dieses Korrelationswerts XTTHV'i ausgewählt. Die Verzerrung d' wird nicht für den gesamten Vektor V'i berechnet, der in den jeweiligen Codebüchern gespeichert ist, sondern es wird nur der Korrelationswert für den gesamten Vektor V'i berechnet, wobei die Verzerrung d' nur für den Vektor V'i berechnet wird, der den großen Korrelationswert XT'HV'i aufweist.
  • Bei der Berechnung des Korrelationswerts XTTHV'i wird im allgemeinen nach der Berechnung des Synthesesprachvektors HV' die Korrelationsberechnung zwischen dem Soll-Eingangssprachvektor XT und dem Synthesesprachvektor HV' durchgeführt. Jedoch sind bei dem Berechnungsverfahren wie oben beschrieben für die Berechnung des Synthesesprachvektors HV' die N-malige Filterberechnung und die N-malige Durchführung der Korrelationsberechnung notwendig, da die Anzahl der Vektoren V'i gleich der Codebuchgröße N ist.
  • In dieser Ausführungsform wird eine Rückwärtsfilterung verwendet, die in "Fast CELP Coding based on algebraic codes", Proc. ICASSP'87, S. 1957-1960, J. P. Adoul, u. a., offenbart ist. Bei dieser Rückwärtsfilterung wird bei der Berechnung des Korrelationswerts XTTHV'i anfangs XTTH berechnet und (XTTH)V' berechnet. Durch Verwenden dieses Berechnungsverfahrens wird der Korrelationswert. XTTHV'i erhalten durch einmaliges Filtern und N-maliges Durchführen der Korrelationsberechnung. Anschließend werden die willkürlichen Zahlen das Vektors V'i mit dem großen Korrelationswert XTTHV'i ausgewählt, wobei die Filterung des Synthesesprachvektors HV'i nur für die ausgewählte willkürliche Zahl des Vektors V'i durchgeführt zu werden braucht. Folglich ist es möglich, die Berechnungskomplexität erheblich zu verringern.
  • Als nächstes wird die in Fig. 1 gezeigte Sprachcodierungsvorrichtung genauer erläutert. Der Adaptivcodebuch- Suchabschnitt 37 umfaßt das Adaptivcodebuch 66 und den Vorauswahlabschnitt 68. Im Adaptivcodebuch-Suchabschnitt 37 wird der vergangene Signalformvektor (Schrittweitenperiodenvektor), der für die Signalform des aktuellen Rahmens am besten geeignet ist, als Einheit eines Unterrahmens gesucht. Jeder der im Adaptivcodebuch 66 gespeicherten Schrittweitenperiodenvektoren wird erhalten durch Weiterleiten des decodierten Sprachvektors über ein Umkehrfilter. Der Koeffizient des Umkehrfilters ist der quantisierte Koeffizient, wobei der Ausgangsvektor vom Umkehrfilter der Restsignalformvektor des decodierter Sprachvektors ist. Im Vorauswahlabschnitt 68 wird die Vorauswahl einer Vorschau des Schrittweitenperiodenvektors (im folgenden als Schrittweitenvorschau bezeichnet), der ausgewählt werden soll, zweimal durchgeführt. Durch zweimaliges Durchführen der Vorauswahl werden schließlich M Elemente (z. B. 16 Elemente) der Schrittweitenvorschau ausgewählt. Als nächstes wird im Vorauswahlabschnitt 68 die optimale Schrittweitenvorschau unter den Schrittweitenvorschauen als auszugebender Schrittweitenperiodenvektor zugewiesen. Wenn der optimale Verstärkungsfaktor g' wie in Formel (17) gezeigt gesetzt worden ist, kann die obenerwähnte Formel (16) wie in Formel (18) gezeigt modifiziert werden.
  • Anschließend ist die Schrittweitenvorschau, die nach der kleinsten Verzerrung d' sucht, die erhalten werden kann, gleich der Schrittweitenvorschau, die nach dem maximierten zweiten Term der Formel (18) sucht. Entsprechend wird im Vorauswahlabschnitt 68 der zweite Term der Formel (18) für M Elemente der ausgewählten Schrittweitenvorschau berechnet, wobei die Schrittweitenvorschau, die das Berechnungsergebnis maximiert, als auszugebender Schrittweitenperiodenvektor HP festgelegt wird.
  • Der Zufallscodebuch-Suchabschnitt 28 umfaßt ein Zufallscodebuch 67 und Vorauswahlabschnitte 69 und 70. Im Zu fallscodebuch-Suchabschnitt 28 wird unter mehreren Rauschsignalformvektoren, die im Zufallscodebuch 67 als Einheit eines Unterrahmens gespeichert sind, ein Signalformvektor (ein Rauschsignalformvektor) gesucht, der für die Signalform des aktuellen Rahmens am besten geeignet ist. Das Zufallscodebuch 67 umfaßt die Untercodebücher 67a und 67b. In den Untercodebüchern 67a und 67b sind jeweils mehrere Erregungsvektoren gespeichert. Der Rauschsignalformvektor Cd wird durch die Summe der zwei Erregungsvektoren dargestellt, wie in Formel (19) gezeigt ist.
  • Cd = &theta;&sub1; · Csub1p + &theta;&sub2; · Csub2q (19)
  • In Formel (19) sind Csub1p und Csub2q die Erregungsvektoren, die in den Untercodebüchern 67a bzw. 67b gespeichert sind, während &theta;&sub1; und &theta;&sub2; das positive und das negative Vorzeichen der Erregungsvektoren Csub1p und Csub2q sind und d = 1~128, p = 1~128, q = 1~128.
  • Wie oben beschrieben worden ist, ist es durch Darstellen des Rauschsignalformvektors Cd durch zwei Erregungsvektoren Csub1p und Csub2q und durch Übertragen des Codes, der den zwei Erregungsvektoren Csub1p und Csub2q entspricht, als Code aus Bit-Serien selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem dieser Codes auf tritt, möglich, die Auswirkung des Fehlers auf der Übertragungsleitung durch Verwendung des anderen Codes zu verringern.
  • Ferner werden in dieser Ausführungsform die Erregungsvektoren Csub1p und Csub2q durch 7 Bits dargestellt, währen die Vorzeichen &theta;&sub1; und &theta;&sub2; durch 1 Bit dargestellt werden. Wenn der Rauschsignalformvektor Cd wie beim Stand der Technik durch einen einzelnen Vektor dargestellt wird, werden die Erregungsvektoren Csub1p und Csub2q durch 15 Bits dargestellt und die Vorzeichen &theta;&sub1; und &theta;&sub2; durch 1 Bit dargestellt. Da dementsprechend für das Zufallscodebuch eine große Menge an Speicher benötigt wird, ist die Codebuchgröße zu groß. Da jedoch in dieser Ausführungsform der Rauschsignalformvektor Cd durch die Summe der zwei Erregungsvektoren Csub1p und Csub2q dargestellt wird, kann die Codebuchgröße des Codebuches 67 im Vergleich zu derjenigen des Standes der Technik erheblich verringert werden. Folglich ist es möglich, die im Zufallscodebuch 67 zu speichernden Rauschsignalformvektoren Cd zu lernen und zu erhalten, indem eine Sprachdatenbank verwendet wird, in der mehrere aktuelle Sprachvektoren gespeichert sind, so daß die Rauschsignalformvektoren Cd mit den aktuellen Sprachvektoren übereinstimmen.
  • Um den Rauschsignalformvektor Cd auszuwählen, der für der Soll-Eingangssprachvektor XT am besten geeignet ist, werden in den Vorauswahlabschnitten 69 und 70 entsprechend die Erregungsvektoren Csub1p und Csub2q aus den Codebuchern 67a und 67b vorausgewählt. Mit anderen Worten, der Korrelationswert zwischen den Erregungsvektoren Csub1p und Csub2q und dem Soll- Eingangssprachvektor XT wird entsprechend berechnet, wobei die Vorauswahl einer Vorschau eines auszuwählenden Rauschsignalformvektors Cd (im folgenden mit Zufallsvorschau bezeichnet) ausgeführt wird. Nach dem Rauschsignalformvektor wird gesucht, indem jede der Zufallsvorschauen gegen den gesuchten Schrittweitenperiodenvektor HP orthogonalisiert wird, um die Quantisierungseffizienz zu steigern. Der gegen den Schrittweitenperiodenvektor HP orthogonalisierte Rauschsignalformvektor (HPd) wird durch die folgende Formel (20) dargestellt.
  • Anschließend wird der Korrekturwert XTT(HCd) zwischen diesem orthogonalisierten Rauschsignalformvektor (HCd) und dem Soll-Eingangssprachvektor XTT durch die Formel (21) dargestellt.
  • Anschließend wird die Vorauswahl der Zufallsvorschau unter Verwendung des Korrelationswertes XTT(HCd) durchgeführt. In der Formel (21) ist der Nennerterm (HCd)THP des zweiten Terms äquivalent zu (H P)THCd. Dementsprechend wird die obenerwähnte Rückwärtsfilterung auf den erster Term XTTHCd der Formel (21) und auf (HP)THCd angewendet Da der Rauschsignalformvektor Cd die Summe der Erregungsvektoren Csub1p und Csub2q ist, wird der Korrelationswert XTT(HCd) durch die Formel (22) dargestellt.
  • XTT(HCd) = XTT(HCsub1p) + XTT(HCsub2q) (22)
  • Entsprechend wird die von der Formel (22) gezeigte Berechnung für die Erregungsvektoren Csub1p und Csub2q durchgeführt, wobei unter diesen entsprechend M Elemente der berechneten Korrelationswerte ausgewählt werden, deren Wert groß ist. Anschließend werden unter den M Elementen der in den Vorauswahlabschnitten 69 und 70 ausge wählten Erregungsvektoren Csub1p und Csub2q entsprechend diejenigen Zufallsvorschauen als auszugebender Rauschsignalformvektor ausgewählt, die die am besten geeignete Kombination enthalten. Auf dieselbe Weise wie bei der obenbeschriebenen Technik der Auswahl der optimalen Vorschau der Schrittweitenperiodenvorschau wird nach der Kombination der Erregungsvektoren Csub1p und Csub2q gesucht, deren zweiter Term der Formel (23) die unter Verwendung des Soll-Eingangssprachvektors XT und der Zufallsvorschau berechnete Verzerrung d" darstellt.
  • Da die M Elemente der Erregungsvektoren Csub1p und Csub2q unter Verwendung der obenerwähnten Vorauswahl entsprechend aus jedem der Untercodebücher 67a und 67b ausgewählt werden, kann die in Formel (23) gezeigte Berechnung insgesamt M2 mal ausgeführt werden.
  • Wie oben beschrieben worden ist, werden in dieser Ausführungsform die M Elemente der Erregungsvektoren Csub1p und Csub2q entsprechend in den Vorauswahlabschnitten 69 und 70 ausgewählt, während die optimale Kombination unter den M Elementen der vorausgewählten Erregungsvektoren Csub1p, und Csub2q ausgewählt wird, so daß es möglich ist, die Toleranz gegenüber einem Übertraqungsfehler weiter zu erhöhen. Da wie vorher erwähnt ein Rauschsignalformvektor Cd durch die zwei Erregungsvektoren Csub1p und Csub2q dargestellt wird, ist es selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem der Codes auftritt, die den Erregungsvektoren Csub1p und Csub2q entsprechen, möglich, den Übertragungsfehler des einen Codes durch den anderen Code zu kompensieren. Außerdem werden die Erregungsvektoren Csub1p und Csub2q die eine hohe Korrelation mit dem Soll-Eingangssprachvektor aufweisen, von der Vor auswahl ausgewählt, woraufhin die optimale Kombination der Erregungsvektoren Csub1p und CSUb2q als auszugebender Rauschsignalformvektor ausgewählt wird, wobei der Rauschsignalformvektor, bei dem der Übertragungsfehler nicht aufgetreten ist, eine hohe Korrelation mit dem Soll-Eingangssprachvektor XTT aufweist. Somit ist es im Vergleich zur Nichtdurchführung der Vorauswahl möglich, die Auswirkungen von Übertragungsfehlern zu verringern.
  • Fig. 14 zeigt ein Ergebnis, bei dem die Sprachqualität der decodierten Sprache mittels eines Meinungstests in dem Fall geschätzt wurde, in dem die Sprachdaten mittels der Sprachcodierungsvorrichtung des Standes der Technik bzw. der vorliegenden Erfindung codiert und übertragen und durch die Sprachdecodierungsvorrichtung decodiert wurden. In Fig. 14 ist die Sprachqualität der decodierten Sprache dargestellt, wobei der Pegel der in die Sprachcodierungsvorrichtung eingegebenen Sprachdaten jeweils auf 3 Stufen eingestellt wurde (A: hoher Pegel, B: mittlerer Pegel, C: niedriger Pegel), für den Fall, in dem kein Übertragungsfehler auftrat, sowie die Sprachqualität (siehe Marke D) der decodierten Sprache dargestellt für den Fall, in dem ein Zufallsfehlerverhältnis 0,1% betrug. In Fig. 14 zeigen die schräg schraffierten Balken das Ergebnis gemäß dem herkömmlichen adaptiven Differentialimpulscodierungsmodulation-(ADPCM)-Verfahren, während die kreuzweise schraffierten Balken das Ergebnis gemäß dieser Ausführungsform der vorliegenden Erfindung zeigen. Gemäß Fig. 14 ist klar, daß in dem Fall, in dem kein Übertragungsfehler aufgetreten ist, unabhängig vom Pegel der eingegebenen Sprachdaten eine Sprachqualität der decodierten Sprache erreicht wird, die derjenigen gemäß dem ADPCM-Verfahren gleicht, während in dem Fall, in dem ein Übertragungsfehler aufgetreten ist, die Sprachqualität der decodierten Sprache besser ist als diejenige gemäß dem ADPCM-Verfahren. Somit ist die Sprachcodierungsvor richtung gemäß dieser Ausführungsform robust gegen Übertragungsfehler.
  • Wie oben beschrieben worden ist, ist es gemäß der obenerwähnten Ausführungsform möglich, die Codierung und Decodierung von Sprache bei 8 kb/s zu verwirklichen, eine Sprachcodierung mit einer hohen Sprachqualität der decodierten Sprache, die derjenigen einer decodierten Sprache bei 32 kb/s ADPCM entspricht, was internationaler Standard ist. Ferner ist es gemäß dieser Ausführungsform selbst dann, wenn auf der Übertragungsleitung ein Bitfehler auftritt, möglich, eine qualitativ hochwertige decodierte Sprache ohne Auswirkung des Bitfehlers zu erhalten.
  • Die Ausführungsform der Erfindung ist bis zu diesem Punkt mit Bezug auf die Figuren genauer erläutert worden; jedoch ist der konkrete Aufbau der Erfindung nicht auf diese Ausführungsform beschränkt. Die vorliegende Erfindung umfaßt Abwandlungen und dergleichen, die in die vorliegende Erfindung, wie sie beansprucht wird, fallen.

Claims (10)

1. Sprachcodierungsverfahren, mit wenigstens vier Abläufen von Schritten;
wobei ein erster Ablauf enthält:
einen ersten Schritt zum Bilden eines Vektors aus Sprachsignalen, der mehrere Abtast werte enthält, als eine Einheit einer Rahmenoperation und zum Speichern des Vektors als einen Spracheingangsvektor;
einen zweiten Schritt zum sequentiellen Prüfen der Amplitude jedes Spracheingangsvektors, jeweils für einen Rahmen zu einer Zeit, und zum Komprimieren der Amplitude, wenn der Absolutwert der Amplitude einen vorgegebenen Wert übersteigt;
einen dritten Schritt zum Ausführen einer Linearprädiktionsanalyse und zum Berechnen eines LPC-Koeffizienten für jeden durch den zweiten Schritt ausgegebenen Spracheingangsvektor;
einen vierten Schritt zum Umsetzen eines durch den dritten Schritt berechneten LPC-Koeffizienten in einen LSP-Parameter;
einen fünften Schritt zum Quantisieren des LSP- Parameters unter Verwendung eines Vektorquantisierungsprozesses;
einen sechsten Schritt zum Umsetzen des quantisierten LSP-Parameters in einen quantisierten LPC-Koeffizienten;
einen siebten Schritt zum Synthetisieren eines synthetischen Sprachvektors auf der Grundlage eines von außen gelieferten Ansteuerungsvektors und des quantisierten LPC-Koeffizienten;
einen achten Schritt zum Berechnen von Verzerrungsdaten durch Subtrahieren des durch den siebten Schritt ausgegebenen synthetischen Sprachvektors von dem durch den zweiten Schritt ausgegebenen Spracheingangsvektor;
einen neunten Schritt zum Gewichten der durch den achten Schritt berechneten Verzerrungsdaten; und
einen zehnten Schritt zum Berechnen der Verzerrungsleistung der Verzerrungsdaten mit Bezug auf alle durch den neunten Schritt gewichteten Verzerrungsdaten;
wobei ein zweiter Ablauf enthält:
einen elften Schritt zum Wählen eines Schrittweitenperiodenvektors aus mehreren Schrittweitenperiodenvektoren;
einen zwölften Schritt zum Wählen eines Rauschsignalformvektors aus mehreren Rauschsignalformvektoren;
einen dreizehnten Schritt zum Berechnen eines Prädiktionsverstärkungsfaktors für jeden Rauschsignalformvektor, der durch den zwölften Schritt ausgewählt wird;
einen vierzehnten Schritt zum Multiplizieren des Prädiktionsverstärkungsfaktors, der durch den dreizehnten Schritt berechnet wird, mit dem Rauschsignalformvektor, der durch den zwölften Schritt gewählt wird;
einen fünfzehnten Schritt zum jeweiligen Multiplizieren eines aus den mehreren Verstärkungsfaktoren ausgewählten Verstärkungsfaktors mit dem Schrittweitenperiodenvektor, der durch den elften Schritt ausgewählt wird, bzw. mit einem Ausgangsvektor des vierzehnten Schrittes; und
einen sechzehnten Schritt zum Addieren zweier durch den fünfzehnten Schritt erhaltener Multiplikationsergebnisse und zum Liefern des Additionsergebnisses an den siebten Schritt als Ansteuerungsvektor;
wobei in einem dritten Ablauf ein Wert gewählt wird, der die durch den zehnten Schritt berechnete Verzerrungsleistung minimiert, wenn ein Schrittweitenperiodenvektor gemäß dem elften Schritt gewählt ist, ein Rauschsignalformvektor gemäß dem zwölften Schritt gewählt ist und ein Verstärkungsfaktor gemäß dem fünfzehnten Schritt gewählt ist; und
wobei in einem vierten Ablauf verarbeitete Informationen, die durch die Struktureinrichtungen erhalten wird, in Bitreihen codiert werden, falls erforderlich eine Fehlerkorrekturcodierung hinzugefügt wird und dann die codierten Bitreihen übertragen werden;
wobei der dreizehnte Schritt das Berechnen des Prädiktionsverstärkungsfaktors durch Ausführen einer Linearprädiktionsanalyse auf der Grundlage der Leistung eines Ausgangsvektors des vierzehnten Schrittes, multipliziert mit einem Verstärkungsfaktor während der Verarbeitung des fünfzehnten Schrittes des laufenden Rahmens, und der Leistung eines Ausgangsvektors des vierzehnten Schrittes, multipliziert mit einem Verstärkungsfaktor während der Verarbeitung des fünfzehnten Schrittes für einen vergangenen Rahmen, umfaßt.
2. Sprachcodierungsverfahren nach Anspruch 1, bei dem der fünfzehnte Schritt enthält:
einen ersten Unterschritt zum Multiplizieren eines Verstärkungsfaktors, der aus den mehreren in einer vorgegebenen Verstärkungsfaktor-Speichereinrichtung (31a) gespeicherten Verstärkungsfaktoren gewählt wird, mit der Hälfte des Schrittweitenperiodenvektors, der durch den elften Schritt gewählt wird, und mit mit der Hälfte des Ausgangsvektors des vierzehnten Schrittes;
einen zweiten Unterschritt zum Multiplizieren eines Verstärkungsfaktors, der aus mehreren in einer vorgegebenen Verstärkungsfaktor-Speichereinrichtung (31b) gespeicherten Verstärkungsfaktoren gewählt wird, mit der verbleibenden Hälfte des Schrittweitenperiodenvektors, der durch den elften Schritt gewählt wird, und mit der verbleibenden Hälfte des Ausgangsvektors des vierzehnten Schrittes;
einen dritten Unterschritt zum Liefern der Summe aus einem mit einem Verstärkungsfaktor gemäß dem ersten Unterschritt multiplizierten Schrittweitenperiodenvektor und aus einem mit einem Verstärkungsfaktor gemäß dem zweiten Unterschritt multiplizierten Schrittweitenperiodenvektor als einen mit einem Verstärkungsfaktor gemäß dem fünfzehnten Schritt multiplizierten Schrittweitenperiodenvektor an den sechzehnten Schritt: und
einen vierten Unterschritt zum Liefern der Summe aus einem Ausgangsvektor des vierzehnten Schrittes, multipliziert mit einem Verstärkungsfaktor gemäß dem ersten Unterschritt, und aus einem Ausgangsvektor des vierzehnten Schrittes, multipliziert mit einem Verstärkungsfaktor gemäß dem zweiten Unterschritt, als einen mit einem Verstärkungsfaktor gemäß dem fünfzehnten Schritt multiplizierten Ausgangsvektor des vierzehnten Schrittes an den sechzehnten Schritt.
3. Sprachcodierungsverfahren nach einem der Ansprüche 1, 2, bei dem der elfte Schritt enthält:
Berechnen eines Korrelationswerts zwischen einem Eingangssprachvektor, der durch den zweiten Schritt ausgegeben wird, und einem synthetischen Sprachvektor, der durch den siebten Schritt ausgegeben wird, durch Ausführen einer Rückwärtsfilterung in bezug auf sämtliche Schrittweitenperiodenvektoren, die in einer vorgegebenen Schrittweitenperiodenvektor-Speichereinrichtung (66) gespeichert sind;
Auswählen eines Schrittweitenperiodenvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt; und
Liefern des ausgewählten Schrittweitenperiodenvektors an den fünfzehnten Schritt.
4. Sprachcodierungsverfahren nach einem der Ansprüche 1-3, wobei der zwölfte Schritt enthält:
einen ersten Unterschritt zum Berechnen eines Korrelationswertes zwischen einem Eingangssprachvektor, der durch den zweiten Schritt ausgegeben wird, und einem synthetischen Sprachvektor, der durch den siebten Schritt ausgegeben wird, durch Ausführen einer Rückwärtsfilterung mit Bezug auf alle in einer ersten Erregungsvektor-Speichereinrichtung (67a) gespeicherten Erregungsvektoren und zum Wählen eines Erregungsvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt;
einen zweiten Unterschritt zum Berechnen eines Korrelationswertes zwischen einem Eingangssprachvektor, der durch den zweiten Schritt ausgegeben wird, und einem synthetischen Sprachvektor, der durch den siebten Schritt ausgegeben wird, durch Ausführen einer Rückwärtsfilterung mit Bezug auf sämtliche in einer zweiten Erregungsvektor- Speichereinrichtung (67b) gespeicherten Erregungsvektoren und zum Auswählen eines Erregungsvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt; und
einen dritten Unterschritt zum Addieren eines Ausgangsvektors des ersten Unterschrittes und eines Ausgangsvektors des zweiten Unterschrittes und zum Liefern des Additionsergebnisses an den vierzehnten Schritt als den Rauschsignalformvektor.
5. Sprachcodierungsverfahren nach einem der Ansprüche 3, 4, bei dem dann, wenn der Eingangssprachvektor mit XT bezeichnet wird, ein Impulsantwortkoeffizient des siebten Schrittes mit H bezeichnet wird und entweder der Schrittweitenperiodenvektor oder der Rauschsignalformvektor mit V'i bezeichnet wird, der synthetische Sprachvektor durch HV'i gegeben ist, der Korrelationswert durch XTTHV'i gegeben ist und die Rückwärtsfilterung dadurch ausgeführt wird, daß zunächst XTTH berechnet wird und dann (XTTH)V'i berechnet wird.
6. Sprachcodierungsvorrichtung, mit:
einem Puffer (22) zum Bilden eines Vektors aus Sprachsignalen, der mehrere Abtastwerte enthält, als eine Einheit einer Rahmenoperation und zum Speichern des Vektors als einen Spracheingangsvektor;
einer Amplitudenbegrenzungseinrichtung (23) zum sequentiellen Prüfen der Amplitude jedes im Puffer (22) gespeicherten Spracheingangsvektors, jeweils für einen Rahmen zu einer Zeit, und zum Komprimieren der Amplitude, wenn der Absolutwert der Amplitude einen vorgegebenen Wert übersteigt;
einer LPC-Analyseeinrichtung (24) zum Ausführen einer Linearprädiktionsanalyse und zum Berechnen eines LPC-Koeffizienten für jeden von der Amplitudenbegrenzungseinrichtung (23) ausgegebenen Spracheingangsvektor;
einer LPC-Parameter-Umsetzungseinrichtung zum Umsetzen jedes durch die LPC-Analyseeinrichtung (24) berechneten LPC-Koeffizienten in einen LSP-Parameter;
einer Vektorquantisierungseinrichtung zum Quantisieren des LSP-Parameters unter Verwendung eines Vektorquantisierungsprozesses;
einer LPC-Koeffizient-Umsetzungseinrichtung zum Umsetzen des quantisierten LSP-Parameters in einen quantisierten LPC-Koeffizienten;
einer Synthetisierungseinrichtung (26) zum Synthetisieren eines synthetischen Sprachvektors auf der Grundlage eines von außen gelieferten Ansteuerungsvektors und des quantisierten LPC-Koeffizienten;
einer Verzerrungsdaten-Berechnungseinrichtung (33) zum Berechnen von Verzerrungsdaten durch Subtrahieren des von der Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektors von dem von der Amplitudenbegrenzungseinrichtung (23) ausgegebenen Spracheingangsvektor;
einer Wahrnehmungsgewichtungseinrichtung (34) zum Gewichten der durch die Verzerrungsdaten-Berechnungseinrichtung (33) erhaltenen Verzerrungsdaten;
einer Verzerrungsleistung-Berechnungseinrichtung (35) zum Berechnen der Verzerrungsleistung der Verzerrungsdaten mit Bezug auf alle durch die Wahrnehmungsgewichtungseinrichtung (34) gewichteten Verzerrungsdaten;
einer Schrittweitenperiodenvektor-Sucheinrichtung (27) zum Speichern mehrerer Schrittweitenperiodenvektoren und zum Wählen eines Schrittweitenperiodenvektors aus den mehreren gespeicherten Schrittweitenperiodenvektoren;
einer Rauschsignalformvektor-Sucheinrichtung (28) zum Suchen mehrerer Rauschsignalformvektoren und zum Wählen eines Rauschsignalformvektors aus den mehreren gespeicherten Rauschsignalformvektoren;
einer Verstärkungsfaktor-Anpassungseinrichtung (29) zum Berechnen eines Prädiktionsverstärkungsfaktors für jeden durch die Rauschsignalformvektor-Sucheinrichtung (28) gewählten Rauschsignalformvektor;
einer Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30) zum Multiplizieren des durch die Verstärkungsfaktor-Anpassungseinrichtung (29) berechneten Prädiktionsverstärkungsfaktors mit dem durch die Rauschsignalformvektor-Sucheinrichtung (28) gewählten Rauschsignalformvektor;
einer Verstärkungsfaktor-Multiplikationseinrichtung (31) zum Speichern mehrerer Verstärkungsfaktoren und zum Multiplizieren eines aus den mehreren gespeicherten Verstärkungsfaktoren gewählten Verstärkungsfaktors mit dem durch die Schrittweitenperiodenvektor-Sucheinrichtung (27) gewählten Schrittweitenperiodenvektor bzw. mit einem Ausgangsvektor der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
einer Additionseinrichtung (32) zum Addieren zweier Multiplikationsergebnisse, die durch die Verstärkungsfaktor-Multiplikationseinrichtung (31) erhalten werden, und zum Liefern des Additionsergebnisses an die Synthetisierungseinrichtung (26) als den Ansteuerungsvektor;
einer Steuereinrichtung zum Wählen eines Wertes, der die durch die Verzerrungsleistung-Berechnungseinrichtung (35) berechnete Verzerrungsleistung minimiert, wenn ein Schrittweitenperiodenvektor durch die Schrittweitenperiodenvektor-Sucheinrichtung (27) gewählt ist, ein Rauschsignalformvektor durch die Rauschsignalformvektor- Sucheinrichtung (28) gewählt ist und ein Verstärkungsfaktor durch die Verstärkungsfaktor-Multiplikationseinrichtung (31) gewählt wird ist; und
einer Codeausgabeeinrichtung (36) zum Codieren verarbeiteter Informationen, die durch die strukturellen Einrichtungen erhalten werden, in Bitreihen, zum Addieren einer Fehlerkorrekturcodierung, falls notwendig, und dann zum Übertragen der codierten Bitreihe:
wobei die Verstärkungsfaktor-Anpassungseinrichtung (29) den Prädiktionsverstärkungsfaktor durch Ausführen einer Linearprädiktionsanalyse auf der Grundlage der Leistung eines Ausgangsvektors einer Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), die mit einem Verstärkungsfaktor während der Verarbeitung der Verstärkungsfaktor-Multiplikationseinrichtung (31) für den laufenden Rahmen multipliziert wird, und der Leistung eines Ausgangsvektors einer Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), die durch einen Verstärkungsfaktor während der Verarbeitung der Verstärkungsfaktor-Multiplikationseinrichtung (31) für einen vergangenen Rahmen multipliziert wird, berechnet.
7. Sprachcodierungsvorrichtung nach Anspruch 6, wobei die Verstärkungsfaktor-Multiplikationseinrichtung (31) enthält:
eine erste Unterverstärkungsfaktor-Multiplikationseinrichtung (31a) zum Multiplizieren eines aus den mehreren darin gespeicherten Verstärkungsfaktoren gewählten Verstärkungsfaktors mit der Hälfte eines durch die Schrittweitenperiodenvektor-Sucheinrichtung (27) gewähl ten Schrittweitenperiodenvektors und mit der Hälfte eines Ausgangsvektors der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
eine zweite Unterverstärkungsfaktor-Multiplikationseinrichtung (31b) zum Multiplizieren eines aus mehreren darin gespeicherten Verstärkungsfaktoren gewählten Verstärkungsfaktors mit der verbleibenden Hälfte des durch die Schrittweitenperiodenvektor-Sucheinrichtung (27) gewählten Schrittweitenperiodenvektors und der verbleibenden Hälfte des Ausgangsvektors der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
einer ersten Additionseinrichtung zum Liefern der Summe aus einem Schrittweitenperiodenvektor, der durch die erste Unterverstärkungsfaktor-Multiplikationseinrichtung (31a) mit einem Verstärkungsfaktor multipliziert wird, und aus einem Schrittweitenperiodenvektor, der durch die zweite Unterverstärkungsfaktor-Multiplikationseinrichtung (31b) mit einem Verstärkungsfaktor multipliziert wird, als einen Schrittweitenperiodenvektor, der mit einem Verstärkungsfaktor durch die Verstärkungsfaktor-Multiplikationseinrichtung (31) multipliziert ist, an die Additionseinrichtung (32); und
eine zweite Additionseinrichtung zum Liefern der Summe aus einem Ausgangsvektor der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der durch die erste Unterverstärkungsfaktor-Multiplikationseinrichtung (31a) mit einem Verstärkungsfaktor multipliziert wird, und aus einem Ausgangsvektor der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der durch die zweite Unterverstärkungsfaktor-Multiplikationseinrichtung (31b) mit einem Verstärkungsfaktor multipliziert wird, als einen Ausgangsvektor der Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der durch die Verstärkungsfaktor-Multiplikationseinrichtung (31) mit einem Verstärkungsfaktor multipliziert ist, an die Additionseinrichtung (32).
8. Sprachcodierungsvorrichtung nach einem der Ansprüche 6, 7, wobei die Schrittweitenperiodenvektor- Sucheinrichtung (27) enthält:
eine Schrittweitenperiodenvektor-Speichereinrichtung (66) zum Speichern mehrerer Schrittweitenperiodenvektoren; und
eine Vorauswahleinrichtung (68) zum Berechnen eines Korrelationswertes zwischen einem von der Amplitudenbegrenzungseinrichtung (23) ausgegebenen Eingangssprachvektor und einem von der Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektor durch Ausführen einer Rückwärtsfilterung mit Bezug auf alle Schrittweitenperiodenvektoren, die in der Schrittweitenperiodenvektor-Speichereinrichtung (66) gespeichert sind, zum Auswählen eines Schrittweitenperiodenvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt; und zum Liefern des gewählten Schrittweitenperiodenvektors an die Verstärkungsfaktor-Multiplikationseinrichtung (31).
9. Sprachcodierungsvorrichtung nach einem der Ansprüche 6-8, wobei die Rauschsignalformvektor-Sucheinrichtung (28) enthält:
eine erste Erregungsvektor-Speichereinrichtung (67a) zum Speichern mehrerer Erregungsvektoren;
eine erste Vorauswahleinrichtung (69) zum Berechnen eines Korrelationswertes zwischen einem von der Amplitudenbegrenzungseinrichtung (23) ausgegebenen Eingangssprachvektor und einem von der Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektor durch Ausführen einer Rückwärtsfilterung mit Bezug auf alle Erregungsvektoren, die in der ersten Erregungsvektor-Speichereinrichtung (67a) gespeichert sind, und zum Auswählen eines Erregungsvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt;
eine zweite Erregungsvektor-Speichereinrichtung (67b) zum Speichern mehrerer Erregungsvektoren;
eine zweite Vorauswahleinrichtung (70) zum Berechnen eines Korrelationswertes zwischen einem von der Amplitudenbegrenzungseinrichtung (23) ausgegebenen Eingangssprachvektor und einem von der Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektor durch Ausführen einer Rückwärtsfilterung mit Bezug auf alle Erregungsvektoren, die in der zweiten Erregungsvektor-Speichereinrichtung (67b) gespeichert sind, und zum Auswählen eines Erregungsvektors, der ermöglicht, daß der Korrelationswert vorgegebene Bedingungen erfüllt; und
eine Additionseinrichtung zum Addieren eines Ausgangsvektors der ersten Vorauswahleinrichtung (69) und eines Ausgangsvektors der zweiten Vorauswahleinrichtung (70) und zum Liefern des Additionsergebnisses an die Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30) als den Rauschsignalformvektor.
10. Sprachcodierungsvorrichtung nach einem der Ansprüche 8, 9, wobei dann, wenn der Eingangssprachvektor mit XT bezeichnet wird, ein Impulsantwortkoeffizient der Synthetisierungseinrichtung (26) mit H bezeichnet wird und entweder der Schrittweitenperiodenvektor oder der Rauschsignalformvektor mit V'i bezeichnet wird, der synthetische Sprachvektor durch HV'i gegeben ist, der Korrelationsvektor durch XTTHV'i gegeben ist und die Rückwärtsfilterung dadurch ausgeführt wird, daß zunächst XTTH berechnet wird und dann (XTTH)V'i berechnet wird.
DE69328450T 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung Expired - Lifetime DE69328450T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP04170895A JP3087796B2 (ja) 1992-06-29 1992-06-29 音声の予測符号化装置
JP26519592A JP2776474B2 (ja) 1992-10-02 1992-10-02 多段ベクトル量子化法
JP4265194A JP2853824B2 (ja) 1992-10-02 1992-10-02 音声のパラメータ情報符号化法
JP07053493A JP3148778B2 (ja) 1993-03-29 1993-03-29 音声の符号化方法

Publications (2)

Publication Number Publication Date
DE69328450D1 DE69328450D1 (de) 2000-05-25
DE69328450T2 true DE69328450T2 (de) 2001-01-18

Family

ID=27465260

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69328450T Expired - Lifetime DE69328450T2 (de) 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung
DE69309557T Expired - Lifetime DE69309557T2 (de) 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE69309557T Expired - Lifetime DE69309557T2 (de) 1992-06-29 1993-06-28 Verfahren und Vorrichtung zur Sprachkodierung

Country Status (3)

Country Link
US (1) US5787391A (de)
EP (2) EP0751496B1 (de)
DE (2) DE69328450T2 (de)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3559588B2 (ja) * 1994-05-30 2004-09-02 キヤノン株式会社 音声合成方法及び装置
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US5648989A (en) * 1994-12-21 1997-07-15 Paradyne Corporation Linear prediction filter coefficient quantizer and filter set
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
TW317051B (de) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US7024355B2 (en) * 1997-01-27 2006-04-04 Nec Corporation Speech coder/decoder
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6021325A (en) * 1997-03-10 2000-02-01 Ericsson Inc. Mobile telephone having continuous recording capability
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
EP1746583B1 (de) 1997-10-22 2008-09-17 Matsushita Electric Industrial Co., Ltd. Tonkodierer und Tondekodierer
JP3842432B2 (ja) 1998-04-20 2006-11-08 株式会社東芝 ベクトル量子化方法
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
JP2000056799A (ja) * 1998-08-06 2000-02-25 Matsushita Electric Ind Co Ltd 励振信号生成装置並びに音声符号化装置及び音声復号化装置
US6493665B1 (en) 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6556966B1 (en) 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6714907B2 (en) 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
SE519563C2 (sv) 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
CA2259094A1 (en) * 1999-01-15 2000-07-15 Universite De Sherbrooke A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
US6138089A (en) * 1999-03-10 2000-10-24 Infolio, Inc. Apparatus system and method for speech compression and decompression
EP1221694B1 (de) * 1999-09-14 2006-07-19 Fujitsu Limited Sprachkodierer/dekodierer
EP1221162B1 (de) * 1999-09-30 2005-06-29 STMicroelectronics Asia Pacific Pte Ltd. G.723.1 audiokodierer
ATE420432T1 (de) * 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
KR100355033B1 (ko) * 2000-12-30 2002-10-19 주식회사 실트로닉 테크놀로지 선형예측 분석을 이용한 워터마크 삽입/추출 장치 및 그방법
US7647223B2 (en) * 2001-08-16 2010-01-12 Broadcom Corporation Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space
US7617096B2 (en) * 2001-08-16 2009-11-10 Broadcom Corporation Robust quantization and inverse quantization using illegal space
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
JP2005202262A (ja) * 2004-01-19 2005-07-28 Matsushita Electric Ind Co Ltd 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム
JP4599558B2 (ja) * 2005-04-22 2010-12-15 国立大学法人九州工業大学 ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
US20090198491A1 (en) * 2006-05-12 2009-08-06 Panasonic Corporation Lsp vector quantization apparatus, lsp vector inverse-quantization apparatus, and their methods
US8189621B2 (en) * 2006-05-12 2012-05-29 Microsoft Corporation Stack signaling to application with lack of requested bandwidth
WO2008047795A1 (fr) * 2006-10-17 2008-04-24 Panasonic Corporation Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
US8144793B2 (en) 2006-12-12 2012-03-27 Microsoft Corporation Cognitive multi-user OFDMA
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
US20080162150A1 (en) * 2006-12-28 2008-07-03 Vianix Delaware, Llc System and Method for a High Performance Audio Codec
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
US8195452B2 (en) 2008-06-12 2012-06-05 Nokia Corporation High-quality encoding at low-bit rates
ES2639747T3 (es) 2008-07-10 2017-10-30 Voiceage Corporation Dispositivo y método para cuantificar filtros de LPC en una súper-trama
EP2304722B1 (de) 2008-07-17 2018-03-14 Nokia Technologies Oy Verfahren und vorrichtung zur schnellen suche des nächsten nachbarn für vektorquantisierer
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN104751850B (zh) * 2013-12-25 2021-04-02 北京天籁传音数字技术有限公司 一种用于音频信号的矢量量化编解码方法及装置
CN113470691B (zh) * 2021-07-08 2024-08-30 浙江大华技术股份有限公司 一种语音信号的自动增益控制方法及其相关装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0241170B1 (de) * 1986-03-28 1992-05-27 AT&T Corp. Anordnung zur Erzeugung eines anpassungsfähigen Spracherkennungssignals
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US5010574A (en) * 1989-06-13 1991-04-23 At&T Bell Laboratories Vector quantizer search arrangement
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
DE69022237T2 (de) * 1990-10-16 1996-05-02 Ibm Sprachsyntheseeinrichtung nach dem phonetischen Hidden-Markov-Modell.
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
US5426460A (en) * 1993-12-17 1995-06-20 At&T Corp. Virtual multimedia service for mass market connectivity

Also Published As

Publication number Publication date
EP0751496B1 (de) 2000-04-19
EP0751496A3 (de) 1997-01-22
EP0577488B9 (de) 2007-10-03
EP0577488A1 (de) 1994-01-05
US5787391A (en) 1998-07-28
EP0577488B1 (de) 1997-04-09
DE69309557D1 (de) 1997-05-15
EP0751496A2 (de) 1997-01-02
DE69309557T2 (de) 1997-10-09
DE69328450D1 (de) 2000-05-25

Similar Documents

Publication Publication Date Title
DE69328450T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69227401T2 (de) Verfahren zum Kodieren und Dekodieren von Sprachsignalen
DE69634179T2 (de) Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
DE19647298C2 (de) Kodiersystem
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69836624T2 (de) Audiokodierer und -dekodierer
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
DE60226308T2 (de) Quantisierung der Anregung in einem Geräuschrückkopplungskodierungssytem mit allgemeiner Rauschformung
DE69530442T2 (de) Vorrichtung zur Sprachkodierung
DE69529672T2 (de) System zur sprachkodierung
DE69521164T2 (de) System zum Kodieren und Dekodieren von Signalen
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE69329569T2 (de) Digitale Kodierung von Sprachsignalen
DE69223335T2 (de) Sprachkodiersystem
DE69526017T2 (de) Vorrichtung zur Vektorquantisierung
DE69033510T2 (de) Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE69610915T2 (de) Verfahren zur quantisierung des verstärkungsfaktors für die linear-prädiktive sprachkodierung mittels analyse-durch-synthese
DE60309651T2 (de) Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens
DE69615870T2 (de) Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
DE69725945T2 (de) Sprachkodierer mit niedriger Bitrate
DE69624449T2 (de) Vorrichtung zur Sprachkodierung
DE60214121T2 (de) Quantisierung der Anregung bei einem &#34;noise-feedback&#34; Kodierungsverfahren
DE69329476T2 (de) Sprachkodierungsystem

Legal Events

Date Code Title Description
8363 Opposition against the patent
8365 Fully valid after opposition proceedings