[go: up one dir, main page]

DE60029990T2 - Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer - Google Patents

Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer Download PDF

Info

Publication number
DE60029990T2
DE60029990T2 DE60029990T DE60029990T DE60029990T2 DE 60029990 T2 DE60029990 T2 DE 60029990T2 DE 60029990 T DE60029990 T DE 60029990T DE 60029990 T DE60029990 T DE 60029990T DE 60029990 T2 DE60029990 T2 DE 60029990T2
Authority
DE
Germany
Prior art keywords
gain
factor
signal
codevector
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60029990T
Other languages
English (en)
Other versions
DE60029990D1 (de
Inventor
Bruno Rock Forest BESSETTE
Redwan Sherbrooke SALAMI
Roch Canton de Magog LEFEBVRE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VoiceAge Corp
Original Assignee
VoiceAge Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4164645&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60029990(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceAge Corp filed Critical VoiceAge Corp
Publication of DE60029990D1 publication Critical patent/DE60029990D1/de
Application granted granted Critical
Publication of DE60029990T2 publication Critical patent/DE60029990T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuits Of Receivers In General (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Stereophonic System (AREA)

Description

  • Hintergrund der Erfindung
  • 1. Fachgebiet der Erfindung
  • Die vorliegende Erfindung betrifft ein Verfahren zum Glätten des Verstärkungsfaktors und eine Vorrichtung, welche in einem Breitband-Signalcodierer eingebaut ist.
  • 2. Kurze Beschreibung des Standes der Technik
  • Für viele Anwendungen, wie Audio-Video-Telekonferenzen, Multimedia- und drahtlose Anwendungen, wie auch bei Anwendungen im Internet und bei Paketnetzen, wächst der Bedarf nach effizienten digitalen Breitband-Sprach- bzw. Audio-Codierungsverfahren mit einem guten Kompromiß zwischen subjektiver Qualität und Bit-Rate. Bis vor kurzem wurden bei Sprachcodierungsanwendungen hauptsächlich in einem Bereich von 200 Hz bis 3400 Hz gefilterte Telefonbandbreiten angewandt. Es gibt jedoch einen wachsenden Bedarf Breitband-Sprachanwendungen, um die Verständlichkeit und Natürlichkeit der Sprachsignale zu verbessern. Es wurde gefunden, daß eine Bandbreite im Bereich von 50 Hz bis 7000 Hz ausreicht, um eine Sprachqualität wie von Angesicht zu Angesicht zu erreichen. Für Audiosignale ergibt dieser Bereich eine akzeptable Audio-Qualität, aber diese ist immer noch geringer als die CD-Qualität, bei welcher im Bereich von 20 Hz bis 20000 Hz gearbeitet wird.
  • Ein Sprachcodierer wandelt ein Sprachsignal in einen digitalen Bitstrom um, welcher über einen Kommunikationskanal übertragen (oder in einem Speichermedium gespeichert) wird. Das Sprachsignal wird digitalisiert (abgetastet und üblicherweise mit 16 Bit pro Abtastung quantisiert), und der Sprachcodierer hat die Aufgabe, diese digitalen Abtastungen mit einer kleineren Anzahl von Bits darzustellen und dabei eine gute subjektive Sprachqualität aufrecht zu erhalten. Der Sprachdecodierer oder Synthesizer bearbeitet den übertragenen bzw. gespeicherten Bitstrom, um ihn in ein Tonsignal, beispielsweise in ein Sprach- bzw. Audiosignal, zurückzuverwandeln.
  • Eines der besten Verfahren des Standes der Technik zur Erreichung eines guten Kompromisses zwischen guter Qualität und Bit-Rate ist das sogenannte CELP-Verfahren (Code Excited Linear Prediction, dt.: codeangeregte Linearprädiktion). Nach diesem Verfahren wird das abgetastete Sprachsignal in aufeinanderfolgenden Blöcken von L Abtastungen, die gewöhnlich als Datenübertragungsblock bezeichnet werden, bearbeitet, wobei L irgendeine vorgegebene Zahl (entsprechend etwa einer Sprachdauer von 10 ms bis 30 ms) ist. Beim CELP-Verfahren wird ein Linearprädiktions(LP)-Synthesefilter berechnet und mit jedem Datenübertragungsblock übertragen. Der L-Abtastungs-Datenübertragungsblock wird dann in kleinere Blöcke mit der Größe von N Abtastungen unterteilt, die als Unter-Datenübertragungsblöcke bezeichnet werden, wobei L = kN und k die Anzahl der Unter-Datenübertragungsblöcke in einem Datenübertragungsblock ist (N entspricht üblicherweise einer Sprachdauer von 4 ms bis 10 ms). In jedem Unter-Datenübertragungsblock wird ein Erregungssignal erzeugt, das üblicherweise aus zwei Komponenten besteht: eine aus der letzten Erregung (auch als Tonhöhenbeitrag oder adaptives Codeverzeichnis bezeichnet) und die andere aus einem innovativen Codeverzeichnis (auch als festes Codeverzeichnis bezeichnet). Dieses Erregungssignal wird übertragen und im Decodierer als Eingang des Linearprädiktions-Synthesefilters benutzt, um eine synthetisierte Sprache zu erhalten.
  • Ein innovatives Codeverzeichnis im Zusammenhang mit dem CELP-Verfahren ist ein indexierter Satz N-Abtastungen langer Folgen, welche als N-dimensionale Codevektoren bezeichnet werden sollen. Jede Codeverzeichnisfolge ist durch eine ganze Zahl k indexiert, welche von 1 bis M reicht, wobei M die Größe des Codeverzeichnisses darstellt, welche oftmals als eine Anzahl von Bits ausgedrückt wird, wobei M = 2b ist.
  • Um Sprache nach dem CELP-Verfahren zu synthetisieren, wird jeder Block von N Abtastungen synthetisiert, indem ein geeigneter Codevektor aus dem innovativen Codeverzeichnis durch Zeitvariationsfilter die spektralen Charakteristiken des Sprachsignals modelliert. Am Codierungs-Ende wird der Syntheseausgang für alle Codevektoren aus dem innovativen Codeverzeichnis oder einem Untersatz davon (Codeverzeichnis-Suche) berechnet. Der gespeicherte Codevektor ist entsprechend einem wahrnehmungsgewichteten Verzerrungsmaß der der Originalsprache am nächsten kommende Synthese-Ausgang. Diese Wahrnehmungsgewichtung wird unter Anwendung eines sogenannten Wahnehmungsgewichtungsfilters durchgeführt, das üblicherweise aus dem Linearprädiktions-Synthesefilter abgeleitet wird.
  • Das CELP-Modell ist bei der Codierung von Telefonband-Schallsignalen sehr erfolgreich angewandt worden, und in einem weiten Bereich von Anwendungen, insbesondere bei Mobilfunk-Anwendungen, existieren einige Standards auf der Basis von CELP. Im Telefonband wird das Schallsignal in der Bandbreite auf 200 Hz bis 3400 Hz begrenzt und mit 8000 Abtastungen pro Sekunde abgetastet. Bei Breitband-Sprach- bzw. Audio-Anwendungen wird das Schallsignal in der Bandbreite auf 50 Hz bis 7000 Hz begrenzt und mit 16000 Abtastungen pro Sekunde abgetastet.
  • Wenn das für das Telefonband optimierte CELP-Modell auf Breitbandsignale angewandt wird, treten einige Schwierigkeiten auf, und es wird notwendig, dem Modell zusätzliche Merkmale hinzuzufügen, um Breitbandsignale hoher Qualität zu erhalten. Breitbandsignale weisen im Vergleich mit Telefonbandsignalen einen wesentlich breiteren Dynamikbereich auf, was zu Genauigkeitsproblemen führt, wenn eine Festpunkt-Implementierung des Algorithmus erforderlich ist (was bei Drahtlos-Anwendungen wichtig ist). Weiterhin wird das CELP-Modell oftmals die meisten seiner Codierungsbits im Niederfrequenzbereich verbrauchen, welcher üblicherweise einen höheren Energiegehalt hat, was ein Tiefpaß-Ausgangssignal zur Folge hat.
  • Die Veröffentlichung US-A-5 195 168 beschreibt eine Vorrichtung, um ein Signal im wesentlichen zu rekonstruieren. Das Signal wird in aufeinanderfolgende Zeitintervalle unterteilt. Jedes Zeitintervall hat ein Eingangsreferenzsignal mit einem Satz von Vektoren sowie mindestens ein repräsentatives elektrisches Signal für jedes Eingangsreferenzsignal. Die Vorrichtung verwendet eine Codeverzeichniseinheit mit einem Codeverzeichnisspeicher, eine Verstärkungsfaktor-Einstellvorrichtung, eine Syntheseeinheit mit einem Synthesefilter, eine Antennenweiche sowie eine Wahrnehmungsgewichtungseinheit, welche die repräsentativen elektrischen Signale verwendet, um im Hinblick auf eine Rekonstruktion des Signals im wesentlichen einen zusammengehörigen Satz synthetisierter Signalvektoren zu erzeugen.
  • Für jeden Vektor des Eingangsreferenzsignals wird vom Codeverzeichnisspeicher ein spezieller Erregungscodeverzeichnisvektor bereitgestellt, wobei im Codeverzeichnisspeicher ein Satz von Erregungscodeverzeichnisvektoren gespeichert ist. Wenn es gewünscht wird, multipliziert die Verstärkungsfaktor-Einstellvorrichtung als Reaktion auf den speziellen Erregungscodeverzeichnisvektor diesen Codevektor mit einem ausgewählten Erregungsverstärkungsfaktor, um für jeden Eingangsreferenzsignalvektor im wesentlichen eine Korrelation mit der Energie des repräsentativen elektrischen Signals zu erzeugen. Das entsprechende Interpolationssynthesefilter erzeugt dann als Reaktion auf den speziellen Erregungscodevektor, multipliziert mit dem speziellen Verstärkungsfaktor, den synthetisierten Signalvektor.
  • Ein bei synthetisierten Spachsignalen festgestelltes Problem besteht in einer Verminderung der Decodiererleistung, wenn im abgetasteten Sprachsignal ein Hintergrundrauschen vorhanden ist. Das CEPL-Verfahren verwendet am Decodierer-Ende Nachfilter- und Nachbearbeitungsverfahren, um das erhaltenen synthetisierte Signal zu verbessern. Diese Verfahren müssen zur Eignung für Breitbandsignale angepaßt werden.
  • Zusammenfassung der Erfindung
  • Um das oben diskutierte Problem des Standes der Technik zu überwinden, wird durch die vorliegende Erfindung ein Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor bei der Decodierung eines codierten Breitbandsignals aus einem Satz von Signalcodierungsparametern vorgesehen. Dieses Verfahren umfaßt das Finden eines Codevektors und eines Verstärkungsfaktors in bezug auf mindestens einen ersten und mindestens einen zweiten Signalcodierungsparameter dieses Satzes, das Berechnen eines ersten Faktors, welcher repräsentativ für einen Grad der Stimmhaftigkeit im Breitbandsignal ist, als Reaktion auf mindestens einen dritten Signalcodierungsparameter des Satzes, das Berechnen eines zweiten Faktors, welcher repräsentativ für einen Stabilitätsgrad des Breitbandsignals ist, als Reaktion auf mindestens einen vierten Signalcodierungsparameter dieses Satzes, das Berechnen eines geglätteten Verstärkungsfaktors unter Anwendung einer nichtlinearen Operation in bezug auf den ersten und zweiten Faktor und die Anwendung auf den gefundenen Verstärkungsfaktor und das Verstärken des gefundenen Codevektors mit dem geglätteten Verstärkungsfaktor, um dadurch den Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  • Die vorliegende Erfindung betrifft auch ein Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Signals aus einem Satz von Signalcodierungsparametern, wobei das Signal ein stationäres Hintergrundrauschen enthält. Dieses Verfahren umfaßt das Finden eines Codevektors und eines Verstärkungsfaktors in bezug auf mindestens einen ersten und mindestens einen zweiten Signalcodierungsparameter des Satzes, das Berechnen mindestens eines Faktors, welcher kennzeichnend für den Pegel des stationären Hintergrundrauschens in dem Signal als Reaktion auf mindestens einen dritten Signalcodierungsparameter dieses Satzes ist, das Berechnen eines geglätteten Verstärkungsfaktors unter Anwendung einer nichtlinearen Operation in bezug auf den für den Rauschpegel kennzeichnenden Faktor und die Anwendung auf den gefundenen Verstärkungsfaktor und das Verstärken des gefundenen Codevektors mit dem geglätteten Verstärkungsfaktor, um dadurch den Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  • Dementsprechend nutzt die vorliegende Erfindung ein Merkmal zum Glätten des Verstärkungsfaktors, um Breitbandsignale (50 Hz bis 7000 Hz) vorzugsweise, aber nicht ausschließlich mittels CELP-Codierungsverfahren effektiv zu codieren, um ein rekonstruiertes (synthetisiertes) Signal hoher Qualität, insbesondere bei der Anwesenheit von Hintergrundrauschen im abgetasteten Breitbandsignal, zu erhalten.
  • Entsprechend bevorzugter Ausführungsformen des Verfahrens zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor:
    • • umfaßt das Finden eines Codevektors das Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf mindestens einen ersten Signalcodierungsparameter;
    • • umfaßt das Finden eines Verstärkungsfaktors das Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors;
    • • umfaßt der erste Signalcodierungsparameter einen Innovations-Codeverzeichnisindex;
    • • umfaßt der mindestens eine dritte Codierungsparameter die folgenden Parameter: einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Verstärkungsfaktor; eine während der Codierung des Breitbandsignals berechnete Tonhöhen-Verzögerung; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des berechneten Tonhöhen-Codevektors angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex.
    • • umfaßt der mindestens eine dritte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters;
    • • der innovative Codevektor wird in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses gefunden, wobei dieser Index k den mindestens einen ersten Signalcodierungsparameter bildet;
    • • umfaßt das Berechnen eines ersten Faktors das Berechnen eines Stimmfaktors rv nach der folgenden Beziehung: rv = (Ev – Ec)/(Ev + Ec)wobei: • Ev die Energie eines skalierten adaptiven Codevektors bvT ist; • Ec die Energie eines skalierten Innovations-Codevektors gck ist; • b ein während der Codierung des Breitbandsignals berechneter Tonhöhen-Verstärkungsfaktor ist; • T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; • vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; • g ein während der Codierung des Breitbandsignals berechneter innovativer Codeverzeichnis-Verstärkungsfaktor ist; • k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und • cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
    • • der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
    • • umfaßt das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung: λ = 0,5(1 – rv).
    • • zeigt ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal an;
    • • umfaßt das Berechnen eines zweiten Faktors das Bestimmen eines Abstandsmaßes, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilter angibt;
    • • wird das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet und umfaßt das Bestimmen eines Abstandsmaßes das Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertragungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung:
      Figure 00070001
      wobei p die Ordnung des Linearprädiktionsfilters ist;
    • • umfaßt das Berechnen eines zweiten Faktors die Kartierung des Immitanz-Spektralpaar-Abstandsmaßes Ds zu diesem zweiten Faktor Θ nach der folgenden Beziehung: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≤ 1.
    • • umfaßt das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘ
    • • hat der Faktor Sm einen Wert, welcher sich für ein stimmloses und stabiles Breitbandsignal an einen Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an einen Wert 0 annähert;
    • • umfaßt das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1 und
    • • umfaßt das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert;
    • • umfaßt das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘ
    • • und das Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung: gs = Sm·g0 + (1 – Sm)·g.
  • Die vorliegende Erfindung betrifft weiterhin:
    • • den Einsatz des oben beschriebenen Verfahrens, eine Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor beim Decodieren eines codierten Breitbandsignals aus einem Satz von Signalcodierungsparametern und
    • • ein zellulares Kommunikationssystem, ein Netzwerkelement und ein drahtloses Zweirichtungs-Kommunikationsuntersystem, in welche die oben genannte Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Breitbandsignals aus einem Satz von Signalcodierungsparametern eingebaut ist.
  • Die oben genannten und andere Gegenstände, Vorteile und Merkmale der vorliegenden Erfindung werden nach dem Lesen der nachfolgenden, nicht einschränkenden Beschreibung einer bevorzugten Ausführungsform derselben noch deutlicher hervortreten, wobei diese zur Illustration nur in Verbindung mit den beigefügten Zeichnungen dient.
  • Kurze Beschreibung der Zeichnungen
  • In den beigefügten Zeichnungen ist dargestellt:
  • 1 ist ein schematisches Blockschaubild eines Breitbandcodierers;
  • 2 ist ein schematisches Blockschaubild eines Breitbanddecodierers, in welchem das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung zum Glätten des Verstärkungsfaktors realisiert sind;
  • 3 ist ein schematisches Blockschaubild einer Vorrichtung zur Tonhöhenanalyse;
  • 4 ist ein vereinfachtes schematisches Blockschaubild eines zellularen Kommunikationssystems, in welchem der Breitbandcodierer von 1 und der Breitbanddecodierer von 2 angewandt werden können; und
  • 5 ist ein schematisches Flußschaubild des Verfahrens zum Glätten des Verstärkungsfaktors, realisiert im Breitbanddecoder von 2.
  • Detaillierte Beschreibung der bevorzugten Ausführungsform
  • Wie es der Fachwelt bekannt ist, stellt ein zellulares Kommunikationssystem 401 (siehe 4) einen Telekommunkationsservice für einen großen geographischen Bereich bereit, indem dieser große geographische Bereich in eine Anzahl C kleinerer Zellen unterteilt wird. Der Service in den C kleineren Zellen wird von den jeweiligen Zellularbasisstationen 4021, 4022, ... 402C versehen, um jede Zelle mit Funkmelde-, Audio- und Datenkanälen zu versorgen.
  • Funkmeldekanäle werden benutzt, um innerhalb der Grenzen des Erfassungsbereiches (Zelle) der Zellularbasisstation 402 zu einem mobilen Funktelefon (mobile Sender-Empfänger-Einheit), wie beispielsweise 403, weiterzuschalten und Anrufe zu anderen Funktelefonen 403 entweder innerhalb oder außerhalb der Zelle der Basisstation oder auch in einem anderen Netz, wie beispielsweise in einem öffentlichen Selbstwählferndienstnetz (SWFD) 404, anzumelden.
  • Wenn ein Funktelefon 403 einen Anruf erfolgreich angemeldet oder empfangen hat, wird zwischen diesem Funktelefon 403 und der Zellularbasisstation 402, welche der Zelle entspricht, in welcher sich das Funktelefon 403 befindet, ein Audio- oder Datenkanal aufgebaut, und die Kommunikation zwischen der Basisstation 402 und dem Funktelefon 403 erfolgt über diesen Audio- oder Datenkanal. Das Funktelefon 403 kann bei einem weiterlaufenden Anruf über den Meldekanal auch Steuer- oder Taktinformationen empfangen.
  • Wenn ein Funktelefon 403 eine Zelle verläßt und in eine andere benachbarte Zelle eintritt während noch ein Anruf läuft, übergibt das Funktelefon 403 den Anruf an einen verfügbaren Audio- oder Datenkanal der Basisstation 402 der neuen Zelle. Wenn ein Funktelefon 403 eine Zelle verläßt und in eine andere benachbarte Zelle eintritt während kein Anruf läuft, sendet das Funktelefon 403 eine Steuerungsnachricht über den Meldekanal, um sich bei der Basissta tion 402 der neuen Zelle einzuloggen. Auf diese Weise ist eine mobile Kommunikation über einen großen geographischen Bereich möglich.
  • Das zellulare Kommunikationssystem 401 umfaßt ferner einen Steuerterminal 405, um die Kommunikation zwischen zellularen Basisstationen 402 und dem SWFD 404 beispielsweise während einer Kommunikation zwischen einem Funktelefon 403 und dem SWFD 404 oder zwischen einem Funktelefon 403 in einer ersten Zelle und einem Funktelefon 403, das sich in einer zweiten Zelle befindet, zu steuern.
  • Selbstverständlich ist ein drahtloses Zweirichtungs-Kommunikationsuntersystem erforderlich, um einen Audio- oder Datenkanal zwischen einer Basisstation 402 einer Zelle und einem in dieser Zelle befindlichen Funktelefon 403 aufzubauen. Wie es in 4 in einer sehr vereinfachten Form dargestellt ist, umfaßt ein solches drahtloses Zweirichtungs-Kommunikationsuntersystem typischerweise im Funktelefon 403:
    • – einen Sender 406 mit: – einem Codierer 407 zur Sprachcodierung und – eine Sendeschaltung 408, um die codierte Sprache vom Codierer 407 über eine Antenne, wie 409, zu senden sowie
    • – einen Empfänger 410 mit: – einer Empfangsschaltung 411 zum Empfang der gesendeten codierten Sprache üblicherweise über die gleiche Antenne 409 und – einen Decodierer 412 zum Decodieren der empfangenen codierten Sprache aus der Empfangsschaltung 411.
  • Das Funktelefon 403 umfaßt ferner andere herkömmliche Funktelefonschaltungen 413, an welche der Codierer 407 und der Decodierer 412 angeschlossen sind, um deren Signale zu verarbeiten. Diese Schaltungen 413 sind der Fachwelt wohlbekannt und werden in der vorliegenden Beschreibung nicht weiter beschrieben werden.
  • Weiterhin umfaßt ein solches drahtloses Zweirichtungs-Kommunikationsuntersystem typischerweise in jeder Basisstation 402:
    • – einen Sender 414 mit: – einem Codierer 415 zur Sprachcodierung und – eine Sendeschaltung 416, um die codierte Sprache vom Codierer 415 über eine Antenne, wie 417, zu senden sowie
    • – einen Empfänger 418 mit: – einer Empfangsschaltung 419 zum Empfang der gesendeten codierten Sprache über die gleiche Antenne 417 oder eine andere Antenne (nicht dargestellt) und – einen Decodierer 420 zum Decodieren der empfangenen codierten Sprache aus der Empfangsschaltung 419.
  • Die Basisstation 402 umfaßt ferner typischerweise eine Basisstations-Steuereinheit 421 zusammen mit ihrer zugehörigen Datenbank 422 zum Steuern der Kommunikation zwischen dem Steuerterminal 405 sowie dem Sender 414 und dem Empfänger 418.
  • Wie es der Fachwelt wohlbekannt ist, ist eine Sprachcodierung erforderlich, um die zur Übertragung der Schallsignale, wie beispielsweise Sprachsignale, über das drahtlose Zweirichtungs-Kommunikationsuntersystem, d.h. zwischen einem Funktelefon 403 und einer Basisstation 402, benötigte Bandbreite zu reduzieren.
  • Linearprädiktions-Sprachcodierer (wie beispielsweise 415 und 407) arbeiten typischerweise mit 13 Kilobits/Sekunde und darunter, wie auch die codeangeregten Linearprädiktions(CELP)-Codierer, bei welchen typischerweise Linearprädiktions-Synthesefilter angewandt werden, um eine Kurzzeit-Spektralhüllkurve der Sprache zu modellieren. Die Linearprädiktions-Information wird typischerweise alle 10 oder 20 ms an den Decodierer (wie beispielsweise 420 und 412) übertragen und am Decodierungsende entnommen.
  • Die in der vorliegenden Beschreibung offenbarten neuartigen Verfahren können bei unterschiedlichen Codierern auf der Basis von Linearprädiktion Anwendung finden. Es wird jedoch bei der bevorzugten Ausführungsform ein Codierer von CELP-Typ angewandt, um diese Verfahren in nicht einschränkender Weise zu illustrieren. In gleicher Weise können solche Verfahren auch bei anderen Schallsignalen als Sprache sowie bei anderen Typen von Breitbandsignalen angewandt werden.
  • 1 zeigt ein allgemeines Blockschaltbild eines CELP-Sprachcodierers 100, welcher zur besseren Anpassung an Breitbandsignale abgewandelt wurde.
  • Das abgetastete Eingangs-Sprachsignal 114 wird in aufeinanderfolgende L-Abtastblöcke, die als „Datenübertragungsblöcke" bezeichnet werden, unterteilt. Während jedes Datenübertragungsblockes werden verschiedene Parameter, welche das Sprachsignal im Datenübertragungsblock darstellen, berechnet, codiert und gesendet. Die Linearprädiktionsparameter, welche das Linearprädiktions-Synthesefilter darstellen, werden üblicherweise für jeden Datenübertragungsblock einmal berechnet. Der Datenübertragungsblock wird ferner in kleinere Blöcke von N-Abtastungen (Blöcke der Länge N) unterteilt, in welchen die Erregungsparameter (Tonhöhe und Innovation) bestimmt werden. In der CELP-Literatur werden diese Blöcke der Länge N als „Unter-Datenübertragungsblöcke" bezeichnet, und die N-Abtastsignale in den Unter-Datenübertragungsblöcken werden als N-dimensionale Vektoren bezeichnet. Bei dieser bevorzugten Ausführungsform entspricht die Länge N 5 ms, während die Länge L 20 ms entspricht, was bedeutet, daß ein Datenübertragungsblock vier Unter-Datenübertragungsblöcke enthält (N = 80 bei einer Abtastrate von 16 kHz und gleich 64 nach der Herabsetzung auf 12,8 kHz). Verschiedene N-dimensionale Vektoren sind vom Codierungsvorgang betroffen. Eine Liste der Vektoren, die in den 1 und 2 erscheinen, wie auch eine Liste der gesendeten Parameter ist nachfolgend angegeben:
  • Liste der hauptsächlichen N-dimensionalen Vektoren:
    • s
      Breitbandsignal-Eingangssprachvektor (nach der Unterabtastung, Vorbearbeitung und Anhebung);
      sW
      gewichteter Sprachvektor;
      s0
      Nulleingangsreaktion des gewichteten Synthesefilters;
      sp
      unterabgetastetes vorbearbeitetes Signal; überabgetastetes synthetisiertes Sprachsignal;
      s'
      Synthesesignal vor der Entzerrung;
      sd
      entzerrtes Synthesesignal;
      sh
      Synthesesignal nach der Entzerrung und Nachbearbeitung;
      x
      Zielvektor für die Tonhöhensuche;
      x'
      Zielvektor für die Innovationssuche;
      h
      Impulsreaktion des gewichteten Synthesefilters;
      vT
      adaptiver (Tonhöhen-) Codeverzeichnisvektor bei der Verzögerung T;
      yT
      gefilterter Tonhöhen-Codeverzeichnisvektor (vT zusammen mit h gefaltet);
      ck
      innovativer Codevektor beim Index k (k-ter Eingang aus dem innovativen Codeverzeichnis);
      cf
      verbesserter skalierter innovativer Codevektor;
      u
      Erregungssignal;
      u'
      verbesserte Erregung;
      z
      Bandpaßfilter-Rauschsequenz;
      w'
      weiße Rauschsequenz und
      w
      skalierte Rauschsequenz.
  • Liste der gesendeten Parameter
    • STP
      Kurzzeit-Prädiktionsparameter (A(z) definierend);
      T
      Tonhöhenverzögerung (oder Tonhöhen-Codeverzeichnisindex);
      b
      Tonhöhen-Verstärkungsfaktor (oder Tonhöhen-Codeverzeichnis-Verstärkungsfaktor);
      j
      Index des am Tonhöhen-Codeverzeichnis angelegten Tiefpaßfilters;
      k
      Codevektorindex (Eingang des innovativen Codeverzeichnisses) und
      g
      Verstärkungsfaktor des innovativen Codeverzeichnisses.
  • Bei dieser bevorzugten Ausführungsform werden die STP-Parameter einmal pro Datenübertragungsblock und die übrigen Parameter viermal pro Datenübertragungsblock (d.h. mit jedem Unter-Datenübertragungsblock) übertragen.
  • Codierer 100
  • Das abgetastete Sprachsignal wird durch den Codierer 100 von 1 Block für Block codiert, wobei der Codierer in elf Module mit den Bezugszahlen 101 bis 111 unterteilt ist.
  • Die eingegebene Sprache wird in den oben erwähnten L-Abtastungsblöcken, die als Datenübertragungsblöcke bezeichnet werden, bearbeitet.
  • Bezugnehmend auf 1 wird das abgetastete Eingangs-Sprachsignal 114 in einem Unterabtastmodul 101 unterabgetastet. Beispielsweise wird das Signal unter Anwendung von Verfahren, welche der Fachwelt wohlbekannt sind, von 16 kHz auf 12,8 kHz unterabgetastet. Die Unterabtastung auf eine andere Frequenz als 12,8 kHz kann selbstverständlich ebenfalls vorgesehen werden. Die Unterabtastung erhöht die Effizienz der Codierung, da eine schmalere Frequenz-Bandbreite codiert wird. Dadurch wird auch die Algorithmen-Komplexität reduziert, da die Anzahl der Abtastungen in einem Datenübertragungsblock vermindert wird. Die Anwendung der Unterabtastung erlangt Bedeutung, wenn die Bitrate unter 16 kBit/s reduziert wird, obwohl die Unterabtastung über 16 kBit/s unwesentlich ist.
  • Nach der Unterabtastung ist der 320-Abtastungs-Datenübertragungsblock von 20 ms auf einen 256-Abtastungs-Datenübertragungsblock reduziert (Unterabtastverhältnis von 4:5).
  • Der Eingangs-Datenübertragungsblock wird dann dem fakultativen Vorbearbeitungsblock 102 zugeführt. Der Vorbearbeitungsblock 102 kann aus einem Hochpaßfilter mit einer Grenzfrequenz von 50 Hz bestehen. Das Hochpaßfilter 102 entfernt unerwünschte Klangfrequenzen unter 50 Hz.
  • Das unterabgetastete, vorbearbeitete Signal wird durch sp(n), n = 0, 1, 2, ..., L – 1 bezeichnet, wobei L die Länge des Datenübertragungsblockes ist (256 bei einer Abtastfrequenz von 12,8 kHz). Bei einer bevorzugten Ausführungsform des Anhebungsfilters 103 wird das Signal sp(n) unter Anwendung der folgenden Übertragungsfunktion angehoben: P(z) = 1 – μz–1 wobei μ ein Anhebungsfaktor mit einem Wert zwischen 0 und 1 ist (ein typischer Wert ist μ = 0,7). Es könnte auch ein Filter höherer Ordnung angewandt werden. Es sollte darauf hingewiesen werden, daß das Hochpaßfilter 102 und das Anhebungsfilter 103 ausgetauscht werden könnten, um effizientere Festpunkt-Implementierungen zu erhalten.
  • Die Funktion des Anhebungsfilters 103 besteht darin, die Hochfrequenzanteile des Eingangssignals zu verstärken. Es reduziert auch den Dynamikbereich des Eingangs-Sprachsignals, wodurch es für eine Festpunkt-Implementierung geeigneter wird. Ohne Anhebung ist eine Linearprädiktionsanalyse am Festpunkt unter Anwendung einer Einzel-Präzisionsarithmetik schwierig zu implementieren.
  • Die Anhebung spielt auch eine wichtige Rolle bei der Erzielung einer genauen Gesamt-Wahrnehmungsgewichtung des Qunatisierungsfehlers, was zur Verbesserung der Klangqualität beiträgt. Dies wird weiter unten detaillierter erläutert werden.
  • Die Ausgabe des Anhebungsfilters 103 wird mit s(n) bezeichnet. Dieses Signal wird zur Durchführung der Linearprädiktionsanalyse in einem Rechnermodul 104 verwendet. Die Linearprädiktionsanalyse ist ein Verfahren, das der Fachwelt wohlbekannt ist. Bei dieser bevorzugten Ausführungsform wird ein Autokorrelations-Lösungsansatz angewandt. Bei der Autokorrelationslösung wird das Signal zuerst unter Anwendung eines Hamming-Fensters (das gewöhnlich eine Länge von 30 ms bis 40 ms hat) mit Fenstern versehen. Die Autokorrelationswerte werden aus dem Fenstersignal berechnet, und es wird eine Levinson-Durbin-Rekursion angewandt, um die Linearprädiktionskoeffizienten ai zu berechnen, wobei i = 1, ..., p umfaßt und p die Linearprädiktionsordnung ist, welche bei der Breitbandcodierung typischerweise 16 beträgt. Die Parameter ai sind die Koeffizienten der Übertragungsfunktion des Linearprädiktionsfilters, welche durch die folgende Beziehung gegeben ist:
    Figure 00160001
  • Die Linearprädiktionsanalyse wird in einem Rechnermodul 104 durchgeführt, welcher auch die Quantisierung und die Interpolation der Linearprädiktions-Filterkoeffizienten durchführt. Die Linearprädiktions-Filterkoeffizienten werden zuerst in einen anderen Äquivalenzbereich transformiert, welcher für Quantifizierungs- und Interpolationszwecke geeigneter ist. Der Linien-Spektralpaar-(LSP) und der Immitanz-Spektralpaar-Bereich (ISP) sind zwei Bereiche, in welchen die Quantisierung und die Interpolation effizient durchgeführt werden können. die 16 Linearprädiktions-Filterkoeffizienten ai können unter Anwendung der Spalt- oder Mehrstufen-Quantisierung oder Kombinationen derselben in der Größenordnung von 30 bis 50 Bits quantifiziert werden. Der Zweck der Interpolation besteht darin, es zu ermöglichen, die Linearprädiktions-Filterkoeffzienten für jeden Unter-Datenübertragungsblock auf den neuesten Stand zu bringen, während sie nur einmal pro Datenübertragungsblock übertragen werden, was die Codiererleistung verbessert, ohne die Bitrate zu erhöhen. Die Quantisierung und Interpolation der Linearprädiktions-Filterkoeffizienten dürfte der Fachwelt ansonsten wohlbekannt sein und wird daher in der vorliegenden Beschreibung nicht weiter beschrieben werden.
  • Die folgenden Abschnitte werden die übrigen Codierungsarbeitsgänge beschreiben, welche auf der Basis von Unter-Datenübertragungsblöcken erfolgen. In der nachfolgenden Beschreibung bezeichnen das Filter A(z) das nicht quantifizierte interpolierte Linearprädiktionsfilter des Unter-Datenübertragungsblockes und das Filter A(z) das quantifizierte interpolierte Linearprädiktionsfilter des Unter-Datenübertragungsblockes.
  • Wahrnehmungsgewichtung
  • Bei den Analyse-durch-Synthese-Codierern werden die optimalen Tonhöhen- und innovativen Parameter durch Minimierung der mittleren quadratischen Abweichung zwischen der Eingangssprache und der synthetisierten Sprache in einem wahrnehmungsgewichteten Bereich gesucht. Dies entspricht der Minimierung der Abweichung zwischen einer gewichteten Eingangssprache und einer gewichteten Synthesesprache.
  • Das gewichtete Signal sw(n) wird in einem Wahrnehmungsgewichtungsfilter 105 berechnet. Traditionell ist das gewichtete Signal sw(n) durch ein Gewichtungsfilter mit einer Übertragungsfunktion W(z) in der nachfolgenden Form berechnet worden: W(z) = A(z/y1)/A(z/y2) mit 0 < y2 < y1 ≤ 1Wie es der Fachwelt wohlbekannt ist, zeigt die Analyse eines Analyse-durch-Synethese-Codierers (AbS), daß der Quantisierungsfehler durch eine Übertragungsfunktion W – 1(z) gewichtet wird, welche die Umkehrung der Übertragungsfunktion des Wahrnehmungsgewichtungsfilters 105 ist. Dieses Ergebnis ist gut beschrieben von B.S. Atal und M.R. Schroeder in „Predective coding of speech and subjective error criteria" („Prädiktionscodierung von Sprache und subjektive Fehlerkriterien") in IEEE Transaction ASSP, Band 27, Nr. 3, 5.247–254, Juni 1979. Die Übertragungsfunktion W – 1(z) zeigt wenig von der formenden Struktur des Eingangs-Sprachsignals. Daher wird das Maskierungsverhalten des menschlichen Ohrs ausgenutzt, indem der Quantisierungsfehler derart geformt wird, daß dieser in den formenden Bereichen, wo er durch die starke Signalenergie in diesen Bereichen maskiert wird, mehr Energie hat. Der Betrag der Gewichtung wird durch die Faktoren y1 und y2 gesteuert.
  • Das oben erwähnte herkömmliche Wahrnehmungsgewichtungsfilter 105 arbeitet mit Telefonbandsignalen gut. Es wurde jedoch festgestellt, daß dieses herkömmliche Wahrnehmungsge wichtungsfilter 105 für eine effiziente Wahrnehmungsgewichtung von Breitbandsignalen nicht geeignet ist. Es wurde jedoch auch gefunden, daß diesem herkömmlichen Wahrnehmungsgewichtungsfilter 105 Begrenzungen bei der Modellierung der formenden Struktur innewohnen, welche der erforderlichen spektralen Neigung zuwiderlaufen. Die spektrale Neigung ist bei Breitbandsignalen infolge des breiten Dynamikbereiches zwischen niedrigen und hohen Frequenzen stärker ausgeprägt. Nach dem Stand der Technik wurde vorgeschlagen, in W(z) ein Neigungsfilter hinzuzufügen, um die Neigung und die Formanten-Gewichtung des Breitbandeingangssignals getrennt zu steuern.
  • Eine neuartige Lösung dieses Problems besteht in der Einfügung eines Anhebungsfilters 103 in den Eingang, Berechnen des Linearprädiktionsfilters A(z) auf der Grundlage der angehobenen Sprache s(n) und der Anwendung eines abgewandelten Filters W(z) durch Fixierung seines Nenners.
  • Die Linearprädiktionsanalyse erfolgt im Modul 104 am angehobenen Signal s(n), um das Linearprädiktionsfilter A(z) zu erhalten. Auch wird ein neues Wahrnehmungsgewichtungsfilter 105 mit fixiertem Nenner benutzt. Ein Beispiel einer Übertragungsfunktion für das Wahrnehmungsgewichtungsfilter 105 ist durch die folgende Beziehung gegeben: W(z) = A(z/y1)/A(z/y2) mit 0 < y2 < y1 ≤ 1
  • Im Nenner kann eine höhere Ordnung angewandt werden. Diese Struktur entkoppelt im wesentlichen die Formanten-Gewichtung von der Neigung.
  • Anzumerken ist, daß wegen der Berechnung von A(z) auf der Basis des angehobenen Sprachsignals s(n) die Neigung des Filters 1/A(z/y1) im Vergleich zum Fall, wenn A(z) auf der Basis der Originalsprache berechnet wird, weniger ausgeprägt ist. Wegen der Durchführung der Rückentzerrung im Decodierer und der Anwendung eines Filters mit der Übertragungsfunktion: P–1(z) = 1/(1 – μz–1) wird das Quantisierungsfehlerspektrum durch ein Filter mit der Übertragungsfunktion W – 1(z)P – 1(z) geformt. Wenn y1 gleich μ gesetzt wird, was typischerweise der Fall ist, wird das Spektrum des Quantisierungsfehlers durch ein Filter geformt, dessen Übertragungsfunktion 1/A(z/y1) ist, wobei A(z) auf der Grundlage des angehobenen Sprachsignals berechnet wird. Subjektives Abhören zeigte, daß diese Struktur zur Erzielung der Fehlerformung durch eine Kombination von Anhebung und modifizierter Gewichtungsfilterung sehr effizient für die Codierung von Breitbandsignalen ist und dies zuzüglich der Vorteile einer einfachen Festpunkt-Algorithmus-Implementierung.
  • Tonhöhenanalyse
  • Um die Tonhöhenanalyse zu vereinfachen, wird im Tonhöhensuchmodul mit offener Schleife 106 unter Anwendung des gewichteten Sprachsignals sw(n) zuerst eine Tonhöhenverzögerung TOL mit offener Schleife abgeschätzt. Dann wird die Tonhöhenanalyse mit geschlossener Schleife, welche im Tonhöhensuchmodul 107 mit geschlossener Schleife auf der Basis eines Unter-Datenübertragungsblockes durchgeführt wird, auf den Bereich rund um die Tonhöhenverzögerung TOL mit offener Schleife beschränkt, was die Kompliziertheit der Suche nach den Langzeit-Linearprädiktionsparametern T und b (Tonhöhenverzögerung bzw. Tonhöhen-Verstärkungsfaktor) deutlich reduziert. Die Tonhöhenanalyse mit offener Schleife wird im Modul 106 gewöhnlich alle 10 ms (zwei Unter-Datenübertragungsblöcke) unter Anwendung von Verfahren, wie sie der Fachwelt wohlbekannt sind, durchgeführt.
  • Der Zielvektor x für die Langzeit-Prädiktionsanalyse wird zuerst berechnet. Dies erfolgt gewöhnlich durch Subtraktion der Null-Eingangs-Reaktion s0 des gewichteten Synthesefilters W(z)/Â(z) vom gewichteten Sprachsignal sw(n). Diese Null-Eingangs-Reaktion s0 wird durch einen Null-Eingangs-Reaktionsrechner 108 berechnet. Spezieller wird der Zielvektor x nach der folgenden Beziehung berechnet: x = sw – s0 wobei x der N-dimensionale Zielvektor, sw der gewichtete Sprachvektor im Unter-Datenübertragungsblock und s0 die Null-Eingangs-Reaktion des Filters W(z)/Â(z) ist, welches der Ausgang des kombinierten Filters W(z)/Â(z) infolge seiner Anfangszustände ist. Der Null-Eingangs-Reaktionsrechner 108 reagiert auf das quantifizierte interpolierte Linearprädiktions filter Â(z) vom Linearprädiktionsanalyse-, Quantisierungs- und Interpolations-Rechnermodul 104 sowie auf die im Speichermodul 111 gespeicherten Anfangszustände des gewichteten Synthesefilters W(z)/Â(z), um die Null-Eingangs-Reaktion s0 (denjenigen Teil der Reaktion auf die Anfangszustände, wie er durch Einstellen der Eingänge auf einen Wert gleich Null bestimmt wird) des Filters W(z)/Â(z) zu berechnen. Dieser Arbeitsgang ist wiederum der Fachwelt wohlbekannt und wird demzufolge nicht weiter beschrieben werden.
  • Selbstverständlich können alternative, aber mathematisch gleichwertige Lösungen angewandt werden, um den Zielvektor x zu berechnen.
  • Ein N-dimensionaler Impulsreaktionsvektor des gewichteten Synthesefilters W(z)/Â(z) wird im Impulsreaktions-Generatormodul 109 unter Verwendung der Linearprädiktions-Filterkoeffizienten A(z) und Â(z) aus dem Modul 104 berechnet. Dieser Arbeitsgang ist wiederum der Fachwelt wohlbekannt und wird demzufolge nicht weiter beschrieben werden.
  • Die Tonhöhenparameter mit geschlossener Schleife (oder das Tonhöhen-Codeverzeichnis) b, T und j werden im Tonhöhensuchmodul 107 mit geschlossener Schleife berechnet, welcher den Zielvektor x, den Impulsreaktionsvektor h sowie die Tonhöhenverzögerung TOL mit offener Schleife als Eingänge verwendet. Traditionell ist die Tonhöhenprädiktion durch ein Tonhöhenfilter mit der folgenden Übertragungsfunktion dargestellt worden: 1/(1 – bz–T)wobei b der Tonhöhen-Verstärkungsfaktor und T die Tonhöhenverzögerung ist. In diesem Falle ist der Tonhöhenbeitrag zum Erregungssignal u(n) durch bu(n – T) gegeben, wobei die Gesamt-Erregung gegeben ist durch: u(n) = bu(n – T) + gck(n)wobei g der innovative Codeverzeichnis-Verstärkungsfaktor und ck(n) der innovative Codevektor beim Index k ist.
  • Diese Darstellung hat ihre Grenzen, wenn die Tonhöhenverzögerung T kürzer ist als die Unter-Datenübertragungsblock-Länge N. In einer anderen Darstellung kann der Tonhöhenbeitrag als ein Tonhöhen-Codeverzeichnis angesehen werden, welches das letzte Erregungssignal enthält. Generell ist jeder Vektor im Tonhöhen-Codeverzeichnis die um eins verschobene Version des vorhergehenden Vektors (Entfernen einer Abtastung und Hinzufügen einer neuen Abtastung). Für Tonhöhenverzögerungen T > N ist das Tonhöhen-Codeverzeichnis gleich der Filterstruktur (1/(1 – b2 – T), und der Tonhöhen-Codeverzeichnisvektor vT(n) bei der Tonhöhenverzögerung T ist gegeben durch: vT(n) = u(n – T) für n = 0, ..., N – 1.
  • Für Tonhöhenverzögerungen T kürzer als N wird ein Vektor vT(n) durch Wiederholung der verfügbaren Abtastungen von der letzten Erregung aufgebaut bis der Vektor vollständig ist (Dies ist äquivalent mit der Filterstruktur).
  • In den neuesten Codierern wird eine höhere Tonhöhenauflösung angewandt, was die Qualität der in Sprache umgesetzten Tonsegmente wesentlich verbessert. Dies wird durch Überabtastung des letzten Erregungssignals unter Verwendung von Mehrphasen-Interpolationsfiltern erreicht. In diesem Falle entspricht der Vektor vT(n) gewöhnlich einer interpolierten Version der letzten Erregung mit einer Tonhöhenverzögerung um einen nicht ganzzahligen Wert (beispielsweise 50,25).
  • Die Tonhöhensuche besteht im Finden der besten Tonhöhenverzögerung T und des Verstärkungsfaktors b, welche die mittlere quadratische Abweichung E zwischen dem Zielvektor x und der skalierten gefilterten letzten Erregung minimieren. Der Fehler E wird ausgedrückt durch: E = ∥x – byT2 wobei yT der gefilterte Tonhöhen-Codeverzeichnisvektor bei der Tonhöhenverzögerung T:
    Figure 00210001
    ist. Es kann gezeigt werden, daß der Fehler E durch Maximierung des nachfolgenden Suchkriteriums minimiert werden kann:
    Figure 00220001
    wobei t das Vektorverhalten bezeichnet.
  • Bei der bevorzugten Ausführungsform der vorliegenden Erfindung wird eine Tonhöhenauflösung von 1/3 des Unter-Datenübertragungsblockes angewandt, und die Tonhöhensuche (Tonhöhen-Codeverzeichnis) besteht aus drei Stufen.
  • In der ersten Stufe wird die Tonhöhenverzögerung TOL mit offener Schleife in einem Tonhöhensuchmodul mit offener Schleife 106 als Reaktion auf das gewichtete Sprachsignal sw(n) abgeschätzt. Wie in der vorangehenden Beschreibung angegeben, wird diese Tonhöhenanalyse mit offener Schleife üblicherweise alle 10 ms (zwei Unter-Datenübertragungsblöcke) unter Anwendung von Verfahren durchgeführt, wie sie der Fachwelt wohlbekannt sind.
  • In der zweiten Stufe wird das Suchkriterium C in einem Suchmodul mit geschlossener Schleife 107 gesucht, um die Tonöhenverzögerungen rund um die abgeschätzte Tonhöhenverzögerung TOL mit offener Schleife ganzzahlig zu machen (üblicherweise ±5), was den Suchvorgang deutlich vereinfacht. Es kann ein einfaches Verfahren angewandt werden, um den gefilterten Codevektor yT auf den neuesten Stand zu bringen, ohne die Faltung für jede Tonhöhenverzögerung berechnen zu müssen.
  • Wenn in der zweiten Stufe eine optimale ganzzahlige Tonhöhenverzögerung gefunden ist, testet eine dritte Stufe des Suchmoduls 107 die Bruchteile rund um diese optimale ganzzahlige Tonhöhenverzögerung.
  • Wenn die Tonhöhen-Prädiktionsfunktion durch ein Filter der Form 1/(1 – bz – T) dargestellt wird, was für Tonhöhenverzögerungen T > N eine zulässige Annahme ist, zeigt das Tonhö-henfilter über den gesamten Frequenzbereich eine harmonische Struktur mit einer auf 1/T bezogenen harmonischen Frequenz. Im Falle von Breitbandsignalen ist diese Struktur nicht sehr effizient, weil die harmonische Struktur bei Breitbandsignalen nicht das ganze ausgedehnte Spektrum abdeckt. Die harmonische Struktur existiert in Abhängigkeit vom Sprachsegment nur bis zu einer bestimmten Frequenz. Um eine effiziente Darstellung des Tonhöhenbeitrages in den in Sprache umgesetzten Segmenten von Breitbandsprache zu erreichen, muß demzufolge das Tonhöhen-Prädiktionsfilter die nötige Flexibilität haben, um den Betrag der Periodizität über das Breitbandspektrum zu variieren.
  • Ein neues Verfahren, welches eine effiziente Modellierung der harmonischen Struktur des Sprachspektrums von Breitbandsignalen erreicht, wird in der vorliegenden Beschreibung dargestellt, wobei verschiedene Formen von Tiefpaßfiltern auf die letzte Erregung angewandt und das Tiefpaßfilter mit dem höheren Prädiktions-Verstärkungsfaktor ausgewählt wird.
  • Wenn eine Unter-Datenübertragungsblock-Tonhöhenauflösung angewandt wird, können die Tiefpaßfilter in die Interpolationsfilter eingeschlossen werden, welche angewandt werden, um eine höhere Tonhöhenauflösung zu erhalten. In diesem Falle wird die dritte Stufe der Tonhöhensuche, bei welcher die Bruchteile rund um die gewählte ganzzahlige Tonhöhenverzögerung geprüft werden, für die verschiedenen Interpolationsfilter mit unterschiedlicher Tiefpaßcharakteristik wiederholt und derjenige Bruchteil und Filterindex werden ausgewählt, welche das Suchkriterium C maximieren.
  • Eine einfachere Lösung zur Vervollständigung der Suche in den oben beschriebenen drei Stufen besteht darin, die optimale gebrochene Tonhöhenverzögerung unter Verwendung nur eines Interpolationsfilters mit einem bestimmten Frequenzgang zu bestimmen und am Ende die optimale Tiefpaß-Filterkennlinie durch Anwenden der verschiedenen vorgegebenen Tiefpaßfilter an den gewählten Tonhöhen-Codeverzeichnisvektor vT und Wahl desjenigen Tiefpaßfilters, welches den Tonhöhen-Prädiktionsfehler minimiert, auszuwählen. Diese technische Lösung wird unten im Detail diskutiert werden.
  • 3 zeigt ein schematisches Blockschaltbild einer bevorzugten Ausführungsform der vorgeschlagenen technischen Lösung.
  • Im Speichermodul 303 wird das letzte Erregungssignal u(n), n < 0, gespeichert. Der Tonhöhen-Codeverzeichnis-Suchmodul 301 reagiert auf den Zielvektor x, auf die Tonhöhenverzöge rung TOL mit offener Schleife und auf das letzte Erregungssignal u(n), n < 0 aus dem Speichermodul 303, um eine Tonhöhen-Codeverzeichnissuche durchzuführen, welche das oben definierte Suchkriterium C minimiert. Aus dem Ergebnis der im Modul 301 durchgeführten Suche erzeugt der Modul 302 einen optimalen Tonhöhen-Codeverzeichnisvektor vT. Man beachte, daß wegen der Verwendung einer Unterabtastungs-Tonhöhenauflösung (gebrochene Tonhöhe) das letzte Erregungssignal u(n), n < 0, interpoliert wird und der Tonhöhen-Codeverzeichnisvektor vT dem interpolierten letzten Erregungssignal entspricht. Bei dieser bevorzugten Ausführungsform hat das Interpolationsfilter (im Modul 301, aber nicht dargestellt) eine Tiefpaßfiltercharakteristik und entfernt Frequenzanteile über 7000 Hz.
  • Bei der bevorzugten Ausführungsform wird eine K-Filtercharakteristik angewandt. Diese Filtercharakteristik könnte eine Tiefpaß- oder eine Bandpaßcharakteristik sein. Wenn der optimale Codevektor vT bestimmt ist und vom Tonhöhen-Codevektorgenerator 302 geliefert wird, werden K gefilterte Versionen des Codevektors vT berechnet und zwar unter Verwendung von K unterschiedlichen Frequenzformfiltern, wie 305(j) , wobei j = 1, 2, ..., K ist. Diese gefilterten Versionen werden mit vf (j) bezeichnet, wobei j = 1, 2, ..., K ist. Die unterschiedlichen Vektoren vf (j) werden in entsprechenden Modulen 304(j) mit der Impulsreaktion h gefaltet, wobei j = 0, 1, 2, ..., K ist, um die Vektoren y(j) zu erhalten, wobei j = 0, 1, 2, ..., K ist.
  • Um den mittleren quadratischen Prädiktionsfehler für jeden Vektor y(j) zu berechnen, wird der Wert y(j) mittels eines entsprechenden Verstärkers 307(j) mit dem Verstärkungsfaktor b multipliziert und der Wert by(j) mittels eines entsprechenden Subtrahierers 308(j) vom Zielvektor x subtrahiert. Ein Wähler 309 wählt das Frequenzformungsfilter 305(j) , welches den mittleren quadratischen Tonhöhen-Prädiktionsfehler minimiert. e(j) = ∥x – b(j)y(j)2 j = 1, 2, ..., K
  • Um den mittleren quadratischen Tonhöhen-Prädiktionsfehler e(j) für jeden Wert von y(j) zu berechnen, wird der Wert y(j) mittels eines entsprechenden Verstärkers 307(j) mit dem Verstärkungsfaktor b multipliziert und der Wert b(j)y(j) mittels eines entsprechenden Subtrahierers 308(j) vom Zielvektor x subtrahiert. Jeder Verstärkungsfaktor b(j) wird in einem entsprechenden Rechner 306(j) in Verbindung mit dem Frequenzformungsfilter beim Index j unter Verwendung der folgenden Beziehung berechnet: b(j) = x'y(j)/∥y(j)2
  • Im Selektor 309 werden die Parameter b, T und j auf der Basis von vT bzw. vf (j) ausgewählt, wodurch der mittlere quadratische Tonhöhen-Prädiktionsfehler e minimiert wird.
  • Zur 1 wird der Tonhöhen-Codeverzeichnisindex T codiert und zum Multiplexer 112 übertragen. Der Tonhöhen-Verstärkungsfaktor b wird quantifiziert und ebenfalls zum Multiplexer 112 übertragen. Mit dieser neuartigen Lösung ist eine gesonderte Information erforderlich, um den Index j des ausgewählten Frequenzformungsfilters im Multiplexer 112 zu codieren. Wenn beispielsweise drei Filter angewandt werden (j = 0, 1, 2, 3), dann sind zwei Bits erforderlich, um diese Information darzustellen. Die Filterindex-Information j kann auch gemeinsam mit dem Tonhöhen-Verstärkungsfaktor b codiert werden.
  • Suche nach dem innovativen Codeverzeichnis
  • Wenn die Tonhöhe oder die Langzeit-Prädiktionsparameter b, T und j bestimmt sind, besteht der nächste Schritt in der Suche nach der optimalen innovativen Erregung mittels des Suchmoduls 110 von 1. Zuerst wird der Zielvektor durch Subtraktion des Langzeit-Prädiktionsbeitrages auf den neuesten Stand gebracht: x' = x – byT wobei b der Tonhöhen-Verstärkungsfaktor und yT der gefilterte Tonhöhen-Codeverzeichnisvektor ist (die letzte Erregung bei der Verzögerung T gefiltert durch ein Tiefpaßfilter und gefaltet mit der Impulsreaktion h, wie es unter Bezugnahme auf 3 beschrieben wurde).
  • Der Suchvorgang wird beim CELP-Verfahren durch das Finden des optimalen Erregungs-Codevektors ck sowie des Verstärkungsfaktors g durchgeführt, welche den mittleren quadratischen Fehler E zwischen dem Zielvektor und dem skalierten gefilterten Codevektor minimieren E = ∥x' – gHck2 wobei H eine niedere Dreiecks-Faltmatrix, abgeleitet aus dem Impulsreaktionsvektor h ist.
  • Bei der bevorzugten Ausführungsform der vorliegenden Erfindung wird die innovative Codeverzeichnissuche im Modul 110 mittels eines algebraischen Codeverzeichnisses durchgeführt, wie es in den US-Patenten Nr. 5.444.816 (Adoul u. Miterf.), erteilt am 22. August 1995; 5.699.482, erteilt Adoul u. Miterf. am 17. Dezember 1997; 5.754.976, erteilt Adoul u. Miterf. am 19. Mai 1998 und 5.701.392, erteilt Adoul u. Miterf. am 23. Dezember 1997, beschrieben ist.
  • Wenn der optimale Erregungsvektor ck und sein Verstärkungsfaktor g mittels des Moduls 110 ausgewählt sind, werden der Codeverzeichnisindex k und der Verstärkungsfaktor g codiert und an den Multiplexer 112 gesendet.
  • Bezugnehmend auf 1 werden die Parameter b, T, j, Â(z), k und g im Multiplexer 112 dem Multiplexen unterworfen, bevor sie durch den Kommunikationskanal gesendet werden.
  • Speicher auf den neuesten Stand bringen
  • Im Speichermodul 111 (1) werden die Zustände des gewichteten Synthesefilters W(z)/Â(z) durch Filtern des Erregungssignals u = gck + bvT durch ein gewichtetes Synthesefilter auf den neuesten Stand gebracht. Nach dieser Filterung werden die Zustände des Filters gespeichert und im nächsten Unter-Datenübertragungsblock als Anfangszustände zur Berechnung der Null-Eingangsreaktion im Rechnermodul 108 verwendet.
  • Wie im Falle des Zielvektors x können auch andere alternative aber mathematisch gleichwertige Lösungen, welche der Fachwelt wohlbekannt sind, angewandt werden, um die Filterzustände auf den neuesten Stand zu bringen.
  • Decodierer 200
  • Die Sprachdecodierungsvorrichtung 200 von 2 zeigt die verschiedenen Schritte, welche zwischen dem Digitaleingang 222 (Eingangsstrom vom Demultiplexer 217) und dem Sprachabtastausgang 223 (Ausgang des Addierers 221) durchgeführt werden.
  • Der Demultiplexer 217 extrahiert die Synthesemodellparameter aus den vom binären Eingangs-Kanal erhaltenen binären Informationen. Die aus jedem empfangenen Datenübertragungsblock extrahierten Parameter sind:
    • – die Kurzzeit-Prädiktionsparameter Â(z)(einmal pro Datenübertragungsblock)
    • – die Langzeit-Prädiktionsparameter T, b und j (für jeden Unter-Datenübertragungsblock) und
    • – der Innovations-Codeverzeichnisindex k und der Verstärkungsfaktor g (für jeden Unter-Datenübertragungsblock).
  • Das laufende Sprachsignal wird auf der Basis dieser Parameter synthetisiert, wie es hier nachfolgend erläutert werden wird.
  • Das innovative Codeverzeichnis 218 reagiert auf den Index k durch Erzeugung eines Innovations-Codevektors ck, welcher durch den decodierten Verstärkungsfaktor g mittels eines Verstärkers 224 skaliert wird. Bei der bevorzugten Ausführungsform wird ein innovatives Codeverzeichnis 218 zur Darstellung des innovativen Codevektors ck angewandt, wie es in den oben erwähnten US-Patenten Nr. 5.444.816; 5.699.482; 5.754.976 und 5.701.392 beschrieben ist.
  • Der am Ausgang des Verstärkers 224 erzeugte skalierte Codevektor gck wird in einem Innovationsfilter 205 bearbeitet.
  • Glättung des Verstärkungsfaktors
  • Beim Decodierer 200 von 2 wird beim innovativen Codeverzeichnis-Verstärkungsfaktor g ein nichtlineares Verstärkungsfaktor-Glättungsverfahren angewandt, um das Hintergrund-Rauschverhalten zu verbessern. Auf der Basis der Stationärität (bzw. Stabilität) und der Stimmhaftigkeit des Sprachsegments des Breitbandsignals wird der Verstärkungsfaktor g des innovativen Codeverzeichnisses 218 geglättet, am die Energie-Fluktuation der Erregung im Falle stationärer Signale zu reduzieren. Dadurch wird die Sprachcodiererleistung bei Anwesenheit stationären Hintergrundrauschens verbessert.
  • Bei einer bevorzugten Ausführungsform werden zwei Parameter benutzt, um den Betrag der Glättung zu steuern, d.h. die Stimmhaftigkeit des Unter-Datenübertragungsblockes des Breitbandsignals und die Stabilität des Linearprädiktionsfilters 206 sind beide kennzeichnend für stationäres Hintergrundrauschen im Breitbandsignal.
  • Es können unterschiedliche Verfahren zur Abschätzung des Grades der Stimmhaftigkeit im Unter-Datenübertragungsblock angewandt werden.
  • Schritt 501 (5):
  • Bei einer bevorzugten Ausführungsform wird im Stimmfaktor-Generator 204 ein Stimmfaktor rv unter Anwendung der folgenden Beziehung berechnet: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie eines skalierten Tonhöhen-Codevektors bvT und Ec die Energie eines skalierten innovativen Codevektors gck ist. Dabei ist:
    Figure 00280001
  • Anzumerken ist, daß der Stimmfaktor rv zwischen –1 und 1 liegt, wobei ein Wert von 1 reinen Stimmsignalen und ein Wert von –1 reinen Stimmlossignalen entspricht.
  • Schritt 502 (5):
  • Auf der Basis von rv wird im Verstärkungsfaktor-Glättungsrechner 228 ein Faktor λ nach der folgenden Beziehung berechnet: λ = 0,5 (1 – rv)
  • Man beachte, daß der Faktor λ auf den Umfang der Stimmlosigkeit bezogen ist, d.h. λ = 0 steht für reine Stimmsegmente und λ = 1 für reine Stimmlossegmente.
  • Schritt 503 (5):
  • In einem Stabilitätsfaktorgenerator 230 wird auf der Basis eines Abstandsmaßes, welches die Ähnlichkeit benachbarter Linearprädiktionsfilter angibt, ein Stabilitätsfaktor Θ berechnet. Es können unterschiedliche Ähnlichkeitsmaße angewandt werden. Bei dieser bevorzugten Ausführungsform werden die Linearprädiktionskoeffizienten im Immitanz-Spektralpaar quantisiert und interpoliert. Es ist daher bequem, das Abstandsmaß im Immitanz-Spektralpaar-Bereich abzuleiten. Alternativ kann die Linien-Spektralfrequenz-Darstellung des Linearprädiktionsfilters in gleicher Weise angewandt werden, um den Ähnlichkeitsabstand benachbarter Linearprädiktionsfilter zu finden. Im Stand der Technik sind auch schon andere Maße angewandt worden, wie beispielsweise das Itakura-Maß.
  • In einer bevorzugten Ausführungsform wird das Immitanz-Spektralpaar-Abstandsmaß zwischen den Immitanz-Spektralpaaren im vorliegenden Datenübertragungsblock n und dem letzten Datenübertragungsblock n – 1 in einem Stabilitätsfaktorgenerator 230 berechnet und ist durch folgende Beziehung gegeben:
    Figure 00290001
    wobei p die Ordnung des Linearprädiktionsfilters 206 ist. Man beachte, daß die ersten angewandten p-1-Immitanz-Spektralpaare Frequenzen im Bereich von 0 Hz bis 800 Hz sind.
  • Schritt 504 (5):
  • Das Immitanz-Spektralpaar-Abstandsmaß wird im Verstärkungsfaktor-Glättungsrechner 228 für einen Stabilitätsfaktor Θ im Bereich von 0 bis 1 kartiert und abgeleitet durch Θ = 1,25 – Ds/400000,0 begrenzt durch 0 ≤ Θ ≤ 1.
  • Man beachte, daß größere Werte von Θ stabileren Signalen entsprechen.
  • Schritt 505 (5):
  • Im Verstärkungsfaktor-Glättungsrechner 228 wird auf der Basis sowohl der Stimmhaftigkeit als auch der Stabilität ein Verstärkungsfaktor-Glättungsfaktor Sm berechnet und ist gegeben durch: Sm = λΘ.
  • Der Wert Sm nähert sich für stimmlose und stabile Signale dem Wert 1, was bei stationären Hintergrundrauschsignalen der Fall ist. Für reine Stimmsignale oder für unstabile Signale nähert sich der Wert Sm dem Wert 0.
  • Schritt 506 (5):
  • Im Verstärkungsfaktor-Glättungsrechner 228 wird durch Vergleich des innovativen Codeverzeichnis-Verstärkungsfaktors g mit einem Schwellwert, welcher durch den anfangsmodifizierten Verstärkungsfaktor des letzten Unter-Datenübertragungsblockes g–1 gegeben ist, ein anfangsmodifizierter Verstärkungsfaktor g0 berechnet. Wenn g größer als oder gleich g–1 ist, dann wird g0 durch stufenweise Verringerung um 1,5 dB begrenzt durch g0 ≥ g–1. Wenn g kleiner ist als g–1, dann wird g0 durch stufenweises Erhöhen von g um 1,5 dB begrenzt durch g0 ≤ g–1. Man beachte, daß die schrittweise Erhöhung des Verstärkungsfaktors einer Multiplikation mit 1,19 entspricht. Mit anderen Worten:
    wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1
    und
    wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1.
  • Schritt 507 (5):
  • Schließlich wird im Verstärkungsfaktor-Glättungsrechner 228 ein geglätteter fester Codeverzeichnis-Verstärkungsfaktor gs berechnet nach der Beziehung: gs = Sm·g0 + (1 – Sm)·g.
  • Der geglättete Verstärkungsfaktor gs wird dann zur Skalierung des innovativen Codevektors ck im Verstärker 232 verwendet.
  • Hier sei erwähnt, daß das oben beschriebene Verstärkungsfaktor-Glättungsverfahren auch bei anderen Signalen als Breitbandsignalen angewandt werden kann.
  • Periodische Anreicherung:
  • Der am Ausgang des Verstärkers 224 erzeugte skalierte Codevektor wird mittels eines frequenzabhängigen Tonhöhenverstärkers 205 bearbeitet.
  • Die Anreicherung der Periodizität des Erregungssignals u verbessert die Qualität für den Fall von in Sprache umgesetzten Elementen. Dies erfolgte in der Vergangenheit durch Filterung des Innovationsvektors aus dem innovativen Codeverzeichnis (fixiertes Codeverzeichnis) 218 durch ein Filter der Form 1/(1 – εbz – T), wobei ε ein Faktor unter 0,5 ist, welcher den Umfang der eingeführten Periodizität steuert. Diese technische Lösung ist im Falle von Breitbandsignalen wenig effizient, da es eine Periodizität über das gesamte Spektrum einführt. Eine neue alternative technische Lösung, welche Bestanteil der vorliegenden Erfindung ist, wird hier beschrieben, wonach die Periodizitätsanreicherung durch die Filterung des innovativen Codevektors ck aus dem innovativen (fixierten) Codeverzeichnis durch ein Innovationsfilter 205 (F(z)) erreicht wird, dessen Frequenzverhalten die höheren Frequenzen mehr anhebt als die niederen Frequenzen. Die Koeffizienten von F(z) werden auf den Umfang der Periodizität im Erregungssignal u bezogen.
  • Der Fachwelt sind viele Verfahren verfügbar, um gültige Periodizitätskoeffizienten zu erhalten. Beispielsweise gibt der Wert des Verstärkungsfaktors b einen Anhaltspunkt für die Periodizität. Das heißt, wenn der Verstärkungsfaktor b nahe bei 1 liegt, ist die Periodizität des Erregungssignals u hoch, und wenn der Verstärkungsfaktor b kleiner als 0,5 ist, dann ist die Periodizität gering.
  • Ein anderer effizienter Weg zur Ableitung der Filterkoeffizienten F(z), welcher bei einer bevorzugten Ausführungsform angewandt wird, bezieht sich auf den Umfang des Tonhöhenbei trages im gesamten Erregungssignal u. Dies führt zu einem Frequenzverhalten abhängig von der Periodizität der Unter-Datenübertragungsblock-Periodizität, wobei höhere Frequenzen für höhere Tonhöhen-Verstärkungsfaktoren stärker angehoben werden (stärkerer Gesamtanstieg). Das Innovationsfilter 205 hat die Wirkung einer Verminderung der Energie des innovativen Codevektors ck bei niederen Frequenzen, wenn das Erregungssignal u periodischer ist, was die Periodizität des Erregungssignals u bei niederen Frequenzen stärker anreichert als bei hohen Frequenzen. Vorgeschlagene Formen für das Innovationsfilter 205 sind: F(z) = 1 – σz–1 oder (1) F(z) = –αz + 1 – αz–1 (2)wobei σ und α periodische Faktoren sind, welche aus dem Pegel der Periodizität des Erregungssignals u abgeleitet wurden.
  • Die zweite Form von F(z) mit drei Termen wird bei der bevorzugten Ausführungsform angewandt. Der Periodizitätsfaktor α wird im Stimmfaktorgenerator 204 berechnet. Es können verschiedene Verfahren angewandt werden, um den Periodizitätsfaktor α aus der Periodizität des Erregungssignals u abzuleiten. Nachfolgend werden zwei Verfahren dargestellt:
  • Verfahren 1:
  • Zuerst wird im Stimmfaktorgenerator 204 das Verhältnis des Tonhöhenbeitrages zum Gesamt-Erregungssignal u nach der folgenden Beziehung berechnet
    Figure 00320001
    wobei vT der Tonhöhen-Codeverzeichnisvektor, b der Tonhöhen-Verstärkungsfaktor und u das Erregungssignal ist und u am Ausgang des Addierers 219 gegeben ist durch u = gck + bvT
  • Anzumerken ist, daß der Term bvT seinen Ursprung im Tonhöhen-Codeverzeichnis (adaptives Codeverzeichnis) 201 und zwar als Reaktion auf die Tonhöhenverzögerung T und den letzten Wert u, welche im Speicher 203 gespeichert sind, hat. Der Tonhöhen-Codevektor vT aus dem Tonhöhen-Codeverzeichnis 201 wird dann durch ein Tiefpaßfilter 202 bearbeitet, dessen Grenzfrequenz durch den Index j aus dem Demultiplexer 217 eingestellt wird. Der erhaltene Codevektor vT wird dann durch einen Verstärker 226 mit dem Verstärkungsfaktor b aus dem Demultiplexer 217 multipliziert, um das Signal bvT zu erhalten.
  • Der Faktor α wird im Stimmfaktorgenerator 204 nach α = qRp begrenzt durch α < qberechnet, wobei q ein Faktor ist, welcher das Ausmaß der Anreicherung steuert (bei dieser bevorzugten Ausführungsform wird q auf 0,25 eingestellt).
  • Verfahren 2:
  • Ein anderes Verfahren, das bei einer bevorzugten Ausführungsform der Erfindung zur Berechnung des Periodizitätsfaktors α benutzt wird, wird nachfolgend diskutiert werden.
  • Zuerst wird im Stimmfaktorgenerator 204 ein Stimmfaktor rv nach der Beziehung rv = (Ev – Ec)/(Ev + Ec)berechnet, wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT und Ec die Energie des skalierten innovativen Codevektors gck ist. Dabei ist:
    Figure 00330001
  • Anzumerken ist, daß die Werte von rv zwischen –1 und 1 liegen (1 entspricht reinen Stimmsignalen und –1 entspricht reinen Stimmlossignalen).
  • Bei dieser bevorzugten Ausführungsform wird der Faktor σ dann im Stimmfaktorgenerator 204 nach der Beziehung σ = 0,125(1 + rv)berechnet, was einem Wert von 0 für rein stimmlose Signale und 0,25 für reine Stimmsignale entspricht.
  • In der ersten Zwei-Term-Form von F(z) kann für den Periodizitätsfaktor σ bei den obigen Verfahren 1 und 2 näherungsweise σ = 2α angesetzt werden. In einem solchen Fall wird der Periodizitätsfaktor σ im obigen Verfahren 1 wie folgt berechnet: σ = 2gRp begrenzt durch σ < 2q
  • Bei Verfahren 2 wird der Periodizitätsfaktor σ wie folgt berechnet: σ = 0,25 (1 + rv).
  • Das verbesserte Signal cf wird demzufolge durch Filterung des skalierten innovativen Codevektors gck durch das Innovationsfilter 205 (F(z)) berechnet.
  • Das verbesserte Erregungssignal u' wird durch den Addierer 220 wie folgt berechnet: u' = cf + bvT
  • Anzumerken ist, daß dieser Vorgang nicht im Codierer 100 durchgeführt wird. Daher ist wesentlich, den Inhalt des Tonhöhen-Codeverzeichnisses 201 unter Verwendung des Erregungssignals u ohne Verbesserung auf den neuesten Stand zu bringen, um die Synchronität zwischen dem Codierer 100 und dem Decodierer 200 zu bewahren. Daher wird das Erregungssignal u verwendet, um den Speicher 203 des Tonhöhen-Codeverzeichnisses 201 auf den neues ten Stand zu bringen, und das verbesserte Erregungssignal u' wird am Eingang des Linearprädiktions-Synthesefilters 206 verwendet.
  • Synthese und Entzerrung
  • Das synthetisierte Signal s' wird durch Filterung des verbesserten Erregungssignals u' durch das Linearprädiktions-Synthesefilter 206 berechnet, welches die Form 1/Â(z) hat, wobei Â(z) das interpolierte Linearprädiktionsfilter im gegenwärtigen Unter-Datenübertragungsblock ist. Wie es in der 2 zu sehen ist, werden die quantifizierten Linearprädiktionskoeffizienten Â(z) vom Demultiplexer 217 auf der Leitung 225 dem Linearprädiktions-Synthesefilter 206 zugeführt, um die Parameter des Linearprädiktions-Synthesefilters 206 entsprechend einzustellen. Das Entzerrungsfilter 207 ist die Umkehrung des Anhebungsfilters 103 von 1. Die Übertragungsfunktion des Entzerrungsfilters 207 ist gegeben durch: D(z) = 1/(1 – μz–1)wobei μ ein Anhebungsfaktor mit einem Wert zwischen 0 und 1 ist (ein typischer Wert ist μ = 0,7). Es könnte auch ein Filter höherer Ordnung angewandt werden.
  • Die Vektoren werden durch das Entzerrungsfilter D(z) (Modul 207) gefiltert, um den Vektor sd zu erhalten, welcher durch das Hochpaßfilter 208 geleitet wird, um unerwünschte Frequenzen unter 50 Hz zu entfernen und sh zu erhalten.
  • Überabtasten und Hochfrequenz-Regenerierung
  • Der Überabtastmodul 209 führt den umgekehrten Prozeß des Unterabtastmoduls 101 von 1 durch. Bei dieser bevorzugten Ausführungsform wandelt die Überabtastung die Abtastrate von 12,8 kHz in die ursprüngliche Abtastrate von 16 kHz um, wobei Verfahren angewandt werden, wie sie der Fachwelt wohlbekannt sind. Das überabgetastete Synthesesignal wird mit S ^ bezeichnet. Das Signal S ^ wird auch als das synthetisierte Breitband-Zwischensignal bezeichnet.
  • Das überabgetastete Synthesesignal S enthält nicht die höheren Frequenzkomponenten, welche beim Unterabtastvorgang (Modul 101 von 1) im Codierer 100 verlorengegangen sind. Dies gibt dem synthetisierten Sprachsignal eine Tiefpaß-Wahrnehmung. Um das voll ständige Frequenzband des Originalsignals wiederherzustellen, wird ein Hochfrequenz-Erzeugungsvorgang beschrieben. Dieser Vorgang wird in den Modulen 210 bis 216 sowie im Addierer 221 durchgeführt und erfordert eine Eingabe vom Stimmfaktorgenerator 204 (2).
  • Bei dieser neuartigen technischen Lösung werden die Hochfrequenzbestandteile erzeugt, indem der obere Teil des Spektrums mit weißem Rauschen aufgefüllt wird, welches im Erregungsbereich exakt skaliert und dann in den Sprachbereich umgewandelt wurde, vorzugsweise durch Formung unter Anwendung des gleichen Linearprädiktions-Synthesefilters, das auch zur Synthese des unterabgetasteten Signals S ^ verwendet wurde.
  • Der Hochfrequenz-Erzeugungsvorgang wird nachfolgend beschrieben werden.
  • Der Zufallsrauschgenerator 213 erzeugt eine Sequenz weißen Rauschens w' mit einem flachen Spektrum über die gesamte Frequenzbandbreite unter Anwendung von Verfahren, welche der Fachwelt wohlbekannt sind. Die erzeugte Sequenz hat eine Länge N', welches die Länge des Unter-Datenübertragungsblockes im Originalbereich ist. Man beachte, daß N die Länge des Unter-Datenübertragungsblockes im unterabgetasteten Bereich ist. Bei dieser bevorzugten Ausführungsform entsprechen N = 64 und N' = 80 5 ms.
  • Die Sequenz des weißen Rauschens wird im Verstärkungsfaktor-Einstellmodul 214 exakt skaliert. Die Einstellung des Verstärkungsfaktors umfaßt die folgenden Schritte. Zuerst wird die Energie der erzeugten Rauschsequenz w' gleich der Energie des verbesserten Erregungssignals u' eingestellt, wobei die Berechnung in einem Energieberechnungsmodul 210 erfolgt und die resultierende skalierte Rauschsequenz ist gegeben durch:
    Figure 00360001
  • Der zweite Schritt beim Skalieren des Verstärkungsfaktors besteht darin, die Hochfrequenzanteile des synthetisierten Signals am Ausgang des Stimmfaktorgenerators 204 in Betracht zu ziehen und somit die Energie des erzeugten Rauschens im Falle von Stimmsegmenten (wo im Vergleich zu stimmlosen Segmenten weniger Energie bei hohen Frequenzen vorliegt) zu reduzieren. Bei dieser bevorzugten Ausführungsform wird die Messung des Gehaltes an hohen Frequenzen durch Messung des Anstieges des Synthesesignals durch einen Spektral-Neigungsrechner 212 und entsprechende Reduzierung der Energie realisiert. Andere Meßverfahren, wie beispielsweise Null-Schnitt-Messungen, können gleichfalls angewandt werden. Wenn die Neigung sehr stark ist, was Stimmsegmenten entspricht, wird die Rauschenergie weiter reduziert. Der Neigungsfaktor wird im Modul 212 als der erste Korrelationskoeffizient des Synthesesignals sh berechnet und ist gegeben durch:
    Figure 00370001
    unter der Bedingung, daß die Neigung ≥ 0 und ≥ rv ist, wobei der Stimmfaktor rv gegeben ist durch: rv = (Ev – Ec)/(Ev + Ec)wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT und Ec die Energie des skalierten innovativen Codevektors gck ist, wie es bereits früher beschrieben wurde. Der Stimmfaktor rv ist in den allermeisten Fällen kleiner als die Neigung, aber diese Bedingung wurde vorsorglich eingeführt und zwar als Vorsorge gegen Hochfrequenztöne, wo der Neigungswert negativ und der Wert von rv hoch ist. Demzufolge reduziert diese Bedingung die Rauschenergie für solche Tonsignale.
  • Der Neigungswert ist gleich 0 im Falle eines flachen Spektrums und er ist gleich 1 im Falle von stark stimmhaften Signalen und schließlich ist er negativ im Falle von stimmlosen Signalen, wo bei hohen Frequenzen eine hohe Energie gegeben ist.
  • Es können verschiedene Verfahren angewandt werden, um den Skalierungsfaktor gt aus dem Anteil des Hochfrequenzgehaltes abzuleiten. Bei dieser Erfindung werden zwei Verfahren angegeben, welche auf der oben beschriebenen Neigung des Signals beruhen.
  • Verfahren 1:
  • Der Skalierungsfaktor gt wird aus der Neigung wie folgt abgeleitet: gt = 1 – Neigung begrenzt durch 0,2 ≤ gt ≤ 1,0.
  • Für ein stark stimmhaftes Signal, bei welchem sich die Neigung an 1 an nähert, ist gt gleich 0,2 und für stark stimmlose Signale wird gt zu 1,0.
  • Verfahren 2:
  • Zuerst wird der Neigungsfaktor gt darauf beschränkt, daß er größer oder gleich Null ist, und dann wird der Skalierungsfaktor aus der Neigung abgeleitet durch: gt = 10–0,6 Neigung
  • Die im Verstärkungsfaktor-Einstellmodul 214 erzeugte skalierte Rauschfrequenz wg ist somit gegeben durch: wg = gtw.
  • Wenn die Neigung nahe Null liegt, liegt der Skalierungsfaktor gt nahe 1, was nicht zu einer Energiereduktion führt. Wenn der Neigungswert gleich 1 ist, führt der Skalierungsfaktor gt zu einer Reduktion der Energie des erzeugten Rauschens von 12 dB.
  • Nachdem das Rauschen präzise skaliert ist (wg), wird es unter Anwendung der Spektral-Formungseinrichtung 215 in den Sprachbereich eingebracht. Bei der bevorzugten Ausführungsform wird dies durch Filtern des Rauschens wg durch eine in der Bandbreite erweiterte Version des gleichen Linearprädiktions-Synthesefilters erreicht, wie sie im Unterabtastbereich (1/Â(z/0,8)) verwendet wurde. Die entsprechenden Koeffizienten für das in der Bandbreite erweiterte Linearprädiktionsfilter werden in der Spektral-Formungseinrichtung 215 berechnet.
  • Die gefilterte skalierte Rauschsequenz wf wird dann zur Wiedereinspeicherung im Bandpaßfilter 216 auf den erforderlichen Frequenzbereich gefiltert. Bei der bevorzugten Ausführungsform schränkt das Bandpaßfilter 21b die Rauschsequenz auf den Frequenzberich von 5,6 kHz bis 7,2 kHz ein. Die resultierende bandpaßgefilterte Rauschsequenz z wird im Addierer 221 mit dem überabgetasteten synthetisierten Sprachsignal s' addiert, um am Ausgang 223 das endgültige rekonstruierte Sprachsignal zu erhalten
  • Wenn auch die vorliegende Erfindung oben beispielhaft an einer bevorzugten Ausführungsform derselben beschrieben wurde, kann die Ausführungsform, wenn man es will, innerhalb des Schutzumfanges der beigefügten Ansprüche modifiziert werden. Wenn auch die bevorzugte Ausführungsform unter Bezugnahme auf Breitband-Sprachsignale diskutiert wird, dürfte es für den Fachmann klar sein, daß der Erfindungsgegenstand sich auch auf andere Ausführungsformen richtet, welche Breitbandsignale im allgemeinen anwenden und daß er nicht zwangsläufig auf Sprachanwendungen begrenzt ist.

Claims (92)

  1. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Breitbandsignals aus einem Satz von Signalcodierungsparametern, wobei das Verfahren umfaßt: Finden eines Codevektors (ck) und eines Verstärkungsfaktors (g) in bezug auf mindestens einen ersten (k) und mindestens einen zweiten (g) Signalcodierungsparameter dieses Satzes; Berechnen (501, 502) eines ersten Faktors (rv, λ), welcher repräsentativ für Grad der Stimmhaftigkeit im Breitbandsignal ist, als Reaktion auf mindestens einen dritten Signalcodierungsparameter (b, vT) dieses Satzes; Berechnen (503, 504) eines zweiten Faktors (Θ), welcher repräsentativ für einen Stabilitätsgrad des Breitbandsignals ist, als Reaktion auf mindestens einen vierten Signalcodierungsparameter (LP) dieses Satzes; Berechnen eines geglätteten Verstärkungsfaktors (gs) unter Anwendung einer nichtlinearen Operation in bezug auf den ersten und zweiten Faktor (rv, λ; Θ) und Anwendung auf den gefundenen Verstärkungsfaktor (g) und Verstärken des gefundenen Codevektors (cK) mit dem geglätteten Verstärkungsfaktor (gs), um dadurch den Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  2. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem: das Finden eines Codevektors das Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und das Finden eines Verstärkungsfaktors das Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors umfaßt.
  3. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem: das Finden eines Codevektors das Finden eines Codevektors in einem Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine erste Signalcodierungsparameter einen innovativen Codeverzeichnisindex umfaßt.
  4. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem: das Finden eines Codevektors das Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine dritte Signalcodierungsparameter die folgenden Parameter umfaßt: einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Verstärkungsfaktoren; eine während der Codierung des Breitbandsignals berechnete Tonhöhen-Vezögerung; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des berechneten Tonhöhen-Codevektor angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex.
  5. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem der mindestens eine vierte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters umfaßt.
  6. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem: das Finden eines Codevektors das Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses umfaßt, wobei der Index k den mindestens einen ersten Signalcodierungsparameter bildet und das Berechnen eines ersten Faktors das Berechnen eines Stimmfaktors rv nach der folgenden Beziehung umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei: – Ev die Energie eines skalierten adaptiven Codevektors bvT ist; – Ec die Energie eines skalierten innovativen Codevektors gck ist; – b ein während der Codierung des Breitbandsignals berechneter Tonhöhen-Verstärkungsfaktor ist; – T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; – vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; – g ein während der Codierung des Breitbandsignals berechneter innovativer Codeverzeichnis-Verstärkungsfaktor ist; – k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und – cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
  7. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 6, bei welchem der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
  8. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 7, bei welchem das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung umfaßt: λ = 0,5(1 – rv).
  9. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 6, bei welchem ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal anzeigt.
  10. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem das Berechnen eines zweiten Faktors das Bestimmen eines Abstandsmaßes umfaßt, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneter Linearprädiktionsfilter angibt.
  11. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 10, bei welchem: das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet wird und das Bestimmen eines Abstandsmaßes das Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertra gungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung umfaßt:
    Figure 00440001
    wobei p die Ordnung des Linearprädiktionsfilters ist.
  12. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 11, bei welchem das Berechnen eines zweiten Faktors die Kartierung des Immitanz-Spektralpaar-Abstandsmaßes DS zu diesem zweiten Faktor Θ nach der folgenden Beziehung umfaßt: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≤ 1.
  13. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung umfaßt: Sm = λΘ.
  14. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 13, bei welchem der Faktor Sm einen Wert hat, welcher sich für ein stimmloses und stabiles Breitbandsignal an den Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an den Wert 0 annähert.
  15. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem: das Finden eines Codevektors das Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt; das Breitbandsignal vor der Codierung abgetastet sowie bei der Codierung und Decodierung nach Datenübertragungsblöcken und Unter-Datenübertragungsblöcken bearbeitet wird und das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert umfaßt, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1.
  16. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 1, bei welchem das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert umfaßt.
  17. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 16, bei welchem: das Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘ sowie das Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung umfaßt: gs = Sm·g0 + (1 – Sm)·g.
  18. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Signals aus einem Satz von Signalcodierungsparametern, wobei das Signal ein stationäres Hintergrundrauschen enthält und das Verfahren umfaßt: Finden eines Codevektors (ck) und eines Verstärkungsfaktors (g) in bezug auf mindestens einen ersten (k) und mindestens einen zweiten (g) Signalcodierungsparameter dieses Satzes; Berechnen mindestens eines Faktors (rv, λ; Θ), welcher kennzeichnend für den Pegel des stationären Hintergrundrauschens in dem Signal ist, als Reaktion auf mindestens einen dritten Signalcodierungsparameter (b, vT; LP) dieses Satzes; Berechnen eines geglätteten Verstärkungsfaktors (gs) unter Anwendung einer nichtlinearen Operation in bezug auf den für den Rauschpegel kennzeichnenden Faktor (rv, λ; Θ) und Anwendung auf den gefundenen Verstärkungsfaktor (g) und Verstärken des gefundenen Codevektors (ck) mit dem geglätteten Verstärkungsfaktor (gs), um dadurch den Codevektor mit geglätteten Verstärkungsfaktor zu erzeugen.
  19. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 18, bei welchem der mindestens eine für einen Pegel des stationären Hintergrundrauschens kennzeichnende Faktor ein Faktor (rv, λ) ist, welcher repräsentativ für einen Grad der Stimmhaftigkeit im Signal ist.
  20. Verfahren zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 18, bei welchem der mindestens eine für einen Pegel des stationären Hintergrundrauschens kennzeichnende Faktor ein Faktor (Θ) ist, welcher repräsentativ für einen Stabilitätsgrad des Signals ist.
  21. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Breitbandsignals aus einem Satz von Signalcodierungsparametern, wobei diese Vorrichtung umfaßt: einen Einrichtung zum Finden eines Codevektors (ck) und eines Verstärkungsfaktors (g) in bezug auf mindestens einen ersten (k) und mindestens einen zweiten (g) Signalcodierungsparameter dieses Satzes; eine Einrichtung zum Berechnen (501, 502) eines ersten Faktors (rv, λ), welcher repräsentativ für einen Grad der Stimmhaftigkeit im Breitbandsignal ist, als Reaktion auf mindestens einen dritten Signalcodierungsparameter (b, vT) dieses Satzes; eine Einrichtung zum Berechnen (503, 504) eines zweiten Faktors (Θ), welcher repräsentativ für einen Stabilitätsgrad des Breitbandsignals ist, als Reaktion auf mindestens einen vierten Signalcodierungsparameter (LP) dieses Satzes; eine Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors (gs) unter Anwendung einer nichtlinearen Operation in bezug auf den ersten und zweiten Faktor (rv, λ; Θ) und Anwendung auf den gefundenen Verstärkungsfaktor (g) und eine Einrichtung zum Verstärken des gefundenen Codevektors (ck) mit dem geglätteten Verstärkungsfaktor (gs), um dadurch den Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  22. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors umfaßt: eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter und eine Einrichtung zum Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors.
  23. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines Codevektors in einem Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine erste Signalcodierungsparameter einen innovativen Codeverzeichnisindex umfaßt.
  24. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine dritte Signalcodierungsparameter die folgenden Parameter umfaßt: einen während der Codierung des Breitbandsignals berechneten Tonhöhen- Verstärkungsfaktor; eine während der Codierung des Breitbandsignals berechnete Tonhöhen- Verzögerung; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Codevektor angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex.
  25. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher der mindestens eine vierte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters umfaßt.
  26. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses umfaßt, wobei der Index k den mindestens einen ersten Signalcodierungsparameter bildet und die Einrichtung zum Berechnen eines ersten Faktors eine Einrichtung zum Berechnen eines Stimmfaktors rv nach der folgenden Beziehung umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei: – Ev die Energie eines skalierten adaptiven Codevektors bvT ist; – Ec die Energie eines skalierten innovativen Codevektors gck ist; – b ein während der Codierung des Breitbandsignals berechneter Tonhöhen-Verstärkungsfaktor ist; – T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; – vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; – g ein während der Codierung des Breitbandsignals berechneter innovativen Codeverzeichnis-Verstärkungsfaktor ist; – k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und – cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
  27. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 26, bei welcher der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
  28. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 27, bei welcher die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung umfaßt: λ = 0,5(1 – rv).
  29. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 28, bei welcher ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal anzeigt.
  30. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zum Bestimmen eines Abstandsmaßes umfaßt, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneter Linearprädiktionsfilter angibt.
  31. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 30, bei welcher: das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Bestimmen eines Abstandsmaßes eine Einrichtung zum Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertragungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung umfaßt:
    Figure 00510001
    wobei p die Ordnung des Linearprädiktionsfilters ist.
  32. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 31, bei welcher die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zur Kartierung des Immitanz-Spektralpaar-Abstandsmaßes Ds zu diesem zweiten Faktor Θ nach der folgenden Beziehung umfaßt: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≤ 1.
  33. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung umfaßt: Sm = λΘ.
  34. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 33, bei welcher der Faktor Sm einen Wert hat, welcher sich für ein stimmloses und stabiles Breitbandsignal an einen Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an einen Wert 0 annähert.
  35. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt; das Breitbandsignal vor der Codierung abgetastet sowie bei der Codierung und Decodierung nach Datenübertragungsblöcken und Unter-Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 umfaßt, wobei diese Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors eine Einrichtung zum Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert umfaßt, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1.
  36. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 21, bei welcher die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert umfaßt.
  37. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 36, bei welcher: die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘsowie eine Einrichtung zum Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung umfaßt: gs = Sm·g0 + (1 – Sm)·g.
  38. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor während der Decodierung eines codierten Signals aus einem Satz von Signalcodierungsparametern, wobei das Signal ein stationäres Hintergrundrauschen enthält und die Vorrichtung umfaßt: eine Einrichtung zum Finden eines Codevektors (ck) und eines Verstärkungsfaktors (g) in bezug auf mindestens einen ersten (k) und mindestens einen zweiten (g) Signalcodierungsparameter dieses Satzes; eine Einrichtung zum Berechnen mindestens eines Faktors (rv, λ; Θ), welcher kennzeichnend für den Pegel des stationären Hintergrundrauschens in dem Signal als Reaktion auf mindestens einen dritten Signalcodierungsparameter (b, vT; LP) dieses Satzes ist; eine Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors (gs) unter Anwendung einer nichtlinearen Operation in bezug auf den für den Rauschpegel kennzeichnenden Faktor (rv, λ; Θ) und Anwendung auf den gefundenen Verstärkungsfaktor (g) und eine Einrichtung zum Verstärken des gefundenen Codevektors (ck) mit dem geglätteten Verstärkungsfaktor (gs), um dadurch den Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  39. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 38, bei welcher der mindestens eine für einen Pegel des stationären Hintergrundrauschens kennzeichnende Faktor ein Faktor (rv, λ) ist, welcher repräsentativ für einen Grad der Stimmhaftigkeit im Signal ist.
  40. Vorrichtung zum Erzeugen eines Codevektors mit geglättetem Verstärkungsfaktor nach Anspruch 38, bei welcher der mindestens eine für einen Pegel des stationären Hintergrundrauschens kennzeichnende Faktor ein Faktor (Θ) ist, welcher repräsentativ für einen Stabilitätsgrad des Signals ist.
  41. Zellulares Kommunikationssystem für den Service in einem geographischen Bereich, welcher in eine Vielzahl von Zellen unterteilt ist, umfassend: mobile Sender-/Empflängereinheiten; entsprechend in den Zellen befindliche Zellularbasisstationen; eine Einrichtung zum Steuern der Kommunikation zwischen den Zellularbasisstationen; ein drahtloses Zweirichtungs-Kommunikationsuntersystem zwischen jeder in einer Zelle befindlichen mobilen Einheit und der Zellularbasisstation dieser Zelle, wobei das drahtlose Zweirichtungs-Kommunikationsuntersystem sowohl in der mobilen Einheit als auch in der Zellularbasisstaion (a) einen Sender mit einem Decodierer zur Codierung eines Breitbandsignals und eine Einrichtung zum Senden des codierten Breitbandsignals sowie (b) einen Empfänger mit einer Einrichtung zum Empfang eines gesendeten codierten Breitbandsignals und einen Decodierer zum Decodieren des empfangenen codierten Breitbandsignals umfaßt; in welchem der Decodierer eine Einrichtung zum Decodieren des empfangenen codierten Breitbandsignals als Reaktion auf einen Satz Signalcodierungsparameter umfaßt und in welchem die Breitbandsignal-Decodierungseinrichtung eine Vorrichtung nach Anspruch 21 umfaßt; um bei der Decodierung des codierten Breitbandsignals aus dem Satz von Signalcodierungsparametern einen Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  42. Zellulares Kommunikationssystem nach Anspruch 41, bei welchem die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors umfaßt: eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter und eine Einrichtung zum Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors.
  43. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines Codevektors in einem Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine erste Signalcodierungsparameter einen innovativen Codeverzeichnisindex umfaßt.
  44. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine zweite Signalcodierungsparameter die folgenden Parameter umfaßt: einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Verstärkungsfaktor; eine während der Codierung des Breitbandsignals berechnete Tonhöhen-Verzögerungen; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Codevektor angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex
  45. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem der mindestens eine vierte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters umfaßt.
  46. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses umfaßt, wobei der Index k den mindestens einen ersten Signalcodierungsparameter bildet und die Einrichtung zum Berechnen eines ersten Faktors eine Einrichtung zum Berechnen eines Stimmfaktors rv nach der folgenden Beziehung umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei: – Ev die Energie eines skalierten adaptiven Codevektors bvT ist; – Ec die Energie eines skalierten innovativen Codevektors gck ist; – b ein während der Codierung des Breitbandsignals berechneter Tonhöhen- Verstärkungsfaktor ist; – T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; – vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; – g ein während der Codierung des Breitbandsignals berechneter innovativer Codeverzeichnis-Verstärkungsfaktor ist; – k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und – cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
  47. Zellulares Kommunikationssystem, nach Anspruch 46, bei welchem der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
  48. Zellulares Kommunikationssystem, nach Anspruch 47, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung umfaßt: λ = 0,5(1 – rv).
  49. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal anzeigt.
  50. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zum Bestimmen eines Abstandsmaßes umfaßt, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneter Linearprädiktionsfilter angibt.
  51. Zellulares Kommunikationssystem, nach Anspruch 40, bei welchem: das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Bestimmen eines Abstandsmaßes eine Einrichtung zum Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertragungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung umfaßt:
    Figure 00570001
    wobei p die Ordnung des Linearprädiktionsfilters ist.
  52. Zellulares Kommunikationssystem, nach Anspruch 51, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zur Kartierung des Immitanz-Spektralpaar-Abstandsmaßes Ds zu diesem zweiten Faktor Θ nach der folgenden Beziehung umfaßt: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≤ 1.
  53. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung umfaßt: Sm = λΘ.
  54. Zellulares Kommunikationssystem, nach Anspruch 53, bei welchem der Faktor Sm einen Wert hat, welcher sich für ein stimmloses und stabiles Breitbandsignal an einen Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an einen Wert 0 annähert.
  55. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt; das Breitbandsignal vor der Codierung abgetastet sowie bei der Codierung und Decodierung nach Datenübertragungsblöcken und Unter-Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 umfaßt, wobei diese Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors eine Einrichtung zum Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert umfaßt, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1
  56. Zellulares Kommunikationssystem, nach Anspruch 41, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert umfaßt.
  57. Zellulares Kommunikationssystem, nach Anspruch 56, bei welchem: die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘsowie eine Einrichtung zum Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung umfaßt: gs = Sm·g0 + (1 – Sm)·g.
  58. Netzwerkelement, welches einen Empfänger einschließlich einer Einrichtung zum Empfang eines gesendeten codierten Breitbandsignals sowie einen Decodierer zum Decodieren des empfangenen codierten Breitbandsignals umfaßt; wobei der Decodierer eine Einrichtung umfaßt, welche auf einen Satz von Signalcodierungsparametern zum Decodieren des empfangenen Breitbandsignals reagiert und diese Breitbandsignal-Decodierungseinrichtung eine Vorrichtung nach Anspruch 21 umfaßt, um während der Decodierung des codierten Breitbandsignals aus dem Satz von Signalcodierungsparametern einen Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  59. Netzwerkelement nach Anspruch 58, bei welchem die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors umfaßt: eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter und eine Einrichtung zum Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors.
  60. Netzwerkelement nach Anspruch 58, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines Codevektors in einem Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine erste Signalcodierungsparameter einen innovativen Codeverzeichnisindex umfaßt.
  61. Netzwerkelement nach Anspruch 58, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine dritte Signalcodierungsparameter die folgenden Parameter umfaßt: einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Verstärkungsfaktor; eine während der Codierung des Breitbandsignals berechnete Tonhöhen-Verzögerung; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Codevektor angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex
  62. Netzwerkelement nach Anspruch 58, bei welchem der mindestens eine vierte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters umfaßt.
  63. Netzwerkelement nach Anspruch 58, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses umfaßt, wobei der Index k den mindestens einen ersten Signalcodierungsparameter bildet und die Einrichtung zum Berechnen eines ersten Faktors eine Einrichtung zum Berechnen eines Stimmfaktors rv nach der folgenden Beziehung umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei: – Ev die Energie eines skalierten adaptiven Codevektors bvT ist; – Ec die Energie eines skalierten innovativen Codevektors gck ist; – b ein während der Codierung des Breitbandsignals berechneter Tonhöhen-Verstärkungsfaktor ist; – T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; – vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; – g ein während der Codierung des Breitbandsignals berechneter innovativer Codeverzeichnis-Verstärkungsfaktor ist; – k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und – cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
  64. Netzwerkelement nach Anspruch 63, bei welchem der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
  65. Netzwerkelement nach Anspruch 64, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung umfaßt: λ = 0,5(1 – rv).
  66. Netzwerkelement nach Anspruch 58, bei welchem ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal anzeigt.
  67. Netzwerkelement nach Anspruch 58, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zum Bestimmen eines Abstandsmaßes umfaßt, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneter Linearprädiktionsfilter angibt.
  68. Netzwerkelement nach Anspruch 67, bei welchem das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Bestimmen eines Abstandsmaßes eine Einrichtung zum Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertragungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung umfaßt:
    Figure 00630001
    wobei p die Ordnung des Linearprädiktionsfilters ist.
  69. Netzwerkelement nach Anspruch 68, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zur Kartierung des Immitanz-Spektralpaar-Abstandsmaßes Ds zu diesem zweiten Faktor Θ nach der folgenden Beziehung umfaßt: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≥ 1.
  70. Netzwerkelement nach Anspruch 58, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung umfaßt: Sm = λΘ.
  71. Netzwerkelement nach Anspruch 70, bei welchem der Faktor Sm einen Wert hat, welcher sich für ein stimmloses und stabiles Breitbandsignal an einen Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an einen Wert 0 annähert.
  72. Netzwerkelement nach Anspruch 58, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt; das Breitbandsignal vor der Codierung abgetastet sowie bei der Codierung und Decodierung nach Datenübertragungsblöcken und Unter-Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 umfaßt, wobei diese Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors eine Einrichtung zum Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert umfaßt, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1
  73. Netzwerkelement nach Anspruch 58, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors das Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert umfaßt.
  74. Netzwerkelement nach Anspruch 73, bei welchem: die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘsowie eine Einrichtung zum Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung umfaßt: gs = Sm·g0 + (1 – Sm)·g.
  75. Drahtloses Zweirichtungs-Kommunikationsuntersystem zwischen jedem Paar aus einer mobilen Einheit und einer Basisstation in einem Kommunikationssystem für den Service in einem geographischen Bereich, wobei das drahtlose Zweirichtungs-Kommunikationsuntersystem sowohl in der mobilen Einheit als auch in der Basisstation (a) einen Sender mit einem Decodierer zur Codierung eines Breitbandsignals und eine Einrichtung zum Senden des codierten Breitbandsignals sowie (b) einen Empfänger mit einer Einrichtung zum Empfang eines gesendeten codierten Breitbandsignals und einen Decodierer zum Decodieren des empfangenen codierten Breitbandsignals umfaßt; in welchem der Decodierer eine Einrichtung zum Decodieren des empfangenen codierten Breitbandsignals als Reaktion auf einen Satz Signalcodierungsparameter umfaßt und in welchem die Breitbandsignal-Decodierungseinrichtung eine Vorrichtung nach Anspruch 21 umfaßt, um bei der Decodierung des codierten Breitbandsignals aus dem Satz von Signalcodierungsparametern einen Codevektor mit geglättetem Verstärkungsfaktor zu erzeugen.
  76. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem die Einrichtung zum Finden eines Codevektors umfaßt: eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter und eine Einrichtung zum Finden eines innovativen Codeverzeichnis-Verstärkungsfaktors.
  77. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines Codevektors in einem Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine erste Signalcodierungsparameter einen innovativen Codeverzeichnisindex umfaßt.
  78. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt und der mindestens eine dritte Signalcodierungsparameter die folgenden Parameter umfaßt: einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Verstärkungsfaktor; eine während der Codierung des Breitbandsignals berechnete Tonhöhen-Verzögerung; einen Index j eines Tiefpaßfilters, welcher während der Codierung des Breitbandsignals ausgewählt wurde und auf einen während der Codierung des Breitbandsignals berechneten Tonhöhen-Codevektor angewandt wird und einen während der Codierung des Breitbandsignals berechneten innovativen Codeverzeichnisindex.
  79. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem der mindestens eine vierte Signalcodierungsparameter Koeffizienten eines während der Codierung des Breitbandsignals berechneten Linearprädiktionsfilters umfaßt.
  80. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem: die Einrichtung zum Finden eines Codevektors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf einen Index k des innovativen Codeverzeichnisses umfaßt, wobei der Index k den mindestens einen ersten Signalcodierungsparameter bildet und die Einrichtung zum Berechnen eines ersten Faktors eine Einrichtung zum Berechnen eines Stimmfaktors rv nach der folgenden Beziehung umfaßt: rv = (Ev – Ec)/(Ev + Ec)wobei: – Ev die Energie eines skalierten adaptiven Codevektors bvT ist; – Ec die Energie eines skalierten innovativen Codevektors gck ist; – b ein während der Codierung des Breitbandsignals berechneter Tonhöhen Verstärkungsfaktor ist; – T eine während der Codierung des Breitbandsignals berechnete Tonhöhenverzögerung ist; – vT ein adaptiver Codeverzeichnisvektor bei der Tonhöhenverzögerung T ist; – g ein während der Codierung des Breitbandsignals berechneter innovativer Codeverzeichnis-Verstärkungsfaktor ist; – k ein während der Codierung des Breitbandsignals berechneter Index des innovativen Codeverzeichnisses ist und – cK der innovative Codevektor des innovativen Codeverzeichnisses beim Index k ist.
  81. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 80, bei welchem der Stimmfaktor rv einen Wert zwischen –1 und 1 hat, wobei der Wert 1 einem reinen Stimmsignal und der Wert –1 einem reinen Stimmlossignal entspricht.
  82. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 80, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Faktors λ unter Anwendung der folgenden Beziehung umfaßt: λ = 0,5(1 – rv).
  83. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 82, bei welchem ein Faktor λ = 0 ein reines Stimmsignal und ein Faktor λ = 1 ein reines Stimmlossignal anzeigt.
  84. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zum Bestimmen eines Abstandsmaßes umfaßt, welches die Ähnlichkeit zwischen benachbarten, aufeinanderfolgenden, während der Codierung des Breitbandsignals berechneter Linearprädiktionsfilter angibt.
  85. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 84, bei welchem: das Breitbandsignal vor der Codierung abgetastet sowie während der Codierung und der Decodierung in Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Bestimmen eines Abstandsmaßes eine Einrichtung zum Berechnen eines Immitanz-Spektralpaar-Abstandsmaßes zwischen den Immitanz-Spektralpaaren in einem vorliegenden Datenübertragungsblock n des Breitbandsignals und den Immitanz-Spektralpaaren des letzten Datenübertragungsblockes n – 1 des Breitbandsignals nach der folgenden Beziehung umfaßt:
    Figure 00680001
    wobei p die Ordnung des Linearprädiktionsfilters ist.
  86. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 85, bei welchem die Einrichtung zum Berechnen eines zweiten Faktors eine Einrichtung zur Kartierung des Immitanz-Spektralpaar-Abstandsmaßes Ds zu diesem zweiten Faktor Θ nach der folgenden Beziehung umfaßt: Θ = 1,25 – Ds/400000,0begrenzt durch 0 ≤ Θ ≤ 1.
  87. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung umfaßt: Sm = λΘ.
  88. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 87, bei welchem der Faktor Sm einen Wert hat, welcher sich für ein stimmloses und stabiles Breitbandsignal an einen Wert 1 und für ein reines Stimm- oder unstabiles Breitbandsignal an einen Wert 0 annähert.
  89. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem: die Einrichtung zum Finden eines Codevektors und eines Verstärkungsfaktors eine Einrichtung zum Finden eines innovativen Codevektors in einem innovativen Codeverzeichnis in bezug auf den mindestens einen ersten Signalcodierungsparameter umfaßt; das Breitbandsignal vor der Codierung abgetastet sowie bei der Codierung und Decodierung nach Datenübertragungsblöcken und Unter-Datenübertragungsblöcken bearbeitet wird und die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors g0 umfaßt, wobei diese Einrichtung zum Berechnen eines anfangsmodifizierten Verstärkungsfaktors eine Einrichtung zum Vergleichen des gefundenen Verstärkungsfaktors g, der während der Codierung des Breitbandsignals berechnet wurde, mit einem Schwellwert umfaßt, welcher durch den anfangsmodifizierten Verstärkungsfaktor vom letzten Unter-Datenübertragungsblock g–1 wie folgt gegeben ist: wenn g < g–1 dann g0 = g × 1,19 begrenzt durch g0 ≤ g–1 und wenn g ≥ g–1 dann g0 = g/1,19 begrenzt durch g0 ≥ g–1.
  90. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 75, bei welchem die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors die Berechnung eines anfangsmodifizierten Verstärkungsfaktors g0 durch Vergleich des gefundenen Verstärkungsfaktors g mit einem Schwellwert umfaßt.
  91. Drahtloses Zweirichtungs-Kommunikationsuntersystem nach Anspruch 90, bei welchem: die Einrichtung zum Berechnen eines geglätteten Verstärkungsfaktors eine Einrichtung zum Berechnen eines Verstärkungsfaktor-Glättungsfaktors Sm auf der Basis sowohl des ersten Faktors λ als auch des zweiten Faktors Θ nach der folgenden Beziehung: Sm = λΘsowie eine Einrichtung zum Bestimmen des geglätteten Verstärkungsfaktors gs nach der folgenden Beziehung umfaßt: gs = Sm·g0 + (1 – Sm)·g.
  92. Mobiltelefon, das eine Vorrichtung nach Anspruch 21 einschließt.
DE60029990T 1999-11-18 2000-11-17 Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer Expired - Lifetime DE60029990T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2290037 1999-11-18
CA002290037A CA2290037A1 (en) 1999-11-18 1999-11-18 Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
PCT/CA2000/001381 WO2001037264A1 (en) 1999-11-18 2000-11-17 Gain-smoothing in wideband speech and audio signal decoder

Publications (2)

Publication Number Publication Date
DE60029990D1 DE60029990D1 (de) 2006-09-21
DE60029990T2 true DE60029990T2 (de) 2006-12-07

Family

ID=4164645

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60029990T Expired - Lifetime DE60029990T2 (de) 1999-11-18 2000-11-17 Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer

Country Status (13)

Country Link
US (1) US7191123B1 (de)
EP (1) EP1232494B1 (de)
JP (1) JP4662673B2 (de)
CN (1) CN1229775C (de)
AT (1) ATE336060T1 (de)
AU (1) AU1644401A (de)
CA (1) CA2290037A1 (de)
CY (1) CY1106164T1 (de)
DE (1) DE60029990T2 (de)
DK (1) DK1232494T3 (de)
ES (1) ES2266003T3 (de)
PT (1) PT1232494E (de)
WO (1) WO2001037264A1 (de)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
EP1423847B1 (de) * 2001-11-29 2005-02-02 Coding Technologies AB Wiederherstellung von hochfrequenzkomponenten
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
KR100732659B1 (ko) 2003-05-01 2007-06-27 노키아 코포레이션 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치
US7451091B2 (en) 2003-10-07 2008-11-11 Matsushita Electric Industrial Co., Ltd. Method for determining time borders and frequency resolutions for spectral envelope coding
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4887282B2 (ja) * 2005-02-10 2012-02-29 パナソニック株式会社 音声符号化におけるパルス割当方法
EP1866915B1 (de) * 2005-04-01 2010-12-15 Qualcomm Incorporated Verfahren und vorrichtung zur anti-sparseness-filterung eines bandbreitenerweiterten sprachprädiktions-erregungssignals
ES2705589T3 (es) * 2005-04-22 2019-03-26 Qualcomm Inc Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
CN100420155C (zh) * 2005-08-03 2008-09-17 上海杰得微电子有限公司 宽带音频压缩编码器的频带组划分方法
JP5117407B2 (ja) * 2006-02-14 2013-01-16 フランス・テレコム オーディオ符号化/復号化で知覚的に重み付けするための装置
EP2118885B1 (de) 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Sprachverstärkung in unterhaltungsaudioinhalten
JP5291004B2 (ja) * 2007-03-02 2013-09-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信ネットワークにおける方法及び装置
CN101266798B (zh) * 2007-03-12 2011-06-15 华为技术有限公司 一种在语音解码器中进行增益平滑的方法及装置
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN100550133C (zh) 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
CN101609674B (zh) * 2008-06-20 2011-12-28 华为技术有限公司 编解码方法、装置和系统
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011065741A2 (ko) 2009-11-24 2011-06-03 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103295578B (zh) * 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
GB201401689D0 (en) * 2014-01-31 2014-03-19 Microsoft Corp Audio signal processing
FI3751566T3 (fi) 2014-04-17 2024-04-23 Voiceage Evs Llc Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä
US9510787B2 (en) * 2014-12-11 2016-12-06 Mitsubishi Electric Research Laboratories, Inc. Method and system for reconstructing sampled signals
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5195168A (en) 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
JP3186412B2 (ja) 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
TW326070B (en) 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US5987406A (en) * 1997-04-07 1999-11-16 Universite De Sherbrooke Instability eradication for analysis-by-synthesis speech codecs
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains

Also Published As

Publication number Publication date
ES2266003T3 (es) 2007-03-01
CN1229775C (zh) 2005-11-30
EP1232494A1 (de) 2002-08-21
DK1232494T3 (da) 2006-11-13
JP2003514267A (ja) 2003-04-15
US7191123B1 (en) 2007-03-13
WO2001037264A1 (en) 2001-05-25
CY1106164T1 (el) 2011-06-08
JP4662673B2 (ja) 2011-03-30
EP1232494B1 (de) 2006-08-09
CA2290037A1 (en) 2001-05-18
AU1644401A (en) 2001-05-30
DE60029990D1 (de) 2006-09-21
CN1391689A (zh) 2003-01-15
PT1232494E (pt) 2006-10-31
ATE336060T1 (de) 2006-09-15

Similar Documents

Publication Publication Date Title
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE69625874T2 (de) Verfahren und Vorrichtung zur Wiedergabe von Sprachsignalen, zur Dekodierung, zur Sprachsynthese und tragbares Funkendgerät
DE60011051T2 (de) Celp-transkodierung
DE69926821T2 (de) Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE69934608T2 (de) Adaptive kompensation der spektralen verzerrung eines synthetisierten sprachresiduums
DE69618422T2 (de) Verfahren zur Sprachdekodierung und tragbares Endgerät
DE69816810T2 (de) Systeme und verfahren zur audio-kodierung
DE69615839T2 (de) Sprachkodierer
DE69614782T2 (de) Verfahren und Einrichtung zur Wiedergabe von Sprachsignalen und Verfahren zu seiner Übertragung
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE69615302T2 (de) Maskierung des wahrnehmbaren Rauschens auf der Basis der Frequenzantwort eines Synthesefilters
DE602004007786T2 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE69621393T2 (de) Quantisierung von Sprachsignalen in prädiktiven Kodiersystemen unter Verwendung von Modellen menschlichen Hörens
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE69604526T2 (de) Verfahren zur Anpassung des Rauschmaskierungspegels in einem Analyse-durch-Synthese-Sprachkodierer mit einem wahrnehmunggebundenen Kurzzeitfilter
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60129544T2 (de) Kompensationsverfahren bei rahmenauslöschung in einem sprachkodierer mit veränderlicher datenrate
DE60128677T2 (de) Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition