[go: up one dir, main page]

DE69905035T2 - Rauschunterdrückung mittels spektraler subtraktion unter verwendung von linearem faltungsprodukt und kausaler filterung - Google Patents

Rauschunterdrückung mittels spektraler subtraktion unter verwendung von linearem faltungsprodukt und kausaler filterung

Info

Publication number
DE69905035T2
DE69905035T2 DE69905035T DE69905035T DE69905035T2 DE 69905035 T2 DE69905035 T2 DE 69905035T2 DE 69905035 T DE69905035 T DE 69905035T DE 69905035 T DE69905035 T DE 69905035T DE 69905035 T2 DE69905035 T2 DE 69905035T2
Authority
DE
Germany
Prior art keywords
samples
block
gain function
noise
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69905035T
Other languages
English (en)
Other versions
DE69905035D1 (de
Inventor
Ingvar Claesson
Harald Gustafsson
Sven Nordholm
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE69905035D1 publication Critical patent/DE69905035D1/de
Publication of DE69905035T2 publication Critical patent/DE69905035T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Processing Of Color Television Signals (AREA)
  • Burglar Alarm Systems (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)
  • Telephone Function (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

    GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft Kommunikationssysteme und insbesondere Verfahren und Vorrichtungen zum Abmildern der Effekte von störenden Hintergrundrauschkomponenten bei Kommunikationssignalen.
  • HINTERGRUND DER ERFINDUNG
  • Heutzutage erhöht sich die Anzahl von Freihandausrüstungen bei Mobiltelefonen und anderen Kommunikationsvorrichtungen. Ein wohlbekanntes Problem in Zusammenhang mit Freihandlösungen, insbesondere in Automobilanwendungen, ist das eines störenden Hintergrundrauschens, das an einem Freihandmikrofon aufgenommen wird und zu einem Fernend-Nutzer übermittelt wird. Mit anderen Worten nimmt aufgrund der Tatsache, dass die Distanz zwischen einem Freihandmikrofon und einem Nahend-Nutzer relativ groß sein kann, das Freihandmikrofon nicht nur die Nahend-Nutzersprache auf, sondern auch irgendwelches Rauschen, das zufällig am Nahend- Ort vorliegt. Beispielsweise nimmt in einer Automobiltelefonanwendung das Nahend-Mikrofon normalerweise umgebendes Verkehrsrauschen, Strassen- und Passagierbereichsrauschen auf. Das sich ergebende verrauschte Nahend-Sprachsignal kann für den Fernend-Nutzer störend oder sogar intolerabel sein. Es ist daher wünschenswert, dass das Hintergrundrauschen soweit wie möglich reduziert wird, vorzugsweise früh in der Nahend-Signalverarbeitungskette (z. B. bevor das empfangene Nahend-Mikrofonsignal in einen Nahend-Sprachkodierer eingegeben wird).
  • Als eine Folge enthalten viele Freihandsysteme einen Rauschreduktionsprozessor, der dazu ausgebildet ist, ein Hintergrundrauschen an der Eingabe einer Nahend- Signalverarbeitungskette zu eliminieren. Fig. 1 zeigt ein allgemeines Blockdiagramm solch eines Freihandsystems 100. In Fig. 1 ist ein Rauschreduktionsprozessor 110 an dem Ausgang eines Freihandmikrofons 120 positioniert, und am Eingang eines Nahend-Signalverarbeitungspfades (nicht gezeigt). Beim Betrieb empfängt der Rauschreduktionsprozessor 110 ein verrauschtes Sprachsignal x von dem Mikrofon 120 und verarbeitet das verrauschte Sprachsignal x, um ein klareres, rauschreduziertes Sprachsignal SNR bereitzustellen, was durch die Nahend-Signalverarbeitungskette und zuletzt zu dem Fernend-Nutzer geführt wird.
  • Ein wohlbekanntes Verfahren zum Implementieren des Rauschreduktionsprozessors 110 von Fig. 1 wird im Stand der Technik als Spektralsubtraktion bezeichnet. Man siehe beispielsweise S. F. Boll, Suppression of Acoustic Noise in Speech using Spectral Subtraction, IEEE Trans. Acoust. Speech and Sig. Proc., vol. 27; 113-120, 1979. Allgemein verwendet eine Spektralsubtraktion Schätzwerte des Rauschspektrums und des verrauschten Sprachspektrums, um eine auf einem Signal- zu-Rausch-Verhältnis (SNR) basierende Verstärkungsfunktion zu bilden, die mit dem Eingabespektrum multipliziert wird, um Frequenzen mit einem geringen SNR zu unterdrücken. Obwohl eine spektrale Subtraktion eine signifikante Rauschreduktion bereitstellt, leidet sie an mehreren wohlbekannten Nachteilen. Beispielsweise enthält das Spektralsubtraktions- Ausgangssignal typischerweise Artefakte, die im Stand der Technik als Musiktöne (musical tones) bekannt sind. Weiter führen Diskontinuitäten zwischen verarbeiteten Signalblöcken oft zu verminderter Sprachqualität von dem Standpunkt des Fernend-Nutzers. Dieser Artikel betrachtet kein Auferlegen einer Phase auf die Verstärkungsfunktion, um ein kausales Filtern bereitzustellen. Viele Verbesserungen am grundlegenden Spektralsubtraktionsverfahren wurden in den vergangenen Jahren entwickelt. Man siehe beispielsweise N. Virage, Speech Enhancement Based on Masking Properties of the Auditory System, IEEE ICASSP... Proc. 796-799 vol. 1, 1995; D. Tsoukalas, M. Paraskevas and J. Mourjopoulos, Speech Enhancement using Psychoacoustic Criteria, IEEE ICASSP. Proc., 359-362 vol. 2, 1993; F. Xie and D. Van Compernolle, Speech Enhancement by Spectral Magnitude Estimation - A Unifying Approach, IEEE Speech Communication, 89-104 vol. 19, 1996; R. Martin, Spectral Subtraction Based on Minimum Statistics, UESIPCO, Proc., 1182-1185 vol. 2, 1994; und S. M. McOlash, R. J. Niederjohn and J. A. Heinen, A Spectral Substraktion Method for Enhancement of Speech Corrupted by Nonwhite, Nonstationary Noise, IEEE IECON. Proc., 872-877 vol. 2, 1995.
  • Der Rabiner et al. Artikel, mit dem Titel "On the Implementation of a Short-Time Spectral Analysis Method for System Identification," IEEE Transactions on ASSP, vol. 28, 1980, pages 69-78, beschreibt eine Implementierung eines Verfahrens für Spektralschätzung. Der Artikel beschreibt das Überlappungs- und Addierverfahren zum Schutz gegen Alias, wenn eine schnelle FFT (Fourier Transformation) (Fast Fourier Transform) verwendet wird. Dieser Artikel behandelt kein Auferlegen einer Phase auf die Verstärkungsfunktion, um ein kausales Filtern bereitzustellen.
  • Während diese Verfahren unterschiedliche Grade einer Sprachverbesserung bereitstellen, wäre es nichtsdestoweniger vorteilhaft, wenn zur Berücksichtigung der oben beschriebenen Spektralsubtraktionsprobleme bezüglich Musiktönen und Zwischenblockdiskontinuitäten alternative Verfahren entwickelt werden könnten. Daher besteht eine Notwendigkeit an Verfahren und Vorrichtungen zum Durchführen einer Rauschreduktion mit spektraler Subtraktion.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung, wie in den Ansprüchen 1-30 beansprucht, erfüllt das oben beschriebene und andere Bedürfnisse, indem verbesserte Verfahren und Vorrichtungen zum Durchführen einer Rauschreduktion mittels Spektralsubtraktion bereitgestellt werden. In Übereinstimmung mit beispielhaften Ausführungen wird eine Spektralsubtraktion unter Verwendung einer linearen Faltung durchgeführt, kausaler Filterung und/oder spektralabhängiger exponentieller Mittelung der Spektralsubtraktionsverstärkungsfunktion. Vorteilhaft liefern in Übereinstimmung mit der Erfindung aufgebaute Systeme signifikant verbesserte Sprachqualitäten im Vergleich zu Systemen des Standes der Technik, ohne eine übermäßige Komplexität einzuführen.
  • In Übereinstimmung mit der Erfindung werden Spektralschätzungen niedriger Ordnung entwickelt, die eine geringere Frequenzauflösung und reduzierte Varianz im Vergleich zu Spektralschätzungen in bekannten Spektralsubtraktionssystemen aufweisen. Die Spektren in Übereinstimmung mit der Erfindung werden verwendet, um eine Verstärkungsfunktion mit einer erwünschten niedrigen Varianz zu bilden, die ihrerseits die Musiktöne in dem Spektralsubtraktions-Ausgangssignal reduziert. In Übereinstimmung mit beispielhaften Ausführungen wird die Verstärkungsfunktion weiter unter Verwendung einer eingangsspektralabhängigen exponentialen Mittelung über Blöcken geglättet. Die Verstärkungsfunktion mit geringer Auflösung wird in die Gesamtblocklängen-Verstärkungsfunktion interpoliert, entspricht nichtsdestoweniger einem Filter der Länge niedriger Ordnung. Vorteilhaft erlaubt die niedrige Ordnung der Verstärkungsfunktion, dass während der Interpolation eine Phase hinzugefügt wird. Die Verstärkungsfunktionsphase, die in Übereinstimmung mit beispielhaften Ausführungen entweder eine lineare Phase oder eine Minimalphase sein kann, bewirkt, dass der Verstärkungsfilter kausal ist, und verhindert Diskontinuitäten zwischen Blöcken. In beispielhaften Ausführungen wird der Kausalfilter mit den Eingangssignalspektren multipliziert, und die Blöcke werden unter Verwendung eines Überlappungs- und Addierverfahrens angepasst. Weiter wird die Rahmenlänge so klein wie möglich gemacht, um eine eingeführte Verzögerung ohne ein Einführen von ungeeigneten Veränderungen der Spektralschätzung zu minimieren.
  • In einer beispielhaften Ausführung enthält ein Rauschunterdrückungssystem einen Spektralsubtraktionsprozessor, der dazu ausgebildet ist, ein verrauschtes Eingangssignal zu filtern, um ein rauschreduziertes Ausgangssignal bereitzustellen. Die Verstärkungsfunktion des Spektralsubtraktionsprozessors wird basierend auf einer Schätzung einer spektralen Dichte des Eingangssignals und auf einer Schätzung einer spektralen Dichte einer Rauschkomponente des Eingangssignals berechnet. Weiter wird ein Block von Abtastwerten des rauschreduzierten Ausgangssignals basierend auf einem jeweiligen Block von Abtastwerten des Eingangssignals und einem jeweiligen Block von Abtastwerten der Verstärkungsfunktion berechnet, und eine Ordnung des Blocks von berechneten Abtastwerten des Ausgangssignals ist größer als eine Summe einer Ordnung des jeweiligen Blocks von Abtastwerten des Eingangssignals und einer Ordnung des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion.
  • In beispielhaften Ausführungen wird der Block von berechneten Abtastwerten des Ausgangssignals basierend auf einer korrekten Faltung des jeweiligen Blocks von Abtastwerten des Eingangssignals und des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion berechnet. Beispielsweise wird ein Block von N-Abtastwerten des Ausgangssignals basierend auf einem Block von L-Abtastwerten des Eingangssignals und einem Block von M-Abtastwerten der Verstärkungsfunktion berechnet, wobei die Summe von L und M geringer als N ist. Der Block von M-Abtastwerten der Verstärkungsfunktion kann beispielsweise unter Verwendung einer Spektralschätzung berechnet werden, basierend auf den L-Abtastwerten des Eingangssignals. In Übereinstimmung mit beispielhaften Ausführungen wird die Spektralschätzung unter Verwendung von entweder einem Bartlett-Verfahren oder einem Welsh-Verfahren durchgeführt. Aufeinander folgende Blöcke des Ausgangssignals werden unter Verwendung eines Überlappungs- und Addierverfahrens angepasst, und eine Phase wird zur Verstärkungsfunktion addiert, so dass der Spektralsubtraktionsprozessor ein kausales Filtern bereitstellt. Vorteilhaft kann die Verstärkungsfunktion entweder eine Linearphase oder Minimalphase aufweisen.
  • Ein beispielhaftes Verfahren gemäß der Erfindung umfasst die Schritte einer Berechnung einer Schätzung einer Spektraldichte eines Eingangssignals und einer Schätzung einer Spektraldichte einer Rauschkomponente des Eingangssignals, und ein Verwenden einer Spektralsubtraktion, um das rauschreduzierte Ausgangssignal basierend auf dem verrauschten Eingangssignal und basierend auf einer Verstärkungsfunktion, berechnet unter Verwendung der spektralen Dichteschätzungen, zu berechnen. In Übereinstimmung mit den Verfahren wird der Block von Abtastwerten des rauschreduzierten Ausgangssignals basierend auf einem jeweiligen Block von Abtastwerten des Eingangssignals und auf einem jeweiligen Block von Abtastwerten der Verstärkungsfunktion berechnet, und eine Ordnung des Blocks von berechneten Abtastwerten des Ausgangssignals ist größer als eine Summe einer Ordnung des jeweiligen Blocks von Abtastwerten des Eingangssignals und einer Ordnung des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion.
  • Die oben beschriebenen und anderen Merkmale und Vorteile der vorliegenden Erfindung werden detaillierter im folgenden mit Bezug auf die veranschaulichten Beispiele, gezeigt in den begleitenden Zeichnungen, erläutert. Der Fachmann versteht, dass die beschriebenen Ausführungsbeispiele zum Zwecke einer Veranschaulichung bereitgestellt sind, und dass viele äquivalente Ausführungen darin erwogen sind.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Fig. 1 zeigt ein Blockdiagramm eines Rauschunterdrückungssystems, in dem die Lehren der vorliegenden Erfindung implementiert werden können.
  • Fig. 2 zeigt einen bekannten Spektralsubtraktions- Rauschreduktionsprozessor.
  • Fig. 3-4 zeigen beispielhafte Spektralsubtraktions- Rauschunterdrückungsprozessoren gemäß der Erfindung.
  • Fig. 5 zeigt exemplarische Spektrogramme, abgeleitet unter Verwendung von Spektralsubtraktionsverfahren gemäß der Erfindung.
  • Fig. 6-7 zeigen exemplarische Verstärkungsfunktion, abgeleitet unter Verwendung von Spektralsubtraktionsverfahren gemäß der Erfindung.
  • Fig. 8-28 zeigen Simulationen von beispielhaften Spektralsubtraktionsverfahren gemäß der Erfindung.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • Um die verschiedenen Merkmale und Vorteile der vorliegenden Erfindung zu verstehen, ist es hilfreich, zuerst ein bekanntes Spektralsubtraktionsverfahren zu betrachten. Allgemein baut eine Spektralsubtraktion auf der Annahme auf, dass das Rauschsignal und das Sprachsignal in einer Kommunikationsanwendung zufällig, unkorreliert und addiert sind, um das verrauschte Sprachsignal zu bilden. Wenn beispielsweise s(n), w(n) und x(n) stochastische stationäre Kurzzeitprozesse sind, die Sprache, Rauschen beziehungsweise verrauschte Sprache darstellen, dann gilt:
  • x(n) = s(n) + w(n) (1)
  • Rx(f) = Rs(f) + Rw(f) (2)
  • Wobei R(f) die spektrale Leistungsdichte eines Zufallprozesses bezeichnet.
  • Die spektrale Rauschleistungsdichte (Rw(f) kann während Sprachpausen geschätzt werden, (d. h. wobei x(n) = w(n)). Um die spektrale Leistungsdichte der Sprache zu schätzen wird eine Schätzung gebildet als:
  • Die bekannte Weise zur Schätzung der spektralen Leistungsdichte ist es, ein Periodogramm zu verwenden. Falls beispielsweise XN(fu) die N lange Fourier-Transformation von x(n) und WN(fu) die entsprechende Fourier-Transformation von w(n), dann gilt:
  • x(fu) = Px,N(fu) = 1/N XN(fu) ², fu = u/N, u = 0, ..., N - 1 (4)
  • w(fu) = Pw,N(fu) = 1/N WN(fu) ², fu = u/N, u = 0, ..., N - 1 (5)
  • Die Gleichungen (3), (4) und (5) können miteinander kombiniert werden, um folgendes bereitzustellen:
  • SN(fu) ² = XN(fu) ² - WN(fu) ² (6)
  • Alternativ ergibt sich eine allgemeinere Form als:
  • SN(fu) a = XN(fu) a - WN(fu) a (7)
  • Wobei die spektrale Leistungsdichte mit einer allgemeinen Form einer spektralen Dichte ausgetauscht ist.
  • Da das menschliche Ohr für Phasenfehler der Sprache nicht empfindlich ist, kann die verrauschte Sprachphase φx(f) als eine Annäherung der sauberen Sprachphase φs(f) verwendet werden:
  • φs(fu) = φx(fu) (8)
  • Ein allgemeiner Ausdruck für eine Schätzung der sauberen Sprach Fourier Transformation ist somit gegeben durch:
  • SN(fu) = ( XN(fu) a - k· WN(fu) a)1/a·ejφx(fu) (9)
  • Wobei ein Parameter k eingeführt wird, um die Menge einer Rauschsubtraktion zu steuern.
  • Um die Notation zu vereinfachen wird ein Vektor eingeführt:
  • Die Vektoren werden Element um Element berechnet. Der Klarheit halber werden Element um Element Multiplikationen von Vektoren hierin mittels bezeichnet. Somit kann die Gleichung (9) unter Verwendung einer Verstärkungsfunktion GN und unter Verwendung der Vektornotation geschrieben werden als:
  • SN = GN XN ejφx = GN XN (11)
  • wobei die Verstärkungsfunktion gegeben ist durch:
  • Die Gleichung (12) zeigt den konventionellen spektralen Subtraktionsalgorithmus und ist in Fig. 2 veranschaulicht. In Fig. 2 enthält ein bekannter Spektralsubtraktions- Rauschreduktionsprozessor 200 einen Schnelle-Fourier- Transformation-Prozessor 210, einen Größenquadrierungsprozessor 220, einen Sprachaktivitätsdetektor 230, eine Blockmittelungsvorrichtung 240, einen Blockverstärkungsberechnungsprozessor 250, einen Multiplizierer 260, und einen Inverse-Schnelle-Fourier- Transformation-Prozessor 270.
  • Wie veranschaulicht, ist ein verrauschtes Spracheingangssignal mit einem Eingang des Schnelle-Fourier- Transformation-Prozessors 210 verbunden, und ein Ausgang des Schnelle-Fourier-Transformation-Prozessors 210 ist mit einem Eingang des Quadrierungsgrößenprozessors 220 und mit einem ersten Eingang des Multiplizierers 260 verbunden. Ein Ausgang des Quadrierungsgrößenprozessors 220 ist mit einem ersten Kontakt des Schalters 225 und mit einem ersten Eingang des Verstärkungsberechnungsprozessors 250 verbunden. Ein Ausgang des Sprachaktivitätsdetektors 230 ist mit einem Throw-Eingang des Schalters 225 verbunden, und ein zweiter Kontakt des Schalter 225 ist mit einem Eingang der Blockmittlungsvorrichtung 240 verbunden. Ein Ausgang der Blockmittlungsvorrichtung 240 ist mit einem zweiten Eingang des Verstärkungsberechnungsprozessors 250 verbunden, und ein Ausgang des Verstärkungsberechnungsprozessors 250 ist mit einem zweiten Eingang des Multiplizierers 260 verbunden. Ein Ausgangsmultiplizierer 260 ist mit einem Eingang des Inverse- Schnelle-Fourier-Transformation-Prozessors 270 gekoppelt, und ein Ausgang des Inverse-Schnelle-Fourier-Transformation- Prozessors 270 liefert eine Ausgabe für das bekannte Spektralsubtraktionssystem 200.
  • Beim Betrieb verarbeitet das bekannte Spektralsubtraktionssystem 200 das ankommende verrauschte Sprachsignal unter Verwendung des oben beschriebenen bekannten Spektralsubtraktionsalgorithmus, um das klarere, rauschreduzierte Sprachsignal bereitzustellen. In der Praxis können die verschiedenen Komponenten von Fig. 2 unter Verwendung beliebiger bekannter digitaler Signalverarbeitungstechnologie implementiert werden, einschließlich eines Mehrzweckcomputers, einer Ansammlung von integrierten Schaltungen und/oder Anwendung spezifischen integrierten Schaltungen (ASIC).
  • Es wird darauf hingewiesen, dass beim bekannten Spektralsubtraktionsalgorithmus zwei Parameter, a und k vorhanden sind, die den Wert einer Rauschsubtraktion und Sprachqualität steuern. Ein Einstellen des ersten Parameters auf a = 2 liefert eine spektrale Leistungssubtraktion, während ein Einstellen des ersten Parameters auf a = 1 eine Spektralgrößensubtraktion liefert. Zusätzlich liefert ein Einstellen des ersten Parameters auf a = 0,5 eine Erhöhung der Rauschreduktion, während die Sprache nur ein wenig verzerrt wird. Dieses rührt daher, dass die Spektren komprimiert werden, bevor das Rauschen von der verrauschten Sprache subtrahiert wird.
  • Der zweite Parameter k wird so eingestellt, dass die erwünschte Rauschreduktion erzielt wird. Falls beispielsweise ein größeres k gewählt wird, erhöht sich die Sprachverzerrung. In der Praxis wird der Parameter k typischerweise in Abhängigkeit davon eingestellt, wie der erste Parameter a gewählt ist. Ein Vermindern von a führt typischerweise ebenso zu einer Verminderung des Parameters k, um die Sprachverzerrung gering zu halten. Im Falle einer spektralen Leistungssubtraktion ist es üblich, eine Über- Subtraktion zu verwenden (d. h. k > 1).
  • Die bekannte Spektralsubtraktionsverstärkungsfunktion (siehe Gleichung (12)) wird von einer Vollblockschätzung abgeleitet und weist die Phase Null auf. Als eine Folge ist die entsprechende Impulsantwort gN(u) nicht-kausal und weist eine Länge N auf (gleich der Blocklänge). Daher ergibt die Multiplikation der Verstärkungsfunktion GN(l) und des Eingangssignals XN (siehe Gleichung (11)) eine periodische zirkuläre Faltung mit einem nicht-kausalen Filter. Wie oben beschrieben kann eine periodische zirkuläre Faltung zu einem unerwünschten Alias im Zeitbereich führen, und die nicht- kausale Eigenschaft des Filters kann zu Diskontinuitäten zwischen Blöcken und somit zu verminderter Sprachqualität führen. Vorteilhafter Weise liefert die vorliegende Erfindung Verfahren und Vorrichtungen zum Bereitstellen einer richtigen Faltung mit einem kausalen Verstärkungsfilter, und eliminiert dadurch die oben erwähnten Probleme eines Zeitdomänen-Alias und einer Zwischenblockdiskontinuität.
  • Hinsichtlich des Zeitbereich-Aliasproblems wird darauf hingewiesen, dass eine Faltung im Zeitbereich einer Multiplikation im Frequenzbereich entspricht. Mit anderen Worten:
  • x(u)·y(u) X(f)·Y(f), u = -∞, ..., ∞ (13)
  • Wenn die Transformation von einer Schnellen Fourier Transformation (FFT) der Länge N erhalten wird, ist das Ergebnis der Multiplikation nicht eine korrekte Faltung. Vielmehr ist das Ergebnis eine zirkuläre Faltung mit einer Periodizität von N.
  • xN yN (14)
  • wobei das Symbol eine zirkuläre Faltung bezeichnet.
  • Um eine richtige Faltung zu erhalten, wenn eine Schnelle Fourier Transformation verwendet wird, muss die akkumulierte Ordnung der Impulsantworten xN und yN geringer als oder gleich 1 weniger als die Blocklänge N - 1 sein.
  • Somit kann gemäß der Erfindung das Zeitbereich-Aliasproblem, was sich aus der periodischen zirkulären Faltung ergibt, unter Verwendung einer Verstärkungsfunktion GN(l) und einem Eingangssignalblock GN(l) und einem Eingangssignalblock XN mit einer Gesamtordnung von weniger oder gleich N - 1 gelöst werden.
  • Gemäß einer bekannten Spektralsubtraktion weist das Spektrum XN des Eingangssignals eine volle Blocklänge N auf. Gemäß der Erfindung wird jedoch ein Eingangssignalblock xL der Länge L (L > N) dazu verwendet, um ein Spektrum der Ordnung L aufzubauen. Die Länge L wird als Rahmenlänge bezeichnet, und somit ist xL ein Rahmen. Da das Spektrum, das mit der Verstärkungsfunktion der Länge N multipliziert ist, auch die Länge N aufweisen sollte, wird der Rahmen xL mit Nullen auf die volle Blocklänge N aufgefüllt, was XLIN ergibt.
  • Um eine Verstärkungsfunktion der Länge N aufzubauen, kann die Verstärkungsfunktion gemäß der Erfindung von einer Verstärkungsfunktion GM(l) der Länge M interpoliert werden, wobei M < N, um GMIN(l) zu bilden. Um die Verstärkungsfunktion niedriger Ordnung GMIN(l) gemäß der Erfindung abzuleiten, kann eine beliebige bekannte oder noch zu entwickelnde Spektralschätztechnik als eine Alternative zu dem oben beschriebenen einfachen Fourier Transformation Periodigramm verwendet werden. Verschiedene bekannte Spektralschätztechniken liefern eine geringere Varianz bei der sich ergebenden Verstärkungsfunktion. Man siehe beispielsweise J. G. Proakis und D. G. Manolakis, Digital Signal Processing; Principles, Algorithms, and Applications, Macmillan, Second Ed., 1992.
  • In Übereinstimmung mit dem wohlbekannten Bartlett-Verfahren wird beispielsweise der Block der Länge N in K Unterblöcke der Länge M aufgeteilt. Ein Periodogramm für jeden Unter- Block wird dann berechnet, und die Ergebnisse werden gemittelt, um ein M-langes Periodogramm für den Gesamtblock bereitzustellen als:
  • Vorteilhafter Weise wird die Varianz um einen Faktor K reduziert, wenn die Unter-Blöcke unkorreliert sind, im Vergleich zum Vollblocklängenperiodogramm. Die Frequenzauflösung wird auch um den gleichen Faktor reduziert.
  • Alternativ kann das Welsh-Verfahren verwendet werden. Das Welsh-Verfahren ist ähnlich zum Bartlett-Verfahren, mit der Ausnahme, dass jeder Unter-Block mit einem Hanning-Fenster begrenzt wird, und dass es den Unter-Blöcken erlaubt wird, einander zu überlappen, was mehr Unter-Blöcke ergibt. Die durch das Welsh-Verfahren bereitgestellte Varianz ist im Vergleich zum Bartlett-Verfahren weiter reduziert. Das Bartlett- und Welsh-Verfahren sind nur zwei Spektralschätztechniken, und andere bekannte Spektralschätztechniken können ebenso verwendet werden.
  • Ungeachtet der genauen Spektralschätztechnik, die implementiert wird, ist es möglich und wünschenswert, die Varianz der verrauschten Periodogrammschätzung noch weiter zu vermindern, indem Mittelungsverfahren verwendet werden. Beispielsweise ist es unter der Annahme, dass das Rauschen langzeitstationär ist, möglich, die sich aus dem oben beschriebenen Bartlett- und Welsh-Verfahren ergebenen. Periodogramme zu mitteln. Ein Verfahren verwendet eine exponentielle Mittelung als:
  • x,M(l) = &alpha;· x,M(l - 1) + (1 - &alpha;)·Px,M(l) (16)
  • In der Gleichung (16) wird die Funktion Px,M(l) MD unter Verwendung des Bartlett- oder Welsh-Verfahrens berechnet, die Funktion x,M(l) ist das exponentielle Mittel für den momentanen Block und die Funktion x,M(l - 1) ist die exponentielle Mittlung des vorhergehenden Blocks. Der Parameter &alpha; steuert, wie lang der exponentielle Speicher ist, und sollte typischerweise nicht die Länge überschreiten, in der das Rauschen als stationär betrachtet werden kann. Ein &alpha; näher bei 1 ergibt einen längeren exponentiellen Speicher, und eine substantielle Reduktion der Periodogrammvarianz.
  • Die Länge M wird als die Sub-Blocklänge bezeichnet, und die sich ergebende Verstärkungsfunktion mit niedriger Ordnung weist eine Impulsantwort der Länge M auf. Somit weist die Rauschperiodogrammschätzung xL,M(l) und die verrauschte Sprachperiodogrammschätzung PxL,M(l) die beim Aufbau der Verstärkungsfunktion verwendet wird, auch die Länge M auf:
  • Gemäß der Erfindung wird dies erzielt, indem eine kürzere Periodogrammschätzung von dem Eingangsrahmen XL und einer Mittlung unter Verwendung von beispielsweise dem Bartlett- Verfahren verwendet wird. Das Bartlett-Verfahren (oder ein anderes geeignetes Schätzverfahren) vermindert die Varianz des geschätzten Periodogramms, und es ergibt sich auch eine Reduktion einer Frequenzauflösung. Die Reduktion der Auflösung von L-Frequenzstellen auf M-Stellen bedeutet, dass die Periodogrammschätzung PxL,M(l) auch eine Länge M aufweist. Zusätzlich kann die Varianz der Rauschperiodogrammschätzung xL,M(l) weiter vermindert werden, unter Verwendung einer exponentiellen Mittelung, wie oben beschrieben.
  • Um die Anforderung einer Gesamtordnung von weniger oder gleich N - 1 zu erfüllen, wird die Rahmenlänge L, addiert zur Sub-Blocklänge M geringer als N eingestellt. Als ein Ergebnis ist es möglich, den erwünschten Ausgabeblock zu bilden als:
  • SN = GMIN(l) XLIN (18)
  • Vorteilhaft liefert der Filter niedriger Ordnung gemäß der Erfindung weiter eine Möglichkeit, die durch die nicht- kausale Natur des Verstärkungsfilters bewirkten Probleme beim bekannten Spektralsubtraktionsalgorithmus (d. h. Zwischenblockdiskontinuität und verminderte Sprachqualität) zu berücksichtigen. Insbesondere kann gemäß der Erfindung eine Phase zur Verstärkungsfunktion addiert werden, um einen kausalen Filter bereitzustellen. Gemäß beispielhaften Ausführungen kann die Phase von einer Größenfunktion aufgebaut werden, und kann entweder eine lineare Phase oder eine Minimalphase sein, wie erwünscht.
  • Um einen Linearphasenfilter gemäß der Erfindung aufzubauen, wird zuerst betrachtet, dass, falls die Blocklänge der FFT die Länge M aufweist, eine zirkuläre Verschiebung im Zeitbereich eine Multiplikation mit einer Phasenfunktion im Frequenzbereich ist:
  • g(n - l)M GM(fu)·e-j2&pi;ul/M, fu = u/M, u = 0, ..., M - 1 (19)
  • In vorliegendem Fall ist l gleich M/2 + 1, da die erste Position in der Impulsantwort eine Verzögerung von Null aufweisen sollte (d. h. ein kausaler Filter). Daher:
  • g(n - (M/2 + 1))M GM(fu)·e-j&pi;u(1+2/M) (20)
  • und der lineare Phasenfilter M(fu) wird somit erhalten als
  • M(fu) = GM(fu)·e-j&pi;u(1+2/M) (21)
  • Gemäß der Erfindung wird die Verstärkungsfunktion weiter zu einer Länge N interpoliert, was beispielsweise unter Verwendung einer glatten Interpolation vorgenommen wird. Die zur Verstärkungsfunktion addierte Phase ändert sich demzufolge, was ergibt:
  • MIN(fu) = GMIN(fu)·e-j&pi;u(1+2/M)·M/N (22)
  • Vorteilhaft kann ein Aufbau des Linearphasenfilters auch in dem Zeitbereich vorgenommen werden. In solch einem Fall wird die Verstärkungsfunktion GM(fu) in den Zeitbereich unter Verwendung einer IFFT umgeformt, wo die zirkuläre Verschiebung vorgenommen wird. Die verschobene Impulsantwort wird mit Nullen auf eine Länge N aufgefüllt, und dann unter Verwendung einer N-langen FFT zurück transformiert. Dieses führt zu einem interpolierten kausalen Linearphasenfilter MIN(fu), wie erwünscht.
  • Ein kausaler Minimalphasenfilter gemäß der Erfindung kann aus der Verstärkungsfunktion unter Verwendung einer Hilbert- Transformationsrelation aufgebaut werden. Man siehe beispielsweise A. V. Oppenheim und R. W. Schafer, Discrete-Time Signal Processing, Prentic-Hall, Inter. Ed., 1989. Die Hilbert-Transformationsbeziehung beinhaltet ein eindeutiges Verhältnis zwischen realen und imaginären Teilen einer komplexen Funktion. Vorteilhaft kann dies für ein Verhältnis zwischen einer Größe und Phase verwendet werden, wenn der Logarithmus des komplexen Signals verwendet wird als:
  • ln( GM(fu) ·ej·arg(GM(fu))) = ln( GM(fu) ) + ln(ej·arg(GM(fu))) = ln( GM(fu) ) + j·arg(GM(fu)) (23)
  • Im vorliegenden Zusammenhang ist die Phase Null, was eine reale Funktion ergibt. Die Funktion ln( GM(fu) ) wird in den Zeitbereich unter Verwendung einer IFFT der Länge M umgewandelt, was gM(n) bildet. Die Zeitbereichsfunktion wird umgeordnet als:
  • Die Funktion M(n) wird zurück in den Frequenzbereich unter Verwendung einer M-langen FFT transformiert, was ln( M(fu)·ej·arg( M(fu))) ergibt. Daraus wird die Funktion M(fu) gebildet. Der kausale Minimalphasenfilter M(fu) wird dann auf eine Lange N interpoliert. Die Interpolation wird auf die gleiche Weise wie im oben beschriebenen Linearphasenfall vorgenommen.
  • Der sich ergebende interpolierte Filter GMIN(fu) ist kausal und hat eine annähernd minimale Phase.
  • Das oben beschriebene Spektralsubtraktionsverfahren gemäß der Erfindung ist in Fig. 3 gezeigt. In Fig. 3 ist ein Spektralsubtraktions-Rauschreduktionsprozessor 300 gezeigt, und liefert eine lineare Faltung und kausale Filterung, und enthält einen Bartlett-Prozessor 305, einen Quadrierungsgrößenprozessor 320, einen Sprachaktivitätsdetektor 330, einen Blockmittlungsprozessor 340, einen Niedrigordnungs-Verstärkungsberechnungsprozessor 350, einen Verstärkungsphasenprozessor 355, einen Interpolationsprozessor 356, einen Multiplizierer 360, einen Invers Schnelle-Fourier-Transformation-Prozessor 370, und einen Überlappungs- und Addierprozessor 380.
  • Wie gezeigt ist das verrauschte Spracheingangssignal mit einem Eingang des Bartlett-Prozessors 305 verbunden, und einem Eingang des Schnelle-Fourier-Transformation-Prozessors 310 verbunden. Ein Ausgang des Bartlett-Prozessors 305 ist mit einem Eingang des Quadrierungsgrößenprozessors 320 verbunden, und ein Ausgang des Schnelle-Fourier- Transformation-Prozessors 310 ist mit einem ersten Eingang des Multiplizierers 360 verbunden. Ein Ausgang des Quadrierungsgrößenprozessors 320 ist mit einem ersten Kontakt des Schalters 320 und mit einem ersten Eingang des Niedrigordnungs-Verstärkungsberechnungsprozessors 350 verbunden. Ein Steuerausgang des Sprachaktivitätendetektors 330 ist mit einem Throw-Eingang des Schalters 325 verbunden, und ein zweiter Kontakt des Schalters 325 ist mit einem Eingang der Blockmittlungsvorrichtung 340 verbunden.
  • Ein Ausgang der Blockmittlungsvorrichtung 340 ist mit einem zweiten Eingang des Niedrigordnungs- Verstärkungsberechnungsprozessors 350 verbunden, und ein Ausgang des Niedrigordnungs-Verstärungsberechnungsprozessors 350 ist mit einem Eingang des Verstärkungsphasenprozessors 355 verbunden. Ein Ausgang des Verstärkungsphasenprozessors 355 ist mit einem Eingangsinterpolationsprozessors 356 verbunden, und ein Ausgang des Interpolationsprozessors 356 ist mit einem zweiten Eingang des Multiplizierers 360 verbunden. Ein Ausgang des Multiplizierers 360 ist mit einem Eingang des Inverse-Schnelle-Fourier-Transformation- Prozessors 370 verbunden, und ein Ausgang des Inverse- Schnelle-Fourier-Transformation-Prozessors 370 ist mit einem Eingang des Überlappungs- und Addierprozessors 380 verbunden. Ein Ausgang des Überlappungs- und Addierprozessors 380 liefert eine rauschreduzierte, klare Sprachausgabe für den beispielhaften Rauschreduktionsprozessor 300.
  • Beim Betrieb verarbeitet der Spektralsubtraktions- Rauschreduktionsprozessor 300 gemäß der Erfindung das ankommende verrauschte Sprachsignal unter Verwendung des Linearfaltungs-, Kausalfilterungsalgorithmus, oben beschrieben, um das klare, rauschreduzierte Sprachsignal bereitzustellen. In der Praxis können die verschiedenen Komponenten von Fig. 3 implementiert werden unter Verwendung einer beliebigen bekannten digitalen Signalverarbeitungstechnologie, einschließlich eines Netzwerkcomputers, einer Ansammlung von integrierten Schaltungen und/oder anwendungsspezifischen integrierten Schaltungen (ASIC).
  • Vorteilhaft kann die Varianz der Verstärkungsfunktion GM(l) der Erfindung noch weiter vermindert werden, mittels eines gesteuerten Exponentialverstarkungsfunktions- Mittelungsverfahrens gemäß der Erfindung. Gemäß beispielhaften Ausführungen wird die Mittelung abhängig gemacht von der Diskrepanz zwischen dem momentanen Blockspektrum Px·M(l) und dem gemittelten Rauschspektrum x·M(l). Wenn beispielsweise eine geringe Diskrepanz vorliegt, kann ein langes Mitteln der Verstärkungsfunktion GM(l) bereitgestellt werden, in Entsprechung einer Situation mit stationärem Hintergrundrauschen. Wenn dem gegenüber eine große Diskrepanz vorliegt kann ein kurzes Mitteln oder kein Mitteln der Verstärkungsfunktion GM(l) bereitgestellt werden, entsprechend Situationen mit Sprache oder stark veränderlichem Hintergrundrauschen.
  • Um den transienten Übergang von einer Sprachperiode zu einer Hintergrundrauschperiode zu handhaben, wird die Mittelung der Verstärkungsfunktion nicht direkt proportional zu einem Vermindern bei der Diskrepanz erhöht, da ein solches eine hörbare Schattensprache einfügt (da die Verstärkungsfunktion, geeignet für ein Sprachspektrum, für eine lange Periode verbleiben würde). Stattdessen wird bewirkt, dass das Mitteln sich langsam erhöht, um der Verstärkungsfunktion es zu ermöglichen, sich an die stationäre Eingabe anzupassen.
  • Gemäß beispielhaften Ausführungen ist das Diskrepanzmaß zwischen Spektren definiert als:
  • wobei &beta;(l) begrenzt ist durch:
  • und wobei &beta;(l) = 1 zur Folge hat, dass die Verstärkungsfunktion nicht exponentiell gemittelt wird, und &beta; &beta;(l) = &beta;min einen maximalen Grad einer exponentiellen Mittelung bereitstellt.
  • Der Parameter (1) ist eine exponentielle Mittelung der Diskrepanz zwischen Spektren, beschrieben durch
  • (l) = &gamma;· (l - 1) + (1 - &gamma;)·&beta;(l) (27)
  • Der Parameter &gamma; in Gleichung (27) wird dazu verwendet, sicherzustellen, dass sich die Verstärkungsfunktion auf den neuen Pegel anpasst, wenn ein Übergang von einer Periode mit einer hohen Diskrepanz zwischen den Spektren zu einer Periode mit niedriger Diskrepanz auftritt. Wie oben erwähnt, wird dies getätigt, um Schattensprache zu verhindern. Gemäß beispielhaften Ausführungen wird die Anpassung beendet, bevor die erhöhte Exponentielle Mittelung der Verstärkungsfunktion aufgrund des verminderten Pegels von &beta;(l) beginnt. Somit:
  • Wenn die Diskrepanz &beta;(l) sich erhöht, folgt der Parameter &beta;(l) direkt, wenn sich jedoch die Diskrepanz vermindert, wird ein exponentielles Mitteln für &beta;(l) verwendet, um den gemittelten Parameter &beta;(l) zu bilden. Die exponentielle Mittelung der Verstärkungsfunktion wird beschrieben durch:
  • M(l) = (1 - (l))· M(l - 1) + (l)·GM(l) (29)
  • Die obigen Gleichungen können für unterschiedliche Eingangssignalbedingungen wie folgt interpretiert werden.
  • Während verrauschter Perioden ist die Varianz reduziert. Solange die Rauschspektren einen stetigen Mittelwert für jede Frequenz aufweisen, kann gemittelt werden, um die Varianz zu vermindern. Rauschpegelveränderungen ergeben eine Diskrepanz zwischen dem gemittelten Rauschspektrum x,M(l), und dem Spektrum für den momentanen Block Px,M(l). Somit vermindert das gesteuerte exponentielle Mittelungsverfahren die Verstärkungsfunktionsmittelung, bis der Rauschpegel sich auf einem neuen Pegel stabilisiert hat. Dieses Verhalten erlaubt ein Handhaben von Rauschpegeländerungen und bewirkt eine Verminderung einer Varianz während stationärer Rauschperioden, und ein promptes Antworten auf Rauschänderungen. Eine Sprachsignal mit hoher Energie weist oft zeitvariierende Spektrale Spitzen auf. Wenn die spektralen Spitzen von unterschiedlichen Blöcken gemittelt werden, enthält deren spektrale Schätzung eine Mittelung dieser Spitzen, und sieht somit wie ein breiteres Spektrum aus, was eine reduzierte Sprachqualität zur Folge hat. Somit wird das exponentielle Mitteln während hochenergetischen Sprachperioden auf einem Minimum gehalten. Da die Diskrepanz zwischen dem mittleren Rauschspektrum x.M(l) und dem momentanen hochenergetischen Sprachspektrum Px.M(l) groß ist, wird kein exponentielles Mitteln der Verstärkungsfunktion durchgeführt. Während niedrigenergetischer Sprachperioden wird die exponentielle Mittelung mit einem Kurzspeicher verwendet, in Abhängigkeit von der Diskrepanz zwischen dem momentanen niedrigenergetischen Sprachspektrum und dem gemittelten Rauschspektrum. Die Varianzreduktion ist demzufolge für geringenergetische Sprache geringer als während Hintergrundrauschperioden, und größer im Vergleich zu hochenergetischen Sprachperioden.
  • Das oben beschriebene spektrale Subtraktionsverfahren gemäß der Erfindung ist in Fig. 4 veranschaulicht. In Fig. 4 zeigt einen Spektralsubtraktions-Rauschreduktionsprozessor 400, der eine lineare Faltung, ein kausales Filtern und ein gesteuertes exponentielles Mitteln bereitstellt, und enthält den Bartlett-Prozessor 305, den Quadrierungsgrößenprozessor 320, den Sprachaktivitätsdetektor 330, die Blockmittlungsvorrichtung 340, den Niedrigordnungs- Verstärkungsberechnungsprozessor 350, den Verstärkungsphasenprozessor 355, den Interpolationsprozessor 356, den Multiplizierer 360, den Inverse-Schnelle-Fourier- Transformation-Prozessor 370, und den Überlappungs- und Addierprozessor 389 des Systems 300 von Fig. 3, und auch den Mittelungssteuerprozessor 445, eine Exponentialmittelungsprozessor 446 und einen optionalen Fest- FIR-Nachfilter 465.
  • Wie veranschaulicht, ist das verrauschte Spracheingangssignal mit einem Eingang des Bartlett-Prozessors 305 und mit einem Eingang des Schnelle-Fourier-Transformation-Prozessors 310 verbunden. Ein Ausgang des Bartlett-Prozessors 305 ist mit einem Eingang des Quadrierungsgrößenprozessors 320 verbunden, und ein Ausgang des Schnelle-Fourier-Transformation- Prozessors 310 ist mit einem ersten Eingang des Multiplizierers 360 verbunden. Ein Ausgang des Quadrierungsgrößenprozessors 320 ist mit einem ersten Kontakt des Schalters 325 verbunden, mit einem ersten Eingang des Niedrigordnungs-Verstärkungsberechnungsprozessors 350 mit einem ersten Eingang des Mittelungssteuerungsprozessors 445.
  • Ein Steuerausgang des Sprachaktivitätsdetektors 330 ist mit einem Throw-Eingang des Schalters 325 verbunden, und ein zweiter Kontakt des Schalters 325 ist mit einem Eingang der Blockmittlungsvorrichtung 340 verbunden. Ein Ausgang der Blockmittlungsvorrichtung 340 ist mit einem zweiten Eingang des Niedrigordnungs-Verstärkungsberechnungsprozessors 350 und mit einem zweiten Eingang des Mittelungscontrollers 445 verbunden. Ein Ausgang des Niedrigordnungs- Verstärkungsberechnungsprozessors 350 ist mit einem Signaleingang des Exponentialmittelungsprozessors 446 verbunden, und ein Ausgang des Mittelungscontrollers 445 ist mit einem Steuereingang des Exponentialmittlungsprozessors 446 verbunden.
  • Eine Ausgabe des Exponentialmittlungsprozessors 446 ist mit einem Eingang des Verstärkungsphasenprozessors 355 gekoppelt, und ein Ausgang des Verstärkungsphasenprozessors 355 ist mit einem Eingang des Interpolationsprozessors 356 gekoppelt. Ein Ausgang des Interpolationsprozessors 356 ist mit einem zweiten Eingang des Multiplizierers 360 gekoppelt, und ein Ausgang des optionalen festen FIR-Nachfilters 456 ist mit einem dritten Eingang des Multiplizierers 360 gekoppelt. Ein Ausgang des Multiplizierers 360 ist mit einem Eingang des Inverse-Schnelle-Fourier-Transformation-Prozessors 370 gekoppelt, und ein Ausgang des Inverse-Schnelle-Fourier- Transformation-Prozessors 370 ist mit einem Eingang des Überlappungs- und Addierprozessors 380 gekoppelt. Ein Ausgang des Überlappungs- und Addierprozessors 380 liefert ein klares Sprachsignal für das beispielhafte System 400.
  • Beim Betrieb verarbeitet der Spektralsubtraktions- Rauschreduktionsprozessor 400 gemäß der Erfindung das ankommende verrauschte Sprachsignal unter Verwendung der linearen Faltung, kausalen Filterung und dem gesteuerten Exponentialmittlungsalgorithmus, oben erläutert, um das verbesserte, rauschreduzierte Sprachsignal bereitzustellen. Wie beim Ausführungsbeispiel von Fig. 3 können die verschiedenen Komponenten von Fig. 4 unter Verwendung beliebiger bekannter digitaler Signalverarbeitungstechnologie implementiert werden, einschließlich eines Allzweckcomputers, einer Ansammlung von integrierten Schaltungen und/oder anwendungsspezifischer integrierter Schaltungen (ASIC).
  • Es wird darauf hingewiesen, dass, da die Summe der Rahmenlänge L und der Unter-Blocklänge M in Übereinstimmung mit beispielhaften Ausführungen als kürzer als N - 1 gewählt ist, der zusätzliche feste FIR-Filter 465 mit Länge J &le; N - 1 - L - M hinzugefügt werden kann, wie in Fig. 4 gezeigt. Der Nachfilter 465 wird angewendet, indem die interpolierte Impulsantwort des Filters mit dem Signalspektrum multipliziert wird, wie gezeigt. Die Interpolation zu einer Länge N wird durch Auffüllen des Filters mit Nullen und durch Verwendung einer N-langen FFT durchgeführt. Dieser Nachfilter 465 kann dazu verwendet werden, die Telefonbandbreite oder eine konstante Tonkomponente herauszufiltern.
  • Alternativ kann die Funktionalität des Nachfilters 465 direkt in die Verstärkungsfunktion einbezogen werden.
  • Die Parameter des oben beschriebenen Algorithmus werden in die Tat umgesetzt basierend auf der speziellen Anwendung, in der der Algorithmus implementiert ist. Eine beispielhafte Parameterauswahl wird im folgenden in Zusammenhang mit einem Freihand-GSM-Automobil-Mobiltelefon beschrieben.
  • Zuerst wird basierend auf der GSM-Spezifikation die Rahmenlänge L auf 160 Abtastwerte eingestellt, was 20 ms Rahmen bereitstellt. Andere Auswahlen von L können in anderen Systemen verwendet werden. Es sollte jedoch darauf hingewiesen werden, dass eine Erhöhung der Rahmenlänge L einer Erhöhung einer Verzögerung entspricht. Die Unter- Blocklänge M (z. B. die Periodogrammlänge für den Bartlett- Prozessor) wird klein gemacht, um eine erhöhte Varianzreduktion M bereitzustellen. Da eine FFT dazu verwendet wird, die Periodogramme zu berechnen, kann die Länge M bequem auf ein Vielfaches von zwei eingestellt werden. Die Frequenzauflösung ergibt sich dann als:
  • B = Fs/M (30)
  • Die Abtastrate bei GSM ist 8000 Hz. Somit ergibt eine Länge M = 16, M = 32 und M = 64 eine Frequenzauflösung von 500 Hz, 250 Hz beziehungsweise 125 Hz, wie in Fig. 5 veranschaulicht. In Fig. 5 zeigt die Kurve (a) ein einfaches Periodogramm eines klaren Sprachsignals, und die Kurven (b), (c) und (d) zeigen Periodogramme, die für ein klares Sprachsignal unter Verwendung des Bartlett-Verfahrens mit 32, 16 beziehungsweise 8 Frequenzbändern berechnet wurden. Eine Frequenzauflösung von 250 Hz ist für Sprach- und Rauschsignale brauchbar, somit ist M = 32. Dieses liefert eine Länge L + M = 160 + 32 = 192, was geringer als N - 1 sein sollte, wie oben beschrieben. Somit wird N beispielsweise als ein Vielfaches von zwei gewählt, was größer als 192 ist, (z. B. N = 256). In solch einem Fall kann ein optionaler FIR-Nachfilter der Länge J &le; 63 angewendet werden, falls erwünscht.
  • Wie oben erwähnt, wird die Größe einer Rauschreduktion durch die Parameter a und k gesteuert. Eine Parameterwahl von a = 0,5 (d. h. eine Quadratwurzel-Spektralsubtraktion) liefert eine starke Rauschreduktion, während eine geringe Sprachverzerrung aufrecht erhalten wird. Dieses ist in Fig. 6 gezeigt (wo die Sprach- plus Rauschschätzung 1 ist und k 1 ist). Es wird in Fig. 6 darauf hingewiesen, dass a = 0,5 mehr Rauschreduktion im Vergleich zu höheren Werten von a liefert. Der Klarheit halber zeigt Fig. 6 nur eine Frequenzstelle, und es ist die SNR für diese Frequenzstelle, auf die im folgenden Bezug genommen wird.
  • In Übereinstimmung mit beispielhaften Ausführungen ist der Parameter k vergleichsweise klein eingestellt, wenn a = 0,5 verwendet wird. In Fig. 7 ist die Verstärkungsfunktion für unterschiedliche k-Werte veranschaulicht, bei a = 0,5 (auch hier ist die Sprache plus Rauschschätzung 1). Die Verstärkungsfunktion sollte sich fortlaufend vermindern, wenn in Richtung geringerem SNR gegangen wird, was der Fall ist, wenn k &le; 1. Simulationen zeigen, dass k = 0,7 eine geringe Sprachverzerrung liefert, während eine hohe Rauschreduktion aufrecht erhalten wird.
  • Wie oben beschrieben wird die Rauschspektrumschätzung exponentiell gemittelt, und der Parameter &alpha; steuert die Länge des exponentiellen Speichers. Da die Verstärkungsfunktion gemittelt wird, wird ein Bedarf an Rauschspektrumschätzmittelung geringer sein. Simulationen zeigen, das 0.6 < &alpha; < 0,9 die erwünschte Varianzreduktion bereitstellt, was eine Zeitkonstante &tau;frame von ungefähr 2 bis 10 Rahmen liefert:
  • &tau;frame -1/ln&alpha; (31)
  • Die exponentielle Mittelung der Rauschschätzung ist beispielsweise als &alpha; = 0,8 gewählt.
  • Der Parameter &beta;min bestimmt die Maximalzeitkonstante für die exponentielle Mittelung der Verstärkungsfunktion. Die Zeitkonstante &tau;&beta;min, bestimmt in Sekunden, wird dazu verwendet, um &beta;min zu bestimmen als:
  • Eine Zeitkonstante von 2 Minuten ist für ein stationäres Rauschsignal brauchbar, entsprechend zu &beta;min 0. Mit anderen Worten gibt es keine Notwendigkeit für eine niedrigere Begrenzung für &beta;(l) (in Gleichung (32)), da &beta;(l) &ge; 0 (gemäß Gleichung (25)).
  • Der Parameter &gamma;c steuert, wie schnell der Speicher der gesteuerten exponentiellen Mittelung sich vergrößern kann, wenn ein Übergang von Sprache zu einem stationären Eingangssignal vorliegt (d. h., wie schnell der (l) Parameter sich vermindern darf, unter Bezugnahme auf Gleichungen (27) und (28). Wenn das Mitteln der Verstärkungsfunktion unter Verwendung eines langen Speichers vorgenommen wird, ergibt dies ein Schattensprechen, da die Verstärkungsfunktion das Sprachspektrum erinnert.
  • Es wird beispielsweise eine extreme Situation betrachtet, in der die Diskrepanz zwischen der verrauschten Sprachspektrumschätzung PM(l) und der Rauschspektrumschätzung M(l) von einem Extremwert zu einem anderen übergeht. Im ersten Fall ist die Diskrepanz groß, so dass GM(l) 1 für alle Frequenzen, über eine lange Zeitperiode. Somit ist &beta;(l) = (l) = 1. Als nächstes werden die Spektralschätzungen manipuliert, so dass PM(l) = M(l), um eine Extremsituation zu simulieren, bei der &beta;(l) = 0 und GM(l) = (1 - k)1/a. Der (l) Parameter wird sich in Abhängigkeit vom Parameter &gamma;c auf Null vermindern. Somit sind die Parameterwerte:
  • (-1) = 1, M(-1) = 1,
  • &beta;(-1) = 1, GM(-1) = 1,
  • &beta;(l) = 0, GM(l) = 0.09, l = 0, 1, 2, ... (33)
  • Unter Einfügung gegebener Parameter in die Gleichungen (27) und (29) ergibt sich:
  • (l) = &gamma; (34)
  • M(l) = (1 - (l))· M(l - 1) + 0.09· (l) (35)
  • wobei l die Anzahl von Blöcken nach einem Vermindern einer Energie ist. Falls die Verstärkungsfunktion so gewählt ist, dass sie den Zeitkonstantenpegel e&supmin;¹ nach 2 Rahmen erreicht hat, ist &gamma;c 0,506. Diese Extremsituation ist in den Kurven (a) und (b) von Fig. 8 für unterschiedliche Werte von &gamma;c gezeigt. Eine realistischere Simulation mit einer langsameren Verminderung einer Energie ist auch in den Kurven (c) und (d) von Fig. 8 dargestellt. Die e&supmin;¹ Pegellinie stellt den Pegel einer Einheitszeitkonstante dar (d. h. wenn dieser Pegel durchlaufen wird, ist die Einheitszeitkonstante überschritten). Das Ergebnis einer Realsimulation unter Verwendung von aufgezeichneten Eingangssignalen ist in Fig. 9 dargestellt, und &gamma;c = 0,8 ist als eine gute Wahl zum Verhindern von Schattensprache gezeigt.
  • Im folgenden sind Ergebnisse bereitgestellt, erhalten unter Verwendung der oben vorgeschlagenen Parameterauswahlen. Vorteilhaft zeigen die simulierten Ergebnisse Verbesserungen einer Sprachqualität und Residualhintergrundrauschqualität im Vergleich zu anderen Spektralsubtraktionsansätzen, während immer noch eine starke Rauschreduktion bereitgestellt wird. Die Exponentialmittelung der Verstärkungsfunktion ist hauptsächlich verantwortlich für die erhöhte Qualität des residualen Rauschens. Die korrekte Faltung in Kombination mit der kausalen Filterung erhöht die Gesamtklangqualität, und macht es möglich, eine kurze Verzögerung zu erreichen.
  • In den Simulationen wurde der wohlbekannte GSM- Sprachaktivitätsdetektor (man siehe beispielsweise European Digital Cellular Telecommunications Systems (Phase 2); Voice Activity Detection (VAD) (GSM 06.32), European Telecommunications Standards Institute, 1994) wurde auf ein verrauschtes Sprachsignal angewendet. Die in den Simulationen verwendeten Signale wurden von getrennten Aufzeichnungen von Sprache und Rauschen, aufgezeichnet in einem Auto, kombiniert. Die Sprachaufzeichnung wird in einem ruhigen Auto unter Verwendung einer Freihandausrüstung und einem analogen Telefonbandbreitenfilter durchgeführt. Die Rauschsequenzen werden unter Verwendung der gleichen Ausrüstungen in einem bewegten Auto aufgezeichnet.
  • Die durchgeführte Rauschreduktion wird mit der empfangenen Sprachqualität verglichen. Die obigen Parameterauswahlen weisen gute Sprachqualität im Vergleich zu großer Rauschreduktion auf. Wenn aggressivere Auswahlen vorgenommen werden, wird eine verbesserte Rauschreduktion erzielt. Fig. 10 und 11 stellen die Eingangssprache beziehungsweise Rauschen dar, wobei die zwei Eingaben in einem 1 : 1 Verhältnis aufaddiert werden. Das sich ergebende verrauschte Eingangssprachsignal wird in Fig. 12 dargestellt. Das rauschreduzierte Ausgangssignal ist in Fig. 13 dargestellt. Die Ergebnisse können auch von einem Standpunkt der Energie dargestellt werden, was es einfach macht, die Rauschreduktion zu berechnen, und auch aufzeigt, wenn einige Sprachperioden nicht verbessert sind. Die Fig. 14, 15 und 16 zeigen die saubere Sprache, die verrauschte Sprache beziehungsweise die sich ergebende Ausgangssprache nach der Rauschreduktion. Wie gezeigt, wird eine Rauschreduktion im Bereich von 13 dB erzielt. Wenn eine Eingabe unter Verwendung von Sprache und Fahrzeugrauschen, in einem 2 : 1 Verhältnis aufaddiert, gebildet wird, erhöht sich die Eingangs-SNR, wie in Fig. 17 und 19 dargestellt. Die sich ergebenden Signale sind in den Fig. 18 und 20 dargestellt, wobei eine Rauschreduktion nahe bei 18 dB geschätzt werden kann.
  • Zusätzliche Simulationen wurden durchgeführt, um klar die Wichtigkeit aufzuzeigen, dass geeignete Impulsantwortlänge der Verstärkungsfunktion und auch kausale Eigenschaften vorliegen. Die im folgenden aufgezeigten Sequenzen sind alle abgeleitet von verrauschter Sprache mit einer Länge von 30 Sekunden. Die Sequenzen sind als die absoluten Mittelwerte der Ausgabe von der IFFT dargestellt, SN (siehe Fig. 4). Die IFFT ergibt 256 lange Datenblöcke, wobei der Absolutwert von jedem Datenwert abgenommen und gemittelt wird. Somit können die Effekte von unterschiedlichen Auswahlen einer Verstärkungsfunktion klar gesehen werden (d. h. nicht-kausaler Filter, kürzere und längere Impulsantworten, Minimalphase oder Linearphase).
  • Fig. 21 präsentiert den Mittelwert SN , was sich aus einer Verstärkungsfunktion mit einer Impulsantwort der kürzeren Länge M ergibt, und nicht-kausal ist, da die Verstärkungsfunktion eine Phase von Null aufweist. Dies kann auf dem hohen Pegel in den M = 32 Abtastwerten am Ende des gemittelten Blocks beobachtet werden.
  • Fig. 22 präsentiert den Mittelwert SN , was sich aus einer Verstärkungsfunktion mit einer Impulsantwort der vollen Länge N ergibt, und ist nicht-kausal, da die Verstärkungsfunktion eine Phase von Null aufweist. Dies kann bei dem hohen Pegel in den Abtastwerten am Ende des gemittelten Blocks beobachtet werden. Dieses entspricht der Verstärkungsfunktion für die bekannte Spektralsubtraktion, bezüglich Phase und Länge. Die Verstärkungsfunktion mit voller Länge wird erhalten, indem das Rausch-Periodogramm und das Periodogramm verrauschten Sprache anstelle der Verstärkungsfunktion interpoliert werden.
  • Fig. 23 präsentiert den Mittelwert SN , was sich aus einer Minimalphasenverstärkungsfunktion mit einer Impulsantwort der kürzeren Länge M ergibt. Die auf die Verstärkungsfunktion angewendete Minimalphase macht diese kausal. Die Kausalität kann beim niedrigen Pegel in den Abtastwerten am Ende des gemittelten Blocks beobachtet werden. Der Minimalphasenfilter ergibt eine Maximalverzögerung von M = 32 Abtastwerten, was in Fig. 23 am Verlauf von Abtastwert 160 bis 192 beobachtet werden kann. Die Verzögerung ist minimal unter der Bedingung, dass die Verstärkungsfunktion kausal ist.
  • Fig. 24 präsentiert den Mittelwert SN , was sich aus einer Verstärkungsfunktion mit einer Impulsantwort der vollen Länge N ergibt, und darauf beschränkt ist, eine Minimalphase aufzuweisen. Die Beschränkung auf Minimalphase ergibt eine Maximalverzögerung von N = 256 Abtastwerten, und der Block kann eine maximale lineare Verzögerung von 96 Abtastwerten halten, da der Rahmen 160 Abtastwerte am Anfang des vollen Blocks von 256 Abtastwerten ist. Dies kann in der Fig. 24 am Verlauf von Abtastwert 160 bis 255 beobachtet werden, was nicht Null erreicht. Da die Verzögerung länger als 96 sein kann, ergibt sich eine zirkuläre Verzögerung, und im Falle einer Minimalphase ist es schwierig, die verzögerten Abtastwerte zu erfassen, die den Rahmenabschnitt überlagern.
  • Fig. 25 präsentiert den Mittelwert SN , sich ergebend aus einer Linearphasenverstärkungsfunktion mit einer Impulsantwort der kürzeren Länge M. Die auf die Verstärkungsfunktion angewendete lineare Phase mach diese kausal. Dies kann am niedrigen Pegel in den Abtastwerten am Ende des gemittelten Blocks beobachtet werden. Die Verzögerung mit der linearen Phasenverstärkungsfunktion ist M/2 = 16 Abtastwerte, wie dies am Verlauf von Abtastwerten 0 bis 15 und 160 bis 175 beobachtet werden kann.
  • Fig. 26 präsentiert den Mittelwert SN , sich ergebend aus einer Verstärkungsfunktion mit einer Impulsantwort der vollen Länge N, und was darauf beschränkt ist, eine lineare Phase aufzuweisen. Die Beschränkung auf eine Linearphase ergibt eine Maximalverzögerung von N/2 = 128 Abtastwerten. Der Block kann eine maximale lineare Verzögerung von 96 Abtastwerten halten, da der Rahmen 160 Abtastwerte am Beginn des vollen Blocks von 256 Abtastwerten aufweist. Die Abtastwerte, die länger als 96 Abtastwerte verzögert wird, ergeben die beobachtete zirkuläre Verzögerung.
  • Der Vorteil von niedrigen Abtastwert-Werten im Block, entsprechend der Überlappung, ist geringer Indifferenz zwischen Blöcken, da die Überlappung keine Diskontinuitäten einführt. Wenn eine Voll-Längen-Impulsantwort verwendet wird, was der Fall für eine bekannte Spektralsubtraktion ist, überschreitet die mit Linearphase oder Minimalphase eingefügte Verzögerung die Länge des Blocks. Die resultierende zirkuläre Verzögerung ergibt einen "WRAP- around" (Umwickelungs-)Effekt der verzögerten Abtastwerte, und damit können die Abtastwerte in der falschen Reihenfolge sein. Dies zeigt an, dass dann, wenn eine Linearphasen- oder Minimalphasenverstärkungsfunktion verwendet wird, die kürzere Länge des Impulsantwort gewählt werden sollte. Die Einführung der Linear- oder Minimalphase macht die Verstärkungsfunktion kausal.
  • Wenn die Klangqualität des Ausgangssignals der wichtigste Faktor ist, dann sollte der lineare Phasenfilter verwendet werden. Wenn die Verzögerung wichtig ist, sollte der nicht- kausale Null-Phasenfilter verwendet werden, obwohl Sprachqualität im Vergleich zur Verwendung des Linearphasenfilters verloren geht. Ein guter Kompromiss ist der Minimalphasenfilter, der eine kurze Verzögerung und gute Sprachqualität aufweist, obwohl die Komplexität im Vergleich zur Verwendung des Linearphasenfilters höher ist. Die Verstärkungsfunktion entsprechend der Impulsantwort der kurzen Länge M sollte immer verwendet werden, um Klangqualität zu gewinnen.
  • Die exponentielle Mittelung der Verstärkungsfunktion liefert eine geringere Varianz, wenn das Signal stationär ist. Der Hauptvorteil ist die Reduktion von Musiktönen und residualem Rauschen. Die Verstärkungsfunktion mit oder ohne exponentieller Mittelung und in Fig. 27 bis 28 dargestellt. Wie veranschaulicht, ist die Variabilität des Signals während Rauschperioden und auch für Niedrigenergiesprachperioden, geringer, wenn die exponentielle Mittelung verwendet wird. Die geringere Variabilität der Verstärkungsfunktion bewirkt geringer auffallende Tonartefakte in dem Ausgangssignal.
  • Zusammenfassend liefert die vorliegende Erfindung verbesserte Verfahren und Vorrichtungen zur Spektralsubtraktion unter Verwendung einer linearen Faltung, kausalen Filterung und/oder gesteuerter exponentieller Mittelung der Verstärkungsfunktion. Die beispielhaften Verfahren liefern verbesserte Rauschreduktion und arbeiten gut mit Rahmenlängen zusammen, die nicht notwendiger Weise ein Vielfaches von zwei aufweisen. Dies kann ein wichtiges Merkmal sein, wenn das Rauschreduktionsverfahren mit anderen Sprachverbesserungsverfahren und anderen Sprachcodern integriert wird.
  • Die beispielhaften Verfahren reduzieren die Variabilität der Verstärkungsfunktion, in diesem Fall einer komplexen Funktion, auf zwei wichtige Weisen. Zuerst wird die Varianz der momentan Blockspektralschätzung mit einem Spektralschätzverfahren (z. B. Bartlett oder Welsh) reduziert, durch einen Kompromiss zwischen Frequenzauflösung und Varianzreduktion. Zweitens wird eine exponentielle Mittlung der Verstärkungsfunktion bereitgestellt, die von der Diskrepanz zwischen dem geschätzten Rauschspektrum und der Momentaneingangs-Signalspektralschätzung abhängt. Die geringe Variabilität der Verstärkungsfunktion während stationären Eingangssignalen ergibt einen Ausgang mit geringerem tonalen Residualrauschen. Die geringere Auflösung der Verstärkungsfunktion wird weiter dazu verwendet, eine korrekte Faltung durchzuführen, was eine verbesserte Klangqualität liefert. Die Klangqualität wird weiter verbessert, indem kausale Eigenschaften zur Verstärkungsfunktion hinzugefügt werden. Vorteilhafter Weise kann die Qualitätsverbesserung im Ausgabeblock beobachtet werden. Eine Klangqualitätsverbesserung ergibt sich aufgrund der Tatsache, dass der überlappende Teil der Ausgabeblöcke stark reduzierte Abtast-Werte aufweisen, und damit die Blöcke weniger interferieren, wenn sie mit den Überlappungs- und Addierverfahren eingepasst werden. Die Ausgangsrauschreduktion ist 13-18 dB unter Verwendung der oben beschriebenen beispielhaften Parameterauswahlen.
  • Der Fachmann versteht, dass die vorliegende Erfindung nicht auf die bestimmten beispielhaften Ausführungen beschränkt ist, die hierin zum Zwecke einer Veranschaulichung beschrieben wurden, und dass viele alternative Ausführungen auch erwogen sind. Obwohl die Erfindung im Umfeld von Freihand-Kommunikationsanwendungen beschrieben wurde, versteht der Fachmann beispielsweise, dass die Lehren der Erfindung genauso auf irgendeine Signalverarbeitungsanwendung anwendbar sind, bei der es wünschenswert ist, eine bestimmte Signalkomponente zu entfernen. Der Umfang der Erfindung ist daher durch die angefügten Ansprüche definiert, und nicht durch die vorhergehende Beschreibung, und alle Äquivalente im Umfang der Bedeutung der Ansprüche sollen hierin umfasst sein.

Claims (30)

1. Ein Rauschunterdrückungssystem mit einem Spektralsubtraktionsprozessor (300, 400) dazu konfiguriert, ein rauschbehaftetes Eingangssignal (X) zu filtern, um ein rauschreduziertes Ausgangssignal (S) bereitzustellen, wobei basierend auf einem jeweiligen Block von Abtastwerten des Eingangssignals (XLIN) und einem jeweiligen Block von Abtastwerten einer Verstärkungsfunktion (350) ein Block von Abtastwerten des rauschreduzierten Ausgangssignals (SMIN) berechnet wird, dadurch gekennzeichnet, dass
die Verstärkungsfunktion (350) des Spektralsubtraktionsprozessors (300, 400) basierend auf einer Schätzung einer spektralen Dichte des Eingangssignals und einer Schätzung einer spektralen Dichte einer Rauschkomponente des Eingangssignals berechnet ist; und
eine Phase (355) zur Verstärkungsfunktion (350) hinzuaddiert ist, so dass der Spektralsubtraktionsprozessor (300, 400) ein kausales Filtern bereitstellt,
wobei eine Ordnung des Blocks von berechneten Abtastwerten des Ausgangssignals (SMIN) größer als eine Summe einer Ordnung des jeweiligen Blocks von Abtastwerten des Eingangssignals (XLIN) und einer Ordnung des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion (350) ist.
2. Das Rauschunterdrückungssystem nach Anspruch 1, wobei der Block von berechneten Abtastwerten des Ausgangssignals (SMIN) basierend auf einer Faltung des jeweiligen Blocks von Abtastwerten des Eingangssignals (XLIN) und des jeweiligen Blocks von Abtastwerten des Verstärkungsfunktion (350) berechnet ist.
3. Das Rauschunterdrückungssystem nach Anspruch 1, wobei ein Block von N-Abtastwerten des Ausgangssignals (SMIN) basierend auf einem Block von L-Abtastwerten des Eingangssignals (XLIN) berechnet ist, wobei L kleiner als N ist.
4. Das Rauschunterdrückungssystem nach Anspruch 1, wobei ein Block von N-Abtastwerten des Ausgangssignals (SMIN) basierend auf einem Block von M-Abtastwerten der Verstärkungsfunktion (350) berechnet ist, wobei M kleiner als N ist.
5. Das Rauschunterdrückungssystem nach Anspruch 1, wobei ein Block von N-Abtastwerten des Ausgangssignals (Si) basierend auf einem Block von L-Abtastwerten des Eingangssignals (XLIN) und einem Block von M- Abtastwerten der Verstärkungsfunktion (350) berechnet ist, wobei die Summe von L und M geringer als N ist.
6. Das Rauschunterdrückungssystem nach Anspruch 5, wobei der Block von L-Abtastwerten des Eingangssignals mit Nullen aufgefüllt ist, um einen Block von N- Eingangssignalabtastwerten (XLIN) bereitzustellen, auf denen der Block von N-Abtastwerten des Ausgangssignals (SMIN) basiert.
7. Das Rauschunterdrückungssystem nach Anspruch 5, wobei der Block von M-Abtastwerten der Verstärkungsfunktion (350) interpoliert ist (356), um einen Block von N- Verstärkungsfunktionsabtastwerten bereitzustellen, auf dem der Block von N-Abtastwerten des Ausgangssignals (SMIN) basiert.
8. Das Rauschunterdrückungssystem nach Anspruch 5, wobei der Block von M-Abtastwerten der Verstärkungsfunktion (350) mittels einer Spektralabschätzung basierend auf den L-Abtastwerten des Eingangssignals berechnet ist.
9. Das Rauschunterdrückungssystem nach Anspruch 8, wobei die Spektralschätzung unter Verwendung des Bartlett- Verfahrens (305) durchgeführt ist.
10. Das Rauschunterdrückungssystem nach Anspruch 8, wobei die Spektralabschätzung unter Verwendung des Welsh- Verfahrens durchgeführt ist.
11. Das Rauschunterdrückungssystem nach Anspruch 1, wobei aufeinanderfolgende Blöcke von dem Ausgangssignal (SMIN) unter Verwendung eines Überlappungs- und Addierverfahrens (380) angepasst sind.
12. Das Rauschunterdrückungssystem nach Anspruch 1, wobei die Verstärkungsfunktion (350) eine lineare Phase aufweist.
13. Das Rauschunterdrückungssystem nach Anspruch 1, wobei die Verstärkungsfunktion (350) eine Minimumphase aufweist.
14. Ein Verfahren zum Verarbeiten eines verrauschten Eingangssignals (X), um ein rauschreduziertes Ausgangssignal (S) bereitzustellen, umfassend die Schritte einer Verwendung einer Spektralsubtraktion, um das rauschreduzierte Ausgangssignal (S) basierend auf dem verrauschten Eingangssignal (X) und basierend auf einer Verstärkungsfunktion (350), berechnet unter Verwendung von spektralen Dichteschätzwerten, zu berechnen, wobei ein Block von Abtastwerten des rauschreduzierten Ausgangssignals (SMIN) basierend auf einem jeweiligen Block von Abtastwerten des Eingangssignals (XLIN) und auf einem jeweiligen Block von Abtastwerten der Verstärkungsfunktion (350) berechnet wird, gekennzeichnet durch
Berechnen einer Schätzung einer spektralen Dichte des Eingangssignals und einer Schätzung einer spektralen Dichte einer Rauschkomponente des Eingangssignals; und
Addieren einer Phase (355) zur Verstärkungsfunktion (350), so dass der Schritt zur Verwendung einer spektralen Subtraktion ein kausales Filtern bereitstellt,
wobei eine Ordnung des Blocks von berechneten Abtastwerten des Ausgangssignals (SMIN) größer als eine Summe einer Ordnung des jeweiligen Blocks von Abtastwerten des Eingangssignals (XLIN) und einer Ordnung des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion (350) ist.
15. Das Verfahren nach Anspruch 14, umfassend den Schritt zum Berechnen des Blocks von berechneten Abtastwerten des Ausgangssignals (SMIN) als eine Faltung des jeweiligen Blocks von Abtastwerten des Eingangssignals (XLIN) und des jeweiligen Blocks von Abtastwerten der Verstärkungsfunktion (350).
16. Das Verfahren nach Anspruch 14, umfassend den Schritt zur Berechnung eines Blocks von N-Abtastwerten des Ausgangssignals (SMIN) basierend auf einem Block von L- Abtastwerten des Eingangssignals, wobei L kleiner als N ist.
17. Das Verfahren nach Anspruch 14, umfassend den Schritt zum Berechnen eines Blocks von N-Abtastwerten des Ausgangssignals (SMIN) basierend auf einem Block von M- Abtastwerten der Verstärkungsfunktion (350), wobei M kleiner als N ist.
18. Das Verfahren nach Anspruch 14, umfassend den Schritt zur Berechnung eines Blocks von N-Abtastwerten des Ausgangssignals (SMIN) basierend auf einem Block von L- Abtastwerten des Eingangssignals und auf einem Block von M-Abtastwerten der Verstärkungsfunktion (350), wobei die Summe von L und M geringer als N ist.
19. Das Verfahren nach Anspruch 18, umfassend den Schritt einer Auffüllung des Blocks von L-Abtastwerten des Eingangssignals mit Nullen, um einen Block von N- Eingangs (XLIN) Signalabtastwerten für eine Berechnung des Blocks von N-Abtastwerten des Ausgangssignals (SMIN) bereitzustellen.
20. Das Verfahren nach Anspruch 18, umfassend den Schritt einer Interpolierung (356) des Blocks von M-Abtastwerten der Verstärkungsfunktion (350), um einen Block von N- Verstärkungsfunktionsabtastwerten für eine Berechnung des Blocks von N-Abtastwerten des Ausgangssignals (SMIN) bereitzustellen.
21. Das Verfahren nach Anspruch 18, umfassend den Schritt einer Verwendung einer spektralen Abschätzung zur Berechnung des Blocks von M-Abtastwerten der Verstärkungsfunktionen (350) basierend auf den L- Abtastwerten des Eingangssignals.
22. Das Verfahren nach Anspruch 21, wobei der Schritt einer Verwendung einer spektralen Abschätzung unter Verwendung eines Bartlett-Algorithmus (305) durchgeführt wird.
23. Das Verfahren nach Anspruch 21, wobei der Schritt einer Verwendung einer spektralen Abschätzung unter Verwendung eines Welsh-Algorithmus durchgeführt wird.
24. Das Verfahren nach Anspruch 14, umfassend den Schritt einer Anpassung aufeinander folgender Blöcke des Ausgangssignals (SMIN) unter Verwendung eines Überlappungs- und Addierverfahrens (380).
25. Das Verfahren nach Anspruch 14, wobei die Verstärkungsfunktion (350) eine lineare Phase aufweist.
26. Das Verfahren nach Anspruch 14, wobei die Verstärkungsfunktion (350) eine Minimalphase aufweist.
27. Ein Mobiltelefon, umfassend einen Spektralsubtraktionsprozessor (300, 400), dazu ausgebildet, ein verrauschtes Nah-End-Sprachsignal (X) zu filtern, um ein rauschreduziertes Nah-End- Sprachsignal (S) bereitzustellen, wobei ein Block von Abtastwerten des rauschreduzierten Nah-End-Sprachsignals (SMIN) basierend auf einem jeweiligen Block von Abtastwerten des verrauschten Nah-End-Sprachsignals (XLIN) und auf einem jeweiligen Block von Abtastwerten einer Verstärkungsfunktion (350) berechnet ist, dadurch gekennzeichnet, dass
die Verstärkungsfunktion (350) des Spektralsubtraktionsprozessors basierend auf einer Abschätzung einer spektralen Dichte des verrauschten Nahend-Sprachsignals und auf einer Schätzung einer spektralen Dichte einer Rauschkomponente des verrauschten Nahend-Sprachsignals berechnet ist; und
eine Phase (355) zur Verstärkungsfunktion (350) hinzuaddiert ist, so dass der Spektralsubtraktionsprozessor (300, 400) ein kausales Filtern bereitstellt,
wobei eine Ordnung des Blocks von berechneten Abtastwerten des rauschreduzierten Sprachsignals (SMIN) großer als eine Summe einer Ordnung des jeweiligen Blocks von Abtastwerten des verrauschten Nah-End- Sprachsignals (XLIN) und einer Ordnung des jeweiligen Blocks von Abtastwerten der Verstärkungfunktion (350) ist.
28. Das Mobiltelefon nach Anspruch 27, wobei ein Block von Abtastwerten der Verstärkungfunktion (350) unter Verwendung einer spektralen Schätzung basierend auf einem Block von Abtastwerten des verrauschten Nahend- Sprachsignals berechnet ist.
29. Das Mobiltelefon nach Anspruch 28, wobei die Spektralabschätzung unter Verwendung von entweder einem Bartlett-Algorithmus (350) oder einem Welsh-Algorithmus durchgeführt ist.
30. Das Mobiltelefon nach Anspruch 27, wobei die Verstärkungfunktion (350) entweder eine lineare Phase oder eine Minimalphase aufweist.
DE69905035T 1998-05-27 1999-05-27 Rauschunterdrückung mittels spektraler subtraktion unter verwendung von linearem faltungsprodukt und kausaler filterung Expired - Lifetime DE69905035T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/084,387 US6175602B1 (en) 1998-05-27 1998-05-27 Signal noise reduction by spectral subtraction using linear convolution and casual filtering
PCT/SE1999/000899 WO1999062054A1 (en) 1998-05-27 1999-05-27 Signal noise reduction by spectral subtraction using linear convolution and causal filtering

Publications (2)

Publication Number Publication Date
DE69905035D1 DE69905035D1 (de) 2003-02-27
DE69905035T2 true DE69905035T2 (de) 2003-08-21

Family

ID=22184655

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69905035T Expired - Lifetime DE69905035T2 (de) 1998-05-27 1999-05-27 Rauschunterdrückung mittels spektraler subtraktion unter verwendung von linearem faltungsprodukt und kausaler filterung

Country Status (14)

Country Link
US (1) US6175602B1 (de)
EP (1) EP1080465B1 (de)
JP (1) JP4402295B2 (de)
KR (1) KR100594563B1 (de)
CN (1) CN1145931C (de)
AT (1) ATE231644T1 (de)
AU (1) AU756511B2 (de)
BR (1) BR9910704A (de)
DE (1) DE69905035T2 (de)
EE (1) EE200000678A (de)
HK (1) HK1039996B (de)
IL (1) IL139653A (de)
MY (1) MY120810A (de)
WO (1) WO1999062054A1 (de)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6510408B1 (en) * 1997-07-01 2003-01-21 Patran Aps Method of noise reduction in speech signals and an apparatus for performing the method
US6459914B1 (en) * 1998-05-27 2002-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US6549586B2 (en) 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6697654B2 (en) * 1999-07-22 2004-02-24 Sensys Medical, Inc. Targeted interference subtraction applied to near-infrared measurement of analytes
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
DE10017646A1 (de) * 2000-04-08 2001-10-11 Alcatel Sa Geräuschunterdrückung im Zeitbereich
US6359773B1 (en) * 2000-08-24 2002-03-19 Inventec Corporation Portable data processing device
US6463408B1 (en) 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
JP2002221988A (ja) * 2001-01-25 2002-08-09 Toshiba Corp 音声信号の雑音抑圧方法と装置及び音声認識装置
JP4127792B2 (ja) * 2001-04-09 2008-07-30 エヌエックスピー ビー ヴィ 音声強化デバイス
DE10150519B4 (de) 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
WO2003059007A2 (en) * 2002-01-07 2003-07-17 Meyer Ronald L Microphone support system
CA2506700C (en) * 2002-10-04 2013-05-21 Sigtec Navigation Pty Ltd Satellite-based positioning system improvement
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7480595B2 (en) * 2003-08-11 2009-01-20 Japan Science And Technology Agency System estimation method and program, recording medium, and system estimation device
KR100644627B1 (ko) * 2004-09-14 2006-11-10 삼성전자주식회사 음장 제어 정보 부호화 방법 및 이에 적합한 음장 처리 방법
CN101031963B (zh) * 2004-09-16 2010-09-15 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
CA2603389C (en) * 2005-05-13 2012-07-10 Bio-Rad Laboratories, Inc. Identifying statistically linear data
US7676046B1 (en) 2005-06-09 2010-03-09 The United States Of America As Represented By The Director Of The National Security Agency Method of removing noise and interference from signal
US7492814B1 (en) 2005-06-09 2009-02-17 The U.S. Government As Represented By The Director Of The National Security Agency Method of removing noise and interference from signal using peak picking
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
DE102005039621A1 (de) 2005-08-19 2007-03-01 Micronas Gmbh Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
JP4750592B2 (ja) * 2006-03-17 2011-08-17 富士通株式会社 ピーク抑圧方法、ピーク抑圧装置、無線送信装置
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US20080231557A1 (en) * 2007-03-20 2008-09-25 Leadis Technology, Inc. Emission control in aged active matrix oled display using voltage ratio or current ratio
US8868418B2 (en) * 2007-06-15 2014-10-21 Alon Konchitsky Receiver intelligibility enhancement system
US8868417B2 (en) * 2007-06-15 2014-10-21 Alon Konchitsky Handset intelligibility enhancement system using adaptive filters and signal buffers
US20080312916A1 (en) * 2007-06-15 2008-12-18 Mr. Alon Konchitsky Receiver Intelligibility Enhancement System
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
JP2010122617A (ja) * 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
US20100239110A1 (en) * 2009-03-17 2010-09-23 Temic Automotive Of North America, Inc. Systems and Methods for Optimizing an Audio Communication System
US8834386B2 (en) * 2009-07-07 2014-09-16 Koninklijke Philips N.V. Noise reduction of breathing signals
CN101860774B (zh) * 2010-05-31 2014-03-05 中山大学 一种能够自动修复声音的语音设备及方法
DE112011104737B4 (de) * 2011-01-19 2015-06-03 Mitsubishi Electric Corporation Geräuschunterdrückungsvorrichtung
US9159336B1 (en) * 2013-01-21 2015-10-13 Rawles Llc Cross-domain filtering for audio noise reduction
JP6337519B2 (ja) * 2014-03-03 2018-06-06 富士通株式会社 音声処理装置、雑音抑圧方法、およびプログラム
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
GB2558529A (en) * 2016-09-11 2018-07-18 Continental automotive systems inc Dynamically increased noise suppression based on input noise characteristics
WO2019213769A1 (en) 2018-05-09 2019-11-14 Nureva Inc. Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
US10894512B2 (en) 2019-04-11 2021-01-19 Gregory J. Phillips Side-facing side view mirror brake lights
ES2928295T3 (es) * 2020-02-14 2022-11-16 System One Noc & Dev Solutions S A Método de mejora de las señales de voz telefónica basado en redes neuronales convolucionales
US12062369B2 (en) * 2020-09-25 2024-08-13 Intel Corporation Real-time dynamic noise reduction using convolutional networks

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
US5400299A (en) 1993-08-20 1995-03-21 Exxon Production Research Company Seismic vibrator signature deconvolution
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
KR100250561B1 (ko) * 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
US5933495A (en) * 1997-02-07 1999-08-03 Texas Instruments Incorporated Subband acoustic noise suppression

Also Published As

Publication number Publication date
WO1999062054A1 (en) 1999-12-02
JP4402295B2 (ja) 2010-01-20
HK1039996B (zh) 2005-02-18
BR9910704A (pt) 2001-01-30
KR100594563B1 (ko) 2006-06-30
CN1311891A (zh) 2001-09-05
US6175602B1 (en) 2001-01-16
ATE231644T1 (de) 2003-02-15
IL139653A0 (en) 2002-02-10
AU4664499A (en) 1999-12-13
JP2002517021A (ja) 2002-06-11
CN1145931C (zh) 2004-04-14
MY120810A (en) 2005-11-30
HK1039996A1 (en) 2002-05-17
EP1080465A1 (de) 2001-03-07
IL139653A (en) 2005-06-19
DE69905035D1 (de) 2003-02-27
EE200000678A (et) 2002-04-15
AU756511B2 (en) 2003-01-16
KR20010043837A (ko) 2001-05-25
EP1080465B1 (de) 2003-01-22

Similar Documents

Publication Publication Date Title
DE69905035T2 (de) Rauschunterdrückung mittels spektraler subtraktion unter verwendung von linearem faltungsprodukt und kausaler filterung
DE60001398T2 (de) System und verfahren zur rauschverminderung im mikrofonpaarsignal mittels spektraler subtraktion
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE60116255T2 (de) Rauschunterdückungsvorrichtung und -verfahren
DE60031354T2 (de) Geräuschunterdrückung vor der Sprachkodierung
DE69420027T2 (de) Rauschverminderung
DE69816128T2 (de) Verfahren und vorrichtung zur erzeugung von hintergrundrauschen in einem kommunikationssystem
EP1080463B1 (de) Rauschsignalunterdrückung mittels spektraler subtraktion unter verwendung einer spektral abhängigen exponentiellen gemittelten verstärkungsfunktion
DE69529328T2 (de) Verfahren und Apparat zur Geräuschunterdrückung in einem Sprachsignal und korrespondierendes System mit Echounterdrückung
DE69627359T2 (de) Verbesserter echokompensator mit anwendung in der digitalen telefonie
DE102008039330A1 (de) Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
DE69731573T2 (de) Geräuschverminderungsanordnung
EP0912974A1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE10119277A1 (de) Verfahren zur Maskierung von Geräuschmodulationen und Störgeräuschen bei der Sprachübertragung
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
DE10162559B4 (de) Verfahren und Vorrichtung zur Unterdrückung von periodischen Störsignalen
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
WO2001099390A2 (en) Noise reduction method and apparatus
DE10043064B4 (de) Verfahren und Vorrichtung zur Elimination von Lautsprecherinterferenzen aus Mikrofonsignalen
DE60030137T2 (de) Verfahren und vorrichtung zur leistungsverbesserung eines adaptiven filters mittels nicht hörbarer information
EP2080197B1 (de) Vorrichtung zur geräuschunterdrückung bei einem audiosignal
EP1155561B1 (de) Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
EP1430674B1 (de) Vorrichtung und verfahren zur unterdrückung von periodischen störsignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition