DE4445983C2 - Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren - Google Patents
Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der VerfahrenInfo
- Publication number
- DE4445983C2 DE4445983C2 DE19944445983 DE4445983A DE4445983C2 DE 4445983 C2 DE4445983 C2 DE 4445983C2 DE 19944445983 DE19944445983 DE 19944445983 DE 4445983 A DE4445983 A DE 4445983A DE 4445983 C2 DE4445983 C2 DE 4445983C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- unit
- disturbed
- values
- power density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 69
- 230000009467 reduction Effects 0.000 title claims description 22
- 230000006870 function Effects 0.000 claims description 36
- 230000003595 spectral effect Effects 0.000 claims description 20
- 230000001629 suppression Effects 0.000 claims description 20
- 238000012546 transfer Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 13
- 238000011410 subtraction method Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims 2
- 230000002950 deficient Effects 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 238000011946 reduction process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Rauschunterdrückung nach dem
Spektralsubtraktionsverfahren und ein Verfahren zur Unterdrückung von nadelförmigen
Störimpulsen, sowie Vorrichtungen zur Durchführung dieser Verfahren.
Bei Tonträgern, insbesondere Kompaktkassetten, sind Rauschunterdrückungsverfahren
bekannt, die bei der Aufnahme auf einer pegel- und frequenzabhängigen Kompression und
bei der Wiedergabe auf einer entsprechenden Expansion des Audiosignals beruhen. Eines
dieser Verfahren ist als sogenanntes Dolby®-Verfahren bekannt. Da diese Verfahren sowohl
bei der Aufnahme als auch bei der Wiedergabe angewendet werden müssen, ist keine
nachträgliche Rauschreduktion bei der Wiedergabe von nicht vorverarbeitetem Material
möglich. Auch ergibt das Abspielen von Tonaufnahmen, welche einer Kompression
unterzogen wurden, keine befriedigende Klangqualität, soweit ein entsprechendes
Expansionsverfahren nicht verwendet wird. Somit zeigt sich, daß derartige
Rauschunterdrückungsverfahren für eine allgemeine Anwendung, insbesondere für die
Rauschunterdrückung bei Rundfunkempfängern, nicht geeignet ist.
Ein weiteres bekanntes Verfahren zur Rauschreduktion stellt das sogenannte
Spektralsubtraktionsverfahren dar, das unter anderem in der Dissertationsschrift
"Geräuschreduktion bei Sprachübertragung mit Hilfe von Mikrophon-Array-Systemen",
S. Gierl, Universität Karlsruhe 1990, S. 90-92, beschrieben ist.
Bei diesem Verfahren wird das Signal durch eine Einheit zur Signalanalyse, welche im
wesentlichen aus einer Fouriertransformationseinheit besteht, auf ihre spektralen
Eigenschaften analysiert. Aus diesen spektralen Eigenschaften wird die Leistungsdichte des
gestörten Signals bestimmt, wobei anhand von detektierten Pausen im Signal die
Störleistungsdichte abgeschätzt wird. Diese abgeschätzte Störleistungsdichte wird von der
Leistungsdichte des gestörten Signals subtrahiert, was zu einem im wesentlichen ungestörten
Signal führt. Diese Subtraktion erfolgt durch die Anwendung einer Übertragungsfunktion
auf das analysierte Signal, insbesondere auf den Betragsbestandteil des an sich komplexen
fouriertransformierten Signals. Im folgenden wird das angepaßte und fouriertransformierte
Signal in einer Einheit zur Signalsynthese, welche im wesentlichen eine Einheit zur inversen
Fouriertransformation enthält, rücktransformiert zu einem gewöhnlichen Signal. Dieses
Signal erweist sich als rauschreduziert. Dieses rauschreduzierte Signal zeigt eine Reihe von
störenden Artefakten, sogenannte "musical tones", die oft störender wahrgenommen werden
als das relativ gleichmäßige Rauschen, welches einem Audiosignal überlagert sein kann.
Weiterhin erweist sich dieses Verfahren als zum Teil nicht durchführbar oder nur als
begrenzt tauglich, wenn das Signal überhaupt keine Pausen enthält oder die Pausen von
solchem zeitlichen Abstand sind, daß sie den geänderten Signalbedingungen nicht mehr
angepaßt sein können. In solchen Fällen führt dieses Verfahren teilweise zu dem
ungewollten, möglichst zu vermeidenden Unterdrücken des eigentlichen Signals.
Der Erfindung liegt unter Berücksichtigung des Standes der Technik die Aufgabe zugrunde,
ein Rauschunterdrückungsverfahren und Vorrichtungen zur Durchführung dieses Verfahrens
zu schaffen, welche bei möglichst geringer Verzerrung des eigentlichen Signals ein
bestmögliches Rauschunterdrückungsergebnis und damit ein bestmögliches Nutzsignal
erreichen. Dabei sollen insbesondere Artefakte wie "musical tones" und ähnliche, aufgrund
von nadelförmigen oder breitbandigen Störsignalen, vermieden werden.
Diese Aufgabe wird mit den Verfahren nach Anspruch 1 und 10, sowie mit den
Vorrichtungen zur Durchführung dieser Verfahren nach den Ansprüchen 20 und 23 gelöst.
Vorteilhafte Weiterbildungen dieser Erfindung sind in den abhängigen Ansprüchen
dargestellt.
Durch die besonders vorteilhafte Weise, die Störleistungsdichte eines breitbandigen
Rauschsignals anhand des Minimums der Leistungsdichte des gestörten Signals zu
bestimmen, ist eine sehr sichere und aussagekräftige Möglichkeit zur Bestimmung der
Störleistungsdichte und damit zur Optimierung des an sich bekannten
Spektralsubtraktionsverfahrens gegeben. Diese vorteilhafte Weise ermöglicht es, unabhängig
von Pausen, also sowohl deren Abstand als auch deren Länge, die Störleistungsdichte zu
bestimmen. Weiterhin gelingt es nun, die Störleistungsdichte entsprechend den jeweils
aktuellen Bedingungen, d. h. jeweils nach der Art der Musik, z. B. Klassik, moderne Musik
einschließlich Techno oder Sprache, zu bestimmen, welche je nach Art völlig
unterschiedlich ausgeprägt ausfällt. Daher ist eine bewußte externe Anpassung an die
geänderten Bedingungen nicht mehr erforderlich. Damit ist ein sehr sicheres, automatisches
Spektralsubtraktionsverfahren zur Unterdrückung von breitbandigen Störsignalen gegeben.
Nach einem weiteren vorteilhaften Merkmal der Erfindung wird das Minimum der
Leistungsdichte über einen begrenzten Frequenzabschnitt bestimmt. Der begrenzte
Frequenzabschnitt wird auf ein möglichst eng begrenztes Frequenzband eingeengt, um damit
den für die Berechnung notwendigen Aufwand an Speicherleistung und Rechenzeit
möglichst gering zu halten. Dies ist bei geeigneter Auswahl des Frequenzabschnittes
möglich, ohne die Qualität der Rauschunterdrückung zu reduzieren, im Gegenteil, durch das
beschleunigte Rechenverfahren gelingt es sogar, die für eine erfolgreiche
Rauschunterdrückung erforderliche Übertragungsfunktion häufiger zu aktualisieren, was der
Rauschunterdrückungsqualität zugute kommt. Damit ist ein besonders vorteilhaftes
Klangempfinden für den Hörer am Beispiel von Hörsignalen gegeben. In diesem Fall wird
der begrenzte Frequenzbandabschnitt auf den Nutzkanal, in diesem Fall den menschlichen
Hörbereich begrenzt.
Teilweise ist es sogar möglich, das Frequenzband des Nutzsignals noch weiter
einzuschränken, wenn das Minimum der Leistungsdichte für bestimmte Frequenzen
repräsentativ ist für den gesamten Frequenzbereich. In diesem Fall wird das Rechenverfahren
noch einmal beschleunigt und damit das Rauschunterdrückungsverfahren noch weiter
optimiert.
Nach einer vorteilhaften Ausbildung des Verfahrens wird neben der Bestimmung des
Minimums der Leistungsdichte auch das Maximum bestimmt. Aus diesen Angaben läßt sich
eine Plausibilitätskontrolle durchführen, wodurch es gelingt, Irrläufer, welche aus der
Signalanalyse entstehen können, zu identifizieren und eine Zugrundelegung für die
Rauschunterdrückung zu verhindern, was eine weitere Verbesserung des
Rauschunterdrückungsergebnisses bewirkt.
Nach einem besonders vorteilhaften Merkmal der Erfindung wird die Übertragungsfunktion
(Hg) durch Faltung einer Fensterfunktion (G) mit einer Übertragungsfunktion (H) gegeben.
Durch diese besondere Erzeugung der Übertragungsfunktion (Hg) gelingt es, die besonders
störenden "musical tones" zu verhindern. Neben den "musical tones" lassen sich auch andere
Effekte, insbesondere durch geeignete Wahl der Fensterfunktion wie z. B. der Hamming-Funktion,
verhindern, wie z. B. die störenden Gibbs'schen Phänomene aufgrund des
Überschwingverhaltens bei den Fouriertransformationen bzw. der inversen
Fouriertransformation. Eine rechenaufwandreduzierte Fensterfunktion ist durch die
sogenannte Rechteckfunktion gegeben, welche aufgrund des minimalen Rechenaufwandes
ein Optimum an Rechengeschwindigkeit und damit die Echtzeitverarbeitung der Signale
sicherstellt. Diese Echtzeitverarbeitung ermöglicht ein möglichst autentisches rauscharmes
Signal.
Nach einer bevorzugten Ausbildungsform der Erfindung wird aus den bestimmten
Extremwerten ein Maß für das Signal-Rausch-Verhältnis des Signals abgeleitet, anhand
dessen bei Unterschreitung eines gewählten Grenzwertes der Stereodecoder von Stereo auf
Mono geschaltet wird. Dadurch gelingt es, den Signalspannungsabstand um mehrere dB zu
erhöhen, was selbst wiederum rauschunterdrückend wirkt.
In einem anderen Verfahren der Erfindung wird das MPX-Signal auf Signaländerungen
untersucht, welche durch nadelförmige Störimpulse, insbesondere von Multipathstörungen
herrührt. Sobald diese gestörten Signale aufgefunden wurden, werden diese durch
korrigierte Werte ersetzt. Erfindungsgemäß wird dabei das MPX-Signal selbst untersucht.
Dies erfolgt insbesondere, indem es auf Signaländerungen oberhalb eines bestimmten
einstellbaren Schwellwerts untersucht wird. Liegen die Signalwertänderungen oberhalb
dieses Schwellwerts, so ist eine Störung detektiert und diese Signalstelle wird durch einen
korrigierten Wert ersetzt, welcher in der technisch einfachsten Ausführung des Verfahrens
gleich dem letzten ungestörten Wert gewählt wird. Bessere Korrekturergebnisse werden
erreicht, indem aufwendigere Verfahren zur Korrekturwertbestimmung verwendet werden,
insbesondere Interpolationsverfahren linearer oder höherer Ordnung, welche aus den den
gestörten Signalen benachbarten, ungestörten Signalwerten die Korrekturwerte bestimmt.
Dabei zeigt sich, daß die Interpolationsverfahren höherer Ordnung für den Zuhörer bessere
Klangergebnisse gewährleisten, wobei durch die Interpolation höherer Ordnung ein erhöhter
Rechenaufwand notwendig ist, der eine Echtzeitverarbeitung der Signale mit zunehmender
Ordnung immer mehr in Frage stellt.
Wird eine Reihe von gestörten Signalen in Folge festgestellt, was zur Folge hat, daß in dem
Zwischenspeicher, auch Buffer genannt, nicht genügend ungestörte Signalwerte für die
Bestimmung der Interpolationswerte vorhanden sind, so wird für die ersten gestörten
Signalwerte der Wert gleich dem letzten ungestörten Signalwert gewählt, bis eine
ausreichende Anzahl von ungestörten Signalwerten vorliegen, so daß eine Interpolation nun
möglich ist. Dieses Verfahren stellt auch bei extrem schwierigen Störsituationen
insbesondere bei sogenannten Bursts aus nadelförmigen Störungen, ein sicheres Verfahren
zur Unterdrückung von ungewollten Störimpulsen dar.
Vorzugsweise wird der Schwellwert einstellbar gewählt. Dadurch ist sichergestellt, daß
jeweils für die aktuelle Signalsituation ein optimiertes Rauschunterdrücken anhand der Wahl
des Schwellwertes möglich ist. Als besonders vorteilhaft hat sich herausgestellt, den
Schwellwert dynamisch in Abhängigkeit der mittleren Leistung des Signals einzustellen.
Dieses Verfahren stellt sicher, daß Signale mit besonders hoher Dynamik und damit
regelmäßig hoher mittlerer Leistung des Signals einen höheren Schwellwert aufweisen, als
diejenigen Signale mit geringer Dynamik. Dies erfolgt stets dynamisch, also unabhängig von
einer festen Einstellung von außen, jeweils nach dem aktuellen Signal. Am Beispiel von
Musiksignalen wird sehr schnell deutlich, daß für klassische Stücke mit relativ hoher
Dynamik der Schwellwert höher gewählt ist und damit sichergestellt ist, daß ein Nutzsignal
nicht als Störsignal erkannt wird und damit gelöscht wird. Dadurch ist ein besonders sicheres
Verfahren zur Rauschunterdrückung bei optimierter Signalsicherheit gegeben.
Nach einem besonders vorteilhaften Verfahren wird das Maß für die mittlere Leistung zur
Bestimmung des Schwellwerts mittels Tiefpaßfilterung eines normierten MPX-Signals
gewonnen. Dabei ist eine Vielzahl von Normierungsmöglichkeiten geeignet. Als besonders
einfache und dadurch vorteilhafte Weise hat sich herausgestellt, das Betragssignal zu
berechnen.
Als besonders vorteilhaft hat sich herausgestellt, das Verfahren zur Rauschunterdrückung
von nadelförmigen Störimpulsen mit den erfindungsgemäßen Verfahren zur
Spektralsubtraktion zu kombinieren, was nicht nur die jeweiligen Störungen für sich
unterdrückt, sondern auch Signale für die andere nachgeordnete Rauschunterdrückungsstufe
in besonderer Weise geeignet vorbereitet, da das verbleibende Rauschen der jeweiligen
Rauschunterdrückungsstärke der anderen Stufe entspricht. Wäre das Signal nicht durch die
Vorstufe zur Rauschunterdrückung durch das andere Verfahren gegangen, so wäre das
jeweilige nachgeschaltete Verfahren bei weitem nicht von der Wirksamkeit, wie mit dieser
vorgeschalteten Stufe der anderen Verfahrensweise. Diese erfindungsgemäße Kombination
stellt die optimierte Weise zur Rauschunterdrückung sowohl von nadelförmigen
Störimpulsen, als auch von breitbandigen Störungen dar.
Die folgenden Ausführungsbeispiele der Erfindung lassen weitere vorteilhafte Merkmale und
Besonderheiten erkennen, die anhand der Darstellungen in den Zeichnungen im folgenden
näher beschrieben und erläutert werden.
Es zeigt
Fig. 1 einen schematischen Aufbau des gesamten Geräuschreduktionsverfahrens.
Fig. 2 zeigt ein Blockdiagramm mit der Darstellung der Signalkomponente des
Geräuschreduktionsverfahrens auf der Basis der Spektralsubtraktionsverfahren.
Fig. 3 zeigt ein Blockschaltbild eines Verfahrens zur Rauschunterdrückung von
nadelförmigen Störimpulsen.
In Fig. 1 ist eine Anordnung dargestellt, welche am Beispiel eines MPX-Signals eine
Rauschunterdrückung zur Vermeidung einerseits von nadelförmigen Störimpulsen,
andererseits von breitbandigem Rauschen durchführt.
Zuerst wird dieses MPX-Signal in einer ersten Stufe um das Rauschen aufgrund der
nadelförmigen Störungen reduziert. Dieses rauschreduzierte MPX-Signal wird dann im
folgenden in einem Stereodecoder zu einem Audiosignal umgesetzt, welches im folgenden
durch ein Rauschunterdrückungsverfahren nach dem erfindungsgemäßen
Spektralsubtraktionsverfahren weiter verarbeitet wird.
Diese Anwendung der Verfahren auf ein MPX-Signal und auf ein Audiosignal stellen
lediglich eine beispielhafte, nicht den Schutzbereich und die Anwendbarkeit auf andere
Signale beschränkende Anwendung dar. Es existiert eine Vielzahl weiterer
Anwendungsgebiete für diese Rauschunterdrückungsverfahren.
Im vorliegenden Beispiel wird das MPX-Signal durch einen Analog-Digital-Wandler ADC
unter Einhaltung der Nyquistbedingung digitalisiert und einer Einheit zur Multipathdetektion
zugeführt, welche Signaländerungen im MPX-Signal oberhalb eines bestimmten
Schwellwertes feststellt und im Falle eines Überschreitens dieses Schwellwertes einen
Trigger setzt, der eine Korrektur des digitalisierten, gestörten MPX-Signals auslöst. Die
Korrektur erfolgt durch Interpolation linearer oder höherer Ordnung aus dem gestörten
Signal, wobei der Korrekturwert aus den dem oder den gestörten Signalwerten benachbarten
Signalwerten bestimmt wird. Dieses korrigierte Signal wird dem Stereodecoder zugeführt,
der dieses MPX-Signal in seine zwei Kanalinformationen für den linken und den rechten
Kanal umsetzt.
Wird durch die Einheit für die Multipathdetektion eine Störung besonderen Ausmaßes
festgestellt, so wird über die Triggercontroleinheit die Umsetzung des MPX-Signals auf die
zwei Kanäle durch den Stereodecoder mittels der Monoblendkontrolle verhindert, um die
Vorteile des in diesem Falle um mehrere dB verbesserten Signalspannungsabstands zu
nutzen. Diese Signalspannungsabstandsverbesserung wirkt sich Signal-Rausch-Verhältnis
verbessernd und damit rauschreduzierend aus.
Das auf zwei Kanäle umgesetzte Audiosignal wird im folgenden durch die Einheit zur
Durchführung des erfindungsgemäßen Spektralsubtraktionsverfahrens um die noch
verbleibenden breitbandigen Störsignale reduziert. Wird in dieser Einheit, in der unter
anderem ein Maß für das Signal Rauschverhältnis abgeleitet wird, ein zu schlechtes
Verhältnis erkannt, so wird mittels der Monoblendkontrolle entsprechend der Einheit zur
Multipathunterdrückung die Umsetzung des MPX-Signals aus Stereo verhindert und dieses
auf Mono umgesetzt, um die genannten Vorteile zu erreichen.
In Fig. 2 ist der nähere Aufbau der Einheit für das erfindungsgemäße
Spektralsubtraktionsverfahren dargestellt. Das ein breitbandiges Rauschen enthaltende
Signal wird durch die Signalanalyseeinheit zuerst segmentiert und dann im folgenden durch
eine Fouriertransformationseinheit in die spektralen Bestandteile nach Real- und Imaginärteil
transformiert und aufgeteilt. Anschließend werden diese komplexen Informationen in
Polarkoordinaten umgesetzt, was zum Betragsspektrum |X(l, j)| und zum Phasenspektrum
(l, j) führt. Für das Spektralsubtraktionsverfahren wird das Phasenspektrum (l, j) nicht
verwendet, lediglich das Betragsspektrum geht in das Verfahren ein. Aus diesem
Betragsspektrum wird die Leistungsdichte des gestörten Eingangssignals SXX bestimmt, was
beispielsweise durch ein einfaches rekursives Filter erster Ordnung nach folgender
Vorschrift:
SXX(l, j) = (1 - c1) SXX(l, j - 1) + c1 |X(l, j)|2
erfolgen kann. Typische Werte für c1 liegen dabei in der Größenordnung c1 = 0,4 . . . 1,0.
Im folgenden wird aus der Leistungsdichte des gestörten Eingangssignals SXX die
Störleistungsdichte bestimmt, indem der Minimalwert Snn von SXX über ein festgelegtes
Frequenzband bestimmt wird. Dieses Minimum wird als die Störleistungsdichte betrachtet.
Im übrigen wird anhand des Minimalwerts und des ebenfalls bestimmten Maximalwerts über
das bestimmte Frequenzband eine Wertebereichskontrolle durchgeführt, um festzustellen, ob
die Störleistungsdichte bzw. die Leistungsdichte des gestörten Eingangssignals Signalwerten
entsprechen oder ob diese Werte aufgrund eines systematischen Defektes des Verfahrens
entstanden sind. Sollte sich aufgrund der Wertebereichskontrolle ergeben, daß ein solcher
Defekt vorliegt, wird die anschließende Korrektur mit diesen Werten nicht durchgeführt. Es
werden gegebenenfalls andere, plausiblere Werte herangezogen oder unter Umständen gar
keine Spektralsubtraktion durchgeführt.
Durch die Minimalwertbildung wird eine Unabhängigkeit von dem Vorliegen von Pausen
geschaffen, die es ermöglicht, jedes beliebige Musikstück oder andere Audiosignale von
einem breitbandigen Rauschen zu befreien. Dies erfolgt sogar spezifisch nach dem jeweiligen
Signaltyp, denn das Minimum wird ja jeweils spezifisch für das aktuelle Signal bestimmt.
Diese Signalqualitäten unterscheiden sich beispielsweise sehr je nach Signaltyp. Ein
Sprachsignal ist völlig different von einem modernen Musikstück, wie Techno-Musik, oder
wiederum völlig different von klassischer Musik. Sowohl ihr Signalspektrum, als auch die
Intensität der einzelnen Frequenzen weichen deutlich voneinander ab, wodurch völlig
unterschiedliche Minimalwerte gebildet werden und damit das jeweilige Rauschen ohne ein
Wegfiltern des eigentlichen Nutzsignals geschaffen werden kann.
Durch die Wahl des begrenzten Frequenzbereiches, über den das Minimum bzw. Maximum
gebildet wird, gelingt es ferner, den Rechenaufwand für die Spektralsubtraktion zu
verringern und andererseits spezifische Frequenzbereiche besonders hervorzuheben, was zur
Beschleunigung des Rauschunterdrückungsverfahrens und zu einer Verbesserung der
Rauschunterdrückung führt. Dies stellt eine deutliche Verbesserung des Hörempfindens dar,
denn Artefakte können auf diese Art und Weise besser verhindert werden.
Aus der Störleistungsdichte und der Leistungsdichte des gestörten Eingangssignals SXX wird
eine Übertragungsfunktion H bestimmt, welche mit einer Fensterfunktion G zu der
endgültigen Übertragungsfunktion Hg gefaltet wird. Diese endgültige Übertragungsfunktion
Hg wird auf das Betragsspektrum |X(l, j)| angewendet, wodurch die endgültige Filterung,
d. h. die eigentliche Spektralsubtraktion erfolgt. Dabei wird die Störleistungsdichte von der
Leistungsdichte des gestörten Eingangssignals abgezogen, wodurch die Leistungsdichte des
quasi ungestörten Nutzsignals gebildet wird. Aus diesem wird dann zusammen mit der
Phaseninformation in der Signalsyntheseeinheit das eigentliche Signal wieder gebildet, indem
zuerst die karthesischen Koordinaten bestimmt, anschließend die inverse
Fouriertransformation durchgeführt und eine Synthesefunktion, die hier beispielhaft als
"overlap-add-Funktion" dargestellt ist, auf das rücktransformierte Signal angewendet wird.
Bei der Wahl der Übertragungsfunktion H wird vorzugsweise aus der Vielzahl der
bekannten Übertragungsfunktionen diejenige zur "Schätzung der Teilbandbeträge"
verwendet, die im folgenden dargestellt ist
wobei α den Überschätzfaktor und β den sogenannten "spectral floor" darstellt, sowie
ist.
Diese Übertragungsfunktion H wird zur Vermeidung von Artefakten im geräuschreduzierten
Signal, die insbesondere in Form von sogenannten "musical tones" auftreten können,
spektral gefiltert, d. h. sie wird mit einer Gewichtungsfunktion G gefaltet. Dies entspricht
einer multiplikativen Gewichtung der Impulsantwort des Spektralsubtraktionsfilters mit einer
Fensterfunktion, für die wiederum Rechteck-, Hamming-, Hanning- oder andere
Fensterfunktionen in Frage kommen. Durch diese Begrenzung der Übertragungsfunktion
gelingt es, diese störenden Artefakte weitgehend zu verhindern. Die Qualität der
Verhinderung läßt sich durch die Art und den Umfang der Begrenzung durch die Wahl der
Fensterfunktion und die Wahl des Fensters bestimmen.
In Fig. 3 ist in einer Blockdarstellung der Aufbau einer Anordnung zur
Rauschunterdrückung aufgrund von nadelförmigen Störungen am Beispiel von Multipath-Störungen
in einem MPX-Signal dargestellt. Das MPX-Signal wird zuerst in einem Analog-
Digital-Wandler ADC unter Einhaltung der Nyquistbedingung digitalisiert. Im folgenden
wird das digitalisierte Signal in einer Differentiationseinheit auf seine Signalwertänderungen
untersucht. Die Signalwertänderungen werden im folgenden normiert durch Betragsbildung
und mit einem Schwellwert verglichen, der sich aus den tiefpaß-gefilterten Absolutwerten
des digitalisierten MPX-Signals ergibt, wobei zusätzlich eine level-Kontrolle, also eine
Wertebereichskontrolle, durchgeführt wird. Überschreitet die Signalwertänderung diesen
Schwellwert, wird ein Triggerpuls an die Triggerkontrolle geleitet, welche eine
Signalwertkorrektur in die Wege leitet. Die Signalwertkorrektur wird in Form einer
Interpolation linearer oder höherer Ordnung durchgeführt. Als Basis für die Interpolation
werden die ungestörten, den gestörten Signalwerten benachbarten Signalwerte
herangezogen. Alle diese Werte sind in dem Buffer abgelegt. Als bevorzugte
Interpolationsart hat sich im Hinblick auf den Rechenaufwand bezogen auf die Qualität der
Rauschunterdrückung die lineare Interpolation herausgestellt. Ergibt sich jedoch, daß eine
Vielzahl von Störimpulsen direkt aufeinanderfolgend eintreffen - ein sogenannter
Störimpuls-Burst - so kann der Buffer ausschließlich mit gestörten Signalen beaufschlagt
sein. In diesem Fall wird erfindungsgemäß jeweils der älteste gestörte Signalwert von dem
letzten noch ungestörten Signalwert ersetzt, bis ausreichend viele ungestörte Signalwerte
mittels der Interpolation korrigiert werden können.
Auch bei diesem Verfahren wird der Schwellwert dynamisch nach dem jeweils aktuellen
Signal angepaßt, d. h. ergeben sich durch den Typ des MPX-Signals standardmaßig größere
Schwankungen, so wird der Schwellwert höher angelegt, als bei MPX-Signalen mit nahezu
konstanter niedriger Signalwerthöhe. Dadurch gelingt es, eine sehr differenzierte
Rauschunterdrückung zu gewährleisten.
Claims (27)
1. Verfahren zur Rauschunterdrückung nach dem Spektralsubtraktionsverfahren, bei
dem in einem bestimmten, begrenzten Frequenzbereich des durch Rauschen gestörten
Nutzsignals eine Fouriertransformation durchgeführt und bei dem im folgenden das
Minimum der Leistungsdichte des gestörten Signals bestimmt und dieses als Maß für
die Störleistungsdichte zur Bildung des ungestörten Nutzsignals verwendet wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der begrenzte
Frequenzbereich entsprechend dem Frequenzband des Nutzsignals gewählt wird.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der begrenzte
Frequenzbereich entsprechend dem menschlichen Hörbereich gewählt wird.
4. Verfahren nach einem der Ansprüche 2 oder 3, dadurch gekennzeichnet, daß der
begrenzte Frequenzbereich das Frequenzband des Nutzsignals teilweise umfaßt.
5. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß
über den Frequenzbereich oder über Frequenzbereichsabschnitte das Maximum
bestimmt wird, und mittels diesem eine Wertebereichskontrolle als
Plausibilitätskontrolle durchgeführt wird und abhängig davon eine Wertekorrektur
vornehmbar ist.
6. Verfahren nach einem der vorstehenden Ansprüche 1 bis 5, dadurch
gekennzeichnet, daß eine Übertragungsfunktion (Hg) durch Faltung einer
Fensterfunktion (G) mit einer Übertragungsfunktion (H) gegeben ist.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Fensterfunktion (G)
eine Hammingfunktion ist.
8. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Fensterfunktion (G)
eine Rechteckfunktion ist.
9. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß mittels der Extremwerte
ein Maß für das Signal-Rausch-Verhältnis (S/R) abgeleitet und beim Unterschreiten
eines vorgewählten Grenzwertes ein Stereodecoder auf Monobetrieb umgeschaltet
wird.
10. Verfahren zur Rauschunterdrückung von nadelförmigen Störimpulsen, insbesondere
Multipathstörungen, bei dem die Größe der zeitlichen Änderung des MPX-Signals
bestimmt wird und die Größe mit einem bestimmten Schwellwert verglichen wird und
bei Überschreiten des Schwellwerts die detektierten, defekten Signalstellen
ausgeschnitten und durch korrigierte Werte ersetzt werden.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die korrigierten Werte
gleich dem letzten ungestörten Signalwert gewählt werden.
12. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die korrigierten Werte
durch Interpolation linearer oder höherer Ordnung aus den benachbarten ungestörten
Signalwerten bestimmt werden.
13. Verfahren nach den Ansprüchen 11 und 12, dadurch gekennzeichnet, daß die
Anzahl der gestörten Signalwerte bestimmt wird und ab einer vorgegebenen Anzahl
die ersten gestörten Signalwerte durch den letzten ungestörten Signalwert ersetzt
werden und die folgenden gestörten Signalwerte durch interpolierte Signalwerte
ersetzt werden.
14. Verfahren nach einem der vorstehenden Ansprüche 10 bis 13, dadurch
gekennzeichnet, daß der Schwellwert einstellbar ist.
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß der Schwellwert
dynamisch in Abhängigkeit der mittleren Leistung des Signals eingestellt wird.
16. Verfahren zur Rauschunterdrückung nach Anspruch 15, dadurch gekennzeichnet,
daß das Maß für die mittlere Leistung mittels Tiefpaßfilterung eines normierten
MPX-Signales gebildet wird.
17. Verfahren nach einem der vorstehenden Ansprüche 10 bis 16, dadurch
gekennzeichnet, daß bei Feststellung eines gestörten MPX-Signales ein
Stereodecoder angesteuert und dieser auf Monobetrieb geschaltet wird.
18. Verfahren nach einem der vorstehenden Ansprüche 10 bis 17, dadurch
gekennzeichnet, daß dieses Verfahren auf bandbegrenzte Nicht-MPX-Signale
angewendet wird.
19. Verfahren nach einem der vorstehenden Ansprüche 10 bis 18, bei dem anschließend
ein Verfahren zur Rauschunterdrückung nach dem Spektralsubtraktionsverfahren nach
einem der Ansprüche 1 bis 9 durchgeführt wird.
20. Vorrichtung zur Durchführung eines Verfahrens zur Rauschunterdrückung nach
Anspruch 1, dadurch gekennzeichnet, daß eine Einheit zur Signalanalyse eines in
einem bestimmten, begrenzen Frequenzbereich des durch Rauschen gestörten Nutzsignals
mittels Fouriertransformation, eine Einheit zur Bestimmung der Leistungsdichte des
gestörten Signals, eine Einheit zur Bestimmung des Minimums der Leistungsdichte
des gestörten Signals als Maß für die Störleistungsdichte, eine Filtereinheit zur
Anwendung einer aus der Leistungsdichte des gestörten Signals und der
Störleistungsdichte abgeleiteten Übertragungsfunktion (Hg) auf das analysierte Signal
und eine Einheit zur Signalsynthese mittels inverser Fouriertransformation dieses
gefilterten Signals vorgesehen sind (Fig. 2).
21. Vorrichtung zur Durchführung eines Verfahrens zur Rauschunterdrückung nach
Anspruch 20, dadurch gekennzeichnet, daß eine Einheit zur Bestimmung des
Maximums der Leistungsdichte des gestörten Signals und eine Einheit zur
Wertebereichskontrolle vorgesehen ist, welche aus den Extremwerten eine
Plausibilitätsprüfung vornimmt und im folgenden eine Korrektur einleitet.
22. Vorrichtung nach einem der Ansprüche 20 oder 21 zur Durchführung eines
Verfahrens zur Rauschunterdrückung gemäß Anspruch 6, dadurch gekennzeichnet,
daß die Übertragungsfunktion (Hg) in einer Schaltungseinheit gebildet wird, in
welcher eine Übertragungsfunktion (H) mit einer Fensterfunktion (G) zur
Übertragungsfunktion (Hg) gefaltet wird.
23. Vorrichtung zur Durchführung eines Verfahrens zur Rauschunterdrückung nach
Anspruch 10, dadurch gekennzeichnet, daß eine Einheit zur Bestimmung der
zeitlichen Signalwertänderungen im MPX-Signal und eine Vergleichseinheit
vorgesehen ist, die die Änderungswerte mit einem Schwellwert vergleicht und
abhängig davon in einer Korrektureinheit die Signalwertkorrektur vorgenommen
wird.
24. Vorrichtung nach Anspruch 23 zur Durchführung eines Verfahrens zur
Rauschunterdrückung, dadurch gekennzeichnet, daß eine Einheit zur dynamischen
Anpassung des Schwellwertes vorgesehen ist, welche ein Tiefpaßfilter und wahlweise
eine Wertebereichskontrolleinheit aufweist.
25. Vorrichtung nach einem der Ansprüche 23 oder 24 zur Durchführung eines
Verfahrens zur Rauschunterdrückung, dadurch gekennzeichnet, daß die Einheit zur
Bestimmung der Signalwertänderungen eine Schaltung zur Differentiation und eine
zur Betragsbildung enthält.
26. Vorrichtung nach einem der Ansprüche 23 bis 25, dadurch gekennzeichnet, daß
dieser eine Vorrichtung gemäß den Ansprüchen 20 bis 22 nachgeschaltet ist.
27. Vorrichtung nach einem der Ansprüche 20 bis 26 zur Durchführung eines Verfahrens
zur Rauschunterdrückung, dadurch gekennzeichnet, daß eine Einheit zur
Stereodemodulation vorgesehen ist, welche bei Vorliegen einer bestimmten
Störungsstärke (Multipath- oder andere Störungen) vom Stereobetriebs- in der
Monobetriebszustand übergeht.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19944445983 DE4445983C2 (de) | 1994-12-22 | 1994-12-22 | Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19944445983 DE4445983C2 (de) | 1994-12-22 | 1994-12-22 | Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4445983A1 DE4445983A1 (de) | 1996-06-27 |
DE4445983C2 true DE4445983C2 (de) | 1998-10-15 |
Family
ID=6536720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19944445983 Expired - Lifetime DE4445983C2 (de) | 1994-12-22 | 1994-12-22 | Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4445983C2 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19955156A1 (de) * | 1999-11-17 | 2001-06-21 | Univ Karlsruhe | Verfahren und Vorrichtung zur Unterdrückung eines Störsignalanteils im Ausgangssignal eines Schallwandlermittels |
DE10139248A1 (de) * | 2001-08-09 | 2003-03-06 | Becker Gmbh 8 | Unterdrückung von Zündstörungen und anderer impulsartiger Störungen beim Rundfunkempfang |
DE10139247A1 (de) * | 2001-08-09 | 2003-03-06 | Becker Gmbh 8 | Verfahren und Schaltungsanordnung zur Rauschunterdrückung |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
EP2552027B1 (de) * | 2011-07-25 | 2015-06-24 | Harman Becker Automotive Systems GmbH | Stereo-Decodierung |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2952785A1 (de) * | 1979-01-03 | 1980-07-17 | Plessey Handel Investment Ag | Empfaenger fuer ein mit expandiertem signalspektrum arbeitendes nachrichtenuebertragungssystem |
DE3440613C1 (de) * | 1984-11-07 | 1986-04-10 | Institut für Rundfunktechnik GmbH, 8000 München | Verfahren zum digitalen Übertragen eines Rundfunk-Programmsignals |
DE9212439U1 (de) * | 1992-09-16 | 1992-11-26 | GS Systems, Inc., Highland Park, Ill. | Signalverarbeitungssystem zur Reduzierung von Rauschanteilen in einem Sprachsignal |
-
1994
- 1994-12-22 DE DE19944445983 patent/DE4445983C2/de not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2952785A1 (de) * | 1979-01-03 | 1980-07-17 | Plessey Handel Investment Ag | Empfaenger fuer ein mit expandiertem signalspektrum arbeitendes nachrichtenuebertragungssystem |
DE3440613C1 (de) * | 1984-11-07 | 1986-04-10 | Institut für Rundfunktechnik GmbH, 8000 München | Verfahren zum digitalen Übertragen eines Rundfunk-Programmsignals |
DE9212439U1 (de) * | 1992-09-16 | 1992-11-26 | GS Systems, Inc., Highland Park, Ill. | Signalverarbeitungssystem zur Reduzierung von Rauschanteilen in einem Sprachsignal |
Non-Patent Citations (1)
Title |
---|
GIERL, S., Geräuschreduktion bei Sprachübertra- gung mit Hilfe von Mikrofonarraysystemen, Disser- tationsschrift Fakultät für Elektrotechnik der Universität Fridericiana Karlsruhe, 1990, S.90-92 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19955156A1 (de) * | 1999-11-17 | 2001-06-21 | Univ Karlsruhe | Verfahren und Vorrichtung zur Unterdrückung eines Störsignalanteils im Ausgangssignal eines Schallwandlermittels |
DE10139248A1 (de) * | 2001-08-09 | 2003-03-06 | Becker Gmbh 8 | Unterdrückung von Zündstörungen und anderer impulsartiger Störungen beim Rundfunkempfang |
DE10139247A1 (de) * | 2001-08-09 | 2003-03-06 | Becker Gmbh 8 | Verfahren und Schaltungsanordnung zur Rauschunterdrückung |
DE10139247C2 (de) * | 2001-08-09 | 2003-08-28 | Becker Gmbh 8 | Verfahren und Schaltungsanordnung zur Rauschunterdrückung |
DE10139248C2 (de) * | 2001-08-09 | 2003-11-27 | Harman Becker Automotive Sys | Verfahren zur Unterdrückung von Störungen im Empfangssignal eines Stereorundfunkempfängers sowie Stereorundfunkempfänger |
Also Published As
Publication number | Publication date |
---|---|
DE4445983A1 (de) | 1996-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0912974B1 (de) | Verfahren zur verringerung von störungen eines sprachsignals | |
DE69131883T2 (de) | Vorrichtung zur Rauschreduzierung | |
DE69428119T2 (de) | Verringerung des hintergrundrauschens zur sprachverbesserung | |
DE69124005T2 (de) | Sprachsignalverarbeitungsvorrichtung | |
DE19747885B4 (de) | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion | |
DE69331181T2 (de) | Tonverstärkervorrichtung mit automatischer Unterdrückung akustischer Rückkopplung | |
EP1386307B1 (de) | Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals | |
EP2005421B1 (de) | Vorrichtung und verfahren zum erzeugen eines umgebungssignals | |
EP1143416A2 (de) | Geräuschunterdrückung im Zeitbereich | |
DE3925589A1 (de) | Verfahren und anordnung zur stoerbefreiung von sprachsignalen | |
EP3197181B1 (de) | Verfahren zur reduktion der latenzzeit einer filterbank zur filterung eines audiosignals sowie verfahren zum latenzarmen betrieb eines hörsystems | |
EP3065417B1 (de) | Verfahren zur unterdrückung eines störgeräusches in einem akustischen system | |
EP3565270B1 (de) | Verfahren zur rauschunterdrückung in einem audiosignal | |
DE69130687T2 (de) | Sprachsignalverarbeitungsvorrichtung zum Herausschneiden von einem Sprachsignal aus einem verrauschten Sprachsignal | |
DE102013011761A1 (de) | Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen | |
DE4445983C2 (de) | Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren | |
DE102015204253B4 (de) | Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals sowie Hörgerät | |
WO2001047335A2 (de) | Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät | |
EP3349481A1 (de) | Verfahren zur frequenzverzerrung eines audiosignals | |
EP0669606B1 (de) | Verfahren zur Geräuschreduktion eines gestörten Sprachsignals | |
DE3230391C2 (de) | ||
EP1351550A1 (de) | Verfahren zur Anpassung einer Signalverstärkung in einem Hörgerät sowie ein Hörgerät | |
DE102017203631B3 (de) | Verfahren zur Frequenzverzerrung eines Audiosignals | |
DE102017216972B4 (de) | Verfahren und Vorrichtung zur rechnergestützten Verarbeitung von Audiosignalen | |
WO2002071731A1 (de) | Verfahren und vorrichtung zur verbesserung der sprachqualität auf transparenten telekommunikations-übertragungswegen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: HARMAN BECKER AUTOMOTIVE SYSTEMS (BECKER DIVISION) |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH, 76307 KARLS |
|
R071 | Expiry of right | ||
R071 | Expiry of right |