HK1097326A1 - 通过在光谱/调制光谱域表征中执行修改的信息信号处理 - Google Patents
通过在光谱/调制光谱域表征中执行修改的信息信号处理 Download PDFInfo
- Publication number
- HK1097326A1 HK1097326A1 HK07104845.2A HK07104845A HK1097326A1 HK 1097326 A1 HK1097326 A1 HK 1097326A1 HK 07104845 A HK07104845 A HK 07104845A HK 1097326 A1 HK1097326 A1 HK 1097326A1
- Authority
- HK
- Hong Kong
- Prior art keywords
- spectral
- modulation
- values
- sequence
- audio signal
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Optical Communication System (AREA)
- Holo Graphy (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Spectrometry And Color Measurement (AREA)
- Liquid Crystal (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
Die vorliegende Erfindung bezieht sich auf die Verarbeitung von Audiosignalen und insbesondere auf die Verarbeitung im Spektral-/Modulationsspektralbereich.
Im Bereich der Signalverarbeitung, beispielsweise bei der Verarbeitung digitaler Audiosignale, existieren häufig Signale, die aus einem Trägersignalanteil und einem Modulationsanteil bestehen. In dem Fall modulierter Signale wird eine Repräsentation, in der die Signale in Träger- und Modulationskomponenten zerlegt sind, häufig benötigt, um diese beispielsweise filtern, codieren oder anderweitig modifizieren zu können.
Zu Zwecken der Audiocodierung ist es beispielsweise bekannt, das Audiosignal einer sogenannten Modulationstransformation zu unterziehen. Dabei wird das Audiosignal durch eine Transformation in Frequenzbänder zerlegt. Anschließend wird eine Zerlegung in Betrag und Phase vorgenommen. Während die Phase nicht weiterverarbeitet, werden die Beträge je Teilband über eine Anzahl von Transformationsblöcken in einer zweiten Transformation erneut transformiert. Das Ergebnis ist eine Frequenzzerlegung der zeitlichen Hüllkurve des betreffenden Teilbandes in Modulationskoeffizienten. Audiocodierungen, die auf einer solchen Modulationstransformation bestehen, sind beispielsweise in M. Vinton und L. Atlas, "A Scalable and Progressive Audio Codec", in Proceedings of the 2001 IEEE ICASSP, 7.-11. Mai 2001, Salt Lake City, United States Patent Application US 2002/0176353A1 : Atlas et al., "Scalable And Perceptually Ranked Signal Coding And Decoding", 11/28/2002, und J. Thompson und L.Atlas, "A Non-uniform Modulation Transform for Audio Coding with Increased Time Resolution", in Proceedings of the 2003 IEEE ICASSP, 6.-10. April, Hong Kong, 2003, beschrieben.
Einen Überblick über weitere verschiedene Demodulationstechniken über die volle Bandbreite des zu demodulierenden Signals, einschließlich asynchroner und synchroner Demodulationstechniken etc., gibt beispielsweise der Artikel L. Atlas, "Joint Acoustic And Modulation Frequency", Journal on Applied Signal Processing 7 EURASIP, S. 668-675, 2003.
Ein Nachteil der oben genannten Schemata zur Audiocodierung unter Verwendung einer Modulationstransformation besteht in der folgenden Tatsache. Solange an den Modulationskoeffizienten zusammen mit den Phasen keine weitere Bearbeitungsschritte vorgenommen werden, bilden die Modulationskoeffizienten eine Spektral-/Modulationsspektraldarstellung des Audiosignals, die reversibel und perfekt rekonstruierend ist, d.h. ohne Veränderungen wieder ins ursprüngliche Audiosignal im Zeitbereich rückkonvertierbar ist. Bei diesen Verfahren werden jedoch die Modulationskoeffizienten gefiltert, um nach psychoakustischen Kriterien die Modulationskoeffizienten auf möglichst kleine Werte zu verringern bzw. quantisieren, so dass eine möglichst hohe Kompressionsrate erzielt wird. Hierdurch erreicht man jedoch im allgemeinen nicht das gewünschte Ziel, die betreffenden Modulationskomponenten aus dem resultierenden Signal zu entfernen oder bei dieser Komponente gezielt Quantisierungsrauschen einzubringen. Der Grund dafür besteht darin, dass die Phasen der Teilbänder nach der Rücktransformation der veränderten Modulationskoeffizienten nicht mehr konsistent mit den veränderten Beträgen dieser Teilbänder sind und auch weiterhin starke Komponenten des Modulationsanteiles des Originalsignals enthalten. Werden nun die Phasen der Teilbänder mit den veränderten Beträgen rekombiniert, werden diese Modulationsanteile bzw. -komponenten durch die Phase wieder in das gefilterte oder quantisierte Signal eingebracht. Mit anderen Worten ausgedrückt, liefert eine Modulationstransformation gefolgt von einer Modifikation der Modülationskoeffizienten auf die oben dargestellte Weise, also durch Filterung der Modulationskoeffizienten, zusammen mit einer anschließenden Synthese des Phasen- und Betragsanteils ein Signal, das bei einer erneuten Analyse bzw. Modulationstransformation immer noch erhebliche Modulationskomponenten an denjenigen Stellen in der Spektral-/Modulationsspektralbereichsdarstellung enthält, die ausgefiltert werden sollten. Eine wirksame Filterung ist also basierend auf den eingehend genannten Modulationstransformations-basierten Signalverarbeitungsschemata nicht möglich.
Es besteht deshalb ein Bedarf nach einem Audiosignalverarbeitungsschema, das es ermöglicht, modulierte Signale mit einem Trägeranteil und einem Modulationsanteil gezielter nach Modulations- und Trägeranteil getrennt verarbeiten zu können.
Die Aufgabe der vorliegenden Erfindung besteht folglich darin, ein Verarbeitungsschema für Audiosignale zu schaffen, das eine gezielter nach Modulations- und Trägeranteilen getrennte Verarbeitung von Audiosignalen ermöglicht.
Diese Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 und ein Verfahren gemäß Anspruch 17 gelöst.
Der Kerngedanke der vorliegenden Erfindung besteht darin, dass sich eine strikter nach Modulations- und Trägeranteilen getrennte Verarbeitung von Audiosignalen erzielen lässt, wenn die Überführung des Informationssignals von der Zeit-/Spektraldarstellung bzw. der Zeit-/Frequenzdarstellung in die Spektral-/Modulationsspektraldarstellung bzw. die Frequenz-/Modulationsfrequenzdarstellung abhängig von sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spektraldarstellung des Informationssignals durchgeführt wird. Hierdurch entfällt eine Rekombination zwischen Phase und Betrag, und damit die Wiedereinführung von unerwünschten Modulationskomponenten in die Zeitdarstellung des verarbeiteten Audiosignals auf der Syntheseseite.
Die Überführung des Audiosignals von der Zeit-/Spektraldarstellung in die Spektral-/Modulationsspektraldarstellung unter Berücksichtigung sowohl des Betrags als auch der Phase bringt das Problem mit sich, dass die Zeit-/Spektraldarstellung des Informationssignals tatsächlich nicht nur von dem Audiosignal sondern auch von dem Phasenversatz der Zeitblöcke zu der Trägerspektralkomponente des Audiosignals abhängt. Anders ausgedrückt bewirkt die blockweise Transformation des Audiosignals von der Zeitdarstellung in die Zeit/Spektraldarstellung, dass die pro Spektralkomponente in der Zeit-/Spektraldarstellung des Audiosignals erhaltenen Folgen von Spektralwerten einen aufmodulierten komplexen Träger aufweisen, der lediglich von der Asynchronität der Blockwiederholfrequenz zu der Trägerfrequenzkomponente des Audiosignals abhängt. Gemäß den Ausführungsbeispielen der vorliegenden Erfindung wird deshalb pro Spektralkomponente eine Demodulation der Folge von Spektralwerten in der Zeit-/Spektraldarstellung des Audiosignals vorgenommen, um pro Spektralkomponente eine demodulierte Folge von Spektralwerten zu erhalten. Die anschließende Überführung der so erhaltenen demodulierten Folgen von Spektralwerten wird durch blockweise Transformationen von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung bzw. durch blockweises spektrales Zerlegen derselben durchgeführt, wodurch Blöcke von Modulationswerten erhalten werden. Diese werden manipuliert bzw. modifiziert, wie z.B. zur Bandpassfilterung zur Entfernung des Modulationsanteils aus dem ursprünglichen Audiosignal mit einer entsprechenden Gewichtungsfunktion gewichtet. Das Ergebnis ist eine modifizierte demodulierte Folge von Spektralwerten bzw. modifizierte demodulierte Zeit/Spektraldarstellung. Auf die so erhaltenen modifizierten demodulierten Folgen von Spektralwerten wird der komplexe Träger wieder aufmoduliert, wodurch eine modifizierte Folge von Spektralwerten erhalten wird, die einen Teil einer Zeit-/Spektraldarstellung des verarbeiteten Audiosignals darstellt. Eine Rücküberführung dieser Darstellung in die Zeitdarstellung ergibt ein verarbeitetes Audiosignal in der Zeitdarstellung bzw. Zeitbereich, das im Hinblick auf Modulations- und Trägeranteile äußerst genau bezüglich des ursprünglichen Audiosignals verändert sein kann.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
- Fig. 1
- ein Blockschaltbild einer Vorrichtung zur Verarbeitung eines Audiosignals gemäß einem Ausführungsbeispiel der vorliegenden Erfindung; und
- Fig. 2
- eine schematische Skizze zur Veranschaulichung der Funktionsweise der Vorrichtung nach
Fig. 1 .
Intern gliedert sich die Vorrichtung 10 im wesentlichen in einen Teil 20 zur Überführung des Audiosignals 14 von einer Zeitdarstellung in eine Zeit-/Frequenzdarstellung, eine Einrichtung 22 zur Überführung des Audiosignals von der Zeit-/Frequenzdarstellung in die Frequenz-/Modulationsfrequenzdarstellung, einen Teil 24, in welchem die eigentliche Verarbeitung stattfindet, nämlich die Modifikation des Audiosignals, und einen Teil 26 zur Rücküberführung des in der Frequenz-/Modulationsfrequenzdarstellung verarbeiteten Audiosignals von dieser Darstellung in die Zeitdarstellung. Die genannten vier Teile sind in dieser Reihenfolge zwischen den Eingang 12 und den Ausgang 16 in Reihe geschaltet, wobei deren genauerer Aufbau und deren genauere Funktionsweise im folgenden beschrieben wird.
Der Teil 20 der Vorrichtung 10 umfasst eine Fensterungseinrichtung 28 und eine Transformationseinrichtung 30, die sich in dieser Reihenfolge an den Eingang 12 anschließen. Insbesondere ist ein Eingang der Fensterungseinrichtung 28 mit dem Eingang 12 verbunden, um das Audiosignal 14 als eine Folge von Informationswerten zu erhalten. Sollte das Audiosignal noch als analoges Signal vorliegen, kann dies beispielsweise durch einen A/D-Wandler bzw. eine diskrete Abtastung in eine Folge von Informations- bzw. Abtastwerten überführt werden. Die Fensterungseinrichtung 28 bildet aus der Folge von Informationswerten Blöcke zu je gleicher Anzahl an Informationswerten und führt an jedem Block von Informationswerten zudem eine Gewichtung mit einer Gewichtungsfunktion durch, die beispielsweise aber nicht ausschließlich einem Sinusfenster oder einem KBD-Fenster entsprechen kann. Die Blöcke können sich überlappen, wie z.B. um 50%, oder nicht. Im folgenden wird lediglich exemplarisch von einer 50%-Überlappung ausgegangen. Bevorzugt werden Fensterfunktionen mit der Eigenschaft, dass sie eine gute Teilbandtrennung in der Zeit/Spektraldarstellung ermöglichen und sich die Quadrate ihrer einander korrespondierenden, da auf ein und denselben Informationswert angewendeten, Gewichtungswerte im Überlappungsbereich zu Eins addieren.
Ein Ausgang der Fensterungseinrichtung 28 ist mit einem Eingang der Transformationseinrichtung 30 verbunden. Die von der Fensterungseinrichtung 28 ausgegeben Blöcke von Informationswerten werden von der Transformationseinrichtung 30 empfangen. Dieselben unterzieht die Transformationseinrichtung 30 dann blockweise einer spektral zerlegenden Transformation, wie z.B. einer DFT oder einer anderen komplexen Transformation. Die Transformationseinrichtung 30 erzielt somit blockweise eine Zerlegung des Audiosignals 14 in Spektralkomponenten und erzeugt somit insbesondere pro Zeitblock, wie er von der Fensterungseinrichtung 28 erhalten wird, einen Block von Spektralwerten, der einen Spektralwert pro Spektralkomponente umfasst. Mehrere Spektralwerte können zu Teilbändern zusammengefasst sein. Im folgenden werden allerdings die Begriffe Teilband und Spektralkomponente synonym verwendet. Für jede Spektralkomponente bzw. jedes Teilband ergibt sich somit pro Zeitblock ein Spektralwert, oder mehrere, falls eine Teilbandzusammenfassung vorliegt, was im folgenden jedoch nicht angenommen wird. Dementsprechend gibt die Transformationseinrichtung 30 pro Spektralkomponente bzw. Teilband eine Folge von Spektralwerten aus, die den zeitlichen Verlauf dieser Spektralkomponente bzw. dieses Teilbandes darstellen. Die von der Transformationseinrichtung 30 ausgegebenen Spektralwerte stellen eine Zeit-/Frequenzdarstellung des Audiosignals 14 dar.
Der Teil 22 umfasst eine Trägerfrequenzbestimmungseinrichtung 32, einen als Demodulationseinrichtung dienenden Mischer 34, eine Fensterungseinrichtung 36, und eine zweite Transformationseinrichtung 38.
Die Fensterungseinrichtung 32 umfasst einen Eingang, der mit dem Ausgang der Transformationseinrichtung 30 verbunden ist. Sie empfängt dort die Spektralwertfolgen für die einzelnen Teilbänder und teilt die Spektralwertfolgen pro Teilband - ähnlich, wie es die Fensterungseinrichtung 28 bezüglich des Audiosignals 14 tut - in Blöcke ein und gewichtet die Spektralwerte jedes Blocks mit einer geeigneten Gewichtungsfunktion. Die Gewichtungsfunktion kann eine der bereits im vorhergehenden bezüglich Einrichtung 28 exemplarisch erwähnten Gewichtungsfunktionen sein. Die aufeinanderfolgenden Blöcke in einem Teilband können sich überlappen oder nicht, wobei im folgenden wieder exemplarisch von einer gegenseitigen Überlappung um 50% ausgegangen wird. Im folgenden wird davon ausgegangen, dass die Blöcke verschiedener Teilbänder zueinander ausgerichtet sind, wie es im folgenden bezugnehmend auf Fig. 1 noch näher erläutert werden wird. Eine andere Vorgehensweise mit zwischen den Teilbändern versetzten Blockfolgen wäre aber ebenfalls denkbar. Am Ausgang gibt die Fensterungseinrichtung pro Teilband Folgen von gefensterten Spektralwertblöcken aus.
Auch die Trägerfrequenzbestimmungseinrichtung 32 umfasst einen Eingang, der mit dem Ausgang der Transformationseinrichtung 30 verbunden ist, um die Spektralwerte der Teilbänder bzw. Spektralkomponenten als Folgen von Spektralwerten pro Teilband zu erhalten. Sie ist dazu vorgesehen, in jedem Teilband diejenige Trägerkomponente herauszufinden, die dadurch herrührt, dass die einzelnen Zeitblöcke, aus denen die einzelnen Spektralwerte der Teilbänder abgeleitet worden sind, einen zeitlich variierenden Phasenversatz zu der Trägerfrequenzkomponente des Audiosignals 14 aufweisen. Die pro Teilband bestimmte Trägerkomponente gibt die Trägerfrequenzbestimmungseinrichtung 32 an ihrem Ausgang an einen Eingang des Mischers 34 aus, der wiederum einen weiteren Eingang aufweist, der mit dem Ausgang der Fensterungseinrichtung 36 verbunden ist.
Der Mischer 34 ist derart ausgebildet, dass er je Teilband die Blöcke von gefensterten Spektralwerten, wie sie von der Transformationseinrichtung ausgegeben werden, mit dem komplex Konjugierten der jeweiligen Trägerkomponente multipliziert, wie sie durch die Trägerfrequenzbestimmungseinrichtung 30 für das jeweilige Teilband bestimmt worden ist, wodurch die Teilbänder bzw. Blöcke von gefensterten Spektralwerten demoduliert werden.
Am Ausgang des Mischers 34 ergeben sich somit demodulierte Teilbänder bzw. ergibt sich pro Teilband eine Folge von demodulierten Blöcken von gefensterten Spektralwerten. Der Ausgang des Mischers 34 ist mit einem Eingang der Transformationseinrichtung 38 verbunden, so dass letztere pro Teilband sich gegenseitig - hier exemplarisch 50% - überlappende Blöcke von gefensterten und demodulierten Spektralwerten erhält und diese blockweise in die Spektral/Modulationsspektraldarstellung transformiert bzw. spektral zerlegt, um durch Verarbeitung aller Teilbänder bzw. Spektralkomponenten eine bisher lediglich in Hinblick auf die Demodulation der Teilbandspektralwertfolgen modifizierte Frequenz-/Modulationsfrequenzdarstellung des Audiosignals 14 zu erzeugen. Die der Transformationseinrichtung 38 pro Teilband zugrundeliegende Transformation kann beispielsweise eine DFT, eine MDCT, MDST oder dergleichen sein, und insbesondere auch die gleiche Transformation wie diejenige der Transformationseinrichtung 30. In Fig. 1 ist exemplarisch davon ausgegangen worden, dass es sich bei den Transformationen beider Transformationseinrichtungen 30, 38 um eine DFT handelt.
Dementsprechend gibt die Transformationseinrichtung 38 an ihrem Ausgang für jedes Teilband bzw. jede Spektralkomponente nacheinander Blöcke von Werten aus, die im folgenden als Modulationswerte bezeichnet werden und eine spektral Zerlegung der Blöcke von gefensterten und demodulierten Spektralwerten darstellen. Die Blöcke von Spektralwerten pro Teilband, bezüglich derer die Transformationseinrichtung 38 die Transformationen durchführt, sind zeitlich zueinander ausgerichtet, so dass sich pro Zeitabschnitt immer gleich eine sich aus einem Modulationswertblock pro Teilband zusammensetzende Matrix von Modulationswerten ergibt. Die Modulationswerte gibt die Transformationseinrichtung 38 an den Teil 24 weiter, der lediglich eine Signalverarbeitungseinrichtung 40 aufweist.
Die Signalverarbeitungseinrichtung 40 ist mit dem Ausgang der Transformationseinrichtung 38 verbunden und erhält somit die Blöcke von Modulationswerten. In dem vorliegenden exemplarischen Fall, da die Vorrichtung 10 der Modulationsanteilunterdrückung dient, vollzieht die Signalverarbeitungseinrichtung 40 eine effektive Tiefpassfilterung im Frequenzbereich an den eingehenden Blöcken von Modulationswerten, nämlich eine Gewichtung der Modulationswerte mit einer Funktion, die ausgehend von der Modulationsfrequenz Null zu höheren bzw. niedrigeren Modulationsfrequenzen abfällt. Die derart modifizierten Blöcke von Modulationswerten gibt die Signalverarbeitungseinrichtung 40 an den Rücküberführungsteil 26 weiter. Die von der Signalverarbeitungseinrichtung 40 ausgegebenen modifizierten Blöcke von Modulationswerten stellen eine modifizierte Frequenz-/Modulationsfrequenzdarstellung des Informationssignals 14 dar, oder anders ausgedrückt eine noch um die Demodulation durch den Mischer 34 von der Frequenz-/Modulationsfrequenzdarstellung des modifizierten Informationssignals 18 abweichende Frequenz-/Modulationsfrequenzdarstellung.
Der Rücküberführungsteil 26 gliedert sich seinerseits wiederum in zwei Teile, nämlich einen Teil zur Überführung des verarbeiteten Audiosignals 18 aus der Frequenz-/Modulationsfrequenzdarstellung, wie sie von der Signalverarbeitungseinrichtung 40 ausgegeben wird, in die Zeit-/Frequenzdarstellung, und einen Teil zur Rücküberführung des verarbeiteten Audiosignals von der Zeit-/Frequenzdarstellung in die Zeitdarstellung. Der erstgenannte der beiden Teile umfasst eine Transformationseinrichtung 42 zur Durchführung einer zu der Transformation nach der Transformationseinrichtung 38 inversen blockweisen Transformation, einen Mischer 46 und eine Zusammenfügungseinrichtung 44. Der zweitgenannte Teil des Rückführungsteils 26 umfasst eine Transformationseinrichtung 48 zur Durchführung einer zu der Transformation der Transformationseinrichtung 30 inversen blockweisen Transformation und eine Zusammenfügungseinrichtung 50.
Die inverse Transformationseinrichtung 42 ist mit ihrem Eingang an den Ausgang der Signalverarbeitungseinrichtung 40 angeschlossen und transformiert die modifizierten Blöcke von Modulationswerten teilbandweise von der Spektraldarstellung zurück in die Zeit/Frequenzdarstellung und macht damit die spektrale Zerlegung wieder rückgängig, um pro Teilband eine Folge von modifizierten Blöcken von Spektralwerten zu erhalten. Diese von der inversen Transformationseinrichtung 42 ausgegebenen modifizierten Spektralwertblöcke unterscheiden sich von den Spektralwertblöcken, wie sie von der Fensterungseinrichtung 36 ausgegeben worden sind, aber nicht nur durch die Verarbeitung durch die Signalverarbeitungseinrichtung 40 sondern auch durch die durch den Mischer 34 bewirkte Demodulation. Deshalb empfängt der Mischer 46 die von der inversen Transformationseinrichtung 42 pro Teilband ausgegebenen Folgen von modifizierten Spektralwertblöcken und mischt dieselben mit einem komplexen Träger, der zu demjenigen, der an entsprechender Stelle bzw. für den entsprechenden Block zur Demodulation des Audiosignals an dem Mischer 34 verwendet worden ist, komplex konjugiert ist, um die Spektralwertblöcke wieder mit dem durch die Phasenversätze der Zeitblöcke bewirkten Träger zu modulieren. Das Ergebnis, das sich am Ausgang des Mischers 46 einstellt, ist pro Teilband eine Folge von modifizierten nicht-demodulierten Spektralwertblöcken.
Der Ausgang des Mischer 46 ist mit einem Eingang der Zusammenfügungseinrichtung 44 verbunden. Diese führt pro Teilband die Folge von wieder mit dem komplexen Träger aufmodulierten modifizierten Blöcken von Spektralwerten zu einem einheitlichen Strom bzw. einer einheitlichen Folge von Spektralwerten zusammen, indem sie einander entsprechende Spektralwerte benachbarter bzw. aufeinanderfolgender Blöcke von Spektralwerten für ein Teilband, wie sie von dem Mischer 46 erhalten werden, geeignet miteinander verknüpft. In dem Fall der Verwendung oben exemplarisch genannter Gewichtungsfunktionen mit der positiven Eigenschaft, dass sich bei Überlappung die Quadrate einander korrespondierender Gewichtungswerte zu Eins summieren, besteht die Verknüpfung in einer einfachen Addition einander zugeordneter Spektralwerte. Das am Ausgang der Zusammenfügungseinrichtung 44 (OLA = overlap-add = Überlappaddierung) ausgegebene Ergebnis setzt sich aus einer modifizierten Folge von Spektralwerten pro Teilband zusammen. Das Ergebnis, das somit am Ausgang des der OLA 44 ausgegeben wird, sind somit modifizierte Teilbänder bzw. modifizierte Folgen von Spektralwerten für alle Spektralkomponenten und stellt eine modifizierte Zeit-/Frequenzdarstellung des Informationssignals 14 bzw. eine Zeit-/Frequenzdarstellung des modifizierten Audiosignals 18 dar.
Die Transformationseinrichtung 48 empfängt die Spektralwertfolgen und somit insbesondere nacheinander jeweils einen Spektralwert für alle Teilbänder bzw. Spektralkomponenten bzw. nacheinander eine spektrale Zerlegung eines Abschnitts des modifizierten Audiosignals 18. Sie erzeugt aus der Folge von spektralen Zerlegungen durch Rückgängigmachung der Spektralzerlegung eine Folge von modifizierten Zeitblöcken. Diese modifizierten Zeitblöcke empfängt wiederum die Zusammenfügungseinrichtung 50. Die Zusammenfügungseinrichtung 50 arbeitet ähnlich der Zusammenfügungseinrichtung 44. Sie fügt die sich exemplarisch um 50% überlappenden modifizierten Zeitblöcke dadurch zusammen, dass sie aus benachbarten bzw. aufeinanderfolgenden modifizierten Zeitblöcken einander entsprechende Informationswerte addiert. Das Ergebnis am Ausgang der Zusammenfügungseinrichtung 50 ist somit eine Folge von Informationswerten, die das verarbeitete Audiosignal 18 darstellen.
Nachdem nun im vorhergehenden der Aufbau der Vorrichtung 10 sowie die Funktionsweise der Einzelkomponenten beschrieben worden ist, wird im folgenden die Funktionsweise derselben Bezug nehmend auf Fig. 1 und 2 näher erörtert.
Die Verarbeitung des Audiosignals durch die Vorrichtung 10 beginnt mit dem Empfang des Audiosignals 14 am Eingang 12. Das Audiosignal 14 liegt dabei in einer abgetasteten Form vor. Die Abtastung ist beispielsweise mittels eines Analog/Digital-Wandlers vorgenommen worden. Die Abtastung erfolgte mit einer gewissen Abtastfrequenz ωs. Das Informationssignal 14 erreicht den Eingang 12 folglich als eine Folge von Abtast- bzw. Informationswerten si = s (2π/ωs · i), wobei s das analoge Informationssignal, si die Informationswerte und der Index i ein Index für die Informationswerte sein sollen. Unter den eingehenden Abtastwerten si fasst die Fensterungseinrichtung 28 je 2N aufeinanderfolgende Abtastwerte zu Zeitblöcken zusammen, vorliegend exemplarisch mit einer 50%-igen Überlappung. Beispielsweise fasst sie die Abtastwerte s0 bis s2N-1 zu einem Zeitblock mit dem Index n = 0 zusammen, die Abtastwerte sN bis s3N-1 zu einem zweiten Zeitblock mit dem Index n = 1, die Abtastwerte s2N bis s4N-1 zu einem dritten Zeitblock von Informationswerten mit dem Index n = 2 usw. zusammen. Jeden dieser Blöcke gewichtet die Fensterungseinrichtung 28 mit einer Fenster- bzw. Gewichtungsfunktion, wie es im Vorhergehenden beschrieben wurde. Seien sn 0 bis sn 2N-1 beispielsweise die 2N Informationswerte des Zeitblocks n, dann ergibt sich der durch die Einrichtung 28 ausgegebene Block schließlich zu sn 0 → sn 0 · g0 bis sn 2N-1 → sn 2N-1 · g2N-1, wobei gi mit i = 0 bis 2N-1 die Gewichtungsfunktion sei.
In Fig. 2 sind die auf die Informationswerte si angewendeten Fensterungsfunktionen exemplarisch für vier aufeinanderfolgende Zeitblöcke n = 0, 1, 2, 3 in einem Diagramm 70 veranschaulicht, bei dem entlang der x-Achse die Zeit t in willkürlichen Einheiten und entlang der y-Achse die Amplitude der Fensterungsfunktionen in willkürlichen Einheiten aufgetragen ist. Auf diese Weise gibt die Fensterungseinrichtung 28 nach jeweils N Informationswerten einen neuen gefensterten Zeitblock zu je 2N Informationswerten an die Transformationseinrichtung 30 weiter. Die Wiederholfrequenz der Zeitblöcke beträgt somit ωs/N.
Die Transformationseinrichtung 30 transformiert die gefensterten Zeitblöcke in eine Spektraldarstellurig. Die Transformationseinrichtung 30 führt dabei eine spektrale Zerlegung der Zeitblöcke von gefensterten Informationswerten in eine Mehrzahl von vorbestimmten Teilbändern bzw. Spektralkomponenten durch. Im vorliegenden Fall wird exemplarisch davon ausgegangen, dass es sich bei der Transformation um eine DFT bzw. diskrete Fouriertransformation handelt. Für jeden Zeitblock zu 2N Informationswerten erzeugt die Transformationseinrichtung 30 in diesem exemplarischen Fall N komplexwertige Spektralwerte für N Spektralkomponenten, wenn das Audiosignal reell ist. Die von der Transformationseinrichtung 30 ausgegebenen komplexen Spektralwerte stellen die Zeit-/-Frequenzdarstellung 74 des Audiosignals dar. Die komplexen Spektralwerte sind hierbei in Fig. 2 durch Kästchen 76 veranschaulicht. Da die Transformationseinrichtung 30 pro aufeinanderfolgendem Zeitblock von Informationswerten pro Teilband bzw. Spektralkomponente zumindest einen Spektralwert erzeugt, gibt die Transformationseinrichtung 30 somit mit der Frequenz ωs/N pro Teilband bzw. Spektralkomponente eine Folge von Spektralwerten 76 aus. Die zu einem Zeitblock ausgegebenen Spektralwerte sind in Fig. 2 bei 74 horizontal entlang der Frequenzachse 78 angeordnet dargestellt. Die zu einem darauffolgenden Zeitblock ausgegebenen Spektralwerte schließen sich direkt darunter in vertikaler Richtung entlang der Achse 80 an. Die Achsen 78 und 80 stellen somit die Frequenz- bzw. Zeitachse der Zeit-/Frequenzdarstellung des Audiosignals 14 dar. Exemplarisch sind in Fig. 3 lediglich vier Teilbänder dargestellt. Die Folge von Spektralwerten pro Teilband verlaufen in der exemplarischen Darstellung von Fig. 2 entlang der Spalten und sind mit 82a, 82b, 82c und 82d dargestellt.
Es wird wieder kurz auf Fig. 1 Bezug genommen, in der das Audiosignal 14 exemplarisch als eine Funktion veranschaulicht ist, die mit sin(bt) · (1+µ · sin(at)) darstellbar ist, wobei α beispielsweise die Modulationsfrequenz der mit der gestrichelten Linie 84 angedeuteten Hüllkurve des Informationssignals 14 sei, während β die Trägerfrequenz des Audiosignals 14 darstelle, t die Zeit sei und µ die Modulationstiefe sei. Bei ausreichend hoher Abtastfrequenz ωs ergibt mit diesem exemplarischen Informationssignal durch die Transformation 72 pro Zeitblock ein Block von Spektralwerten 76, d.h. eine Zeile bei 74, bei dem vornehmlich die Spektralkomponente bzw. der dazugehörige Spektralwert an der Trägerfrequenz β ein ausgeprägtes Maximum aufweist. Die Spektralwerte für diese Spektralkomponente f = β variiert jedoch in der Zeit für aufeinanderfolgende Zeitblöcke aufgrund der Variation der Hüllkurve 84. Dementsprechend variiert der Betrag der Spektralwerte der Spektralkomponente β mit der Modulationsfrequenz α.
Die bisherige Betrachtung ließ aber außer acht, dass die verschiedenen Zeitblöcke aufgrund einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz ωs/N und der Trägerfrequenz des Audiosignals 14 jeweils einen unterschiedlichen Phasenversatz zur Trägerfrequenz β aufweisen können. Je nach dem Phasenversatz sind die Spektralwerte der Spektralblöcke, die sich bei Transformation 72 aus den Zeitblöcken ergeben, mit einem Träger ejΔϕf moduliert, wobei j die imaginäre Einheit, f die Frequenz und Δϕ den Phasenversatz des jeweiligen Zeitblocks darstelle. Bei im wesentlichen gleicher Trägerfrequenz, wie es in dem vorliegenden exemplarischen Fall der Fall ist, nimmt der Phasenversatz Δϕ linear zu. Deshalb erfahren auch die Spektralwerte eines Teilbandes aufgrund einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz und der Trägerfrequenz eine Modulation mit einer Trägerkomponente, die von der Fehlanpassung der beiden Frequenzen abhängt.
Dies in Betracht ziehend leitet nun die Trägerfrequenzbestimmungseinrichtung 32 aus den Spektralwerten a(ωb, n) die durch den Phasenversatz der Zeitblöcke resultierende bzw. durch den Zeitblockphasenversatz bewirkte Trägerkomponente in den Teilbändern ab, wobei ωb die Kreisfrequenz ω bzw. Frequenz f (ω=2πf) des jeweiligen Teilbandes 0≤b<N unter allen N Teilbändern und n der Zeitblock- bzw. Spektralblockindex sei, der gemäß n = ωs · t mit der Zeit t zusammenhängt. Die so ermittelte Modulationsträgerfrequenz ω (m,f) bestimmt die Trägerfrequenzbestimmungseinrichtung 32 für jedes Teilband ωb bzw. jede Frequenz f blockweise, wobei m einen Blockindex anzeige, wie er im folgenden noch näher erläutert wird. Dazu fasst die Trägerfrequenzbestimmungseinrichtung 32 je M aufeinanderfolgende Spektralwerte 76 eines Teilbandes ωb zusammen, wie z.B. die Spektralwerte a (ωb, 0) bis a (ωb, M-1). Unter diesen M Spektralwerten bestimmt sie einen Phasenverlauf durch ein Phasenunwrapping. Anschließend bestimmt sie beispielsweise mittels eines Algorithmus der kleinsten Fehlerquadrate eine Geradengleichung, die dem Phasenverlauf am nächsten kommt. Aus der Steigung und einem Achsenabschnitt bzw. einem Phasen- oder Anfangsoffset der Geradengleichung erhält die Trägerfrequenzbestimmungseinrichtung 32 die gewünschte Modulationsträgerfrequenz ωd für das Teilband b bezüglich des Zeitblockes m bzw. einen Spektralwertblockphasenversatz ϕ für das Teilband b bezüglich des Zeitblockes m. Diese Bestimmung führt die Trägerfrequenzbestimmungseinrichtung für alle Teilbänder über zeitlich gleiche Spektralwerte durch, also für alle Spektralwertblöcke a (ωb, 0) bis a (ωb,M-1) mit ωb für alle Teilbänder 0≤b<N. Auf diese Weise bestimmt die Trägerfrequenzbestimmungseinrichtung 32 für jedes Teilband ωb eine Modulationsträgerfrequenz ωd und den Spektralwertblockphasenversatz ϕ, und das für Block für Block. Die Blockeinteilung, die der Bestimmung der komplexen Träger für alle Teilbänder durch die Einrichtung 32 zugrunde liegt, ist diejenige, wie sie auch von der Fensterungseinrichtung zur Fensterung verwendet wird. Die Trägerfrequenzbestimmungseinrichtung 32 gibt die bestimmten Werte für die komplexen Träger an die Demodulationseinrichtung bzw. den Mischer 34 aus.
Der Mischer 34 mischt nun die gefensterten Blöcke von Spektralwerten der einzelnen Teilbänder, wie sie von der Fensterungseinrichtung 36 ausgeben werden, mit dem komplex konjugierten der jeweiligen Modulationsträgerfrequenzen ωd unter Berücksichtigung der Spektralwertblockphasenversätze ϕ durch Multiplikation dieser Teilbandspektralwertblöcke mit e-j · (ω_d·n + ϕ)), wobei, wie oben erwähnt, jeweils ein unterschiedliches Paar von ωd und ϕ für jedes Teilband und innerhalb jedes Teilbands für die aufeinanderfolgenden Blöcke verwendet wird. Auf diese Weise gibt der Mischer 34 zueinander ausgerichtete demodulierte Teilbandspektralwertblöcke aus, d.h. zweidimensionale Blöcke aus N Spektralwertblöcken zu je M demodulierten Spektralwerten.
Da die durch die Zeitblockversätze verursachten Modulationen in den Teilbändern durch die Demodulation mittels des Mischers 34 entfernt worden sind, ist der Phasenverlauf der Spektralwerte in den Teilbändern innerhalb der Blöcke im Mittel flacher und verläuft im wesentlichen um die Phase 0 herum. Auf diese Weise wird erzielt, dass bei der anschließenden Transformation durch die Transformationseinrichtung 38 die demodulierten und gefensterten Blöcke von Spektralwerten zu einer spektralen Zerlegung führen, bei der die Frequenz 0 bzw. der Gleichanteil sehr gut zentriert ist.
Die sich an die Demodulation 84 durch den Mischer 34 anschließende Transformation 86 durch die Transformationseinrichtung 38 wird blockweise an jedem Teilband bzw. jeder Folge von demodulierten Blöcken von Spektralwerten durchgeführt. Durch die Transformation 86 werden insbesondere die demodulierten Spektralwertblöcke der N Teilbänder blockweise einer spektralen Zerlegung unterzogen. Das Ergebnis der spektralen Zerlegung der Blöcke von Spektralwerten kann auch als Modulationsfrequenzdarstellung bezeichnet werden. Für N zueinander ausgerichtete Blöcke von gefensterten und demodulierten Spektralwerten ergibt die Transformation 86 folglich eine Matrix von M x N Modulationswerten, die die Frequenz-/Modulationsfrequenzdarstellung des Informationssignals 14 über die Zeitdauer der M Zeitblöcke repräsentiert, die zu dieser Matrix beigetragen haben. Die Modulationsmatrix ist in Fig. 2 exemplarisch bei 88 für den Fall N=M=4 gezeigt. Wie es zu sehen ist, hat die Frequenz-/Modulationsfrequenzdarstellung 88 zwei Dimensionen, nämlich die Frequenz 90 und die Modulationsfrequenz 92. Die einzelnen Modulationswerte sind bei 88 mit Kästchen 93 versinnbildlicht.
Die Transformationseinrichtung 38 gibt die Modulationsmatrix an die Verarbeitungseinrichtung 40 weiter. Die Verarbeitungseinrichtung 40 ist gemäß dem vorliegenden. Ausführungsbeispiel dazu vorgesehen, aus dem Audiosignal 14 den Modulationsanteil herauszufiltern. In dem vorliegenden exemplarischen Fall führt die Verarbeitungseinrichtung 40 deshalb eine Tiefpassfilterung an den Modulationsfrequenzanteilen in der Frequenz-/Modulationsfrequenzmatrix durch. In Fig. 1 ist zur Veranschaulichung bei 94 ein Diagramm dargestellt, bei der entlang der x-Achse die Modulationsfrequenz abgetragen und entlang der y-Achse der Betrag der Modulationswerte abgetragen ist. Das Diagramm 94 stellt einen Schnitt der Modulationsmatrix 88 für den exemplarischen Fall des Audiosignals 14 von Fig. 1 dar, nämlich dem sinusmodulierten Sinus. Insbesondere ist in dem Diagramm 94 der Verlauf der Beträge der Modulationswerte entlang der Modulationsfrequenz für das Teilband mit der Frequenz β, also der Trägerfrequenz, dargestellt. Durch die Demodulation 84 mittels des Mischers 34 ist das Modulationsfrequenzspektrum im wesentlichen perfekt zentriert - zumindest im Falle der FFT als der Transformation 86 - bzw. korrekt ausgerichtet. Insbesondere weist das Modulationsfrequenzspektrum an der Trägerfrequenz β zwei Seitenbänder 96 und 98 auf, die an der Modulationsfrequenz α, also der Modulationsfrequenz der Hüllkurve 84 des Audiosignals 14 angeordnet sind. Ferner weisen die Modulationswerte der Modulationsmatrix 88 an der Frequenz β einen Gleichanteil 100 auf. Die Signalverarbeitungseinrichtung 40 ist nun als Tiefpassfilter mit einer Filtercharakteristik 102, die mit gestrichelter Linie dargestellt ist, ausgestaltet, um die beiden Seitenbänder 96 und 98 aus der Frequenz-/Modulationsfrequenzdarstellung 88 zu entfernen. Auf diese Weise wird das Audiosignal 14 von seiner Modulationskomponente befreit, wonach lediglich noch die Trägerkomponente übrig bleibt. Die derart veränderte Modulationsmatrix gibt die Verarbeitungseinrichtung 40 an die inverse Transformationseinrichtung 42 weiter. Die inverse Transformationseinrichtung 42 verarbeitet die modifizierte Modulationsmatrix für jedes Teilband derart, dass der Block von Modulationswerten für das jeweilige Teilband, also eine Spalte in der Modulationsmatrix 88, einer zu der Transformation der Transformationseinrichtung 38 inversen Transformation unterzogen wird, so dass diese Modulationswertblöcke von der Frequenz/Modulationsfrequenzdarstellung zurück in die Zeit/Frequenzdarstellung überführt werden. Auf diese Weise erzeugt die inverse Transformationseinrichtung 42 aus jedem solchen Block von Modulationswerten für jedes Teilband einen Block von Spektralwerten für dieses Teilband.
Ab der Ausgabe der Spektralwerte durch die Transformationseinrichtung 30 bezog sich die vorhergehende Beschreibung vornehmlich auf die Verarbeitung der ersten M Spektralwerte bzw. von M aufeinanderfolgenden Spektralwerten für jedes Teilband. Die Verarbeitungen durch die Einrichtungen 32, 34, 36, 38, 40 und 42 werden aber auch für nachfolgende Blöcke zu je M Spektralwerten für jedes der N Teilbänder wiederholt, und zwar mit einer Überlappung der Blöcke zu je M Spektralwerten von in dem vorliegenden Fall exemplarisch 50%, also mit einer Überlappung pro Teilband um M/2 Spektralwerte. Die Blöcke sind in Fig. 2 exemplarisch mit m = 0, m = 1 und m = 2 in der Zeit-/Frequenzdarstellung 74 durch exemplarische bogenförmige Fensterungs- bzw. Gewichtungsfunktionen veranschaulicht, die sich exemplarisch über M=4 Spektralwerte in jedem Teilband erstrecken. Für jeden dieser Blöcke m erzeugt die Transformationseinrichtung 38 schließlich eine Modulationsmatrix zu je M x N Modulationswerten, die durch die Signalverarbeitungseinrichtung 40 auf die oben beschriebene Weise gefiltert bzw. gewichtet werden. Die inverse Transformationseinrichtung 42 erzeugt aus diesen modifizierten Modulationsmatrizen 88 wiederum für jedes Teilband einen Block von Spektralwerten, d.h. eine mit der Matrix aus modifizierten aber noch demodulierten Blöcken von Spektralwerten.
Die von der inversen Transformationseinrichtung 42 ausgegebenen Blöcke von Spektralwerten pro Teilband weichen von denjenigen, wie sie aus dem Informationssignal 14 am Ausgang der Fensterungseinrichtung 36 erhalten wurden, jedoch nicht nur durch die Verarbeitung durch die Verarbeitungseinrichtung 40 ab, sondern auch durch die durch die Demodulation bewirkte Veränderung. Die Spektralwertblöcke werden deshalb in der Modulationsei-nrichtung 46 wieder mit der Modulationsträgerkomponente moduliert, mit der sie vorher demoduliert wurden. Insbesondere werden also die entsprechenden Blöcke von Spektralwerten, die zuvor mit e-j· (ω_d · n + ϕ)) multipliziert worden sind, nun mit e+j · (ω_d · n + ϕ)) multipliziert, wobei n den Index der Spektralwertefolge des jeweiligen Teilbandes anzeige und ω_d bzw. ωd die Kreisfrequenz des komplexen durch die Einrichtung 32 für den jeweiligen Spektralwertblock bestimmten Modulationsträgers sei.
Die sich nach der Modulationsstufe 46 ergebenden Folgen von Blöcken von Spektralwerten pro Teilband werden nun für jedes Teilband durch die Zusammenfügungseinrichtung 44 zu einem einheitlichen Strom 82a-82d von Spektralwerten pro Teilband zusammengefügt, indem dieselbe die Blöcke von Spektralwerten entsprechend, vorliegend exemplarisch um 50%, miteinander überlappt und einander entsprechende Spektralwerte je nach in der Fensterungseinrichtung 36 verwendeter Gewichtungsfunktion kombiniert, nämlich durch Addieren in dem Fall der oben exemplarisch angegebenen Sinus- oder KBD-Fenster.
Die sich am Ausgang der Zusammenfügungseinrichtung 44 ergebenden Ströme von Spektralwerten pro Teilband stellen die Zeit-/Frequenzdarstellung des verarbeiteten Audiosignals 18 dar. Die Ströme werden von der inversen Transformationseinrichtung 48 empfangen. Sie verwendet in jedem Zeitschritt n die Spektralwerte für alle Teilbänder ωb, also alle Spektralwerte a (ωb, n) mit 0≤b<N, um an denselben eine Transformation von der Frequenz- in die ZeitDarstellung durchzuführen, um für jedes n, d.h. mit einer Wiederholzeitdauer von 2πN/ωs, einen Zeitblock zu erhalten. Diese Zeitblöcke werden durch die Zusammenfügungseinrichtung 50 durch vorliegend exemplarisch 50%-ige Überlappung und Kombinieren einander entsprechender Informationswerte in diesen Zeitblöcken zu einem einheitlichen Strom von Informationswerten zusammengeführt, der schließlich das verarbeitete Audiosignal im Zeitbereich 18 darstellt, das am Ausgang 16 ausgegeben wird.
Das verarbeitete Audiosignal ist in Fig. 1 bei 18 in einem Diagramm dargestellt, bei dem die x-Achse die Zeit und die y-Achse die Amplitude des Audiosignals 18 ist. Wie es zu sehen ist, ist lediglich noch die Trägerkomponente des eingangsseitigen Audiosignals 14 übrig geblieben. Die Modulationsanteile bzw. der Hüllkurvenanteil 84 ist entfernt worden.
In anderen Worten ausgedrückt repräsentierte das Ausführungsbeispiel von Fig. 1 und 2 eine Verarbeitungsvorrichtung, die eine signaladaptive Filterbank dazu verwendete, eine Zerlegung von Signalen in Träger und Modulationskomponenten vorzunehmen, und die entstehende Repräsentation der modulierten Signale verwendete, um diese zu filtern. Ebenso wäre es jedoch möglich, anstatt der Filterverarbeitung in der Signalverarbeitungseinrichtung eine Codierung, Verschlüsselung oder Kompression durchzuführen, oder die Modulationsmatrizen anderweitig zu modifizieren. Im Vergleich zu den in der Beschreibungseinleitung beschriebenen zur Audiocodierung verwendeten Modulationstransformationsverfahren, die eine Betragsbildung durchführen, wird bei diesem Ausführungsbeispiel je Teilband eine Demodulation bezüglich einer Trägerkomponente durchgeführt. Nach Schätzung dieser Teilbandträgerkomponente in der Trägerfrequenzbestimmungseinrichtung 32 wird die Demodulation pro Teilband durch Multiplikation mit der komplex Konjugierten dieser Komponente erzielt. Die auf diese Weise demodulierten Teilbandsignale werden anschließend durch eine weitere Frequenzzerlegung mittels der Fenstereinrichtung 36 und der Transformationseinrichtung 38 in den Modulationsbereich transformiert.
Bei dem Ausführungsbeispiel von Fig. 1 wurde als die erste Transformation 72 exemplarisch eine DFT mit 50% Überlappung und Fensterung verwendet, wobei hiervon jedoch auch Abweichungen und Variationen denkbar sind. Mehrere Blöcke der ersten Transformation 72 wurden abermals - dort mit exemplarisch 50% Überlappung - durch die Fensterungseinrichtung 36 zusammengefasst und teilbandweise mit einem komplexen Modulator, der durch die Trägerfrequenzbestimmungseinrichtung 32 bestimmt worden ist, mittels des Mischers 34 demoduliert und anschließend mit einer DFT transformiert. Bei dem vorhergehenden Ausführungsbeispiel wurde in der Trägerfrequenzbestimmungseinrichtung die Frequenz dieses Modulators aus den Phasen der entsprechenden Blöcke des zu demodulierenden Teilbandes gewonnen, nämlich durch näherungsweises Legen einer Geraden durch den geunwrappten Phasenverlauf der Spektralwerte der entsprechenden Blöcke. Dies kann jedoch auch anders durchgeführt werden. Die Trägerfrequenzbestimmungseinrichtung 32 kann beispielsweise pro Spektralblockabschnitt n bis n+M-1 eine Ebene in den Phasenanteil aller Teilbänder in diesem Abschnitt näherungsweise legen. Ferner wäre es möglich, dass die Trägerfrequenzbestimmungseinrichtung 32 die Bestimmung des komplexen Modulators nicht blockweise Vornimmt sondern kontinuierlich über den Strom von Spektralwerten pro Teilband. Dazu könnte beispielsweise die Trägerfrequenzbestimmungseinrichtung 32 beispielsweise die Phasen der Folge von Spektralwerten eines jeweiligen Teilbandes zunächst unwrappen, tiefpassfiltern und dann die lokale Steigerung des gefilterten Phasenverlaufs zur Anpassung des komplexen Modulators heranziehen. Dementsprechend würde auch der Modulationsteil beim Mischer 46 geändert werden. Ganz allgemein versucht die Trägerfrequenzbestimmungseinrichtung den Phasenverlauf dadurch zu beeinflussen, dass die Phase der komplexen Spektralwerte eines Teilbandes mit einem über die Folge hinweg zunehmenden oder abnehmenden Betrag entweder erhöht oder reduziert wird, derart, dass eine mittleren Steigung der Phase der Folge von Spektralwerten verringert wird, bzw. sich der geunwrappte Phasenverlauf im wesentlichen um einen festen Phasenwert, vorzugsweise die Phase 0, herum variiert.
Noch einmal explizit wird auf die Tatsache hingewiesen, dass für die verwendeten Transformationen 72, 86 und die hierzu inversen Transformationseinrichtungen 42 und 48 auch andere Typen denkbar sind als die DFT bzw. IDFT. So kann beispielsweise, allerdings nicht erfindungsgemäß das komplexe demodulierte Teilbandsignal auch mit je einer reellwertigen Transformation getrennt nach Real- und Imaginärteil in die Frequenz/Modulationsfrequenzdarstellung transformiert bzw. spektral zerlegt werden. Der Realteil repräsentierte dann nach der Demodulationsstufe die Amplitudenmodulation des Subbandsignals bezüglich des zur Demodulation verwendeten Trägers. Der Imaginärteil repräsentierte dann die Frequenzmodulation dieses Trägers. In dem Fall der DFT bzw. IDFT für die Einrichtungen 38 bzw. 42, spiegelt sich der Amplitudenmodulationsanteil des Subbandsignals im symmetrischen Anteil des DFT-Spektrums entlang der Modulationsfrequenzachse wieder, während der Frequenzmodulationsanteil des Trägers dem asymmetrischen Anteil des DFT-Spektrums entlang der Modulationsfrequenzachse entspricht.
Das im vorhergehenden beschriebene Ausführungsbeispiel wurde exemplarisch an einem einfachen sinusmodulierten Sinussignal veranschaulicht. Das Ausführungsbeispiel von Fig. 1 und 2 ist aber auch für eine Filterung des Verlaufs der Hüllkurve eines Gemisches amplitudenmodulierter Signale beliebiger Frequenz, wie z.B. amplitudenmodulierter tonaler Signale, geeignet. Die einzelnen Frequenzkomponenten der Hüllkurve sind zur konsistenten Bearbeitung in der Modulationsmatrix 88 direkt repräsentiert, ganz im Gegensatz zur bereits bekannten Betrags-Phasen-Darstellung nach den in der Beschreibungseinleitung beschriebenen Modulationstransformationsanalyseverfahren zur Audiocodierung. Auch die Filterung von frequenzmodulierten Signalen geringer Modulationstiefe, d.h. mit einem Frequenzhub, der wesentlich kleiner als die Teilbandbreite der ersten DFT ist, ist mit dem Ausführungsbeispiel von Fig. 1 und 2 möglich.
Das Ausführungsbeispiel von Fig. 1 und 2 betraf also eine Anordnung zur Modulationsfilterung, die noch einmal in anderen Worten ausgedrückt auf einer signaladaptiven Transformation, einer Filterung im Modulationsbereich und einer entsprechenden Rücktransformation basierte. Ohne Signalmanipulation im Modulationsbereich, im vorliegenden Ausführungsbeispiel der Filterung, ist die Anordnung aus Fig. 1 perfekt rekonstruierend. Durch Einbringen eines geeigneten Spektralbereichsfilters, wie exemplarisch dem Filter 102, d.h. einer Schwächung der Modulationswerte mit zunehmender Entfernung von einer Mittenmodulationsfrequenz von Null, können die zu entfernenden Modulationsanteile wie gewünscht gedämpft werden. Es sind jedoch auch andere Arten der Verarbeitung von Audiosignalen in der Frequenz-/Modulationsfrequenzdarstellung denkbar. So könnte es auch wünschenswert sein, lediglich den Träger zu entfernen. In diesem Fall bestünde die Filterung in einer Hochpassfilterung, d.h. einer Gewichtung mit einer Gewichtungsfunktion mit einer Modulationsfrequenzkante an einer bestimmten Modulationsfrequenz, die Modulationswerte an geringeren Modulationsfrequenzen mehr schwächt als solche an darüber liegenden Modulationsfrequenzen. In wiederum anderen Anwendungsbereichen bzw. Anwendungen könnte die Signalverarbeitung in der Signalverarbeitungseinrichtung 40 wiederum in einer Bandpassfilterung bestehen, also einer Gewichtung mit einer Gewichtungsfunktion, die von einer bestimmten Mittenmodulationsfrequenz weg abfällt, um Anteile des Audiosignals, die von unterschiedlichen Quellen stammen, zu separieren, d.h. eine Quellenseparation zu erzielen. Weitere Anwendungen, bei denen das vorhergehende Ausführungsbeispiel verwendet werden kann, können die Audiocodierung zur Codierung von Audiosignalen, die Rekonstruktion gestörter Signale und die Fehlerverschleierung betreffen. Ganz allgemein könnte aber auch die Vorrichtung 10 als Musikeffektgerät eingesetzt werden, um spezielle akustische Effekte in dem eingehenden Audiosignal zu verwirklichen. Die Verarbeitungen in der Signalverarbeitungseinrichtung 40 können dementsprechend vielfältigste Formen annehmen, wie z.B. die Quantisierung der Modulationswerte, das Nullsetzen einiger Modulationswerte, die Gewichtung einzelner Abschnitte der oder aller Modulationswerte oder dergleichen. Ein weiteres Anwendungsgebiet wäre der Einsatz der Vorrichtung 10 von Fig. 1 als Wasserzeichen-Einbetter. Der Wasserzeichen-Einbetter würde ein Audiosignal 14 empfangen, wobei die Verarbeitungseinrichtung 40 ein empfangenes Wasserzeichen dadurch in das Audiosignal einbringen könnte, dass dieselbe einzelne Segmente bzw. Modulationswerte gemäß dem Wasserzeichen modifiziert. Die Auswahl der Segmente bzw. Modulationswerte könnte für aufeinanderfolgende Modulationsmatrizen verschieden bzw. zeitvariant erfolgen und würde derart getroffen werden, dass durch psychoakustische Verdeckungseffekte die Modifikationen durch die Wasserzeicheneinbringung für ein menschliches Gehör in dem sich ergebenden Wasserzeichen-behafteten Audiosignal 18 unhörbar sind.
Im Hinblick auf die Transformationseinrichtungen wird noch darauf hingewiesen, dass dieselben natürlich auch als Filterbanken ausgebildet sein können, die eine Spektraldarstellung durch viele einzelne Bandpassfilterungen erzeugen. Ferner wird darauf hingewiesen, dass das sich ergebende Audiosignal 18 nach der Verarbeitung nicht in der Zeitbereichsdarstellung ausgegeben werden muss. Es wäre ferner denkbar das Informationssignal beispielweise in einer Zeit/Spektraldarstellung oder sogar in der Spektral/Modulationsspektraldarstellung auszugeben. Im letztgenannten Fall müsste dann natürlich sichergestellt werden, dass empfängerseitig die notwendige Modulation 46 wieder mit dem geeigneten Träger durchgeführt werden kann, beispielsweise durch Mitlieferung der pro Teilband und Spektralwertblock variierenden komplexen Träger, die zur Demodulation 84 verwendet worden sind. Auf diese Weise ließe sich obiges Ausführungsbeispiel zur Verwirklichung eines Kompressionsverfahrens verwenden.
Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Schema auch in Software implementiert sein kann. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.
Claims (18)
- Vorrichtung zum Verarbeiten eines Audiosignals (14), mit einer Einrichtung (20) zum Überführen des Audiosignals (14) in eine Zeit-/Spe ktraldarstellung (74) durch blockweises Transformieren des Audiosignals; einer Einrichtung (22) zum Überführen des Audiosignals von der Zeit-/Spektraldarstellung (74) in eine Spektral-/Modulationsspektraldarstellung (88) mittels einer einzigen Frequenzzerlegungstransformation, wobei die Einrichtung (22) zum Überführen derart ausgebildet ist, dass die Spektral-/Modulationsspektraldarstellung (88) abhängig von sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spektraldarstellung (74) des Audiosignals (14) ist; einer Einrichtung (24, 40) zum Manipulieren des Audiosignals (14) in der Spektral-/Modulationsspektraldarstellung (88), um eine modifizierte Spektral-/Modulationsspektraldarstellung zu erhalten; und einer Einrichtung (26) zum Bilden eines verarbeiteten Audiosignals (18), das eine verarbeitete VersiAudiosignals (18), das eine verarbeitete Version des Audiosignals (14) darstellt, basierend auf der modifizierten Spektral-/Modulationsspektraldarstellung.
- Vorrichtung gemäß Anspruch 1, bei der die Einrichtung (20) zum Überführen des Audiosignals (14) in die Zeit-/Spektraldarstellung (74) ausgebildet ist, um die Zeit-/Spektraldarstellung in eine Mehrzahl von Spektralkomponenten zu zerlegen, um pro Spektralkomponente eine Folge (82a, 82b, 82c, 82d) von komplexen Spektralwerten zu erhalten.
- Vorrichtung gemäß Anspruch 2, bei der die Einrichtung (22) zum Überführen des Audiosignals (14) von der Zeit-/Spektraldarstellung (74) in die Spektral-/Modulationsspektraldarstellung (88) eine Einrichtung (36, 38) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge (82a, 82b, 82c, 82d) von Spektralwerten aufweist, um einen Teil der Spektral-/Modulationsspektraldarstellung (88) zu erhalten.
- Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (22) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge (82a, 82b, 82c, 82d) von Spektralwerten ausgebildet ist, um die Folge (82a, 82b, 82c, 82d) von Spektralwerten blockweise zunächst mit einem komplexen Träger zu multiplizieren (84), derart, dass sich blockweise ein Betrag einer mittleren Steigung eines Phasenverlaufs der Folge (82a, 82b, 82c, 82d) von Spektralwerten verringert, um demodulierte Blöcke von Spektralwerten zu erhalten, und die demodulierten Blöcke von Spektralwerten dann blockweise spektral zu zerlegen, um den Teil der modifizierten Spektral-/Modulationsspektraldarstellung (88) zu erhalten.
- Vorrichtung gemäß Anspruch 4, bei der die Einrichtung (22) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge (82a, 82b, 82c, 82d) von komplexen Spektralwerten eine Einrichtung (32) zum, abhängig von der Zeit-/Spektraldarstellung (74) des Audiosignals, blockweisen Variieren des komplexen Trägers aufweist, mit dem die Folge (82a, 82b, 82c, 82d) von komplexen Spektralwerten blockweise multipliziert wird.
- Vorrichtung gemäß Anspruch 5, bei der die Einrichtung (32) zum Variieren ausgebildet ist, um zum blockweisen Variieren des komplexen Trägers blockweise Phasen der Spektralwerte in der Folge von Spektralwerten zu unwrappen, um einen Phasenverlauf zu erhalten, eine mittlere Steigung des Phasenverlaufs zu bestimmen und basierend auf der mittleren Steigung den komplexen Träger zu bestimmen.
- Vorrichtung gemäß Anspruch 6, bei der die Einrichtung (32) zum Variieren ferner ausgebildet ist, um aus dem Phasenverlauf einen Achsenabschnitt des Phasenverlaufs zu bestimmen und den komplexen Träger ferner basierend auf dem Achsenabschnitt zu bestimmen.
- Vorrichtung gemäß einem der Ansprüche 4 bis 7, bei der die Einrichtung (26) zum Bilden folgende Merkmale aufweist:eine Einrichtung (42) zum Rücküberführen des Audiosignals von der modifizierten Spektral-/Modulationsspektraldarstellung in eine modifizierte Zeit-/Spektraldarstellung, um modifizierte demodulierte Blöcke von Spektralwerten für die vorbestimmte Spektralkomponente zu erhalten;eine Einrichtung (46) zum blockweise Multiplizieren der modifizierten demodulierten Blöcke von Spektralwerten mit einem zu dem komplexen Träger komplex konjugierten Träger, um modifizierte Blöcke von Spektralwerten zu erhalten; undeine Einrichtung (44) zum Zusammenfügen der modifizierten Blöcke von Spektralwerten zu einer modifizierten Folge von Spektralwerten, um einen Teil einer Zeit-/Spektraldarstellung des verarbeiteten Audiosignals (18) zu erhalten.
- Vorrichtung gemäß Anspruch 8, bei der die Einrichtung zum Bilden ferner folgendes Merkmal aufweist:eine Einrichtung zum Rücküberführen des verarbeiteten Audiosignals (18) von der Zeit-/Spektraldarstellung in die Zeitdarstellung.
- Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (40) zum Modifizieren ausgebildet ist, um eine Gewichtung der Modulationsanteile der Spektral-/Modulationsspektraldarstellung (88) zur Modulationsfilterung, Audiocodierung, Quellenseparation, Rekonstruktion des Audiosignals, zur Fehlerverschleierung oder zur Überlagerung des Audiosignals mit einem Wasserzeichen vorzunehmen.
- Vorrichtung gemäß Anspruch 1, bei der die Einrichtung (20) zum Überführen des Audiosignals in die Zeit-/Spektraldarstellung (74) folgende Merkmale aufweist:eine Blockbildungseinrichtung (28) zum Bilden einer Folge von Blöcken von Informationswerten aus dem Audiosignal (14) ; undeine Einrichtung (30) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten, um eine Folge von Spektralwertblöcken zu erhalten, wobei jeder Spektralwertblock einen Spektralwert (76) für jede einer vorbestimmten Mehrzahl von Spektralkomponenten aufweist, so dass die Folge von Spektralwertblöcken pro Spektralkomponente eine Folge (82a-82d) von Spektralwerten bildet.
- Vorrichtung gemäß Anspruch 11, bei der die Einrichtung (22) zum Überführen des Audiosignals (14) in die Spektral-/Modulationsspektraldarstellung (88) fölgende Merkmale aufweist:eine Einrichtung (32-38) zum spektralen Zerlegen einer vorbestimmten Folge der Folgen (82a-82d) von Spektralwerten, um einen Block von Modulationswerten zu erhalten,wobei die Einrichtung (24; 40) zum Modifizieren ausgebildet ist, um den Block (88) von Modulationswerten zu modifizieren, um einen modifizierten Block von Modulationswerten zu erhalten, der ein Teil der modifizierten Spektral/Modulationsspektraldarstellung (88) ist.
- Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (26) zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (42, 44, 46), um eine modifizierte Folge von Spektralwerten zu erhalten, und eine Folge von modifizierten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (48), um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (50), um das verarbeitete Audiosignal (18) zu erhalten.
- Vorrichtung gemäß Anspruch 13, bei die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten ausgebildet ist, um jeden Block der Folge von Blöcken von Informationswerten zunächst mit einer Fensterfunktion zu multiplizieren und dann spektral zu zerlegen, und die Einrichtung (26) zum Bilden ausgebildet ist, um beim Zusammenfügen (50) die modifizierten Blöcke von Informationswerten derart zu verarbeiten, dass sich die Multiplikation mit der Fensterfunktion nicht auf das verarbeitete Audiosignal (18) auswirkt.
- Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten derart ausgebildet ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge (82a-82d) von komplexen Spektralwerten liefert, und die Einrichtung (32, 34, 36, 38) zum spektralen Zerlegen der vorbestimmten Folge der Folgen (82a-82d) von Spektralwerten ausgebildet ist, um zunächst die vorbestimmte Folge (82a-82d) von Spektralwerten derart zu modifizieren (34), dass eine Phase der Spektralwerte der vorbestimmten Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert wird, um eine phasenmodifizierte Folge von Spektralwerten zu erhalten, und dann die phasenmodifizierte Folge von Spektralwerten spektral zu zerlegen (38), um den zumindest einen Block von Modulationswerten zu erhalten, und die Einrichtung zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (42), um eine modifizierte Folge von Spektralwerten zu erhalten, die modifizierte Folge von Spektralwerten umgekehrt zu der Einrichtung (34) zum spektralen Zerlegen der vorbestimmten Folge der Folgen von Spektralwerten derart zu modifizieren (46), dass eine Phase der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert wird, um eine modifizierte Folge von Spektralwerten zu erhalten, eine Folge von modifizierten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (48), um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (50), um das verarbeitete Audiosignal (18) zu erhalten.
- Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die einzige Frequenzzerlegungstransformation eine einzige diskrete Fouriertransformation ist.
- Verfahren zum Verarbeiten eines Audiosignals (14), mit Überführen (20) des Audiosignals (14) in eine Zeit-/Spektraldarstellung (74) durch blockweises Transformieren des Informationssignals; Überführen (22) des Audiosignals von der Zeit-/Spektraldarstellung (74) in eine Spektral-/Modulationsspektraldarstellung (88) mittels einer einzigen Frequenzzerlegungstransformation, wobei das Überführen derart durchgeführt wird, dass die Spektral-/Modulationsspektraldarstellung (88) abhängig von sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spektraldarstellung (74) des Audiosignals (14) ist; Modifizieren (24) des Audiosignals (14) in der Spektral-/Modulationsspektraldarstellung (88), um eine modifizierte Spektral-/Modulationsspektraldarstellung zu erhalten; und Bilden (26) eines verarbeiteten Audiosignals (18), das eine verarbeitete Version des Audiosignals (14) darstellt, basierend auf der modifizierten Spektral-/Modulationsspektraldarstellung.
- Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 17, wenn das Computer-Programm auf einem Computer abläuft.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102004021403.4 | 2004-04-30 | ||
DE102004021403A DE102004021403A1 (de) | 2004-04-30 | 2004-04-30 | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
PCT/EP2005/003064 WO2005109240A1 (de) | 2004-04-30 | 2005-03-22 | Informationssignalverarbeitung durch modifikation in der spektral-/modulationsspektralbereichsdarstellung |
Publications (2)
Publication Number | Publication Date |
---|---|
HK1097326A1 true HK1097326A1 (zh) | 2007-06-22 |
HK1097326B HK1097326B (en) | 2010-09-30 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
NO20065423L (no) | 2007-01-26 |
WO2005109240A1 (de) | 2005-11-17 |
AU2005241157B2 (en) | 2008-05-22 |
MXPA06012424A (es) | 2007-01-17 |
BRPI0509818B1 (pt) | 2022-06-07 |
CA2564970A1 (en) | 2005-11-17 |
DE102004021403A1 (de) | 2005-11-24 |
RU2006142324A (ru) | 2008-06-10 |
JP2007535849A (ja) | 2007-12-06 |
AU2005241157A1 (en) | 2005-11-17 |
JP4473913B2 (ja) | 2010-06-02 |
US7574313B2 (en) | 2009-08-11 |
DE502005009035D1 (de) | 2010-04-01 |
BRPI0509818A (pt) | 2007-09-18 |
US20070100610A1 (en) | 2007-05-03 |
EP1741039A1 (de) | 2007-01-10 |
CN1950815A (zh) | 2007-04-18 |
IL178671A (en) | 2011-03-31 |
KR100851424B1 (ko) | 2008-08-11 |
IL178671A0 (en) | 2007-02-11 |
AU2005241157B8 (en) | 2008-11-06 |
ATE458225T1 (de) | 2010-03-15 |
RU2351006C2 (ru) | 2009-03-27 |
CN100583085C (zh) | 2010-01-20 |
CA2564970C (en) | 2012-02-07 |
KR20070015174A (ko) | 2007-02-01 |
NO337309B1 (no) | 2016-03-07 |
EP1741039B1 (de) | 2010-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7574313B2 (en) | Information signal processing by modification in the spectral/modulation spectral range representation | |
Rao et al. | Digital signal processing: Theory and practice | |
DE69821089T2 (de) | Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation | |
RU2665298C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
KR101303776B1 (ko) | 효율적인 조합 고조파 변조 방법 | |
JP5523589B2 (ja) | カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 | |
EP2265040B1 (de) | Erweiterte Verarbeitung auf der Basis einer mit komplexer Exponentialfunktion modulierten Filterbank und adaptive Zeitsignalisierungsverfahren | |
Coulson | A generalization of nonuniform bandpass sampling | |
RU2596033C2 (ru) | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере | |
CN105141283A (zh) | 低延迟调制滤波器组 | |
AU597177B2 (en) | Secret speech equipment | |
US20230051509A1 (en) | Method and system for implementing a modal processor | |
JP2004336703A (ja) | デジタル信号のアナログ再構成 | |
Argenti et al. | Design of pseudo-QMF banks with rational sampling factors using several prototype filters | |
AU641473B2 (en) | Communication apparatus for speech signal | |
HK1097326B (en) | Information signal processing by carrying out modification in the spectral/modulation spectral region representation | |
Schuller | Filter banks and audio coding: compressing audio signals using python | |
RU2813317C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
Xiong et al. | A nonuniform modulated complex lapped transform | |
RU2789688C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
RU2800676C1 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
RU2772356C2 (ru) | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов | |
Cruz-Roldán et al. | Pseudo-QMF bank design with controlled in-band aliasing | |
Isen | Sampling and Binary Representation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PE | Patent expired |
Effective date: 20250321 |