[go: up one dir, main page]

DE10000934C1 - Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals - Google Patents

Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals

Info

Publication number
DE10000934C1
DE10000934C1 DE10000934A DE10000934A DE10000934C1 DE 10000934 C1 DE10000934 C1 DE 10000934C1 DE 10000934 A DE10000934 A DE 10000934A DE 10000934 A DE10000934 A DE 10000934A DE 10000934 C1 DE10000934 C1 DE 10000934C1
Authority
DE
Germany
Prior art keywords
signal
coding
decoded signal
coding block
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE10000934A
Other languages
English (en)
Inventor
Juergen Herre
Karlheinz Brandenburg
Thomas Sporer
Michael Schug
Wolfgang Schildbach
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority to DE10000934A priority Critical patent/DE10000934C1/de
Priority to PCT/EP2001/000241 priority patent/WO2001052240A1/de
Priority to DE50100332T priority patent/DE50100332D1/de
Priority to EP01900416A priority patent/EP1247275B1/de
Priority to AT01900416T priority patent/ATE243877T1/de
Priority to US10/168,456 priority patent/US6750789B2/en
Application granted granted Critical
Publication of DE10000934C1 publication Critical patent/DE10000934C1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Bei der Bestimmung eines Codierungs-Blockrasters, das einem decodierten Signal zugrunde liegt, wird zunächst ein Abschnitt des decodierten Signals herausgegriffen, welcher bei einer bestimmten Ausgangs-Ausgangs-Abtastwert des decodierten Signals beginnt. Hierauf wird der Abschnitt in eine spektrale Darstellung umgesetzt, um die spektrale Darstellung dann hinsichtlich eines vorbestimmten Kriteriums zu bewerten, um ein Bewertungsresultat für den Abschnitt zu erhalten. Dieses Prozedure wird für eine Mehrzahl unterschiedlicher Abschnitte, die bei jeweils unterschiedlichen Ausgangs-Abtastwerten beginnen, wiederholt, um eine Mehrzahl von Bewertungsresultaten zu erhalten. Die Mehrzahl der Bewertungsresultate wird schließlich durchsucht, um das Bewertungsresultat zu ermitteln, das bezüglich der anderen Bewertungsresultate einen extremen Wert hat, derart, daß dann davon ausgegangen werden kann, daß der Abschnitt, dem dieses Bewertungsresultat zugeordnet ist, mit dem Codierungs-Blockraster in Einklang ist, das dem decodierten Signal zugrunde liegt. Erfindungsgemäß kann somit für jedes beliebige decodierte Signal, das keinen expliziten Inforamtionen über sein Codierungs-Blockraster hat, das Codierungs-Blockraster ermittelt werden.

Description

Die vorliegende Erfindung bezieht sich allgemein auf die Analyse von auf irgendeine Art codierten und wieder deco­ dierten Signalen und insbesondere auf das Analysieren eines decodierten Signals, das unter Verwendung eines Codieral­ gorithmus verarbeitet worden ist, der auf einer spektralen Darstellung des ursprünglichen Signals aufbaut.
Es ist allgemein bekannt, Audio- und/oder Videosignale unter Verwendung eines bestimmten Codierverfahrens zu codieren, um eine codierte Version des ursprünglichen Signals zu erhal­ ten, wobei sich die codierte Version des ursprünglichen Si­ gnals grundsätzlich dahingehend von dem ursprünglichen Si­ gnal unterscheiden sollte, daß die Datenmenge des codierten Signals kleiner als die Datenmenge des ursprünglichen Si­ gnals ist. In einem solchen Fall wird der Codieralgorithmus, um aus dem ursprünglichen Signal das codierte Signal zu er­ halten, und auch der Decodieralgorithmus, der im wesentli­ chen eine Umkehrung des Codieralgorithmus ist, als datenre­ duzierender Codieralgorithmus bezeichnet.
Zur Datenreduktion von Audiosignalen existieren verschiedene Codieralgorithmen, welche Gegenstand einer Reihe von inter­ nationalen Standards sind, wie z. B. MPEG-1, MPEG-2, MPEG-4 oder auch MPEG-2 AAC (AAC = Advanced Audio Coding), wobei der letztgenannte Codieralgorithmus beispielsweise in dem internationalen Standard ISO/IEC 13818-7 detailliert be­ schrieben ist.
Im nachfolgenden wird auf Fig. 7 Bezug genommen, welche ein Blockschaltbild eines MPEG-Audiocodierverfahrens zeigt. Ein solcher Audiocodierer umfaßt typischerweise einen Audioein­ gang 70, an dem ein Strom von zeitdiskreten Abtastwerten eingespeist wird, welche beispielsweise PCM-Abtastwerte sind, welche beispielsweise 16-Bit-breit sind. In einer Ana­ lysefilterbank 71 wird der Strom von zeitdiskreten Audio-Ab­ tastwerten in Codierungsblöcke oder Frames von Abtastwerten eingeteilt, unter Verwendung einer entsprechenden Fenster­ funktion gefenstert und dann in eine spektrale Darstellung beispielsweise durch eine Filterbank oder durch eine Fou­ rier-Transformation oder eine Abart der Fourier-Transfor­ mation, wie z. B. eine modifizierte diskrete Cosinustrans­ formation (MDCT), überführt. Am Ausgang der Analysefilter­ bank 71 liegen somit aufeinanderfolgende Codierungsblöcke oder Frames von Spektralkoeffizienten vor, wobei ein Block von Spektralkoeffizienten das Spektrum eines Codierungs­ blocks von Audioabtastwerten ist. Oft wird eine 50%ige Über­ lappung aufeinanderfolgender Codierungsblöcke verwendet, so daß pro Block ein Fenster von beispielsweise 2048 Audioab­ tastwerten betrachtet wird, und durch diese Verarbeitung 1024 neue Spektralkoeffizienten erzeugt werden.
Das zeitdiskrete Audiosignal am Eingang 70 wird ferner in ein psychoakustisches Modell 72 eingespeist, um eine Daten­ reduktion zu erreichen, derart, daß bekannterweise die Mas­ kierungsschwelle des Audiosignals abhängig von der Frequenz berechnet wird, um in einem Block 73, der mit Quantisierung und Codierung bezeichnet ist, eine Quantisierung der Spek­ tralkoeffizienten durchzuführen, welche von der Maskierungs­ schwelle abhängt.
Anders ausgedrückt wird die Quantisierung der Spektralkoef­ fizienten derart grob durchgeführt, daß das hierdurch einge­ führte Quantisierungsrauschen noch unter der psychoakusti­ schen Maskierungsschwelle, die durch das psychoakustische Modell 72 berechnet wird, liegt, so daß das Quantisierungs­ rauschen idealerweise unhörbar ist. Dieses Prozedere be­ wirkt, daß typischerweise eine bestimmte Anzahl von Spek­ tralkoeffizienten, die am Ausgang der Analyse-Filterbank 71 noch ungleich 0 sind, nach dem Quantisieren zu 0 gesetzt werden, da das psychoakustische Modell 72 festgestellt hat, daß dieselben durch benachbarte Spektralkoeffizienten mas­ kiert werden und deshalb unhörbar sind.
Auch unabhängig von einem psychoakustischen oder psychoopti­ schen Modell existiert bei jedem Quantisierer eine bestimmte Quantisierungsschrittweite, wobei Spektralwerte, die kleiner als die Schrittweite sind, durch die Quantisierung zu Null gesetzt werden. Abhängig vom Quantisierer gibt es auch die Möglichkeit, daß lediglich Werte, die deutlich kleiner als die Schrittweite sind, zu Null gesetzt werden, und Werte, die knapp unter der Schrittweite sind, aufgerundet werden. In den allermeisten Fällen setzt jeder Quantisierer zumin­ dest einige Werte zu Null, wodurch bereits eine Datenre­ duktion erzielt wird.
Nach dem Quantisieren liegt eine spektrale Darstellung des Codierungsblocks von zeitdiskreten Abtastwerten vor, in der das Quantisierungsrauschen möglichst unterhalb der psycho­ akustischen Maskierungsschwelle liegt. Diese datenreduzie­ rend quantisierten Spektralwerte können anschließend ab­ hängig vom verwendeten Codierer unter Verwendung einer En­ tropie-Codierung, welche z. B. eine Huffman-Codierung sein kann, verlustlos codiert werden. Dadurch wird ein Strom von Codewörtern erhalten, dem in einem Bitstrommultiplexer 74 noch von einem Decodierer benötigte Seiteninformationen hinzugefügt werden, wie z. B. Informationen bezüglich der Analyse-Filterbank, Informationen bezüglich der Quanti­ sierung, wie z. B. Skalenfaktoren, oder aber Seiteninforma­ tionen bezüglich weiterer Funktionsblöcke. Solche weiteren Funktionsblöcke sind bei MPEG-2-AAC beispielsweise die TNS-Verarbeitung, die Intensity-Stereo-Verarbeitung, die Mitte/Seite-Stereoverarbeitung, oder aber eine Prädiktion von Spektrum zu Spektrum.
An einem Ausgang 75 des Codierers, der auch als Bitstromaus­ gang bezeichnet wird, liegt dann das gemäß dem in Fig. 7 ge­ zeigten Codieralgorithmus codierte Signal blockweise vor.
Im Falle des Decodierers wird das codierte Signal am Ausgang 75 des in Fig. 7 gezeigten Codierers in einen Bitstromein­ gang 80 eines in Fig. 8 gezeigten Decodierers eingespeist, welcher zunächst in einem Block 81, der als Bitstrom-Demul­ tiplexer bezeichnet ist, eine Bitstrom-Demultiplex-Operation durchführt, um die Spektraldaten von den Seiteninformationen zu trennen. Am Ausgang des Blocks 81 liegen dann wieder die Codewörter vor, welche die einzelnen Spektralkoeffizienten darstellen. Unter Verwendung einer entsprechenden Tabelle werden die Codewörter decodiert, um quantisierte Spektral­ werte zu erhalten. Diese quantisierten Spektralwerte werden dann in einem Block 82, der mit "Inverse Quantisierung" bezeichnet ist, verarbeitet, um die im Block 73 (Fig. 7) eingeführte Quantisierung rückzurechnen. Am Ausgang des Blocks 82 liegen dann wieder dequantisierte Spektralkoeffi­ zienten vor, welche nun mittels einer Synthesefilterbank 83, die invers zur Analysefilterbank 71 (Fig. 7) arbeitet, in den Zeitbereich überführt werden, um an einem Audioausgang 84 das decodierte Signal zu erhalten.
Bei der Betrachtung des Codier/Decodier-Konzepts, das in den Fig. 7 und 8 dargestellt ist, wird deutlich, daß es sich hier um ein blockorientiertes Verfahren handelt, wobei die Blockerzeugung durch den Analyse-Filterbank-Block 71 von Fig. 7 bewirkt wird, und wobei die Blockbildung erst am Audioausgang 84 des in Fig. 8 gezeigten Decodierers wieder aufgehoben wird.
Es wird ferner deutlich, daß es sich hier um ein verlustbe­ haftetes Codiererkonzept handelt, da das am Audioausgang 84 vorliegende decodierte Signal generell weniger Informationen beinhaltet als das am Audioeingang 70 vorliegende ursprüng­ liche Signal. Durch den durch das psychoakustische Modell 72 gesteuerten Quantisierer 73 werden Informationen aus dem am Audioeingang 70 vorliegenden ursprünglichen Signal entfernt, die im Decodierer nicht mehr wieder hinzugefügt werden, son­ dern auf die verzichtet wird. Rein subjektiv hat dieser Ver­ zicht auf Informationen jedoch aufgrund des psychoakustischen Modells 72, das an die menschlichen Gehöreigenschaften angepaßt ist, im idealen Fall zu keinen Qualitätseinbußen geführt, sondern lediglich zu einer angestrebten Datenkom­ primierung.
An dieser Stelle sei darauf hingewiesen, daß das in Fig. 7 und Fig. 8 am Beispiel eines Audiosignals beschriebene Co­ diererkonzept entsprechend auch auf Bild- oder Videosignale angewendet wird, wobei anstelle des zeitlichen Audiosignals ein Videosignal vorhanden ist, wobei die spektrale Darstel­ lung hier kein Tonspektrum ist, sondern ein Ortsspektrum. Ansonsten findet auch bei der Videosignalkomprimierung eine Analysefilterbank, ein psychooptisches Modell, eine dadurch gesteuerte Quantisierung und Redundanz-Codierung statt, wo­ bei ebenfalls das ganze Codier/Decodier-Konzept blockweise abläuft.
Das decodierte Signal (am Beispiel von Fig. 8 das decodierte Audiosignal am Audioausgang 84) ist typischerweise wieder ein Strom von zeitdiskreten Abtastwerten, denen ein Codie­ rungs-Blockraster zugrunde liegt, das im decodierten Signal jedoch generell nicht sichtbar ist, es sei denn, daß beson­ dere Vorkehrungen getroffen werden.
Während der Vorgang der Decodierung der Normalfall in der Anwendung, nämlich der Übertragung und Speicherung von Audio- und/oder Bildsignalen, ist, gibt es dennoch Fälle, in denen es von Interesse ist, ein gegebenes decodiertes Signal in eine Bitstromdarstellung "zurück zu übersetzen". Dies ist insbesondere in den folgenden Fällen von Interesse, wenn nur das decodierte Signal zur Verfügung steht.
Weiterhin besteht oftmals der Bedarf, Codiersysteme anhand der von ihnen codierten und wieder decodierten Signale zu untersuchen, beispielsweise um herauszufinden, warum ein Co­ dierer, der noch unbekannt ist, so gut klingt.
Darüberhinaus besteht ein Bedarf auf dem Bereich des Urheberrechtsschutzes, zweifelsfrei nachzuweisen, daß ein Mu­ sikstück oder ein Bild mit einem bestimmten Codierer ur­ sprünglich codiert worden ist.
Schließlich besteht im Bereich der Übertragung beispiels­ weise über mehrere Netze mit unterschiedlicher Bandbreite der Bedarf, ein decodiertes Signal wieder zu codieren, um es beispielsweise auf eine andere Bandbreite umzusetzen. In diesem Fall wird das in Fig. 7 und Fig. 8 gezeigte Codie­ rer/Decodierer-Konzept nacheinander mehrmals auf ein ur­ sprüngliches Audiosignal ausgeübt. Hier bestehen Probleme dahingehend, daß sogenannte Tandem-Codierverzerrungen nach­ folgender Codecstufen eingebracht werden, wenn die nachfol­ genden Codecstufen auf der Basis eines anderen Codierungs- Blockrasters als die vorausgehenden Codecstufen arbeiten. Es ist einsichtig, daß die Verwendung eines anderen Codie­ rungs-Blockrasters in einer nachfolgenden Codecstufe hörbare Verzerrungen in das Audiosignal einführt, wenn die Codie­ rungsblockbildung nicht genauso durchgeführt worden ist wie in der ersten Codec-Stufe, da das Konzept auf der Bildung von Kurzzeitspektren basiert und da insbesondere die psycho­ akustische Maskierungsschwelle eines Codierungsblocks von zeitdiskreten Abtastwerten von dem Codierungs-Blockraster abhängt.
In der Fachveröffentlichung "NMR Measurements on Multiple Generations Audio Coding", Michael Keyhl, Jürgen Herre, Christian Schmidmer, 96. AES-Versammlung, 26. Februar bis 1. März 1994, Amsterdam, Preprint 3803, wird vorgeschlagen, zur Überwindung der Tandem-Codierverzerrungen eine Identifikati­ onsmarkierung in ein decodiertes Signal einzubringen, auf die nachfolgende Codierer-Stufen zugreifen können, um auf der Basis diese Identifikationsmarkierung ihre Codierungs­ block-Einteilung des erneut zu codierenden decodierten Signals durchzuführen, derart, daß alle Codec-Stufen in ei­ ner Kette von Codec-Stufen dasselbe Codierungs-Blockraster verwenden.
Obwohl dieses Verfahren die Tandem-Codierverzerrungen be­ deutsam reduziert hat, ist es doch dahingehend nachteilig, daß die Identifikationsmarkierung durch einen Decodierer eingebracht werden muß und von einem nachfolgenden Codierer wieder extrahiert und interpretiert werden muß. Es sind also Änderungen sowohl an einem Decodierer als auch an einem Codierer erforderlich. Weiterhin ist dieses Konzept selbst­ verständlich nur für eine Tandem-Codierung von decodierten Signalen anwendbar, die diese Identifikationsmarkierung für das Codierungs-Blockraster haben. Für Signale, die diese Identifikationsmarkierung nicht haben, kann eine Codecstufe in einer Kette von Codecstufen selbstverständlich nicht auf eine Identifikationsmarkierung zugreifen.
Ähnliche Probleme bzw. Einschränkungen der Flexibilität er­ geben sich auch bei dem MOLE-Konzept, das in "ISO/MPEG Layer 2 - Optimum re-Encoding of Decoded Audio using a MOLE-Si­ gnal", John Fletcher, 104te AES-Convention, 16. bis 19. Mai 1998, Preprint Nr. 4706, beschrieben ist. Allgemein gesagt werden zusätzliche Daten in das decodierte Audiosignal ein­ gebracht, die detailliert beschreiben, auf welche Art das vorliegende decodierte Audiosignal codiert und decodiert worden ist. Diese Daten werden als MOLE-Signal bezeichnet. Wenn das decodierte Audiosignal wieder codiert werden muß, wird ein speziell ausgeführter Codierer dieses MOLE-Signal aus dem zu codierenden Signal extrahieren und auf der Basis dieses Signals die einzelnen Codiererschritte durchführen.
Ähnlich zu dem Konzept der Identifikationsmarkierung besteht auch hier ein Nachteil darin, daß der Decodierer, der ein codiertes ursprüngliches Signal zum ersten Mal decodiert, das Signal in das decodierte Audiosignal einbringen muß. Ein solcher Decodierer unterscheidet sich somit von den üblichen Standard-Decodierern. Des weiteren muß ein Codierer, der ein decodiertes Signal wieder codiert, das Bestimmungssignal ex­ trahieren um dementsprechend zu arbeiten. Dieser gewisser­ maßen zweite Codierer muß ebenfalls modifiziert werden, der­ art, daß er das Bestimmungssignal lesen und interpretieren kann. Schließlich ist auch dieses Konzept nachteilhafter­ weise nur für decodierte Signale wirksam, die ein solches Bestimmungssignal haben, jedoch nicht für Signale, die kein solches Bestimmungssignal haben.
Sowohl die Identifikationsmarkierung als auch das MOLE-Be­ stimmungssignal geben Informationen darüber, welches Codie­ rungs-Blockraster dem decodierten Signal, dem die Identifi­ kationsmarkierung oder das MOLE-Bestimmungssignal zugeordnet ist, zugrunde liegt. Diese Signale müssen jedoch explizit eingebracht werden, was die im vorhergehenden beschriebenen Flexibilitätsnachteile mit sich bringt.
Die WO 99/04572 A1 offenbart eine Vorrichtung zum Ermitteln, welches von mehreren möglichen sendeseitigen Codierungssystemen ursprünglich angewandt wurde. Damit wird verhindert, daß sich Codierungsrauschen von einem Codiersystem zum nächsten Codier­ system ausbreitet. Ein Eingangssignal wird durch zwei unter­ schiedliche Codierer codiert und wieder decodiert, wobei das decodierte Signal mit dem ursprünglichen Eingangssignal ver­ glichen wird. Der Codierer, dessen codiertes und wieder deco­ diertes Signal am ehesten dem ursprünglichen Eingangssignal entspricht, wird als Codierer ausgewählt.
Die Aufgabe der vorliegenden Erfindung besteht darin, eine Vorrichtung und ein Verfahren zum Bestimmen eines Codie­ rungs-Blockrasters, das einem decodierten Signal zugrunde liegt, für ein decodiertes Signal zu schaffen, das keinen expliziten Hinweis auf ein Codierungs-Blockraster hat.
Diese Aufgabe wird durch eine Vorrichtung zum Bestimmen ei­ nes Codierungs-Blockrasters nach Patentanspruch 1 oder durch ein Verfahren zum Bestimmen eines Codierungs-Blockrasters nach Patentanspruch 11 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß das Codierungs-Blockraster, das durch einen Block­ orientierten Codierer praktisch zufällig festgelegt wird, entscheidenden Einfluß auf die spektrale Darstellung des Si­ gnals hat. Bereits minimale Abweichungen oder Codierungs- Blockraster-Offsets führen dazu, daß die spektrale Darstel­ lung des decodierten Signals ein gänzlich anderes Erschei­ nungsbild hat als eigentlich von einer Spektraldarstellung des decodierten Signals erwartet werden würde, wenn demsel­ ben das gleiche Codierungs-Blockraster zugrunde gelegt wird, das dem decodierten Signal an sich zugrunde liegt. Bei da­ tenreduzierenden Codieralgorithmen, welche unter Verwendung eines psychoakustischen Modells oder eines psychooptischen Modells arbeiten, ist von vorneherein bekannt, daß aufgrund der Quantisierung unter Verwendung einer psychooptischen oder psychoakustischen Maskierungsschwelle eine bestimmte Anzahl von Spektralkoeffizienten 0 ist.
Es wird darauf hingewiesen, daß auch unabhängig von einer Quantisierung, die durch ein psychoakustisches oder psycho­ optisches Modell gesteuert wird, üblicherweise immer be­ stimmte Werte zu Null gesetzt werden, nämlich die Werte, die wesentlich kleiner als die Quantisierungsschrittweite sind.
Wenn jedoch die Codierungs-Blockrastereinteilung zum Er­ zeugen einer Spektraldarstellung des decodierten Signals nicht mit der Codierungs-Blockrastereinteilung, die dem decodierten Signal an sich zugrunde liegt, übereinstimmt, so tritt diese Eigenschaft in der spektralen Darstellung des decodierten Signals nicht mehr auf. Jedoch auch bei Codier­ konzepten, die nicht unbedingt datenreduzierend sind, oder die, obgleich sie datenreduzierend wären, jedoch aufgrund des Eingangssignals keinen entscheidenden Datenreduzie­ rungseffekt haben, führt ein Codierungs-Blockraster-Versatz bereits dazu, daß das Spektrum des decodierten Signals, das auf einer anderen Codierungs-Blockrastereinteilung basiert als die Codierungs-Blockrastereinteilung, die dem decodier­ ten Signal zugrunde liegt. Dies resultiert in einer verän­ derten spektralen Struktur, die ein stark "verschmiertes" Aussehen hat, was sich insbesondere darin äußert, daß die einzelnen Spektralanteile nicht mehr gut voneinander ge­ trennt werden können.
Diese Charakteristik des Spektrums kann als Kriterium ver­ wendet werden, um herauszufinden, ob ein Codierungs-Block­ raster-Versatz vorliegt. Bei einem Spektrum mit Rasterver­ satz ist die Schwankung der z. B. logarithmischen Amplitude des Spektralkoeffizienten langsamer bzw. weniger abrupt als bei einem Spektrum ohne Rasterversatz, bei dem eine schnelle bzw. stark abrupte Schwankung der Amplitude der Spektralko­ effizienten feststellbar ist.
Allgemein gesagt hat ein Kurzzeitspektrum des decodierten Signals, das unter Verwendung einer Codierungs-Blockraster­ einteilung erzeugt wird, welche der Codierungs-Blockraster­ einteilung entspricht, die dem decodierten Signal zugrunde liegt, ein bestimmtes Aussehen, beispielsweise bezüglich der Separation der Spektrallinien, bezüglich der Anzahl der Spektrallinien, die gleich 0 sind bzw. die sehr klein sind, etc.
Erfindungsgemäß wird daher zum Bestimmen eines Codierungs- Blockrasters ein Abschnitt des decodierten Signals herausge­ griffen, woraufhin der herausgegriffene Abschnitt in eine spektrale Darstellung desselben umgesetzt wird. Anschließend wird die spektrale Darstellung des herausgegriffenen Ab­ schnitts hinsichtlich zumindest eines vorbestimmten Krite­ riums untersucht, um ein Bewertungsresultat für den Ab­ schnitt zu erhalten. Dieses Konzept wird für verschiedene Abschnitte durchgeführt, wobei immer ein anderes Codie­ rungs-Blockraster zugrunde gelegt wird, so daß sich ver­ schiedene Bewertungsresultate für verschiedene Codierungs- Blockrastereinteilungen und damit Codierungs-Blockraster- Offsets ergeben. Ein Codierungs-Blockraster-Offset, der dem vorbestimmten Kriterium am besten entspricht, d. h. der ein Bewertungsresultat hat, das bezüglich der anderen Bewer­ tungsresultate extrem ist, wird dann unter den Bewertungs­ resultaten, die durch Bewerten der spektralen Darstellungen der verschieden herausgegriffenen Abschnitte erzeugt worden sind, ermittelt und ausgegeben. Damit ist die Codierungs- Blockrastereinteilung, die einem decodierten Signal zugrunde liegt, ohne Verwendung eines explizit im decodierten Signal enthaltenen Hilfssignals eindeutig rekonstruierbar.
Dieses Konzept erlaubt es grundsätzlich, von jedem decodier­ ten Signal das demselben zugrunde liegende Codierungs-Block­ raster zu ermitteln und liefert somit eine erhebliche Flexi­ bilität dahingehend, daß sämtliche decodierten Signale bear­ beitet werden können, und nicht nur decodierte Signale, die bereits eine Identifikationsmarkierung oder ein MOLE-Bestimmungssignal haben. Damit können nahezu beliebig deco­ dierte Signale analysiert werden, um eine verzerrungsfreie Tandem-Codierung durchzuführen, um weitere Informationen bezüglich des dem decodierten Signal zugrunde liegenden Codiereralgorithmus zu erhalten, oder um überhaupt nachzu­ weisen, mit welchem Codierer das decodierte Signal ursprüng­ lich codiert worden ist.
Vorzugsweise kann das erfindungsgemäß bestimmte Codierungs- Blockraster, das dem decodierten Signal zugrunde liegt, in das decodierte Signal selbst eingetragen werden, um somit beliebige decodierte Signale für bestehende Codec-Stufen anzupassen, welche auf der Identifikationsmarkierung oder dem MOLE-Bestimmungssignal aufbauen.
Weiterhin erlaubt das erfindungsgemäße Konzept die Er­ schließung nahezu aller Codierparameter, zumal ausgehend von der Kenntnis des Codierungs-Blockrasters und unter Verwen­ dung entsprechender Iterationsalgorithmen praktisch alle Codiererfunktionalitäten gewissermaßen "zurückgerechnet" werden können. Voraussetzung hierfür ist jedoch die Bestim­ mung des Codierungs-Blockrasters an sich, da das Codie­ rungs-Blockraster alle nachfolgenden Parameter eines Codier­ algorithmus beeinflußt, der auf der spektralen Darstellung eines zu codierenden Signals basiert. Die Bestimmung des Codierungs-Blockrasters ist somit gewissermaßen das "Ein­ gangstor", um ein decodiertes Signal dahingehend vollständig zu analysieren, welches Codier/Decodier-Konzept demselben zugrunde liegt.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Figuren detailliert beschrieben. Es zeigen:
Fig. 1 ein Blockschaltbild einer erfindungsgemäßen Vor­ richtung zum Bestimmen eines Codierungs-Block­ rasters;
Fig. 2 ein Flußdiagramm eines erfindungsgemäßen Verfahrens zum Bestimmen eines Codierungs-Blockrasters;
Fig. 3 eine Prinzipdarstellung eines decodierten Signals zur Veranschaulichung verschiedener Codierungs- Blockraster-Versätze;
Fig. 4 eine spektrale Darstellung eines Abschnitts des de­ codierten Signals mit einem Rasterversatz von einem Abtastwert nach links;
Fig. 5 eine spektrale Darstellung eines Abschnitts des de­ codierten Signals ohne Rasterversatz;
Fig. 6 eine spektrale Darstellung eines Abschnitts des de­ codierten Signals mit einem Rasterversatz von einem Abtastwert nach rechts;
Fig. 7 ein Blockschaltbild eines bekannten Codierers, der auf der Basis einer spektralen Darstellung eines ursprünglichen Signals arbeitet;
Fig. 8 ein Blockschaltbild eines bekannten Decodierers zum Decodieren von durch den in Fig. 7 gezeigten Codie­ rer codierten Signalen; und
Fig. 9 eine beispielhafte Fenstersequenz mit einem Über­ lappungsgrad von 50%.
Fig. 1 zeigt ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Bestimmen eines Codierungs-Blockrasters, das einem decodierten Signal zugrunde liegt. Das decodierte Signal wird an einem Eingang 10 in die erfindungsgemäße Vorrichtung eingespeist und gelangt in eine Einrichtung 11 zum Herausgreifen eines Abschnitts aus dem decodierten Signal. Der durch die Einrichtung 11 herausgegriffene Abschnitt wird in einer Einrichtung 12 in eine spektrale Darstellung desselben umgesetzt. Die spektrale Darstellung des herausgegriffenen Abschnitts wird dann in einer Einrichtung 13 hinsichtlich eines vorbestimmten Kriteriums bewertet, um ein Bewertungsresultat für den herausgegrif­ fenen Abschnitt zu erhalten. Das Bewertungsresultat wird dann in eine Einrichtung 14 zum Durchsuchen und Ausgeben einer Mehrzahl von Bewertungsresultaten eingegeben, um an einem Ausgang 15 der erfindungsgemäßen Vorrichtung das dem decodierten Signal am Eingang 10 der erfindungsgemäßen Vorrichtung zugrunde liegende Codierungs-Blockraster auszu­ geben. Die Vorrichtung, die in Fig. 1 gezeigt ist, arbeitet iterativ, derart, daß die Einrichtung 11 zum Herausgreifen abhängig von einem Abschnitt-Steuerungssignal 16 einen Abschnitt des decodierten Signals herausgreifen kann, der sich von einem vorher herausgegriffenen Abschnitt unter­ scheidet. Die erfindungsgemäße Vorrichtung zum Bestimmen eines Codierungs-Blockrasters ist somit angeordnet, um eine Mehrzahl von Abschnitten des decodierten Signals, die bei verschiedenen Ausgangs-Abtastwerten beginnen, herauszu­ greifen, umzusetzen und zu bestimmen, um eine Mehrzahl von Bewertungsresultaten zu erhalten. Aus dieser Mehrzahl von Bewertungsresultaten ermittelt dann die Einrichtung 14 den herausgegriffenen Abschnitt, der dem Kriterium, das dem Bewerten zugrunde liegt, am besten entspricht, bzw. der abhängig vom Kriterium demselben am wenigsten entspricht, um einen Hinweis auf das Codierungs-Blockraster zu geben.
Im nachfolgenden wird auf Fig. 3 Bezug genommen, um die Struktur eines decodierten Signals am Eingang 10 der in Fig. 1 gezeigten erfindungsgemäßen Vorrichtung und die verschie­ denen Codierungs-Blockraster-Versätze darzustellen. Das decodierte Signal besteht generell aus einer Folge 30 von zeitdiskreten Abtastwerten, die beispielsweise der in Fig. 8 gezeigte Decodierer an seinem Audioausgang 84 erzeugt hat. Insbesondere besteht die Folge 30 von zeitdiskreten Abtastwerten des decodierten Signals aus Abtastwerten 31a, 31b, 31c, 31d, . . . . In Fig. 3 ist ferner fett umrandet ein Codierungsblock 32 von Abtastwerten eingezeichnet, welcher die Codierungs-Blockrastereinteilung definiert, die dem decodierten Signal 30 ursprünglich zugrunde liegt. Fig. 3 stellt den Fall dar, daß keine Überlappung verwendet wird, während Fig. 9, auf die weiter unten eingegangen wird, eine Fenstersequenz darstellt, die eine Überlappung von 50% verwendet.
Das Codierungs-Blockraster ist im Sinne der vorliegenden Beschreibung derart definiert, daß ein Codierungsblock die Abtastwerte umfaßt, die durch eine Analyse-Fensterung aus dem Strom von zeitlichen Abtastwerten herausgegriffen werden. Die Anzahl der Abtastwerte in einem Codierungsblock entspricht somit der Anzahl von Abtastwerten, die beim Fenstern verwendet werden, oder anders ausgedrückt, der Fensterlänge. Da in Fig. 3 keine Überlappung der zeitlichen Fenster vorliegt, endet vor dem in Fig. 3 beispielhaft eingezeichneten Codierungsblock 32 ein vorheriger Codie­ rungsblock und beginnt am Ende des Codierungsblocks 32 ein nachfolgender Codierungsblock.
Fig. 9 zeigt dagegen eine Fenstersequenz, bei der eine Über­ lappung von 50% verwendet wird. Eine solche Fenstersequenz kann bei MPEG-2 AAC auftreten. Entlang der Abszisse von Fig. 9 ist die Nummer eines diskreten Abtastwerts in einem Strom von Abtastwerten aufgetragen. Entlang der Ordinate in Fig. 9 ist die relative Größe des Fensters aufgetragen, d. h. der Faktor, mit dem ein Abtastwert beim Fenstern gewichtet wird.
Die Fenstersequenz in Fig. 9 umfaßt ein "langes" Fenster 90, ein sog. Start-Fenster 92, eine Folge von acht "kurzen" Fenstern 94, ein Stopp-Fenster 96 und wieder ein langes Fenster 98.
Beim Standard MPEG-2-AAC kann ein Codierer, um stark transiente Zeitsignale besser codieren zu können, von einem langen Fenster auf eine Folge von acht kurzen Fenster umschalten. Die Fenstersequenz in Fig. 9 ist somit dafür geeignet, transiente Zeitsignale zwischen Abtastwert-Nr. 2560 und Abtastwert-Nr. 3584 zu verarbeiten.
Bei dem in Fig. 9 dargestellten Fall umfaßt ein langes Fenster 2048 Abtastwerte, während ein kurzes Fenster 256 Abtastwerte umfaßt. Die acht kurzen Fenster 94 umfassen genauso viel Abtastwerte wie ein langes Fenster 90 oder 98. Darüberhinaus sind das Start-Fenster 92 und das Stopp- Fenster 96 derart gewählt, daß nach einem Übergang der Fen­ sterung mit langen Fenstern zu einer Fensterung mit kurzen Fenstern und nach einem entgegengesetzten Übergang wieder zurück zum Fenstern mit langen Fenstern das Codierungs- Blockraster von n . (1024 Abtastwerte) beibehalten wird. Das Codierungs-Blockraster ist hier also durch ein langes Fen­ ster definiert, d. h. durch die Anzahl von Abtastwerten, die ein langes Fenster umfaßt.
Bei einer Überlappung von 50% umfaßt im Falle einer Sequenz von langen Fenstern jedes neue Fenster 50% der Abtastwerte, die durch das vorherige Fenster gefenstert wurden, und 50% "neu" herausgegriffene Abtastwerte. Wird eine höhere Über­ lappung als 50% verwendet, so sinkt damit die Anzahl der "neu" herausgegriffenen Abtastwerte in einem Codierungs­ block, während die Anzahl der "alten" Abtastwerte ansteigt. Die Gesamtanzahl der Abtastwerte pro Codierungsblock bleibt hingegen gleich.
Die erfindungsgemäße Vorrichtung zum Bestimmen eines Codie­ rungs-Blockrasters muß somit lediglich einen einzigen Codie­ rungsblock des decodierten Signals ermitteln, da das Codie­ rungs-Blockraster üblicherweise in einem Signal fest ist und, auch wenn kurze Fenster verwendet werden, sich nicht generell ändert.
In Fig. 3 sind ferner drei mögliche Ansteuerungen der Ein­ richtung 11 (Fig. 1) zum Herausgreifen eingezeichnet, näm­ lich eine erste Alternative 33 mit einem Versatz von einem Abtastwert nach links, d. h. einem Versatz von -1, eine zweite Alternative 34 mit einem Versatz von 0 und eine drit­ te Alternative 35 mit einem Versatz von einem Abtastwert nach rechts, d. h. mit einem Versatz von +1.
Im nachfolgenden wird auf Fig. 2 eingegangen, welche ein Flußdiagramm des erfindungsgemäßen Verfahrens liefert. Zu­ nächst wird über die Steuerleitung 16 (Fig. 1) ein erster Versatz der Einrichtung 11 zum Herausgreifen mitgeteilt, d. h. ein erster Offset wird gesetzt (Schritt 20). Daran an­ schließend wird dieser durch den ersten Offset bestimmte Ab­ schnitt, welcher bei einem Ausgangs-Abtastwert des decodier­ ten Signals beginnt, durch die Einrichtung 12 in seine spek­ trale Darstellung umgesetzt, d. h. es wird eine Spektralana­ lyse dieses Abschnitts mit diesem Offset durchgeführt (Schritt 21). Hierauf wird die spektrale Darstellung am Aus­ gang der Einrichtung 12 (Fig. 1) in der Einrichtung 13 (Fig. 1) bewertet, d. h. es wird eine Bewertung des Spektrums durchgeführt, um ein Bewertungsresultat zu erhalten (Sehritt 22). Dann wird in einem Schritt 23 ermittelt, ob alle ge­ wünschten Offsets bereits durchfahren worden sind, d. h. ob der Suchbereich durchlaufen ist. Ist dies nicht der Fall, d. h. liefert die Entscheidung im Schritt 23 ein "Nein", so wird in einem Schritt 24 über die Steuerleitung 16 der Ein­ richtung 11 zum Herausgreifen ein neuer Offset mitgeteilt, damit die Iterationsschleife mit diesem neuen Offset erneut durchlaufen werden kann. Ist der Suchbereich dann durch­ laufen, d. h. liefert die Entscheidung im Schritt 23 ein "Ja", so werden die verschiedenen Bewertungsresultate durch­ sucht, und es wird das Bewertungsresultat ermittelt, das bezüglich der anderen Bewertungsresultate je nach Kriterium entweder maximal oder minimal ist, um dann eine Identifika­ tion des dem decodierten Signal zugrunde liegenden Codierungs-Blockrasters auf der Basis des Abschnitts, der das günstigste Bewertungsresultat hatte, in einem Schritt 25 auszugeben.
Im nachfolgenden wird auf die Fig. 4 bis 6 Bezug genom­ men, um das durch die Einrichtung 13 durchgeführte Bewerten bzw. den Schritt 22 von Fig. 2 näher zu erläutern. In den Fig. 4 bis 6 ist entlang der Abszisse die Koeffizientennummer aufgetragen. Die Fig. 4 bis 6 zeigen somit graphische Darstellungen von Spektren, wenn die Koeffizientennummer mit der Bandbreite eines Spektralkoeffizienten multipliziert wird. Entlang der Ordinate der in Fig. 4 bis Fig. 6 gezeig­ ten graphischen Darstellungen ist der absolute Betrag der Spektralkoeffizienten in logarithmischer Darstellung aufgetragen.
Insbesondere zeigt Fig. 4 die spektrale Darstellung eines herausgegriffenen Abschnitts mit einem Versatz von minus einem Abtastwert, was der Alternative 33 von Fig. 3 ent­ spricht. Es ist ein deutlich verschmiertes Spektrum zu er­ kennen, in dem keine sauber definierten Spektralkoeffizien­ ten vorliegen, und in dem ferner lediglich eine recht ge­ ringe Anzahl von Spektralkoeffizienten gleich 0 bzw. kleiner als eine vorbestimmte Schwelle sind.
Zum Vergleich ist eine spektrale Darstellung eines heraus­ gegriffenen Abschnitts dargestellt, der keinen Rasterversatz hat, d. h. Alternative 34 von Fig. 3. Es ist ein deutlich definiertes Spektrum zu erkennen, bei dem eine Vielzahl von Spektrallinien aufgrund der Quantisierung in Abhängigkeit von der psychoakustischen Maskierungsschwelle 0 bzw. sehr klein sind, und bei dem ferner alle Spektrallinien eine sau­ ber definierte Struktur haben.
In Fig. 6 schließlich ist eine spektrale Darstellung eines herausgegriffenen Abschnitts dargestellt, welcher einen Rasterversatz von plus einem Abtastwert hat, d. h. welcher der dritten Alternative 35 von Fig. 3 entspricht. Es ist deutlich zu erkennen, daß im Gegensatz zu Fig. 5 das Spek­ trum in Fig. 6 wieder stark verschmiert ist.
Im nachfolgenden wird auf verschiedene Bewertungskriterien näher eingegangen. Grundsätzlich kann als Kriterium jede Ei­ genschaft des in Fig. 5 gezeigten Spektrums verwendet wer­ den, die sich von einer Eigenschaft der in Fig. 4 und 6 ge­ zeigten Spektren unterscheidet. Am dominantesten sichtbar ist, daß bei dem in Fig. 5 gezeigten Spektrum, dem kein Ra­ sterversatz zugrunde liegt, eine große Anzahl von Spektral­ linien kleiner als z. B. 30 dB ist, d. h. etwa 70 dB unter­ halb der signifikanten Spektralkoeffizienten liegt. Anders ausgedrückt ist eine große Anzahl der Spektrallinien gleich 0 bzw. kleiner als 30 dB. Als Kriterium kann hier somit ein einfaches Abzählen der Spektrallinien gleich 0 verwendet werden, um als Bewertungsresultat die von 0 verschiedenen Spektrallinien eines herausgegriffenen Abschnitts zu verwen­ den.
Der Abschnitt mit der geringsten Anzahl von von 0 verschie­ denen Spektralwerten bzw. der größten Anzahl von Spektral­ linien gleich 0 wäre dann der Abschnitt, der von dem Aus­ gangs-Abtastwert des decodierten Signals startet (hier der Abtastwert 31c von Fig. 3), der auch der erste Abtastwert des beim Codieren des ursprünglichen Signals verwendeten Analyse-Fensters ist. Hier liegt daher kein Rasterversatz vor.
Alternativ kann als vorbestimmtes Kriterium auch eine Ent­ scheidungsschwelle verwendet werden, um als Bewertungs­ resultat entweder die Spektralwerte mit einem Betrag ober­ halb der Schwelle oder einem Betrag unterhalb der Schwelle auszugeben.
Alternativ kann ein vorbestimmtes Kriterium zum Bestimmen des korrekten Codierungs-Blockrasters auch auf der Auswer­ tung der schnellen bzw. abrupten Schwankung der z. B. loga­ rithmischen Amplitude der Spektralkoeffizienten basieren. Im Mittel wird die quadrierte Differenz zwischen zwei Spektral­ koeffizienten in den Fig. 4 und 6 (mit Rasterversatz) nie­ driger sein als in Fig. 5 (ohne Rasterversatz). Wie im ersten Beispiel kann auch hier eine Entscheidungsschwelle verwendet werden, um als Bewertungsresultat eine "Schwan­ kungsgeschwindigkeit" des Spektrums mit einem Betrag ober­ halb der Schwelle oder einem Betrag unterhalb der Schwelle auszugeben.
An dieser Stelle sei darauf hingewiesen, daß ein Spektrum, wie es in Fig. 5 gezeigt ist, nur sichtbar wird, wenn neben dem korrekten Rasterversatz auch die Parameter der Analyse­ filterbank 71 (Fig. 7) übereinstimmen. Solche Parameter sind beispielsweise der Filterbanktyp (z. B. DFT, DCT, MDCT), die Codierungs-Blocklänge und die Fensterform. Bei dem in den Fig. 4 bis 6 gezeigten Beispiel wurde beispielsweise eine Filterbank nach MPEG-2 AAC, als Fensterform ein KBD-Fenster (KBD = Kaiser-Bessel-Derived) und als Codierungs-Blocklänge ein langer Block (Only-Long-Sequence) angesetzt.
Oft liegt der Fall tatsächlich so, daß es von vornherein vom decodierten Signal bekannt ist, daß es gemäß MPEG-2 AAC co­ diert und wieder decodiert worden ist. Selbst wenn dies auch nicht bekannt ist, kann das an sich iterative Konzept gemäß der vorliegenden Erfindung, wie es in den Fig. 1 und 2 dar­ gestellt ist, ohne weiteres modifiziert werden, derart, daß auch die Einrichtung 12 zum Umsetzen in die spektrale Dar­ stellung (Fig. 1) iterativ betrieben wird, um der Umsetzung in die spektrale Darstellung unterschiedliche Umsetzungspa­ rameter zugrunde zu legen, um in einer doppelten Iterations­ schleife in Verbindung mit der Steuerung des Abschnitt, der herausgegriffen wird, neben dem Codierungs-Blockraster auch den verwendeten Codieralgorithmus zu eruieren. Es wird darauf hingewiesen, daß immer nur eine begrenzte Anzahl von Codierer-Kandidaten praktisch relevant ist, weshalb das er­ findungsgemäße Konzept auch dann in begrenzter Zeit zu einem Ergebnis kommt, wenn auch der Codierer, der das vorliegende decodierte Signal erzeugt hat, noch unbekannt ist.
Allgemein genügt, wie es bereits ausgeführt worden ist, die Ermittlung eines einzigen Codierungsblocks 32 (Fig. 3), um das gesamte Codierungs-Blockraster, das dem decodierten Signal zugrunde liegt, generell zu ermitteln. Um auch die Umschaltung von langen Codierungsblöcken auf kurze Codie­ rungsblöcke bzw. vielleicht sogar auf andere Rastereintei­ lungen nachvollziehen zu können, kann das erfindungsgemäße Verfahren dahingehend modifiziert werden, daß die Länge ei­ nes Abschnitts, welche der Einrichtung 11 zum Herausgreifen mitzuteilen ist, ebenfalls variiert wird, um das in Fig. 2 gezeigte iterative Verfahren für verschiedene Codierungs- Blocklängen zu wiederholen. Wenn kurze Fenster verwendet werden, wird dies auch den Einrichtungen 12 und 13 mitge­ teilt. Somit kann aus einigen gefundenen Rasterpunkten das gesamte Raster extrapoliert werden oder aber, wie es am Beispiel der kurzen Codierungsblöcke gezeigt wurde, sogar in seine eventuell vorhandenen Feinstrukturen aufgeschlüsselt werden.
Wurden bei der Codierung, die dem decodierten Signal zu­ grunde liegt, zusätzliche Codierungs-"Tools" verwendet, so können durch eine erweiterte Suche bzw. durch zusätzliche Berechnungen auch diese Konfigurationen bestimmt werden.
Falls bei der Erzeugung des decodierten Signals eine M/S- Stereocodierung (J. D. Johnston, A. J. Ferreira: "Sum- Difference Stereo Transform Coding", IEEE ICASSP 1992, S. 569-571), die auch als Mitte/Seite-Codierung oder als Summen/Differenz-Codierung bezeichnet wird, eingesetzt wor­ den ist, wird das oben beschriebene iterative Bestimmen des Codierungs-Blockrasters nicht auf das decodierte Signal selbst ausgeführt, sondern auf die Summe oder Differenz der Spektralwerte. Zeigt sich dann beispielsweise eine signifi­ kante Zahl von verschwindenden (Summen- und Differenz-) Spektralkoeffizienten, so wird auf eine M/S-Codierung ge­ schlossen, und eventuell folgende Rechnungen werden dann mit den Summen- und Differenz-Spektralkoeffizienten ausgeführt. Hier kann das vorbestimmte Kriterium dahingehend modifiziert werden, daß Einzelkriterien des Summen-Signals und des Dif­ ferenz-Signals auf geeignete Art miteinander gewichtet wer­ den, so daß das vorbestimmte Kriterium sowohl auf dem Sum­ men-Signal als auch auf dem Differenz-Signal aufbaut.
Falls bei der Erzeugung des decodierten Signals eine TNS- Codierung (TNS = Temporal Noise Shaping = zeitliche Rauschformung) (J. Herre, J. D. Johnston: "Enhancing the Per­ formance of Perceptual Audio Coders by Using Temporal Noise Shaping (TNS)) eingesetzt worden ist, kann das Codierungs- Blockraster anhand der "niederfrequenten" Spektralkoeffi­ zienten bestimmt werden, welche üblicherweise nicht einer TNS-Codierung unterzogen werden. Normalerweise werden Spek­ tralkoeffizienten unter 1 kHz nicht einer TNS-Codierung un­ terzogen. Dieser Wert kann jedoch selbstverständlich von Fall zu Fall variieren.
Obwohl das erfindungsgemäße Konzept zum Bestimmen eines Co­ dierungs-Blockrasters anhand eines Audio-Codierkonzepts be­ schrieben worden ist, sei darauf hingewiesen, daß dieses Konzept ebenfalls auf Videocodierer anwendbar ist. Das er­ findungsgemäße Konzept ist generell auf sämtliche Codieral­ gorithmen für sämtliche Signale anwendbar, wenn diese Co­ dieralgorithmen die Eigenschaft haben, daß sie auf einer spektralen Darstellung des zu codierenden Signals aufbauen. Immer wenn dies der Fall ist, kann für verschiedene Codie­ rungs-Blockrastereinteilungen für das decodierte Signal eine spektrale Darstellung des herausgegriffenen Abschnitts er­ zeugt werden, um dann die spektrale Darstellung hinsichtlich eines vorbestimmten Kriteriums zu bewerten.
Schließlich sei angemerkt, daß die erfindungsgemäße Vorrich­ tung zum Bestimmen eines Codierungs-Blockrasters nicht unbe­ dingt seriell arbeiten muß, derart, daß ein Bewertungsre­ sultat nach dem anderen erzeugt wird, d. h. daß über die Steuerleitungen 16 (Fig. 1) die Einrichtung 11 zum Heraus­ greifen gesteuert wird, um nach und nach immer einen bei­ spielsweise um 1 verschobenen Abschnitt herauszugreifen. Je nach Implementationsrandbedingungen kann die erfindungsge­ mäße Vorrichtung auch vollständig oder teilweise parallel implementiert sein, so daß beispielsweise 1024 Bewertungsre­ sultate in einem Bearbeitungsdurchgang erzeugt werden. Auch gemischte Seriell/Parallel-Optionen sind möglich, so daß beispielsweise acht Parallelzweige existieren, welche dann entsprechend oft seriell arbeiten, um einen gesamten Suchbereich abdecken zu können.
An dieser Stelle sei auch darauf hingewiesen, daß nicht im­ mer unbedingt ein ganzer vorbestimmter Suchbereich durchlau­ fen werden muß. Wenn, wie im vorliegenden Fall, die Unter­ scheidung zwischen dem Spektrum ohne Rasterversatz und einem Spektrum mit einem minimalen Rasterversatz so deutlich mög­ lich ist, kann die Iteration, die in Fig. 2 dargestellt ist, auch bereits dann abgebrochen werden, wenn ein vorbestimmtes Kriterium erfüllt ist, da eigentlich kein Zweifel mehr daran besteht, daß es sich bei dem hier getesteten herausgegrif­ fenen Abschnitt um einen Abschnitt handelt, der zu dem ur­ sprünglichen Codierungs-Blockraster synchron ist.
Außerdem sei angemerkt, daß das Codierungs-Blockraster durch eine beliebige Definition identifiziert werden kann, und nicht nur durch den Anfangs-Abtastwert eines Codierungs­ blocks. Selbstverständlich kann jeder Abtastwert eines Codierungsblocks von Abtastwerten dazu verwendet werden, um das Codierungs-Blockraster zu definieren. Schließlich kann das Codierungs-Blockraster auch abweichend von der Anzahl von Abtastwerten pro Fenster definiert werden, derart, daß zwei Rasterpunkte des Codierungs-Blockrasters um die z. B. zweifache Anzahl von Abtastwerten eines Fenster voneinander beabstandet sind.

Claims (11)

1. Vorrichtung zum Bestimmen eines Codierungs-Blockra­ sters, das einem decodierten Signal zugrunde liegt, wobei das decodierte Signal durch Codierung und Deco­ dierung gemäß einem Codieralgorithmus mit einem Codie­ rungs-Blockerzeugungsschritt, einem Umsetzungsschritt und einem Datenreduzierungsschritt aus einem ursprüng­ lichen Signal erzeugt ist, wobei der Codierungs-Block­ erzeugungsschritt des Codieralgorithmus darin besteht, das ursprüngliche Signal gemäß dem Codierungs-Block­ raster in Codierungsblöcke mit einer bestimmten Anzahl von zeitdiskreten Signalwerten zu unterteilen, wobei der Umsetzungsschritt darin besteht, aus einem Codie­ rungsblock eine spektrale Darstellung desselben zu er­ zeugen, und wobei der Datenreduzierungsschritt darin besteht, Informationen aus der spektralen Darstellung des ursprünglichen Signals zu entfernen, mit folgenden Merkmalen:
einer Einrichtung (11) zum Herausgreifen eines Ab­ schnitts des decodierten Signals, der bei einem Aus­ gangs-Abtastwert des decodierten Signals beginnt;
einer Einrichtung (12) zum Ausführen des Umsetzungs­ schritts auf den Abschnitt des decodierten Signals, um eine spektrale Darstellung des Abschnitts zu liefern;
einer Einrichtung (13) zum Bewerten der spektralen Dar­ stellung des Abschnitts hinsichtlich eines vorbestimm­ ten Kriteriums, um ein Bewertungsresultat für den Ab­ schnitt zu erhalten,
wobei die Vorrichtung zum Bestimmen eines Codierungs- Blockrasters ferner angeordnet ist, um eine Mehrzahl von Abschnitten des decodierten Signals, die bei ver­ schiedenen Ausgangs-Abtastwerten beginnen, herauszu­ greifen, umzusetzen und zu bewerten, um eine Mehrzahl von Bewertungsresultaten zu erhalten; und
einer Einrichtung (14) zum Durchsuchen der Bewertungs­ resultate und zum Ausgeben einer Identifikation für das Codierungs-Blockraster, das dem decodierten Signal zu­ grunde liegt, auf der Basis des Abschnitts, der ein be­ züglich anderer Bewertungsresultate extremes Bewer­ tungsresultat hat.
2. Vorrichtung nach Anspruch 1, bei der die Einrichtung (13) zum Bewerten angeordnet ist, um als vorbestimmtes Kriterium die Anzahl von Spektralkoeffizienten der spektralen Darstellung zu verwenden, die kleiner als ein vorbestimmter Schwellenwert sind.
3. Vorrichtung nach Anspruch 1, bei der die Einrichtung (13) zum Bewerten angeordnet ist, um als vorbestimmtes Kriterium ein Maß für eine Schwankung von vorzugsweise logarithmierten Amplituden von Spektralkoeffizienten der spektralen Darstellung zu verwenden.
4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (13) zum Bewerten angeordnet ist, um lediglich einen Abschnitt der spektralen Dar­ stellung von der kleinsten Frequenz bis zu einer Grenz­ frequenz hinsichtlich des Kriteriums zu untersuchen.
5. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Codieralgorithmus einer einer Mehrzahl von verschiedenen Codieralgorithmen ist, und bei der die Einrichtung zum Ausführen des Umsetzungsschritts ferner folgende Merkmale aufweist:
eine Speichereinrichtung zum Speichern eines eigenen Satzes von Codierparametern für jeden Codieralgorith­ mus, wobei der Satz von Codierparametern gewählt ist, um zumindest den Umsetzungsschritt des entsprechenden Codieralgorithmus zu definieren; und
eine Einrichtung zum Abrufen eines anderen Satzes von Codierparametern von der Speichereinrichtung, um für einen weiteren Codieralgorithmus Bewertungsresultate zu liefern.
6. Vorrichtung nach Anspruch 5, bei der der Satz von Co­ dierparametern für einen Codieralgorithmus eine demsel­ ben zugrunde liegende Filterbank sowie ein von demsel­ ben verwendetes Fenster zur Codierungs-Blockbildung de­ finiert.
7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der das decodierte Signal ein Stereosignal ist, wo­ bei die Vorrichtung ferner folgendes Merkmal aufweist:
eine Einrichtung zur Stereo-Verarbeitung des decodier­ ten Signals, um zumindest ein verarbeitetes Stereosi­ gnal zu liefern.
8. Vorrichtung nach Anspruch 7, bei der die Einrichtung zur Stereoverarbeitung eine Mitte/Seite-Verarbeitung durchführt, derart, daß die Einrichtung zum Umsetzen (12) zumindest entweder auf ein Mitte-Signal oder auf ein Seite-Signal wirksam ist.
9. Vorrichtung nach einem der vorhergehenden Ansprüche, die ferner folgendes Merkmal aufweist:
eine Schreibeinrichtung, die mit der Einrichtung (14) zum Durchsuchen und Ausgeben gekoppelt ist, um das de­ codierte Signal mit einer Markierung zu versehen, die zumindest Codierungs-Blockrasterinformationen umfaßt.
10. Vorrichtung nach einem der vorhergehenden Ansprüche, die angeordnet ist, um als decodiertes Signal ein Audiosignal oder ein Videosignal zu verarbeiten, wobei der Datenreduzierungsschritt im Falle des Audiosignals eine Quantisierung in Abhängigkeit eines psychoakusti­ schen Modells und im Falle eines Videosignals eine Quantisierung in Abhängigkeit eines psychooptischen Modells umfaßt.
11. Verfahren zum Bestimmen eines Codierungs-Blockrasters, das einem decodierten Signal zugrunde liegt, wobei das decodierte Signal durch Codierung und Decodierung gemäß einem Codieralgorithmus mit einem Codierungs-Blocker­ zeugungsschritt, einem Umsetzungsschritt und einem Da­ tenreduzierungsschritt aus einem ursprünglichen Signal erzeugt ist, wobei der Codierungs-Blockerzeugungs­ schritt des Codieralgorithmus darin besteht, das ur­ sprüngliche Signal gemäß dem Codierungs-Blockraster in Codierungsblöcke mit einer bestimmten Anzahl von zeit­ diskreten Signalwerten zu unterteilen, wobei der Umset­ zungsschritt darin besteht, aus einem Codierungsblock eine spektrale Darstellung desselben zu erzeugen, und wobei der Datenreduzierungsschritt darin besteht, In­ formationen aus der spektralen Darstellung des ur­ sprünglichen Signals zu entfernen, mit folgenden Schritten:
Herausgreifen (11) eines Abschnitts des decodierten Si­ gnals, der bei einem Ausgangs-Abtastwert des decodier­ ten Signals beginnt;
Ausführen (12) des Umsetzungsschritts auf den Abschnitt des decodierten Signals, um eine spektrale Darstellung des Abschnitts zu liefern;
Bewerten (13) der spektralen Darstellung des Abschnitts hinsichtlich eines vorbestimmten Kriteriums, um ein Be­ wertungsresultat für den Abschnitt zu erhalten,
wobei die Schritte des Herausgreifens (11), Ausführens (12) und Bewertens (13) eine Mehrzahl von Malen ausge­ führt werden, um eine Mehrzahl von Abschnitten des decodierten Signals, die bei verschiedenen Ausgangs-Ab­ tastwerten beginnen, herauszugreifen, umzusetzen und zu bewerten, um eine Mehrzahl von Bewertungsresultaten zu erhalten; und
Durchsuchen (14) der Bewertungsresultate und zum Aus­ geben einer Identifikation für das Codierungs-Block­ raster, das dem decodierten Signal zugrunde liegt, auf der Basis des Abschnitts, der ein bezüglich anderer Bewertungsresultate extremes Bewertungsresultat hat.
DE10000934A 2000-01-12 2000-01-12 Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals Expired - Lifetime DE10000934C1 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE10000934A DE10000934C1 (de) 2000-01-12 2000-01-12 Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
PCT/EP2001/000241 WO2001052240A1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
DE50100332T DE50100332D1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
EP01900416A EP1247275B1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
AT01900416T ATE243877T1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
US10/168,456 US6750789B2 (en) 2000-01-12 2001-01-10 Device and method for determining a coding block raster of a decoded signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10000934A DE10000934C1 (de) 2000-01-12 2000-01-12 Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals

Publications (1)

Publication Number Publication Date
DE10000934C1 true DE10000934C1 (de) 2001-09-27

Family

ID=7627256

Family Applications (2)

Application Number Title Priority Date Filing Date
DE10000934A Expired - Lifetime DE10000934C1 (de) 2000-01-12 2000-01-12 Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
DE50100332T Expired - Lifetime DE50100332D1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE50100332T Expired - Lifetime DE50100332D1 (de) 2000-01-12 2001-01-10 Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals

Country Status (4)

Country Link
US (1) US6750789B2 (de)
EP (1) EP1247275B1 (de)
AT (1) ATE243877T1 (de)
DE (2) DE10000934C1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10297751B4 (de) * 2002-06-27 2005-12-22 Samsung Electronics Co., Ltd., Suwon Audiocodierverfahren und Vorrichtung, die die Harmonischen-Extraktion verwenden

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004036154B3 (de) * 2004-07-26 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
EP2315358A1 (de) 2009-10-09 2011-04-27 Thomson Licensing Verfahren und Vorrichtung zur arithmetischen Kodierung oder arithmetischen Dekodierung
EP2707873B1 (de) 2011-05-09 2015-04-08 Dolby International AB Verfahren und codierer zur verarbeitung eines digitalen stereotonsignals
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
MX348506B (es) 2013-02-20 2017-06-14 Fraunhofer Ges Forschung Aparato y metodo para codificar o decodificar una señal de audio utilizando una superposicion dependiente de la ubicacion de un transitorio.
CN111210832B (zh) * 2018-11-22 2024-06-04 广州广晟数码技术有限公司 基于频谱包络模板的带宽扩展音频编解码方法及装置
US11368209B2 (en) 2019-05-30 2022-06-21 Qualcomm Incorporated Methods and apparatus for frequency translating repeaters

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
WO1999004572A1 (en) * 1997-07-18 1999-01-28 British Broadcasting Corporation Re-encoding decoded signals
WO1999008425A1 (en) * 1997-08-08 1999-02-18 Qualcomm Incorporated Method and apparatus for determining the rate of received data in a variable rate communication system

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5179623A (en) * 1988-05-26 1993-01-12 Telefunken Fernseh und Rudfunk GmbH Method for transmitting an audio signal with an improved signal to noise ratio
DE3902948A1 (de) * 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
WO1999004572A1 (en) * 1997-07-18 1999-01-28 British Broadcasting Corporation Re-encoding decoded signals
WO1999008425A1 (en) * 1997-08-08 1999-02-18 Qualcomm Incorporated Method and apparatus for determining the rate of received data in a variable rate communication system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FLETCHER, J.: ISO/MPEG Layer 2 - Optimum re-Encoding of Decoded Audio using a Mole- Signal, in: 104th AES-Convention, 16.-19.5.1998, Preprint Nr. 4706 *
HERRE, J., JOHNSTON, J.D. Enhancing the performance of Perceptual Audio Coders by Using Temporal Noise Shaping (INS), 101 AES, 8.-11.11.96, Los Angeles, Preprint 4384 *
KEYHL, M., HERRE, J., SCHMIDMER, CH.: NMR Measurements on Multiple Generations Audio Coding, in: 96. AES Versammlung, 26.2.- 1.3.1994, Amsterdam, Preprint 3803 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10297751B4 (de) * 2002-06-27 2005-12-22 Samsung Electronics Co., Ltd., Suwon Audiocodierverfahren und Vorrichtung, die die Harmonischen-Extraktion verwenden

Also Published As

Publication number Publication date
EP1247275B1 (de) 2003-06-25
ATE243877T1 (de) 2003-07-15
WO2001052240A2 (de) 2001-07-19
DE50100332D1 (de) 2003-07-31
WO2001052240A8 (de) 2001-08-16
US6750789B2 (en) 2004-06-15
US20030107503A1 (en) 2003-06-12
EP1247275A1 (de) 2002-10-09

Similar Documents

Publication Publication Date Title
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
DE19730129C2 (de) Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE60014363T2 (de) Verringerung der von der quantisierung verursachten datenblock-diskontinuitäten in einem audio-kodierer
DE69534273T2 (de) Verfahren und vorrichtung zum signalkodieren, signalubertragungsverfahren und verfahren und vorrichtung zur signaldekodierung
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE102007017254B4 (de) Vorrichtung zum Kodieren und Dekodieren
DE102004009954B4 (de) Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE60308567T2 (de) Dekodierungsgerät, Kodierungsgerät, Dekodierungsverfahren und Kodierungsverfahren
WO1999004506A1 (de) Verfahren zum codieren eines audiosignals
DE10109648A1 (de) Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
DE60303346T2 (de) Encodier- und/oder Decodierverfahren für digitale Audiosignale, basierend auf Zeit-Frequenzkorrelation und Vorrichtung hierzu
DE60017825T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE10000934C1 (de) Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
DE60300500T2 (de) Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom
DE102004009949B4 (de) Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE4209382C1 (de)
DE10065363B4 (de) Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals
WO2001052240A1 (de) Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
DE102006053976A1 (de) Verfahren zur Umschaltung von Fenster und zur Entscheidung des Bandstatus der Mittel/Seitenkodierung für fortgeschrittene Audiokodierung

Legal Events

Date Code Title Description
8100 Publication of patent without earlier publication of application
D1 Grant (no unexamined application published) patent law 81
8364 No opposition during term of opposition
R071 Expiry of right