DE69406306T2

DE69406306T2 - Verfahren zur bildskalierung und zum filtern mit diskreter cosinustransformation

Info

Publication number: DE69406306T2
Application number: DE69406306T
Authority: DE
Inventors: Michael Reisch; Munib Wober
Original assignee: Polaroid Corp
Current assignee: Polaroid Corp
Priority date: 1993-11-30
Filing date: 1994-11-29
Publication date: 1998-01-29
Anticipated expiration: 2014-11-30
Also published as: US5740284A; EP0731957A1; ATE159366T1; EP0731957B1; KR960706148A; DE69406306D1; CA2171335A1; WO1995015538A1; JPH09506193A

Description

HINTERGRUND DER ERFINDUNG

1. Gebiet der Erfindung

Die Erfindung bezieht sich im allgemeinen auf verbesserte Verfahren und Vorrichtungen zur Bildverarbeitung. Insbesondere bezieht sich die Erfindung auf neue Verfahren und Vorrichtungen zur Verwendung diskreter Cosinustransformationen zum: Vergrößern eines Bildes durch Interpolation; Verkleinern eines Bildes durch Dezimierung; und/oder Filtern eines Bildes im Frequenzbereich durch ein Verfahren, das zu einer mathematischen Faltung im räumlichen Bereich äquivalent ist.

2. Beschreibung des Stands der Technik

Bilder können als zweidimensionale Darstellungen irgendeiner visuellen Realität aufgefaßt werden, die im Raum und/oder der Zeit verteilt ist. Gewöhnlicherweise sind sie das, was das menschliche visuelle System als Veränderungen der externen Anregungen wahrnimmt, wie z.B. Helligkeit, Farbe und manchmal Hinweise auf die Tiefe. Über die Jahre hinweg wurden zwar alle möglichen Verfahren entwickelt, um Bilder einzufangen und wiederzugeben, wobei ihre Darstellung als kontinuierliche, diskrete oder digitale Signale, die unter Verwendung von Rechnern oder anderer spezieller elektronischer Hardware manipuliert, verarbeitet oder angezeigt werden können, das neueste, nun gut etablierteverfahren ist, das eine Vielzahl gewinnbringender Anwendungen hat. So können z.B. Bilder, wenn sie in elektronischer Form vorliegen, verstärkt werden, um spezielle visuelle Effekte zu erzeugen, wiederhergestellt werden, zur Übertragung an ferne Orte kodiert werden, rekonstruiert, angezeigt oder in irgendeine andere faßbare Form umgewandelt werden.
Das Verarbeiten eines elektronischen Bildes kann Vorgänge enthalten wie Filtern, Schärfen, Glätten, Komprimieren, Dekomprimieren, Vergrößern, Rekonstruieren und Drucken des Bildes oder eines beliebigen Teils davon in verschiedenen Bildverarbeitungssystemen, wie einer elektronischen Kamera, einem Camcorder, Drucker, Rechner oder einer beliebigen anderen Abbildungsvorrichtung.
Die Bildverarbeitung kann entweder im Raumbereich oder im Frequenzbereich stattfinden. Man sagt von einem Bild, es liege im Raumbereich, wenn die Werte der zu seiner Beschreibung verwendeten Parameter, wie z.B. Helligkeit, eine direkte Korrespondenz mit dem räumlichen Ort haben. Im Frequenzbereich kann das Bild im Raumbereich durch eine Reihe von Frequenzkomponenten in Form trigonometrischer Funktionen dargestellt werden, die, wenn sie für jeden Bildpunkt (d.h. Pixel) summiert werden, den Wert des Parameters ergeben, der zur Charakterisierung des Bildes des Punktes im Raumbereich verwendet wird, und eine solche Darstellung kann ausgedehnt werden, um alle Punkte eines Bildes abzudecken.
Im Raumbereich können ursprüngliche Daten zweckmäßigerweise als Bilddatenpunkte in einer ersten räumlichen Matrix dargestellt werden, die einem zweidimensionalen Fall zugeordnet ist, s(j,i), wobei der Kleinbuchstabe s den Raumbereich bezeichnet, i der Zeilenindex und j der Spaltenindex ist. Im Frequenzbereich können Matrizen auch verwendet werden, um ein Bild als einen Satz von Transformationskoeffizienten (auch als Frequenzkoeffizienten bezeichnet) mathematisch zu beschreiben, die in einer herkömmlich bezeichneten Transformationsmatrix S(v,u) Frequenzdaten darstellen, wobei der Großbuchstabe S den Frequenzbereich bezeichnet, u die Anzahl der Zeilen und v die Anzahl der Spalten ist.
Räumliche Bilddatenpunkte können unter Verwendung von Transformationen wie Fourier-Transformationen oder diskreten Cosinustransformationen (DCTs) in den Frequenzraum transformiert werden. Wenn die betreffende Transformation eine diskrete Cosinustransformation ist, wird der Frequenzbereich als der DCT-Bereich bezeichnet, und die Frequenzkoeffizienten bezeichnet man als DCT-Koeffizienten. DCT- Transformationen zur Rekonstruktion eines Bildes werden in dem US-Patent Nr. 5,168,375, erteilt am 1. Dezember 1992 an Reisch et al., und in einem Artikel mit dem Titel "Scale Factor of Resolution Conversion Based on Orthogonal Transforms" (Skalierungsfaktor der Auflösungsumwandlung auf der Grundlage orthogonaler Transformationen), Muramatsu et al., IEICE TRANS. FUNDAMENTALS, Band E76-A, Nr.7, Juli 1993, offenbart. Muramatsu et al. offenbart eine Auflösungsumwandlung auf der Grundlage einer orthogonalen Transformation, die durch eine DCT zum Komprimieren digitaler Bilddaten typisiert wird. Reisch et al. offenbart ein Verfahren zum Verarbeiten eines Feldes von Bilddatenproben, um eine oder mehrere der Funktionen zur Dezimierung, Interpolation und Schärfung bereitzustellen, die durch Verwendung eines Matrixtransformation-Prozessors, wie z.B. dem in einem JPEG-Kompressionssystem verwendeten, erzielt werden.
Herkömmlicherweise bezeichnet man das Transformieren von Daten vom Raumbereich zum Frequenzbereich als Vorwärts-Transformation, wohingegen das Transformieren von Daten vom Frequenzbereich zum Raumbereich als inverse Transformation bezeichnet wird. Somit wird eine diskrete Vorwärts- Cosinustransformation als eine Transformation bezeichnet, welche ein Bild von den ursprünglichen Bilddatenpunkten s(j,i) im Raumbereich zu DCT-Koeffizienten S(v,u) wohingegen eine inverse diskrete Cosinustransformation (oder IDCT) als eine Transformation definiert wird, welche die DCT-Koeffizienten S(v,u) vom DCT-Bereich zu rekonstruierten Bilddatenpunkten s'(j,i) im Raumbereich entsprechend den Basisfünktionen der IDCT abbildet.
Die Verwendung von DCT- und IDCT-Transformationen zum Komprimieren oder Dekomprimieren von Bildern zum Verringern der Anforderungen an die Bildspeicherung und/oder Erhöhen der Transfer- und Rechengeschwindiggkeiten ist weitgehend bekannt, und diese Praxis wurde in der Tat von Gruppen, wie z.B. der Joint Photographic Experts Group (JPEG), die als Teil einer gemeinsamen Initiative des Consultative Committee on International Telegraphy and Telephony (CCITT) und von The International Standards Organization (ISO) gebildet weurde, als Industriestandard angenommen. Heutzutage unterstützen die meisten Bildverarbeitungsprogramme sowohl das Laden und Speichern von Dateien, die mit JPEG-Standards für Dateien oder Formate übereinstimmen, und es gibt sogar maßgeschneiderte Hardware auf dem Markt zum Komprimieren und Dekomprimieren im JPEG-Format.
Dennoch ist die Anwendung von DCT-Transformationen auf Bildverarbeitungsvorgänge, bei denen es sich um keine Komprimierung handelt, nicht weitgehend bekannt und bietet eine Möglichkeit zur zweckmäßigen Nutzung von verfügbarer maßgeschneiderter Hardware oder Allzweck-Rechnern, um andere Verarbeitungseffeke zu erzielen, wie z.B. Skalieren, Filtern oder die Bearbeitung von Bilddaten für eine effiziente Übertragung, während Artefakte unterdrückt oder verringert werden.
Folglich besteht eine Hauptaufgabe der Erfindung darin, Verfahren und Vorrichtungen bereitzustellen, welche diskrete Cosinustransformationen für Bildverarbeitungsvorgänge, bei denen es sich nicht um Komprimierung handelt, zu verwenden.
Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, Verfahren und Vorrichtungen bereitzustellen, welche diskrete Cosinustransformationen zur Verstärkung der Komprimierung bei gleichzeitiger Verringerung von Artifakten verwenden.
Weitere Aufgaben der Erfindung ergeben sich zum Teil weiter unten und sind zum Teil aus der folgenden ausführlichen Beschreibung zusammen mit der Zeichnung ersichtlich.

ZUSAMMENFASSUNG DER ERFINDUNG

Verfahren und Vorrichtungen zur Bildverarbeitung, durch welche Bilder, die im Raumbereich vorliegen, im Frequenzbereich dargestellt werden können, indem man diskrete Cosinustransformationen verwendet, die zweckmäßigerweise bearbeitet werden, um Skalierungs- und Filterungseffekte zu erzielen, solange sie im Frequenzbereich sind, und dann in den Raumbereich rücktransformiert oder gespeichert, angezeigt, wiedergegeben oder an entfernte Orte zur anschließenden erneuten Verwendung übertragen werden.
Die Skalierungstechniken, die durch die Erfindung verwendet werden, können der Bildvergrößerung durch Interpolation oder der Bildverkleinerung durch Dezimierung dienen. Im Falle der Dezimierung wird eine Filterungsvorgang vorzugsweise zuerst im Frequenzbereich durchgeführt, um Artifakte im Prozeß der Dezimierung zu verhindern. Der Filterungsvorgang ist mathematisch äquivalent zu einer linearen Faltung im Raumbereich als Folge der Eigenschaften der DCT-Transformation.
Sowohl bei Interpolations- als auch Dezimierungsvorgängen wird eine inverse diskrete Hybrid-Cosinustransformation verwendet, bei der die unabhängige Variable der Reihe von Cosinustermen bei Werten berechnet wird, zu denen man durch Skalierungsverhältnis-Betrachtungen anstatt durch die gewöhnlichen Probennahme- Indexinkremente gelangt. Folglich können Bildpunkte, welche nicht diejenigen sind, die ursprüngliche Bilddaten im Raumbereich enthalten, durch ein Näherungsverfahren erzeugt werden, bei dem diese im Frequenzraum durch eine Reihe von Termen dargestellt werden, die über dem Bereich des Probennahme-Indexes, der demjenigen der ursprünglichen Bilddaten entspricht, als kontinuierlich betrachtet werden kann.
Im Betrieb werden bei dem Hybridverfahren zuerst räumliche Bilddaten unter Verwendung einer standardmäßigen DCT in den Frequenzraum transformiert. Hierbei werden eine DCT-Basismatrix und ihre Transponierte für den zweidimensionalen Fall durch die Bilddaten in Matrixform matrizenmultipliziert, um eine Matrix aus DCT- Koeffizienten zu erzeugen. Ein Skalierungsverhältnis wird dann ausgewählt, und eine Hybrid-IDCT-Basismatrix wird zusammen mit ihrer Transponierten erzeugt. Die Ergebnisse dieser beiden Operationen werden mathematisch kombiniert, um eine rekonstruierte Bilddatenmatrix durch einen inversen Transformationsschritt zu erzeugen. Die rekonstruierte Bilddatenmatrix stellt das neue Bild dar, das entweder vergrößert oder verkleinert sein kann.
Die Skalierungsoperationen können derart durchgeführt werden, daß die Vergrößerung entlang orthogonaler Azimuthe dieselbe oder entlang dieser beiden verschieden ist, da die Operationen wegen der Orthogonalitätseigenschaft der DCT- Basisfünktionen mathematisch entkoppelt werden können.
Um die Filterungsoperation zum Schärfen oder Glätten durchzuführen, greift man auf eine diskrete ungerade Cosinustransformation eines symmetrischen Filterungskerns im Raumbereich zurück. Beim Dezimieren wird die Filterungsoperation vorzugsweise zur Vermeidung von Artefakten durchgeführt, und benachbarte Bilddatenmatrizen werden vorzugsweise um mindestens eine Zeile und Spalte überlappt
Alle Operationen werden vorzugsweise im JPEG-Format durchgeführt, und an den JPEG-Standard angepaßte Spezial-Hardware kann ebenfalls gewinnbringend eingesetzt werden, um Bilddaten in Blöcken der Größe 8X8 oder 16X16 zu verarbeiten.

KURZBESCHREIBUNG DER ZEICHNUNG

Die oben erwähnten Gesichtspunkte und anderen Merkmale der Erfindung werden anhand der begleitenden Zeichnung ausführlich beschrieben, wobei durchgehend dieselben Bezugsziffern verwendet werden, um entsprechende Elemente zu bezeichnen, und es sind:
Fig. 1 ein Plot diskreter normalisierter Cosinusbasisfunktionen für den eindimensionalen Fall einer DCT, wie sie durch Gleichung (1) gegeben ist;
Fig. 2A ein Diagramm rekonstruierter Bilddatenpunkte s'(i) über i für eine eindimensionale Acht-Element-Matrix mit einem Skalierungsverhältnis 1:1;
Fig. 2B ein Diagramm (bezüglich einer Bildvergrößerung) rekonstruierter Bilddatenpunkte s'(x) über x mit einem Skalierungsverhältnis 10:8 über demselben Bereich von Bilddaten wie in Fig. 2A;
Fig. 2C ein Diagramm (bezüglich einer Bildverkleinerung) rekonstruierter Bilddatenpunkte s'(x) über x mit einem Skalierungsverhältnis 2:5 über demselben Bereich von Bilddaten wie in Fig. 2A;
Fig. 3 ein Blockdiagramm eines ersten Ausführungsbeispiels eines Verfahrens zum Skalieren eines Bildes in zweidimensionaler Form, bei dem das Skalierungsverhältnis verändert werden kann, jedoch in beiden Richtungen dasselbe ist;
Fig. 4 ein Blockdiagramm eines zweiten Ausführungsbeispiels eines Verfahrens zum Skalieren eines Bildes in zweidimensionaler Form, bei dem das Skalierungsverhältnis in beiden Richtungen um unterschiedliche Beträge verändert werden kann;
Fig. 5 ein schematisches Blockdiagramm einer Vorrichtung zum Skalieren eines Bildes gemäß dem Verfahren von Fig.3;
Fig. 6 ein schematisches Blockdiagramm von Schritten zum Filtern eines Bildes im Frequenzbereich durch ein Verfahren, das zu einer Faltung im Raumbereich äquivalent ist;
Fig. 7 eine Darstellung der Überlappung zwischen benachbarten Gruppen von Pixeln in einem Bild;
Fig. 8 ein schematisches Blockdiagramm einer Vorrichtung zum Filtern eines Bildes gemäß dem Verfahren von Fig. 6; und
Fig. 9 ein schematisches Blockdiagramm eines Verfahrens zum Verkleinern eines Bildes durch Dezimierung.

AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFUHRUNGSBEISPIELE

Die Erfindung bezieht sich im allgemeinen auf verbesserte Verfahren und Vorrichtungen zur Bildverarbeitung. Insbesondere bezieht sich die Erfindung auf neue Verfahren und Vorrichtungen zur Verwendung diskreter Cosinustransformationen zum: Vergrößern eines Bildes durch Interpolation; Verkleinern eines Bildes durch Dezimierung; und/oder Filtern eines Bildes im Frequenzbereich durch ein Verfahren, das zu einer mathematischen Faltung im räumlichen Bereich äquivalent ist.
Die folgende mathematische Abhandlung bietet zum Teil gewisse mathematische Grundlagen dar, die sich auf Vorwärts- und inverse diskrete Cosinustransformationen (DCTs) beziehen.
Eine Vorwärts-DCT ist definiert als ein mathematischer Prozeß zum Transformieren von Bilddatenpunkten vom Raumbreich zum Frequenzbereich oder insbesondere dem DCT-Bereich. Bilddatenpunkte s(i) in eindimensionaler Form können vom Raumbereich zu DCT-Koeffizienten S(u) für den Frequenzbereich gemäß Gleichung (1) transformiert werden.
für 0≤u≤(N-1),
wobei: S(u) die DCT-Koeffizienten darstellt;
s(i) die Bilddatenpunkte darstellt;
N die Zahl der Bilddatenpunkte darstellt;
CU = 1/ 2 für u=0;
CU = 1 für u≠0.
Die DCT-Koeffizienten S(u) werden aus Gleichung (1) gewonnen, von der die normalisierten Cosinusbasisterme in Fig. 1 für N = 16 gezeigt sind, wobei 0 ≤ u ≤ 15 und 0 ≤ i ≤ 15. Der Wert für S(0) wird bestimmt für u = 0 durch Summieren aller Bilddatenpunkte s(i) für 0 ≤ i ≤ (N-1) mal die Cosinusterme, wie in Fig. 1 dargestellt. Der Wert für S(1) wird bestimmt als die Summierung von Bilddatenpunkten s(i) mal die Cosinusterme für u = 1. Diese Vorgehensweise, die zuerst auf u und dann auf i indexiert wird, wird fortgeführt, um alle sechzehn DCT-Koeffizienten S(0) bis S(15) herzuleiten.
Die verschiedenen Terme von Gleichung (1) können alternativ in Matrixschreibweise ausgedrückt werden, wobei jeder Cosinusterm ein Element einer zweidimensionalen Matrix darstellt, die als eine Vorwärts-DCT-Basismatrix FB definiert ist, wobei jeder Bilddatenpunkt ein Element einer ersten räumlichen Matrix s(i) aus Bilddatenpunkten und jeder DCT-Koeffizient ein Element einer DCT-Matrix S(u) aus DCT-Koeffizienten darstellt.
Eine inverse diskrete Cosinustransformation ist definiert als ein mathematischer Prozeß zum Transformieren von DCT-Koeffizienten vom DCT-Bereich zu rekonstruierten Bilddatenpunkten im Raumbereich. DCT-Koefflzienten S(u) in eindimensionaler Form werden gemäß Gleichung (2) vom DCT-Bereich zu rekonstruierten Bilddatenpunkten s'(i) im Raumbereich transformiert.
für 0 ≤ i ≤ (N-1),
wobei: S(u) die DCT-Koeffizienten darstellt;
s'(i) die rekonstruierten Bilddatenpunkte darstellt;
N die Zahl der DCT-Koeffizienten darstellt;
CU = 1/ 2 für u=0;
CU = 1 für u≠0.
Wenn die DCT-Koeffizienten S(u) von Gleichung (1) aus einer Gruppe von Bilddatenpunkten s(i) hergeleitet werden und die rekonstruierten Bilddatenpunkte s'(i) von Gleichung (2) aus den entsprechenden DCT-Koeffizienten S(u) hergeleitet werden, wird s(i) s'(i), und der Prozeß wird als verlustfrei bezeichnet, da die rekonstruierten Datenpunkte s'(i) innerhalb der Grenzen identisch zu den ursprünglichen Datenpunkten s(i) sind. Die rekonstruierten Bilddatenpunkte s'(i) werden aus Gleichung (2) gewonnen, bei der die Cosinusterme in Fig. 1 für N = 16 gezeigt sind, wobei 0 ≤ i ≤ 15 und 0 ≤ u ≤ 15. Der Wert für s'(0) wird bestimmt für i = 0 durch Summieren jedes der DCT- Koeffizienten S(u) mal die Cosinusterme, wie in Fig. 1 dargestellt. Der Wert für s'(1) wird bestimmt als die Summierung von DCT-Koeffizienten S(u) mal die Cosinusterme für i = 1. Diese Vorgehensweise wird wie zuvor indexiert fortgesetzt, um alle sechzehn rekonstruierten Bilddatenpunkte s'(0) bis s'(15) herzuleiten.
Man beachte, daß die herkömmliche inverse DCT von Gleichung (2) zum Transformieren von Daten in eindimensionaler Form dasselbe Cosinusargument (d.h. gleich Basisfunktionen), das bei der herkömmlichen Vorwärts-DCT von Gleichung (1) verwendet wird, so daß die rekonstruierten Bilddatenpunkte s'(i) mit den ursprünglichen Bilddatenpunkten s(i) zusammenfallen. Allerdings wird im Stand der Technik nicht erkannt, die IDCT zum Bestimmen rekonstruierter Bilddatenpunkte s'(i) zu verwenden, die zwischen die ursprünglichen Bilddatenpunkte s(i) im Raumbereich fallen.
Die obigen Beispiele für eine eindimensionale DCI und IDCT können, wie dem Fachmann bekannt ist, auf mehr-dimensionale Formate erweitert werden. So definiert z.B. Abschnitt A.3.3 von ISO/IEC 10918-1 des Entwurfs für die internationalen Standards zur digitalen Komprimierung unter Verwendung diskreter Cosinustransformationen die Vorwärts-DCT in zweidimensionaler Form als:
für 0 ≤ u ≤ 7 und 0 ≤ v ≤ 7, während die IDCT in zweidimensionaler Form definiert wird als:
für 0 ≤ i ≤ 7 und 0 ≤j ≤ 7,
wobei S(v,u) DCT-Koeffizienten darstellt;
s(j,i) ursprüngliche Bilddatenpunkte darstellt;
s'(j,i) die rekonstruierten Bilddatenpunkte darstellt;
CU=1/ 2 für u = 0;
CU=1 für u≠0;
CV=1/ 2 für v=0; und
Cu=1 für v≠0.
Gemäß Gleichung (3) kann eine erste räumliche Matrix s(j,i) (die eine zweidimensionale 8X8-Gruppe ursprünglicher Bilddatenpunkte im räumlichen Bereich darstellt) zu einer 8X8-DCT-Matrix S(v,u) im Frequenzbereich mit 64 DCT- Koeffizienten vorwärts-DCT-transformiert werden, die auf die 64 Bilddatenpunkte durch Abbilden bezogen werden können. Eine 8X8-DCT-Basismatrix, d.h. eine Vorwärts-Transformationsmatrix, wird aus dem Cosinusausdruck von Gleichung (3) durch Indexieren über den gesamten Bereich der Werte für j und i sowie v und u gewonnen.
Sobald die Bilddatenpunkte s(j,i) zu DCT-Koeffizienten S(v,u) im DCT-Bereich transformiert sind, kann die Anzahl der DCT-Koeffizienten durch Komprimierung verringert werden, die im allgemeinen definiert ist als der Prozeß zum Verringern entweder der Bandbreite oder der Anzahl notwendiger Bits, um ein Bild darzustellen, und insbesondere als der Prozeß zum Verringern der Anzahl der DCT-Koeffizienten S(v,u) im DCT-Bereich durch Entfernen einer ausgewählten Gruppe der DCT- Koeffizienten. Die ausgewählte Gruppe wird als für die Bildwiedergabe gemäß einiger bestimmter Kriterien nicht wesentlich bestimmt. Typischerweise enthält die Gruppe aus DCT-Koeffizienten, die zum Entfernen bestimmt sind, Werte von Null oder beinahe Null oder diejenigen Terme, die einen hochfrequenten Gehalt darstellen, den das menschliche visuelle System nicht wahrnehmen kann, und erleidet daher keinen Informationsverlust.
Ein weiterer Gesichtspunkt der Bildverarbeitung im DCT-Bereich ist das Schärfen und Glätten eines Bildes durch ein Filterungsverfahren, das zu einer Faltung im Raumbereich mathematisch äquivalent ist. Eine Faltung zweier diskreter Signale im Raumbereich findet statt, indem man die beiden diskreten Signale Punkt für Punkt multipliziert und die Produkte dann über geeignete Grenzen hinweg summiert. Das Schärfen ist definiert als der Prozeß zur Verbesserung unscharfer Bilder, insbesondere durch Hervorheben hochfrequenter Komponenten, die in einem Bild Ränder bzw. Kanten darstellen. Andererseits wird das Glätten definiert als der Prozeß entweder für das Weichermachen der Ränder bzw. Kanten des Bildes oder alternativ das Verringern der hochlrequenten Komponeneten.
Das Filtern eines Bildes im DCT-Bereich unter Verwendung eines Prozesses, der einer mathematischen Faltung im Raumbereich ähnelt, ist in einem Artikel mit dem Titel "Discrete Cosine Transform Filtering" von Chitprasert & Rao, Signal Procesing 19 (1990), Seiten 233-245, offenbart, bei dem ein Kern mittels einer diskreten 2N-Punkt- Fouriertransformation (DFT) verarbeitet wird, die 2N komplexe Zahlen ergibt. Ein Kern ist definiert als die Signalwerte eines Filters zum Durchführen einer speziellen Operation, wie z.B. Schärfen oder Glätten im Raum- oder Frequenzbereich. Die Imaginärteile der 2N komplexen Zahlen werden bestimmt und dann beseitigt, während die Realteile und geraden Teile der 2N komplexen Zahlen für weitere Berechnungen beibehalten werden. Die Bestimmung der Imaginärteile der komplexen Zahlen erfordert Rechenzeit und Aufwand, obwohl die Imaginärteile für das Filtern des Bildes nicht erforderlich sind. Dieses Filterungsverfahren ist jedoch mit einem intensiven Rechenaufwand verbunden, und man wird sehen, daß seine Anforderung zur Verwendung komplexer Zahlen durch die Erfindung überwunden wird.

Skalieren durch Wieder-Probennahme

Gemäß der Erfindung können Bilder skaliert werden, wobei Hybridverfahren auf der Grundlage von, vorzugsweise jedoch unterschiedlich von der vorhergehenden mathematischen Beschreibung verwendet werden.
Ein Bild kann in Übereinstimmung mit einem Skalierungsverhältnis skaliert werden, das für jede Dimension definiert wird als die Anzahl der nach einer Transformation gewünschten Ausgabepixel dividiert durch die Anzahl der vor der Transformation verfügbaren Eingabepixel. So hat z.B. für eindimensionale Bilddaten, bei denen die Anzahl der Eingabepixel N einen Wert von acht Pixeln pro cm hat und die Anzahl der Ausgabepixel N' einen Wert von zehn Pixeln pro cm hat, das Skalierungsverhältnis R = N'/N den Wert 10:8. Um ein Bild dann zu vergrößern, wird ein Skalierungsverhältnis von mehr als eins gewählt (z.B. 10:8). Um ein Bild zu verkleinern, wird ein Skalierungsverhältnis von weniger als eins gewählt (z.B. 6:8), und wenn ein Skalierungsverhältnis von eins gewahlt wird (z.B. 8:8), hat das ausgegebene Bild dieselbe Größe wie das eingegebene Bild.
Beispiele der Skalierung eindimensionaler Bilddaten sind in Fig. 2A, 2B und 2C gezeigt. Fig. 2A ist eine Auftragung der Werte von einer zweiten räumlichen Matrix s'(i), Bilddatenpunkte in einer Dimension (durch offene Kreise bezeichnet), die von Gleichung (2) für die inverse Transormation einer DCT-Matrix S(u) mit acht DCT- Koeffizienten für 0 ≤ i ≤ 7 hergeleitet wurden. Weder die IDCT von Gleichung (2) für eindimensionale Daten noch Gleichung (4) für zweidimensionale Daten rekonstruieren Bilddatenpunkte, die zwischen die diskreten Indexwerte für die ursprünglichen Bilddatenpunkte fallen. Es gibt jedoch bei der Bildverarbeitung Zeitpunkte, bei denen die Berechnung derartiger Zwischenwerte wünschenswert ist, wie z.B. Bildvergrößerung durch Interpolation und Bildverkleinerung durch Dezimierung.
Eine rekonstruierte Matrix von Bilddatenpunkten s'(x) für eindimensionale Daten kann von einer Hybrid-IDCT hergeleitet werden, die durch Gleichung (5) gegeben ist. Mit anderen Worten liefert die Hybrid-IDCT der Gleichung (5) eine kontinuierliche Indexvariable x für den Bereich von i(N-1), so daß die rekonstruierten Bilddatenpunkte s'(x) bei nicht-ganzzahligen Werten von x bestimmt werden können (z.B. x&sub1; = 0,5; x&sub2; = 6,3; x&sub3; = 4,99712; etc.). Anstatt i mit einem Intervall delta i gleich dem ganzzahligen Wert 1 (der Probennahme-Geschwindigkeit für die ursprünglichen Bilddaten) zu indexieren, kann x mit einer anderen Probennahme-Geschwindigkeit Δx indexiert werden, die je nach Fall in der Gleitkommaform kleiner oder größer sein kann.
Aufgrund des Skalierens entsprechen einige der rekonstruierten Bilddaten räumlichen Orten, die sich von den ursprünglichen Bilddatenpunkten der ersten räumlichen Matrix s(j,i) unterscheiden. Auf diese Weise können rekonstruierte Bilddatenpunkte s'(x) bestimmt werden, und diese fallen zwischen die diskreten Indexwerte der usprünglichen Bilddatenpunkte s(i).
für 0≤i≤(N-1),
wobei: s'(x) die rekonstruierten Bilddatenpunkte darstellt;
S(u) die DCT-Koeffizienten darstellt;
N die Zahl der DCT-Koeffizienten darstellt;
CU=1/ 2 für u=0; und
CU=1 für u≠0.
Es kann theoretisch eine unendliche Zahl rekonstruierter Bilddatenpunkte s'(x) hergeleitet werden, z.B. die Kurven von Fig. 2B und 2C, während man innerhalb des richtigen Bereichs der Funktion s'(x) von Gleichung (5) bleibt. Der Index x der erneut als Probe genommenen Bilddatenpunkte (wie in Fig. 2B und 2C gezeigt) wird bestimmt, indem man zuerst ein Skalierungsverhältnis R auswählt. Das Skalierungsverhältnis wird für jede Dimension von Bilddaten ausgewählt, und zwar werden eindimensionale Bilddaten durch ein einziges Skalierungsverhältnis skaliert, zweidimensionale Bilddaten werden in der ersten Dimension durch ein Erstdimension- Skalierungsverhältnis und in der zweiten Dimension durch ein Zweitdimension- Skalierungsverhältnis etc. dimensioniert, welches dässelbe oder ein anderes sein kann.
Die Endpunkte zusammenhängender Gruppen von Bilddatenpunkten (d.h. Endpunkte jeder Zeile und Spalte der Bilddatenpunkte in Matrixschreibweise) werden manchmal während des Skalierens ausgelassen, können jedoch bei Bedarf beibehalten oder erneut gewonnen werden.
Fig. 28 zeigt ein Beispiel für Aufwärts-Skalieren durch Wieder-Probennahme (oder Aufwärts-Probennahme) in einer Dimension, bei dem beide Endpunkte willkürlich beibehalten wurden. Die Beabstandung der x Indexwerte in Fig. 28 wird für ein Skalierungsverhältnis von 10:8 bestimmt, was bedeutet, daß zehn rekonstruierte Bilddatenpunkte s'(x) jeweils für acht Bilddatenpunkte des ursprünglichen Bildes s(i) gesucht werden. Mit anderen Worten wird die Quellenachse, d.h. die i-Achse von Fig. 2A, in sieben Segmente unterteilt (für acht Bilddatenpunkte), und die Zielachse, d.h. die x-Achse von Fig. 2B, wird in neun Segmente unterteilt (für zehn Bilddatenpunkte). Somit wird s'(x) für 0 ≤ x ≤ N gemäß der Beziehung 1/9 = x/7 gelöst, wobei x = 7/9. Mit anderen Worten werden die gemäß dem 10:8-Skalierungsverhältnis hergeleiteten Bilddatenpunkte s'(x) von Fig. 2B erneut als Probe genommen für s(x) bei 0, 7/9, 14/9, 21/9, 28/9, 35/9, 42/9, 49/9, 56/9 und 7 bezüglich der ursprünglichen i-Achse. Im allgemeinen ist das neue Probennahme-Intervall einschließlich der beiden Endpunkte gegeben durch: Δx = N'-1/N-1
Fig. 2C zeigt ein Beispiel für Abwärts- Skalieren durch durch Wieder- Probennahme (oder Abwärts-Probennahme) in einer Dimension, bei der ein 2:5- Skalierungsverhältnis gewählt wird und der Nullindex-Punkt (d.h. der Endpunkt) ignoriert wird. Das Skalierungsverhältnis von 2:5 zeigt an, daß nur 0,4 von der Anzahl der ursprünglich als Probe genommenen Punkte erneut als Probe genommen werden müssen. Auflösen der Beabstandung zwischen erneut als Probe genommenen Bilddatenpunkten ergibt einen Wert von 2,5. Somit fallen die durch die Werte für x bezeichneten erneut als Probe genommenen Punkte in den gegebenen Bereich von 0 ≤ x ≤ 7 (wobei die Null-Endpunkte ausgelassen werden) für s'(x) gleich 2,5 und 5,0, wie in Fig. 2C gezeigt. Der Abstand zwischen benachbarten Pixeln ist der Kehrwert des Probennahme-Verhältnisses.

Vergrößern eines Bildes durch Interpolation

Ein spezieller Fall der Skalierung durch Wieder-Probennahme ist das Vergrößern eines Bildes durch Interpolation, und zwar definiert als der Prozeß der Erzeugung (durch Annäherung) einer Anzahl N' von rekonstruierten Bilddatenpunkten s'(x), die größer als die ursprüngliche Anzahl N von Bilddatenpunkten s(i) ist.
Fig. 3 ist ein Blockdiagramm eines bevorzugten Ausführungsbeispiels eines Verfahrens zum Skalieren durch Wieder-Probennahme bei einem Bild aus zweidimensionalen Daten, bei dem das Erstdimension-Skalierungsverhältnis und das Zweitdimension-Skalierungsverhältnis gleich und von eins verschieden sind. Der Vorwärts-DCT-Abschnitt ist mit der Bezugsziffer 10 bezeichnet, während der Hybrid- IDCT-Abschnitt mit der Bezugsziffer 12 bezeichnet ist. Eine erste räumliche Matrix s(j,i), wie bei der Vorwärts-DCT-Gleichung (3), wird in einem Block 20 als eine 8X8- Gruppe aus Pixeln in dem Beispiel des Raumbereichs (unten gezeigt) ausgewählt.
Natürlich versteht sich, daß die 8X8-Matrix gewöhnlicherweise nur eine Teilmenge einer größeren Menge ursprünglicher Bilddaten ist, die in kleinere Untermatrizen erneut abgebildet worden ist, die als Eingabe in die erfindungsgemäßen Verfahren und/oder Vorrichtungen dienen. Im JPEG-Format kann die angenommene standardmäßige Untermatrix-Größe 8X8 oder 16X16 sein. Allerdings kann die Pixelgruppe im allgemeinsten Sinn jede geeignete Größe haben, die als Programmparameter oder unmittelbar durch einen Bediener ausgewählt werden kann. Erste räumliche Matrix s(j,i)
Jedes Element der ersten räumlichen Matrix s(j,i) stellt einen Bilddatenpunkt dar, der einem Pixel eines Bildes entspricht. Die Pixeldaten werden somit im räumlichen Bereich in Matrixform gespeichert.
Die folgende 8X8-Vorwärts-DCT-Basismatrix FB wird in Block 22 erzeugt, indem die Cosinusterme von Gleichung (3) für die beiden zweidimensionalen Vorwärts- DCTs ausgewertet werden, indem man zunächst auf u und v und dann auf i und j indexiert. Vorwärts-DCT-Basismatrix FB
Eine erste Zwischenmatrix I&sub1;, wie unten gezeigt, ist eine 8X8-Matrix, die im Multiplizierer 25 durch Matrixprodukt-Multiplikation der 8X8-Vorwärts-DCT- Basismatrix FB mit der ersten räumlichen 8X8-Matrix s(j,i) erzeugt wird (d.h. I&sub1; = FB * s(j,i)) Erste Zwischenmatrix I&sub1;
Im Block 24 wird die folgende erste transponierte 8X8-Matrix FBT erzeugt, indem die obige Vorwärts-DCT-Basismatrix FB transponiert wird. Erste transponierte Matrix FBT
Die erste 8X8-Zwischenmatrix I&sub1; wird anschließend im Multiplizierer 26 mit der ersten transponierten 8X8-Matrix FBT matrixprodukt-multipliziert, um die folgende 8X8- DCT-Matrix S(v,u) aus DCT-Koeffizienten gemäß der Definition in Gleichung (3) zu erzeugen (d.h. S(v,u) I&sub1; * FBT). DCT-Matrix S(v,u)
Sobald die DCT-Matrix S(v,u) wie oben gezeigt bestimmt ist, wird üblicherweise Gleichung (4) verwendet, um eine zweite räumliche Matrix s(j,i) aus rekonstruierten Bilddatenpunkten zu erzeugen, die von der inversen diskreten Cosinustransformation der DCT-Matrix S(v,u) hergeleitet werden.
Das erfinderische Verfahren von Fig. 3 ermöglicht die Wieder-Probennahme zum Erzeugen einer unendlichen Anzahl rekonstruierter Bilddatenpunkte s'(y,x) in zweidimensionaler Form über die gegebenen Bereiche der Hybrid-IDCT von Gleichung (6). Die Werte der reellen Zahlen der Indizes x und y werden gemäß den zuvor für das Beispiel der eindimensionalen IDCT von Fig. 2B diskutierten Skalierungsverhältnisse bestimmt. (6)
für 0 ≤ x ≤ (N-1) und 0 ≤ y ≤ (M-1),
wobei s'(y,x) eine zweidimensionale Matrix aus rekonstruierten Bilddatenpunkten ist;
S(v,u) eine zweidimensionale Matrix aus DCT-Koeffizienten darstellt;
N die Anzahl der DCT-Koeffizienten in der ersten Dimension darstellt;
M die Anzahl der DCT-Koeffizienten in der zweiten Dimension darstellt;
CU = 1/ 2 für u=0;
CU=1 für u≠0
Cv=1/ 2 für v=0; und
Cu=1 für v≠0.
Da as Erstdimension-Skalierungsverhältnis gleich dem Zweitdimension- Skalierungsverhältnis für das bevorzugte Ausführungsbeispiel von Fig. 3 ist, gilt dann N'=M' (Ausgabepixel in der zweiten Dimension) für Gleichung (6).
Die herkömmliche Größe einer zweidimensionalen IDCT-Basismatrix ist 8X8 in Übereinstimmung mit dem obigen JPEG-Standard von Gleichung (4). Um die Ausmaße jeder Pixelgruppe um 25% zu vergrößern, werden das Erstdimension- Skalierungsverhältnis und das Zweitdimension-Skalierungsverhältnis in Block 23 jeweils als 10:8 gewahlt. Mit anderen Worten, N'=M'=10, was bedeutet, daß die in Block 30 erzeugte Hybrid-IDCT-Basismatrix IB1HYB der ersten Dimension eine 10X8-Matrix ist, wie unten gezeigt. Hybrid-IDCT-Basismatrix IB1HYB der ersten Dimension
Beim Multiplizlerer 32 wird eine zweite 10X8-Zwischenmatrix I&sub2; (unten gezeigt) durch Matrixprodukt-Multiplikation der Erstdimension-Hybrid-IDCT- Basismatrix IB1HYB mit der 8X8-DCT-Matrix S(v,u) erzeugt, d.h. I&sub2; = IB1HYB * S(v,u). Zweite Zwischenmatrix I&sub2;
Die Erstdimension-Hybrid-IDCT-Basismatrix IB1HYB wird in Block 28 transponiert, um die folgende zweite transponierte 8X10-Matrix IB1HYBT zu erzeugen. Zweite transponierte Matrix IB1HYBT
Schließlich wird in Multiplizier 33 die zweite räumliche 10X10-Matrix s'(y,x) der Gleichung (6), welche die rekonstruierten Bilddatenpunkte der ersten räumlichen 8X8-Matrix s(j,i) darstellt, wie folgt durch Matrixprodukt-Multiplikation der zweiten 10X8-Zwischenmatrix I&sub2; mit der zweiten transponierten 8X10-Matrix IB1HYBT bestimmt (d.h. s'(y,x)=I&sub2; * IB1HYBT). Zweite räumliche Matrix s'(y,x)
Die zweite räumliche Matrix s'(y,x) liefert rekonstruierte Bilddatenpunkte, welche für die Reproduktion des Bildes in Block 36 verwendet werden. Man beachte, daß das ursprüngliche Bild des obigen Beispiels zweidimensionaler Interpolation durch eine 8X8-Pixelgruppe dargestellt wurde, die durch Wieder-Probennahme unter Verwendung von Interpolation zu einer 10X10-Pixelgruppe vergrößert wurde, und zwar gemäß der Erstdimension-Hybrid-IDCT-Basismatrix IB1HYB, die wie oben beschrieben von der Gleichung (6) hergeleitet wurde. Dieses Verfahren erleichtert die Bildvergrößerung mit hoher Zuverlässigkeit ohne die Auflösung zu beeinträchtigen.
Das obige bevorzugte Ausführungsbeispiel des Verfahrens von Fig. 3 ist für zweidimensionale Daten geeignet, wenn: das Erstdimension-Skalierungsverhältnis gleich eins ist und das Zweitdimension-Skalierungsverhältnis nicht gleich eins ist; das Erstdimension-Skalierungsverhältnis nicht gleich eins ist und das Zweitdimension- Skalierungsverhältnis gleich eins ist; und das Erstdimension-Skalierungsverhältnis nicht gleich eins ist, das Zweitdimension-Skalierungsverhältnis nicht gleich eins ist und das Erstdimension-Skalierungsverhältnis gleich dem Zweitdimension-Skalierungsverhältnis ist. Wenn unterschiedliche Skalierungsverhältnisse durch unabhängige Wieder- Probennahme der Bilddatenpunkte für jede Dimension ausgewählt werden, wird das Verfahren von Fig. 3 modifiziert, wie es in Fig. 4 zum Ausdruck kommt.
Fig. 4 ist ein mit einem Vorwärts-DCT-Abschnitt 10 und einem Hybrid-IDCT- Abschnitt 12 ausgestattetes Blockdiagramm eines zweiten Ausführungsbeispiels eines Verfahrens zum Skalieren eines Bildes in zweidimensionaler Form, bei dem das Erstdimension-Skalierungsverhältnis nicht gleich eins ist, das Zweitdimension- Skalierungsverhältnis nicht gleich eins ist und das Erstdimension-Skalierungsverhältnis nicht gleich dem Zweitdimension-Skalierungsverhältnis ist. So wird z.B. für eine erste räumliche 8X8-Matrix s(j,i) das Erstdimension-Skalierungsverhältnis in Block 23 als 10:8 gewählt (N' = 10), während das Zweitdimension-Skalierungsverhältnis als 12:8 (M' = 12) gewählt wird. In diesem Fall wird die Erstdimension-10X8-Hybrid-IDCT- Basismatrix IB1HYB in Block 30 erstellt, und die Zweitdimension-8X12-Hybrid-IDCT- Basismatrix IB2HYB wird in Block 38 erstellt. Der Multiplizierer 44 erzeugt die zweite 10X8-Zwischenmatrix-I&sub2; durch Matrixprodukt-Multiplikation der Erstdimension- Hybrid-IDCT-Basismatrix IB1HYB mit der 8X8-DCT-Matrix S(v,u). Im Multiplizierer 46 wird die zweite räumliche Matrix s'(j,i) durch Matrixprodukt-Multiplikation der zweiten 10X8-Zwischenmatrix-I&sub2; mit der Zweitdimension-8X12-Hybrid-IDCT-Basismatrix IB2HYB erzeugt (d.h. s'(y,x) = I&sub2; * IB2HYB). Ausgehend von der zweiten räumlichen Matrix s'(j,i) kann das Bild gedruckt, verarbeitet oder in Block 36 anderweitig rekonstruiert werden.
Eine Vorrichtung, die dem Verfahren von Fig. 3 entspricht, ist in Fig. 5 gezeigt. Ein Vorwärts-Diskret-Cosinustransformation-Prozessor 50 transformiert die erste räumliche Matrix s(j,i) in eine DCT-Matrix S(v,u) im dem Matrixmultiplizierer 54. Nach dem Verarbeiten der DCT-Matrix S(v,u) z.B. im Frequenzbereich für die Kompression (in einem nicht gezeigten Prozessor) wird die zweite räumliche Matrix s'(y,x) rekonstruierter Bilddatenpunkte in dem Matrixmultiplizierer 66 des Hybrid-IDCT- Prozessors 62 erstellt.
Eine digitale Darstellung eines Bildes (nicht gezeigt) wird durch die erste räumliche Matrix s(j,i) dargestellt und in den Vorwärts-DCT-Prozessor 50 eingegeben, der einen Cosinus-Prozessor 52, einen Transponierer 51 und einen Matrixmultiplizierer 54 enthält. Der Cosinus-Prozessor 52 erzeugt die Vorwärts-DCT-Basismatrix FB im DCT-Bereich durch Verarbeiten der Cosinusterme von Gleichung (3). Der Transponierer 51 erzeugt die erste Transponierte Matrix FBT durch Transponieren der Vorwärts-DCT-Basismatrix FB. Der Matrixmultiplizierer 54 erzeugt anfänglich die erste Zwischenmatrix I&sub2; durch Matrixprodukt-Multiplikation der Vorwärts-DCT- Basismatrix FB mit der ersten räumlichen Matrix s(j,i). Der Matrixmultiplizierer 54 erzeugt dann die DCT-Matrix S(v,u) aus DCT-Koeffizienten im Frequenzbereich durch Matrixprodukt-Multiplikation der ersten Zwischenmatrix I&sub2; mit der ersten transponierten Matrix FBT.
Wenn man will, kann die DCT-Matrix S(v,u) in einem Mikroprozessor oder einer anderen geeigneten Schaltung (nicht gezeigt) in ihrer Größe verringert (d.h. dezimiert) werden. Die Interpolation wird üblicherweise im räumlichen Bereich in Form von linearer Interpolation durchgeführt. Die Interpolation oder Erhöhung der Anzahl rekonstruierter Bilddatenpunkte s'(y,x) kann in dem Hybrid-IDCT-Prozessor 62 erzielt werden, der einen Wieder-Probennahme-Cosinusprozessor 64, einen Transponierer 76 und einen Matrixmultiplizierer 66 enthält. Der Wieder-Probennahme-Cosinusprozessor 64 erzeugt eine Erstdimension-Hybrid-IDCT-Basismatrix IB1HYB als Reaktion auf das am Anschluß 68 empfangene Erstdimension-Skalierungsverhältnis zusammen mit dem Zweitdimension-Skalierungsverhältnis. Man beachte, daß das Erstdimension- Skalierungsverhältnis nicht gleich eins ist, das Zweitdimension-Skalierungsverhältnis nicht gleich eins ist und das Erstdimension-Skalierungsverhältnis gleich dem Zweitdimension-Skalierungsverhältnis ist. Die Elemente der Erstdimension-Hybrid- IDCT-Basismatrix IB1HYB werden von den Erstdimension-Cosinustermen von Gleichung (6) hergeleitet. Der Tansponierer 76 erzeugt die zweite tranponierte Matrix IB1HYBT durch Transponieren der Erstdimension-Hybrid-IDCT-Basismatrix IB1HYB. Die zweite Zwischenmatrix I&sub2; wird durch Matrixprodukt-Multiplikation der Erstdimension- Hybrid-IDCT-Basismatrix IB1HYB mit der DCT-Matrix S(v,u) im Matrixmultiplizierer 66 erzeugt. Schließlich erzeugt der Matrixmultiplizierer 66 die zweite räumliche Matrix s'(y,x) durch Matrixprodukt-Multiplikation der zweiten Zwischenmatrix I&sub2; mit der zweiten transponierten Matrix IB1HYBT. Das Bild kann nun gedruckt oder unter Verwendung der rekonstruierten Bilddaten s'(y,x) anderweitig rekonstruiert werden.
Die obigen Verfahren von Fig. 3 und 4 zum Vergrößern eines Bildes durch Interpolation können auch zum Verkleinern eines Bildes durch Dezimierung unter Verwendung von Abwärts-Probennallme verwendet werden, wobei die Skalierungsverhältnisse kleiner als eins gewählt werden, und die Bilddaten verhalten sich für diese Anwendung ordentlich. Um jedoch beste Ergebnisse zu erzielen, wird vor dem Verfahren zum Verkleinern eines Bildes durch Dezimierung unter Verwendung von Abwärts-Probennahme im allgemeinen eine Tiefpaß-Filterung durchgeführt, um Hochfrequenz-Komponeneten zu beseitigen, die eine Aliasing-Verzerrung bewirken könnten.

Filtern

Üblicherweise treten beim Filtern eines Bildes im DCT-Bereich auf ähnliche Weise wie bei einer mathematischen Faltung im Raumbereich Operationen mit einer Matrix aus DCT-Koeffizienten auf, die von einer Matrix aus Kernwerten hergeleitet werden, die als eine DCT-Kernmatrix aus DCT-Kernkoeffizienten dargestellt werden.
Die Faltung eines Bildes ist gemäß dem Verständnis eines Fachmanns ein Filterungsprozeß im räumlichen Bereich durch punktweises Multiplizieren zweier diskreter Signale mit anschließendem Summieren der Produkte über geeignete Grenzen. Im allgemeinen führt eine Faltung zu einer Filterung durch Schärfen oder Glätten eines Bildes. Das Schärfen verbessert verschwommene Bilder, insbesondere durch Verstärken von Hochfrequenz-Komponenten, die Ränder bzw. Kanten in einem Bild darstellen, während das Glätten die Ränder eines Bildes weich macht. Der Kern wird definiert als die Signalwerte eines Filters, das zur Durchführung einer spezifischen Filteroperation verwendet wird, wie z.B. Schärfen oder Glätten im Raum- oder Fraquenzbereich. Der Kern kann im Raum- oder Frequenzbereich je nach den vorbestimmten Kriterien für das Schärfen, Glätten oder dergleichen gewählt werden.
Bekannte Verfahren zum Filtern eines Bildes im Frequenzbereich auf ähnliche Weise wie bei einer mathematischen Faltung im Raumbereich erfordern das Berechnen komplexer Zahlen, wenn der Kern wie zuvor beschrieben verarbeitet wird. Das folgende im DCT-Bereich durchgeführte Filterverfahren umgeht die Notwendigkeit der Berechnung imaginärer Zahlen, wenn der Kern verarbeitet wird, wodurch die Rechenkomplexität, Zeit und Aufwand minimiert werden.
Bilddaten werden im DCT-Bereich auf eine Art gefiltert, die einer Faltung im Raumbereich für eindimensionale Daten mathematisch äquivalent ist, und zwar durch: (1) Erstellen einer DCT-Matrix S(u) aus DCT-Koeffizienten, indem man eine diskrete gerade Cosinustransformation (DECT) einer ersten räumlichen Matrix s(i) aus Bilddatenpunkten durchführt; (2) Erstellen einer DOCT-Matrix H(u) aus DOCT- Koeffizienten, indem man eine diskrete ungerade Cosinustransformation (DOCT) einer Kernmatrix h(i) durchführt; (3) Erstellen einer masken-multiplizierten Matrix durch Maskenmultiplikation von S(u) mit H(u); und (4) Erstellen einer zweiten räumlichen Matrix s'(i) aus rekonstruiereten Bilddatenpunkten, indem man eine IDCT der maskenmultiplizierten Matrix durchführt. Der Fachmann versteht, daß eine diskrete gerade Cosinustransformation (DECT) übereinstimmend als diskrete Cosinustransformation (DCT) bezeichnet wird. Auch ist einem bevorzugten Ausführungsbeispiel der Kern h(i) ungerade und symmetrisch.
Da Bilder veränderliche Mengen an hochfrequentem Inhalt enthalten, kommt es während den Transformationsoperationen oft zu Aliasing-Verzerrungen. Wenn die Menge an hochfrequentem Inhalt problematisch ist,. würde das obige Filterverfahren desweiteren die folgenden Schritte aufweisen: Auswählen einer Überlappung aneinanderliegender erster räumlicher Matrizen s(i) vor dem Erstellen von DCT- Matrizen S(u); und Erstellen gefilterter gesicherter Bereich s's(i) aus den zweiten räumlichen Matrizen s'(i) durch Entfernen gewisser ausgewählter Elemente der zweiten räumlichen Matrizen s'(i).
Mathematisch ist der eindimensionale Ausdruck für das Filtern auf eine Weise, die einer mathematischen Faltung äquivalent ist, durch Gleichung (7) definiert.
s(i) h(i) E> S(u) H(u) (7)
wobei s(i) die erste räumliche Matrix aus Bilddatenpunkten darstellt;
h(i) die Kernmatrix im räumlichen Bereich darstellt;
s(i) h(i) das Filtern oder die Faltung von s(i) mit h(i) darstellt;
H(u) die von h(i) hergeleitete DOCT-Matrix darstellt;
S(u) die von s(i) hergeleitete DCT-Matrix darstellt;
i und u gannzahlige Indizes sind;
der Faltungsoperator ist; und
für die Maskenmultiplikation steht.
Die obige DCT-Matrix S(u) für eindimensionale Daten wird von der Gleichung (1) hergeleitet, während die eindimensionale DOCT-Matrix H(u) wie im folgenden gezeigt aus der Gleichung (8) hergeleitet wird, wobei h(i) ein ungerader symmetrischer Kern der Größe k ist.
für 0 ≤ u ≤ (N-1);
wobei N die Größe des verwendeten DCT-Blocks darstellt;
h(i) = 0 für i > (k-1)/2;
di = 1/2 für i=0;
d&sub1; = 1 für i = 1,2,..., (N-1);
i,u und N ganzzahlig sind; und
k die Kerngröße ist.
Natürlich könnte die obige mathematische Filter-Analysis ohne weiteres auf Bilddaten erweitert werden, die in jeglicher Anzahl von Dimensionen vorliegen.
Ein bevorzugtes Ausführungsbeispiel eines Verfahrens zum Filtern zweidimensionaler Bilddaten im DCT-Bereich auf eine Weise, die einer mathematischen Faltung im Raumbereich äquivalent ist, ist in Fig. 6 beschrieben und enthält einen Vorwärts-DCT-Abschnitt 10 mit Schritten, die zu den zuvor für das Interpolationsverfahren von Fig. 3 beschriebenen identisch sind. Als Beispiel wird die unten aufgeführte erste räumliche 8X8-Matrix s(j,i) aud 64 Bilddatenpunkten in Block 20 ausgewählt, wie unten gezeigt. Erste räumliche Matrix s(j,i)
Die folgende 8X8-Vorwärts-DECT-Basismatrix FBE wird von den Cosinustermen aus Gleichung (3) in Block 22 hergeleitet. Vorwärts-DECT-Basismatrix FBE
Die folgende erste 8X8-Zwischenmatrix I&sub2; wird im Multiplizierer 25 durch Matrixprodukt-Multiplikation der 8X8-Vorwärts-DECT-Matrix FBE mit der ersten räumlichen 8X8-Matrix s(j,i) erstellt. Erste Zwischenmatrix I&sub1;
Im Block 24 wird die folgende erste transponierte 8X8-Matrix FBET durch Transponieren der der obigen 8X8-Vorwärts-DCT-Basismatrix FBE erstellt. Erste transponierte Matrix FBET
Die erste Zwischenmatrix I1 wird im Multiplizierer 26 mit der ersten transponierten Matrix FBET matrixprodukt-multipliziert, um die folgende DCT-Matrix S(v,u) aus DCT- Koeffizienten zu erstellen, wie in Gleichung (3) definiert (d.h. S(v,u) = I&sub1; * FBET). DCT-Matrix S(v,u)
Die oben beschriebenen Schritte vervollständigen die Bestimmung der in Gleichung (7) notwendigen zweidimensionalen Vorwärts-DECT-Matrix S(v,u). Dann muß die zweidimensionale Vorwärts-DOCT-Matrix H(v,u) bestimmt werden. Der folgende ungerade symmetrische 5X5-Kern h(j,i) im Raumbereich wurde in Block 124 willkürlich ausgewählt, um das bevorzugte Ausführungsbeispiel des Filterprozesses zu veranschaulichen. Kernmatrix h(j,i)
Um die Multiplikation der 5X5-Kernmatrix h(j,i) mit anderen 8X8-Matrizen (für dieses Beispiel und in Übereinstimmung mit der internationalen JPEG- Standard-Matrixgröße ausgewählt) zu erleichtern, wird die 5X5-Kernmatrix h(j,i) in Block 122 "gefüllt" bzw. "gepolstert", um eine "gefüllte" 8X8-Kernmatrix hp(j,i) im Raumbereich zu erstellen. Das Füllen wird erreicht, indem man den unteren rechten Quadranten des ungeraden symmetrischen Kerns in den oberen linken Quadranten der gefüllten Kernmatrix hp(j,i) einfügt und dann die verbleibenden Elemente von hp(j,i) gleich Null setzt; wie unten gezeigt. Gefüllte Kernmatrix hp(j,i)
Die zweidimensionale DOCT-Matrix H(v,u) wird wie folgt von Gleichung (9) hergeleitet.
für 0≤u≤N-1 und 0≤v≤N-1,
wobei hp(j,i) die zweidimensionale gefüllte Kernmatrix ist;
N die Anzahl der Elemente von hp(j,i) in der ersten Dimension ist;
M die Anzahl der Elemente von hp(j,i) in der zweiten Dimension ist;
di=1/2 für i=0;
di=1 für i=1,2,...,(N-1);
dj=1/2 für j=0;
dj=1 für i= 1,2,..., (M-1);
i, j, u, v, N, M ganzzahlig sind;
hp(j,i) = 0 für i oder j > (k-1)/2; und
k eine vorbestimmte Kerngröße ist.
Eine 8X8-Vorwärts-Basismatrix FB&sub0; (unten aufgelistet) wird von den Cosinustermen der Gleichung (9) hergeleitet. Vorwärts-DOCT-Basismatrix FB&sub0;
Im Multiplizierer 128 wird die folgende zweite 8X8-Zwischenmatrix I&sub2; durch Matrixprodukt-Multiplikation der 8X8-Vorwärts-DOCT-Basismatrix FB0 mit der gefüllten 8X8-Kermnatrix hp(j,i) erstellt. Zweite Zwischenmatrix I&sub2;
Die 8X8-Vorwärts-DOCT-Basismatrix FB&sub0; wird in Block 130 transponiert, um die folgende zweite transponierte 8X8-Matrix FB&sub0;T zu erzeugen. Zweite transponierte Matrix FB&sub0;T
Der Multiplizierer 136 erstellt die folgende 8X8-Vorwärts-DOCT-Matrix H(v,u) durch Matrixprodukt-Multiplikation der zweiten 8X8-Zwischenmatrix I&sub2; mit der zweiten transponierten Matrix FB&sub0;. Vorwärts-DOCT-Matrix H(v,u)
An diesem Punkt sind nun beide Funktionen S(v,u) und H(v,u) auf der rechten Seite der Gleichung (7) bestimmt. Somit wird in dem Maskenmultiplizierer 144 durch Maskenmultiplikation der 8X8-Vorwärts-DCT-Matrix S(v,u) mit der 8X8-Vorwärts- DOCT-Matrix H(v,u) die folgende dritte 8X8-Zwischenmatrix I&sub3; erstellt. Dritte Zwischenmatrix I&sub3;
Um das gefilterte Bild zu rekonstruieren, werden die DCT-Koeffizienten der dritten Zwischenmatrix I&sub3; zunächst in den Raumbereich transformiert. Die unten gezeigte zweite räumliche Matrix s'f(j,i) aus gefilterten rekonstruierten Bilddatenpunkten wird in Block 140 erstellt, indem eine inverse diskrete Cosinustransformation wie in Gleichung (4) an der dritten 8X8-Zwischenmatrix I&sub3; durchgeführt wird. Das gefilterte Bild kann dann gedruckt oder anderweitig von den gefilterten rekonstruierten Bilddatenpunkten der zweiten räumlichen Matrix s'f(j,i) wiedergegeben werden. Zweite räumliche Matrix s'(j,i)
Wie schon früher gesagt, ist das obige Verfahren angemessen, wenn das Bild relativ frei von Aliasing-Verzerrungen aufgrund von Hochfrequenz-Komponenten ist. Bei vielen Bildern ist jedoch das Hinzufügen eines Überlappungsvorgangs in dem obigen Filterverfahren erforderlich, das auf das Entfernen von Aliasing-Verzerrungen aufgrund von Hochfrequenz-Komponenten abzielt. Wenn die Hochfrequenz-Komponenten die gewünschte Bildqualität nicht wirkungsvoll stören, kann das Überlappungsverfahren ausgelassen werden, und die obige zweite räumliche Matrix s'(j,i) eignet sich, um das ursprüngliche Bild zu drucken oder anderweitig wiederzugeben. In dem Fall, daß eine Aliasing-Verzerrung ein Problem darstellt, wird ein Überlappungsverfahren, wie das weiter unten anhand von Fig. 7 beschriebene, zusammen mit dem oben beschriebenen Verfahren eingerichtet, wobei gewisse rekonstruierte Bilddatenpunkte der zweiten räumlichen Matrix s'(j,i) in Block 142 entfernt werden, was zu einem gefilterten gesicherten Bereich führt, der als s's(j,i) bezeichnet wird.
Für eine Kerngröße von 5X5, d.h. k = 5, wird eine (k-1)-Überlappung von vier Pixeln zwischen Pixelgruppen verwendet, um einen gesicherten 4X4-Bereich aus gefilterten Pixeln für eine 8X8-Gruppe aus zu verarbeitenden Pixeln bereitzustellen. Somit findet beim Filtern mit einer Überlappung auf eine Weise, die ähnlich einer mathematischen Faltung ist, vorzugsweise eine Überlappung jeder 8X8-Pixelgruppe des Bildes mit jeder angrenzenden Pixelgruppe um vier Pixel statt.
Fig. 7 veranschaulicht ein bevorzugtes Ausführungsbeispiel des Überlappungsvorgangs, bei dem ein Bild 150 durch in zwölf Zeilen und zwölf Spalten angeordnete Pixel dargestellt ist. Eine erste 8X8-Pixelgruppe 152 aus 64 Bilddatenpunkten überspannt die Zeilen 1-8 und die Spalten 1-8, wie durch die schwarze durchgezogene Linie gezeigt. Eine zweite 8X8-Pixelgruppe 154 aus 64 Bilddatenpunkten überspannt die Zeilen 1-8 und die Spalten 5-12, wie durch eine gestrichelte Linie gezeigt. Jede Pixelgruppe steht für eine zweidimensionale erste räumliche Matrix s(j,i) zum Filtern gemäß dem obigen Verfahren von Fig. 8 einschließlich Überlappung Der Überlappungsbereich ist in Fig. 7 als die Fläche einschließlich der Zeilen 1-8 und der Spalten 5-8 gezeigt. Obwohl das Beispiel von Fig. 7 eine Überlappung von Matrizen zeigt, die in Bild 150 horizontal benachbart sind, läßt sich dasselbe Verfahren auf Matrizen anwenden, die in Bild 150 vertikal benachbart sind.
Nachdem die erste räumliche Matrix s(j,i) (als erste Pixelgruppe 152 definiert) im DCT-Bereich verarbeit und gefiltert worden ist, wird die zweite räumliche Matrix s'(j,i) aus rekonstruierten Bilddatenpunkten durch eine IDCT der dritten Zwischenmatrix I&sub3; in Block 140 von Fig. 6 erzeugt. Dann wird in Block 142 ein Randoder Grenzgebiet der zweiten räumlichen Matrix s'(j,i) als (k-1)/2 Pixel breit bestimmt, und die rekonstruierten Bilddatenpunkte innerhalb des Randgebietes werden entfernt. Die verbleibenden Pixel bilden die gesicherte Matrix s's(j,i) aus gefilterten rekonstruierten Pixeln. In Fig. 7 werden alle rekonstruierten Bilddatenpunkte für Block 152, die sich in den Zeilen und Spalten 1, 2, 7 und 8 befinden, entfernt, was zu der gesicherten Matrix s's(j,i) aus rekonstruierten Bilddatenpunkten führt, die sich in den Zeilen 3-6 und den Spalten 3-6 befinden. Für die zweite Pixelgruppe 154 enthält die zweite räumliche Matrix s's(j,i) aus rekonstruierten Bilddatenpunkten die Zeilen 1-8 und die Spalten 5-12. Die rekonstruierten gefilterten Pixel, die in Block 142 für die zweite Pixelgruppe 154 entfernt wurden, enthalten alle rekonstruierten Pixel in den Zeilen 1, 2, 7 und 8 sowie den Spalten 5, 6, 11 und 12. Die gesicherte Matrix s's(j,i) der zweiten Pixelgruppe 154 enthält rekonstruierte Bilddatenpunkte, die sich in den Zeilen 3-6 und den Spalten 7-10 befinden.
In dem Fall, daß das Filtern des Bildes im Frequenzbereich durch ein einer mathematischen Faltung im Raumbereich ähnliches Verfahren mit dem Skalieren des Bildes kombiniert wird, wird die Überlappung bestimmt, indem man die Kerngröße k betrachtet.
Ein Filtersystem, das gemäß dem Verfahren von Fig. 6 arbeitet, ist in dem schematischen Blockdiagramm von Fig. 8 geschildert. Das System enthält einen Vorwärts-DECT-Prozessor 50, einen Vorwärts-DOCT-Prozessor 158, einen Nullenfüll-Prozessor 159, einen Maskenmultiplizierer 156 und einen IDCT-Prozessor 160. Der IDCT-Prozessor 160 könnte ohne weiteres durch einen Hybrid-IDCT- Prozessor ersetzt werden, wie zuvor anhand von Fig. 3 und 4 beschrieben.
Der DECT-Prozessor 50 enthält einen Cosinus-Prozessor 52, einen Transponierer 51 und einen Matrixmultiplizierer 54. Die erste räumliche Matrix s(j,i) wird ausgewählt als eine 8X8-Matrix aus Bilddatenpunkten, und die Vorwärts-DECT- Basismatrix FBE wird in Block 52 als eine 8X8-Matrix aus den Cosinustermen von Gleichung (3) erzeugt. Die erste transponierte Matrix FBET wird als eine 8X8-Matrix erzeugt, indem man die Vorwärts-DECT-Basismatrix FBE in dem Transponierer 51 transponiert. Die erste Zwischenmatrix I&sub1; wird als eine 8X8-Matrix in dem Matrixmultiplizierer 54 durch Matrixprodukt-Multiplikation der Vorwärts-DECT- Basismatrix FBE mit der ersten räumlichen Matrix s(j,i) erstellt. Die Vorwärts-DECT- Matrix S(v,u) wird dann in dem Matrixmultiplizierer 54 als eine 8X8-Matrix durch Matrixprodukt-Multiplikation der ersten 8X8-Zwischenmatrix I&sub1; mit der ersten transponierten 8X8-Matrix FBET erstellt.
Der DOCT-Prozessor 158 enthält einen Cosinus-Prozessor 118, einen Transponierer 115 und einen Matrixmultiplizierer 157. Da die erste räumliche Matrix s(j,i) als eine 8X8-Matrix aus Bilddatenpunkten in dem Vorwärts-DECT-Prozessor 50 ausgewählt wurde, wird die Vorwärts-DOCT-Basismatrix FB&sub0; ebenfalls als eine 8X8- Matrix in dem Cosinus-Prozessor 118 aus den Cosinustermen von Gleichung (9) erstellt. Die zweite transponierte Matrix FB&sub0;T wird in dem Transponierer 115 als eine 8X8-Matrix erzeugt, indem die Vorwärts-DOCT-Basismatrix FB&sub0; transponiert wird. Die Kernmatrix h(j,i) wird in den Nullenfüll-Prozessor 159 eingegeben, der die gefüllte 8X8-Kernmatrix hp(j,i) erstellt. Der Matrixmultiplizierer 157 erstellt die zweite Zwischenmatrix I&sub2; als 8X8-Matrix durch Matrixprodukt-Multiplikation der Vorwärts- DOCT-Basismatrix FB&sub0; mit der gefüllten Kernmatrix hp(j,i). Die Vorwärts-DOCT- Matrix H(v,u) wird dann als 8X8-Matrix in dem Matrixmultiplizierer 157 durch Matrixprodukt-Multiplikation der zweiten Zwischenmatrix I&sub2; mit der zweiten transponierten Matrix FB&sub0;T erstellt.
Der Maskenmultiplizierer 156 erzeugt die dritte Zwischenmatrix I&sub3; als 8X8- Matrix durch Maskenmultiplikation der Vorwärts-DECT-Matrix S(v,u) mit der Vorwärts-DOCT-Matrix H(v,u).
Der IDCT-Prozessor 160 enthält einen Cosinus-Prozessor 162, einen Transponierer 164 und einen Matrixmultiplizierer 166. Der Cosinus-Prozessor 162 erstellt eine 8X8-IDCT-Basismatrix IB aus den Cosinustermen von Gleichung (4). Eine dritte transponierte Matrix IBT wird 8X8-Matrix in dem Transponierer 164 erzeugt, indem die IDCT-Basismatrix IB transponiert wird. Eine vierte Zwischenmatrix I&sub4; wird in dem Matrixmultiplizierer 166 als 8X8-Matrix durch Matrixprodukt-Multiplikation der IDCT-Basismatrix IB mit der dritten Zwischenmatrix I&sub3; erstellt. Schließlich wird die zweite räumliche Matrix s'(j,i) aus rekonstruierten Bilddatenpunkten in dem Matrixmultiplizierer 166 durch Matrixprodukt-Multiplikation der vierten Zwischenmatrix I&sub4; mit der dritten transponierten Matrix IBT erstellt. Die zweite räumliche Matrix s'(j,i) kann verwendet werden, um das gefilterte Bild zu drucken oder anderweitig wiederzugeben. Wenn jedoch aufgrund von Rauschen eine Aliasing- Verzerrung ein Problem darstellt, könnte Überlappungs-Hardware (nicht gezeigt) hinzugefügt werden, um eine Aliasing-Verzerrung mittels der zuvor besprochenen Verfahren des Überlappens aneinanderliegender Pixelgruppen zu verhindern.

Verkleinern eines Bildes durch Dezimierung

Gelegentlich kann es wünschenswert sein, die Größe eines Bildes zum Drucken oder für Anzeigeanwendungen zu verkleinern. Dies kann durch ein als Dezimierung bezeichnetes Verfahren erreicht werden, das als Verkleinerung der Bildgröße durch Entfernen von Datenpunkten definiert ist. Schlüsselmerkmale der obigen Wieder- Probennahme- und Filterverfahren werden in das Verfahren zum Verkleinern eines Bildes durch Dezimierung mit aufgenommen. Tatsächlich ist die Verkleinerung eines Bildes durch Dezimierung ein spezieller Fall der Skalierung, bei dem das Bild durch Abwärts-Probennahme unter Verwendung eines Skalierungsverhältnisses von weniger als eins nach unten skaliert wird.
Üblicherweise führt man eine Tiefpaßfilterung eines Bildes vor dem Verkleinern des Bildes durch Dezimierung durch. Das Tiefpaßfiltern verringert Hochfrequenz- Artifakte. Allerdings ist ein Filtern vor dem Dezimieren in dem Fall nicht notwendig, bei dem die räumliche Aliasing-Verzerrung ohne Auswirkungen auf eine getreue Bildwiedergabe ist. Das schematische Blockdiagramm von Fig. 9 zeigt die Schritte eines Verfahrens zum Verkleinern eines Bildes durch Dezimieren, wie es in dem folgenden bevorzugten Ausführungsbeispiel für zweidimensionale Bilddaten beschrieben ist. Eine Wiederholung einiger der ausführlichen Erklärungen der zuvor beschriebenen Mathematik und Schritte wird der Kürze wegen weggelassen.
Fig. 9 zeigt einen Vorwärts-DECT-Abschnitt 10, einen Filterungsabschnitt 220 und einen Dezimierungsabschnitt 224. Der Vorwärts-DECT-Abschnitt 10 entspricht dem Vorwärts-DCT-Abschnitt 10 von Fig. 3, der Filterungsabschnitt 220 enthält die Filterschritte von Fig. 6, und der Dezimierungsabschnitt steht mit dem Hybrid-IDCT- Abschnitt 12 von Fig. 3 in Beziehung.
Die zweidimensionale DECT-Matrix S(v,u), die wie für das Beispiel der Vergrößerung eines Bildes durch Interpolation in Fig. 3 beschrieben erstellt wird, wird in dem Maskenmultiplizierer 144 mit der Vorwärts-DOCT-Matrix H(v,u) maskenmultipliziert, um eine dritte Zwischenmatrix I&sub3; (d.h. eine masken-multiplizierte Matrix) zu erstellen, wie zuvor für Fig. 6 beschrieben. Der Dezimierungsabschnitt 224 führt eine Abwärts-Probennahme der zweidimensionalen Hybrid-IDCT-Basismatrix in entweder einer oder beiden Dimensionen durch, so daß weniger rekonstruierte Bilddatenpunkte s'(y,x) als die ursprüngliche Anzahl Bilddatenpunkte s(j,i) erzeugt werden. Das verkleinerte Bild (nicht gezeigt) wird dann gedruckt, verarbeitet oder aus den rekonstruierten Bilddatenpunkten s'(y,x) anderweitig rekonstruiert.
Für das bevorzugte Ausführungsbeispiel eines Verfahrens zum Verkleinern eines Bildes durch Dezimierung, wie in Fig. 9 gezeigt, enthält der Vorwärts-DECT-Abschnitt 10 den Schritt der Auswahl der ersten räumlichen Matrix s(j,i) als eine 8X8-Matrix in Block 20. Die 8X8-Vorwärts-DECT-Basismatrix FBE wird in Block 22 aus den Cosinustermen von Gleichung (3) bestimmt. In dem Multiplizierer 25 wird die erste 8X8-Zwischenmatrix I&sub1; durch Matrixprodukt-Multiplikation der Vorwärts-DCT- Basismatrix FBE mit der ersten räumlichen Matrix s(j,i) erstellt. Die erste transponierte Matrix FBET wird als eine 8X8-Matrix in Block 24 erstellt, indem die Vorwärts-DECT- Basismatrix FBE transponiert wird. Der Multiplizierer 26 erzeugt die 8X8-Vorwärts- DECT-Matrix S(v,u) durch Matrixprodukt-Multiplikation von I&sub1; mit der ersten transponierten Matrix FBET. Für dieses Beispiel sind die Werte der ersten räumlichen Matrix s(j,i), der Vorwärts-DECT-Basismatrix FBE, der ersten Zwischenmatrix I&sub1;, der ersten transponierten Matrix FBET und der Vorwärts-DECT.Matrix S(v,u) die gleichen wie die oben für das Beispiel von Fig. 3 aufgelisteten.
Der Filterungsabschnitt 220 enthält den Schritt der in Block 124 stattfindenden Auswahl eines Filterkerns oder Faltungskerns, der im Raumbereich als h(j,i) dargestellt wird. Der Kern wird gemäß den vorbestimmten Kriterien ausgewählt, wie z.B. dem Wunsch, das Bild zu schärfen oder zu glätten. Für unser Beispiel wurde der folgende ungerade, symmetrische 3X3-Kern h(j,i) für das Tiefpaßfiltern willkürlich ausgewählt. Kern h(j,i)
Die unten gezeigte gefüllte 8X8-Kernmatrix h(j,i) wird in Block 122 erstellt, um an die Größe der in Block 20 ausgewählten ersten räumlichen 8X8-Matrix angepaßt zu werden. Gefüllte Kernmatrix hp(j,i)
Die folgende 8X8-Vorwärts-DOCT-Basismatrix FB&sub0; der gefüllten Kernmatrix hp(j,i) wird aus den Cosinustermnen der Gleichung (9) hergeleitet, wie in dem Filterbeispiel von Fig. 6 zuvor beschrieben. Vorwärts-DOCT-Basismatrix FB&sub0;
In dem Multiplizierer 128 wird die 8X8-Vorwärts-DOCT-Basismatrix FB&sub0; mit der gefüllten 8X8-Kernmatrix hp(j,i) matrixprodukt-multipliziert, um die unten gezeigte zweite Zwischenmatrix I&sub2; zu erzeugen. Zweite Zwischenmatrix I&sub2;
Die folgende zweite transponierte 8X8-Matrix FB&sub0;T wird erstellt durch Transponieren der 8X8-Vorwärts-DOCT-Basismatrix FB&sub0; in Block 130. Zweite transponierte Matrix FB&sub0;T
Die weiter unten gezeigte Vorwärts-DOCT-Matrix H(v,u) wird in dem Matrixmultiplizierer 136 durch Matrixprodukt-Multiplikation der zweiten 8X8- Zwischenmatrix I&sub2; mit der zweiten transponierten 8X8-Matrix FB&sub0;T erstellt. Vorwärts-DOCT-Matrix H(v,u)
Die folgende dritte 8X8-Zwischenmatrix I&sub3; wird in dem Maskenmultiplizierer 144 durch Maskenmultiplikation der 8X8-Vorwärts-DECT-Matrix S(v,u) mit der 8X8-Vorwärts- DOCT-Matrix H(v,u) erstellt. Dritte Zwischenmatrix I&sub3;
An diesem Punkt würde nun eine standardmäßige inverse DCT (wie in Gleichung (4)) der obigen dritten Zwischenmatrix I&sub3; zu einer zweiten räumlichen 8X8-Matrix s'(j,i) aus rekonstruierten Bilddatenpunkten führen. Wenn eine Überlappung benachbarter Gruppen von Pixeln als notwendig erachtet wird, um eine Aliasing-Verzerrung zu verhindern (wie zuvor in Übereinstimmung mit den Filterbeispielen von Fig. 6 und 7 besprochen), würde die Überlappung für das Filtern mit der obigen 3X3-Kernmatrix h(j,i) den Wert k-1 oder zwei Pixel betragen, was dazu führt, daß eine ein Pixel breite Umfangsfläche (k-1)/2 der zweiten räumlichen Matrix s'(j,i) entfernt wird. Die entfernten Elemente von s'(j,i) würden alle rekonstruierten Bilddatenpunkte in den Zeilen 1, 8 und den Spalten 1, 8 enthalten. Die gefilterte, gesicherte rekonstruierte Matrix S's(j,i) wäre eine 6X6-Matrix, die 36 rekonstruierte Bilddatenpunkte enthält, die sich in den Zeilen 2-7 und den Spalten 2-7 befinden. Mit anderen Worten würde ein Umfang der Breite eines Pixels von der tiefpaß-gefilterten Version der zweiten räumlichen Matrix s'(j,i) entfernt werden, um eine Aliasing-Verzerrung zu verhindern.
Anstatt unmittelbar eine Standard-IDCT an der dritten Zwischenmatrix I&sub3; durchzuführen, um ein rekonstruiertes gefiltertes Bild voller Größe wie oben beschrieben zu erstellen, kann ein verkleinertes Bild erhalten werden, wenn eine Abwärts-Skalierung oder Abwärts-Probennahme durchgeführt wird, indem das Erstdimension-Skalierungsverhältnis in Block 23A kleiner als eins gewählt wird (d.h. 6:8, wobei N'=6) und das Zweitdimension-Skalierungsverhältnis in Block 23B kleiner als eins gewählt wird (d.h. 6:8, wobei M'=6), wobei für das bevorzugte Ausführungsbeispiel das Erstdimension-Skalierungsverhältnis gleich dem Zweitdimension-Skalierungsverhältnis ist. Herkömmlicherweise war die Auswahl der Skalierungsverhältnisse auf Werte begrenzt, welche ein Bild ohne unangebrachte mathematische Berechnung verkleinern (oder vergrößern). So ist z.B. ein Skalierungsverhältnis von 1:2 typisch, da eine erste räumliche 8X8-Matrix s(j,i) aus Bilddatenpunkten mit der zweiten räumlichen 4X4-Matrix aus sechzehn rekonstruierten Bilddatenpunkten durch das ganzzahlige Vielfache von zwei mathematisch in Beziehung steht. Ein Skalierungsverhältnis von 2:5 wäre hingegen atypisch. Gemäß einem Merkmal der Erfindung kann jedoch jedes beliebige Skalierungsverhältnis für jede Dimension gewählt werden (wie zuvor in dem Verfahren von Fig. 3 und 4 zum Vergrößern eines Bildes durch Interpolation beschrieben). Werte rekonstruierter Bilddatenpunkte der zweiten räumlichen Matrix s'(y,x), die zwischen die indexierten Orte der Bilddatenpunkte der ersten räumlichen Matrix s(j,i) fallen, werden bestimmt, indem man s'(x) nach Werten von x auflöst, die in die passenden Bereiche für u und v in Gleichung (6) fallen. Wenn z.B. ein Wieder-Probennahme-Verhältnis von 2:5 für jede Dimension ausgewählt wird, werden die zu einer Kurve (im Bereich von 0 bis 7) interpolierten Werte von s'(x) bei x = 2,5 und x = 5 für die erste Gruppe aus acht Pixeln ausgewertet, wie gezeigt und unter Bezugnahme auf Fig. 2C besprochen.
Wenn man sowohl das Erstdimension- und das Zweitdimension- Skalierungsverhältnis als 2:5 wählt, wird die folgende 2X8-Hybrid-IDCT-Basismatrix IB1HYB in Block 30 aus den Cosinustermen von Gleichung (6) erstellt. Hybrid-IDCT-Basismatrix IB1HYB
Eine vierte 2X8-Zwischenmatrix I&sub4;, wie unten gezeigt, wird in dem Multiplizierer 32 des Dezimierungsabschnitts 224 durch Matrixprodukt-Multiplikation der 2X8_Hybrid- IDCT-Basismatrix mit der dritten 8X8-Zwischenmatrix I&sub3; erstellt. Vierte Zwischenmatrix I&sub4;
Eine dritte transponierte Matrix IB1HBT (nicht gezeigt) wird in Block 28 durch Transponieren der Hybrid-IDCT-Basismatrix IB1HYBT erstellt. Schließlich wird in dem Multiplizierer 33 die folgende zweite räumliche 2X2-Matrix s'(j,i) aus rekonstruierten gefilterten Bilddatenpunkten durch Matrixprodukt-Multiplikation der vierten 2X8- Zwischenmatrix I&sub4; mit der dritten transponierten 8X2-Matrix IB1HYBT erstellt. Zweite räumliche Matrix s'(j,i)
In Block 36 kann das Bild gedruckt oder unter Verwendung der rekonstruierten Bilddatenpunkte der zweiten räumlichn Matrix s'(j,i) reproduziert werden.
Die Reihenfolge der Schritte in den obigen Beispielen ist nicht absolut oder in jedem Fall unveränderlich. Ein Durchschnittsfachman könnte leicht erkennen, wann die Reihenfolge der Schritte kritisch ist. Auch könnte jegliche Anzahl von Dimensionen von Bilddatenpunkten entsprechend der erfindungsgemäßen Lehre verarbeitet werden, d.h. die obigen Beispiele, die ein- und zweidimensionale Bilddatenpunkte verwenden, sind beispielhaft aber nicht einschränkend. Außerdem können die zahlreichen Merkmale der Erfindung nach Belieben kombiniert oder gesondert angewandt werden. So könnte z.B. ein durch zweidimensionale Bilddaten dargestelltes Bild zur Verkleinerung in der einen Dimension und zur Vergrößerung in der anderen Dimension skaliert werden.

Claims

1. Verfahren zum Skalieren eines NxM-Bildes, das in einem räumlichen Bereich als eine Vielzahl erster Matrizen s(j,i) aus Bilddatenpunkten dargestellt wird, wobei die ersten Matrizen s(j,i) zu diskreten geraden Vorwärts-Cosinustransformation-(DECT)- Matrizen S(v,u) aus Vorwärts-DECT-Koeffizienten in einem DECT-Bereich transformiert (10) werden, indem man eine Vorwärts-DECT jeder ersten Matrix s(j,i) durchführt, bei der N, M, i, j, v und u ganze Zahlen sind, wobei das Verfahren dadurch gekennzeichnet ist, daß man für jede Vorwärts-DECT-Matrix S(v,u) eine rekonstruierte Matrix s'(y,x) aus rekonstruierten Bilddatenpunkten in dem räumlichewn Bereich erzeugt (12), indem man eine inverse diskrete gerade Hybrid-Cosinustransformation (IDECT) der Vorwärts-DECT-Matrix S(v,u) durchführt, in welcher die unabhängige Variable der aus Cosinustermen bestehenden Reihe der Hybrid-IDECT bei reellen Zahlen x und y berechnet wird, wobei man zu diesen reellen Zahlen durch Skalierungsverhältnis-Betrachtungen gelangt.

2. Verfahren nach Anspruch 1, bei welchem die rekonstruierten Matrizen s'(y,x) durch die folgende Hybrid-IDECT-Transformation erzeugt werden:

wobei 0≤x≤(N-1);

0≤y≤(M-1);

CU=1/ 2 für u=0;

Cu=1 für u≠0;

CV=1/ 2 für v=0; und

Cu=1 für v≠0.

3. Verfahren nach Anspruch 1, bei welchem der Schritt (10) zum Erzeugen der Vorwärts-DECT-Matrizen aufweist:

Erstellen von jeder ersten Matrix s(j,i) entsprechenden Zwischenmatrizen I&sub1; durch Matrixprodukt-Multiplikation (25) einer Vorwärts-DECT-Basismatrix FB mit jeder ersten Matrix s(j,i);

Erstellen einer ersten transponierten Matrix FBT durch Transponieren der Vorwärts- DECT-Basismatrix FB; und

Erzeugen der Vorwärts-DECT-Matrizen S(v,u) durch Matrixprodukt-Multiplikation (26) der Zwischenmatrizen I&sub1; mit der ersten transponierten Matrix FBT.

4. Verfahren nach Anspruch 1, bei welchem der Schritt (12) zum Erzeugen rekonstruierter Matrizen s'(y,x) aufweist:

Auswählen (23) von Wieder-Probennahme-Verhältnissen N':N und M':M, wobei N' und M' ganze Zahlen sind;

Erstellen einer ersten N'xM-Hybrid-IDECT-Basismatrix IB1HYB (30) und einer zweiten NXM'-Hybrid-IDECT-Basismatrix IB1HYB (38) in Übereinstimmung mit den Wieder- Probennahme-Verhältnissen;

Erstellen von Zwischenmatrizen I&sub2; durch Matrixprodukt-Multiplikation (44) der ersten Hybrid-DECT-Basismatrix IB1HYB mit den Vorwärts-DECT-Matrizen S(v,u); und Erzeugen der rekonstruierten Matrizen s'(y,x) durch Matrixprodukt-Multiplikation (46) der Zwischenmatrizen I&sub2; mit der zweiten Hybrid-IDECT-Basismatrix IB2HYB.

5. Verfahren nach Anspruch 1, welches weiterhin einen Schritt (36) zum Wiederherstellen eines skalierten Bildes aus den rekonstruierten Matrizen aufweist.

6. Verfahren zum Skalieren und Filtern eines NxM-Bildes, das in einem raumlichen Bereich als eine Vielzahl erster Matrizen s(j,i) aus Bilddatenpunkten dargestellt wird, wobei die ersten Matrizen s(j,i) zu diskreten geraden Vorwärts-Cosinustransformation- (DECT)-Matrizen S(v,u) aus Vorwärts-DECT-Koeffizienten in einem DECT-Bereich transformiert (10) werden, indem man eine Vorwarts-DECT jeder ersten Matrix s(j,i) durchfiihrt, bei der N, M, i, j, v und u ganze Zahlen sind, wobei das Verfahren gekennzeichnet ist durch: Filtern der Vorwärts-DECT-Matrizen S(v,u) auf eine Weise, die einer mathematischen Faltung ähnelt; und Erzeugen gefilterter rekonstruierter Matrizen s'f(y,x) aus gefilterten rekonstruierten Bilddatenpunkten in dem räumlichen Bereich, indem man eine inverse diskrete gerade Hybrid-Cosinustransformation (IDECT) an jeder gefilterten Vorwärts-DECT-Matrix S(v,u) durchführt, in welcher die unabhängige Variable der aus Cosinustermen bestehenden Reihe der Hybrid-IDECT bei reellen Zahlen x und y berechnet wird, wobei man zu diesen reellen Zahlen durch Skalierungsverhältnis-Betrachtungen gelangt.

7. Verfahren nach Anspruch 6, bei welchem der Schritt zum Filtern umfaßt: Auswählen (124) eines Kernes h(j,i) in dem räumlichen Bereich gemäß einem vorbestimmten Kriterium;

Auffüllen (122) des Kerns h(j,i) mit Nullen, um einen gefüllten Kern hp(j,i) zu erzeugen; Erstellen diskreter ungerader Vorwärts-Cosinustranformation-(DOCT)-Matrizen H(v,u) aus Vorwärts-DOCT-Koeffizienten in einem DOCT-Bereich, die dem gefüllten Kern hp(j,i) entsprechen, indem man eine Vorwärts-DOCT von hp(j,i) durchführt; und Masken-Multiplizieren (144) der Vorwärts-DECT-Matrizen S(v,u) mit den Vorwärts- DOCT-Matrizen H(v,u), um Zwischenmatrizen I&sub3; zu erzeugen.

8. Verfahren nach Anspruch 7, bei welchem der Schritt zum Erzeugen gefilterter rekonstruierter Matrizen s'f(j,i) weiterhin das Erzeugen der gefilterten rekonstruierten Matrizen s'f(j,i) durch Ausführen der Hybrid-IDECT an den Zwischenmatrizen I&sub3; umfaßt.

9. Verfahren nach Anspruch 7, bei welchem die Vorwärts-DOCT aus hp(j,i) gewonnen wird durch:

Erstellen von Zwischenmatrizen I&sub2; durch Matrixprodukt-Multiplikation (128) einer Vorwärts-DOCT-Basismatrix FB&sub0; mit dem gefüllten Kern hp(j,i);

Erstellen (130) einer transponierten Matrix FB&sub0;T durch Transponieren der Vorwärts- DOCT-Basismatrix FBO; und

Matrixprodukt-Multiplikation (136) der Zwischenmatrizen I&sub2; mit der transponierten Matrix FB&sub0;T.

10. Verfahren nach Anspruch 6, welches weiterhin einen Schritt (142) zum Aussondern ausgewählter gefilterter rekonstruierter Bilddatenpunkte umfaßt.

11. Verfahren nach Anspruch 6, bei welchem die rekonstruierten Matrizen s'(y,x) durch die folgende Hybrid-IDECT-Transformation erzeugt werden:

wobei 0≤x≤(N-1);

0≤y≤(M-1);

CU=1/ 2 für u=0;

CU=1 für u≠0;

Cv=1/ 2 für v=0; und

Cu=1 für v≠0.

12. Verfahren nach Anspruch 6, bei welchem der Schritt (10) zum Erzeugen der Vorwärts-DECT-Matrizen umfaßt:

13. Verfahren nach Anspruch 6, bei welchem der Schritt (12) zum Erzeugen rekonstruierter Matrizen s'(y,x) umfaßt:

Erstellen einer ersten N'xM-Hybrid-IDECT-Basismatrix IB1HYB (30) und einer zweiten NxM'-Hybrid-IDECT-Basismatrix IB2HYB (38) in Übereinstimmung mit den Wieder- Probennahme-Verhältnissen;

Erstellen von Zwischenmatrizen I&sub2; durch Matrixprodukt-Multiplikation (44) der ersten Hybrid-IDECT-Basismatrix IB1HYB mit den Vorwärts-DECT-Matrizen S(v,u); und Erzeugen der rekonstruierten Matrizen s'(y,x) durch Matrixprodukt-Multiplikation (46) der Zwischenmatrizen I&sub2; mit der zweiten Hybrid-IDECT-Basismatrix IB2HYB.

14. Verfahren nach Anspruch 6, welches weiterhin einen Schritt (36) zum Wiederherstellen eines skalierten Bildes aus den rekonstruierten Matrizen umfaßt.

15. Verfahren nach Anspruch 10, welches weiterhin einen Schritt (36) zum Wiederherstellen eines skalierten Bildes aus den rekonstruierten Matrizen umfaßt.

16. Verfahren nach Anspruch 7, bei welchem die Vorwärts-DOCT-Matrizen H(v,u) von der Vorwärts-DOCT aus hp(j,i) erstellt werden als:

für 0≤u≤N-1 und 0≤v≤N-1,

wobei hp(j,i) die zweidimensionale gefüllte Kernmatrix ist;

N die Anzahl der Elemente von hp(j,i) in der ersten Dimension ist;

M die Anzahl der Elemente von hp(j,i) in der zweiten Dimension ist;

di=1/2 für i=0;

di=1 für i=1,2,...,(N-1);

dj 1/2 für j=0;

dj=1 für i=1,2,...,(M-1);

i, j, u, v, N, M ganzzahlig sind;

hp(j,i) = 0 für i oder j > (k-1)/2; und

k eine vorbestimmte Kerngröße ist.