DE69834959T2

DE69834959T2 - Prädiktives Bilddekodierungsverfahren

Info

Publication number: DE69834959T2
Application number: DE69834959T
Authority: DE
Inventors: Chong Seng Shatomorioka 416 Boon
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp
Priority date: 1997-04-09
Filing date: 1998-04-07
Publication date: 2007-01-25
Anticipated expiration: 2018-04-08
Also published as: ID20775A; DE69815922D1; ES2202678T3; EP1322122A1; EP1079634B1; DE69834959D1; KR100451326B1; DE69824896T2; SG65064A1; BR9801156B1; EP1079634A1; KR19980081235A; TW395136B; US6633678B2; KR100319248B1; US20020027955A1; DE69824896D1; EP0871336B1; IN192209B; EP1322122B1

Description

Gebiet der Erfindung
Die vorliegende Erfindung betrifft die prädiktive Bilddecodierung und insbesondere Verfahren zur prädiktiven Bilddecodierung.
Hintergrund der Erfindung
Um ein digitales Bild mit hoher Effizienz zu speichern oder zu übertragen, muss es kompressionscodiert werden. Ein typisches Verfahren zur Kompressionscodierung digitaler Bilder ist das durch JPEG (Joint Photographic Experts Group; Gemeinsame Fachgruppe Fotografie) und MPEG (Moving Picture Experts Group; Fachgruppe Film) vertretene DCT-Verfahren (Discrete Cosine Transformation; Diskrete Kosinustransformation). Darüber hinaus gibt es Wellenform-Codierungsverfahren wie Subband-Codierung, Wavelet-Codierung und Fraktal-Codierung. Um ein redundantes Signal zwischen Bildern zu eliminieren, wird eine Interbild-Prädiktion durch Bewegungskompensation durchgeführt und das Differenzsignal wird Wellenform-codiert.
Nachstehend wird ein auf der Bewegungskompensations-DCT beruhendes MPEG-Verfahren beschrieben. Zunächst wird ein Eingangsbild eines zu codierenden Einzelbilds (Frame) in mehrere Makroblöcke mit einer Größe von jeweils 16 × 16 Pixeln unterteilt. Jeder Makroblock wird weiter in vier Blöcke mit einer Größe von jeweils 8 × 8 Pixeln unterteilt, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Dieses Verfahren heißt Intraframe-Codierung.
Mit einem Verfahren der Bewegungserkennung, wie Block-Abgleich, aus einem Einzelbild, das vorübergehend an ein Objektbild mit einem zu quantisierenden Objekt-Makroblock angrenzt, wird der Prädiktions-Makroblock mit dem kleinsten Fehler aus dem Objekt-Makroblock erkannt, und aufgrund der erkannten Bewegung wird die Bewegungskompensation aus dem letzten Bild durchgeführt, um dadurch einen optimalen Prädiktionsblock zu erhalten. Ein Signal, das die Bewegung zu dem Prädiktionsblock mit dem kleinsten Fehler anzeigt, ist ein Bewegungsvektor. Ein Bild, das als Bezug für die Erzeugung des Prädiktions-Makroblocks verwendet wird, wird nachstehend als Bezugsbild bezeichnet. Danach wird die Differenz zwischen dem Objektblock und dem entsprechenden Prädiktionsblock ermittelt, und diese Differenz wird DCT-transformiert, um den DCT-Koeffizienten zu erhalten. Der DCT-Koeffizient wird quantisiert, und die quantisierten Ausgangsdaten werden zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Dieses Verfahren heißt Interframe-Codierung.
Die Interframe-Codierung hat zwei Prädiktionsmodi: Prädiktion aus einem vorhergehenden Bild in der Reihenfolge der Anzeige und Prädiktion sowohl aus vorhergehenden als auch künftigen Bildern. Der erstgenannte Modus wird als Vorwärtsprädiktion und der letztgenannte als Zweirichtungsprädiktion bezeichnet.
Decodiererseitig wird nach dem Zurückführen des quantisierten DCT-Koeffizienten zum ursprünglichen Differenzsignal der Prädiktionsblock auf der Grundlage des Differenzsignals und des Bewegungsvektors erhalten, und der Prädiktionsblock und das Differenzsignal werden addiert, um das Bild wiederzugeben. Bei diesem herkömmlichen Verfahren wird vorausgesetzt, dass die Größe des Bezugsbilds (eines Bilds, das als Bezug zur Erzeugung eines Prädiktionsbilds dient) gleich der Größe des Objektbilds ist.
In den letzten Jahren sind mehrere Objekte, die ein Bild (Bild beliebiger Form) darstellen, getrennt kompressionscodiert und übertragen worden, um dadurch die Codierungsleistung zu verbessern und eine objektweise Wiedergabe zu ermöglichen. Bei der Codierung und Decodierung dieser Bilder beliebiger Form ändert sich die Größe des Bilds sehr häufig. So wird ein Ball immer kleiner, bis er schließlich ganz verschwindet. Und gelegentlich wird die Größe des Bilds (Objekts) null.
Bei der normalen prädiktiven Codierung ist ein Bezugsbild ein wiedergegebenes Bild kurz vor einem Objektbild, das gerade verarbeitet wird. Wenn die Größe des Bezugsbilds null ist, da nichts in dem Bezugsbild definiert ist, d. h. da das Bezugsbild keine signifikanten Bilddaten hat, die zur prädiktiven Codierung verwendet werden sollen, kann keine prädiktive Codierung durchgeführt werden. In diesem Fall gibt es außer der Intraframe-Codierung keine herkömmliche Methode. In der Regel erhöht jedoch die Intraframe-Codierung die Menge der codierten Daten und senkt die Kompressionsleistung. Wenn ein Bild verschwindet (Bildgröße = null) und in einer Folge von Bewegtbildern häufig erscheint, wird die Codierungsleistung erheblich verschlechtert. Wenn beispielsweise bei einem Blitzlicht-Bewegtbild das Licht in Bild-Einheiten verschwindet und wieder erscheint, müssen alle Bilder des Lichts Intraframe-codiert werden.
Kurze Darstellung der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren zur prädiktiven Bilddecodierung zur Verfügung zu stellen, das eine effiziente prädiktive Decodierung eines Bilds veränderlicher Größe auch dann realisieren kann, wenn die Größe eines Bezugsbilds null ist oder wenn das Bezugsbild völlig transparent ist.
Die Erfindung ist in Anspruch 1 dargelegt.
Kurze Beschreibung der Zeichnungen
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer ersten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
Die 2(a) und 2(b) sind schematische Darstellungen zur Erläuterung der Bildprädiktion bei dem erfindungsgemäßen Verfahren zur prädiktiven Bilddecodierung.
3 ist ein Blockdiagramm, das eine Prädiktive-Bilddecodierungs-Vorrichtung gemäß der ersten Ausführungsform zeigt.
4 ist ein Blockdiagramm, das eine Einzelbild-Speichereinheit zeigt, die in der Prädiktive-Bilddecodierungs-Vorrichtung gemäß der ersten Ausführungsform verwendet wird.
5 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer dritten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
6 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer vierten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
7 ist ein Diagramm, das Bilddaten gemäß der ersten Ausführungsform zeigt.
8 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer zweiten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
9 ist ein Diagramm, das Bilddaten gemäß der zweiten Ausführungsform zeigt.
10 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer fünften Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
11 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer Ausführungsform der vorliegenden Erfindung.
Detaillierte Beschreibung der bevorzugten Ausführungsformen
Ausführungsform 1
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer ersten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Bevor 1 erläutert wird, wird ein Bildprädiktionsverfahren gemäß der ersten Ausführungsform anhand der 2(a) und 2(b) beschrieben.
Die Größe eines Eingangsbilds, das bei dem Verfahren zur prädiktiven Bilddecodierung der ersten Ausführungsform verwendet wird, ist veränderlich, und es kann passieren, dass die Größe null wird.
2(a) zeigt Bilder 201 bis 210 eines Bewegtbilds, die in der Reihenfolge der Anzeige angeordnet sind. Das Bild 201 ist das erste anzuzeigende Einzelbild, an das sich 202, 203 ... anschließen, und diese Reihenfolge ist durch #1 bis #10 dargestellt. Da das Bild #1 (201) das erste Bild ist, wird es Intraframe-codiert. Bei der ersten Ausführungsform wird ein Bild (ein Einzelbild) in mehrere Blöcke unterteilt, die jeweils eine Größe von 8 × 8 Pixeln haben, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Der quantisierte Koeffizient wird einer Codierung variabler Länge unterzogen. Bei der Decodierung werden die durch die Codierung variabler Länge erhaltenen codierten Daten einer Decodierung variabler Länge unterzogen, und der durch die Decodierung variabler Länge erhaltene quantisierte Koeffizient wird einer inversen Quantisierung und inversen DCT unterzogen, wodurch das Bild wiedergegeben wird. Dann wird das Bild #2 (202) einer prädiktiven Interframe-Codierung durch Referenzieren des wiedergegebenen Bilds #1 (201) unterzogen.
Bei der ersten Ausführungsform wird mittels Block-Abgleichs als Bewegungserkennungsverfahren der Prädiktionsblock mit dem kleinsten Fehler aus dem Objektblock, der gerade verarbeitet wird, aus dem Bild #1 (201) erkannt. Aufgrund der erkannten Bewegung von dem Objektblock zu dem Prädiktionsblock wird durch Bewegungskompensation des Objektblocks aus dem wiedergegebenen Bild #1 (201) ein optimaler Prädiktionsblock erhalten. Danach wird die Differenz zwischen dem Objektblock und dem entsprechenden Prädiktionsblock ermittelt und DCT-transformiert. Der DCT-Koeffizient wird quantisiert, und der quantisierte Ausgabewert wird zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Das wiedergegebene Bild #1 (201) dient als Bezugsbild für das Bild #2 (202). Diese Prädiktion wird als Vorwärtsprädiktion bezeichnet. Bei der Decodierung wird der Prädiktionsblock zu der Differenz addiert, die der inversen Quantisierung und inversen DCT unterzogen worden ist, wodurch das Bild wiedergegeben wird.
In ähnlicher Weise werden das Bild #3 (203) und das Bild #4 (204) unter Verwendung der durch Pfeile gekennzeichneten Bezugsbilder prädiktiv codiert. Wie bei den Bildern #6 (206), #8 (208) und #10 (210) kann die Prädiktion aus dem vorletzten Bild erfolgen. Im Gegensatz zur Vorwärtsprädiktion kann die Prädiktion wie bei den Bildern #5 (205), #7 (207) und #9 (209) durch Referenzieren eines künftigen Bilds erfolgen, das nach dem Objektbild angezeigt werden soll. Diese Prädiktion wird als Rückwärtsprädiktion bezeichnet. Wenn sowohl die Vorwärts- als auch die Rückwärtsprädiktion durchgeführt werden, handelt es sich um eine Zweirichtungsprädiktion. Die Zweirichtungsprädiktion hat drei Modi: Vorwärtsprädiktionsmodus, Rückwärtsprädiktionsmodus, Interpolationsmodus zur Herstellung des Gleichgewichts von Vorwärts- und Rückwärtsprädiktion.
2(b) zeigt die Übertragungsreihenfolge, d. h. die Decodierungsreihenfolge, der Bilder, die wie in 2(a) gezeigt prädiktiert wurden.
Das Bild #1 (211) wird zuerst decodiert und wiedergegeben. Durch Referenzieren des wiedergegebenen Bilds #1 wird das Bild #2 (212) decodiert. Bei den Zweirichtungsprädiktionsbildern wie beim Bild #5 (216) müssen die für die Prädiktion verwendeten Bezugsbilder vor dem Prädiktionsbild decodiert und wiedergegeben werden. Daher wird das Bild #6 (215) vor dem Bild #5 (216) decodiert. Ebenso werden die Bilder #8 (217) und #10 (219) vor den Bildern #7 (218) bzw. #9 (220) übertragen, decodiert und wiedergegeben.
Bei der Übertragung eines Bilds mit veränderlicher Größe muss die Größe des Bilds übertragen werden. Bei der ersten Ausführungsform wird die Bildgröße am Kopf der codierten Daten des Bilds angegeben, und die horizontale Größe Hm und die vertikale Größe Vm werden jeweils durch 20 Bit dargestellt. 7 zeigt die gemäß der ersten Ausführungsform codierten Bilddaten (VD), die außer der horizontalen Größe Hm und der vertikalen Größe Vm auch den Bewegungsvektor, die Quantisierungsbreite und den DCT-Koeffizienten aufweisen.
Nachstehend wird der Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst die Größe des vorhergehenden Bezugsbilds eingegeben (Schritt 102), und es wird geprüft, ob die Größe des Bezugsbilds null ist oder nicht (Schritt 103).
Bei der in 2(b) gezeigten Decodierungsreihenfolge ist stets ein Bezugsbild vor einem zu decodierenden Bild vorhanden (bei der Codierung ein Codierungsobjekt). Das heißt, das Bezugsbild ist das zuletzt wiedergegebene Bild bei dem Verfahren der prädiktiven Decodierung der ersten Ausführungsform. Beispielsweise ist in 2(b) das Bild #3 (213) ein Bezugsbild für das Bild #4 (214). Ein durch Zweirichtungsprädiktion wiedergegebenes Bild kann jedoch nicht zur Prädiktion verwendet werden, sodass dieses Bild kein Bezugsbild sein kann. Daher ist beispielsweise das Bild #6 (215) ein Bezugsbild für das Bild #8 (217).
Wenn im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds nicht null ist, folgt Schritt 104, in dem ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt wird. Wenn jedoch im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds null ist, folgt Schritt 105, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem wiedergegebenen Bilds, dessen Größe nicht null ist, als Bezugsbild erzeugt wird. Die Methode zur Erkennung eines vor kurzem wiedergegebenen Bilds, dessen Größe nicht null ist, wird nachstehend anhand von 2(b) beschrieben.
Wenn ein Prädiktionsbild des Bilds #4 (214) erzeugt wird, wird unterstellt, dass die Größe des Bilds #3 (213) unmittelbar vor dem Bild #4 (214) null ist und die Größe des Bilds #2 nicht null ist. In diesem Fall wird durch Referenzieren des Bilds #2 (212) ein Prädiktionsbild des Bilds #4 (214) erzeugt. Genauso wird bei der Erzeugung eines Prädiktionsbilds des Bilds #6 (215) in der Annahme, dass die Größe der Bilder #3 (213) und #4 (214) null ist, das Prädiktionsbild durch Referenzieren des Bilds #2 (212) erzeugt. Die erste Ausführungsform verwendet die blockweise Bewegungskompensation als Verfahren zur Erzeugung eines Prädiktionsbilds, wie MPEG1.
3 ist ein Blockdiagramm, das eine Prädiktive-Bilddecodierungs-Vorrichtung 300 gemäß der ersten Ausführungsform zeigt.
Die Prädiktive-Bilddecodierungs-Vorrichtung 300 empfängt Bilddaten, die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem vorgeschriebenen Verfahren erhalten werden, und führt die prädiktive Decodierung der Bilddaten durch.
Die Prädiktive-Bilddecodierungs-Vorrichtung 300 weist einen Daten-Analysator 302, einen Decodierer 303 und ein Addierwerk 306 auf. Der Daten-Analysator 302 analysiert die kompressionscodierten Bilddaten und gibt die Quantisierungsbreite und den DCT-Koeffizienten an die Leitung 312, den Bewegungsvektor an die Leitung 318 und die Bildgröße an die Leitung 321 aus. Der Decodierer 303 wandelt die komprimierten Blockdaten (komprimierter Block) aus dem Daten-Analysator 302 durch Daten-Expansion in einen expandierten Block um. Das Addierwerk 306 addiert den expandierten Block und den Prädiktionsblock, um einen wiedergegebenen Block zu erzeugen.
Die Prädiktive-Bilddecodierungs-Vorrichtung 300 weist außerdem eine Einzelbild-Speichereinheit 309 und einen Prädiktionsbild-Generator 310 auf. Die Einzelbild-Speichereinheit 309 speichert den wiedergegebenen Block. Der Prädiktionsbild-Generator 310 erzeugt eine Adresse zum Zugreifen auf die Einzelbild-Speichereinheit 309 aufgrund des Bewegungsvektors und erhält als Prädiktionsblock einen Block, der der Adresse aus dem in der Einzelbild-Speichereinheit 309 gespeicherten Bild entspricht. Bei der ersten Ausführungsform bestimmt der Prädiktionsbild-Generator 310 als Bezugsbild ein einziges wiedergegebenes Bild, das vor kurzem wiedergegeben worden ist und zu referenzierende signifikante Bilddaten aufweist, aufgrund der Bildgröße von dem Daten-Analysator 302. Die Bestimmung des Bezugsbilds kann, wie in 3 durch Strichlinien dargestellt ist, mit einem Steuergerät 320 erfolgen, das die Einzelbild-Speichereinheit 309 entsprechend der Bildgröße von dem Daten-Analysator 302 steuert. Das heißt, die Einzelbild-Speichereinheit 309 wird von dem Steuergerät 320 so gesteuert, dass sie ein einzelnes wiedergegebenes Bild wählt, das vor kurzem wiedergegeben worden ist und zu referenzierende signifikante Bilddaten aufweist.
Der Decodierer 303 weist einen inversen Quantisierer (IQ) 304, der den komprimierten Block aus dem Daten-Analysator 302 invers quantisiert, und einen inversen diskreten Kosinustransformator (nachstehend als IDCT bezeichnet) 305 auf, der die Ausgangssignale von dem inversen Quantisierer 304 einer inversen DCT (Transformation eines Frequenzbereichssignals in ein Raumbereichssignal) unterzieht.
Die Bezugssymbole 301 und 307 bezeichnen das Eingabe- bzw. Ausgabeterminal der Prädiktive-Bilddecodierungs-Vorrichtung 300.
Nachstehend wird die Funktionsweise der in 3 gezeigten Prädiktive-Bilddecodierungs-Vorrichtung beschrieben.
Zunächst werden Bilddaten (codierte Daten), die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem festgelegten Verfahren erhalten werden, in das Eingabeterminal 301 eingegeben. Bei der ersten Ausführungsform erfolgt die Kompressionscodierung durch Bewegungskompensations-DCT wie bei MPEG1, sodass die codierten Daten den Bewegungsvektor, die Quantisierungsbreite, den DCT-Koeffizienten und die Bildgrößendaten umfassen.
Dann werden in dem Daten-Analysator 302 die kompressionscodierten Bilddaten analysiert und die Quantisierungsbreite und der DCT-Koeffizient werden als komprimierte Blockdaten über die Leitung 312 an den Decodierer 303 gesendet. Außerdem wird der in dem Daten-Analysator 302 analysierte Bewegungsvektor über die Leitung 318 an den Prädiktionsbild-Generator 310 gesendet. Ebenso wird die von dem Daten-Analysator 302 analysierte Bildgröße über die Leitung 321 an das Steuergerät 320 gesendet.
In dem Decodierer 303 werden die komprimierten Blockdaten, d. h. der komprimierte Block, von dem inversen Quantisierer 304 und dem Inverse-DCT-Transformator 305 expandiert, sodass ein expandierter Block 314 entsteht. Genauer gesagt, quantisiert der inverse Quantisierer 304 den komprimierten Block invers, und der Inverse-DCT-Transformator 305 transformiert das Frequenzbereichssignal in ein Raumbereichssignal, sodass der expandierte Block 314 entsteht. In dem Prädiktionsbild-Generator 310 wird entsprechend dem über die Leitung 318 gesendeten Bewegungsvektor eine Adresse 321 zum Zugreifen auf die Einzelbild-Speichereinheit 309 erzeugt und in die Einzelbild-Speichereinheit 309 eingegeben. Dann wird aus den in der Einzelbild-Speichereinheit 309 gespeicherten Bildern ein Prädiktionsblock 317 erzeugt. Der Prädiktionsblock 317 (319) und der expandierte Block 314 werden in das Addierwerk 306 eingegeben, in dem die Blöcke 319 und 314 addiert werden, sodass ein wiedergegebener Block 315 entsteht. Der wiedergegebene Block 315 wird von dem Ausgabeterminal 307 ausgegeben und wird gleichzeitig über die Leitung 316 gesendet und in der Einzelbild-Speichereinheit 309 gespeichert. Wenn die Intraframe-Decodierung durchgeführt wird, sind die Abtastwerte des Prädiktionsblocks alle null.
Die Funktionsweise des Prädiktionsbild-Generators 310 ist mit der identisch, die bereits in Zusammenhang mit dem Ablaufdiagramm von 1 beschrieben wurde. Das heißt, die Größe des Bezugsbilds wird in den Prädiktionsbild-Generator 310 eingegeben, und der Prädiktionsbild-Generator 310 bestimmt das Bezugsbild. Die Bezugsbild-Bestimmung kann durch Steuern der Einzelbild-Speichereinheit 309 entsprechend den über das Steuergerät 320 und die Leitung 322 gesendeten Informationen darüber, ob die Größe des Bezugsbilds null ist oder nicht, erfolgen.
4 ist ein Blockdiagramm, das eine Einzelbild-Speicherbank 406 als Beispiel für die Einzelbild-Speichereinheit 309 in der Prädiktive-Bilddecodierungs-Vorrichtung 300 gemäß der ersten Ausführungsform zeigt. Die Einzelbild-Speicherbank 406 weist drei Einzelbild-Speicher 401 bis 403 auf. Das wiedergegebene Bild wird in einem der Einzelbild-Speicher 401 bis 403 gespeichert. Bei der Erzeugung eines Prädiktionsbilds wird auf die Einzelbild-Speicher 401 bis 403 zugegriffen.
Bei der ersten Ausführungsform hat die Einzelbild-Speicherbank 406 Schalter 404 und 405. Der Schalter 405 soll einen Einzelbild-Speicher zum Speichern des wiedergegebenen Bilds wählen, das von den Einzelbild-Speichern 401 bis 403 über die Leitung 408 (entspricht der Leitung 316 in 3) eingegeben wird. Der Schalter 405 wählt nacheinander die Einzelbild-Speicher 401 bis 403, die von dem Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Das heißt, nachdem das erste wiedergegebene Bild in dem Einzelbild-Speicher 401 gespeichert worden ist, wird das zweite wiedergegebene Bild in dem Einzelbild-Speicher 402 gespeichert. Nachdem das dritte wiedergegebene Bild in dem Einzelbild-Speicher 403 gespeichert worden ist, wählt der Schalter 405 den Einzelbild-Speicher 401. Der Schalter 404 ist über die Leitung 407 (entspricht der Leitung 317 in 3) mit dem Prädiktionsbild-Generator 310 verbunden. Dieser Schalter 404 wählt ebenfalls nacheinander die Einzelbild-Speicher 401 bis 403, die von dem Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Die Schaltfolge wird jedoch entsprechend der Größe des Bezugsbilds geändert. Obwohl zur Erzeugung eines Prädiktionsbilds entsprechend der vorgegebenen Reihenfolge beispielsweise der Schalter 404 mit dem Einzelbild-Speicher 402 verbunden werden muss, wenn die Bildgröße des Einzelbild-Speichers 402 null ist, steuert das Steuergerät 320 den Schalter 404 so, dass der vorhergehende Einzelbild-Speicher 401 gewählt wird (unter der Voraussetzung, dass die Bildgröße des Einzelbild-Speichers 401 nicht null ist). Auf diese Weise kann ein Prädiktionsbild aus einem Bezugsbild, dessen Größe nicht null ist, erzeugt werden. Der Schalter 404 kann mit mehreren Einzelbild-Speichern gleichzeitig verbunden sein. Bei einer Einheit, bei der jeder Einzelbild-Speicher bei jeder Wiedergabe eines einzelnen Bilds rückgesetzt wird, kann durch Steuern der Einheit mit dem Steuergerät 320 in einer Weise, dass der Einzelbild-Speicher nicht rückgesetzt wird, wenn die Größe des wiedergegebenen Bilds null ist, ein vor kurzem wiedergegebenes Bild, dessen Größe nicht null ist, in dem Einzelbild-Speicher bleiben. Mit anderen Worten, es ist möglich, eine Aktualisierung des Einzelbild-Speichers zu vermeiden.
Obwohl bei der ersten Ausführungsform das Verfahren der DCT mit blockweiser Bewegungskompensation beschrieben wird, kann die vorliegende Erfindung auch für andere Prädiktionsverfahren verwendet werden, die beispielsweise die globale Bewegungskompensation oder arbiträre gitterförmige Block-Bewegungskompensation nutzen. Obwohl bei der ersten Ausführungsform ein Prädiktionsbild aus einem einzigen wiedergegebenen Bild, das als Bezugsbild dient, erzeugt wird, kann die vorliegende Erfindung ebenso für den Fall verwendet werden, dass ein Prädiktionsbild aus mehreren Bezugsbildern erzeugt wird.
Wie vorstehend beschrieben, wird gemäß der ersten Ausführungsform die Größe eines vorhergehenden Bezugsbilds ermittelt, die in die Vorrichtung eingegeben wird, und wenn die Größe des Bezugsbilds nicht null ist, wird ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt. Wenn jedoch die Größe des vorhergehenden Bezugsbilds null ist, wird ein Prädiktionsbild unter Verwendung eines vor kurzem wiedergegebenen Bilds erzeugt, dessen Größe nicht null ist. Wenn also mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, um die Kompressionsleistung zu erhöhen, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung oder Codierung verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann.
Ausführungsform 2
Bei der ersten Ausführungsform wird ermittelt, ob die Größe des Bezugsbilds null ist oder nicht, und die Bezugsbild-Bestimmung erfolgt unter Verwendung der ermittelten Informationen. Wenn jedoch der Umstand, dass die Bildgröße null ist, durch einen anderen Index (z. B. ein Ein-Bit-Flag F) dargestellt wird, kann die Steuerung mit diesem Index durchgeführt werden. Bei dieser zweiten Ausführungsform, die nicht Bestandteil der Erfindung ist, wird die Erzeugung des Prädiktionsbilds unter Verwendung dieses Indexes gesteuert.
Das heißt, bei der zweiten Ausführungsform, die in 9 dargestellt ist, weisen die codierten Daten eines Objektbilds ein Ein-Bit-Flag F auf, das anzeigt, dass die Bildgröße null ist, d. h. das entsprechende Bezugsbild ist völlig transparent und hat keine codierten Daten, und dieses Flag F wird vor der die Bildgröße angebenden horizontalen und vertikalen Größe Hm und Vm gesetzt. Wenn die Bildgröße null ist, ist das Flag F „0". Bei der zweiten Ausführungsform wird also die Erzeugung eines Prädiktionsbilds mit Hilfe des Flags F gesteuert.
Nachstehend wird ein Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform anhand des Ablaufdiagramms von 8 beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst im Schritt 802 ein vorhergehendes Bezugsbild eingegeben, und im Schritt 803 wird geprüft, ob das Flag F des Bezugsbilds „1" ist oder nicht. Wenn im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds „1" ist, ist die Größe dieses Bezugsbilds nicht null, d. h. das Bezugsbild ist nicht völlig transparent und es hat codierte Daten. Somit wird im Schritt 804 ein Prädiktionsbild unter Verwendung des vorhergehenden Bezugsbilds erzeugt.
Wenn jedoch im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds nicht „1" ist, folgt Schritt 805, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem wiedergegebenen Bilds, dessen Flag F nicht „0" ist, als Bezugsbild erzeugt wird.
Wenn, wie vorstehend beschrieben, bei der zweiten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt, ob das zuvor wiedergegebene Bild zu referenzierende signifikante codierte Daten hat, und die Bezugsbild-Bestimmung erfolgt durch Erkennen dieses Flags. Dadurch wird die Bestimmung des Bezugsbilds erleichtert.
Ausführungsform 3
5 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer dritten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess gemäß dieser dritten Ausführungsform ist im Wesentlichen mit dem gemäß der ersten Ausführungsform identisch, mit der Ausnahme, dass Schritt 505 in 5 an die Stelle von Schritt 105 in 1 tritt. Wenn das Bezugsbild null ist oder wenn es völlig transparent ist (oder wenn das Flag F des Bilds „0" ist), wird im Schritt 505 ein Prädiktionsbild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild mit einem vorgegebenen Wert, erzeugt.
Bei dieser dritten Ausführungsform wird unterstellt, dass das Prädiktionsbild grau ist, d. h., dass sowohl sein Luminanzsignalwert als auch sein Farbdifferenzsignalwert 128 sind. Dadurch wird bei der Codierung der graue Block von dem zu codierenden Block subtrahiert. Bei der Decodierung wird der graue Block zu dem zu decodierenden Block addiert. Der vorgenannte vorgegebene Wert kann variabel sein und von dem Codierer an den Decodierer gesendet werden, um zur Erzeugung eines Prädiktionsbilds verwendet zu werden.
Wenn, wie vorstehend beschrieben, bei der dritten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem wird, wenn die Größe des Bezugsbilds null ist, d. h. wenn das Bezugsbild völlig transparent ist, ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt. Dadurch wird außer den Wirkungen, die von der ersten Ausführungsform bereitgestellt werden, auch die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform 4
10 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer vierten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess gemäß dieser vierten Ausführungsform ist im Wesentlichen mit dem Prozess gemäß der zweiten Ausführungsform identisch, mit der Ausnahme, dass Schritt 1005 in 10 an die Stelle von Schritt 805 in 8 tritt. Wenn das Flag F des Bezugsbilds „0" ist, wird im Schritt 1005 ein Prädiktionsbild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild mit einem vorgegebenen Wert, erzeugt.
Wenn bei der vierten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt, ob das zuvor wiedergegebene Bild zu referenzierende signifikante codierte Daten hat, und wenn festgestellt wird, dass dieses Flag „0" ist, wird ein Prädiktionsbild mit dem vorgegebenen Wert erzeugt. Dadurch wird außer den Wirkungen, die von der zweiten Ausführungsform bereitgestellt werden, auch die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform 5
6 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer fünften Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Nachstehend wird die Zweirichtungsprädiktion für den Fall beschrieben, dass die Bezugsbildgröße null ist, also das Bezugsbild völlig transparent ist.
Zunächst werden im Schritt 602 die Größen der Vorwärts- und Rückwärts-Bezugsbilder eingegeben. Das in 2(a) gezeigte Bild #5 (205) ist ein Zweirichtungsprädiktionsbild, dessen Vorwärts- und Rückwärts-Bezugsbilder die Bilder #4 (204) bzw. #6 (206) sind.
Wenn in den Schritten 603 und 604 entschieden wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder jeweils null ist, wird im Schritt 605 ein Bild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Bild mit einem vorgegebenen Wert, als vorgegebener Wert erzeugt.
Wenn in den Schritten 603 und 604 entschieden wird, dass die Größe des Vorwärts-Bezugsbilds null und die Größe des Rückwärts-Bezugsbilds nicht null ist, wird im Schritt 606 ein Prädiktionsbild unter Verwendung nur des Rückwärts-Bezugsbilds erzeugt.
Wenn in den Schritten 603 und 607 entschieden wird, dass die Größe des Vorwärts-Bezugsbilds nicht null ist und die Größe des Rückwärts-Bezugsbilds null ist, wird im Schritt 608 ein Prädiktionsbild unter Verwendung nur des Vorwärts-Bezugsbilds erzeugt.
Wenn in den Schritten 603 und 607 entschieden wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder jeweils nicht null ist, wird ein Prädiktionsbild unter Verwendung dieser Bezugsbilder erzeugt.
Im Schritt 610 wird das erzeugte Prädiktionsbild ausgegeben. Bei Empfang des Prädiktionsbilds subtrahiert der Codierer das Prädiktionsbild von dem Objektbild, während der Decodierer das Prädiktionsbild zu der Differenz des Objektbilds addiert. Auf diese Weise kann das Restsignal (Differenzsignal) unterdrückt werden.
In dem Fall, dass, wie vorstehend beschrieben, bei der fünften Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung von Vorwärts- und Rückwärts-Bezugsbildern erzeugt wird, wird vermieden, dass Bilder mit veränderlicher Größe, die bereits verschwunden sind, als Bezugsbilder verwendet werden, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Und da ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt wird, wird die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform der Erfindung
11 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer Ausführungsform der vorliegenden Erfindung. Diese Ausführungsform der Erfindung ist im Wesentlichen mit der fünften Ausführungsform identisch, so wie die zweite und die vierte Ausführungsform im Wesentlichen identisch mit der ersten bzw. dritten Ausführungsform sind. Insbesondere wird bei dieser Ausführungsform die Frage „Ist die Größe null?" in den Schritten 603, 604 und 607 in 6 in die Frage „Ist das Flag F 0?" in den Schritten 1103, 1104 und 1107 in 11 umgewandelt.
In dem Fall, dass bei dieser Ausführungsform der Erfindung mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung von Vorwärts- und Rückwärts-Bezugsbildern erzeugt wird, wird vermieden, dass Bilder mit veränderlicher Größe, die bereits verschwunden sind, als Bezugsbilder verwendet werden, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Wenn festgestellt wird, dass das Flag F der Vorwärts- und Rückwärts-Bezugsbilder jeweils „0" ist, wird ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt. Dadurch wird die Erkennung eines Bilds mit veränderlicher Größe, das bereits verschwunden ist, erleichtert, und die Erzeugung des Prädiktionsbilds wird ebenfalls erleichtert.

Claims

Prädiktives Bilddecodierungsverfahren zum Decodieren eines ersten codierten Frames (216), der durch Codieren eines Bilds erhalten wird, mit den Schritten: Ermitteln (1103, 1104, 1107), ob ein zweiter codierter Frame (214) und ein dritter codierter Frame (215), die als Vorwärts-Bezugsbild bzw. Rückwärts-Bezugsbild verwendet werden sollen, jeweils Bildinhaltsdaten (VD) enthalten oder nicht, wobei das Ermitteln aufgrund eines in dem zweiten codierten Frame enthaltenen ersten Flags (Flag F) und eines in dem dritten codierten Frame enthaltenen zweiten Flags (Flag F) erfolgt, wobei das erste Flag (Flag F) angibt, ob der zweite codierte Frame Bildinhaltsdaten (VD) enthält oder nicht, und das zweite Flag (Flag F) angibt, ob der dritte codierte Frame Bildinhaltsdaten (VD) enthält oder nicht; Wählen (608) eines decodierten Frames, der dem zweiten codierten Frame entspricht, als Vorwärts-Bezugsbild, wenn der zweite codierte Frame Bildinhaltsdaten enthält und der dritte codierte Frame keine Bildinhaltsdaten enthält; Wählen (606) eines decodierten Frames, der dem dritten codierten Frame entspricht, als Rückwärts-Bezugsbild, wenn der zweite codierte Frame keine Bildinhaltsdaten enthält und der dritte codierte Frame Bildinhaltsdaten enthält; Wählen (609) eines decodierten Frames, der dem zweiten codierten Frame entspricht, und eines decodierten Frames, der dem dritten codierten Frame entspricht, als Vorwärts-Bezugsbild bzw. Rückwärts-Bezugsbild, wenn der zweite codierte Frame und der dritte codierte Frame jeweils Bildinhaltsdaten enthalten; Erzeugen (606, 608, 609) eines Prädiktionsbilds durch Referenzieren mindestens entweder des gewählten Vorwärts-Bezugsbilds oder des gewählten Rückwärts-Bezugsbilds und Decodieren des ersten codierten Frames durch prädiktives Decodieren unter Verwendung des erzeugten Prädiktionsbilds.