-
Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft die prädiktive Bilddecodierung und
insbesondere Verfahren zur prädiktiven
Bilddecodierung.
-
Hintergrund
der Erfindung
-
Um
ein digitales Bild mit hoher Effizienz zu speichern oder zu übertragen,
muss es kompressionscodiert werden. Ein typisches Verfahren zur
Kompressionscodierung digitaler Bilder ist das durch JPEG (Joint
Photographic Experts Group; Gemeinsame Fachgruppe Fotografie) und
MPEG (Moving Picture Experts Group; Fachgruppe Film) vertretene DCT-Verfahren (Discrete
Cosine Transformation; Diskrete Kosinustransformation). Darüber hinaus
gibt es Wellenform-Codierungsverfahren wie Subband-Codierung, Wavelet-Codierung und Fraktal-Codierung.
Um ein redundantes Signal zwischen Bildern zu eliminieren, wird
eine Interbild-Prädiktion durch
Bewegungskompensation durchgeführt
und das Differenzsignal wird Wellenform-codiert.
-
Nachstehend
wird ein auf der Bewegungskompensations-DCT beruhendes MPEG-Verfahren beschrieben.
Zunächst
wird ein Eingangsbild eines zu codierenden Einzelbilds (Frame) in
mehrere Makroblöcke
mit einer Größe von jeweils
16 × 16
Pixeln unterteilt. Jeder Makroblock wird weiter in vier Blöcke mit
einer Größe von jeweils
8 × 8
Pixeln unterteilt, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert
und quantisiert. Dieses Verfahren heißt Intraframe-Codierung.
-
Mit
einem Verfahren der Bewegungserkennung, wie Block-Abgleich, aus
einem Einzelbild, das vorübergehend
an ein Objektbild mit einem zu quantisierenden Objekt-Makroblock angrenzt,
wird der Prädiktions-Makroblock
mit dem kleinsten Fehler aus dem Objekt-Makroblock erkannt, und
aufgrund der erkannten Bewegung wird die Bewegungskompensation aus
dem letzten Bild durchgeführt,
um dadurch einen optimalen Prädiktionsblock
zu erhalten. Ein Signal, das die Bewegung zu dem Prädiktionsblock
mit dem kleinsten Fehler anzeigt, ist ein Bewegungsvektor. Ein Bild,
das als Bezug für
die Erzeugung des Prädiktions-Makroblocks
verwendet wird, wird nachstehend als Bezugsbild bezeichnet. Danach
wird die Differenz zwischen dem Objektblock und dem entsprechenden
Prädiktionsblock
ermittelt, und diese Differenz wird DCT-transformiert, um den DCT-Koeffizienten zu
erhalten. Der DCT-Koeffizient wird quantisiert, und die quantisierten
Ausgangsdaten werden zusammen mit den Bewegungs-Informationen übertragen
oder gespeichert. Dieses Verfahren heißt Interframe-Codierung.
-
Die
Interframe-Codierung hat zwei Prädiktionsmodi:
Prädiktion
aus einem vorhergehenden Bild in der Reihenfolge der Anzeige und
Prädiktion
sowohl aus vorhergehenden als auch künftigen Bildern. Der erstgenannte
Modus wird als Vorwärtsprädiktion und
der letztgenannte als Zweirichtungsprädiktion bezeichnet.
-
Decodiererseitig
wird nach dem Zurückführen des
quantisierten DCT-Koeffizienten zum ursprünglichen Differenzsignal der
Prädiktionsblock
auf der Grundlage des Differenzsignals und des Bewegungsvektors
erhalten, und der Prädiktionsblock
und das Differenzsignal werden addiert, um das Bild wiederzugeben.
Bei diesem herkömmlichen
Verfahren wird vorausgesetzt, dass die Größe des Bezugsbilds (eines Bilds,
das als Bezug zur Erzeugung eines Prädiktionsbilds dient) gleich
der Größe des Objektbilds ist.
-
In
den letzten Jahren sind mehrere Objekte, die ein Bild (Bild beliebiger
Form) darstellen, getrennt kompressionscodiert und übertragen
worden, um dadurch die Codierungsleistung zu verbessern und eine objektweise
Wiedergabe zu ermöglichen.
Bei der Codierung und Decodierung dieser Bilder beliebiger Form ändert sich
die Größe des Bilds
sehr häufig.
So wird ein Ball immer kleiner, bis er schließlich ganz verschwindet. Und
gelegentlich wird die Größe des Bilds
(Objekts) null.
-
Bei
der normalen prädiktiven
Codierung ist ein Bezugsbild ein wiedergegebenes Bild kurz vor einem
Objektbild, das gerade verarbeitet wird. Wenn die Größe des Bezugsbilds
null ist, da nichts in dem Bezugsbild definiert ist, d. h. da das
Bezugsbild keine signifikanten Bilddaten hat, die zur prädiktiven
Codierung verwendet werden sollen, kann keine prädiktive Codierung durchgeführt werden.
In diesem Fall gibt es außer
der Intraframe-Codierung keine herkömmliche Methode. In der Regel
erhöht
jedoch die Intraframe-Codierung die Menge der codierten Daten und senkt
die Kompressionsleistung. Wenn ein Bild verschwindet (Bildgröße = null)
und in einer Folge von Bewegtbildern häufig erscheint, wird die Codierungsleistung
erheblich verschlechtert. Wenn beispielsweise bei einem Blitzlicht-Bewegtbild
das Licht in Bild-Einheiten verschwindet und wieder erscheint, müssen alle
Bilder des Lichts Intraframe-codiert
werden.
-
Kurze Darstellung
der Erfindung
-
Ziel
der vorliegenden Erfindung ist es, ein Verfahren zur prädiktiven
Bilddecodierung zur Verfügung
zu stellen, das eine effiziente prädiktive Decodierung eines Bilds
veränderlicher
Größe auch
dann realisieren kann, wenn die Größe eines Bezugsbilds null ist
oder wenn das Bezugsbild völlig
transparent ist.
-
Die
Erfindung ist in Anspruch 1 dargelegt.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
ersten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
Die 2(a) und 2(b) sind
schematische Darstellungen zur Erläuterung der Bildprädiktion
bei dem erfindungsgemäßen Verfahren
zur prädiktiven
Bilddecodierung.
-
3 ist
ein Blockdiagramm, das eine Prädiktive-Bilddecodierungs-Vorrichtung
gemäß der ersten
Ausführungsform
zeigt.
-
4 ist
ein Blockdiagramm, das eine Einzelbild-Speichereinheit zeigt, die
in der Prädiktive-Bilddecodierungs-Vorrichtung
gemäß der ersten Ausführungsform
verwendet wird.
-
5 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
dritten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
6 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
vierten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
7 ist
ein Diagramm, das Bilddaten gemäß der ersten
Ausführungsform
zeigt.
-
8 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
zweiten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
9 ist
ein Diagramm, das Bilddaten gemäß der zweiten
Ausführungsform
zeigt.
-
10 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
fünften Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
11 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
Ausführungsform
der vorliegenden Erfindung.
-
Detaillierte Beschreibung
der bevorzugten Ausführungsformen
-
Ausführungsform 1
-
1 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
ersten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Bevor 1 erläutert wird,
wird ein Bildprädiktionsverfahren
gemäß der ersten
Ausführungsform
anhand der 2(a) und 2(b) beschrieben.
-
Die
Größe eines
Eingangsbilds, das bei dem Verfahren zur prädiktiven Bilddecodierung der
ersten Ausführungsform
verwendet wird, ist veränderlich, und
es kann passieren, dass die Größe null
wird.
-
2(a) zeigt Bilder 201 bis 210 eines
Bewegtbilds, die in der Reihenfolge der Anzeige angeordnet sind.
Das Bild 201 ist das erste anzuzeigende Einzelbild, an
das sich 202, 203 ... anschließen, und diese Reihenfolge
ist durch #1 bis #10 dargestellt. Da das Bild #1 (201)
das erste Bild ist, wird es Intraframe-codiert. Bei der ersten Ausführungsform
wird ein Bild (ein Einzelbild) in mehrere Blöcke unterteilt, die jeweils
eine Größe von 8 × 8 Pixeln haben,
und jeder Block von 8 × 8
Pixeln wird DCT-transformiert und quantisiert. Der quantisierte
Koeffizient wird einer Codierung variabler Länge unterzogen. Bei der Decodierung
werden die durch die Codierung variabler Länge erhaltenen codierten Daten
einer Decodierung variabler Länge
unterzogen, und der durch die Decodierung variabler Länge erhaltene
quantisierte Koeffizient wird einer inversen Quantisierung und inversen
DCT unterzogen, wodurch das Bild wiedergegeben wird. Dann wird das
Bild #2 (202) einer prädiktiven
Interframe-Codierung durch Referenzieren des wiedergegebenen Bilds
#1 (201) unterzogen.
-
Bei
der ersten Ausführungsform
wird mittels Block-Abgleichs als Bewegungserkennungsverfahren der
Prädiktionsblock
mit dem kleinsten Fehler aus dem Objektblock, der gerade verarbeitet
wird, aus dem Bild #1 (201) erkannt. Aufgrund der erkannten
Bewegung von dem Objektblock zu dem Prädiktionsblock wird durch Bewegungskompensation
des Objektblocks aus dem wiedergegebenen Bild #1 (201)
ein optimaler Prädiktionsblock
erhalten. Danach wird die Differenz zwischen dem Objektblock und
dem entsprechenden Prädiktionsblock
ermittelt und DCT-transformiert. Der DCT-Koeffizient wird quantisiert, und der
quantisierte Ausgabewert wird zusammen mit den Bewegungs-Informationen übertragen
oder gespeichert. Das wiedergegebene Bild #1 (201) dient
als Bezugsbild für
das Bild #2 (202). Diese Prädiktion wird als Vorwärtsprädiktion
bezeichnet. Bei der Decodierung wird der Prädiktionsblock zu der Differenz
addiert, die der inversen Quantisierung und inversen DCT unterzogen
worden ist, wodurch das Bild wiedergegeben wird.
-
In ähnlicher
Weise werden das Bild #3 (203) und das Bild #4 (204)
unter Verwendung der durch Pfeile gekennzeichneten Bezugsbilder
prädiktiv
codiert. Wie bei den Bildern #6 (206), #8 (208)
und #10 (210) kann die Prädiktion aus dem vorletzten
Bild erfolgen. Im Gegensatz zur Vorwärtsprädiktion kann die Prädiktion
wie bei den Bildern #5 (205), #7 (207) und #9
(209) durch Referenzieren eines künftigen Bilds erfolgen, das
nach dem Objektbild angezeigt werden soll. Diese Prädiktion
wird als Rückwärtsprädiktion
bezeichnet. Wenn sowohl die Vorwärts-
als auch die Rückwärtsprädiktion
durchgeführt
werden, handelt es sich um eine Zweirichtungsprädiktion. Die Zweirichtungsprädiktion
hat drei Modi: Vorwärtsprädiktionsmodus,
Rückwärtsprädiktionsmodus,
Interpolationsmodus zur Herstellung des Gleichgewichts von Vorwärts- und
Rückwärtsprädiktion.
-
2(b) zeigt die Übertragungsreihenfolge, d.
h. die Decodierungsreihenfolge, der Bilder, die wie in 2(a) gezeigt prädiktiert wurden.
-
Das
Bild #1 (211) wird zuerst decodiert und wiedergegeben.
Durch Referenzieren des wiedergegebenen Bilds #1 wird das Bild #2
(212) decodiert. Bei den Zweirichtungsprädiktionsbildern
wie beim Bild #5 (216) müssen die für die Prädiktion verwendeten Bezugsbilder
vor dem Prädiktionsbild
decodiert und wiedergegeben werden. Daher wird das Bild #6 (215)
vor dem Bild #5 (216) decodiert. Ebenso werden die Bilder
#8 (217) und #10 (219) vor den Bildern #7 (218)
bzw. #9 (220) übertragen,
decodiert und wiedergegeben.
-
Bei
der Übertragung
eines Bilds mit veränderlicher
Größe muss
die Größe des Bilds übertragen
werden. Bei der ersten Ausführungsform
wird die Bildgröße am Kopf
der codierten Daten des Bilds angegeben, und die horizontale Größe Hm und
die vertikale Größe Vm werden
jeweils durch 20 Bit dargestellt. 7 zeigt
die gemäß der ersten
Ausführungsform
codierten Bilddaten (VD), die außer der horizontalen Größe Hm und
der vertikalen Größe Vm auch den
Bewegungsvektor, die Quantisierungsbreite und den DCT-Koeffizienten aufweisen.
-
Nachstehend
wird der Prädiktionsbild-Erzeugungsprozess
bei dem Verfahren zur prädiktiven Bilddecodierung
gemäß der ersten
Ausführungsform beschrieben.
-
Um
ein Prädiktionsbild
zu erzeugen, wird zunächst
die Größe des vorhergehenden
Bezugsbilds eingegeben (Schritt 102), und es wird geprüft, ob die Größe des Bezugsbilds
null ist oder nicht (Schritt 103).
-
Bei
der in 2(b) gezeigten Decodierungsreihenfolge
ist stets ein Bezugsbild vor einem zu decodierenden Bild vorhanden
(bei der Codierung ein Codierungsobjekt). Das heißt, das
Bezugsbild ist das zuletzt wiedergegebene Bild bei dem Verfahren
der prädiktiven
Decodierung der ersten Ausführungsform.
Beispielsweise ist in 2(b) das
Bild #3 (213) ein Bezugsbild für das Bild #4 (214).
Ein durch Zweirichtungsprädiktion
wiedergegebenes Bild kann jedoch nicht zur Prädiktion verwendet werden, sodass dieses
Bild kein Bezugsbild sein kann. Daher ist beispielsweise das Bild
#6 (215) ein Bezugsbild für das Bild #8 (217).
-
Wenn
im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds
nicht null ist, folgt Schritt 104, in dem ein Prädiktionsbild
unter Verwendung des Bezugsbilds erzeugt wird. Wenn jedoch im Schritt 103 entschieden
wird, dass die Größe des Bezugsbilds
null ist, folgt Schritt 105, in dem ein Prädiktionsbild
unter Verwendung eines vor kurzem wiedergegebenen Bilds, dessen
Größe nicht
null ist, als Bezugsbild erzeugt wird. Die Methode zur Erkennung eines
vor kurzem wiedergegebenen Bilds, dessen Größe nicht null ist, wird nachstehend
anhand von 2(b) beschrieben.
-
Wenn
ein Prädiktionsbild
des Bilds #4 (214) erzeugt wird, wird unterstellt, dass
die Größe des Bilds
#3 (213) unmittelbar vor dem Bild #4 (214) null ist
und die Größe des Bilds
#2 nicht null ist. In diesem Fall wird durch Referenzieren des Bilds
#2 (212) ein Prädiktionsbild
des Bilds #4 (214) erzeugt. Genauso wird bei der Erzeugung
eines Prädiktionsbilds
des Bilds #6 (215) in der Annahme, dass die Größe der Bilder
#3 (213) und #4 (214) null ist, das Prädiktionsbild
durch Referenzieren des Bilds #2 (212) erzeugt. Die erste
Ausführungsform
verwendet die blockweise Bewegungskompensation als Verfahren zur
Erzeugung eines Prädiktionsbilds,
wie MPEG1.
-
3 ist
ein Blockdiagramm, das eine Prädiktive-Bilddecodierungs-Vorrichtung 300 gemäß der ersten
Ausführungsform
zeigt.
-
Die
Prädiktive-Bilddecodierungs-Vorrichtung 300 empfängt Bilddaten,
die durch Kompressionscodierung eines Bilds mit veränderlicher
Größe nach
einem vorgeschriebenen Verfahren erhalten werden, und führt die
prädiktive
Decodierung der Bilddaten durch.
-
Die
Prädiktive-Bilddecodierungs-Vorrichtung 300 weist
einen Daten-Analysator 302, einen Decodierer 303 und
ein Addierwerk 306 auf. Der Daten-Analysator 302 analysiert
die kompressionscodierten Bilddaten und gibt die Quantisierungsbreite und
den DCT-Koeffizienten
an die Leitung 312, den Bewegungsvektor an die Leitung 318 und
die Bildgröße an die
Leitung 321 aus. Der Decodierer 303 wandelt die
komprimierten Blockdaten (komprimierter Block) aus dem Daten-Analysator 302 durch
Daten-Expansion in einen expandierten Block um. Das Addierwerk 306 addiert
den expandierten Block und den Prädiktionsblock, um einen wiedergegebenen Block
zu erzeugen.
-
Die
Prädiktive-Bilddecodierungs-Vorrichtung 300 weist
außerdem
eine Einzelbild-Speichereinheit 309 und
einen Prädiktionsbild-Generator 310 auf.
Die Einzelbild-Speichereinheit 309 speichert
den wiedergegebenen Block. Der Prädiktionsbild-Generator 310 erzeugt
eine Adresse zum Zugreifen auf die Einzelbild-Speichereinheit 309 aufgrund
des Bewegungsvektors und erhält
als Prädiktionsblock
einen Block, der der Adresse aus dem in der Einzelbild-Speichereinheit 309 gespeicherten
Bild entspricht. Bei der ersten Ausführungsform bestimmt der Prädiktionsbild-Generator 310 als
Bezugsbild ein einziges wiedergegebenes Bild, das vor kurzem wiedergegeben
worden ist und zu referenzierende signifikante Bilddaten aufweist,
aufgrund der Bildgröße von dem
Daten-Analysator 302. Die Bestimmung des Bezugsbilds kann,
wie in 3 durch Strichlinien dargestellt ist, mit einem
Steuergerät 320 erfolgen, das
die Einzelbild-Speichereinheit 309 entsprechend der Bildgröße von dem
Daten-Analysator 302 steuert. Das heißt, die Einzelbild-Speichereinheit 309 wird
von dem Steuergerät 320 so
gesteuert, dass sie ein einzelnes wiedergegebenes Bild wählt, das
vor kurzem wiedergegeben worden ist und zu referenzierende signifikante
Bilddaten aufweist.
-
Der
Decodierer 303 weist einen inversen Quantisierer (IQ) 304,
der den komprimierten Block aus dem Daten-Analysator 302 invers
quantisiert, und einen inversen diskreten Kosinustransformator (nachstehend
als IDCT bezeichnet) 305 auf, der die Ausgangssignale von
dem inversen Quantisierer 304 einer inversen DCT (Transformation
eines Frequenzbereichssignals in ein Raumbereichssignal) unterzieht.
-
Die
Bezugssymbole 301 und 307 bezeichnen das Eingabe-
bzw. Ausgabeterminal der Prädiktive-Bilddecodierungs-Vorrichtung 300.
-
Nachstehend
wird die Funktionsweise der in 3 gezeigten
Prädiktive-Bilddecodierungs-Vorrichtung
beschrieben.
-
Zunächst werden
Bilddaten (codierte Daten), die durch Kompressionscodierung eines
Bilds mit veränderlicher
Größe nach
einem festgelegten Verfahren erhalten werden, in das Eingabeterminal 301 eingegeben.
Bei der ersten Ausführungsform
erfolgt die Kompressionscodierung durch Bewegungskompensations-DCT
wie bei MPEG1, sodass die codierten Daten den Bewegungsvektor, die
Quantisierungsbreite, den DCT-Koeffizienten und die Bildgrößendaten
umfassen.
-
Dann
werden in dem Daten-Analysator 302 die kompressionscodierten
Bilddaten analysiert und die Quantisierungsbreite und der DCT-Koeffizient werden
als komprimierte Blockdaten über
die Leitung 312 an den Decodierer 303 gesendet.
Außerdem wird
der in dem Daten-Analysator 302 analysierte Bewegungsvektor über die
Leitung 318 an den Prädiktionsbild-Generator 310 gesendet.
Ebenso wird die von dem Daten-Analysator 302 analysierte
Bildgröße über die
Leitung 321 an das Steuergerät 320 gesendet.
-
In
dem Decodierer 303 werden die komprimierten Blockdaten,
d. h. der komprimierte Block, von dem inversen Quantisierer 304 und
dem Inverse-DCT-Transformator 305 expandiert, sodass ein expandierter
Block 314 entsteht. Genauer gesagt, quantisiert der inverse
Quantisierer 304 den komprimierten Block invers, und der
Inverse-DCT-Transformator 305 transformiert
das Frequenzbereichssignal in ein Raumbereichssignal, sodass der
expandierte Block 314 entsteht. In dem Prädiktionsbild-Generator 310 wird
entsprechend dem über
die Leitung 318 gesendeten Bewegungsvektor eine Adresse 321 zum Zugreifen
auf die Einzelbild-Speichereinheit 309 erzeugt und in die
Einzelbild-Speichereinheit 309 eingegeben.
Dann wird aus den in der Einzelbild-Speichereinheit 309 gespeicherten
Bildern ein Prädiktionsblock 317 erzeugt.
Der Prädiktionsblock 317 (319)
und der expandierte Block 314 werden in das Addierwerk 306 eingegeben,
in dem die Blöcke 319 und 314 addiert
werden, sodass ein wiedergegebener Block 315 entsteht.
Der wiedergegebene Block 315 wird von dem Ausgabeterminal 307 ausgegeben und
wird gleichzeitig über
die Leitung 316 gesendet und in der Einzelbild-Speichereinheit 309 gespeichert.
Wenn die Intraframe-Decodierung durchgeführt wird, sind die Abtastwerte
des Prädiktionsblocks alle
null.
-
Die
Funktionsweise des Prädiktionsbild-Generators 310 ist
mit der identisch, die bereits in Zusammenhang mit dem Ablaufdiagramm
von 1 beschrieben wurde. Das heißt, die Größe des Bezugsbilds wird in
den Prädiktionsbild-Generator 310 eingegeben,
und der Prädiktionsbild-Generator 310 bestimmt
das Bezugsbild. Die Bezugsbild-Bestimmung kann durch Steuern der
Einzelbild-Speichereinheit 309 entsprechend den über das
Steuergerät 320 und
die Leitung 322 gesendeten Informationen darüber, ob
die Größe des Bezugsbilds
null ist oder nicht, erfolgen.
-
4 ist
ein Blockdiagramm, das eine Einzelbild-Speicherbank 406 als
Beispiel für
die Einzelbild-Speichereinheit 309 in der Prädiktive-Bilddecodierungs-Vorrichtung 300 gemäß der ersten
Ausführungsform
zeigt. Die Einzelbild-Speicherbank 406 weist drei Einzelbild-Speicher 401 bis 403 auf.
Das wiedergegebene Bild wird in einem der Einzelbild-Speicher 401 bis 403 gespeichert.
Bei der Erzeugung eines Prädiktionsbilds
wird auf die Einzelbild-Speicher 401 bis 403 zugegriffen.
-
Bei
der ersten Ausführungsform
hat die Einzelbild-Speicherbank 406 Schalter 404 und 405.
Der Schalter 405 soll einen Einzelbild-Speicher zum Speichern
des wiedergegebenen Bilds wählen,
das von den Einzelbild-Speichern 401 bis 403 über die Leitung 408 (entspricht
der Leitung 316 in 3) eingegeben
wird. Der Schalter 405 wählt nacheinander die Einzelbild-Speicher 401 bis 403,
die von dem Steuergerät 320,
d. h. entsprechend dem Steuersignal 322, gesteuert werden.
Das heißt,
nachdem das erste wiedergegebene Bild in dem Einzelbild-Speicher 401 gespeichert
worden ist, wird das zweite wiedergegebene Bild in dem Einzelbild-Speicher 402 gespeichert.
Nachdem das dritte wiedergegebene Bild in dem Einzelbild-Speicher 403 gespeichert
worden ist, wählt
der Schalter 405 den Einzelbild-Speicher 401.
Der Schalter 404 ist über
die Leitung 407 (entspricht der Leitung 317 in 3)
mit dem Prädiktionsbild-Generator 310 verbunden.
Dieser Schalter 404 wählt
ebenfalls nacheinander die Einzelbild-Speicher 401 bis 403,
die von dem Steuergerät 320,
d. h. entsprechend dem Steuersignal 322, gesteuert werden.
Die Schaltfolge wird jedoch entsprechend der Größe des Bezugsbilds geändert. Obwohl zur
Erzeugung eines Prädiktionsbilds
entsprechend der vorgegebenen Reihenfolge beispielsweise der Schalter 404 mit
dem Einzelbild-Speicher 402 verbunden werden muss, wenn
die Bildgröße des Einzelbild-Speichers 402 null
ist, steuert das Steuergerät 320 den
Schalter 404 so, dass der vorhergehende Einzelbild-Speicher 401 gewählt wird
(unter der Voraussetzung, dass die Bildgröße des Einzelbild-Speichers 401 nicht
null ist). Auf diese Weise kann ein Prädiktionsbild aus einem Bezugsbild,
dessen Größe nicht
null ist, erzeugt werden. Der Schalter 404 kann mit mehreren
Einzelbild-Speichern gleichzeitig verbunden sein. Bei einer Einheit,
bei der jeder Einzelbild-Speicher bei jeder Wiedergabe eines einzelnen Bilds
rückgesetzt
wird, kann durch Steuern der Einheit mit dem Steuergerät 320 in
einer Weise, dass der Einzelbild-Speicher nicht rückgesetzt
wird, wenn die Größe des wiedergegebenen
Bilds null ist, ein vor kurzem wiedergegebenes Bild, dessen Größe nicht null
ist, in dem Einzelbild-Speicher bleiben. Mit anderen Worten, es
ist möglich,
eine Aktualisierung des Einzelbild-Speichers zu vermeiden.
-
Obwohl
bei der ersten Ausführungsform
das Verfahren der DCT mit blockweiser Bewegungskompensation beschrieben
wird, kann die vorliegende Erfindung auch für andere Prädiktionsverfahren verwendet
werden, die beispielsweise die globale Bewegungskompensation oder
arbiträre
gitterförmige Block-Bewegungskompensation nutzen.
Obwohl bei der ersten Ausführungsform
ein Prädiktionsbild
aus einem einzigen wiedergegebenen Bild, das als Bezugsbild dient,
erzeugt wird, kann die vorliegende Erfindung ebenso für den Fall
verwendet werden, dass ein Prädiktionsbild
aus mehreren Bezugsbildern erzeugt wird.
-
Wie
vorstehend beschrieben, wird gemäß der ersten
Ausführungsform
die Größe eines
vorhergehenden Bezugsbilds ermittelt, die in die Vorrichtung eingegeben
wird, und wenn die Größe des Bezugsbilds
nicht null ist, wird ein Prädiktionsbild
unter Verwendung des Bezugsbilds erzeugt. Wenn jedoch die Größe des vorhergehenden
Bezugsbilds null ist, wird ein Prädiktionsbild unter Verwendung
eines vor kurzem wiedergegebenen Bilds erzeugt, dessen Größe nicht
null ist. Wenn also mehrere Objekte, die ein Bild darstellen, kompressionscodiert
und objektweise gesendet werden, um die Kompressionsleistung zu
erhöhen,
wird vermieden, dass ein Bild mit veränderlicher Größe, das
bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung oder Codierung
verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung
führt, die
das Restsignal (Differenzsignal) unterdrücken kann.
-
Ausführungsform 2
-
Bei
der ersten Ausführungsform
wird ermittelt, ob die Größe des Bezugsbilds
null ist oder nicht, und die Bezugsbild-Bestimmung erfolgt unter
Verwendung der ermittelten Informationen. Wenn jedoch der Umstand,
dass die Bildgröße null
ist, durch einen anderen Index (z. B. ein Ein-Bit-Flag F) dargestellt wird,
kann die Steuerung mit diesem Index durchgeführt werden. Bei dieser zweiten
Ausführungsform, die
nicht Bestandteil der Erfindung ist, wird die Erzeugung des Prädiktionsbilds
unter Verwendung dieses Indexes gesteuert.
-
Das
heißt,
bei der zweiten Ausführungsform, die
in 9 dargestellt ist, weisen die codierten Daten
eines Objektbilds ein Ein-Bit-Flag F auf, das anzeigt, dass die
Bildgröße null
ist, d. h. das entsprechende Bezugsbild ist völlig transparent und hat keine
codierten Daten, und dieses Flag F wird vor der die Bildgröße angebenden
horizontalen und vertikalen Größe Hm und
Vm gesetzt. Wenn die Bildgröße null
ist, ist das Flag F „0". Bei der zweiten
Ausführungsform
wird also die Erzeugung eines Prädiktionsbilds
mit Hilfe des Flags F gesteuert.
-
Nachstehend
wird ein Prädiktionsbild-Erzeugungsprozess
bei dem Verfahren zur prädiktiven Bilddecodierung
gemäß der zweiten
Ausführungsform
anhand des Ablaufdiagramms von 8 beschrieben.
-
Um
ein Prädiktionsbild
zu erzeugen, wird zunächst
im Schritt 802 ein vorhergehendes Bezugsbild eingegeben,
und im Schritt 803 wird geprüft, ob das Flag F des Bezugsbilds „1" ist oder nicht.
Wenn im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds „1" ist, ist die Größe dieses
Bezugsbilds nicht null, d. h. das Bezugsbild ist nicht völlig transparent
und es hat codierte Daten. Somit wird im Schritt 804 ein
Prädiktionsbild
unter Verwendung des vorhergehenden Bezugsbilds erzeugt.
-
Wenn
jedoch im Schritt 803 entschieden wird, dass das Flag F
des Bezugsbilds nicht „1" ist, folgt Schritt 805,
in dem ein Prädiktionsbild
unter Verwendung eines vor kurzem wiedergegebenen Bilds, dessen
Flag F nicht „0" ist, als Bezugsbild
erzeugt wird.
-
Wenn,
wie vorstehend beschrieben, bei der zweiten Ausführungsform mehrere Objekte,
die ein Bild darstellen, kompressionscodiert und dann objektweise
gesendet werden, wird vermieden, dass ein Bild mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben
die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das
anzeigt, ob das zuvor wiedergegebene Bild zu referenzierende signifikante
codierte Daten hat, und die Bezugsbild-Bestimmung erfolgt durch Erkennen dieses
Flags. Dadurch wird die Bestimmung des Bezugsbilds erleichtert.
-
Ausführungsform 3
-
5 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
dritten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess
gemäß dieser
dritten Ausführungsform
ist im Wesentlichen mit dem gemäß der ersten
Ausführungsform
identisch, mit der Ausnahme, dass Schritt 505 in 5 an
die Stelle von Schritt 105 in 1 tritt.
Wenn das Bezugsbild null ist oder wenn es völlig transparent ist (oder
wenn das Flag F des Bilds „0" ist), wird im Schritt 505 ein
Prädiktionsbild,
dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild
mit einem vorgegebenen Wert, erzeugt.
-
Bei
dieser dritten Ausführungsform
wird unterstellt, dass das Prädiktionsbild
grau ist, d. h., dass sowohl sein Luminanzsignalwert als auch sein
Farbdifferenzsignalwert 128 sind. Dadurch wird bei der Codierung
der graue Block von dem zu codierenden Block subtrahiert. Bei der
Decodierung wird der graue Block zu dem zu decodierenden Block addiert. Der
vorgenannte vorgegebene Wert kann variabel sein und von dem Codierer
an den Decodierer gesendet werden, um zur Erzeugung eines Prädiktionsbilds
verwendet zu werden.
-
Wenn,
wie vorstehend beschrieben, bei der dritten Ausführungsform mehrere Objekte,
die ein Bild darstellen, kompressionscodiert und dann objektweise
gesendet werden, wird vermieden, dass ein Bild mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem wird,
wenn die Größe des Bezugsbilds
null ist, d. h. wenn das Bezugsbild völlig transparent ist, ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt. Dadurch wird außer den
Wirkungen, die von der ersten Ausführungsform bereitgestellt werden,
auch die Erzeugung des Prädiktionsbilds
erleichtert.
-
Ausführungsform 4
-
10 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
vierten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess
gemäß dieser
vierten Ausführungsform
ist im Wesentlichen mit dem Prozess gemäß der zweiten Ausführungsform
identisch, mit der Ausnahme, dass Schritt 1005 in 10 an
die Stelle von Schritt 805 in 8 tritt.
Wenn das Flag F des Bezugsbilds „0" ist, wird im Schritt 1005 ein
Prädiktionsbild,
dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild
mit einem vorgegebenen Wert, erzeugt.
-
Wenn
bei der vierten Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
dann objektweise gesendet werden, wird vermieden, dass ein Bild
mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven Decodierung
oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben
die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das
anzeigt, ob das zuvor wiedergegebene Bild zu referenzierende signifikante
codierte Daten hat, und wenn festgestellt wird, dass dieses Flag „0" ist, wird ein Prädiktionsbild
mit dem vorgegebenen Wert erzeugt. Dadurch wird außer den
Wirkungen, die von der zweiten Ausführungsform bereitgestellt werden,
auch die Erzeugung des Prädiktionsbilds
erleichtert.
-
Ausführungsform 5
-
6 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer
fünften
Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Nachstehend
wird die Zweirichtungsprädiktion
für den
Fall beschrieben, dass die Bezugsbildgröße null ist, also das Bezugsbild
völlig
transparent ist.
-
Zunächst werden
im Schritt 602 die Größen der
Vorwärts-
und Rückwärts-Bezugsbilder eingegeben.
Das in 2(a) gezeigte Bild #5 (205)
ist ein Zweirichtungsprädiktionsbild,
dessen Vorwärts-
und Rückwärts-Bezugsbilder
die Bilder #4 (204) bzw. #6 (206) sind.
-
Wenn
in den Schritten 603 und 604 entschieden wird,
dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder
jeweils null ist, wird im Schritt 605 ein Bild, dem ein
vorgegebener Wert zugewiesen ist, d. h. ein Bild mit einem vorgegebenen
Wert, als vorgegebener Wert erzeugt.
-
Wenn
in den Schritten 603 und 604 entschieden wird,
dass die Größe des Vorwärts-Bezugsbilds null
und die Größe des Rückwärts-Bezugsbilds
nicht null ist, wird im Schritt 606 ein Prädiktionsbild
unter Verwendung nur des Rückwärts-Bezugsbilds
erzeugt.
-
Wenn
in den Schritten 603 und 607 entschieden wird,
dass die Größe des Vorwärts-Bezugsbilds nicht
null ist und die Größe des Rückwärts-Bezugsbilds
null ist, wird im Schritt 608 ein Prädiktionsbild unter Verwendung
nur des Vorwärts-Bezugsbilds
erzeugt.
-
Wenn
in den Schritten 603 und 607 entschieden wird,
dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder
jeweils nicht null ist, wird ein Prädiktionsbild unter Verwendung
dieser Bezugsbilder erzeugt.
-
Im
Schritt 610 wird das erzeugte Prädiktionsbild ausgegeben. Bei
Empfang des Prädiktionsbilds subtrahiert
der Codierer das Prädiktionsbild
von dem Objektbild, während
der Decodierer das Prädiktionsbild
zu der Differenz des Objektbilds addiert. Auf diese Weise kann das
Restsignal (Differenzsignal) unterdrückt werden.
-
In
dem Fall, dass, wie vorstehend beschrieben, bei der fünften Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung
von Vorwärts-
und Rückwärts-Bezugsbildern erzeugt
wird, wird vermieden, dass Bilder mit veränderlicher Größe, die
bereits verschwunden sind, als Bezugsbilder verwendet werden, was
zu einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Und da ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt wird, wird die Erzeugung des
Prädiktionsbilds
erleichtert.
-
Ausführungsform
der Erfindung
-
11 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer
Ausführungsform
der vorliegenden Erfindung. Diese Ausführungsform der Erfindung ist
im Wesentlichen mit der fünften
Ausführungsform
identisch, so wie die zweite und die vierte Ausführungsform im Wesentlichen
identisch mit der ersten bzw. dritten Ausführungsform sind. Insbesondere
wird bei dieser Ausführungsform
die Frage „Ist
die Größe null?" in den Schritten 603, 604 und 607 in 6 in
die Frage „Ist das
Flag F 0?" in den
Schritten 1103, 1104 und 1107 in 11 umgewandelt.
-
In
dem Fall, dass bei dieser Ausführungsform
der Erfindung mehrere Objekte, die ein Bild darstellen, kompressionscodiert
und objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung
von Vorwärts-
und Rückwärts-Bezugsbildern erzeugt
wird, wird vermieden, dass Bilder mit veränderlicher Größe, die
bereits verschwunden sind, als Bezugsbilder verwendet werden, was
zu einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Wenn festgestellt
wird, dass das Flag F der Vorwärts-
und Rückwärts-Bezugsbilder
jeweils „0" ist, wird ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt. Dadurch wird die Erkennung
eines Bilds mit veränderlicher
Größe, das
bereits verschwunden ist, erleichtert, und die Erzeugung des Prädiktionsbilds
wird ebenfalls erleichtert.