DE10303928A1

DE10303928A1 - Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und dafür geeigente Vorrichtung

Info

Publication number: DE10303928A1
Application number: DE2003103928
Authority: DE
Inventors: Byung-Cheol Song; Kang-Wook Chun
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2002-03-09
Filing date: 2003-01-31
Publication date: 2003-10-23
Also published as: US20030169933A1; KR100850705B1; KR20030073254A; CN1444397A; CN1283100C; JP2003274415A; US7280708B2; US20060210184A1

Abstract

Ein Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis einer zeitlichen und räumlichen Komplexität und eine dafür geeignete Vorrichtung werden bereitgestellt. Im Verfahren wird die Kodierung mit verschiedenen zeitlichen und räumlichen Auflösungen bei Bildraten, die auf der zeitlichen und räumlichen Komplexität eines eingegebenen Bildes basieren, durchgeführt, so dass die Bilddaten mit einer hohen Effizienz gespeichert werden können. Das Verfahren umfasst: Berechnen einer räumlichen Komplexität der eingegebenen Bilddaten, Bestimmen einer Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert und Umwandeln der Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung.

Description

HINTERGRUND DER ERFINDUNG

GEBIET DER ERFINDUNG

Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren für das Kodieren eines Bewegtbildes und insbesondere auf ein Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und auf eine dafür geeignete Vorrichtung.

BESCHREIBUNG DES STANDS DER TECHNIK

Da digitale Videorekorder (DVRs) und persönliche Videorecorder (PVRs) eine große Verbreitung gefunden haben, ist die Forschung über Bildkompressionstechniken aktiv vorangetrieben worden. Da jedoch beim konventionellen DVR und PVR ein Bild mit einer festen Auflösung ohne die Berücksichtigung einer zeitlichen und räumlichen Komplexität komprimiert wird, ist der Wirkungsgrad der Komprimierung niedrig.
Fig. 1 ist ein Blockdiagramm eines Bewegtbildkodiersystems des Stands der Technik. Zuerst werden die eingegebenen Bilddaten in 8 × 8 Bildpunktblöcke aufgeteilt. Um die räumliche Korrelation zu entfernen, führt eine Einheit 110 zur diskreten Kosinus-Transformation (DCT) DCT-Operationen mit den Bilddaten, die in Einheiten von 8 × 8 Bildpunktblöcken eingegeben werden, durch. Durch die Quantisierung von DCT-Koeffizienten, die man in der DCT-Einheit 120 erhält, drückt eine Quantisiereinheit (Q) 120 die DCT-Koeffizienten durch einige repräsentative Werte aus, so dass eine hoch wirksame verlustbehaftete Kompression durchgeführt wird. Eine Einheit 130 zur variablen Längenkodierung (VCL) führt eine Entropiekodierung der quantisierten DCT-Koeffizienten durch und gibt einen entropiekodierten Datenstrom aus.
Ein Einheit 140 zur inversen Quantisierung (IQ) führt eine inverse Quantisierung der Bilddaten, die in der Quantisiereinheit 120 quantisiert wurden, durch. Eine Einheit 150 zur inversen DCT (IDCT) transformiert die Bilddaten, die in der Einheit 140 zur inversen Quantisierung (IQ) invers quantisiert wurden. Eine Bildspeichereinheit 160 speichert die Bilddaten, die in der IDCT-Einheit 150 einer IDCT-Transformation unterworfen wurden, in Einheiten von Bildern. Eine Bewegungsschätzeinheit (ME-Einheit) 170 entfernt zeitliche Korrelationen durch die Verwendung von Bilddaten des aktuell eingegebenen Bildes und Bilddaten eines vorhergehenden Bildes, das in der Bildspeichereinheit 160 gespeichert ist.
Für eine Datenkompression wird im DVR und PVR des Stands der Technik ein MPEG-2 Kodierer verwendet, wie das in Fig. 1 gezeigt ist. Wenn die Eingabedaten nicht komprimiert sind, so werden die Daten durch den MPEG-2-Kodierer komprimiert, und der Bitstrom wird in einem Speichermedium, wie einem Festplattenlaufwerk (HDD) oder einer digitalen Bildplatte (DVD) gespeichert. Wenn die Eingabebilddaten einen komprimierten Bitstrom darstellen, so wird um einen MPEG-2 Strom mit den gewünschten Zuständen unter Verwendung eines Bewegtbildtranskoders, der in Fig. 2 gezeigt ist, zu erzeugen, das MPEG-2 Bewegtbild dekodiert, und dann wird eine vorbestimmte Maßstabs- und Formattransformation vorgenommen. Dann wird die MPEG-2 Bewegtbildkodierung durchgeführt.
Fig. 2 ist ein Blockdiagramm einer Transkodiervorrichtung des Stands der Technik. Wenn die eingegebenen Bilddaten einen komprimierten Bitstrom darstellen, so werden die Bilddaten durch einen Bewegtbilddekodierer 220, der eine Einheit 222 zur variablen Längenkodierung (VLD), eine Einheit 224 zur inversen Quantisierung, eine IDCT-Einheit 226, einen Bildspeicher 228 und eine Bewegungskompensationseinheit (MC-Einheit) 230 umfasst, dekodiert. Um dann einen MPEG-2 Strom mit den gewünschten Zuständen zu erzeugen, wird das Bewegtbild mit einer vorbestimmten Auflösung unter Verwendung desselben MPEG-2 Kodierers, wie beim Bewegtbildkodierer, der in Fig. 1 gezeigt ist, kodiert. Dieses Verfahren wird als Transkodierung bezeichnet. Wenn eine Transkodierung durchgeführt wird, so wird eine Einheit 240 für die Maßstab- und Formattransformation verwendet, um den Maßstab des Bildes zu reduzieren oder um das Format des Bildes, das durch den Bewegtbilddekodierer 220 dekodiert wurde, umzuwandeln, wenn das notwendig sein sollte. Dann wird der MPEG-2 Kodierer 260 verwendet, um eine MPEG-2 Kodierung mit einer vorbestimmten Auflösung durchzuführen.
Somit wird bei der MPEG-2 Kodierung im Stand der Technik eine Kodierung immer mit konstanter Auflösung durchgeführt. Wenn somit die räumlich Komplexität gemäß den Eigenschaften eines eingegebenen Bewegtbildes groß oder nicht groß ist, so wird die Kodierung immer mit derselben Auflösung durchgeführt. Sogar wenn ein Bewegtbild eine geringe zeitliche Änderung aufweist, sollte eine hohe Bildrate von 30 Hz aufrecht gehalten werden, so dass die Effizienz der Kodierung abnimmt.

ZUSAMMENFASSUNG DER ERFINDUNG

Die vorliegende Erfindung liefert ein Verfahren und eine Vorrichtung der adaptiven Bewegtbildkodierung, um adaptiv eine Bewegtbildkodierung auf der Basis der Eigenschaften des eingegebenen Bewegtbildes durchzuführen, so dass die Kodiereffizienz zunimmt.
Die vorliegende Erfindung liefert auch ein Verfahren und eine Vorrichtung der adaptives Bewegtbildcodierung, um die Effizienz des Speicherns, wenn ein Bewegtbild in einem HDD oder einer DVD gespeichert wird, durch die Verwendung der MPEG-2 Kompression zu maximieren.
Gemäß einem Aspekt der vorliegenden Erfindung wird ein adaptives Bildkodierverfahren auf der Basis einer räumlichen Komplexität bereitgestellt, wobei es folgendes umfasst: (a) Berechnen einer räumlichen Komplexität der eingegebenen Bilddaten, (b) Bestimmen einer Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert, und (c) Umwandeln der Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung.
Gemäß einem anderen Aspekt der vorliegenden Erfindung wird eine adaptive Bildkodiervorrichtung auf der Basis einer räumlichen Komplexität bereit gestellt, wobei sie folgendes umfasst: eine Berechnungseinheit für die räumliche Komplexität, die eine räumliche Komplexität der eingegebenen Bilddaten berechnet, eine Auflösungsbestimmungseinheit, die eine Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt, und eine Auflösungsumwandlungseinheit, die die Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung umwandelt.
Gemäß einem nochmals anderen Aspekt der vorliegenden Erfindung wird ein adaptives Bildkodierverfahren, das auf einer zeitlichen Komplexität basiert, bereitgestellt, wobei es folgendes umfasst: (a) Berechnen einer zeitlichen Komplexität der eingegebenen Bilddaten, (b) Bestimmen einer Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert, und (c) Umwandeln der Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate.
Gemäß einem nochmals anderen Aspekt der vorliegenden Erfindung wird eine adaptive Bewegtbildkodiervorrichtung auf der Basis einer zeitlichen Komplexität bereit gestellt, wobei sie folgendes umfasst: eine Berechnungseinheit für die zeitliche Komplexität, die eine zeitliche Komplexität der eingegebenen Bilddaten berechnet, eine Bildratenbestimmungseinheit, die eine Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt, und eine Bildratenumwandlungseinheit, die die Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate umwandelt.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Die obige Aufgabe und andere Aufgaben und Vorteile der vorliegenden Erfindung werden durch eine detaillierte Beschreibung bevorzugter Ausführungsformen unter Bezug auf die angefügten Zeichnungen deutlicher.
Fig. 1 ist ein Blockdiagramm eines Bewegtbildkodiersystems des Stands der Technik;
Fig. 2 ist ein Blockdiagramm einer Transkodiervorrichtung des Stands der Technik;
Fig. 3 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung;
Fig. 4 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Transkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung;
Fig. 5 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung; und
Fig. 6 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Transkodierung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN

Der Kern einer Bildkomprimiertechnik für den Zweck der Speicherung liegt darin, ob ein vorgegebenes Bild mit hoher Effizienz komprimiert wird oder ob dies nicht der Fall ist. Beim konventionellen DVR und PVR wird ein Bild mit einer vorbestimmten Auflösung komprimiert und dann gespeichert.
Die vorliegende Erfindung dient zur Lösung der Probleme, die auftreten, wenn ein Bild mit einer vorbestimmten Auflösung komprimiert und gespeichert wird. Gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung wird unter Berücksichtigung, dass die zeitliche und räumliche Komplexität groß oder klein sein kann, gemäß den Eigenschaften eines eingegebenen Bewegtbildes die Kodierung in Einheiten von Gruppen von Bildern (GOP) mit unterschiedlichen räumlichen und zeitlichen Auflösungen gemäß der räumlichen und zeitlichen Auflösung des eingegebenen Bildes durchgeführt, so dass eine hohe Effizienz beim Speichern erzielt werden kann.
Nach der Dekodierung wird eine GOP, die eine niedrige räumliche Komplexität aufweist, durch Interpolation expandiert und dann angezeigt. Eine GOP, die eine niedrige zeitliche Komplexität, das heißt eine geringe Bewegung aufweist, wird mit einer niedrigeren Bildrate kodiert, so dass die Kodiereffizienz zunimmt.
Unter Bezug auf die begleitenden Zeichnungen werden nun bevorzugte Ausführungsformen der vorliegenden Erfindung erläutert.
Fig. 3 ist ein vollständiges Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.
Die Vorrichtung zur Bewegtbildkodierung gemäß der vorliegenden Erfindung umfasst eine Berechnungseinheit 320 für die räumliche Komplexität, eine Auflösungsbestimmungseinheit 340, eine Auflösungsumwandlungseinheit 360 und eine Kodiereinheit 380, die sequentiell, das heißt in einer Kaskadenverbindung, verbunden sind.
Die Berechnungseinheit 320 für die räumliche Komplexität erhält Dispersionswerte in Einheiten von 8 × 8 Blöcken für die eingegebenen Bilder in Einheiten von GOPs und berechnet einen Mittelwert der Dispersionswerte. Obwohl der mittlere Dispersionswert in der vorliegenden Ausführungsform in Einheiten von GOP erhalten wird, kann ein mittlerer Dispersionswert selektiv für andere Einheiten erhalten werden.
Die Auflösungsbestimmungseinheit 340 vergleicht den mittleren Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, mit einem vorbestimmten Schwellwert und bestimmt eine Auflösung in Einheiten von GOP. Wenn beispielsweise der mittlere Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, größer als der vorbestimmte Schwellwert ist, so wird die MPEG-2 Kodierung für diese GOP mit einer vorbestimmten ursprünglichen Auflösung durchgeführt. Wenn der mittlere Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, kleiner als der vorbestimmte Schwellwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt.
Obwohl in der vorliegenden Ausführungsform die räumliche Komplexität in Einheiten von GOP berechnet wird, und dann die Auflösung bestimmt wird, so ist es auch möglich, eine räumliche Komplexität ausgewählt für andere Einheiten, beispielsweise für Einheiten von Sequenzen, zu berechnen, und dann die Auflösung zu bestimmen. Obwohl in der vorliegenden Ausführungsform die Auflösung für die MPEG-2 Kodierung geändert wird, kann dies selektiv auf andere Kodierverfahren als MPEG-2 angewandt werden.
Hier kann der vorbestimmte Schwellwert anfänglich unter Berücksichtigung der Systemumgebungen, wie einer Puffer- und Speicherkapazität, bestimmt werden, oder er kann beliebig von einem Nutzer gemäß den Typen der eingegebenen Bilder bestimmt werden.
Statt der Verwendung eines festen Schwellwerts ist es auch möglich, einen Schwellwert ausgewählt adaptiv zu bestimmen. Beispielsweise ist es möglich zu bestimmen, ob die Auflösung erhöht werden soll oder nicht, durch einen aufsummierten Mittelwert, der aus den Dispersionswerten aller vorheriger 8 × 8 Blockeinheiten erhalten wird. Wenn beispielsweise ein Einheitsdispersionswert größer als der aufsummierte Mittelwert ist, so wird eine MPEG-2 Kodierung für diese GOP mit der ursprünglich gewünschten Auflösung durchgeführt. Wenn der Einheitsdispersionswert kleiner als der aufsummierte Mittelwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt. Der Schwellwert kann ausgewählt durch das Multiplizieren eines aufsummierten Mittelwerts mit einem gewissen Wert α bestimmt werden. In diesem Fall wird durch das passende Bestimmen eines konstanten Werts α die Auflösung erniedrigt, so dass das Verhältnis der zur kodierenden GOP eingestellt werden kann.
Wenn das obige Verfahren durchgeführt wird, so kann die Kodierung nur nach der Verzögerung von einer GOP beginnen, das heißt eine Verzögerung von einer GOP ist unvermeidlich. Um diese Verzögerung zu vermeiden oder zu reduzieren, ist es auch möglich, eine Auflösung durch das Erhalten eines mittleren Dispersionswerts für nur das erste Bild jeder GOP zu bestimmen. Dies kann passend durch einen Nutzer unter Berücksichtigung des Kompromisses zwischen Leistung und Verzögerung bestimmt werden.
Fig. 4 ist ein Blockdiagramm einer adaptiven Transkodiervorrichtung auf der Basis einer räumlichen Komplexität gemäß der vorliegenden Erfindung.
Die Transkodiervorrichtung gemäß der vorliegenden Erfindung umfasst einen Bewegtbilddekodierer 420, eine Berechnungseinheit 440 für die räumliche Komplexität, eine Auflösungsbestimmungseinheit 450, eine Auflösungsumwandlungseinheit 460 und eine Kodiereinheit 480. Der Bewegtbilddekodierer 420 umfasst eine Einheit 422 zur variablen Längendekodierung (VLD), eine Einheit 424 zur inversen Quantisierung (IQ), eine IDCT- Einheit 426, einen Bildspeicher 428 und eine Bewegungskompensationseinheit (MC-Einheit) 430. Hier führen der Bewegtbilddekodierer 420 und die Kodiereinheit 480 dieselben Funktionen wie in der Bewegtbildtranskodiervorrichtung des Stands der Technik, die in Fig. 2 gezeigt ist, durch, weswegen eine detaillierte Erläuterung weggelassen wird.
Wenn eingegebene Bilddaten zu einem Strom komprimiert sind, so werden die eingegebenen Bilddaten in der VLD-Einheit 422 dekodiert.
Unabhängig vom Bildtyp, wie I, B und P, erhält die Berechnungseinheit 440 für die räumliche Komplexität einen Dispersionswert in Einheiten von 8 × 8 Blöcken in einem räumlichen Bereich für ein eingegebenes Bild und berechnet einen Mittelwert in Einheiten von GOP. Obwohl ein mittlerer Dispersionswert in Einheiten von GOP bei der vorliegenden Ausführungsform erhalten wird, ist es auch möglich, ausgewählt einen mittleren Dispersionswert für andere Einheiten, beispielsweise in Einheiten von Sequenzen, zu erhalten.
Die Auflösungsbestimmungseinheit 450 vergleicht den mittleren Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, mit einem vorbestimmten Schwellwert und bestimmt die Auflösung einer aktuellen GOP. Wenn beispielsweise ein mittlerer Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, größer als der vorbestimmte Schwellwert ist, so wird eine MPEG-2 Kodierung für diese GOP mit der vorbestimmten ursprünglichen Auflösung durchgeführt. Wenn der mittleren Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, kleiner als der vorbestimmte Schwellwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt.
Obwohl in der vorliegenden Ausführungsform die räumliche Komplexität in Einheiten von GOPs berechnet wurde, und dann die Auflösung bestimmt wurde, ist es auch möglich, ausgewählt die räumliche Komplexität für andere Einheiten, beispielsweise für Einheiten von Sequenzen, zu berechnen, und dann die Auflösung zu bestimmen. Obwohl in der vorliegenden Ausführungsform die Auflösung für die MPEG-2 Kodierung geändert wurde, kann dies ausgewählt auf andere Kodierverfahren als MPEG-2 angewandt werden.
Hier kann der vorbestimmte Schwellwert anfänglich unter Berücksichtigung der Systemumgebungen, wie einer Puffer- und Speicherkapazität, bestimmt werden, oder er kann beliebig durch einen Nutzer gemäß den Typen der eingegeben Bilder bestimmt werden.
Statt einen festen Schwellwert zu verwenden, ist es auch möglich, adaptiv einen Schwellwert zu bestimmen. Beispielsweise ist es durch einen aufsummierten Mittelwert, der aus den Dispersionswerten aller vorhergehenden 8 × 3 Blockeinheiten erhalten wird, möglich zu bestimmen, ob die Auflösung erhöht werden soll oder nicht.
Wenn das obige Verfahren durchgeführt wird, so kann die Kodierung nur nach der Verzögerung einer GOP beginnen, das heißt eine Verzögerung um eine GOP ist unvermeidlich. Um diese Verzögerung zu vermeiden oder zu reduzieren, ist es auch möglich, die Auflösung durch das Erhalten eines mittleren Dispersionswertes nur für das erste Bild jeder GOP zu bestimmen. Dies kann passend durch einen Nutzer unter Berücksichtigung des Kompromisses zwischen Leistung und Verzögerung bestimmt werden.
Das obige Verfahren ist ein Transkodierverfahren, das heißt, ein Bitstrom wird geändert, um die Effizienz der Speicherung zu erhöhen. Es ist auch möglich, einen Bitstrom nach der Transformation mit einer anderen Bitrate, einer anderen Auf- Jösung oder einer anderen Norm zu speichern, um den Zweck der ursprünglichen Transkodierung zu befriedigen.
Wie bei der hoch effizienten Speicherung durch das Kodieren von Daten mit unterschiedlichen Auflösungen auf der Basis der räumlichen Komplexität, wie das oben beschrieben wurde, ist es auch möglich, Daten mit einer höheren Effizienz durch das Ändern der Bildraten auf der Basis der zeitlichen Komplexität zu speichern.
Fig. 5 ist ein Blockdiagramm einer adaptiven Bewegtbildkodiervorrichtung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.
Die Bewegtbildkodiervorrichtung gemäß der vorliegenden Ausführungsform umfasst eine Berechnungseinheit 20 für die Bewegungsaktivität, eine Bildratenbestimmungseinheit 540, eine Bildratenumwandlungseinheit 560 und eine Kodiereinheit 580.
Die Berechnungseinheit 520 für die Bewegungsaktivität erhält Bewegungsvektoren für alle Makroblöcke in einer GOP, berechnet Bewegungsaktivitäten auf der Basis der Bewegungsvektoren und berechnet eine mittlere Bewegungsaktivität der Makroblöcke. In der vorliegenden Ausführungsform wird, wenn der Bewegungsvektor (MV) eines Makroblocks (MV1, MV2) ist, die Bewegungsaktivität des Makroblocks definiert zu MV1² + MV².
Die Bildratenbestimmungseinheit 540 vergleicht eine mittlere Bewegungsaktivität, die in der Berechnungseinheit 520 für die Bewegungsaktivität berechnet wird, mit einem vorbestimmten Schwellwert und bestimmt eine Bildrate für die GOP und führt eine Kodierung durch. Durch das passende Einstellen des Schwellwerts können eine Vielzahl von Bildrateneinstellverfahren ausgeführt werden. Es ist auch möglich, eine Vielzahl von Schwellwerten zu haben und eine Bildrate nach dem Vergleichen einer Bewegungsaktivität mit den Schwellwerten einzustellen. Es kann beispielsweise ein Verfahren gestaltet werden, so dass wenn die bestimmten Schwellwerte 10 und 20 betragen, wenn die Bewegungsaktivität kleiner als 10 ist, eine Bildrate von 10 Hz ausgewählt wird, wenn die Bewegungsaktivität kleiner als 20 ist, eine Bildrate von 20 Hz ausgewählt wird, und wenn die Bewegungsaktivität gleich oder größer als 20 ist, eine Bildrate von 30 Hz ausgewählt wird. Um Probleme, die durch eine plötzliche Änderung einer Bewegung (Bildwackeln) verursacht werden, zu verhindern, ist es jedoch vorteilhaft, das nur dann, wenn eine Bewegungsaktivität sehr nahe an 0 liegt, die Bildrate der entsprechende GOP entsprechend auf einen relativ niedrigen Wert eingestellt wird.
Die Bildratenumwandlungseinheit 560 stellt die Bildrate der eingegebenen Bilddaten gemäß der Bildrate, die in der Bildratenbestimmungseinheit 540 bestimmt wurde, ein und gibt die Ergebnisse an die Kodiereinheit 580 aus.
Fig. 6 ist ein Blockdiagramm einer adaptiven Transkodiervorrichtung, die auf der zeitlichen Komplexität basiert, gemäß der vorliegenden Erfindung.
Die adaptive Transkodiervorrichtung gemäß der vorliegenden Erfindung umfasst einen Bewegtbilddekodierer 620, eine Berechnungseinheit 640 für die Bewegungsaktivität, eine Bildratenbestimmungseinheit 650, eine Maßstabumwandlungseinheit 660 und eine Kodiereinheit 680. Der Bewegtbilddekodierer 620 umfasst eine Einheit 622 zur variablen Längenkodierung (VLD), eine Einheit 624 für die inverse Quantisierung (IQ), eine IDCT-Einheit 626, einen Bildspeicher 628 und eine Bewegungskompensationseinheit (MC-Einheit) 630.
Wenn die eingegebenen Bilddaten einen komprimierten Strom darstellten, so berechnet die Berechnungseinheit 640 für die Bewegungsaktivität Bewegungsaktivitäten in Einheiten von GOP unter Verwendung einer Bewegungsvektorinformation, die im Dekodierschritt des komprimierten Stroms erhalten wird. Beispielsweise empfängt in der Ausführungsform der vorliegenden Erfindung, wie sie in Fig. 6 gezeigt ist, die Berechnungseinheit 640 für die Bewegungseinheit Bewegungsvektoren (MVs) die von der Einheit 622 für eine variable Längenkodierung ausgegeben werden, und berechnet eine Bewegungsaktivität jedes Makroblocks auf der Basis der Bewegungsvektoren.
In einem MPEG-Strom folgt auf einen Sequenzkopfteil ein GOP- Kopfteil. Im allgemeinen wird ein Sequenzkopfteil einmal vorne vor der gesamten Sequenz platziert, und eine GOP-Kopfteil wird vorne an jeder GOP platziert. Eine Bildgrößeninformation wird in jedem Sequenzkopfteil platziert. Bei einer echten Übertragung wird jedoch ein Sequenzkopfteil für jede GOP-Einheit übertragen, wenn ein MPEG-2 Strom übertragen wird. Somit kann, wenn ein Sequenzkopfteil in jede GOP-Einheit getan wird, wenn die Kodierung durchgeführt wird, die Dekodierung ohne jedes Problem ausgeführt werden.
Die vorliegende Erfindung ist nicht auf die oben beschriebenen bevorzugten Ausführungsformen beschränkt, und es ist offensichtlich, dass Variationen und Modifikationen durch Fachleute innerhalb dem Wesen und dem Umfang der vorliegenden Erfindung, wie sie in den angefügten Ansprüchen definiert ist, ausgeführt werden können.
Die vorliegende Erfindung kann auch in einem Programmkode auf einem von einem Computer lesbaren Aufzeichnungsmedium verkörpert werden, der durch einen Computer gelesen werden kann. Das vom Computer lesbare Aufzeichnungsmedium umfasst alle Arten von Aufzeichnungsvorrichtungen, auf denen von einem Computer lesbare Daten gespeichert werden. Das von einem Computer lesbare Aufzeichnungsmedium umfasst Speichermedien, wie magnetische Speichermedien (beispielsweise ROMs, Disketten, Festplatten etc.), optisch lesbare Medien (beispielsweise CD- ROMs, DVDs, etc.) und Trägerwellen (beispielsweise Übertragungen über das Internet). Das vom Computer lesbare Aufzeichnungsmedium kann auch an Computersysteme, die durch ein Netzwerk verbunden sind, übertragen werden, und es kann einen vom Computer lesbaren Kode in einer verteilten Betriebsart speichern und ausführen.
Gemäß der vorliegenden Erfindung, wie sie oben beschrieben wurde, wird die zeitliche und räumliche Komplexität eines Bilds in Einheiten von GOP berechnet, und eine GOP, die eine relativ niedrige zeitliche und räumliche Komplexität aufweist, wird mit einer geringeren Auflösung als der ursprünglichen Auflösung kodiert, während eine GOP, die eine relativ hohe zeitliche und räumliche Komplexität aufweist, mit der ursprünglichen Auflösung kodiert wird, so dass das Bewegtbild in einem Speichermedium effizienter gespeichert werden kann.

REFERENZLISTE DER ZEICHNUNGEN

Fig. 1

INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
160 Bildspeicher Fig. 2
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
228 Bildspeicher
240 Maßstabs- und Formattransformationseinheit
260 Kodierer Fig. 3
INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
320 Berechnungseinheit für die räumliche Komplexität
340 Auflösungsbestimmungseinheit
360 Auflösungsumwandlungseinheit
380 Kodierer Fig. 4
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
428 Bildspeicher
440 Berechnungseinheit für die räumliche Komplexität
450 Auflösungsbestimmungseinheit
460 Auflösungsumwandlungseinheit
480 Kodierer Fig. 5
INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
520 Berechnungseinheit für die Bewegungsaktivität
540 Bildratenbestimmungseinheit
560 Bildratenumwandlungseinheit
580 Kodierer Fig. 6
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
628 Bildspeicher
640 Berechnungseinheit für die Bewegungsaktivität
650 Bildratenbestimmungseinheit
660 Bildratenumwandlungseinheit
680 Kodierer

Claims

1. Adaptive Bildkodierverfahren auf der Basis einer räumlichen Komplexität, umfassend:

a) Berechnen einer räumlichen Komplexität eingegebener Bilddaten;

b) Bestimmen einer Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert; und

c) Umwandeln der Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung.

2. Verfahren nach Anspruch 1, wobei die räumliche Komplexität auf der Basis eines mittleren Dispersionswertes für jeden Block der eingegebenen Bilddaten berechnet wird.

3. Verfahren nach Anspruch 1, wobei die Schritte für das Berechnen einer räumlichen Komplexität und das Bestimmen einer Auflösung in Einheiten von Gruppen von Bildern (GOP) der eingegebenen Bilddaten durchgeführt werden.

4. Verfahren nach Anspruch 1, wobei die Schritte für das Berechnen einer räumlichen Komplexität und das Bestimmen einer Auflösung in Einheiten von Sequenzen der eingegeben Bilddaten durchgeführt werden.

5. Verfahren nach Anspruch 1 oder 2, wobei wenn die eingegebenen Bilddaten kodierte Bilddaten sind, eine räumliche Komplexität auf der Basis der dekodierten Daten der eingegebenen Bilddaten gemessen wird.

6. Verfahren nach Anspruch 1 oder 2, wobei wenn die eingegebenen Bilddaten kodierten Bilddaten sind, eine räumliche Komplexität auf der Basis von Dispersionswerten, die aus mit der inversen diskreten Kosinus-Transformation (IDCT) transformierten Daten und bewegungskompensierten Daten erhalten werden, berechnet wird.

7. Adaptive Bildkodiervorrichtung, basierend auf einer räumlichen Komplexität, umfassend:
eine Berechnungseinheit für die räumliche Komplexität, die eine räumliche Komplexität von eingegebenen Bilddaten berechnet;
eine Auflösungsbestimmungseinheit, die eine Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Auflösungsumwandlungseinheit, die die Auflösung eingegebener Bilddaten auf der Basis der bestimmten Auflösung umwandelt.

8. Vorrichtung nach Anspruch 7, wobei die räumliche Komplexität auf der Basis eines mittleren Dispersionswertes für jeden Block der eingegebenen Bilddaten berechnet wird.

9. Vorrichtung nach Anspruch 7, wobei die Berechnung einer räumlichen Komplexität in der Berechnungseinheit für die räumliche Komplexität und die Bestimmung einer Auflösung in der Auflösungsbestimmungseinheit in Einheiten von Gruppen von Bildern (GOP) der eingegebenen Bilddaten durchgeführt wird.

10. Vorrichtung nach Anspruch 7, wobei die Berechnung einer räumlichen Komplexität in der Berechnungseinheit für die räumliche Komplexität und die Bestimmung einer Auflösung in der Auflösungsbestimmungseinheit in Einheiten von Sequenzen der eingegeben Bilddaten durchgeführt wird.

11. Vorrichtung nach Anspruch 7 oder 8, wobei wenn die eingegeben Bilddaten kodierte Bilddaten sind, eine räumliche Komplexität auf der Basis der dekodierten Daten der eingegeben Bilddaten gemessen wird.

12. Vorrichtung nach Anspruch 7 oder 8, wobei wenn die eingegebenen Bilddaten kodierte Bilddaten sind, eine räumliche Komplexität auf der Basis von Dispersionswerten, die von IDCT-transformierten Daten und bewegungskompensierten Daten erhalten werden, berechnet wird.

13. Adaptives Bildkodierverfahren auf der Basis einer zeitlichen Komplexität, umfassend:

a) Berechnen einer zeitlichen Komplexität der eingegebenen Bilddaten;

b) Bestimmen einer Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert; und

c) Umwandeln der Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate.

14. Verfahren nach Anspruch 13, wobei die zeitliche Komplexität auf der Basis einer Bewegungsaktivität jedes Makroblocks der eingegebenen Bilddaten berechnet wird.

15. Verfahren nach Anspruch 14, wobei die Bewegungsaktivität die Größe eines Bewegungsvektors des Makroblocks ist.

16. Verfahren nach Anspruch 15, wobei die Bewegungsaktivität MV1² + MV2² ist, wenn der Bewegungsvektor eines Makroblocks (MV1, MV2) ist.

17. Verfahren nach Anspruch 13, wobei die Schritte für das Berechnen einer zeitlichen Komplexität und des Bestimmens einer Bildrate in Einheiten von GOP der eingegebenen Bilddaten durchgeführt werden.

18. Verfahren nach Anspruch 13, wobei die Schritte für das Berechnen einer zeitlichen Komplexität und des Bestimmens einer Bildrate in Einheiten von Sequenzen der eingegebenen Bilddaten durchgeführt werden.

19. Verfahren nach Anspruch 14, wobei wenn die eingegebenen Bilddaten kodierte Bilddaten sind, eine Bewegungsaktivität unter Verwendung eines Bewegungsvektors, der im Dekodierschritt der eingegebenen Bilddaten erhalten wird, berechnet wird.

20. Verfahren nach Anspruch 13, wobei die zeitliche Komplexität auf der Basis der Bewegungsaktivität jedes Makroblocks eingegebenen Bilddaten berechnet wird.

21. Adaptive Bewegtbildkodiervorrichtung auf der Basis einer zeitlichen Komplexität, umfassend:
eine Einheit zur Berechnung einer zeitlichen Komplexität, die eine zeitliche Komplexität der eingegebenen Bilddaten berechnet;
eine Bildratenbestimmungseinheit, die eine Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Bildratenumwandlungseinheit, die die Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate umwandelt.

22. Vorrichtung nach Anspruch 21, wobei die zeitliche Komplexität auf der Basis einer Bewegungsaktivität jedes Makroblocks der eingegebenen Bilddaten berechnet wird.

23. Vorrichtung nach Anspruch 22, wobei die Bewegungsaktivität die Größe eines Bewegungsvektors des Makroblocks ist.

24. Vorrichtung nach Anspruch 23, wobei die Bewegungsaktivität MV1² + MV2² ist, wenn der Bewegungsvektor eines Makroblocks (MV1, MV2) ist.

25. Vorrichtung nach Anspruch 21, wobei das Berechnen einer zeitlichen Komplexität in der Berechnungseinheit für die zeitliche Komplexität und das Bestimmen einer Bildrate in der Bildratenbestimmungseinheit in Einheiten von GOP der eingegebenen Bilddaten durchgeführt werden.

26. Vorrichtung nach Anspruch 21, wobei das Berechnen einer zeitlichen Komplexität in der Berechnungseinheit für die zeitliche Komplexität und das Bestimmen einer Bildrate in der Bildratenbestimmungseinheit in Einheiten von Sequenzen der eingegebenen Bilddaten durchgeführt werden.

27. Vorrichtung nach Anspruch 22, wobei wenn die eingegebenen Bilddaten kodierte Bilddaten sind, eine Bewegungsaktivität unter Verwendung eines Bewegungsvektors, der im Dekodierschritt der eingegebenen Bilddaten erhalten wird, berechnet wird.

28. Vorrichtung nach Anspruch 21, wobei die zeitliche Komplexität auf der Basis der Bewegungsaktivität jedes Makroblocks der eingegebenen Bilddaten berechnet wird.