DE10303928A1 - Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und dafür geeigente Vorrichtung - Google Patents
Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und dafür geeigente VorrichtungInfo
- Publication number
- DE10303928A1 DE10303928A1 DE2003103928 DE10303928A DE10303928A1 DE 10303928 A1 DE10303928 A1 DE 10303928A1 DE 2003103928 DE2003103928 DE 2003103928 DE 10303928 A DE10303928 A DE 10303928A DE 10303928 A1 DE10303928 A1 DE 10303928A1
- Authority
- DE
- Germany
- Prior art keywords
- image data
- resolution
- complexity
- input image
- frame rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000006185 dispersion Substances 0.000 claims abstract description 24
- 230000003044 adaptive effect Effects 0.000 claims abstract description 20
- 230000033001 locomotion Effects 0.000 claims description 55
- 230000002123 temporal effect Effects 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 29
- 230000000694 effects Effects 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 6
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Ein Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis einer zeitlichen und räumlichen Komplexität und eine dafür geeignete Vorrichtung werden bereitgestellt. Im Verfahren wird die Kodierung mit verschiedenen zeitlichen und räumlichen Auflösungen bei Bildraten, die auf der zeitlichen und räumlichen Komplexität eines eingegebenen Bildes basieren, durchgeführt, so dass die Bilddaten mit einer hohen Effizienz gespeichert werden können. Das Verfahren umfasst: Berechnen einer räumlichen Komplexität der eingegebenen Bilddaten, Bestimmen einer Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert und Umwandeln der Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung.
Description
- Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren für das Kodieren eines Bewegtbildes und insbesondere auf ein Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und auf eine dafür geeignete Vorrichtung.
- Da digitale Videorekorder (DVRs) und persönliche Videorecorder (PVRs) eine große Verbreitung gefunden haben, ist die Forschung über Bildkompressionstechniken aktiv vorangetrieben worden. Da jedoch beim konventionellen DVR und PVR ein Bild mit einer festen Auflösung ohne die Berücksichtigung einer zeitlichen und räumlichen Komplexität komprimiert wird, ist der Wirkungsgrad der Komprimierung niedrig.
- Fig. 1 ist ein Blockdiagramm eines Bewegtbildkodiersystems des Stands der Technik. Zuerst werden die eingegebenen Bilddaten in 8 × 8 Bildpunktblöcke aufgeteilt. Um die räumliche Korrelation zu entfernen, führt eine Einheit 110 zur diskreten Kosinus-Transformation (DCT) DCT-Operationen mit den Bilddaten, die in Einheiten von 8 × 8 Bildpunktblöcken eingegeben werden, durch. Durch die Quantisierung von DCT-Koeffizienten, die man in der DCT-Einheit 120 erhält, drückt eine Quantisiereinheit (Q) 120 die DCT-Koeffizienten durch einige repräsentative Werte aus, so dass eine hoch wirksame verlustbehaftete Kompression durchgeführt wird. Eine Einheit 130 zur variablen Längenkodierung (VCL) führt eine Entropiekodierung der quantisierten DCT-Koeffizienten durch und gibt einen entropiekodierten Datenstrom aus.
- Ein Einheit 140 zur inversen Quantisierung (IQ) führt eine inverse Quantisierung der Bilddaten, die in der Quantisiereinheit 120 quantisiert wurden, durch. Eine Einheit 150 zur inversen DCT (IDCT) transformiert die Bilddaten, die in der Einheit 140 zur inversen Quantisierung (IQ) invers quantisiert wurden. Eine Bildspeichereinheit 160 speichert die Bilddaten, die in der IDCT-Einheit 150 einer IDCT-Transformation unterworfen wurden, in Einheiten von Bildern. Eine Bewegungsschätzeinheit (ME-Einheit) 170 entfernt zeitliche Korrelationen durch die Verwendung von Bilddaten des aktuell eingegebenen Bildes und Bilddaten eines vorhergehenden Bildes, das in der Bildspeichereinheit 160 gespeichert ist.
- Für eine Datenkompression wird im DVR und PVR des Stands der Technik ein MPEG-2 Kodierer verwendet, wie das in Fig. 1 gezeigt ist. Wenn die Eingabedaten nicht komprimiert sind, so werden die Daten durch den MPEG-2-Kodierer komprimiert, und der Bitstrom wird in einem Speichermedium, wie einem Festplattenlaufwerk (HDD) oder einer digitalen Bildplatte (DVD) gespeichert. Wenn die Eingabebilddaten einen komprimierten Bitstrom darstellen, so wird um einen MPEG-2 Strom mit den gewünschten Zuständen unter Verwendung eines Bewegtbildtranskoders, der in Fig. 2 gezeigt ist, zu erzeugen, das MPEG-2 Bewegtbild dekodiert, und dann wird eine vorbestimmte Maßstabs- und Formattransformation vorgenommen. Dann wird die MPEG-2 Bewegtbildkodierung durchgeführt.
- Fig. 2 ist ein Blockdiagramm einer Transkodiervorrichtung des Stands der Technik. Wenn die eingegebenen Bilddaten einen komprimierten Bitstrom darstellen, so werden die Bilddaten durch einen Bewegtbilddekodierer 220, der eine Einheit 222 zur variablen Längenkodierung (VLD), eine Einheit 224 zur inversen Quantisierung, eine IDCT-Einheit 226, einen Bildspeicher 228 und eine Bewegungskompensationseinheit (MC-Einheit) 230 umfasst, dekodiert. Um dann einen MPEG-2 Strom mit den gewünschten Zuständen zu erzeugen, wird das Bewegtbild mit einer vorbestimmten Auflösung unter Verwendung desselben MPEG-2 Kodierers, wie beim Bewegtbildkodierer, der in Fig. 1 gezeigt ist, kodiert. Dieses Verfahren wird als Transkodierung bezeichnet. Wenn eine Transkodierung durchgeführt wird, so wird eine Einheit 240 für die Maßstab- und Formattransformation verwendet, um den Maßstab des Bildes zu reduzieren oder um das Format des Bildes, das durch den Bewegtbilddekodierer 220 dekodiert wurde, umzuwandeln, wenn das notwendig sein sollte. Dann wird der MPEG-2 Kodierer 260 verwendet, um eine MPEG-2 Kodierung mit einer vorbestimmten Auflösung durchzuführen.
- Somit wird bei der MPEG-2 Kodierung im Stand der Technik eine Kodierung immer mit konstanter Auflösung durchgeführt. Wenn somit die räumlich Komplexität gemäß den Eigenschaften eines eingegebenen Bewegtbildes groß oder nicht groß ist, so wird die Kodierung immer mit derselben Auflösung durchgeführt. Sogar wenn ein Bewegtbild eine geringe zeitliche Änderung aufweist, sollte eine hohe Bildrate von 30 Hz aufrecht gehalten werden, so dass die Effizienz der Kodierung abnimmt.
- Die vorliegende Erfindung liefert ein Verfahren und eine Vorrichtung der adaptiven Bewegtbildkodierung, um adaptiv eine Bewegtbildkodierung auf der Basis der Eigenschaften des eingegebenen Bewegtbildes durchzuführen, so dass die Kodiereffizienz zunimmt.
- Die vorliegende Erfindung liefert auch ein Verfahren und eine Vorrichtung der adaptives Bewegtbildcodierung, um die Effizienz des Speicherns, wenn ein Bewegtbild in einem HDD oder einer DVD gespeichert wird, durch die Verwendung der MPEG-2 Kompression zu maximieren.
- Gemäß einem Aspekt der vorliegenden Erfindung wird ein adaptives Bildkodierverfahren auf der Basis einer räumlichen Komplexität bereitgestellt, wobei es folgendes umfasst: (a) Berechnen einer räumlichen Komplexität der eingegebenen Bilddaten, (b) Bestimmen einer Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert, und (c) Umwandeln der Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung.
- Gemäß einem anderen Aspekt der vorliegenden Erfindung wird eine adaptive Bildkodiervorrichtung auf der Basis einer räumlichen Komplexität bereit gestellt, wobei sie folgendes umfasst: eine Berechnungseinheit für die räumliche Komplexität, die eine räumliche Komplexität der eingegebenen Bilddaten berechnet, eine Auflösungsbestimmungseinheit, die eine Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt, und eine Auflösungsumwandlungseinheit, die die Auflösung der eingegebenen Bilddaten auf der Basis der bestimmten Auflösung umwandelt.
- Gemäß einem nochmals anderen Aspekt der vorliegenden Erfindung wird ein adaptives Bildkodierverfahren, das auf einer zeitlichen Komplexität basiert, bereitgestellt, wobei es folgendes umfasst: (a) Berechnen einer zeitlichen Komplexität der eingegebenen Bilddaten, (b) Bestimmen einer Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert, und (c) Umwandeln der Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate.
- Gemäß einem nochmals anderen Aspekt der vorliegenden Erfindung wird eine adaptive Bewegtbildkodiervorrichtung auf der Basis einer zeitlichen Komplexität bereit gestellt, wobei sie folgendes umfasst: eine Berechnungseinheit für die zeitliche Komplexität, die eine zeitliche Komplexität der eingegebenen Bilddaten berechnet, eine Bildratenbestimmungseinheit, die eine Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt, und eine Bildratenumwandlungseinheit, die die Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate umwandelt.
- Die obige Aufgabe und andere Aufgaben und Vorteile der vorliegenden Erfindung werden durch eine detaillierte Beschreibung bevorzugter Ausführungsformen unter Bezug auf die angefügten Zeichnungen deutlicher.
- Fig. 1 ist ein Blockdiagramm eines Bewegtbildkodiersystems des Stands der Technik;
- Fig. 2 ist ein Blockdiagramm einer Transkodiervorrichtung des Stands der Technik;
- Fig. 3 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung;
- Fig. 4 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Transkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung;
- Fig. 5 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung; und
- Fig. 6 ist ein Blockdiagramm einer Vorrichtung zur adaptiven Transkodierung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.
- Der Kern einer Bildkomprimiertechnik für den Zweck der Speicherung liegt darin, ob ein vorgegebenes Bild mit hoher Effizienz komprimiert wird oder ob dies nicht der Fall ist. Beim konventionellen DVR und PVR wird ein Bild mit einer vorbestimmten Auflösung komprimiert und dann gespeichert.
- Die vorliegende Erfindung dient zur Lösung der Probleme, die auftreten, wenn ein Bild mit einer vorbestimmten Auflösung komprimiert und gespeichert wird. Gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung wird unter Berücksichtigung, dass die zeitliche und räumliche Komplexität groß oder klein sein kann, gemäß den Eigenschaften eines eingegebenen Bewegtbildes die Kodierung in Einheiten von Gruppen von Bildern (GOP) mit unterschiedlichen räumlichen und zeitlichen Auflösungen gemäß der räumlichen und zeitlichen Auflösung des eingegebenen Bildes durchgeführt, so dass eine hohe Effizienz beim Speichern erzielt werden kann.
- Nach der Dekodierung wird eine GOP, die eine niedrige räumliche Komplexität aufweist, durch Interpolation expandiert und dann angezeigt. Eine GOP, die eine niedrige zeitliche Komplexität, das heißt eine geringe Bewegung aufweist, wird mit einer niedrigeren Bildrate kodiert, so dass die Kodiereffizienz zunimmt.
- Unter Bezug auf die begleitenden Zeichnungen werden nun bevorzugte Ausführungsformen der vorliegenden Erfindung erläutert.
- Fig. 3 ist ein vollständiges Blockdiagramm einer Vorrichtung zur adaptiven Bewegtbildkodierung auf der Basis der räumlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.
- Die Vorrichtung zur Bewegtbildkodierung gemäß der vorliegenden Erfindung umfasst eine Berechnungseinheit 320 für die räumliche Komplexität, eine Auflösungsbestimmungseinheit 340, eine Auflösungsumwandlungseinheit 360 und eine Kodiereinheit 380, die sequentiell, das heißt in einer Kaskadenverbindung, verbunden sind.
- Die Berechnungseinheit 320 für die räumliche Komplexität erhält Dispersionswerte in Einheiten von 8 × 8 Blöcken für die eingegebenen Bilder in Einheiten von GOPs und berechnet einen Mittelwert der Dispersionswerte. Obwohl der mittlere Dispersionswert in der vorliegenden Ausführungsform in Einheiten von GOP erhalten wird, kann ein mittlerer Dispersionswert selektiv für andere Einheiten erhalten werden.
- Die Auflösungsbestimmungseinheit 340 vergleicht den mittleren Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, mit einem vorbestimmten Schwellwert und bestimmt eine Auflösung in Einheiten von GOP. Wenn beispielsweise der mittlere Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, größer als der vorbestimmte Schwellwert ist, so wird die MPEG-2 Kodierung für diese GOP mit einer vorbestimmten ursprünglichen Auflösung durchgeführt. Wenn der mittlere Dispersionswert, der in der Berechnungseinheit 320 für die räumliche Komplexität berechnet wurde, kleiner als der vorbestimmte Schwellwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt.
- Obwohl in der vorliegenden Ausführungsform die räumliche Komplexität in Einheiten von GOP berechnet wird, und dann die Auflösung bestimmt wird, so ist es auch möglich, eine räumliche Komplexität ausgewählt für andere Einheiten, beispielsweise für Einheiten von Sequenzen, zu berechnen, und dann die Auflösung zu bestimmen. Obwohl in der vorliegenden Ausführungsform die Auflösung für die MPEG-2 Kodierung geändert wird, kann dies selektiv auf andere Kodierverfahren als MPEG-2 angewandt werden.
- Hier kann der vorbestimmte Schwellwert anfänglich unter Berücksichtigung der Systemumgebungen, wie einer Puffer- und Speicherkapazität, bestimmt werden, oder er kann beliebig von einem Nutzer gemäß den Typen der eingegebenen Bilder bestimmt werden.
- Statt der Verwendung eines festen Schwellwerts ist es auch möglich, einen Schwellwert ausgewählt adaptiv zu bestimmen. Beispielsweise ist es möglich zu bestimmen, ob die Auflösung erhöht werden soll oder nicht, durch einen aufsummierten Mittelwert, der aus den Dispersionswerten aller vorheriger 8 × 8 Blockeinheiten erhalten wird. Wenn beispielsweise ein Einheitsdispersionswert größer als der aufsummierte Mittelwert ist, so wird eine MPEG-2 Kodierung für diese GOP mit der ursprünglich gewünschten Auflösung durchgeführt. Wenn der Einheitsdispersionswert kleiner als der aufsummierte Mittelwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt. Der Schwellwert kann ausgewählt durch das Multiplizieren eines aufsummierten Mittelwerts mit einem gewissen Wert α bestimmt werden. In diesem Fall wird durch das passende Bestimmen eines konstanten Werts α die Auflösung erniedrigt, so dass das Verhältnis der zur kodierenden GOP eingestellt werden kann.
- Wenn das obige Verfahren durchgeführt wird, so kann die Kodierung nur nach der Verzögerung von einer GOP beginnen, das heißt eine Verzögerung von einer GOP ist unvermeidlich. Um diese Verzögerung zu vermeiden oder zu reduzieren, ist es auch möglich, eine Auflösung durch das Erhalten eines mittleren Dispersionswerts für nur das erste Bild jeder GOP zu bestimmen. Dies kann passend durch einen Nutzer unter Berücksichtigung des Kompromisses zwischen Leistung und Verzögerung bestimmt werden.
- Fig. 4 ist ein Blockdiagramm einer adaptiven Transkodiervorrichtung auf der Basis einer räumlichen Komplexität gemäß der vorliegenden Erfindung.
- Die Transkodiervorrichtung gemäß der vorliegenden Erfindung umfasst einen Bewegtbilddekodierer 420, eine Berechnungseinheit 440 für die räumliche Komplexität, eine Auflösungsbestimmungseinheit 450, eine Auflösungsumwandlungseinheit 460 und eine Kodiereinheit 480. Der Bewegtbilddekodierer 420 umfasst eine Einheit 422 zur variablen Längendekodierung (VLD), eine Einheit 424 zur inversen Quantisierung (IQ), eine IDCT- Einheit 426, einen Bildspeicher 428 und eine Bewegungskompensationseinheit (MC-Einheit) 430. Hier führen der Bewegtbilddekodierer 420 und die Kodiereinheit 480 dieselben Funktionen wie in der Bewegtbildtranskodiervorrichtung des Stands der Technik, die in Fig. 2 gezeigt ist, durch, weswegen eine detaillierte Erläuterung weggelassen wird.
- Wenn eingegebene Bilddaten zu einem Strom komprimiert sind, so werden die eingegebenen Bilddaten in der VLD-Einheit 422 dekodiert.
- Unabhängig vom Bildtyp, wie I, B und P, erhält die Berechnungseinheit 440 für die räumliche Komplexität einen Dispersionswert in Einheiten von 8 × 8 Blöcken in einem räumlichen Bereich für ein eingegebenes Bild und berechnet einen Mittelwert in Einheiten von GOP. Obwohl ein mittlerer Dispersionswert in Einheiten von GOP bei der vorliegenden Ausführungsform erhalten wird, ist es auch möglich, ausgewählt einen mittleren Dispersionswert für andere Einheiten, beispielsweise in Einheiten von Sequenzen, zu erhalten.
- Die Auflösungsbestimmungseinheit 450 vergleicht den mittleren Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, mit einem vorbestimmten Schwellwert und bestimmt die Auflösung einer aktuellen GOP. Wenn beispielsweise ein mittlerer Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, größer als der vorbestimmte Schwellwert ist, so wird eine MPEG-2 Kodierung für diese GOP mit der vorbestimmten ursprünglichen Auflösung durchgeführt. Wenn der mittleren Dispersionswert, der in der Berechnungseinheit 440 für die räumliche Komplexität berechnet wurde, kleiner als der vorbestimmte Schwellwert ist, so wird die Auflösung jedes Bildes dieser GOP erniedrigt, beispielsweise um die Hälfte in jeder Richtung, und dann wird die MPEG-2 Kodierung für diese GOP durchgeführt.
- Obwohl in der vorliegenden Ausführungsform die räumliche Komplexität in Einheiten von GOPs berechnet wurde, und dann die Auflösung bestimmt wurde, ist es auch möglich, ausgewählt die räumliche Komplexität für andere Einheiten, beispielsweise für Einheiten von Sequenzen, zu berechnen, und dann die Auflösung zu bestimmen. Obwohl in der vorliegenden Ausführungsform die Auflösung für die MPEG-2 Kodierung geändert wurde, kann dies ausgewählt auf andere Kodierverfahren als MPEG-2 angewandt werden.
- Hier kann der vorbestimmte Schwellwert anfänglich unter Berücksichtigung der Systemumgebungen, wie einer Puffer- und Speicherkapazität, bestimmt werden, oder er kann beliebig durch einen Nutzer gemäß den Typen der eingegeben Bilder bestimmt werden.
- Statt einen festen Schwellwert zu verwenden, ist es auch möglich, adaptiv einen Schwellwert zu bestimmen. Beispielsweise ist es durch einen aufsummierten Mittelwert, der aus den Dispersionswerten aller vorhergehenden 8 × 3 Blockeinheiten erhalten wird, möglich zu bestimmen, ob die Auflösung erhöht werden soll oder nicht.
- Wenn das obige Verfahren durchgeführt wird, so kann die Kodierung nur nach der Verzögerung einer GOP beginnen, das heißt eine Verzögerung um eine GOP ist unvermeidlich. Um diese Verzögerung zu vermeiden oder zu reduzieren, ist es auch möglich, die Auflösung durch das Erhalten eines mittleren Dispersionswertes nur für das erste Bild jeder GOP zu bestimmen. Dies kann passend durch einen Nutzer unter Berücksichtigung des Kompromisses zwischen Leistung und Verzögerung bestimmt werden.
- Das obige Verfahren ist ein Transkodierverfahren, das heißt, ein Bitstrom wird geändert, um die Effizienz der Speicherung zu erhöhen. Es ist auch möglich, einen Bitstrom nach der Transformation mit einer anderen Bitrate, einer anderen Auf- Jösung oder einer anderen Norm zu speichern, um den Zweck der ursprünglichen Transkodierung zu befriedigen.
- Wie bei der hoch effizienten Speicherung durch das Kodieren von Daten mit unterschiedlichen Auflösungen auf der Basis der räumlichen Komplexität, wie das oben beschrieben wurde, ist es auch möglich, Daten mit einer höheren Effizienz durch das Ändern der Bildraten auf der Basis der zeitlichen Komplexität zu speichern.
- Fig. 5 ist ein Blockdiagramm einer adaptiven Bewegtbildkodiervorrichtung auf der Basis der zeitlichen Komplexität gemäß einer Ausführungsform der vorliegenden Erfindung.
- Die Bewegtbildkodiervorrichtung gemäß der vorliegenden Ausführungsform umfasst eine Berechnungseinheit 20 für die Bewegungsaktivität, eine Bildratenbestimmungseinheit 540, eine Bildratenumwandlungseinheit 560 und eine Kodiereinheit 580.
- Die Berechnungseinheit 520 für die Bewegungsaktivität erhält Bewegungsvektoren für alle Makroblöcke in einer GOP, berechnet Bewegungsaktivitäten auf der Basis der Bewegungsvektoren und berechnet eine mittlere Bewegungsaktivität der Makroblöcke. In der vorliegenden Ausführungsform wird, wenn der Bewegungsvektor (MV) eines Makroblocks (MV1, MV2) ist, die Bewegungsaktivität des Makroblocks definiert zu MV12 + MV2.
- Die Bildratenbestimmungseinheit 540 vergleicht eine mittlere Bewegungsaktivität, die in der Berechnungseinheit 520 für die Bewegungsaktivität berechnet wird, mit einem vorbestimmten Schwellwert und bestimmt eine Bildrate für die GOP und führt eine Kodierung durch. Durch das passende Einstellen des Schwellwerts können eine Vielzahl von Bildrateneinstellverfahren ausgeführt werden. Es ist auch möglich, eine Vielzahl von Schwellwerten zu haben und eine Bildrate nach dem Vergleichen einer Bewegungsaktivität mit den Schwellwerten einzustellen. Es kann beispielsweise ein Verfahren gestaltet werden, so dass wenn die bestimmten Schwellwerte 10 und 20 betragen, wenn die Bewegungsaktivität kleiner als 10 ist, eine Bildrate von 10 Hz ausgewählt wird, wenn die Bewegungsaktivität kleiner als 20 ist, eine Bildrate von 20 Hz ausgewählt wird, und wenn die Bewegungsaktivität gleich oder größer als 20 ist, eine Bildrate von 30 Hz ausgewählt wird. Um Probleme, die durch eine plötzliche Änderung einer Bewegung (Bildwackeln) verursacht werden, zu verhindern, ist es jedoch vorteilhaft, das nur dann, wenn eine Bewegungsaktivität sehr nahe an 0 liegt, die Bildrate der entsprechende GOP entsprechend auf einen relativ niedrigen Wert eingestellt wird.
- Die Bildratenumwandlungseinheit 560 stellt die Bildrate der eingegebenen Bilddaten gemäß der Bildrate, die in der Bildratenbestimmungseinheit 540 bestimmt wurde, ein und gibt die Ergebnisse an die Kodiereinheit 580 aus.
- Fig. 6 ist ein Blockdiagramm einer adaptiven Transkodiervorrichtung, die auf der zeitlichen Komplexität basiert, gemäß der vorliegenden Erfindung.
- Die adaptive Transkodiervorrichtung gemäß der vorliegenden Erfindung umfasst einen Bewegtbilddekodierer 620, eine Berechnungseinheit 640 für die Bewegungsaktivität, eine Bildratenbestimmungseinheit 650, eine Maßstabumwandlungseinheit 660 und eine Kodiereinheit 680. Der Bewegtbilddekodierer 620 umfasst eine Einheit 622 zur variablen Längenkodierung (VLD), eine Einheit 624 für die inverse Quantisierung (IQ), eine IDCT-Einheit 626, einen Bildspeicher 628 und eine Bewegungskompensationseinheit (MC-Einheit) 630.
- Wenn die eingegebenen Bilddaten einen komprimierten Strom darstellten, so berechnet die Berechnungseinheit 640 für die Bewegungsaktivität Bewegungsaktivitäten in Einheiten von GOP unter Verwendung einer Bewegungsvektorinformation, die im Dekodierschritt des komprimierten Stroms erhalten wird. Beispielsweise empfängt in der Ausführungsform der vorliegenden Erfindung, wie sie in Fig. 6 gezeigt ist, die Berechnungseinheit 640 für die Bewegungseinheit Bewegungsvektoren (MVs) die von der Einheit 622 für eine variable Längenkodierung ausgegeben werden, und berechnet eine Bewegungsaktivität jedes Makroblocks auf der Basis der Bewegungsvektoren.
- In einem MPEG-Strom folgt auf einen Sequenzkopfteil ein GOP- Kopfteil. Im allgemeinen wird ein Sequenzkopfteil einmal vorne vor der gesamten Sequenz platziert, und eine GOP-Kopfteil wird vorne an jeder GOP platziert. Eine Bildgrößeninformation wird in jedem Sequenzkopfteil platziert. Bei einer echten Übertragung wird jedoch ein Sequenzkopfteil für jede GOP-Einheit übertragen, wenn ein MPEG-2 Strom übertragen wird. Somit kann, wenn ein Sequenzkopfteil in jede GOP-Einheit getan wird, wenn die Kodierung durchgeführt wird, die Dekodierung ohne jedes Problem ausgeführt werden.
- Die vorliegende Erfindung ist nicht auf die oben beschriebenen bevorzugten Ausführungsformen beschränkt, und es ist offensichtlich, dass Variationen und Modifikationen durch Fachleute innerhalb dem Wesen und dem Umfang der vorliegenden Erfindung, wie sie in den angefügten Ansprüchen definiert ist, ausgeführt werden können.
- Die vorliegende Erfindung kann auch in einem Programmkode auf einem von einem Computer lesbaren Aufzeichnungsmedium verkörpert werden, der durch einen Computer gelesen werden kann. Das vom Computer lesbare Aufzeichnungsmedium umfasst alle Arten von Aufzeichnungsvorrichtungen, auf denen von einem Computer lesbare Daten gespeichert werden. Das von einem Computer lesbare Aufzeichnungsmedium umfasst Speichermedien, wie magnetische Speichermedien (beispielsweise ROMs, Disketten, Festplatten etc.), optisch lesbare Medien (beispielsweise CD- ROMs, DVDs, etc.) und Trägerwellen (beispielsweise Übertragungen über das Internet). Das vom Computer lesbare Aufzeichnungsmedium kann auch an Computersysteme, die durch ein Netzwerk verbunden sind, übertragen werden, und es kann einen vom Computer lesbaren Kode in einer verteilten Betriebsart speichern und ausführen.
- Gemäß der vorliegenden Erfindung, wie sie oben beschrieben wurde, wird die zeitliche und räumliche Komplexität eines Bilds in Einheiten von GOP berechnet, und eine GOP, die eine relativ niedrige zeitliche und räumliche Komplexität aufweist, wird mit einer geringeren Auflösung als der ursprünglichen Auflösung kodiert, während eine GOP, die eine relativ hohe zeitliche und räumliche Komplexität aufweist, mit der ursprünglichen Auflösung kodiert wird, so dass das Bewegtbild in einem Speichermedium effizienter gespeichert werden kann.
- INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
160 Bildspeicher Fig. 2
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
228 Bildspeicher
240 Maßstabs- und Formattransformationseinheit
260 Kodierer Fig. 3
INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
320 Berechnungseinheit für die räumliche Komplexität
340 Auflösungsbestimmungseinheit
360 Auflösungsumwandlungseinheit
380 Kodierer Fig. 4
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
428 Bildspeicher
440 Berechnungseinheit für die räumliche Komplexität
450 Auflösungsbestimmungseinheit
460 Auflösungsumwandlungseinheit
480 Kodierer Fig. 5
INPUT IMAGE = Eingabe Bild
OUTPUT STREAM = Ausgabestrom
520 Berechnungseinheit für die Bewegungsaktivität
540 Bildratenbestimmungseinheit
560 Bildratenumwandlungseinheit
580 Kodierer Fig. 6
INPUT STREAM = Eingabestrom
OUTPUT STREAM = Ausgabestrom
628 Bildspeicher
640 Berechnungseinheit für die Bewegungsaktivität
650 Bildratenbestimmungseinheit
660 Bildratenumwandlungseinheit
680 Kodierer
Claims (28)
1. Adaptive Bildkodierverfahren auf der Basis einer
räumlichen Komplexität, umfassend:
a) Berechnen einer räumlichen Komplexität eingegebener
Bilddaten;
b) Bestimmen einer Auflösung durch das Vergleichen der
berechneten räumlichen Komplexität mit einem vorbestimmten
Schwellwert; und
c) Umwandeln der Auflösung der eingegebenen Bilddaten
auf der Basis der bestimmten Auflösung.
2. Verfahren nach Anspruch 1, wobei die räumliche Komplexität
auf der Basis eines mittleren Dispersionswertes für jeden
Block der eingegebenen Bilddaten berechnet wird.
3. Verfahren nach Anspruch 1, wobei die Schritte für das
Berechnen einer räumlichen Komplexität und das Bestimmen einer
Auflösung in Einheiten von Gruppen von Bildern (GOP) der
eingegebenen Bilddaten durchgeführt werden.
4. Verfahren nach Anspruch 1, wobei die Schritte für das
Berechnen einer räumlichen Komplexität und das Bestimmen einer
Auflösung in Einheiten von Sequenzen der eingegeben Bilddaten
durchgeführt werden.
5. Verfahren nach Anspruch 1 oder 2, wobei wenn die
eingegebenen Bilddaten kodierte Bilddaten sind, eine räumliche
Komplexität auf der Basis der dekodierten Daten der eingegebenen
Bilddaten gemessen wird.
6. Verfahren nach Anspruch 1 oder 2, wobei wenn die
eingegebenen Bilddaten kodierten Bilddaten sind, eine räumliche
Komplexität auf der Basis von Dispersionswerten, die aus mit der
inversen diskreten Kosinus-Transformation (IDCT)
transformierten Daten und bewegungskompensierten Daten erhalten
werden, berechnet wird.
7. Adaptive Bildkodiervorrichtung, basierend auf einer
räumlichen Komplexität, umfassend:
eine Berechnungseinheit für die räumliche Komplexität, die eine räumliche Komplexität von eingegebenen Bilddaten berechnet;
eine Auflösungsbestimmungseinheit, die eine Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Auflösungsumwandlungseinheit, die die Auflösung eingegebener Bilddaten auf der Basis der bestimmten Auflösung umwandelt.
eine Berechnungseinheit für die räumliche Komplexität, die eine räumliche Komplexität von eingegebenen Bilddaten berechnet;
eine Auflösungsbestimmungseinheit, die eine Auflösung durch das Vergleichen der berechneten räumlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Auflösungsumwandlungseinheit, die die Auflösung eingegebener Bilddaten auf der Basis der bestimmten Auflösung umwandelt.
8. Vorrichtung nach Anspruch 7, wobei die räumliche
Komplexität auf der Basis eines mittleren Dispersionswertes für jeden
Block der eingegebenen Bilddaten berechnet wird.
9. Vorrichtung nach Anspruch 7, wobei die Berechnung einer
räumlichen Komplexität in der Berechnungseinheit für die
räumliche Komplexität und die Bestimmung einer Auflösung in
der Auflösungsbestimmungseinheit in Einheiten von Gruppen von
Bildern (GOP) der eingegebenen Bilddaten durchgeführt wird.
10. Vorrichtung nach Anspruch 7, wobei die Berechnung einer
räumlichen Komplexität in der Berechnungseinheit für die
räumliche Komplexität und die Bestimmung einer Auflösung in
der Auflösungsbestimmungseinheit in Einheiten von Sequenzen
der eingegeben Bilddaten durchgeführt wird.
11. Vorrichtung nach Anspruch 7 oder 8, wobei wenn die
eingegeben Bilddaten kodierte Bilddaten sind, eine räumliche
Komplexität auf der Basis der dekodierten Daten der eingegeben
Bilddaten gemessen wird.
12. Vorrichtung nach Anspruch 7 oder 8, wobei wenn die
eingegebenen Bilddaten kodierte Bilddaten sind, eine räumliche
Komplexität auf der Basis von Dispersionswerten, die von
IDCT-transformierten Daten und bewegungskompensierten Daten
erhalten werden, berechnet wird.
13. Adaptives Bildkodierverfahren auf der Basis einer
zeitlichen Komplexität, umfassend:
a) Berechnen einer zeitlichen Komplexität der
eingegebenen Bilddaten;
b) Bestimmen einer Bildrate durch das Vergleichen der
berechneten zeitlichen Komplexität mit einem vorbestimmten
Schwellwert; und
c) Umwandeln der Bildrate der eingegebenen Bilddaten
auf der Basis der bestimmten Bildrate.
14. Verfahren nach Anspruch 13, wobei die zeitliche
Komplexität auf der Basis einer Bewegungsaktivität jedes Makroblocks
der eingegebenen Bilddaten berechnet wird.
15. Verfahren nach Anspruch 14, wobei die Bewegungsaktivität
die Größe eines Bewegungsvektors des Makroblocks ist.
16. Verfahren nach Anspruch 15, wobei die Bewegungsaktivität
MV12 + MV22 ist, wenn der Bewegungsvektor eines Makroblocks
(MV1, MV2) ist.
17. Verfahren nach Anspruch 13, wobei die Schritte für das
Berechnen einer zeitlichen Komplexität und des Bestimmens
einer Bildrate in Einheiten von GOP der eingegebenen Bilddaten
durchgeführt werden.
18. Verfahren nach Anspruch 13, wobei die Schritte für das
Berechnen einer zeitlichen Komplexität und des Bestimmens
einer Bildrate in Einheiten von Sequenzen der eingegebenen
Bilddaten durchgeführt werden.
19. Verfahren nach Anspruch 14, wobei wenn die eingegebenen
Bilddaten kodierte Bilddaten sind, eine Bewegungsaktivität
unter Verwendung eines Bewegungsvektors, der im
Dekodierschritt der eingegebenen Bilddaten erhalten wird, berechnet
wird.
20. Verfahren nach Anspruch 13, wobei die zeitliche
Komplexität auf der Basis der Bewegungsaktivität jedes Makroblocks
eingegebenen Bilddaten berechnet wird.
21. Adaptive Bewegtbildkodiervorrichtung auf der Basis einer
zeitlichen Komplexität, umfassend:
eine Einheit zur Berechnung einer zeitlichen Komplexität, die eine zeitliche Komplexität der eingegebenen Bilddaten berechnet;
eine Bildratenbestimmungseinheit, die eine Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Bildratenumwandlungseinheit, die die Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate umwandelt.
eine Einheit zur Berechnung einer zeitlichen Komplexität, die eine zeitliche Komplexität der eingegebenen Bilddaten berechnet;
eine Bildratenbestimmungseinheit, die eine Bildrate durch das Vergleichen der berechneten zeitlichen Komplexität mit einem vorbestimmten Schwellwert bestimmt; und
eine Bildratenumwandlungseinheit, die die Bildrate der eingegebenen Bilddaten auf der Basis der bestimmten Bildrate umwandelt.
22. Vorrichtung nach Anspruch 21, wobei die zeitliche
Komplexität auf der Basis einer Bewegungsaktivität jedes
Makroblocks der eingegebenen Bilddaten berechnet wird.
23. Vorrichtung nach Anspruch 22, wobei die
Bewegungsaktivität die Größe eines Bewegungsvektors des Makroblocks ist.
24. Vorrichtung nach Anspruch 23, wobei die
Bewegungsaktivität MV12 + MV22 ist, wenn der Bewegungsvektor eines
Makroblocks (MV1, MV2) ist.
25. Vorrichtung nach Anspruch 21, wobei das Berechnen einer
zeitlichen Komplexität in der Berechnungseinheit für die
zeitliche Komplexität und das Bestimmen einer Bildrate in der
Bildratenbestimmungseinheit in Einheiten von GOP der
eingegebenen Bilddaten durchgeführt werden.
26. Vorrichtung nach Anspruch 21, wobei das Berechnen einer
zeitlichen Komplexität in der Berechnungseinheit für die
zeitliche Komplexität und das Bestimmen einer Bildrate in der
Bildratenbestimmungseinheit in Einheiten von Sequenzen der
eingegebenen Bilddaten durchgeführt werden.
27. Vorrichtung nach Anspruch 22, wobei wenn die eingegebenen
Bilddaten kodierte Bilddaten sind, eine Bewegungsaktivität
unter Verwendung eines Bewegungsvektors, der im
Dekodierschritt der eingegebenen Bilddaten erhalten wird, berechnet
wird.
28. Vorrichtung nach Anspruch 21, wobei die zeitliche
Komplexität auf der Basis der Bewegungsaktivität jedes Makroblocks
der eingegebenen Bilddaten berechnet wird.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20020012727A KR100850705B1 (ko) | 2002-03-09 | 2002-03-09 | 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10303928A1 true DE10303928A1 (de) | 2003-10-23 |
Family
ID=27786012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2003103928 Withdrawn DE10303928A1 (de) | 2002-03-09 | 2003-01-31 | Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und dafür geeigente Vorrichtung |
Country Status (5)
Country | Link |
---|---|
US (2) | US7280708B2 (de) |
JP (1) | JP2003274415A (de) |
KR (1) | KR100850705B1 (de) |
CN (1) | CN1283100C (de) |
DE (1) | DE10303928A1 (de) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100850705B1 (ko) * | 2002-03-09 | 2008-08-06 | 삼성전자주식회사 | 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치 |
US8369405B2 (en) | 2004-05-04 | 2013-02-05 | Qualcomm Incorporated | Method and apparatus for motion compensated frame rate up conversion for block-based low bit rate video |
JP5038134B2 (ja) | 2004-07-01 | 2012-10-03 | クゥアルコム・インコーポレイテッド | スケーラブルなビデオ符号化において、フレームレートアップ変換技術を使用する方法及び装置 |
JP2008507915A (ja) | 2004-07-20 | 2008-03-13 | クゥアルコム・インコーポレイテッド | 映像圧縮のための符号器補助式フレーム速度アップコンバージョンのための方法及び装置 |
US8553776B2 (en) | 2004-07-21 | 2013-10-08 | QUALCOMM Inorporated | Method and apparatus for motion vector assignment |
KR100584603B1 (ko) | 2004-08-03 | 2006-05-30 | 학교법인 대양학원 | 다시점 영상의 다이렉트 모드 움직임 예측 방법 및 장치 |
CN100515069C (zh) * | 2004-09-16 | 2009-07-15 | 株式会社Ntt都科摩 | 视频评价装置及方法、帧速率确定装置、及视频处理装置 |
JP2006115470A (ja) * | 2004-09-16 | 2006-04-27 | Ntt Docomo Inc | 映像評価装置、フレームレート決定装置、映像処理装置、映像評価方法、および映像評価プログラム |
US8780957B2 (en) | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
AR052601A1 (es) * | 2005-03-10 | 2007-03-21 | Qualcomm Inc | Clasificacion de contenido para procesamiento de multimedia |
KR100775787B1 (ko) * | 2005-08-03 | 2007-11-13 | 경희대학교 산학협력단 | 영역별 시공간적 특성을 이용한 동영상 부호화 장치 및 그방법 |
US8879635B2 (en) * | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
US8654848B2 (en) | 2005-10-17 | 2014-02-18 | Qualcomm Incorporated | Method and apparatus for shot detection in video streaming |
US8948260B2 (en) | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US8249070B2 (en) * | 2005-12-29 | 2012-08-21 | Cisco Technology, Inc. | Methods and apparatuses for performing scene adaptive rate control |
KR100734314B1 (ko) * | 2006-02-11 | 2007-07-02 | 삼성전자주식회사 | 움직임 보상 기반의 영상 압축 시스템에서의 영상 신호의공간 해상도 변환 방법 |
US20070230564A1 (en) * | 2006-03-29 | 2007-10-04 | Qualcomm Incorporated | Video processing with scalability |
US9131164B2 (en) | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
US8750387B2 (en) | 2006-04-04 | 2014-06-10 | Qualcomm Incorporated | Adaptive encoder-assisted frame rate up conversion |
US8634463B2 (en) | 2006-04-04 | 2014-01-21 | Qualcomm Incorporated | Apparatus and method of enhanced frame interpolation in video compression |
JP5188033B2 (ja) | 2006-04-24 | 2013-04-24 | 株式会社日立製作所 | 記録再生装置、送出装置及び伝送システム。 |
KR100968204B1 (ko) | 2007-01-11 | 2010-07-06 | 전자부품연구원 | 다시점 비디오 코덱에서의 영상 예측 방법 및 이를 위한프로그램을 기록한 컴퓨터로 판독 가능한 기록매체 |
US8296662B2 (en) * | 2007-02-05 | 2012-10-23 | Brother Kogyo Kabushiki Kaisha | Image display device |
WO2008147565A2 (en) * | 2007-05-25 | 2008-12-04 | Arc International, Plc | Adaptive video encoding apparatus and methods |
KR101087178B1 (ko) | 2007-08-31 | 2011-11-25 | 후지쯔 가부시끼가이샤 | 신호 출력 장치, 신호 출력 방법 및 신호 출력 프로그램을 기록한 기록 매체 |
KR100939435B1 (ko) * | 2007-10-29 | 2010-01-28 | 에스케이 텔레콤주식회사 | 영상 분석 장치 및 방법 |
JP2011507392A (ja) * | 2007-12-11 | 2011-03-03 | トムソン ライセンシング | 配信のチェーンにおいてトランスコーディングする方法及びシステム |
KR100952340B1 (ko) * | 2008-01-24 | 2010-04-09 | 에스케이 텔레콤주식회사 | 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치 |
KR100950718B1 (ko) * | 2008-04-03 | 2010-03-31 | 주식회사 창해에너지어링 | 인코딩 제어 방법 및 시스템 |
JP5451593B2 (ja) * | 2008-06-09 | 2014-03-26 | パナソニック株式会社 | 撮像装置、撮像方法 |
JP4636474B2 (ja) * | 2008-11-17 | 2011-02-23 | Necカシオモバイルコミュニケーションズ株式会社 | 映像変換装置、映像再生装置、映像変換再生システム及びプログラム |
JP2010160304A (ja) | 2009-01-08 | 2010-07-22 | Seiko Epson Corp | 画像データ処理方法及び画像表示システム |
CN101778275B (zh) * | 2009-01-09 | 2012-05-02 | 深圳市融创天下科技股份有限公司 | 一种自适应时间域和空间域分辨率框架的图像处理方法 |
US20110013692A1 (en) * | 2009-03-29 | 2011-01-20 | Cohen Robert A | Adaptive Video Transcoding |
US8346915B2 (en) * | 2009-05-04 | 2013-01-01 | Qualcomm Incorporated | System and method of recording and sharing mobile application activities |
US9286709B2 (en) * | 2009-07-27 | 2016-03-15 | Dreamworks Animation Llc | Variable frame rate rendering and projection |
RU2010144450A (ru) * | 2010-10-29 | 2012-05-10 | ЭлЭсАй Корпорейшн (US) | Оценка движения для видео транскодера |
US20120275511A1 (en) * | 2011-04-29 | 2012-11-01 | Google Inc. | System and method for providing content aware video adaptation |
US20130021512A1 (en) * | 2011-07-20 | 2013-01-24 | Broadcom Corporation | Framing of Images in an Image Capture Device |
KR101311143B1 (ko) | 2012-03-28 | 2013-09-25 | 고려대학교 산학협력단 | 고속영상처리를 위한 부호화 장치 및 방법 |
JP6300440B2 (ja) * | 2012-12-12 | 2018-03-28 | 三菱電機株式会社 | 画像符号化装置 |
KR102050423B1 (ko) * | 2013-04-30 | 2019-11-29 | 한화테크윈 주식회사 | 영상 재생 방법 |
US10432946B2 (en) * | 2014-12-23 | 2019-10-01 | Apple Inc. | De-juddering techniques for coded video |
US10735773B2 (en) | 2015-06-04 | 2020-08-04 | Apple Inc. | Video coding techniques for high quality coding of low motion content |
US9602762B2 (en) | 2015-06-12 | 2017-03-21 | Sharp Laboratories Of America, Inc. | Fallback in frame rate conversion system |
US10523939B2 (en) * | 2015-12-31 | 2019-12-31 | Facebook, Inc. | Dynamic codec adaption |
CN107565971B (zh) * | 2017-09-07 | 2020-04-14 | 华为技术有限公司 | 一种数据压缩方法及装置 |
CN114026867B (zh) | 2019-07-09 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 分辨率自适应视频编解码 |
CN110636303B (zh) * | 2019-09-19 | 2022-12-06 | 深圳市梦网视讯有限公司 | 一种gop层率控调整方法和系统 |
CN113473041A (zh) * | 2020-03-30 | 2021-10-01 | 杭州海康威视数字技术股份有限公司 | 一种处理超高清模拟视频图像的方法及硬盘录像设备 |
WO2023059034A1 (ko) * | 2021-10-04 | 2023-04-13 | 엘지전자 주식회사 | 적응적으로 해상도를 변경하는 영상 부호화/복호화 방법, 장치, 및 비트스트림을 전송하는 방법 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61247183A (ja) | 1985-04-25 | 1986-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 符号化サンプル数低減法 |
JPS63108879A (ja) | 1986-10-25 | 1988-05-13 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化伝送装置 |
JP2588925B2 (ja) | 1988-03-11 | 1997-03-12 | 富士通株式会社 | 可変ビットレート画像符号化装置 |
JPH01300780A (ja) | 1988-05-30 | 1989-12-05 | Toshiba Corp | 画像伝送装置 |
GB2222500A (en) * | 1988-09-05 | 1990-03-07 | Philips Electronic Associated | Picture motion measurement |
JP2514114B2 (ja) | 1991-01-31 | 1996-07-10 | 株式会社グラフィックス・コミュニケーション・テクノロジーズ | 動画像符号化装置 |
US5544284A (en) * | 1992-02-11 | 1996-08-06 | Eastman Kodak Company | Sequential product code quantization of digital color image |
US6222881B1 (en) * | 1994-10-18 | 2001-04-24 | Intel Corporation | Using numbers of non-zero quantized transform signals and signal differences to determine when to encode video signals using inter-frame or intra-frame encoding |
KR100234247B1 (ko) * | 1995-05-29 | 1999-12-15 | 윤종용 | 가변 비트율 동화상 부호화장치 |
US6314140B1 (en) * | 1995-12-28 | 2001-11-06 | Lucent Technologies Inc. | Dynamic video focus control |
JP3150627B2 (ja) | 1996-10-04 | 2001-03-26 | 日本電信電話株式会社 | 復号信号の再符号化方法 |
JPH10164579A (ja) | 1996-11-29 | 1998-06-19 | Sanyo Electric Co Ltd | 符号化制御方法およびその方法を用いた符号化制御装置 |
CN1156171C (zh) * | 1997-04-07 | 2004-06-30 | 松下电器产业株式会社 | 提高处理效率的图象声音处理装置 |
FR2764156B1 (fr) * | 1997-05-27 | 1999-11-05 | Thomson Broadcast Systems | Dispositif de pretraitement pour codage mpeg ii |
US6122321A (en) | 1998-05-12 | 2000-09-19 | Hitachi America, Ltd. | Methods and apparatus for reducing the complexity of inverse quantization operations |
JP3185763B2 (ja) * | 1998-07-13 | 2001-07-11 | 日本電気株式会社 | 動画像符号化装置 |
KR100336497B1 (ko) * | 1999-12-27 | 2002-05-15 | 오길록 | 공간예측 오차 모델을 이용한 동영상 부호화기의 율제어장치 및 방법 |
US6493386B1 (en) * | 2000-02-02 | 2002-12-10 | Mitsubishi Electric Research Laboratories, Inc. | Object based bitstream transcoder |
US6650705B1 (en) * | 2000-05-26 | 2003-11-18 | Mitsubishi Electric Research Laboratories Inc. | Method for encoding and transcoding multiple video objects with variable temporal resolution |
AU2000257047A1 (en) | 2000-06-28 | 2002-01-08 | Mitsubishi Denki Kabushiki Kaisha | Image encoder and image encoding method |
DE60138073D1 (de) * | 2000-07-12 | 2009-05-07 | Canon Kk | Bildverarbeitungsverfahren und Bildverarbeitungsvorrichtung |
US6834080B1 (en) * | 2000-09-05 | 2004-12-21 | Kabushiki Kaisha Toshiba | Video encoding method and video encoding apparatus |
KR100394014B1 (ko) * | 2001-06-23 | 2003-08-09 | 엘지전자 주식회사 | 영상 변환 부호화 장치 |
WO2002071736A2 (en) * | 2001-03-05 | 2002-09-12 | Intervideo, Inc. | Systems and methods of error resilience in a video decoder |
US6680973B2 (en) * | 2001-03-29 | 2004-01-20 | Koninklijke Philips Electronics N.V. | Scalable MPEG-2 video decoder with selective motion compensation |
KR100850705B1 (ko) * | 2002-03-09 | 2008-08-06 | 삼성전자주식회사 | 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치 |
KR100850706B1 (ko) * | 2002-05-22 | 2008-08-06 | 삼성전자주식회사 | 적응적 동영상 부호화 및 복호화 방법과 그 장치 |
KR20040076034A (ko) * | 2003-02-24 | 2004-08-31 | 삼성전자주식회사 | 동 영상의 가변 비트율 부호화 방법 및 장치 |
-
2002
- 2002-03-09 KR KR20020012727A patent/KR100850705B1/ko not_active Expired - Fee Related
-
2003
- 2003-01-23 JP JP2003015419A patent/JP2003274415A/ja active Pending
- 2003-01-30 CN CNB031034284A patent/CN1283100C/zh not_active Expired - Fee Related
- 2003-01-31 DE DE2003103928 patent/DE10303928A1/de not_active Withdrawn
- 2003-02-04 US US10/357,370 patent/US7280708B2/en not_active Expired - Fee Related
-
2006
- 2006-05-05 US US11/418,261 patent/US20060210184A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20030169933A1 (en) | 2003-09-11 |
KR100850705B1 (ko) | 2008-08-06 |
KR20030073254A (ko) | 2003-09-19 |
CN1444397A (zh) | 2003-09-24 |
CN1283100C (zh) | 2006-11-01 |
JP2003274415A (ja) | 2003-09-26 |
US7280708B2 (en) | 2007-10-09 |
US20060210184A1 (en) | 2006-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE10303928A1 (de) | Verfahren für das adaptive Kodieren eines Bewegtbildes auf der Basis zeitlicher und räumlicher Komplexität und dafür geeigente Vorrichtung | |
US6104434A (en) | Video coding apparatus and decoding apparatus | |
US8249154B2 (en) | Method and apparatus for encoding/decoding image based on intra prediction | |
US5631644A (en) | Image encoding apparatus | |
JP4677003B2 (ja) | 動映像符号化及び復号化方法、並びにその装置 | |
KR100664928B1 (ko) | 비디오 코딩 방법 및 장치 | |
KR100850706B1 (ko) | 적응적 동영상 부호화 및 복호화 방법과 그 장치 | |
US20060182356A1 (en) | Video compression and decompression system with postfilter to filter coding artifacts | |
KR101090586B1 (ko) | 부호화 장치/복호화 장치, 부호화 방법/복호화 방법 및 기록 매체 | |
US8243802B2 (en) | Moving picture encoding apparatus, moving picture encoding method, moving picture encoding program, moving picture decoding apparatus, moving picture decoding method, and moving picture decoding program | |
KR100843080B1 (ko) | 비디오 트랜스코딩 방법 및 장치 | |
US7450639B2 (en) | Advanced noise estimation method and apparatus based on motion compensation, and method and apparatus to encode a video using the same | |
KR101450645B1 (ko) | 비디오 비트율 제어 방법 및 장치 | |
US20210195243A1 (en) | Transform device, decoding device, transforming method, and decoding method | |
US8340191B2 (en) | Transcoder from first MPEG stream to second MPEG stream | |
JPH04331592A (ja) | 動画像符号化装置 | |
JPH0730895A (ja) | 画像処理装置及びその処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8139 | Disposal/non-payment of the annual fee |