[go: up one dir, main page]

DE69628282T2 - Verfahren zur kompression mehrerer videobilder - Google Patents

Verfahren zur kompression mehrerer videobilder Download PDF

Info

Publication number
DE69628282T2
DE69628282T2 DE69628282T DE69628282T DE69628282T2 DE 69628282 T2 DE69628282 T2 DE 69628282T2 DE 69628282 T DE69628282 T DE 69628282T DE 69628282 T DE69628282 T DE 69628282T DE 69628282 T2 DE69628282 T2 DE 69628282T2
Authority
DE
Germany
Prior art keywords
video
image
video images
images
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69628282T
Other languages
English (en)
Other versions
DE69628282D1 (de
Inventor
Subutai Ahmad
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Interval Research Corp
Palo Alto Research Center Inc
Original Assignee
Interval Research Corp
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interval Research Corp, Palo Alto Research Center Inc filed Critical Interval Research Corp
Publication of DE69628282D1 publication Critical patent/DE69628282D1/de
Application granted granted Critical
Publication of DE69628282T2 publication Critical patent/DE69628282T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7328Query by example, e.g. a complete video frame or video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Auxiliary Devices For And Details Of Packaging Control (AREA)
  • Color Television Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Komprimieren einer Sequenz von Videobildern.
  • Es ist hinlänglich bekannt, dass ein Videobild, wenn es digitalisiert ist, eine große Menge Speicherplatz benötigt. Eine Sequenz von Videobildern (nachfolgend als "Videoszene" bezeichnet), wie z. B. ein Kinofilm, würde Hunderte von Megabyte oder sogar Gigabyte Speicherkapazität benötigen, wenn sie nicht komprimiert würde.
  • Verfahren zum Komprimieren einer Videoszene sind in der Technik hinlänglich bekannt. Ein bekanntes Verfahren besteht darin, einen Bildwert durch eine Analyse der Hauptkomponenten für alle Bilder der Videoszene abzuleiten. Nehmen wir einmal an, jedes Videobild habe N Pixel. Danach wird ein Bildwert auf der Basis eines für eine Hauptkomponentenanalyse gewählten Parameters für jedes der Videobilder bestimmt. Somit wäre der resultierende Speicherbedarf für einen Parameter ein Bild voll mit Komponentenwerten für diesen Parameter (oder N Werten) und ein Bildwert in Verbindung mit jedem Videobild. Wenn mehr als ein Parameter für die Videobilder gewählt wird, dann würde sich der benötigte Gesamtspeicherbedarf entsprechend vervielfachen. Beispiele für die Anwendung einer Hauptkomponentenanalyse sind in "Facial-feature Image Coding Using Principal Components" auf den Seiten 2066 und 2067 in Electronics Letters, 1992, Bd. 28, Nr. 22, von W. J Welsh und D. Shah, sowie in "Computer Graphics Animation of Talking Faces Based on Stochastic Models" auf den Seiten 73 bis 76 in der 1994 International Symposium Speech, Image Processing Networks Proceedings, Bd. 1, von N. M. Brooke und S. D. Scott beschrieben.
  • Aber selbst bei diesem Verfahren wäre, wenn die Videoszene viele Videobilder hat, wie bei einem Kinofilm, der für einen einzelnen Parameter in Verbindung mit jedem der Videobilder benötigte Speicherplatz immer noch groß. Da Videobilder mit einer recht hohen Geschwindigkeit angezeigt werden, z. B. dreißig Mal pro Sekunde, würde ein zweistündiger Videofilm 216.000 Videobilder (2 × 60 × 60 × 30) bei einem standardmäßigen TV-Format 50 Gigabyte Speicherplatz benötigen. Daher würde auf der Basis dieses Verfahrens für einen Parameter jedes Videobild immer noch N Komponentenwerte für eine Hauptkomponentenanalyse und 216.000 Bildwerte mit einem Bildwert für jedes der Videobilder ergeben. Ferner würde, obwohl der benötigte Speicherplatz durch Komprimieren jedes Videobildes mit diesem Verfahren reduziert wird, diese Videoszene zum Betrachten oder Durchlaufen ihrer Videobilder immer noch die Anzeige der gesamten Sammlung von Bildern erfordern, z. B. 216.000 Bilder. Für einen Benutzer wäre das Betrachten oder Durchsuchen der gesamten Kollektion angezeigter Bilder ineffizient und aufwändig. Das Durchlaufen oder Überfliegen der gesamten Kollektion von Videobildern der Videoszene würde eine beträchtliche Menge an Zeit und Aufwand erfordern.
  • Ein weiteres bekanntes Kompressionsverfahren besteht darin, einige der Bilder aus einer Videoszene als Referenzrahmen auszuwählen. Als Referenzrahmen wird jeder n-te in der Sequenz gewählt. Nachfolgende oder vorangehende Bilder werden mit den Referenzrahmen verglichen, und die Differenzen oder Änderungen werden gespeichert. Somit brauchen nur Daten für die Referenzrahmen und die Änderungen daran gespeichert zu werden.
  • Die US 5 265 180 offenbart ein weiteres Verfahren zum Codieren einer Sequenz von Bildern eines digitalen Bewegtbild-Videos, wobei Informationen über zukünftige Bilder in der Bildsequenz anhand einer anfänglichen Analyse der Bilddaten vor der Kompression erhalten werden. Durch die anfängliche Analyse werden Informationen über Variationen der Komplexität zwischen Bildern für das Kompressionssystem gewonnen. Anhand dieser Informationen wird die Einstellung eines Kompressionscontrollers ermittelt. Anhand dieser Einstellung werden andere Kompressionssystem-Schwellenwerte und -Quantifizierer skaliert. Darüber hinaus gibt die anfängliche Analyse qualitative Informationen über Events wie z. B. Szenenänderungen, kurze Perioden mit schnellen Bewegungen, Auflösungen, rollende Schnitte (Wipes) sowie das Aussehen eines einzelnen anomalen Bildes.
  • Da sich die Verwendung von Videobildern zum Erfassen von Informationen immer weiter in den Vordergrund drängt, muss ein Verfahren gefunden werden, um die Mehrzahl von Videobildern oder die Videoszene auf effiziente Weise zu speichern, anzuzeigen und zu durchsuchen. Die Kollektion der angezeigten Videobilder muss auf eine Weise kategorisiert werden, die ein rasches Suchen zulässt. So ist die Kompression der Videobilder nicht nur wichtig, um Speicherplatz minimal zu halten, sondern das Verfahren muss auch Anzeige und schnelle Suche der komprimierten Videobilder noch mehr erleichtern.
  • Somit befasst sich die vorliegende Erfindung mit den Problemen der Videokompression, um den Speicherbedarf minimal zu halten und um ein effizienteres Verfahren zum Anzeigen und Durchsuchen von Videobildern aus einer Videoszene zuzulassen.
  • Die vorliegende Erfindung ist im beiliegenden Anspruch 1 definiert, auf den nunmehr Bezug genommen werden sollte.
  • In einer Ausgestaltung der vorliegenden Erfindung wird eine Mehrzahl von Videobildern komprimiert. Jedes Bild ist durch eine Mehrzahl von Pixeln gekennzeichnet und wird auf der Basis von wenigstens einem Pixelparameter komprimiert. Die Kompression kann auf der Basis einer Hauptkomponentenanalyse erfolgen. Ein Bildwert wird für jedes Videobild für diesen einen Parameter ermittelt. Ein Bildwert in Verbindung mit jedem Videobild wird mit einem Bildwert verglichen, der mit einem anderen Videobild assoziiert ist, um eine Differenz zu ermitteln. Die Differenz wird mit einem Schwellenwert verglichen, der fest oder adaptiv sein kann. Für den Fall, dass die Differenz unterhalb des Schwellenwertes liegt, wird nur einer der Bildwerte gespeichert. Die den gespeicherten Bildwerten entsprechenden Videobilder können angezeigt und durchsucht werden.
  • Das oben erwähnte Verfahren kann zum Komprimieren einer Videodatenbank mit einer Mehrzahl von Videobildern verwendet werden. Ein oder mehrere "Schlüssel"-Videobilder werden mit dem oben beschriebenen Verfahren ausgewählt. Alle anderen Videobilder der Videodatenbank werden mit den "Schlüssel"-Videobildern verglichen, und die Differenzen werden gespeichert. Die "Schlüssel"-Videobilder an sich, oder die bei der Hauptkomponentenanalyse ermittelten Bilder und Parameterwerte werden ebenfalls gespeichert. Auf der Basis dieser Kompression können alle Videobilder der Videodatenbank getreu reproduziert werden.
  • In einer anderen Videodatenbank, die eine Mehrzahl von Datenbankelementen hat, wobei jedes Datenbankelement eine Videoszene ist, wird jede Videoszene auf der Basis des oben offenbarten Kompressionsverfahrens komprimiert. Die Videodatenbank wird durchsucht, um eine Übereinstimmung mit einer anfragenden Videoszene zu finden, die ebenfalls eine Mehrzahl von Videobildern umfasst. Die anfragende Videoszene kann ebenfalls mit dem oben offenbarten Kompressionsverfahren komprimiert werden. Die gespeicherten Bildwerte in Verbindung mit der anfragenden Videoszene werden mit den gespeicherten Bildwerten in Verbindung mit jeder Videoszene aus der Videodatenbank verglichen, um eine Übereinstimmung zwischen der anfragenden Videoszene und einer der Videoszenen aus der Videodatenbank zu finden.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein schematisches Diagramm des Verfahrens des Standes der Technik zum Komprimieren von Videobildern auf der Basis einer Hauptkomponentenanalyse.
  • 2 ist ein schematisches Diagramm des verbesserten Verfahrens der vorliegenden Erfindung, nachdem eine Mehrzahl von Videobildern mit dem Hauptkomponentenanalyseverfahren des Standes der Technik komprimiert wurde.
  • 3 ist ein schematisches Diagramm des Verfahrens der vorliegenden Erfindung zum Komprimieren und Speichern einer Mehrzahl von Videobildern wie beispielsweise eines Kinofilms.
  • 4 ist eine schematische Ansicht eines Verfahrens zum Durchsuchen einer Videodatenbank, um eine Übereinstimmung zwischen einer anfragenden Videoszene und einem der Elemente der Videodatenbank zu ermitteln, die jeweils eine Videoszene umfassen.
  • 5 ist eine bildliche Anzeige des Verfahrens der vorliegenden Erfindung, um eine Kollektion von Videobildern aus einer Videoszene auf effiziente und schnelle Weise anzuzeigen und zu durchsuchen.
  • 6 ist eine Ablauftabelle des Verfahrens der vorliegenden Erfindung zum Ermitteln von Videobildern mit Schlüsselbildparametern gemäß dem Verfahren der vorliegenden Erfindung.
  • 7 ist eine Ablauftabelle des Verfahrens der vorliegenden Erfindung zum Komprimieren einer Mehrzahl von Videobildern unter Verwendung von Videobildern mit Schlüsselbildparametern (oder Referenzbildern), ermittelt gemäß dem in 6 gezeigten Verfahren.
  • 8 ist eine Übersicht über die verschiedenen Verfahren der vorliegenden Erfindung und deren Anwendungen.
  • AUSFÜHRLICHE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 zeigt eine schematische Ansicht des Verfahrens zum Komprimieren einer Videoszene des Standes der Technik. Die Videoszene umfasst eine Mehrzahl von Videotildern oder Videorahmen, mit F1 ... FM bezeichnet. Jedes der Videobilder hat eine Mehrzahl von Pixeln, die mit P1 ... PN bezeichnet sind. Die Kollektion von Videobildern wird als Videoszene bezeichnet.
  • Im Stand der Technik ist es bekannt, das Verfahren der Hauptkomponentenanalyse zum Ableiten eines Hauptkomponentenparameterwertes für die Videoszene anzuwenden. Bei dem Verfahren wird ein Parameter für die Mehrzahl von Videobildern F1 ... FM gewählt. Beispiele für Parameter sind unter anderem Intensität oder ein(e) bestimmte(r) Farbe oder Farbton oder Raumfrequenz usw. Dann wird ein Bild voll mit Komponenten, z. B. N Komponenten, für diesen einen gewählten Parameter abgeleitet. So werden die Komponentenwerte C1 ... CN abgeleitet. Dann wird jedes der Videobilder F1 ... FM durch Ermitteln eines Bildwertes I1 ... IM für jedes Videobild für die gewählte Parameterkomponente C ermittelt. Der Bildwert Ik wird abgeleitet auf der Basis von:
    Figure 00060001
    wobei J ein Index zur Pixelnummer, PkJ der wert des J-ten Pixels im Rahmen Fk ist.
  • Aus dem oben Gesagten wird ersichtlich, dass eine M Videobilder umfassende Videoszene ein Videobild voll mit Daten (oder N Werten) für die Komponente umfasst, die mit der Hauptkomponentenanalyse gewählt wurde, und M Bildwerte, mit einem mit jedem Videobild Fk assoziierten Bildwert Ik. Wie zuvor erwähnt, ergeben sich in dem Fall, dass die Videoszene lang ist, z. B. ein Kinofilm von zwei Stunden, und jedes der Videobilder 1/30 Sekunde lang angezeigt wird, 216.000 Videobilder (2 × 60 × 60 × 30). Somit würde selbst unter Anwendung der bekannten Methode der Hauptkomponentenanalyse zum Komprimieren einer Videoszene mit einer Mehrzahl von Videobildern eine erhebliche Menge Speicherplatz, wo die Videoszene lang ist, für jeden von der Nauptkomonentenanlayse abgeleiteten Parameter benötigt. Darüber hinaus würde das Anzeigen, Betrachten oder Durchsuchen der 216.000 Videobilder trotz der Reduzierung des Speicherbedarfs einen erheblichen Aufwand erfordern.
  • 2 zeigt schematisch ein bevorzugtes Verfahren der vorliegenden Erfindung. Das bevorzugte Verfahren der vorliegenden Erfindung reduziert den Speicherbedarf des Komprimierens einer Videoszene unter Verwendung des Verfahrens der Hauptkomponentenanalyse. Bei dieser Hauptkomponentenanalyse wird entweder lokal für verschiedene Regionen desselben Videobildes ein anderer Parameter verwendet, oder es wird global derselbe Parameter über das gesamte Videobild verwendet. Es ist jedoch ersichtlich, dass das Verfahren der vorliegenden Erfindung nicht durch die Technik der Hauptkomponentenanalyse begrenzt ist. So können beispielsweise auch von einer diskreten Kosinustransformation abgeleitete Bildwerte, Gabor-Filter und Wavelets verwendet werden. Mit dem Hauptkomponentenanalyseverfahren werden jedoch ein oder mehrere Parameter erzeugt. Zunächst konzentriert sich die Erörterung auf das Verfahren der vorliegenden Erfindung, das auf einen Parameter angewendet wird. Es ist jedoch klar, dass das Verfahren der vorliegenden Erfindung auf Kompression auf der Basis einer Mehrzahl von Parametern angewendet werden kann, die durch Hauptkomponentenanalyse abgeleitet werden.
  • Wie zuvor sei angenommen, dass durch die Anwendung des Kompressionsverfahrens auf der Basis der Hauptkomponentenanalyse M Bildwerte erhalten werden. Dies ist dargestellt als I1, I2, I3 ... IM.
  • Danach wird jeder mit einem Videobild Fk assoziierte Bildwert Ik mit einem Bildwert Ik+1 verglichen, der mit einem Videobild Fk+1 assoziiert ist, der sich zeitlich unmittelbar neben dem Videobild Fk befindet. Der Absolutwert der Differenz zwischen den beiden Bildwerten wird erhalten und mit einem Schwellenwert verglichen. Wenn die Differenz zwischen den beiden Bildwerten kleiner ist als ein Schwellenwert, d. h. Ik – Ik+1| ≤ T dann wird entweder der Bildwert Ik oder der Bildwert Ik+1 verworfen. Der verbleibende Bildwert wird gespeichert. Es ist ersichtlich, dass der Schwellenwert T ein fester Schwellenwert oder ein adaptiver Schwellenwert sein kann.
  • Dies geht aus dem folgenden Beispiel hervor. Das Verfahren der vorliegenden Erfindung beginnt mit dem Vergleichen von I1 mit I2. Wenn der Absolutwert der Differenz zwischen den beiden Bildwerten geringer ist als der
  • Schwellenwert, dann sei angenommen, dass I1 behalten wird.
  • Der behaltene Bildwert I2 wird dann mit dem Bildwert I3 verglichen, der mit dem Videobild F3 assoziiert ist, der sich zeitlich unmittelbar daneben befindet. Auch hier verwirft das Verfahren, wenn der Absolutwert der Differenz geringer ist als ein vorbestimmter Schwellenwert, entweder I1 oder I3. Auch hier sei wieder angenommen, dass I1 behalten wird. Diese Technik wird fortgesetzt, bis I1 mit allen übrigen Bildwerten verglichen ist, d. h. I2 ... IM.
  • Das Verfahren wird mit dem Wählen des nächsten Bildwertes Ik fortgesetzt, der nicht verworfen wurde. Man nehme an, dass I4 der nächste Bildwert unmittelbar neben I1 ist, der gespeichert oder behalten wurde. I4 wird dann mit jedem der verbleibenden Bildwerte IJ verglichen, bis alle verbleibenden Bildwerte mit I4 verglichen sind. Dieser Prozess wird so lange fortgesetzt, bis alle verbleibenden Bildwerte miteinander verglichen sind.
  • Wenn ein besonderer Bildwert, z. B. Ik, der mit einem anderen Bildwert verglichen wurde, z. B. IJ größer ist als der Schwellenwert, dann wird keiner der Bildwerte verworfen. Der Vergleich wird fortgesetzt, indem Ik genommen und mit dem Bildwert von IJ+1 verglichen wird, der mit dem Videobild assoziiert ist, das sich dann zeitlich unmittelbar daneben befindet.
  • Aus dem oben Gesagten geht hervor, dass nur Bildwerte Ik behalten werden, die eine größenmäßige Veränderung von mehr als dem Schwellenwert haben. Eine weitere Kompression der Mehrzahl von Bildwerten wird durch Verwerfen derjenigen Bildwerte erhalten, deren Werte sehr nahe an den zeitlich unmittelbar benachbarten Bildwerten liegen.
  • Das obige Verfahren wurde zwar mit Bezug auf das Vergleichen eines Bildwertes Ik mit einem anderen Bildwert Ik+1 beschrieben, der mit Videobildern assoziiert ist, die sich zeitlich unmittelbar daneben befinden, aber es ist leicht ersichtlich, dass das Verfahren der vorliegenden Erfindung nicht darauf begrenzt ist. Der Bildwert Ik braucht nicht mit einem Bildwert Ik+1 verglichen zu werden, der mit einem zeitlich unmittelbar benachbarten Videobild assoziiert ist.
  • Ik kann beispielsweise mit Ik+2 oder sogar mit Ik+3 verglichen werden, die Bildwerte repräsentieren, die sich zeitlich nicht unmittelbar daneben befinden.
  • Ferner kann das Verfahren der vorliegenden Erfindung mit dem Hauptkomponentenanalyseverfahren des Standes der Technik angewendet werden, wo eine Mehrzahl der unterschiedlichen Parameter durch das Hauptkomponentenanalyseverfahren abgeleitet wird. So kann beispielsweise die die Videobilder F1 ... FM umfassende Videoszene mittels einer Hauptkomponentenanalyse komprimiert werden, um eine Mehrzahl von Parametern Ck abzuleiten (wobei k Werte von 1, 2 usw. haben kann). Für jeden der Parameter Ck würde ein Bildwert für jedes Videobild F1 ... FM abgeleitet. So würde z. B. dann, wenn drei Parameter abgeleitet würden, die Videoszene der Videobilder F1 ... FM wie folgt komprimiert:
    • (1) Ein Bild voll mit den werten C11 ... C1N von einer Komponente und einem Bildwert I11 ... I1M in Verbindung mit einem der Videobilder F1 ... FM;
    • (2) Ein Bild voll mit Werten C21 ... C2N von einer Komponente und einem Bildwert I21 ... I2M in Verbindung mit einem der Videobilder F1 ... FM;
    • (3) Ein Bild voll mit Werten C31 ... C3N einer Komponente und einem Bildwert I31 ... I3M in Verbindung mit einem der Videobilder F1 ... FM.
  • Wo eine Mehrzahl von Parametern mit der Hauptkomponentenanalyse abgeleitet wird, da komprimiert das Verfahren der vorliegenden Erfindung diese Mehrzahl von Parametern weiter durch Berechnen der Differenz der Bildwerte in Verbindung mit zeitlich unmittelbar benachbarten Videobildern gemäß:
    Figure 00090001
    Dabei ist k ein Index auf die Mehrzahl von Parametern,
    P ist die Gesamtzahl der Parameter,
    Iik ist der k-Parameter von Bildwert Ii,
    Ijk ist der k-Parameter von Bildwert Ij.
    Wk ist ein Gewichtungsfaktor für Parameter k.
  • Für alle Parameter kann Wk gleich oder unterschiedlich sein, wobei jeder Parameter anders gewichtet ist. Ferner kann, wie oben erörtert, jeder der Bildwerte Ii und Ij mit Videobildern Fi und Fj assoziiert sein, die sich zeitlich unmittelbar daneben befinden oder die sich zeitlich nicht unmittelbar daneben befinden.
  • Die obige Gleichung wird zwar für die weitere Kompression mit einer Mehrzahl von Parametern offenbart, aber das Verfahren der vorliegenden Erfindung kann auch mit einem beliebigen anderen Algorithmus angewendet werden, der die Differenz von zwei Bildwerten berechnet, unabhängig davon, ob die Bildwerte durch Hauptkomponentenanalyse abgeleitet werden oder nicht.
  • Ferner wird infolge der Berechnung der oben erörterten Differenz in dem Fall, dass die Differenz geringer ist als ein vorbestimmter Schwellenwert, einer der Videobildwerte gespeichert, während der andere Bildwert nicht gespeichert wird. Das Ergebnis ist eine weitere Kompression des Stroms von Videobildwerten.
  • Wie zuvor erörtert, kann der Schwellenwert T fest oder adaptiv sein. Die Beschreibung des obigen Verfahrens bezieht sich auf einen festen Schwellenwert. Alternativ stellt das Verfahren der vorliegenden Erfindung einen adaptiven Schwellenwert bereit, so dass der Benutzer (oder ein Computer) die Anzahl der zu speichernden Bildwerte (und dementsprechend die Anzahl der Videobilder) vorgeben kann. Der Benutzer oder der Computer kann die Anzahl der zu speichernden Bildwerte entweder direkt vorgeben oder er kann indirekt die Zeitdauer zum Anzeigen der Videobilder vorgeben, deren Bildwerte gespeichert werden. Im letzteren Beispiel kann der Benutzer beispielsweise ein Fünf-Minuten-Segment von anzuzeigenden Bildwerten für einen zweistündigen Videofilm vorgeben. So würden (5 × 60 × 30 = 9000) Bildwerte gespeichert.
  • Das Verfahren fährt dann zunächst mit dem Vergleichen der Bildwerte aller aufeinander folgenden Videobilder fort, um eine Differenz davon zu ermitteln. Unter Verwendung des vorherigen Beispiels werden die Bildwerte mit I1, I2, I3 ... IM bezeichnet. Danach wird jeder mit einem Videobild Fk assoziierte Bildwert Ik mit einem Bildwert Ik+1 verglichen, der mit einem Videobild Fk+1 assoziiert ist, das sich zeitlich unmittelbar neben dem Videobild Fk befindet. Der Absolutwert der Differenz zwischen den beiden Bildwerten wird ermittelt, d. h. D1(= |I1 – I2|), D2(= |I2 – I3|), D3 ... DM–1(= |IM– 1 – IM |), wobei D die Differenz ist. Die kleinste Differenz D wird dann gewählt, und einer dieser entsprechenden Bildwerte wird behalten. So wird z. B. dann, wenn D2 die kleinste Differenz ist, entweder I2 oder I3 behalten. Nehmen wir einmal an, dass I3 behalten wird.
  • Dann wird aus den übrigen Differenzen D die nächstkleinste Differenz, d. h. D3, gewählt, und einer der Bildwerte wird verworfen.
  • Alternativ werden die Differenzen zwischen aufeinander folgenden verbleibenden Bildwerten I neu berechnet, und die kleinste Differenz wird gewählt. So werden beispielsweise für das obige Beispiel die folgenden Differenzen berechnet: D1(= I1 – I3|), D3 (= |I3 – I4|), D4 ... DM–1 (= |IM–1 – IM|) Die kleinste Differenz wird gewählt, einer der Bildwerte wird behalten.
  • In jedem Fall wird dieser Prozess wiederholt, bis die gewünschte Anzahl an Videobildern verbleibt. So wird das Problem des Vorspezifierens eines Schwellenwertes eliminiert, und der Schwellenwert kann adaptiv auf der Basis des Videoinhalts der Videoszene gewählt werden. Dies ist aus 5 ersichtlich, wo eine Videoszene neunundvierzig (49) Videobilder umfasst, und mittels des Kompressionsverfahrens der vorliegenden Erfindung, wobei der Benutzer ein gewünschtes Ergebnis von vier (4) Videobildern vorgibt, werden so vier (4) Videobilder ermittelt.
  • 6 zeigt eine Ablauftabelle eines Verfahrens zum Ermitteln von Videobildern mit Schlüsselbildparametern, oder der Auswahl von "Schlüssel"-Bildern, gemäß dem oben beschriebenen Verfahren der vorliegenden Erfindung.
  • wie aus dem oben Gesagten hervorgeht, reduziert das Kompressionsverfahren der vorliegenden Erfindung den Speicherbedarf für eine Videoszene erheblich. Darüber hinaus ergibt das Verfahren, was noch wichtiger ist, jedoch eine reduzierte Zahl von Videobildern, die leicht angezeigt, durchlaufen oder durchsucht werden können. Die gewählten Videobilder, die angezeigt werden, enthalten Videoinformationen, die die größte Menge an "Änderung" in einem Strom von Videobildern demonstrieren. Die angezeigten gewählten Videobilder sind analog zu Indexen oder einer Inhaltstabelle für eine Textdatei. Auf diese Weise können Durchsuchen oder Durchlaufen einer Videoszene stark vereinfacht werden.
  • Es ist zu bemerken, dass die Anzeige von "Schlüssel"-Videobildern, die die größte Menge an Änderung des Videoinhalts in einer Videoszene repräsentieren, nicht auf Videobildern zu basieren braucht, die mit der Hauptkomponentenanalyse komprimiert wurden. So kann das Verfahren beispielsweise auf anderen Methoden basieren, die ein oder mehrere Parameter für jedes Videubild ermitteln. Danach wird mit dem Verfahren des Vergleichens aufeinander folgender Bildwerte und des Verwerfens von einem der Bildwerte, wenn die Differenz klein ist (mit einem festen Schwellenwert oder einem adaptiven Schwellenwert), wie oben beschrieben, eine Reihe von "Schlüssel"-Bildwerten berechnet. Die den "Schlüssel"-Bildwerten entsprechenden Videobilder können dann angezeigt werden.
  • Nach dem Ermitteln der "Schlüssel"-Bildwerte können die diesen "Schlüssel"-Bildwerten entsprechenden Videobilder als Indexbilder zum Komprimieren einer Mehrzahl von Videobildern (wie z. B. ein Kinofilm) in komprimierte Daten verwendet werden, von denen die unkomprimierte Mehrzahl von Videobildern ohne erheblichen Treueverlust reproduziert werden kann.
  • 3 zeigt ein schematisches Diagramm eines Verfahrens der vorliegenden Erfindung zum Komprimieren und Speichern einer Mehrzahl von Videobildern, z. B. ein Kinofilm. Wenn wir einmal annehmen, dass der Kinofilm Z Rahmen umfasst, dann gäbe es eine Anzahl von F1 ... FC ... FJ ... FM ... F2 Videobildern oder Rahmenbildern. Die Rahmen FC, FJ, FM und FZ sind die Indexbilder, d. h. diejenigen Videobilder, deren Schlüsselbildwerte mit dem oben beschriebenen Verfahren ermittelt wurden. Danach wird jedes Videobild, das näherungsweise einem der Indexbilder entspricht, verglichen. So werden
    |F1 – FC| ... |FC–1 – FC|, FC, |FC+1 – FJ|, ...
    berechnet. Dies ist wie beim Verfahren des Standes der Technik, da die Differenz zwischen verschiedenen Videobildern und den Indexbildern "Pixel für Pixel" berechnet wird. Diese Differenz wird dann zusammen mit den Indexbildern gespeichert. Alternativ wird die Differenz zusammen mit den die Indexbilder und das Hauptkomponentenanalysebild repräsentierenden "Schlüssel"-Bildwerten gespeichert. Mit dieser Kompressionstechnik können alle Videobilder der Videobank getreu reproduziert werden. 7 zeigt eine Ablauftabelle dieses Verfahrens.
  • Aus dem oben Gesagten geht hervor, dass im Gegensatz zum Verfahren des Standes der Technik, bei dem Referenzrahmen auf der Basis von jedem Satz von N Rahmen gewählt werden, das Kompressionsverfahren für eine Videodatenbank der vorliegenden Erfindung die Wahl der Referenz- oder Indexbilder nicht auf bestimmte zeitliche Positionen begrenzt. Der Vorteil des erfindungsgemäßen Verfahrens lässt sich anhand des nachfolgenden Beispiels ersehen. Man nehme an, dass es siebzehn Videobilder wie folgt gibt:
    I1, I2, I3, I4, ... I17
  • Man nehme ferner an, dass zwischen Bildern I4 und I5 sowie zwischen den Bildern I12 und I13 die größte Änderung vorliegt (z. B. eine abrupte Szenenänderung von einer zur anderen durch die Umschaltung von einer Kamera auf eine andere). Zwischen I1 und I4 befindet sich Kamera 1 an einem festen Ort oder "schwenkt", wobei die Differenz zwischen den Bildern minimal ist. Ebenso sei angenommen, dass die Änderungen zwischen den Bildern I5 und I12 minimal sind. Schließlich sei angenommen, dass auch zwischen I13 und I17 minimale Änderungen vorliegen. Daher gibt es drei Videobilder, die die Bilder I1–I4, I5–I12 und I13 –I17 umfassen.
  • Mit dem Verfahren der vorliegenden Erfindung werden Bilder I1, I5 und I1, als Indexbilder oder Referenzbilder ermittelt, d. h. als Bilder, deren "Schlüssel"-Bildwerte mit dem oben beschriebenen Verfahren ermittelt wurden. Die Kompression der Bilder I1–I17 bestünde darin, die Differenz zwischen I1 und jeweils I2 ... I4 zu finden, diese Differenz zu speichern, die Differenz zwischen I5 und jeweils I6 ... I12 zu finden und zu speichern, und die Differenzen zwischen I13 und jeweils I14 ... I17 zu finden und zu speichern. Darüber hinaus werden natürlich I1, I5 und I13 entweder als Bilder oder die Hauptkomponentenanalyse gespeichert, von der sie abgeleitet wurden.
  • Im Gegensatz zum Verfahren des Standes der Technik wird eine festgelegte Anzahl von Bildern als Referenzbild gewählt. Wenn beispielsweise jeder achte (8.) Rahmen, d. h. I1, I9 und I17 als Index- oder Referenzbilder gewählt wird, dann würde die Differenz zwischen Il und I5 eine riesige Differenz ergeben, weil eine große Änderung der Videobilddaten vorliegt. Ebenso würde die Differenz zwischen I9 und I13 eine große Änderung der Videodaten erfordern.
  • Im Gegensatz dazu kann unter Verwendung der Bilder mit der größten Änderung als Referenzbilder die Kompression optimiert werden.
  • Mit dem Verfahren der vorliegenden Erfindung wird es durch eine weitere Komprimierung der Videobilder und durch Reduzieren des Speicherbedarfs in einem weiteren Verfahren der vorliegenden Erfindung möglich, eine Videodatenbank zu durchsuchen. Die Videodatenbank hat eine Mehrzahl von Datenbankelementen, wobei jedes Datenbankelement eine Videoszene mit einer Mehrzahl von Videobildern ist. Jedes Videodatenbankelement wird mit dem Verfahren der vorliegenden Erfindung wie oben beschrieben komprimiert. Es ist jedoch, ähnlich wie in der vorherigen Erörterung, nicht mehr notwendig, einen oder mehrere Parameter für jedes Videobild von der Hauptkomponentenanalyse abzuleiten. Eine anfragende Videoszene umfasst auch eine Mehrzahl von Videobildern. Das Verfahren der vorliegenden Erfindung erlaubt eine Durchsuchung der Videodatenbank, um eine Übereinstimmung zwischen der anfragenden Videoszene und den Videoszenen der Videodatenbank zu finden. Die anfragende Videoszene kann mit dem oben beschriebenen Verfahren der vorliegenden Erfindung komprimiert werden.
  • Um zu ermitteln, ob eine Übereinstimmung zwischen der anfragenden Videoszene und einem der Videodatenbankelemente vorliegt, werden die mit der anfragenden Videoszene assoziierten gespeicherten Bildwerte mit den gespeicherten Bildwerten verglichen, die mit jedem Datenbankelement assoziiert sind, um eine Übereinstimmung zwischen den Bildwerten zu finden. Ein Verfahren zum Vergleichen der Übereinstimmungen besteht darin, eine exakte Übereinstimmung zu finden. Dies ist jedoch oft nicht möglich. Eine weitere Technik besteht darin, eine statistische Übereinstimmung zwischen den Videobildwerten der anfragenden Videoszene und den Videobildwerten jeder der Videoszenen der Videodatenbank zu finden. So kann beispielsweise der folgende Vergleich angestellt werden:
    Figure 00150001
    Dabei ist k ein Index zur Mehrzahl von Parametern und i ein Index zur Mehrzahl von gespeicherten Bildwerten;
    P ist die Gesamtzahl der Parameter; L ist die Gesamtzahl der gespeicherten Bildwerte,
    VI1k ist der k-Parameter von Bildwert I1 aus der Videodatenbank,
    I1k ist der k-Parameter von Bildwert I1 aus der anfragenden Videoszene,
    Wk ist ein Gewichtungsfaktor für Parameter k.
  • Für den Fall, dass der berechnete Wert unterhalb eines Schwellenwertes liegt, wird eine Übereinstimmung deklariert. Mit diesem erfindungsgemäßen Verfahren wird es dann möglich, auf der Basis eines "Videoclips" die Quelle oder das Videodatenbankelement zu ermitteln, von der/dem das "Videoclip" kam.
  • Die Videodatenbank braucht natürlich nicht vorkomprimiert zu werden. So können die Videodatenbankdaten zur selben Zeit komprimiert werden wie die anfragenden Videobilder.
  • Alternativ kann das Durchsuchen einer Videodatenbank, die eine Mehrzahl von Datenbankelementen umfasst, von denen jedes eine Videoszene ist, auf der Basis einer adaptiven Technik wie folgt durchgeführt werden. Wenn wir annehmen, dass ein Benutzer bereit ist, eine Zeitperiode T lang auf die Bearbeitung einer Suche nach einer Übereinstimmung mit einem der Videodatenbankelemente zur warten und der Prozessor eine bekannte Geschwindigkeit/Kapazität hat, dann kann die Zeitperiode T in einen Vergleich von S Videobildern umgesetzt werden. Unter Anwendung des oben beschriebenen adaptiven Vergleichsverfahrens kann jede Videoszene der Videodatenbank in S Videobilder und S Bildwerte komprimiert werden. Dann erfolgt ein Vergleich zwischen den Bildwerten der anfragenden Videoszenen und der Anzahl S von Bildwerten für jedes der Videodatenbankelemente. Das Videodatenbankelement mit der geringsten Gesamtdifferenz wäre dann die nächstliegende Übereinstimmung zwischen der anfragenden Videoszene und dem gewählten Videodatenbankelement. Die anfragende Videoszene könnte, müsste aber nicht in dieselbe Anzahl von Videobildern des Videodatenbankelementes komprimiert werden. Ferner kann jeder beliebige Suchalgorithmus des Standes der Technik zum Vergleichen der anfragenden Videoszene mit den komprimierten Videobildern angewendet werden.
  • Aus dem oben Gesagten wird ersichtlich, dass mit dem Verfahren der vorliegenden Erfindung eine Videoszene aus einer Mehrzahl von Videobildern stark komprimiert werden kann, um den Speicherbedarf zu verringern. Ferner wird es mit einer Reduzierung des Speicherbedarfs möglich, eine anfragende komprimierte Videoszene zu einer Videodatenbank zum Durchsuchen der Datenbank effizient anzuzeigen und zu durchsuchen, um ein Videodatenbankelement zu ermitteln, das mit der anfragenden Videoszene übereinstimmt.
  • In der bevorzugten Ausgestaltung wird das Verfahren der vorliegenden Erfindung mit einem Computerprogramm ausgeführt, das auf einer Silicon Graphics Workstation von Silicon Graphics. Inc. aus Mountain View, Kalifornien läuft. Eine Kopie dieses Programms ist in Anhang A dargestellt. Eine Übersicht über die verschiedenen Methoden der vorliegenden Erfindung sind in 8 dargestellt.
  • Figure 00180001
  • Figure 00190001
  • Figure 00200001
  • Figure 00210001
  • Figure 00220001
  • Figure 00230001
  • Figure 00240001
  • Figure 00250001
  • Figure 00260001
  • Figure 00270001
  • Figure 00280001
  • Figure 00290001
  • Figure 00300001
  • Figure 00310001
  • Figure 00320001
  • Figure 00330001
  • Figure 00340001
  • Figure 00350001
  • Figure 00360001

Claims (24)

  1. Verfahren zum Komprimieren einer Sequenz von Videobildern, wobei jedes Bild durch eine Mehrzahl von Pixeln gekennzeichnet ist, wobei das genannte Verfahren die folgenden Schritte umfasst: Komprimieren jedes der genannten Videobilder auf der Basis von wenigstens einem Pixelparameter, um einen Bildwert für jedes Videobild für den genannten wenigstens einen Pixelparameter zu ermitteln; Vergleichen jedes der Bildwerte mit dem Bildwert eines anderen Bildes, um eine Differenz zu ermitteln; Verwerfen eines Bildwertes aus jedem Paar verglichener Bildwerte, wenn die davon ermittelte Differenz einen Schwellenwert nicht überschreitet; und Speichern der nicht verworfenen Bildwerte und der Differenzen zwischen den gespeicherten Bildwerten und den verworfenen Bildwerten.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der genannte Schwellenwert fest ist.
  3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der genannte Schwellenwert adaptiv eingestellt wird.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der Schritt des Verwerfens Folgendes umfasst: Verwerfen eines der Bildwerte in Verbindung mit der geringsten Differenz; und Fortfahren mit dem genannten Verwerfungsschritt, bis die Anzahl der verbleibenden Videobildwerte gleich einer vorbestimmten Zahl ist, die kleiner ist als die Mehrzahl von Videobildern in der genannten Sequenz.
  5. Verfahren nach Anspruch 1 oder 4, dadurch gekennzeichnet, dass die Videobilder, für die die Bildwerte ermittelt und miteinander verglichen werden, in der genannten Sequenz von Videobildern unmittelbar nebeneinander liegen.
  6. Verfahren nach Anspruch 1 oder 4, dadurch gekennzeichnet, dass das Komprimieren der Videobilder durch eine Hauptkomponentenanalyse auf der Basis einer Mehrzahl verschiedener Pixelparameter beeinflusst wird.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die genannte Hauptkomponentenanalyse lokal mit einem anderen Pixelparameter für einen anderen Teil jedes Videobildes erfolgt.
  8. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die genannte Hauptkomponentenanalyse global mit demselben Pixelparameter durchgeführt wird, der für die Gesamtheit jedes Videobildes verwendet wird.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass bei dem Kompressionsschritt eine Mehrzahl von Bildwerten für jedes Videobild ermittelt wird, wobei ein Bildwert mit einem Pixelparameter assoziiert ist.
  10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass bei dem genannten Vergleichsschritt die genannte Differenz gemäß der folgenden Formel errechnet wird:
    Figure 00380001
    wobei k ein Index auf die Mehrzahl von Parametern ist, P die Gesamtzahl der Parameter ist, Iik der k-Parameter von Bildwert Ii von Bild i ist, Ijk der k-Parameter von Bildwert Ij von Bild j ist, Wk ein Gewichtungsfaktor für Parameter k ist.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass jeder der genannten Gewichtungsfaktoren Wk für alle Parameter k gleich ist.
  12. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass Ii und Ij Bildwerte sind, die mit Videobildern unmittelbar neben der genannten Sequenz von Videobildern assoziiert sind.
  13. Verfahren nach Anspruch 1 oder 4, dadurch gekennzeichnet, dass der Schritt des Komprimierens jedes Videobildes durch diskrete Kosinustransformation erfolgt.
  14. Verfahren nach Anspruch 1 oder 4, dadurch gekennzeichnet, dass der Schritt des Komprimierens jedes Videobildes mit Hilfe von Gabor-Filtern erfolgt.
  15. Verfahren nach Anspruch 1 oder 4, dadurch gekennzeichnet, dass der Schritt des Komprimierens jedes Videobildes mit Hilfe von Wavelets durchgeführt wird.
  16. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die genannte vorbestimmte Zahl von einem Computer vorgegeben wird.
  17. Verfahren nach Anspruch 4, gekennzeichnet durch den folgenden Schritt: Anzeigen oder Ausdrucken der Videobilder, die den nach dem Verwerfungsschritt verbleibenden Bildwerten entsprechen.
  18. Verfahren zum Suchen in einer Videodatenbank mit einer Mehrzahl von Videoszenen, wobei jede Szene eine Mehrzahl von Videobildern hat, wobei jedes der genannten Videobilder durch eine Mehrzahl von Pixeln gekennzeichnet ist, um eine bereinstimmung mit einer ersten Mehrzahl von Videobildern zu finden, wobei das genannte Verfahren die folgenden Schritte umfasst: Komprimieren der Videobilder jeder Videoszene der genannten Videodatenbank mit einem Verfahren nach Anspruch 1; Vergleichen der mit der genannten ersten Mehrzahl von Videobildern assoziierten Bildwerte mit den genannten gespeicherten Bildwerten, die mit jeder Videoszene assoziiert sind, um eine Übereinstimmung zwischen der genannten ersten Mehrzahl von Videobildern und einer der genannten Videoszenen zu finden.
  19. Verfahren nach Anspruch 1 oder 18, dadurch gekennzeichnet, dass der Schritt des Komprimierens jedes Videobildes durch Hauptkomponentenanalyse erfolgt.
  20. Verfahren zum Suchen in einer Videodatenbank mit einer Mehrzahl von Videoszenen, wobei jede Szene eine Mehrzahl von Videobildern hat, wobei jedes der genannten Videobilder durch eine Mehrzahl von Pixeln gekennzeichnet ist, um eine Übereinstimmung mit einer ersten Mehrzahl von Videobildern zu finden, wobei das genannte Verfahren Folgendes umfasst: Komprimieren der Videobilder jeder Videoszene der genannten Videodatenbank mit einem Verfahren nach Anspruch 4 oder 5; und Vergleichen der Bildwerte in Verbindung mit der genannten ersten Mehrzahl von Videobildern mit den genannten gespeicherten Bildwerten, die mit jeder Videoszene assoziiert sind, um eine Übereinstimmung zwischen der genannten ersten Mehrzahl von Videobildern und einer der genannten Videoszenen zu finden.
  21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, dass der Schritt des Komprimierens jedes Videobildes durch Hauptkomponentenanalyse erfolgt.
  22. Verfahren nach Anspruch 20, gekennzeichnet durch die folgenden Schritte: Komprimieren der genannten ersten Mehrzahl von Videobildern zu einer geringeren vorbestimmten Zahl von Schlüsselbildern, wobei die genannte vorbestimmte Zahl von Schlüsselbildern von einem Benutzer vorgegeben wird, mit einem Verfahren gemäß Anspruch 4; Speichern der verbleibenden Bildwerte und von deren zugehörigen Videobildern aus der genannten ersten Mehrzahl von Videobildern.
  23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, dass jedes Videobild der genannten ersten Mehrzahl durch diskrete Kosinustransformation oder mit Gabor-Filtern oder Wavelets komprimiert wird.
  24. Verfahren nach Anspruch 4, gekennzeichnet durch die Schritte des Vergleichens jedes Videobildes mit einem der Videobilder mit einem verbleibenden Bildwert, um eine Mehrzahl von Videodifferenzen zu ermitteln; und Speichern der genannten Videodifferenzen und der Videobilder mit verbleibenden Bildwerten.
DE69628282T 1995-09-15 1996-09-13 Verfahren zur kompression mehrerer videobilder Expired - Lifetime DE69628282T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US52889195A 1995-09-15 1995-09-15
US528891 1995-09-15
PCT/US1996/014722 WO1997010564A1 (en) 1995-09-15 1996-09-13 A method of compressing a plurality of video images

Publications (2)

Publication Number Publication Date
DE69628282D1 DE69628282D1 (de) 2003-06-26
DE69628282T2 true DE69628282T2 (de) 2004-03-11

Family

ID=24107628

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69628282T Expired - Lifetime DE69628282T2 (de) 1995-09-15 1996-09-13 Verfahren zur kompression mehrerer videobilder

Country Status (7)

Country Link
US (2) US6009204A (de)
EP (1) EP0804774B1 (de)
JP (1) JPH10509298A (de)
AT (1) ATE241179T1 (de)
AU (1) AU7070896A (de)
DE (1) DE69628282T2 (de)
WO (1) WO1997010564A1 (de)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ131399A0 (en) * 1999-06-30 1999-07-22 Silverbrook Research Pty Ltd A method and apparatus (NPAGE02)
WO1996027983A1 (en) 1995-03-07 1996-09-12 Interval Research Corporation System and method for selective recording of information
US5893062A (en) * 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
US6263507B1 (en) 1996-12-05 2001-07-17 Interval Research Corporation Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data
US6340971B1 (en) * 1997-02-03 2002-01-22 U.S. Philips Corporation Method and device for keyframe-based video displaying using a video cursor frame in a multikeyframe screen
JP3780623B2 (ja) 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JP4074366B2 (ja) * 1998-02-24 2008-04-09 コニカミノルタビジネステクノロジーズ株式会社 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
US6185737B1 (en) 1998-06-30 2001-02-06 Sun Microsystems, Inc. Method and apparatus for providing multi media network interface
US7155735B1 (en) 1999-10-08 2006-12-26 Vulcan Patents Llc System and method for the broadcast dissemination of time-ordered data
US6757682B1 (en) 2000-01-28 2004-06-29 Interval Research Corporation Alerting users to items of current interest
GB0007784D0 (en) * 2000-03-30 2000-05-17 Sony Uk Ltd Data compression
US6434320B1 (en) * 2000-10-13 2002-08-13 Comtrak Technologies, Llc Method of searching recorded digital video for areas of activity
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US8817045B2 (en) 2000-11-06 2014-08-26 Nant Holdings Ip, Llc Interactivity via mobile image recognition
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
EP1436730A2 (de) * 2001-05-15 2004-07-14 Koninklijke Philips Electronics N.V. Vorrichtung zur analyse von inhaltsdaten
US20020194193A1 (en) * 2001-06-18 2002-12-19 Gregg Edelmann Method and system for sorting, storing, accessing and searching a plurality of audiovisual recordings
US20050007452A1 (en) * 2001-09-07 2005-01-13 Mckay Therman Ward Video analyzer
MXPA04002211A (es) * 2001-09-07 2005-02-17 Intergraph Hardware Tech Co Metodo, dispositivo y producto de programa de computadora para desmultiplexar imagenes de video.
US6965645B2 (en) * 2001-09-25 2005-11-15 Microsoft Corporation Content-based characterization of video frame sequences
US7149957B2 (en) 2001-11-19 2006-12-12 Ricoh Company, Ltd. Techniques for retrieving multimedia information using a paper-based interface
US7788080B2 (en) 2001-11-19 2010-08-31 Ricoh Company, Ltd. Paper interface for simulation environments
US7743347B2 (en) 2001-11-19 2010-06-22 Ricoh Company, Ltd. Paper-based interface for specifying ranges
US8539344B2 (en) * 2001-11-19 2013-09-17 Ricoh Company, Ltd. Paper-based interface for multimedia information stored by multiple multimedia documents
US7006701B2 (en) * 2002-10-09 2006-02-28 Koninklijke Philips Electronics N.V. Sequential digital image compression
KR101001172B1 (ko) * 2003-01-06 2010-12-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 유사 비디오 콘텐츠 호핑을 위한 방법 및 장치
WO2004107208A1 (en) * 2003-05-30 2004-12-09 Koninklijke Philips Electronics N.V. Search and storage of media fingerprints
US20050044105A1 (en) * 2003-08-19 2005-02-24 Kelly Terrell System and method for delivery of content-specific video clips
US20060015497A1 (en) * 2003-11-26 2006-01-19 Yesvideo, Inc. Content-based indexing or grouping of visual images, with particular use of image similarity to effect same
US7697792B2 (en) * 2003-11-26 2010-04-13 Yesvideo, Inc. Process-response statistical modeling of a visual image for use in determining similarity between visual images
US20060015495A1 (en) * 2003-11-26 2006-01-19 Keating Brett M Use of image similarity in image searching via a network of computational apparatus
US20060015494A1 (en) * 2003-11-26 2006-01-19 Keating Brett M Use of image similarity in selecting a representative visual image for a group of visual images
US20060020597A1 (en) * 2003-11-26 2006-01-26 Yesvideo, Inc. Use of image similarity in summarizing a collection of visual images
WO2005055138A2 (en) * 2003-11-26 2005-06-16 Yesvideo, Inc. Statical modeling of a visual image for use in determining similarity between visual images
US20060188151A1 (en) * 2005-02-23 2006-08-24 Lexmark International, Inc. Method for processing data for use with a video display of an imaging apparatus
JP4890552B2 (ja) 2005-08-29 2012-03-07 エブリックス・テクノロジーズ・インコーポレイテッド モバイル画像認識を介した双方向性
US7423642B2 (en) * 2005-12-14 2008-09-09 Winbond Electronics Corporation Efficient video frame capturing
US20080273113A1 (en) * 2007-05-02 2008-11-06 Windbond Electronics Corporation Integrated graphics and KVM system
US9380256B2 (en) * 2007-06-04 2016-06-28 Trover Group Inc. Method and apparatus for segmented video compression
FR2935498B1 (fr) * 2008-08-27 2010-10-15 Eads Europ Aeronautic Defence Procede d'identification d'un objet dans une archive video.
US9240073B2 (en) * 2011-11-15 2016-01-19 Pixar File format for representing a scene
RU2640298C1 (ru) 2015-10-12 2017-12-27 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки и хранения изображений

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54114920A (en) * 1978-02-28 1979-09-07 Kokusai Denshin Denwa Co Ltd Television signal adaptive forecasting encoding system
JPH03252287A (ja) * 1990-02-28 1991-11-11 Victor Co Of Japan Ltd 動画像圧縮装置
US5177796A (en) * 1990-10-19 1993-01-05 International Business Machines Corporation Image data processing of correlated images
JPH04207788A (ja) * 1990-11-30 1992-07-29 Sony Corp 画像信号符号化装置及び方法
US5305400A (en) * 1990-12-05 1994-04-19 Deutsche Itt Industries Gmbh Method of encoding and decoding the video data of an image sequence
US5265180A (en) * 1991-06-13 1993-11-23 Intel Corporation Method of encoding a sequence of images of a digital motion video signal
KR100206261B1 (ko) * 1992-02-28 1999-07-01 윤종용 디지탈 vtr의 영상신호 대역 압축장치
WO1993019441A1 (en) * 1992-03-20 1993-09-30 Commonwealth Scientific And Industrial Research Organisation An object monitoring system
US5974235A (en) * 1996-10-31 1999-10-26 Sensormatic Electronics Corporation Apparatus having flexible capabilities for analysis of video information

Also Published As

Publication number Publication date
AU7070896A (en) 1997-04-01
WO1997010564A1 (en) 1997-03-20
DE69628282D1 (de) 2003-06-26
US6259817B1 (en) 2001-07-10
JPH10509298A (ja) 1998-09-08
ATE241179T1 (de) 2003-06-15
US6009204A (en) 1999-12-28
EP0804774B1 (de) 2003-05-21
EP0804774A1 (de) 1997-11-05
EP0804774A4 (de) 1999-02-24

Similar Documents

Publication Publication Date Title
DE69628282T2 (de) Verfahren zur kompression mehrerer videobilder
DE60317053T2 (de) Verfahren und Vorrichtung zur Darstellung einer Bildgruppe
DE60037485T2 (de) Signalverarbeitungsverfahren und Videosignalprozessor zum Ermitteln und Analysieren eines Bild- und/oder Audiomusters
DE69612643T2 (de) Verfahren und Vorrichtung zum Extrahieren spezifischer Bildinformation zum Erzeugen von Videoinformation
DE69524235T2 (de) Verfahren und vorrichtung zur global-zu-lokal-block-bewegungsschätzung
DE19803781C2 (de) Verfahren und Vorrichtung zur Bewegtbildkodierung und -dekodierung basierend auf Bereichen
DE3800634C2 (de)
DE69925805T2 (de) Skalierbare lösung für das wiederauffinden von bildern
DE69513541T2 (de) Verfahren zum Detektieren von durch Kamarabewegungen verursachte Szenenänderungen
DE69418367T2 (de) Verfahren zur Detektion einer Szenenänderung
DE69118639T2 (de) Verfahren und Gerät zur dynamischen Kanalbandbreitezuordnung zwischen einer Vielzahl von parallelen Videokodierungsgeräten
DE3851468T2 (de) Kodierungsverfahren von Bildsignalen.
DE69719825T2 (de) Videowiedergabe mit synchronisiertem ton bei veränderlicher geschwindigkeit
DE3639026C2 (de) Hochauflösendes Bildübertragungsverfahren
DE69801209T2 (de) Hierarchischer rekursiver Bewegungsschätzer für Bewegtbildkodierer
DE60211978T2 (de) Laufbildsystem mit bildinterpolation und variabler bildfrequenz
EP0645037B1 (de) Verfahren zur detektion von änderungen in bewegtbildern
EP0517324B1 (de) Vorrichtung zur Steuerung des Quantisierers eines Hybridkodierers
DE19743202B4 (de) Verfahren zum Codieren eines Bewegungsvektors
DE69629715T2 (de) Datenkomprimierung
DE69904610T2 (de) Bewegungsschätzungsverfahren zur Reduzierung der Übertragungskosten von Bewegungsvektoren
DE68910552T2 (de) Verfahren zur Wiederzuordnung der Wahl eines Unterabtastungsverfahrens nach dem Kriterium einer Datenraten-Reduktion einer Folge von Hilfsdaten, die zur Rekonstruktion eines unterabgetasteten, elektronischen Bildes dienen.
EP0525900B1 (de) Filterschaltung zur Vorverarbeitung eines Videosignals
DE69609931T2 (de) Verfahren zur Datenverarbeitung in matrixförmigen Netzwerken in einem Bewegungsschätzungssystem
DE69527457T2 (de) Feststellung von Szenenwechseln in kodierten Videosequenzen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition