[go: up one dir, main page]

DE69225365T2 - Bildsignalkodierungsvorrichtung - Google Patents

Bildsignalkodierungsvorrichtung

Info

Publication number
DE69225365T2
DE69225365T2 DE69225365T DE69225365T DE69225365T2 DE 69225365 T2 DE69225365 T2 DE 69225365T2 DE 69225365 T DE69225365 T DE 69225365T DE 69225365 T DE69225365 T DE 69225365T DE 69225365 T2 DE69225365 T2 DE 69225365T2
Authority
DE
Germany
Prior art keywords
coding
coefficients
coefficient
image signal
transformed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69225365T
Other languages
English (en)
Other versions
DE69225365D1 (de
Inventor
Koh C O Fuji Xerox Co Kamizawa
Yutaka C O Fuji Xerox Co Koshi
Setsu C O Fuji Xerox Kunitake
Kazuhiro Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP3220593A external-priority patent/JPH0563989A/ja
Priority claimed from JP22059691A external-priority patent/JP2664032B2/ja
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of DE69225365D1 publication Critical patent/DE69225365D1/de
Application granted granted Critical
Publication of DE69225365T2 publication Critical patent/DE69225365T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Vorrichtung zum Codieren eines Bildsignals.
  • Beim Handhaben halbtonbildartiger Information wird, falls die Bildinformation digitalisiert wird wie sie ist, die Menge der Information sehr groß, so daß die Informationsmenge im allgemeinen durch Codierung der Bildinformation komprimiert wird.
  • Obwohl es verschiedene Techniken des Codierens von Bildinformation gibt, ist als eine typische Technik zum Codieren eines Halbtonbildes ein Transformationscodierverfahren bekannt, das beispielsweise in Hideo Hashimoto offenbart ist: Eine Einführung in die Kompression von Bildinformation "Bildcodieralgorithmen II - Transformationscodierung", The Journal of the Institute of Television Engineers of Japan, Vol. 43, Nr. 10 (1989), Seiten 1145 - 1152.
  • Ein derartiges Transformationscodierverfahren wird unter Bezug auf Fig. 1 beschrieben werden, die ein grundlegendes Blockdiagramm zeigt.
  • Bezugszeichen 101 zeigt eine Blockvorrichtung zum Detektieren eines rechteckigen Gebiets in einem Bild als einen Pixelblock 102 aus einem digitalen Bildsignal 100; 103 ist ein Konverter zum Ausführen orthogonaler Transformationen bezüglich des Pixelblocks 102 und deren Ausgabe als transformierte Koeffizienten 104; 105 ist ein Koeffizientenselektor zum Auswählen eines spezifischen Koeffizienten aus den transformierten Koeffizienten 104 und Ausgeben eines ausgewählten transformierten Koeffizienten 106; 107 ist ein Quantisierer zum Quantisieren der ausgewählten transformierten Koeffizienten 106 und zum Ausgeben eines quantisierten Koeffizienten 108; und 109 ist ein Codierer zum Codieren des quantisierten Koeffizienten 108 und zum Ausgeben codierter Daten 110 an eine Übertragungsleitung 111.
  • Als nächstes wird ein Betrieb des in der Fig. 1 dargestellten Systems beschrieben werden. In dem System der Fig. 1 umfaßt die Codierverarbeitung eine Transformationsverarbeitung, Informationsreduzierverarbeitung und Codezuweisungsverarbeitung.
  • In der Transformationsverarbeitung wird in dem Falle eines Bildsignales eine zweidimensionale orthogonale Transformation ausgeführt, in der die Korrelation zwischen horizontaler und vertikaler Richtung verwendet wird. Der Pixelblock 102, der M Pixel und N Pixel entsprechend in den horizontalen und vertikalen Richtungen umfaßt, wird in der Blockvorrichtung 101 gebildet und eine eindimensionale orthogonale Transformation wird unabhängig voneinander in der horizontalen und der vertikalen Richtung in dem Konverter 103 ausgeführt. In dem Konverter 103 wird eine lineare Transformation gemäß dem folgenden Ausdruck (1) ausgeführt:
  • Y = AN X AMT ... (1)
  • in dem X der Pixelblock 102 mit N Zeilen und M Spalten ist; Y der transformierte Koeffizient 104 ist; und AN und AM orthogonale Transformationsmatrizen in der entsprechenden N-ten und M- ten Ordnung sind.
  • Obwohl es verschiedene Verfahren der orthogonalen Transformation gibt, wird im allgemeinen eine diskrete Cosinus- Transformation (im folgenden als DCT bezeichnet) in Anbetracht der Codiereffizienz verwendet. Die Transformation der zweidimensionalen DCT ist durch den Ausdruck (2) gegeben und deren inverse Transformation ist durch einen Ausdruck (3) gegeben.
  • Zusätzlich bezeichnet X (j, k) die Elemente des Pixelblocks 102 und j und k bezeichnen die Positionen der Elemente. Y (u, v) stellen die Elemente des transformierten Koeffizienten 105 dar und u und v repräsentieren die Positionen der Elemente.
  • Die Verarbeitung zur Reduktion der Information wird von dem Koeffizientenselektor 105 und dem Quantisierer 107 ausgeführt. In den Koeffizentenselektor 105 wird ein Koeffizient auf Basis der Streuung der transformierten Koeffizienten 104 ausgewählt, um so den ausgewählten transformierten Koeffizienten 106 zu erhalten.
  • In einem solchen Transformationscodierverfahren, eine Technik, in der die Streuung der Koeffizienten mit einem festen Schwellenwert verglichen wird, um einen Koeffizienten größer als der Schwellenwert auszuwählen und die Koeffizienten kleiner als der Schwellenwert auf Null gesetzt werden, um die Kompressionseffizienz zu erhöhen, wird von William K. Pratt vorgeschlagen in "Digital Image Processing", Wiley Interscience, Seiten 678 - 699. Die Schwelle kann in diesem Falle aus den Statistiken der transformierten Koeffizienten einer Vielzahl von Bildern bestimmt werden. Zusätzlich ist eine Technik vorgeschlagen worden, in der die Schwelle aus den Statistiken der transformierten Koeffizienten für jedes Bild bestimmt wird. In dem Fall jedoch, in dem die Verteilung der transformierten Koeffizienten von diesen Statistiken abweicht, kann eine Verschlechterung in der Bildqualität auftreten.
  • In dem Quantisierer 107 werden die ausgewählten transformierten Koeffizienten quantisiert, um den quantisierten Koeffizienten 108 zu erhalten.
  • In der Verarbeitung zum Zuweisen des Codes in dem Codierer 109 wird ein Codewort dem quantisierten Koeffizienten 108 zugewiesen, um so die codierten Daten 110 zu bilden, die auf die Übertragungslinie 111 gegeben werden.
  • Durch jede der oben beschriebenen Verarbeitungen kann die Bildinformation durch die Transformationscodierverfahren codiert werden.
  • Da die Auswahl der Koeffizienten gleichmäßig bezüglich aller Pixelblöcke bestimmt wird, gibt es mit den oben beschriebenen Methoden jedoch das Problem, daß dieses Verfahren sich nicht an die Anderungen lokaler Art der Bilder anpassen kann.
  • Um dieses Problem zu lösen, wurde eine Technik in W.H. Chen et al.: "Adaptive Coding of Monochrome and Color Images, IEEE Transactions on Communications, Vol COM-25, Nr. 11, Seiten 1285 - 1292 (November 1977) vorgeschlagen, die eine Anpassung an jeden Block schafft. Bei dieser Technik werden die Bildblöcke zuerst in vier Klassen in Übereinstimmung mit der Größe der Wechselstromleistung in dem Block klassifiziert, und der Standard zur Auswahl eines Koeffizienten (Bitzuweisung) wird auf der Basis der für jede Klasse erzielten Streuung der Koeffizienten bestimmt.
  • Da die Klassifikation auf der Basis der relativen Größe der Wechselstromleistung innerhalb des Blockes bestimmt wird, selbst wenn die Wechselstromleistung in den Blöcken einander gleich ist, gibt es gemäß diesem Verfahren Unterschiede in der Verteilung der Koeffizienten aufgrund der Richtwirkung der Kanten und dergleichen. Mit diesem Verfahren jedoch, da die Koeffizienten der gleichen Positionen einfach in der gleichen Klasse ohne Beachtung der Unterschiede in der Verteilung der Koeffizienten ausgewählt werden, ist es unmöglich, die geeignetsten Koeffizienten zum Darstellen eines Eingangsbildes auszuwählen, so daß es unmöglich ist, ein Bild mit ausreichend hoher Qualität zu erzielen.
  • Angesichts der oben beschriebenen Probleme wurde eine Technik der Klassifizierung von Blöcken unter Verwendung eines Vektorquantisierverfahrens von Kato, Takegawa und Ohkubo vorgeschlagen: "Adaptives orthogonales Transformationscodierverfahren mit einer Klassifizierung", Transactions of the Institute of Electronics, Information and Communication Engineers (B), Vol J71-B, Nr. 1, Seiten 1 - 9, Januar 1988. Es wird dort berichtet, daß gemäß diesem Verfahren die Bildqualität und Leistung gegenüber dem in der oben beschriebenen Literatur von W. Chen et. al. offenbarten Verfahren durch Bewirken einer Klassifikation, die Größe und die Vorlage der Wechselstromleistung in den Blöcken in Betracht zieht, verbessert wurde.
  • In den oben beschriebenen adaptiven orthogonalen Transformationscodierverfahren unter Verwendung einer Klassifikation werden die als Vektoren verwendeten Koeffizienten auf untere Bereiche beschränkt, in denen die elektrische Leistung konzentriert ist, um eine große Berechnungsmenge zu reduzieren, die in der Vektorquantisierung anfällt. Aus diesem Grunde wird nicht beachtet, daß die Koeffizienten bis in hohe Bereiche verteilt sind, wie dies bei Pixelblöcken der Fall ist, die scharfe Ecken umfassen. Selbst falls zusätzlich ein Versuch gemacht wird, um eine Vektorquantisierung einschließlich der Koeffizienten in den hohen Bereichen zu bewirken, indem die Anzahl der Dimensionen der Vektoren vergrößert wird, passen die hochbereichigen Koeffizienten selten in eine spezifische Verteilung. Daher ist es unmöglich, einen Effekt der Klassifikation zu erwarten.
  • Die vorliegende Erfindung ist getätigt worden, um die oben beschriebenen Probleme zu überwinden, und es ist eine Aufgabe der vorliegenden Erfindung, die Qualität eines reproduzierten Bildes nicht nur hinsichtlich eines allgemeinen Bildes, in dem die elektrische Leistung in den niederbereichigen Koeffizienten konzentriert ist, sondern ebenfalls in einem Bild zu verbessern, in dem die elektrische Leistung in einem hohen Bereich konzentriert ist.
  • Um die vorerwähnte Aufgabe der vorliegenden Erfindung zu lösen, umfaßt eine Vorrichtung zum Codieren eines Bildsignales, in der das Bildsignal in Blöcke geformt wird, die einer orthogonalen Transformation unterzogen werden und ein transformierter Koeffizient codiert wird, ein Mittel zum Unterteilen des Bildsignales in Pixelblöcke, ein Mittel zum Ausführen einer zweidimensionalen orthogonalen Transformation bezüglich jeder der Pixelblöcke, ein Mittel zum Bestimmen des Verhältnisses der während der Codierens zu bewahrenden elektrischen Leistung in Übereinstimmung mit der Charakteristik jedes der Pixelblöcke, ein Bestimmungsmittel zum Bestimmen der Signifikanz von jedem der transformierten Koeffizienten in einer abnehmenden Reihenfolge der elektrischen Leistung, wobei die Bestimmung fortgesetzt wird, bis die Gesamtsumme der elektrischen Leistung der Wechselstromkoeffizienten, die als signifikant bestimmt wurden, das Verhältnis der elektrischen Leistung bezüglich der Gesamtsumme der gesamten elektrischen Leistung innerhalb des Blocks übersteigt, und ein Codiermittel zum Codieren eines Koeffizienten mit Null, der als nicht signifikant bestimmt wurde auf der Basis der Bestimmung.
  • Ferner kann die Vorrichtung wie folgt modifiziert werden. Eine Vorrichtung zum Codieren eines Bildsignals, in dem das Bildsignal in Blöcke geformt und einer orthogonalen Transformation unterzogen wird, und ein transformierter Koeffizient codiert wird, umfaßt ein Mittel zum Unterteilen des Bildsignals in Pixelblöcke, ein Mittel zum Ausführen einer zweidimensionalen orthogonalen Transformation bezüglich jeder der Pixelblöcke, ein Wellenformanalysemittel zum Vergleichen der Wellenform in jedem der Pixelblöcke mit einer Vielzahl von typischen Mustern zum Ausgeben einer Identifikationsinformation zum Identifizieren eines ähnlichsten typischen Musters, ein Speichermittel zum Speichern einer Vielzahl von Elementen von Maskeninformation, die die Signifikanz oder Insignifikanz jeder der transformierten Koeffizienten repräsentieren, die von dem Mittel zum Ausführen der zweidimensionalen orthogonalen Transformation erzielt werden, ein Maskenauswahlmittel zum Auswählen der Maskeninformation aus dem Speichermittel auf der Basis der Identifikationsinformation des Wellenformanalysemittels, ein Koeffizientenauswahlmittel zum Bestimmen der Signifikanz oder Insignifikanz der transformierten Koeffizienten unter Verwendung der Maskeninformation, die ausgewählt wurde, um die als insignifikant bestimmten transformierten Koeffizienten auf Null zu setzen und ein Codiermittel zum Codieren der transformierten Koeffizienten nach der Auswahl.
  • In der vorliegenden Erfindung wird, wenn ein Bildsignal codiert wird, die während des Codierens zu bewahrende elektrische Leistung bestimmt in Übereinstimmung mit den Charaktenstiken des Bildes. Die Koeffizienten nach der Konversion werden, nacheinanderfolgend ausgewählt beginnend mit demjenigen, der das größte Verhältnis der Leistungskonzentration aufweist, bis die zu bewahrende Leistung gesichert ist. Da ein Codieren nur für die so ausgewählten transformierten Koeffizienten durchgeführt wird, werden die Koeffizienten an den optimalen Positionen, die dem Inhalt des Bildes entsprechen, codiert.
  • Ferner, wenn ein Bilgisignal codiert wird, wird die Wellenform innerhalb eines Pixelblocks mit einer Vielzahl von typischen Mustern verglichen und Identifikationsinformation zum Identifizieren eines ähnlichsten typischen Musters wird ausgegeben. Eine Vielzahl von Elementen einer Maskeninformation zum Substituieren mit Null für jeden der transformierten Koeffizienten wird vorher in Übereinstimmung mit jedem typischen Muster vorbereitet. Während die transformierten Koeffizienten mit der Maskierung auf der Basis der Identifikationsinformation versehen werden, werden die Koeffizienten an den optimalen Positionen entsprechend dem Inhalt des Bildes codiert.
  • Die beigefügten Zeichnungen, die in der Beschreibung eingeschlossen und einen Teil von ihr bilden, illustrieren gegenwärtig bevorzugte Ausführungsformen der Erfindung, und dienen zusammen mit der oben gegebenen allgemeinen Beschreibung und der im folgenden gegebenen detaillierten Beschreibung der bevorzugten Ausführungsfqrmen dazu, die Prinzipien der Erfindung zu erklären. In den beigefügten Zeichnungen:
  • Fig. 1 ist ein Blockdiagramm einer konventionellen Codiervorrichtung;
  • Fig. 2 ist ein Blockdiagramm, das eine erste Ausführungsform der Codiervorrichtung gemäß der vorliegenden Erfindung zeigt;
  • Fig. 3 ist ein Flußdiagramm, das die Prozedur der Präparierung von Maskeninformation gemäß der vorliegenden Erfindung zeigt;
  • Fig. 4 ist ein erklärendes Diagramm, das das Ergebnis des Sortierens von Koeffizienteninformation darstellt;
  • Fig. 5 ist ein erklärendes Diagramm, das Beispiele einer Verteilung der Koeffizientenleistung und der Maskeninformation zeigt, die auf Basis einer Verteilung der Koeffizientenleistung bestimmt wird;
  • Fig. 6 ist ein erklärendes Diagramm, das den Betrieb des Auswählens von Koeffizienten in der vorliegenden Erfindung illustriert;
  • Fig. 7 ist ein Blockdiagramm, das eine zweite Ausführungsform der Codiervorrichtung gemäß der vorliegenden Erfindung zeigt;
  • Fig. 8 ist ein Blockdiagramm, das eine dritte Ausführungsform einer Codiervorrichtung gemäß der vorliegenden Erfindung zeigt;
  • Fig. 9 ist ein erklärendes Diagramm der Wellenformanalyse;
  • Fig. 10 ist ein Blockdiagramm des Wellenformanalysators;
  • Fig. 11 ist ein erklärendes Diagramm, das Beispiele der Verteilungen der Pixelwerte in Blöcken und Verteilungen der DCT-Koeffizienten zeigt;
  • Fig. 12 ist ein erklärendes Diagramm, das das Verhältnis zwischen einem Pixelblock und der Aktivität illustriert;
  • Fig. 13 ist ein erläuterndes Diagramm des Inhalts eines Maskenverzeichnisses;
  • Fig. 14 ist ein Flußdiagramm, das die Prozedur der Präparierung der Maskeninformation gemäß der vorliegenden Erfindung zeigt;
  • Fig. 15 ist ein erklärendes Diagramm, das das Ergebnis des Sortierens der Koeffizientenstreuungen zeigt; und
  • Fig. 16 ist ein erläuterndes Diagramm, das ein Beispiel einer Maskeninformation zeigt, die auf der Basis einer Verteilungscharakteristik der Koeffizienten bestimmt wird.
  • Fig. 2 ist ein Blockdiagramm, das eine erste Ausführungsform einer Codiervorrichtung gemäß der vorliegenden Erfindung darstellt. Es sei angemerkt, daß diejenigen Teile, die denen der konventionellen Vorrichtung entsprechen, die in Fig. 1 dargestellt ist, durch die gleichen Bezugszeichen bezeichnet werden.
  • Bezugszeichen 101 bezeichnet eine Blockvorrichtung; 103 einen Konverter; 105 einen Koeffizientenselektor; 107 einen Quantisierer; 109 einen Codierer; und 111 eine Übertragungsleitung. Zusätzlich bezeichnet Bezugszeichen 200 einen Aktivitätsberechner zum Berechnen der Auflösung, d.h. der Aktivität 201, innerhalb eines Pixelblockes 102; 202 eine Vorrichtung zum Bestimmen eines zu bewahrenden Leistungsverhältnisses 203 der Wechselstromleistung des Pixelblockes 102 auf der Basis der Aktivität 201; und 204 eine Vorrichtung zum Bestimmen einer Maske zum Ausgeben einer Maskeninformation 205, die als ein Standard zum Bestimmen der Auswahl der Koeffizienten in dem Koeffizientenselektor 105 dient durch die Verwendung der transformierten Koeffizienten 104 und der beizubehaltenden Leistungsrate 203 dient.
  • In dieser Ausführungsform wird zusätzlich zu drei Arten der Verarbeitung, d.h. der Transformation, der Informationsreduktion und der Codezuweisung, die konventionell ausgeführt werden, wie dies in der Fig. 1 dargestellt ist, eine adaptive Verarbeitung durchgeführt. Diese adaptive Verarbeitung wird parallel mit der Transformationsverarbeitung betrieben und realisiert eine adaptive Informationsreduktion, die an das Merkmal jedes Pixelblocks in der Informationsreduzierverarbeitung angepaßt ist, die nachfolgt.
  • Da die drei Arten der Verarbeitung, d.h. Transformation, Informationsreduktion und Codezuweisung, ähnlich denjenigen des in der Fig. 1 dargestellten Standes der Technik sind, wird deren Beschreibung ausgelassen werden und eine Beschreibung wird nur von der adaptiven Verarbeitung gegeben werden.
  • Die adaptive Verarbeitung besteht aus der Berechnung der Aktivität und der Analyse der Wellenform.
  • Die Aktivität ist ein Index, die die Auflösung eines Bildes anzeigt und die Varianz innerhalb eines Pixelblocks wird verwendet werden. Eine Aktivität kann aus dem folgenden Ausdruck bestimmt werden:
  • = Σ xi - m / N ... (5)
  • in dem xi ein Pixelwert innerhalb eines Blockes ist, m ein Mittelwert der Pixelwerte innerhalb des Blockes ist und N die Gesamtzahl der Pixel innerhalb des Blockes ist.
  • Diese Aktivität G wird von dem Aktivitätsrechner 200 bestimmt, der durch einen Abschnitt dargestellt ist, der von einem gestrichelten Rahmen in der Fig. 2 umrundet ist. In dem Aktivitätsrechner 200 bezeichnet Bezugszeichen 210 einen Mittelwertberechner zum Berechnen eines Mittelwertes 211 innerhalb eines Blockes auf der Basis jedes Pixelwertes des Pixelblockes 102; 212 einen Mittelwertseparator zum Berechnen der Differenz zwischen jedem Pixelwert des Pixelblocks 102 und dem Mittelwert 211 in dem Block und zum Ausgeben eines mittelwertseparierten Signals 213; und 214 ein Varianzberechner zum Berechnen der Aktivität 201 auf der Basis des mittelwertseparierten Signals 213.
  • In dem Varianzberechner 214 wird die Summe der Absolutwerte der mittelwertseparierten Signale 213, die von dem Mittelwertseparierer 212 ausgegeben werden, durch die Gesamtanzahl der Pixel in dem Block gemäß dem Ausdruck (5) dividiert und die Aktivität 201 wird ausgegeben.
  • In der Vorrichtung 202 zum Bestimmen der zu bewahrenden Leistungsrate wird die zu bewahrende Leistungsrate 203 bestimmt auf der Basis der in den Aktivitätsberechner 200 berechneten Aktivität 201. Die Leistungsbewahrungsrate 203 ist ein Verhältnis der Koeffizientenleistung, die nach der Selektion der Koef-fizienten in dem Koeffizientenselektor 105 bewahrt wurde, zur gesamten Koeffizientenleistung.
  • Die Leistungsbewahrungsrate 203 wird auf einen hohen Pegel hinsichtlich eines Blocks gesetzt&sub1; der eine große Aktivität zeigt, d.h. ein Block mit einer hohen Auflösung, während die Leistungsbewahrungsrate 203 auf einen niedrigen Pegel gesetzt wird bezüglich eines Blocks, der einen kleine Aktivität zeigt.
  • In dem Fall beispielsweise, in dem der Pixelblock 102 identische Werte für alle Pixel annimmt, wird die Aktivität 201 in dem Aktivitätsberechner 200 Null. Zu dieser Zeit werden gleichermaßen der transformierte Koeffizient 104, der ein Ausgangssignal des Konverters 103 ist, als auch alle Signalwerte der Wechselspannungskoeffizienten Null. Daher kann die Leistungsbewahrungsrate in dem Fall, in dem die Aktivität 201 Null ist, auf Null (%) gesetzt werden.
  • Als eine Technik zum Realisieren der Vorrichtung 202 zum Bestimmen der Leistungsbewahrungsrate kann die Leistungsbewahrungsrate 203 durch einen Vergleich mit einem Schwellenwert der Aktivität 201 bestimmt werden.
  • Unter der Annahme, daß die Aktivität ist, kann beispielsweise das Verhältnis zwischen den Schwellenwerten T&sub0;, T&sub1;, ..., TN-1 und den Leistungsbewahrungsraten R&sub0;, R&sub1;, ..., RN wie im folgenden bestimmt werden. In diesem Falle ist N ein Schwellenwert, der vorgegeben wird.
  • Wenn < T&sub0; ist, ist die Leistungsbewahrungsrate R&sub0;.
  • Wenn T0 &le; T&sub1;, beträgt die Leistungsbewahrungsrate R&sub1;.
  • Wenn TN-1 &le; ist, wird die Leistungsbewahrungsrate RN.
  • Die Prozedur zum Präparieren der Maskeninformation wird unter Bezug auf das in der Fig. 3 dargestellte Flußdiagramm beschrieben werden.
  • Die in die Maskenbestimmungsvorrichtung 204 eingegebenen transformierten Koeffizienten 105 werden in einer abnehmenden Reihenfolge der elektrischen Koeffizientenleistung sortiert, und Paare der entsprechenden Leistungswerte und Koeffizientenpositionen werden in Form einer Tabelle gespeichert, wie dies in Fig. 4 (Schritt 101) dargestellt ist. Im Falle einer zweidimensionalen orthogonalen Transformation achter Ordnung fallen die Koeffizienten in den Bereich von (0, 0) bis (7, 7), aber da (0, 0) ein Gleichspannungskoeffizient ist, wird er ausgeschlossen und 63 Speichergebiete äquivalent der Anzahl der Gesamtanzahl der Wechselspannungskoeffizienten werden präpariert. Die Inhalte der Speichergebiete können mittels eines Pointers angesprochen werden.
  • Vor den Start der Verarbeitung wird der Pointer auf ein vorderes Ende in der Tabelle gesetzt, d.h. ein Koeffizient mit einer maximalen Leistung in den transformierten Koeffizienten 104. Zusätzlich wird "0" für alle Elemente der Maskeninformation 205 (Schritt 102) eingestellt.
  • In einer Schleife in dem in der Fig. 3 dargestellten Flußdiagramm wird die Operation des Besetzens der Maskeninformation 205 mit "1" entsprechend der Koeffizientenposition in der Reihenfolge beginnend mit dem Koeffizienten mit der größten elektrischen Leistung (Schritt 105) ausgeführt. Gleichzeitig wird eine kumulative Gesamtsumme der Werte der elektrischen Koeffizientenleistung berechnet (Schritt 103) und die Verarbeitung wird an einem Zeitpunkt gestoppt, wenn das Verhältnis der kumulativen Werte der Leistung zur Gesamtwechselstromleistung die Leistungsbewahrungsrate 203 (Schritt 104) überschritten hat.
  • t)ie Figuren 5(A) bis 5(C) und 5(a) bis 5(c) zeigen Beispiele der Verhältnisse der entsprechenden Koeffizientenleistung, wenn die Gesamtwechselstromleistung auf 100 eingestellt wird, als auch Beispiele der Maskeninformation, die durch das Einstellen einer 80 %-igen Leistungsbewahrungsrate als eine Beendigungsbedingung präpariert wird. Die Figuren 5(A), 5(B) und 5(C) zeigen entsprechende elektrische Leistungskonzentrationsraten der entsprechenden Koeffizienten, die verschiedenen Bildblöcken entsprechen, und die unterstrichenen Abschnitte sind Koeffizientenpositionen, die 80 % der Leistungsbewahrungsrate erfüllen. Zusätzlich zeigen die Figuren 5(a), 5(b) und 5(c) Maskeninformation entsprechend den entsprechenden Figuren 5(A), 5(B) und 5(C), und wenn die Maskeninformation bei jeder unterstrichenen Position auf "1" eingestellt wird. Jedoch wird die Maskeninformation an der (0, 0)-Position, die einen Gleichstromkoeffizienten anzeigt, immer auf "1" gesetzt.
  • Als nächstes wird eine detaillierte Beschreibung der Verarbeitung der Informationsreduzierung gegeben.
  • In der in der Fig. 2 dargestellten Maskenbestimmungsvorrichtung 204 wird die Maskeninformation 205 auf der Basis der transformierten Koeffizienten 104 und der Leistungsbewahrungsrate 203 präpariert und wird an den Koeffizientenselektor 105 ausgegeben.
  • Unter Bezugnahme auf die Fig. 6 wird eine Beschreibung einer Skizze des Betriebs der Auswahl der Koeffizienten in den Koeffizientenselektor 105 gegeben werden.
  • Die Maskeninformation 205 ist eine Matrix, die die gleiche Größe wie der transformierte Koeffizient 104 hat, und jedes Element umfaßt binäre Information mit "1" oder "0". Es sei angemerkt, daß die in der Fig. 6 dargestellte Maskeninformation 205 der in der Fig. 5(a) dargestellten Maskeninformation entspricht. Die Information "1" und "0", die jedes Element bilden, dienen als Information, die die Auswahl der Koeffizienten in dem Koeffizientenselektor 105 anzeigt. Die Koeffizienten, die nicht ausgewählt wurden, werden zwingend auf Null gesetzt. Das Ergebnis der Selektion wird als der selektierte transformierte Koeffizient 106 ausgegeben. Es sei angemerkt, daß in den transformierten Koeffizienten 104, die in der Fig. 6 dargestellt sind, diejenigen, die mit "o" markiert sind, Koeffizienten ungleich Null zeigen, während diejenigen, die mit "x" markiert sind, Koeffizienten gleich Null zeigen.
  • Die Verarbeitung zur Informationsreduzierung durch den Quantisierer 107 und die Codezuweisungsverarbeitung durch den Codierer 109 sind gleich denen der konventionellen Vorrichtung.
  • Unter Bezug auf die Fig. 7 wird eine Beschreibung einer zweiten Ausführungsform der vorliegenden Erfindung gegeben werden. Die in der Fig. 7 dargestellt Ausführungsform ist so angeordnet, daß die Positionen des Koeffizientenselektors und des Quantisierers in dem Blockdiagramm der in der Fig. 2 dargestellten Äusführungsform vertauscht sind.
  • In der gleichen Weise wie in der in der Fig. 2 dargestellten ersten Ausführungsform umfaßt die in der Fig. 7 dargestellte zweite Ausführungsform vier Prozesse der Verarbeitung einschließlich der Transformation, Informationsreduktion, Codezuweisung und Adaption, aber da der Betrieb der adaptiven Verarbeitung davon sich unterscheidet, wird hier nur der Betrieb der adaptiven Verarbeitung beschrieben werden.
  • Die von dem Konverter 103 erhaltenen transformierten Koeffizienten 104 werden mit einer gleichförmigen Schrittweite bezüglich aller Wechselspannungskoeffizienten in dem Quantisierer 107 quantisiert und die quantisierten Koeffizienten 108 werden erzielt. Die quantisierten Koeffizienten 108 werden in den Koeffizientenselektor 105 eingegeben und werden ebenfalls in die Vorrichtung 204 zum Bestimmen der Maske gegeben. In der Maskenbestimmungsvorrichtung 204 werden unter Verwendung der quantisierten Koeffizienten 108, deren Genauigkeit niedriger ist als diejenige der transformierten Koeffizienten 104, der Umfang der Berechnung zur Zeit des Sortierens der transformierten Koeffizienten startend mit demjenigen, der die größte Koeffizientenleistung hat, reduziert. Zur gleichen Zeit kann das Speichergebiet zum Speichern der sortierten Resultate ebenfalls reduziert werden.
  • Es sei angemerkt, daß in den oben beschriebenen Ausführungsformen, während die Aktivität, d.h. die Varianz erzielt wird vor der Transformation der Bildblöcke, eine Modifikation möglich ist durch das Schaffen eines Mittels zum Berechnen der Streuung innerhalb eines Blockes der transformierten Koeffizienten nach der orthogonalen Transformation, um die Leistungsbewahrungsrate auf der Basis der berechneten Resultate zu bestimmen. Falls jedoch die Gesamtverarbeitungszeit in Betracht gezogen wird, ist es, da die Transformationsverarbeitung und die \[erarbeitung zum Bestimmen der Varianz einer parallelen Verarbeitung unterzogen werden kann, wünschenswert die Variation vor der Transformation der Bildblöcke zu berechnen.
  • Fig. 8 ist ein Blockdiagramm, das eine dritte Ausführungsform einer Codiervorrichtung gemäß der vorliegenden Erfindung zeigt. Es sei angemerkt, daß Abschnitte, die denjenigen in den Figuren 1 und 2 dargestellten entsprechen, durch die gleichen Bezugszeichen bezeichnet werden.
  • Bezugszeichen 101 bezeichnet eine Blockvorrichtung; 103 einen Konverter; 105 einen Koeffizientenselektor; 107 einen Quantisierer; 109 einen Codierer; und 111 eine Übertragungsleitung. Zusätzlich bezeichnet Bezugszeichen 210 einen Mittelwertberechner zum Berechnen eines Mittelwertes 211 aus einem Pixelblock 102, 212 einen Mittelwertseparierer zum Subtrahieren des Mittelwertes 211 von jedem Pixelwert des Pixelblocks 102 und zum Ausgeben eines mittelwertseparierten Signals 213; 214 einen Varianzberechner zum Berechnen einer Varianz in einem Block auf der Basis des mittelwertseparierten Signals 213 und zum Ausgeben desselben als eine Aktivität 215; 206 einen Wellenformanalysierer zum Analysieren einer Signalwellenform in einem Block auf der Basis des mittelwertseparierten Signals 213 und zum Ausgeben derselben als Wellenforminformation 207; und 208 einen Maskenselektor zum Selektieren einer Maskeninformation 210 aus einem Maskenverzeichnis 209 auf der Basis der Aktivität 210 und der Wellenforminformation 207. Die ausgewählte Maskeninformation 210 wird in den Koeffizientenselektor 105 eingegeben. Es sei angemerkt, daß der Mittelwertberechner 210, der Mittelwertseparierer 212 und der Varianzberechner 214 einen Aktivitätsberechner 200 bilden.
  • In dieser Ausführungsform wird eine adaptive Verarbeitung zusätzlich zu den drei Arten der Verarbeitungen, d.h. der Transformation der Informationsreduktion und der Codezuweisung, die konventionellerweise ausgeführt werden, ausgeführt, wie dies in der Fig. 1 dargestellt ist. Diese adaptive Verarbeitung wird parallel mit der Transformationsverarbeitung ausgeführt und realisiert eine adaptive Informationsreduktion, die an das Merkmal jedes Pixelblocks in der nachfolgenden Informationsreduzierverarbeitung angepaßt ist.
  • Da die drei Arten der Verarbeitung, d.h. Transformation, Information, Reduktion und Codezuweisung, gleich denjenigen in den Figuren 1 und 2 dargestellten sind, wird nur eine Beschreibung der adaptiven Verarbeitung gegeben werden.
  • Die adaptive Verarbeitung beinhaltet die Berechnung der Aktivität und die Analyse der Wellenform.
  • Die Aktivität ist ein Index, der die Auflösung eines Bildes anzeigt, und die Varianz innerhalb eines Pixelblocks wird verwendet werden. Eine Aktivität kann aus dem oben beschriebenen Ausdruck (5) abgeleitet werden.
  • Unter Bezugnahme auf Fig. 8 wird die Berechnung der Aktivität beschrieben werden. Der Mittelwert 211 des Pixelblocks 102, der m in dem Ausdruck (5) entspricht, wird in dem Mittelwertberechner 210 berechnet. In dem Mittelwertseparator 212 wird das mittelwertseparierte Signal 213 generiert, indem der Wert des Mittelwertes 211 von jedem Pixelwert in dem Pixelblock 102 subtrahiert wird. In dem Varianzberechner 214 wird die Summe der Absolutwerte der mittelwertseparierten Signale 213 gemäß dem Ausdruck (5) erzeugt und diese Summe der Absolutwerte dann durch die Gesamtanzahl der Pixel in dem Block dividiert, um die Aktivität 215 zu berechnen und auszugeben.
  • Mit nunmehriger Bezugnahme auf die Fig. 9 wird eine Beschreibung der Wellenformanalyse gegeben werden. Musterübereinstimmung wird als Technik zum Bestimmen der Ahnlichkeit der Wellenformen verwendet. In dieser Technik werden jede der Vielzahl der Grundwellenformen y1, y2, ..., yi, ..., yk, die in einen Wellenformverzeichnis vorbereitet sind, als auch ein eingegebener Bildblock als Sektoren betrachtet, und eine Wellenform des geringsten Abstandes wird durch die Bestimmung der zwei Vektoren ausgewählt, so daß ein Bezeichner i der ausgewählten Wellenform ausgegeben wird.
  • Als eine Technik für eine derartige Wellenformanalyse eines Bildsignals ist in der anhängigen US-Patentanmeldung Serien Nr. 07/903,284, die am 24. Juni 1992 eingereicht wurde (US-A- 5500907), eine Methode vorgeschlagen worden, die für den gleichen Anmelder eingereicht wurde. Es sei angemerkt, daß der Grund zum Ausführen einer Wellenformanalyse in dieser Weise derjenige ist, daß, um das Bildsignal adaptiv zu codieren, es effektiv ist, die Wellenform des Bildsignales vor dem Codieren zu analysieren und die Codierparameter durch Verwendung der Resultate dieser Analyse zu steuern.
  • Der Wellenformanalysator 206 wird im Detail unter Bezugnahme auf Fig. 10 beschrieben werden. In Fig. 10 bezeichnet Bezugszeichen 216 ein mittelwertsepariertes Signal; 310 einen Wellenformvergleicher; und 311 ein Wellenformverzeichnis, in dem eine Vielzahl von Wellenformen registriert ist. Zusätzlich bezeichnet Bezugszeichen 207 eine Wellenforminformation zum Identifizieren der registrierten Wellenformen.
  • Der Betrieb des Wellenformanalysators 206 wird im folgenden beschrieben werden. In dem Wellenformvergleicher 310 wird eine Bestimmung des Abstandes zwischen dem eingegebenen mittelwertseparierten Signal 216 und der in dem Wellenformverzeichnis 311 registrierten Vielzahl der Wellenformen erzeugt. Die in dem Wellenformverzeichnis 311 registrierte Vielzahl der Wellenformen sind entsprechend mit Bezeichnern zu ihrer Identifikation versehen. Als Ergebnis der Bestimmung des Abstandes wird die Information zum Identifizieren der Basiswellenform als die Wellenforminformation 207 ausgegeben, die als die nächste bestimmt wurde.
  • Die Figuren 11(A), 11(B) und 11(C) zeigen Verteilungen der Pixelwerte in entsprechenden 8 x 8 Pixelblöcken, in denen die Verteilungen der Pixelwerte in den Blöcken den Fällen einer horizontalen Gradation, einer vertikalen Gradation und einer geneigten Kante entsprechen. Entsprechend zeigen die Figuren 11(a), 11(b) und 11(c) Koeffizientenmatrizen in Fällen, in denen die DCT bezüglich jedes Pixelblocks ausgeführt wurde. Wie aus den Zeichnungen hervorgeht, entsprechen spezifische Koeffizientenverteilungen den Verteilungen der Pixelwerte in den eingegebenen Bildblöcken. Diese Tatsache zeigt, daß die Form der Verteilung der Koeffizienten aus der Signalwellenform des eingegebenen Pixelblocks geschätzt werden kann.
  • Beispielsweise angenommen, daß die Wellenform des Pixelblocks eine horizontale Gradation hat, wie dies in der Fig. 11(A) dargestellt ist, sind die Koeffizienten in der ersten Zeile der Koeffizientenmatrix ausreichend als zu codierende Koeffizienten nach der Transformation, wie dies in der Fig. 11(a) dargestellt ist. Zusätzlich, im Falle der Wellenform mit einer vertikalen Gradation, wie dies in der Fig. 11(B) dargestellt ist, sind die Koeffizienten in der ersten Spalte der Koeffizientenmatrix ausreichend als zu codierende Koeffizienten nach der Transformation, wie dies in der Fig. 11(b) dargestellt ist. Andererseits, in dem Fall der Wellenform mit einer geneigten Kante, wie dies in der Fig. 11(C) dargestellt ist, müssen die Koeffizienten in einem extensiven Bereich in der Umgebung einer Diagonalen der Koeffizientenmatrix einer Codierung unterzogen werden, wie dies in der Fig. 11(b) dargestellt ist.
  • Daher, falls die Auswahl der Koeffizienten in Übereinstimmung mit der geschätzten Form der Verteilung der Koeffizienten gesteuert wird, ist es möglich, die Verschlechterung der Bildqualität in der Umgebung der Kante zu vermeiden, was das Problem in dem konventionellen Transformationscodierverfahren gewesen ist. Mit anderen Worten, da der Zustand der Verteilung der Koeffizienten aus dem Ergebnis der Wellenformanalyse geschätzt werden kann, können die Koeffizienten effizient auf der Basis der geschätzten Ergebnisse selektiert werden.
  • In ähnlicher Weise kann die Aktivität, die die Auflösung innerhalb des Pixelblocks anzeigt, als Index zum Bestimmen des Selektionsbereichs der Koeffizienten verwendet werden.
  • Wie dies in den Figuren 12(a) und 12(b) dargestellt ist, ist ein Block, der eine kleine Aktivität (siehe Fig. 12(b)) hat, ein Block mit einem flachen Muster und nimmt eine geringen Verteilung der Pixel an. Andererseits ist ein Block mit einer großen Aktivität (siehe Fig. 12(a)) ein Block mit einem komplizierten Muster und eine feine Pixelverteilung einschließlich einer Kante und dergleichen. In dem Pixelblock, der eine kleine Aktivität zeigt, ist die Korrelation zwischen den Pixeln hoch und die elektrische Leistung ist auf Koeffizienten in einem niedrigeren Bereich nach der Transformation konzentriert, so daß es ausreichend ist, wenn diese ausgewählt werden. Zusätzlich in dem Pixelblock, der eine große Aktivität zeigt, ist die elektrische Koeffizientenleistung weit innerhalb der Koeffizientenmatrix aufgrund des Effekts der Kante und dergleichen gestreut, und es ist notwendig, den Bereich der Auswahl der codierten Koeffizienten breit zu setzen.
  • Ein Verfahren zum Auswählen der Codierkoeffizienten mittels der Masken wird im folgenden beschrieben werden.
  • Fig. 13 ist ein Diagramm, das den Inhalt des Maskenverzeichnisses 209 der Fig. 8 zeigt. Die ih dem Maskenverzeichnis registrierte Maskeninformation wird auf der Basis der Wellenforminformation und der Aktivität für jeden Block, die früher bestimmt wurden, ausgewählt. Ein Index wird aus der Aktivität durch geeignete Schwellwertverarbeitung bestimmt. Falls beispielsweise die Aktivität als a angenommen wird, kann der Bezug zwischen den Schwellenwerten T&sub0;, T&sub1;, ..., TN-1 und den Indizes R&sub0;, R&sub1;, ..., RN bestimmt werden, wie dies unten dargestellt ist. N ist ein Schwellenwert, der eingestellt wird, mit dem Ergebnis, daß die Aktivität als eine Klasse (N + 1) klassifiziert wird. Es sei angemerkt, daß die Schwellenwerte für jeden Punkt der Wellenforminformation eingestellt werden können.
  • Wenn < T&sub0; ist, beträgt der Index R&sub0;.
  • Wenn T&sub0; &le; &le; T&sub1; ist, beträgt der Index R&sub1;.
  • Wenn TN-1 &le; ist, beträgt der Index RN.
  • Die in dem Maskenverzeichnis 209 registrierte Maskeninformation muß vor der Codieroperation bestimmt werden, und die Anzahl der Punkte ist gleich zur Anzahl der Zustände der von der Wellenformanalyse klassifizierten Pixelblöcke und der Anzahl der Klassen der Aktivität.
  • Jedes Element der Maskeninformation wird in Übereinstimmung mit einer bestimmten Verteilung der Koeffizienten für jeden Zustand des oben erwähnten Pixelblocks bestimmt. Diese Prozedur wird im folgenden beschrieben werden.
  • Zuerst wird der Zustand des von dem Bild detektierten Pixelblocks auf der Basis der Wellenformanalyse und der Schwellenwertverarbeitung der Aktivität bestimmt, und die transformierten Koeffizienten für jeden Pixelblock werden für jeden Zustand klassifiziert.
  • Nachfolgend wird eine typische Verteilungscharakteristik der Koeffizienten für jedes Aggregat der transformierten Koeffizienten klassifiziert. Für die Verteilungscharakteristik ist es möglich, eine Koeffizientenvarianzmatrix zu verwenden, die durch kumulatives Summieren der absoluten Werte der Koeffizienten für jede Position innerhalb der transformierten Koeffizientenmatrix erzielt wird.
  • Unter nunmehriger Bezugnahme auf das in der Fig. 14 gezeigte Flußdiagramm wird eine Beschreibung der Prozedur zum Bestimmen der Maskeninformation auf der Basis der Koeffizientenvarianzmatrix gegeben.
  • Die Koeffizientenvarianzmatrizen der entsprechenden Aggregate sind in einer abnehmenden Reihenfolge der Varianzwerte sortiert und Paare der entsprechenden Varianzwerte und Koeffizientenpositionen sind in der Form einer Tabelle gespeichert, wie dies in der Fig. 15 (Schritt 301) dargestellt ist. In dem
  • Fall der zweidimensionalen orthogonalen Transformation achter Ordnung fallen die Positionskoeffizienten innerhalb des Bereichs von (0, 0) bis (7, 7), aber da (0, 0) eine Gleichstromkomponente ist, wird sie ausgenommen und 63 Speicherflächen, die in der Anzahl äquivalent zur Gesamtanzahl der Wechselspannungskoeffizienten sind, werden präpariert. Auf die Inhalte der Speichergebiete kann über einen Pointer Bezug genommen werden.
  • Vor dem Starten der Verarbeitung wird der Pointer auf ein vorderes Ende in der Tabelle gesetzt, d.h. ein maximaler Varianzwert in der Varianzmatrix. Zusätzlich werden alle Elemente der Maskeninformation (Schritt 302) auf "0" gesetzt.
  • In einer Schleife des in der Fig. 14 gezeigten Flußdiagramms wird die Operation des Belegens der Maskeninformation mit "1" in Übereinstimmung mit der Koeffizientenposition in der Reihenfolge beginnend mit dem Koeffizienten mit der größten Varianz (Schritt 305, 306) durchgeführt. Gleichzeitig wird eine kumulative Gesamtsumme der Varianzwerte berechnet (Schritt 303), und die Verarbeitung wird zu einem Zeitpunkt gestoppt, wenn das Verhältnis der kumulativen Werte der Varianz zu den Gesamtvarianzen einen vorbestimmten Schwellenwert (Schritt 304) überschritten hat. Zusätzlich wird angenommen, daß der gerade erwähnte vorbestimmte Schwellenwert separat unter Bezug auf die Wellenformanalyse und die Aktivität eingestellt werden kann.
  • Die Figuren 16(A) bis 16(C) und 16(a) bis 16(c) zeigen sowohl Beispiele der Verteilungen der Konzentrationsraten der elektrischen Leistung von DCT-Koeffizienten als auch Beispiele der Maskeninformation, die durch das Einstellen einer 80 %-igen Leistungsbewahrungsrate als eine Beendigungsbedingung präpariert wurde. Figuren 16(A), 16(B) und 16(C) zeigen entsprechende elektrische Leistungskonzentrationsraten der entsprechenden Koeffizienten entsprechend verschiedenen Bildblöcken, und die unterstrichenen Abschnitte sind Koeffizientenpositionen, die die 80 %-ige Leistungsbewahrungsrate erfüllen. Zusätzlich zeigen die Figuren 16(a), 16(b) und 16(c) Maskeninformation entsprechend den entsprechenden Figuren 16(A), 16(B) und 16(C), und die Maskeninformation bei jeder unterstrichenen Position wird auf "1" gesetzt. Jedoch wird die Maskeninformation an der "0, 0"-Position, die eine Gleichstromkomponente anzeigt, immer auf "1" gesetzt.
  • Während die so präparierte Maskeninformation in dem Maskenverzeichnis registriert wird, ist es während des Codierens möglich, eine Maske zum Bewirken einer optimalen Auswahl der Koeffizienten in Übereinstimmung mit den Ergebnissen der Wellenformanalysen und dem Ergebnis der Berechnung der Aktivität auszuwählen.
  • In der vorliegenden Erfindung ist es möglich, da die beizubehaltende elektrische Leistung transformiert wird in Übereinstimmung mit der Natur des Bildes und die transformierten Koeffizienten in Übereinstimmung mit der beibehaltenen Leistung ausgewählt werden, die Auswahl der transformierten Koeffizienten adaptiv unter Berücksichtigung der lokalen Natur eines Bildes ausgeführt werden kann , die Verschlechterung der Bildqualität zu unterdrücken, die auf das Vorhandensein von Kanten und dergleichen zurückzuführen ist.

Claims (7)

1. Vorrichtung zum Codieren eines Bildsignals, in der das Bildsignal in Blöcke unterteilt wird, die einer orthogonalen Transformation unterzogen werden, und ein transformierter Koeffizient codiert wird, die aufweist:
ein Mittel zum Unterteilen des Bildes in Pixelblöcke;
ein Mittel zum Ausführen einer zweidimensionalen orthogonalen Transformation hinsichtlich jedes Pixelblocks;
ein Mittel zum Bestimmen des Verhältnisses der während des Codierens zu konservierenden elektrischen Leistung in Übereinstimmung mit der Charakteristik jedes Pixelblocks;
ein Bestimmungsmittel zum Bestimmen der Signifikanz jedes transformierten Koeffizienten in einer abnehmenden Reihenfolge der elektrischen Leistung, wobei die Bestimmung fortgesetzt wird bis die Gesamtsumme der als signifikant bestimmten Wechselspannungskoeffizienten das Verhältnis der elektrischen Leistung bezüglich der Gesamtsumme der gesamten Wechselspannungsleistung innerhalb des Blocks übersteigt;
ein Codiermittel zum Codieren eines Koeffizienten als 0, der als nicht signifikant bestimmt wurde, auf der Basis der Bestimmung.
2. Vorrichtung zum Codieren eines Bildsignals nach Anspruch 1, worin das Bestimmungsmittel ein Mittel zum Berechnen einer inneren Blockvarianz des Pixelblocks umfaßt, wobei das Verhältnis der elektrischen Leistung auf der Basis der durch eine Berechnung bestimmten Varianz bestimmt wird.
3. Vorrichtung zum Codieren eines Bildsignals nach Anspruch 1, worin das Bestimmungsmittel die einer Quantisierung zu unterziehenden, als signifikant bestimmten transformierten Koeffizienten in einer abnehmenden Reihenfolge der elektrischen Leistung bestimmt.
4. Vorrichtung zum Codieren eines Bildsignals nach Anspruch 1, die ferner aufweist: ein Mittel zum Berechnen einer inneren Blockvarianz der transformierten, einer orthogonalen Transformation unterzogenen Koeffizienten, wobei das Verhältnis der elektrischen Leistung auf der Basis deren Berechnung bestimmt wird.
5. Vorrichtung zum Codieren eines Bildsignals, in der das Bildsignal in Blöcke unterteilt und einer orthogonalen Transformation unterzogen wird, und ein transformierter Koeffizient codiert wird, die aufweist:
ein Mittel zum Unterteilen des Bildes in Pixelblöcke;
ein Mittel zum Ausführen einer zweidimensionalen orthogonalen Transformation für jeden Pixelblock;
ein Wellenformanalysemittel zum Vergleichen der Wellenform in jedem der Pixelblöcke mit einer Vielzahl von typischen Mustern, um Identifikationsinformation zum Identifizieren eines ähnlichsten typischen Musters auszugeben;
ein Speichermittel zum Speichern einer Vielzahl von Punkten einer Maskeninformation, die die Signifikanz oder Nichtsignifikanz jeder der transformierten Koeffizienten repräsentiert, die durch das Mittel zum Ausführen einer zweidimensionalen orthogonalen Transformation erzielt werden;
ein Maskenauswahlmittel zum Auswählen der Maskeninformation aus dem Speichermittel auf der Basis der Identifikationsinformation des Wellenformanalysemittels;
ein Koeffizientenauswahlmittel zum Bestimmen der Signifikanz oder Nichtsignifikanz der transformierten Koeffizienten unter Verwendung der Maskeninformation, die die als nicht signifikant bestimmten Koeffizienten auf 0 setzt; und
ein Codiermittel zum Codieren der transformierten Koeffizienten nach der Auswahl.
6. Vorrichtung zum Codieren eines Bildsignals nach Anspruch 5, worin das Wellenformanalysemittel einen Musterabgleich ausführt, um die Wellenform in jedem der Pixelblöcke mit der Vielzahl der typischen Muster zu vergleichen.
7. Vorrichtung zum Codieren eines Bildsignals nach Anspruch 5, die ferner ein Mittel zum Berechnen der Aktivität in dem Pixelblock aufweist, wobei das Maskenauswahlmittel die Maskeninformation aus dem Speichermittel unter Verwendung der Identifikationsinformation und der Aktivität auswählt.
DE69225365T 1991-08-30 1992-08-27 Bildsignalkodierungsvorrichtung Expired - Fee Related DE69225365T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP3220593A JPH0563989A (ja) 1991-08-30 1991-08-30 画像信号の符号化装置
JP22059691A JP2664032B2 (ja) 1991-08-30 1991-08-30 画像信号の符号化装置

Publications (2)

Publication Number Publication Date
DE69225365D1 DE69225365D1 (de) 1998-06-10
DE69225365T2 true DE69225365T2 (de) 1998-11-19

Family

ID=26523792

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69225365T Expired - Fee Related DE69225365T2 (de) 1991-08-30 1992-08-27 Bildsignalkodierungsvorrichtung

Country Status (3)

Country Link
US (1) US5598484A (de)
EP (1) EP0530022B1 (de)
DE (1) DE69225365T2 (de)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592302A (en) * 1992-03-23 1997-01-07 Canon Kabushiki Kaisha Coding method for coding pixel blocks and apparatus therefor
JP3634419B2 (ja) * 1994-07-25 2005-03-30 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP2770137B2 (ja) * 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
KR0178195B1 (ko) * 1995-03-28 1999-05-01 배순훈 벡터 양자화 방식을 이용한 영상 신호 부호화 장치
US7426311B1 (en) * 1995-10-26 2008-09-16 Hyundai Electronics Industries Co. Ltd. Object-based coding and decoding apparatuses and methods for image signals
JP2836681B2 (ja) * 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
ES2281926T3 (es) * 1997-01-31 2007-10-01 Siemens Aktiengesellschaft Procedimiento y sistema para codificar y decodificar una imagen digitalizada.
EP0917362A1 (de) * 1997-11-12 1999-05-19 STMicroelectronics S.r.l. Makroblockvarianzscchätzung für MPEG2-Videocodierer
JP4344964B2 (ja) * 1999-06-01 2009-10-14 ソニー株式会社 画像処理装置および画像処理方法
WO2002056250A2 (en) * 2001-01-10 2002-07-18 Koninklijke Philips Electronics N.V. Method and system to encode a set of input values into a set of coefficients using a given algorithm
US6717988B2 (en) * 2001-01-11 2004-04-06 Koninklijke Philips Electronics N.V. Scalable MPEG-2 decoder
US7020672B2 (en) * 2001-03-30 2006-03-28 Koninklijke Philips Electronics, N.V. Reduced complexity IDCT decoding with graceful degradation
KR20030012890A (ko) * 2001-04-20 2003-02-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 화상을 개선하는 화상 처리 장치 및 방법과 화상 처리장치를 포함하는 화상 디스플레이 장치
US6985635B2 (en) * 2002-04-22 2006-01-10 Koninklijke Philips Electronics N.V. System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding
US7054497B2 (en) * 2002-06-14 2006-05-30 Koninklijke Philips Electronics N.V. Method and system for optimizing image sharpness during coding and image enhancement
KR100922941B1 (ko) * 2002-11-04 2009-10-22 삼성전자주식회사 에너지에 기반한 적응적인 이산코사인 변환/역이산코사인변환 장치 및 방법
KR100645636B1 (ko) * 2004-12-09 2006-11-15 삼성전기주식회사 Dct 계수를 이용한 카메라의 자동초점조절장치 및 그방법
JP5220420B2 (ja) * 2005-01-19 2013-06-26 オプトポ インコーポレイテッド ディー/ビー/エイ センティス コーポレイション 静的マルチモードマルチプレックス分光法のための静的2次元符号化アパーチャ
US20090028239A1 (en) * 2005-05-03 2009-01-29 Bernhard Schuur Moving picture encoding method, moving picture decoding method and apparatuses using the methods
EP1768416A1 (de) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Frequenzselektive Videocomprimierung und -quantisierung
EP1768415A1 (de) * 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive Scanreihenfolge der DCT-Koeffizienten und Übertragung dieser Reihenfolge
JP3895357B2 (ja) * 2005-06-21 2007-03-22 日東光学株式会社 信号処理装置
US8437563B2 (en) * 2007-04-04 2013-05-07 Telefonaktiebolaget L M Ericsson (Publ) Vector-based image processing
WO2016074746A1 (en) 2014-11-14 2016-05-19 Huawei Technologies Co., Ltd. Systems and methods for mask based processing of a block of a digital image
CN108293125B (zh) * 2014-11-14 2020-08-07 华为技术有限公司 一种数字图像处理系统和方法
WO2016074745A1 (en) * 2014-11-14 2016-05-19 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797945A (en) * 1985-12-13 1989-01-10 Canon Kabushiki Kaisha Image data coding apparatus
EP0260721B1 (de) * 1986-09-25 1993-12-01 Nec Corporation Verfahren und Apparat zur Kodierung von Bewegtbildsignalen
US5162923A (en) * 1988-02-22 1992-11-10 Canon Kabushiki Kaisha Method and apparatus for encoding frequency components of image information
US5170264A (en) * 1988-12-10 1992-12-08 Fuji Photo Film Co., Ltd. Compression coding device and expansion decoding device for a picture signal
US5051840A (en) * 1988-12-14 1991-09-24 Fuji Photo Film Co., Ltd. Device for coding a picture signal by compression
US5121216A (en) * 1989-07-19 1992-06-09 Bell Communications Research Adaptive transform coding of still images
US5268755A (en) * 1991-02-21 1993-12-07 Matsushita Electric Industrial Co., Ltd. Orthogonal transformation encoder

Also Published As

Publication number Publication date
DE69225365D1 (de) 1998-06-10
EP0530022B1 (de) 1998-05-06
EP0530022A2 (de) 1993-03-03
US5598484A (en) 1997-01-28
EP0530022A3 (de) 1995-03-15

Similar Documents

Publication Publication Date Title
DE69225365T2 (de) Bildsignalkodierungsvorrichtung
DE69324743T2 (de) Vorrichtung und Verfahren zur Bildsignalkodierung
DE68927082T2 (de) Verfahren und Vorrichtung für die Bilddatenkomprimierung
DE69127420T2 (de) Kodierungsgerät
DE69225859T2 (de) Orthogonaltransformationskodierer
EP0368139B1 (de) Verfahren zur Codierung von Restfehlerbildern
DE69222844T2 (de) Verfahren und Gerät zur Bildkompression für Dokumente
DE69322713T2 (de) Vorrichtung zur orthogonalen Transformationskodierung und -dekodierung
DE69032177T2 (de) Kodierungsgerät
DE69326990T2 (de) Kodierungssystem und -verfahren
DE69213271T2 (de) Kodierung von Videosignalen
DE69227726T2 (de) Bildverarbeitungsgerät und -Verfahren
DE3854846T2 (de) Kodierung eines Bildsignals mit Berücksichtigung des Kontrasts in jedem Bild und Dekodierung analog zur Kodierung
DE69411804T2 (de) Umgekehrte Halbtonrasterung durch lineare Filterung und statistische Glättung
DE4103229C2 (de)
DE69517283T2 (de) Bildsignalkodierungsvorrichtung die zwischen variabler Längenkodierung und fester Längenkodierung wechselt
DE69126512T2 (de) Bildcodierungsgerät mit Optimierung der erzeugten Codemenge
DE69720559T2 (de) Methode zur Bildkodierung mit Kodes variabler Länge
DE69031198T2 (de) Einrichtung zur orthogonalen Transformationskodierung
DE3750853T2 (de) Verfahren zur Bildsignalkodierung mittels Orthogonal-Transformation.
DE3851173T2 (de) Verfahren und Gerät zur Erkennung von Halbtonbildmustern.
DE69209540T2 (de) Bildverarbeitungsgerät
EP0283715B1 (de) Verfahren zur Codierung von Bildsignalen
DE69519801T2 (de) Videokompressionsverfahren
DE19609859C1 (de) Verfahren zur Bildung einer Bild-Transformationsmatrix für ein beliebig geformtes Bildsegment eines digitalen Bildes, durch einen Rechner

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee