[go: up one dir, main page]

DE69220118T2 - Bildbinarisierungssystem - Google Patents

Bildbinarisierungssystem

Info

Publication number
DE69220118T2
DE69220118T2 DE69220118T DE69220118T DE69220118T2 DE 69220118 T2 DE69220118 T2 DE 69220118T2 DE 69220118 T DE69220118 T DE 69220118T DE 69220118 T DE69220118 T DE 69220118T DE 69220118 T2 DE69220118 T2 DE 69220118T2
Authority
DE
Germany
Prior art keywords
document
image
binarization
data
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69220118T
Other languages
English (en)
Other versions
DE69220118D1 (de
Inventor
Yoshinori Takizawa
Naoko Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Application granted granted Critical
Publication of DE69220118D1 publication Critical patent/DE69220118D1/de
Publication of DE69220118T2 publication Critical patent/DE69220118T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)

Description

    Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Bildbinarisierungssystem, insbesondere auf ein Bildbinarisierungssystem, welches ein Dokument scant bzw. abtastet, die abgetasteten Signale mit einem Schwellenwert vergleicht und die Signale entsprechend binarisiert.
  • Beschreibung des Standes der Technik
  • Optische Buchstabenlesevorrichtungen (OCRs = optical character readers) und optische Zeichenleser (OMRs = optical mark readers) sind zwei Bauarten von Systemen, die eine Bildinformation binarisieren und verarbeiten, und zwar an einer speziellen Stelle auf einem Dokument in einer zufälligen Position innerhalb eines zweidimensionalen Bildrahmens bzw. einer zweidimensionalen Bildaufnahme (frame). Während es verschiedene Verfahren zur Ausführung der Binarisierung gibt, ist die grundlegende Konfiguration von solchen Systemen wie in Fig. 1 gezeigt. Mit Bezug auf die Zeichnungen weist die Vorrichtung Bildaufnahmemittel auf, wie beispielsweise einen Scanner bzw. eine Abtastvorrichtung 10, einen Verstärker 12 zur Verstärkung der abgetasteten bzw. gescanten Signale, einen Analog/Digital- bzw. A/D-Wandler 13, um die digitalisierten Signale zu binarisieren, einen Komparator bzw. eine Vergleichsvorrichtung 14 zur Digitalisierung der binarisierten Signale und eine Schwelleneinstellschaltung 15, die verwendet wird, um den Schwellenwert einzustellen, mit dem die digitalisierten Signale verglichen werden.
  • Der Scanner bzw. die Abtastvorrichtung 10 ist schematisch in Fig. 1 und den anderen Figuren veranschaulicht und es sei erwähnt, daß er von links nach rechts und/oder von rechts nach links horizontal über den zweidimensionalen Bildrahmen bzw. die zweidimensionale Bildeinzelaufnahme (frame) 11 läuft, wenn die Aufnahme 11 und das Dokument 17 vertikal über den Scanner bzw. die Abtastvorrichtung vorgeschoben werden, wie beispielsweise in den gleichfalls eigenen US-Patenten US-A-4 796 962 und US-A-4 921 320 gelehrt. Die Bildaufnahme bzw. das Einzelbild 11 kann eine Druckplatte oder Trommel mit schwarzem Hintergrund aufweisen, und das Dokument 17 kann in der Praxis in gewisser Weise geneigt sein mit Bezug auf die nominalen horizontalen und vertikalen Achsen der Abtastvorrichtung 10 und des Rahmens bzw. der Aufnahme 11. Typischerweise müssen abzutastende Dokumente hellere Hintergründe besitzen oder anders gefärbt sein als der Rahmen 11 mit schwarzem Hintergrund.
  • Die Schwelleneinstellschaltung 15 erzeugt den Schwellenwert, der verwendet wird, um die Mehrpegelbildsignale in binäre Schwarz- Weiß- Signale umzuwandeln. Dies kann unter Verwendung verschiedener Verfahren durchgeführt werden. Das einfachste ist, daß Festschwellenwertverfahren, bei dem die digitalisierte Größe des gescanten bzw. abgetasteten Bildsignals mit einem vorbestimmten Referenzwert verglichen wird. Ein fortschrittlicheres Verfahren sieht die Verwendung einer speziellen Region des Bildbinarisierungsziels bzw. der Bildbinarisierungstarget vor, um einen geeignet festgelegten Schwellenwert zu berechnen.
  • Ein Nachteil bei solchen Systemen ist, daß, wenn es Veränderungen der Dokumentenbeleuchtungsintensität, eine Ungleichförmigkeit in der Dichte der Dokumentbilder oder farbige Muster im Hintergrund gibt, der Schwellenwert nicht adäquat zwischen dem Dichtepegel des Zielbildes und dem Hintergrunddichtepegel unterscheiden kann.
  • Ein Binarisierungsverfahren, welches verwendet wird, um dieses Problem zu lösen, sieht die Anwendung eines veränderlichen bzw. schwimmenden Schwellenwertes vor, der basierend auf den durchschnittlichen Dichtepegeln der Pixel um das interessante Pixel bzw. den interessanten Bildpunkt herum basiert, wodurch es ermöglicht wird, daß die Konturen von verwischten Bildern oder Bildern mit niedrigem Kontrast genauer wiedergegeben werden können. Während es für eine genauere Wiedergabe von Halbtonbildregionen im inneren Teil eines Dokumentes effektiv bzw. wirksam ist, gibt dieses Verfahren auch irgendwelche Flecken, eine Schattierung bzw. Färbung und ähnliches um die Kanten des Dokumentes herum wieder, was die Kanten ausgefranst bzw. ungleichmäßig erscheinen läßt, anstelle gerade wie im ursprünglichen Dokument. Dies stellt ein Problem dar, wenn ein binarisiertes Bild einer weiteren Verarbeitung unterlaufen soll, wie beispielsweise eine optische Zeichenerkennung, bei der es notwendig ist, die absolute Position der Kanten des betreffenden Dokumentenbildes zu kennen.
  • Diese Probleme werden nun speziell erklärt werden. Fig. 2 zeigt ein Beispiel eines binarisierten Target- bzw. Zielbildes 16 auf einem Hintergrund 17. Teile der Dokumentenkante weisen fleckige Teile 18, Schattierungen bzw. Einfärbungen 20 und farbige Muster 22 auf, und zusätzlich gibt es gewisse Verwischungen bzw. Ungenauigkeiten 24 des Zielbildes 16. Wenn dies von dem herkömmlichen in Fig. 1 gezeigten Bildbinarisierungssystem binarisiert wird, welches einen festen Schwellenwert für die Binarisierung verwendet, erzeugt es die Art von Ergebnis, die in Fig. 3 gezeigt ist, was zeigt, daß die befleckten und schattierten Teile 18, 20 und die verwischten Teile 24 verhindern, daß das Zielbild 16 genau wiedergegeben wird.
  • Fig. 4 zeigt das Ergebnis der Anwendung des herkömmlichen Bildbinarisierungssystems der Fig. 1 und einer veränderlichen bzw. schwimmenden Schwelleneinstellung, die dem durchschnittlichen Dichtepegel der Pixel bzw. Bildpunkte entspricht, die die interessanten Bildpixel umgeben. Während die Konturen des Bildes 16 dadurch mit besserer Genauigkeit wiedergegeben werden können, ist ein Nachteil, daß befleckte und schattierte Teile 18, 20 und ähnliches genauso genau wiedergegeben werden, was eine Dokumentenkantenlinie zur Folge hat, die anstatt gerade und sauber, ungerade oder sogar teilweise mit fehlenden Teilen versehen ist.
  • Mit Bezug auf Hochgeschwindigkeits-OCR- und OMR-Systeme besteht die Anforderung für einen qualitativ hochwertigen Druck auf qualitativ hochwertigem Papier, um solche Binarisierungsprobleme auszuschließen, und entsprechende JIS-Standards bestehen. Jedoch kann auf gewöhlichem Papier geschriebener Text oder die Art von beflecktem Text, der durch eine zweite Kopie, insbesondere eine Kohlenstoff- bzw. Tonerkopie erzeugt wird, oder Dokumente mit farbigen Teilen, oder mit einem Text, der keinen ausreichenden Kontrast für eine klare Darstellung besitzt, nicht gelesen werden. Darüber hinaus ist ein Problem bei der Beschleunigung von Vorgängen durch Zuführen von Mehrfachbildspeicherbänken, daß dies die Betriebskomplexitität des Systems steigert.
  • Es sei weiter hingewiesen auf US-A-4 220 972, die ein System zur automatischen Schwellenwertbildung von Videodaten offenbart, um interessante Objekte von Abbildungen mit sowohl hohem als auch niedrigem Kontrast zu detektieren. Eine adaptive Echtzeit-Bildintervalextraktionsvorrichtung extrahiert die Kanten eines Objektes und erzeugt gleichzeitig ein Helligkeitssignal für eine größere Intensität als eine gegebene Schwelle. Ein Kantenfilter bestimmt die Kantenintensitätsgröße, die zwischen den aufeinanderfolgenden Bildelementen oder Pixeln in der Scanbzw. Abtastlinie der Videodaten assoziiert ist. Eine Kantenschwelle wird automatisch aus der durchschnittlichen Kantenintensität jeder Abtastlinie bzw. -zeile der Daten bestimmt. Wenn die Datenkante größer wird als die Kantenschwelle, wird eine logische Kantenausgangsgröße erzeugt. In derselben Weise werden die Daten auch durch einen Helligkeitsfilter geleitet, der Daten über einer gegebenen Hintergrundschwelle betont. Der Hintergrund und die Schwelle werden auf eine Basis von Zeile zu Zeile bzw. Linie zu Linie aktualisiert. Dies erzeugt ein logisches Signal, wenn die Intensität über der automatisch bestimmten Schwelle liegt.
  • Gemäß der vorliegenden Erfindung sind ein Bildbinarisierungsystem und ein Bildbinarisierungsverfahren nach den Ansprüchen 1 bzw. 5 vorgesehen. Bevorzugte Ausführungsbeispiele der Erfindung sind in den abhängigen Ansprüchen offenbart.
  • Zusammenfassung der Erfindung
  • Ein Ziel der Erfindung ist es daher, ein Bildbinarisierungssystem vorzusehen, welches genau ein Zieldokumentbild wiedergeben kann, welches verwischte Konturen oder einen niedrigen Dichtepegel besitzt, und welches auch Flecken, Muster, ungleichförmige Beleuchtungseffekte und ähnliches um die Kantenteile des Dokumentes herum ignorieren kann, während es gleichzeitig leicht und genau die wahren Kanten des Dokumentes detektieren kann. Dieses System macht es möglich, Dokumente von normal gedruckter Qualität zu lesen, ohne spezielles, qualitativ hochwertiges Papier zu verwenden, und ermöglicht auch, daß eine kontinuierliche Hochgeschwindigkeits-Bildverarbeitung mit einem Minimum an Speicherkapazität implementiert bzw. durchgeführt wird.
  • Dieses Ziel wird durch ein Bildbinarisierungssystem nach Anspruch 1 erreicht. Ein solches System scant bzw. tastet ein Dokument ab, welches in einer willkürlichen Position innerhalb eines zwei-dimensionalen Bildrahmens bzw. einer Bildaufnahme auf einem schwarzen Hintergrund gelegen ist, und wandelt die abgetasteten digitalisierten Multipegelbildsignale in Schwarz- Weiß- Binärsignale um, wobei es folgendes aufweist: einen ersten Binarisierungsabschnitt, der Halbtonbildregionen im inneren Teil des Dokumentes binarisiert, und zwar unter Verwendung eines veränderlichen bzw. schwebenden Schwellenwertes, der auf Pixeldichtepegeln basiert; einen zweiten Binarisierungsabschnitt, der unter Verwendung eines vorbestimmten festen Schwellenwertes binarisiert; und Detektionsmittel, die die binarisierte Signalausgangsgröße des zweiten Binarisierungsabschnittes verwendet, um eine kontinuierliche Detektion der Oberkante und entweder der rechten oder der linken Kante des Dokumentes auszuführen, um den inneren Teil des Dokumentes zu definieren.
  • Mit dem so konfigurierten Bildbinarisierungssystem wird die Binarisierung der Halbtonbildbereiche im Innenteil des Dokumentes adaptiv durch einen ersten Binarisierungsabschnitt ausgeführt, und zwar gemäß des beabsichtigten Zweckes, während die Detektion der Kantenteile des Dokumentes durch einen zweiten Binarisierungsabschnitt handgehabt wird, und wird erleichtert durch die Anwendung eines niedrigen festen Schwellenwertes, der speziell zur Kantenextraktion ausgelegt ist.
  • In einem bevorzugten Ausführungsbeispiel ist das Bildbinarisierungssystem konfiguriert, um binarisierte Bilddaten von Bildern auf gescanten Dokumenten vorzusehen, und zwar durch optisches Abtasten eines Dokumentes, welches in einem Bildrahmen bzw. einer Bildaufnahme positioniert ist, und um Scan- bzw. Abtastzeilenbildintensitätsdaten für jedes gescante Pixel in der Aufnahme vorzusehen, einen Intensitätspegel mit fester Schwelle bzw. einem festen Schwellenintensitätspegel vorzusehen, einen veränderlichen Schwellenintensitätspegel vorzusehen, der mit dem duchschnittlichen Intensitätspegel eines Satzes von Bildpixeln benachbart zu jedem abgetasteten Pixel in Beziehung steht, vorzusehen, um die Intensitätsdaten der abgetasteten Pixel mit einer festen Schwellenintensität zu vergleichen, und um erste Binärausgangsdaten für jedes abgetastete Pixel vorzusehen, um die Intensitätsdaten der gescanten Pixel mit einer veränderlichen Schwellenintensität zu vergleichen, und um die zweiten Binärausgangsdaten für jedes gescante Pixel vorzusehen, um die Kanten eines gescanten- bzw. abgetasteten Dokumentes ansprechend auf die ersten Binärausgangsdaten zu detektieren, und um die zweiten Binärausgangsdaten für jedes abgetastete Pixel des Bildes auf dem Dokument ansprechend auf die Detektion bzw. Erkennung der Dokumentenkanten zu speichern und zu verarbeiten.
  • Weitere Merkmale der Erfindung, ihr Wesen und verschiedene Vorteile werden aus den beigefügten Zeichnungen und der folgenden detaillierten Beschreibung der Erfindung offensichtlich.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 zeigt die Konfiguration eines herkömmlichen Bildbinarisierungssystems;
  • Fig. 2 zeigt ein Beispiel eines Mehrpegeldigitalbildes bzw. eines mehrpegeldigitalisierten Bildes;
  • Fig. 3 zeigt ein Bild, welches unter Verwendung eines herkömmlichen Binarisierungssystems mit fester Schwelle binarisiert wurde;
  • Fig. 4 zeigt ein Bild, welches unter Verwendung eines herkömmlichen Binarisierungssystems mit adaptiver Schwelle bzw. einem herkömmlichen adaptiven Schwellenbinarisierungssystem binarisiert wurde;
  • Fig. 5 zeigt die Konfiguration eines Bildbinarisierungssystems gemäß eines ersten Ausführungsbeispiels der vorliegenden Erfindung;
  • Fig. 6 zeigt ein Bild, welches gemäß der vorliegenden Erfindung binarisiert wurde;
  • Fig. 7 ist ein erklärendes Diagramm, um die Dokumentenkantendetektion bzw. -erkennung gemäß der vorliegenden Erfindung zu veranschaulichen;
  • Fig. 8 zeigt die Konfiguration eines Bildbinarisierungssystems gemäß eines weiteren Ausführungsbeispiels der vorliegenden Erfindung;
  • Fig. 9 ist ein Histogramm, welches die Signalpegel eines gescsanten bzw. abgetasteten Bildes zeigt; und
  • Fig. 10 ist ein beispielhaftes Diagramm, um den Übergang zwischen den zwei binarisierten Teilen zu veranschaulichen.
  • Beschreibung des bevorzugten Ausführungsbeispiels
  • Fig. 5 zeigt die Anordnung eines Bildbinarisierungssystems gemäß eines ersten Ausführungsbeispiels der vorliegenden Erfindung. Mit Bezug auf die Zeichnung werden Bildsignale von Bildaufnahmemitteln, wie beispielsweise einem Scanner bzw. einer Abtastvorrichtung 10 gelesen, werden von einem Verstärker 12 verstärkt und in einen A/D- bzw. Analog/Digital-Wandler 13 eingegeben, der die Analogsignale in Digitalsignale umwandelt. Zur Binarisierung werden die digitalisierten Signale dann in einen Komparator bzw. eine Vergleichsvorrichtung 27 und eine Schwelleneinstellschaltung 28 eingegeben.
  • Der Komparator 27 und eine Schwelleneinstellschaltung 28, die im Vergleichsvorgang verwendet werden, bilden einen ersten Binarisierungsabschnitt 29, der verwendet wird, um Halbton-Bildregionen im Innenteil des Dokumentes zu binarisieren, und zwar in geeigneter Weise für die beabsichtigte Anwendung des binarisierten Bildes. Wenn beispielsweise Text das Ziel ist, würde ein Binarisierungsverfahren verwendet werden, welches optimale Ergebnisse mit Bezug auf darauffolgende Verarbeitungsschritte erzeugt, wie beispielsweise die Zeichenextraktion und Zeichenerkennung. Für dieses Ausführungsbeispiel wird ein Binarisierungsverfahren verwendet, welches auf einem schwebenden bzw. veränderlichen Schwellenwert basiert, der konstant basierend auf den Dichtepegeln der Pixel wieder berechnet wird, die jedes interessante Pixel bzw. jeden interessanten Bildpunkt umgeben. Dieses Binarisierungsverfahren macht es möglich, genau die Konturen von verwischten Dokumentobjektbildern und Bildern mit niedrigem Kontrast wiederzugeben. Das in Fig. 4 gezeigte Bild wurde unter Verwendung dieses Verfahrens erhalten, um das in Fig. 2 gezeigte Bild 16 zu binarisieren. Die Konturen des Objektbildes sind ordnungsgemäß wiedergegeben worden. Jedoch ist, wie zuvor erklärt, die Position der Kante des Dokumentes nicht ordnungsgemäß aufgenommen worden.
  • Ein Komparator bzw. eine Vergleichsvorrichtung 30 und eine Schwelleneinstellschaltung 31, die im Vergleichsvorgang verwendet werden, bilden einen zweiten Binarisierungsabschnitt 32, der zum Extrahieren von Dokumentenkanten verwendet wird. Die Schwelleneinstellschaltung 31 wird verwendet, um eine feste Schwelleneinstellung zu erzeugen. Das Abtasten von nicht zum Dokument gehörigen Teilen erzeugt eine Auslesung mit stabilem Schwarzpegel. Dieser Dichtepegel wird zuvor sichergestellt, und ein fester Schwellenwert A wird auf einen Pegel eingestellt, der geringfügig weniger dicht ist als der erwähnte Dichtepegel ist.
  • Fig. 9 ist ein Histogramm, welches die Signalpegel eines abgetasteten Bildes zeigt. Wenn der abgetastete Hintergrundsignalpegel, der von nicht zum Dokument gehörigen Teilen erhalten wird, im wesentlichen konstant ist, ist es möglich, den festen Schwellenwert A derart einzustellen, so daß er geringfügig über dem Schwarzpegel des Scanners bzw. der Abtastvorrichtung liegt, wie in Fig. 9 gezeigt. Durch Verwendung einer niedrigen Schwellenwerteinstellung werden irgendwelche befleckten oder gefärbten bzw. schattierten Kantenteile oder Grenzdesignelemente mit niedrigem Kontrast, die einen helleren Dichtepegel besitzen als der Schwellenwert A, zu weiß binarisiert. Dies bedeutet, daß es möglich ist, ein binarisiertes Bild mit einer klar definierten Grenze zwischen zum Dokument gehörigen und nicht zum Dokument gehörigen Teilen zu erhalten.
  • Die vom zweiten Binarisierungsabschnitt 32 der Fig. 5 binarisierten Signale werden in eine Dokumentenkantendetektionsschaltung 33 eingegeben. Daten, die die Position der Dokumentenkanten anzeigen, wie sie von der Kantendetektionsschaltung 33 detektiert werden, werden in eine Innenregionverarbeitungsschaltung 34 zusammen mit den Bildsignalen eingegeben, die vom ersten Binarisierungsabschnitt 29 binarisiert worden sind, und vorgeschriebene Verarbeitungsvorgänge werden ausgeführt, um das Zielbild 16 zu extrahieren.
  • Wenn das in Fig. 2 gezeigte Dokument von den Bildbinarisierungssystem dieser Erfindung binarisiert worden ist, wird das in Fig. 4 gezeigte Bild vom ersten Binarisierungsabschnitt 29 erzeugt, und das in Fig. 6 gezeigte Bild wird vom zweiten Binarisierungsabschnitt 32 erzeugt. Die Binärbilddaten, die vom zweiten Binarisierungsabschnitt 32 unter Verwendung eines niedrigen festen Schwellenwerts erzeugt worden sind, werden in die Kantendetektionsschaltung 33 eingegeben, die die Kantendetektion ausführt.
  • Das Kantendetektionsverfahren sieht das Abtasten eines Kantendetektionsfensters in Richtung der Abtastung vor, die zu dieser Zeit verwendet wird. Sowohl die horizontalen als auch die vertikalen Richtungen sind in Fig. 7 gezeigt. Die Positionen, an denen es Übereinstimmungen zwischen den halbweißen, halbschwarzen Fenstermustern 38 oder 39 und den Binärbilddaten gibt, sehen die Detektion eines Satzes von Kantenpositionen innerhalb des Bildrahmens bzw. der Bildaufnahme 11 vor, und zwar in absoluter Hinsicht. Aus einem Satz von vier Punkten, an denen eine Dokumentenkante detektiert wird, wird eine Linearannäherung verwendet, um die Stelle der oberen linken Kante des Dokumentes zu berechnen.
  • Wenn die Dokumentenkantenstelleninformation anzeigt, daß das Dokument beispielsweise geneigt ist, berechnet die Innenregionverarbeitungsschaltung 34 der Fig. 5 das Ausmaß der Neigung und kompensiert die Bilddaten entsprechend. Die Schaltung 34 führt auch die Verarbeitung aus, um die vorgeschriebene Region oder die Regionen des Dokumentes zu verarbeiten, und zwar unter Verwendung absoluter Positionsdaten, wie aus den Dokumentenecken gemessen. Das Bildbinarisierungssystem dieser Erfindung ermöglicht es somit, daß ein Zielbild 16' genau extrahiert wird, welches wenig Verwischungen bzw. Unklarheiten hat.
  • Bei der herkömmlichen Bauart eines Systems muß zuerst der gesamte Bildrahmen bzw. die gesamte Bildaufnahme in den Speicher gelesen werden. Während das Bild ausgelesen wird, wird die Dokumentenumrandung gesucht und der erforderliche Teil wird extrahiert und verarbeitet. Dies macht es schwierig, kontinuierlich mehrfache Bilder zu verarbeiten, die in schneller Aufeinanderfolge eingegeben werden. Ein weiterer Nachteil ist, daß eine große Speicherkapazität erforderlich ist, um mehrere bzw. mehrfache Bildaufnahmen zu halten oder zu speichern.
  • Das Bildbinarisierungssystem mit fester Schwelle gemäß der vorliegenden Erfindung sieht andererseits eine Echtzeit-Verarbeitung vor. Die Verwendung der Kantendetektionsschaltung 33, um die Dokumentenkanten zu detektieren, macht es möglich, nur den erforderlichen Teil des Dokumentes für die sofortige Verarbeitung zu extrahieren und zu speichern. Mit Bezug auf Fig. 10 wird dies durchgeführt durch Detektieren der oberen Kante des Dokumentes 17 in der Region bzw. im Gebiet 43 und durch Konstruieren einer linearen Annäherung der oberen Kante. Diese Detektion wird für die linke (oder rechte) Kante wiederholt, und zwar unter Verwendung des Stromes von hereinkommenden Signalen. Basierend auf diesen beiden geraden Linien wird die Position der oberen linken (oder rechten) Kante berechnet, und zwar gefolgt von der Berechnung der Adresse der Zielbildregion 44 innerhalb des zwei-dimensionalen Bildrahmens bzw. der zwei-dimensionalen Bildaufnahme 11.
  • Die vertikale Bildrahmenabtastungsadresse wird kontinuierlich überwacht und an dem Punkt, an dem die Zieladresse erreicht worden ist, wird eine Signaleingabe in einem Bildspeicher 35 (Fig. 5) begonnen und wird angehalten, wenn die Adreßstellen überschritten werden. Die Vertikaladressenüberwachung wird eingestellt, um die Adressen der linken/rechten Kanten alle 32 Abtastzeilen zu überwachen.
  • Fig. 10 zeigt den Wechsel zwischen den beiden Schwellenschaltungen. Diese Anordnung ermöglicht, daß eine Verarbeitung auf kontinuierlicher Basis ausgeführt wird und minimiert zusätzlich die erforderliche Speichermenge, was die Schaltung vereinfacht. Für OCR- bzw. Zeichenerkennungssysteme und andere solche Systeme, bei denen eine kontinuierliche schnelle Verarbeitung erforderlich ist, ist die Anordnung gemäß der vorliegenden Erfindung stark wirksam.
  • Das Ausführungsbeispiel der Erfindung der Fig. 5 ist mit Bezug auf eine simultane Binarisierung durch die zwei Binarisierungsabschnitte beschrieben worden. Für komplexe Binarisierungsvorgänge, die nicht in Echtzeit handgehabt werden können, wie beispielsweise jene unter Verwendung von relativ weitreichenden Fehlerdiffusionstechniken, kann die im Ausführungsbeispiel der Fig. 8 gezeigte Anwendung verwendet werden. In dieser Konfiguration wird zuerst der zweite Binarisierungsabschnitt 32 verwendet, um eine zugeordnete bzw. bezeichnete Region 43 zu binarisieren, in dem die Dokumentenkante existieren bzw. auftreten soll. Die Kantendetektionsschaltung 33 wird verwendet, um die absolute Lage der Dokumentenregion 44 innerhalb der Bidlaufnahme bzw. des Bildrahmens zu erhalten, an der das Zielbild 16 gelegen ist. Dann wird gerade der umgebende Teil 42 durch eine Gate- bzw. Tor- bzw. Gatterschaltung 40 hindurchgegeben und in einem Mehrwertspeicher 41 gespeichert. Darauf folgt die Binarisierung durch den Binarisierungsabschnitt 29, wodurch eine effiziente Verarbeitung von nur den erforderlichen Teilen des Dokumentes 17 vorgesehen wird.
  • Das Ausführungsbeispiel der Fig. 8 kann somit verwendet werden, um die zeitaufwendige Binarisierung von Teilen eines abgetasten Dokumentes 17 zu vermeiden, beispielsweise von Teilen 45 der Fig. 10, von denen bekannt ist, daß sie nicht interessant sind.
  • Die Ausführungsbeispiele der Erfindung sind mit Bezug auf ein Kantendetektionsfenster beschrieben worden, welches von links nach rechts gescant bzw. abgetastet wird, und die linke Kante wird als Anfangsstelle verwendet, an der die Positionen des Fenstermusters und des Bildmusters zusammenfallen. Jedoch kann die rechte Kantenstelle stattdessen verwendet werden, und zwar unter Verwendung eines umgekehrten Schwarz- Weiß- Fenstermusters, und durch Speichern der Endstelle im Speicher, an der die Positionen des Fenstermusters und des Bildmusters zusammenfallen.

Claims (8)

1. Ein Bildbinarisierungssystem das ein in einer willkürlichen Position angeordnetes Dokument (17) innerhalb eines zweidimensionalen Bildfeldes oder Bildrahmens (Aufnahme) (11) auf einem schwarzen Hintergrund abtastet und die abgetasteten Multipegelbildsignale in binäre Signale umwandelt, wobei das Dokument einen durch Kanten begrenzten Innenteil aufweist die die körperlichen oder physikalischen Grenzen des Dokumentes definieren, wobei das Binarisiersystem folgendes aufweist:
zweite Binarisiermittel (29) zum Binarisieren von Halbtonbildzonen oder -regionen in dem erwähnten Innenteil des Dokumentes unter Verwendung eines veränderlichen bzw. schwimmenden Schwellenwertes der auf Pixeldichtepegeln basiert;
erste Binarisierungsmittel (32) zum Binarisieren von dem Gebiet innerhalb des Rahmens entsprechenden Bildsignalen unter Verwendung eines vorbestimmten festen Schwellenwertes; und Detektionsmittel (33) zur Verwendung der binarisierten Signalausgangsgröße von den ersten Binarisiermitteln zur Durchführung einer kontinuierlichen Detektion der Kanten des Dokuments und zur Definition des Innenteils des Dokuments.
2. Bildbinarisierungssystem nach Anspruch 1, wobei folgendes vorgesehen ist:
Abtastmittel (10) zum optischen Abtasten des Dokumentes und zum Vorsehen von Abtastzeilenbildintensitätsdaten für jedes abgetastete Pixel des Rahmens; erste Schwelleneinstellmittel zum Vorsehen des festen Schwellenintensitätspegels;
zweite Schwelleneinstellmittel zum Vorsehen des veränderlichen bzw. schwimmenden Schwellenintensitätspegels in Beziehung stehend mit dem durchschnittlichen Intensitätspegel eines Satzes von Bildpixeln benachbart zu jedem abgetasteten Pixel; wobei die ersten Binarisierungsmittel (29) Mittel (27) aufweisen zum Vergleichen der Intensitätsdaten der abgetasteten Pixel mit der festen Schwellenintensität und zum Vorsehen erster Binärausgangsdaten für jedes abgetastete Pixel;
wobei die zweiten Binarisierungsmittel (32) Mittel (30) aufweisen zum Vergleichen der Intensitätsdaten der abgetasteten Pixel mit der veränderlichen bzw. schwimmenden Schwellenintensität und zum Vorsehen zweiter binärer Ausgangsdaten für jedes abgetastete Pixel;
wobei die Kantendetektionsmittel (33) auf die ersten binären Ausgangsdaten ansprechen, um die Kanten des abgetasteten Dokumentes zu detektieren; und
Mittel die auf die Detektion der Dokumentkanten ansprechen, um die zweiten binären Ausgangsdaten für jedes abgetastete Pixel des Bildes auf dem Dokument zu speichern und zu verarbeiten.
3. System nach Anspruch 2, wobei die Kantendetektionsmittel (33) ferner folgendes aufweisen:
Mittel zur Definition eines Kantendetektionsdatenfensters, welches ein Muster aus Binärpixeldatenwerten aufweist, und zwar repräsentativ für eine Dokumentenkante gegenüber dem Bildrahmen;
zum Vergleichen der ersten binären Ausgangsdaten abgeleitet aus einer Reihe oder Serie von Abtastlinien bzw. -zeilen zum Kantendetektionsdatenfenster und zum Indentifizieren eines Satzes von Indentitätsabtastpositionen die eine Anzeige bilden für die Kante des Dokumentes gegenüber dem Bildrahmen; und
Mittel zum Extrapolieren der Oberkanten- und Seitenkanten-Positionen des Dokumentes in dem Bildfeld und zum Indentifizieren irgendeiner relativen Neigung dazwischen.
4. System nach Anspruch 3, wobei ferner folgendes vorgesehen ist:
auf die Detektion der oberen und Seitenkantenteile des Dokumentes ansprechende Mittel um zu bewirken, daß die zweiten Binarisierungsmittel die zweiten binären Ausgangsdaten für einen Teil des Dokumentes innerhalb der oberen und Seitenkantenteile vorsehen.
5. Bildbinarisierungsverfahren, das ein in einer willkürlichen Position angeordnetes Dokument innerhalb eines zweidimensionalen Bildbereichs oder Rahmens auf einem schwarzen Hintergrund abtastet und die abgetasteten Multipegel- Bildsignale in binäre Signale umwandelt, wobei das Dokument einen Innenteil aufweist, der durch Kanten begrenzt ist, die die physikalischen oder körperlichen Grenzen des Dokumentes bilden, und wobei das Binarisierungsverfahren die folgenden Schritte aufweist:
Binarisieren der abgetasteten Bildsignale von den Halbtonbildregionen oder -zonen in einem Innenteil des Dokumentes unter Verwendung eines veränderlichen bzw. schwimmenden Schwellenwertes, der auf Pixeldichtepegeln basiert;
Binarisierung der abgetasteten Bildsignale entsprechend dem Gebiet innerhalb des Rahmens unter Verwendung eines vorbestimmten festen Schwellenwertes; und Verwendung der binarisierten Signalausgangsgröße von dem zweiten Binarisierungsschritt zur Durchführung einer kontinuierlichen Detektion der Kanten des Dokumentes und zur Definition des Innenteus des Dokumentes.
6. Bildbinarisierungsverfahren nach Anspruch 5, wobei die folgenden Schritte vorgesehen sind:
optisches Abtasten des erwähnten Dokumentes positioniert in dem erwähnten Bildrahmen und Vorsehen von Abtastzeilenbildintensitätsdaten für jedes abgetastete Pixel des Rahmens;
Vorsehen eines festen Schwellenintensitätspegels;
Vorsehen eines veränderlichen bzw. schwimmenden Schwellenintensitätspegels in Beziehung stehend mit dem durchschnittlichen Intensitätspegel eines Satzes von Bildpixeln benachbart zu jedem abgetasteten Pixel;
Vergleichen der Intensitätsdaten der abgetasteten Pixel mit der festen Schwellenintensität und Vorsehen erster Binärausgangsdaten für jedes abgetastete Pixel;
Vergleichen der Intensitätsdaten der abgetasteten Pixel mit der veränderlichen Schwellenintensität und Vorsehen zweiter Binärausgangsdaten für jedes abgetastete Pixel;
Detektieren der Kanten des erwähnten abgetasteten Dokumentes ansprechend auf die ersten binären Ausgangsdaten; und
Speichern und Verarbeiten der zweiten binären Ausgangsdaten für jedes abgetastete Pixel des Bildes auf dem Dokument ansprechend auf die Detektion der Dokumentenkanten.
7. Verfahren nach Anspruch 6, wobei die Kantendetektionsschritte ferner folgende Schritte aufweisen:
Definition eines Kantendetektionsdatenfensters, welches ein Muster aus Binärpixeldatenwerten aufweist, und zwar repräsentativ für eine Dokumentenkante gegenüber dem Bildrahmen;
Vergleichen der ersten binären Ausgangssdaten abgeleitet in einer Reihe von Abtastlinien oder -zeilen mit dem Kantendetketionsdatenfenster und Identifizieren eines Satzes von Identitätsabtastpositionen die eine Anzeige bilden für die Kante des Dokumentes gegenüber dem Bildrahmen; und
Extrapolieren der Oberkanten- und Seitenkanten-Positionen des Dokumentes in dem Bildfeld und Identifizieren jedweder relativer Neigung dazwischen.
8. Verfahren nach Anspruch 7, wobei ferner die folgenden Schritte vorgesehen sind:
Vorsehen der zweiten binären Ausgangsdaten für einen Teil des Dokumentes innerhalb der oberen und Seitenkantenteile ansprechend auf die Detektion der oberen und Seitenkantenteile des Dokumentes.
DE69220118T 1991-03-29 1992-02-20 Bildbinarisierungssystem Expired - Lifetime DE69220118T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3066918A JPH04302375A (ja) 1991-03-29 1991-03-29 画像二値化装置

Publications (2)

Publication Number Publication Date
DE69220118D1 DE69220118D1 (de) 1997-07-10
DE69220118T2 true DE69220118T2 (de) 1998-01-22

Family

ID=13329839

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69220118T Expired - Lifetime DE69220118T2 (de) 1991-03-29 1992-02-20 Bildbinarisierungssystem

Country Status (3)

Country Link
EP (1) EP0505729B1 (de)
JP (1) JPH04302375A (de)
DE (1) DE69220118T2 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19517178C1 (de) * 1995-05-09 1996-11-21 Ibm Hintergrundbereinigung bei elektronisch abgetasteten Bildern
DE19536170A1 (de) * 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
JPH1056569A (ja) * 1996-08-07 1998-02-24 Riso Kagaku Corp 画像処理方法および装置
JP4250483B2 (ja) 2003-08-25 2009-04-08 キヤノン株式会社 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US7333656B2 (en) * 2003-11-26 2008-02-19 Matsushita Electric Industrial Co., Ltd. Image processing method and image processing apparatus
JP2010134958A (ja) * 2010-02-08 2010-06-17 Fujitsu Ltd 境界検出方法、プログラムおよびこれを用いた装置
JP5725276B2 (ja) * 2010-08-03 2015-05-27 富士ゼロックス株式会社 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
CN104184918B (zh) * 2013-05-27 2017-07-07 富士通株式会社 图像处理装置和方法以及上置式图像扫描装置
US9495343B2 (en) * 2014-09-30 2016-11-15 Konica Minolta Laboratory U.S.A., Inc. Horizontal and vertical line detection and removal for document images
CN117830315B (zh) * 2024-03-05 2024-05-10 渭南大东印刷包装机械有限公司 基于图像处理的印刷机实时监控方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4193093A (en) * 1978-08-03 1980-03-11 The United States Of America As Represented By The Secretary Of The Navy CCD camera interface circuit
US4220972A (en) * 1979-05-22 1980-09-02 Honeywell Inc. Low contrast object extraction device

Also Published As

Publication number Publication date
EP0505729B1 (de) 1997-06-04
EP0505729A3 (de) 1994-01-05
EP0505729A2 (de) 1992-09-30
JPH04302375A (ja) 1992-10-26
DE69220118D1 (de) 1997-07-10

Similar Documents

Publication Publication Date Title
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE3881392T2 (de) System und Verfahren für automatische Segmentierung.
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69226825T2 (de) Verbessertes automatisches Segmentieren von Bildern
DE69728482T2 (de) Zweidimensionaler Codeleser
DE60118240T2 (de) Methode zur bildanalyse
DE3633743C2 (de)
DE69511507T2 (de) Verfahren und Vorrichtung zur automatischen Bildsegmentierung unter Verwendung von Standardvergleichsmustern
DE3851173T2 (de) Verfahren und Gerät zur Erkennung von Halbtonbildmustern.
DE69230440T2 (de) Verfahren und gerät zur adaptiven schwellwertverarbeitung von grauskalabildern
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE3686821T2 (de) Halbtonbildverarbeitungseinrichtung.
DE4001613A1 (de) Binaerumsetzungsverfahren
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE69330354T2 (de) Bildverarbeitung zur Bestimmung und Änderung von den Hintergrund einer abgetasteten Dokumentenvorlage darstellenden Dichtewerten.
DE2858688C2 (de)
DE3879609T2 (de) Verfahren und Vorrichtung zum Erkennen von kennzeichnenden Unterschieden in einem Blattmaterial.
DE69220118T2 (de) Bildbinarisierungssystem
DE102011051934A1 (de) Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera
DE69210863T2 (de) Bildabtaster
DE69516255T2 (de) Verfahren und Vorrichtung zum Lesen eines Bildes
DE10027737B4 (de) Digitaler Bildverarbeitungsapparat
DE69015238T2 (de) Reliefbildabtaster.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: EASTMAN KODAK CO., ROCHESTER, N.Y., US