DE69220118T2 - Bildbinarisierungssystem - Google Patents
BildbinarisierungssystemInfo
- Publication number
- DE69220118T2 DE69220118T2 DE69220118T DE69220118T DE69220118T2 DE 69220118 T2 DE69220118 T2 DE 69220118T2 DE 69220118 T DE69220118 T DE 69220118T DE 69220118 T DE69220118 T DE 69220118T DE 69220118 T2 DE69220118 T2 DE 69220118T2
- Authority
- DE
- Germany
- Prior art keywords
- document
- image
- binarization
- data
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Input (AREA)
- Image Processing (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein Bildbinarisierungssystem, insbesondere auf ein Bildbinarisierungssystem, welches ein Dokument scant bzw. abtastet, die abgetasteten Signale mit einem Schwellenwert vergleicht und die Signale entsprechend binarisiert.
- Optische Buchstabenlesevorrichtungen (OCRs = optical character readers) und optische Zeichenleser (OMRs = optical mark readers) sind zwei Bauarten von Systemen, die eine Bildinformation binarisieren und verarbeiten, und zwar an einer speziellen Stelle auf einem Dokument in einer zufälligen Position innerhalb eines zweidimensionalen Bildrahmens bzw. einer zweidimensionalen Bildaufnahme (frame). Während es verschiedene Verfahren zur Ausführung der Binarisierung gibt, ist die grundlegende Konfiguration von solchen Systemen wie in Fig. 1 gezeigt. Mit Bezug auf die Zeichnungen weist die Vorrichtung Bildaufnahmemittel auf, wie beispielsweise einen Scanner bzw. eine Abtastvorrichtung 10, einen Verstärker 12 zur Verstärkung der abgetasteten bzw. gescanten Signale, einen Analog/Digital- bzw. A/D-Wandler 13, um die digitalisierten Signale zu binarisieren, einen Komparator bzw. eine Vergleichsvorrichtung 14 zur Digitalisierung der binarisierten Signale und eine Schwelleneinstellschaltung 15, die verwendet wird, um den Schwellenwert einzustellen, mit dem die digitalisierten Signale verglichen werden.
- Der Scanner bzw. die Abtastvorrichtung 10 ist schematisch in Fig. 1 und den anderen Figuren veranschaulicht und es sei erwähnt, daß er von links nach rechts und/oder von rechts nach links horizontal über den zweidimensionalen Bildrahmen bzw. die zweidimensionale Bildeinzelaufnahme (frame) 11 läuft, wenn die Aufnahme 11 und das Dokument 17 vertikal über den Scanner bzw. die Abtastvorrichtung vorgeschoben werden, wie beispielsweise in den gleichfalls eigenen US-Patenten US-A-4 796 962 und US-A-4 921 320 gelehrt. Die Bildaufnahme bzw. das Einzelbild 11 kann eine Druckplatte oder Trommel mit schwarzem Hintergrund aufweisen, und das Dokument 17 kann in der Praxis in gewisser Weise geneigt sein mit Bezug auf die nominalen horizontalen und vertikalen Achsen der Abtastvorrichtung 10 und des Rahmens bzw. der Aufnahme 11. Typischerweise müssen abzutastende Dokumente hellere Hintergründe besitzen oder anders gefärbt sein als der Rahmen 11 mit schwarzem Hintergrund.
- Die Schwelleneinstellschaltung 15 erzeugt den Schwellenwert, der verwendet wird, um die Mehrpegelbildsignale in binäre Schwarz- Weiß- Signale umzuwandeln. Dies kann unter Verwendung verschiedener Verfahren durchgeführt werden. Das einfachste ist, daß Festschwellenwertverfahren, bei dem die digitalisierte Größe des gescanten bzw. abgetasteten Bildsignals mit einem vorbestimmten Referenzwert verglichen wird. Ein fortschrittlicheres Verfahren sieht die Verwendung einer speziellen Region des Bildbinarisierungsziels bzw. der Bildbinarisierungstarget vor, um einen geeignet festgelegten Schwellenwert zu berechnen.
- Ein Nachteil bei solchen Systemen ist, daß, wenn es Veränderungen der Dokumentenbeleuchtungsintensität, eine Ungleichförmigkeit in der Dichte der Dokumentbilder oder farbige Muster im Hintergrund gibt, der Schwellenwert nicht adäquat zwischen dem Dichtepegel des Zielbildes und dem Hintergrunddichtepegel unterscheiden kann.
- Ein Binarisierungsverfahren, welches verwendet wird, um dieses Problem zu lösen, sieht die Anwendung eines veränderlichen bzw. schwimmenden Schwellenwertes vor, der basierend auf den durchschnittlichen Dichtepegeln der Pixel um das interessante Pixel bzw. den interessanten Bildpunkt herum basiert, wodurch es ermöglicht wird, daß die Konturen von verwischten Bildern oder Bildern mit niedrigem Kontrast genauer wiedergegeben werden können. Während es für eine genauere Wiedergabe von Halbtonbildregionen im inneren Teil eines Dokumentes effektiv bzw. wirksam ist, gibt dieses Verfahren auch irgendwelche Flecken, eine Schattierung bzw. Färbung und ähnliches um die Kanten des Dokumentes herum wieder, was die Kanten ausgefranst bzw. ungleichmäßig erscheinen läßt, anstelle gerade wie im ursprünglichen Dokument. Dies stellt ein Problem dar, wenn ein binarisiertes Bild einer weiteren Verarbeitung unterlaufen soll, wie beispielsweise eine optische Zeichenerkennung, bei der es notwendig ist, die absolute Position der Kanten des betreffenden Dokumentenbildes zu kennen.
- Diese Probleme werden nun speziell erklärt werden. Fig. 2 zeigt ein Beispiel eines binarisierten Target- bzw. Zielbildes 16 auf einem Hintergrund 17. Teile der Dokumentenkante weisen fleckige Teile 18, Schattierungen bzw. Einfärbungen 20 und farbige Muster 22 auf, und zusätzlich gibt es gewisse Verwischungen bzw. Ungenauigkeiten 24 des Zielbildes 16. Wenn dies von dem herkömmlichen in Fig. 1 gezeigten Bildbinarisierungssystem binarisiert wird, welches einen festen Schwellenwert für die Binarisierung verwendet, erzeugt es die Art von Ergebnis, die in Fig. 3 gezeigt ist, was zeigt, daß die befleckten und schattierten Teile 18, 20 und die verwischten Teile 24 verhindern, daß das Zielbild 16 genau wiedergegeben wird.
- Fig. 4 zeigt das Ergebnis der Anwendung des herkömmlichen Bildbinarisierungssystems der Fig. 1 und einer veränderlichen bzw. schwimmenden Schwelleneinstellung, die dem durchschnittlichen Dichtepegel der Pixel bzw. Bildpunkte entspricht, die die interessanten Bildpixel umgeben. Während die Konturen des Bildes 16 dadurch mit besserer Genauigkeit wiedergegeben werden können, ist ein Nachteil, daß befleckte und schattierte Teile 18, 20 und ähnliches genauso genau wiedergegeben werden, was eine Dokumentenkantenlinie zur Folge hat, die anstatt gerade und sauber, ungerade oder sogar teilweise mit fehlenden Teilen versehen ist.
- Mit Bezug auf Hochgeschwindigkeits-OCR- und OMR-Systeme besteht die Anforderung für einen qualitativ hochwertigen Druck auf qualitativ hochwertigem Papier, um solche Binarisierungsprobleme auszuschließen, und entsprechende JIS-Standards bestehen. Jedoch kann auf gewöhlichem Papier geschriebener Text oder die Art von beflecktem Text, der durch eine zweite Kopie, insbesondere eine Kohlenstoff- bzw. Tonerkopie erzeugt wird, oder Dokumente mit farbigen Teilen, oder mit einem Text, der keinen ausreichenden Kontrast für eine klare Darstellung besitzt, nicht gelesen werden. Darüber hinaus ist ein Problem bei der Beschleunigung von Vorgängen durch Zuführen von Mehrfachbildspeicherbänken, daß dies die Betriebskomplexitität des Systems steigert.
- Es sei weiter hingewiesen auf US-A-4 220 972, die ein System zur automatischen Schwellenwertbildung von Videodaten offenbart, um interessante Objekte von Abbildungen mit sowohl hohem als auch niedrigem Kontrast zu detektieren. Eine adaptive Echtzeit-Bildintervalextraktionsvorrichtung extrahiert die Kanten eines Objektes und erzeugt gleichzeitig ein Helligkeitssignal für eine größere Intensität als eine gegebene Schwelle. Ein Kantenfilter bestimmt die Kantenintensitätsgröße, die zwischen den aufeinanderfolgenden Bildelementen oder Pixeln in der Scanbzw. Abtastlinie der Videodaten assoziiert ist. Eine Kantenschwelle wird automatisch aus der durchschnittlichen Kantenintensität jeder Abtastlinie bzw. -zeile der Daten bestimmt. Wenn die Datenkante größer wird als die Kantenschwelle, wird eine logische Kantenausgangsgröße erzeugt. In derselben Weise werden die Daten auch durch einen Helligkeitsfilter geleitet, der Daten über einer gegebenen Hintergrundschwelle betont. Der Hintergrund und die Schwelle werden auf eine Basis von Zeile zu Zeile bzw. Linie zu Linie aktualisiert. Dies erzeugt ein logisches Signal, wenn die Intensität über der automatisch bestimmten Schwelle liegt.
- Gemäß der vorliegenden Erfindung sind ein Bildbinarisierungsystem und ein Bildbinarisierungsverfahren nach den Ansprüchen 1 bzw. 5 vorgesehen. Bevorzugte Ausführungsbeispiele der Erfindung sind in den abhängigen Ansprüchen offenbart.
- Ein Ziel der Erfindung ist es daher, ein Bildbinarisierungssystem vorzusehen, welches genau ein Zieldokumentbild wiedergeben kann, welches verwischte Konturen oder einen niedrigen Dichtepegel besitzt, und welches auch Flecken, Muster, ungleichförmige Beleuchtungseffekte und ähnliches um die Kantenteile des Dokumentes herum ignorieren kann, während es gleichzeitig leicht und genau die wahren Kanten des Dokumentes detektieren kann. Dieses System macht es möglich, Dokumente von normal gedruckter Qualität zu lesen, ohne spezielles, qualitativ hochwertiges Papier zu verwenden, und ermöglicht auch, daß eine kontinuierliche Hochgeschwindigkeits-Bildverarbeitung mit einem Minimum an Speicherkapazität implementiert bzw. durchgeführt wird.
- Dieses Ziel wird durch ein Bildbinarisierungssystem nach Anspruch 1 erreicht. Ein solches System scant bzw. tastet ein Dokument ab, welches in einer willkürlichen Position innerhalb eines zwei-dimensionalen Bildrahmens bzw. einer Bildaufnahme auf einem schwarzen Hintergrund gelegen ist, und wandelt die abgetasteten digitalisierten Multipegelbildsignale in Schwarz- Weiß- Binärsignale um, wobei es folgendes aufweist: einen ersten Binarisierungsabschnitt, der Halbtonbildregionen im inneren Teil des Dokumentes binarisiert, und zwar unter Verwendung eines veränderlichen bzw. schwebenden Schwellenwertes, der auf Pixeldichtepegeln basiert; einen zweiten Binarisierungsabschnitt, der unter Verwendung eines vorbestimmten festen Schwellenwertes binarisiert; und Detektionsmittel, die die binarisierte Signalausgangsgröße des zweiten Binarisierungsabschnittes verwendet, um eine kontinuierliche Detektion der Oberkante und entweder der rechten oder der linken Kante des Dokumentes auszuführen, um den inneren Teil des Dokumentes zu definieren.
- Mit dem so konfigurierten Bildbinarisierungssystem wird die Binarisierung der Halbtonbildbereiche im Innenteil des Dokumentes adaptiv durch einen ersten Binarisierungsabschnitt ausgeführt, und zwar gemäß des beabsichtigten Zweckes, während die Detektion der Kantenteile des Dokumentes durch einen zweiten Binarisierungsabschnitt handgehabt wird, und wird erleichtert durch die Anwendung eines niedrigen festen Schwellenwertes, der speziell zur Kantenextraktion ausgelegt ist.
- In einem bevorzugten Ausführungsbeispiel ist das Bildbinarisierungssystem konfiguriert, um binarisierte Bilddaten von Bildern auf gescanten Dokumenten vorzusehen, und zwar durch optisches Abtasten eines Dokumentes, welches in einem Bildrahmen bzw. einer Bildaufnahme positioniert ist, und um Scan- bzw. Abtastzeilenbildintensitätsdaten für jedes gescante Pixel in der Aufnahme vorzusehen, einen Intensitätspegel mit fester Schwelle bzw. einem festen Schwellenintensitätspegel vorzusehen, einen veränderlichen Schwellenintensitätspegel vorzusehen, der mit dem duchschnittlichen Intensitätspegel eines Satzes von Bildpixeln benachbart zu jedem abgetasteten Pixel in Beziehung steht, vorzusehen, um die Intensitätsdaten der abgetasteten Pixel mit einer festen Schwellenintensität zu vergleichen, und um erste Binärausgangsdaten für jedes abgetastete Pixel vorzusehen, um die Intensitätsdaten der gescanten Pixel mit einer veränderlichen Schwellenintensität zu vergleichen, und um die zweiten Binärausgangsdaten für jedes gescante Pixel vorzusehen, um die Kanten eines gescanten- bzw. abgetasteten Dokumentes ansprechend auf die ersten Binärausgangsdaten zu detektieren, und um die zweiten Binärausgangsdaten für jedes abgetastete Pixel des Bildes auf dem Dokument ansprechend auf die Detektion bzw. Erkennung der Dokumentenkanten zu speichern und zu verarbeiten.
- Weitere Merkmale der Erfindung, ihr Wesen und verschiedene Vorteile werden aus den beigefügten Zeichnungen und der folgenden detaillierten Beschreibung der Erfindung offensichtlich.
- Fig. 1 zeigt die Konfiguration eines herkömmlichen Bildbinarisierungssystems;
- Fig. 2 zeigt ein Beispiel eines Mehrpegeldigitalbildes bzw. eines mehrpegeldigitalisierten Bildes;
- Fig. 3 zeigt ein Bild, welches unter Verwendung eines herkömmlichen Binarisierungssystems mit fester Schwelle binarisiert wurde;
- Fig. 4 zeigt ein Bild, welches unter Verwendung eines herkömmlichen Binarisierungssystems mit adaptiver Schwelle bzw. einem herkömmlichen adaptiven Schwellenbinarisierungssystem binarisiert wurde;
- Fig. 5 zeigt die Konfiguration eines Bildbinarisierungssystems gemäß eines ersten Ausführungsbeispiels der vorliegenden Erfindung;
- Fig. 6 zeigt ein Bild, welches gemäß der vorliegenden Erfindung binarisiert wurde;
- Fig. 7 ist ein erklärendes Diagramm, um die Dokumentenkantendetektion bzw. -erkennung gemäß der vorliegenden Erfindung zu veranschaulichen;
- Fig. 8 zeigt die Konfiguration eines Bildbinarisierungssystems gemäß eines weiteren Ausführungsbeispiels der vorliegenden Erfindung;
- Fig. 9 ist ein Histogramm, welches die Signalpegel eines gescsanten bzw. abgetasteten Bildes zeigt; und
- Fig. 10 ist ein beispielhaftes Diagramm, um den Übergang zwischen den zwei binarisierten Teilen zu veranschaulichen.
- Fig. 5 zeigt die Anordnung eines Bildbinarisierungssystems gemäß eines ersten Ausführungsbeispiels der vorliegenden Erfindung. Mit Bezug auf die Zeichnung werden Bildsignale von Bildaufnahmemitteln, wie beispielsweise einem Scanner bzw. einer Abtastvorrichtung 10 gelesen, werden von einem Verstärker 12 verstärkt und in einen A/D- bzw. Analog/Digital-Wandler 13 eingegeben, der die Analogsignale in Digitalsignale umwandelt. Zur Binarisierung werden die digitalisierten Signale dann in einen Komparator bzw. eine Vergleichsvorrichtung 27 und eine Schwelleneinstellschaltung 28 eingegeben.
- Der Komparator 27 und eine Schwelleneinstellschaltung 28, die im Vergleichsvorgang verwendet werden, bilden einen ersten Binarisierungsabschnitt 29, der verwendet wird, um Halbton-Bildregionen im Innenteil des Dokumentes zu binarisieren, und zwar in geeigneter Weise für die beabsichtigte Anwendung des binarisierten Bildes. Wenn beispielsweise Text das Ziel ist, würde ein Binarisierungsverfahren verwendet werden, welches optimale Ergebnisse mit Bezug auf darauffolgende Verarbeitungsschritte erzeugt, wie beispielsweise die Zeichenextraktion und Zeichenerkennung. Für dieses Ausführungsbeispiel wird ein Binarisierungsverfahren verwendet, welches auf einem schwebenden bzw. veränderlichen Schwellenwert basiert, der konstant basierend auf den Dichtepegeln der Pixel wieder berechnet wird, die jedes interessante Pixel bzw. jeden interessanten Bildpunkt umgeben. Dieses Binarisierungsverfahren macht es möglich, genau die Konturen von verwischten Dokumentobjektbildern und Bildern mit niedrigem Kontrast wiederzugeben. Das in Fig. 4 gezeigte Bild wurde unter Verwendung dieses Verfahrens erhalten, um das in Fig. 2 gezeigte Bild 16 zu binarisieren. Die Konturen des Objektbildes sind ordnungsgemäß wiedergegeben worden. Jedoch ist, wie zuvor erklärt, die Position der Kante des Dokumentes nicht ordnungsgemäß aufgenommen worden.
- Ein Komparator bzw. eine Vergleichsvorrichtung 30 und eine Schwelleneinstellschaltung 31, die im Vergleichsvorgang verwendet werden, bilden einen zweiten Binarisierungsabschnitt 32, der zum Extrahieren von Dokumentenkanten verwendet wird. Die Schwelleneinstellschaltung 31 wird verwendet, um eine feste Schwelleneinstellung zu erzeugen. Das Abtasten von nicht zum Dokument gehörigen Teilen erzeugt eine Auslesung mit stabilem Schwarzpegel. Dieser Dichtepegel wird zuvor sichergestellt, und ein fester Schwellenwert A wird auf einen Pegel eingestellt, der geringfügig weniger dicht ist als der erwähnte Dichtepegel ist.
- Fig. 9 ist ein Histogramm, welches die Signalpegel eines abgetasteten Bildes zeigt. Wenn der abgetastete Hintergrundsignalpegel, der von nicht zum Dokument gehörigen Teilen erhalten wird, im wesentlichen konstant ist, ist es möglich, den festen Schwellenwert A derart einzustellen, so daß er geringfügig über dem Schwarzpegel des Scanners bzw. der Abtastvorrichtung liegt, wie in Fig. 9 gezeigt. Durch Verwendung einer niedrigen Schwellenwerteinstellung werden irgendwelche befleckten oder gefärbten bzw. schattierten Kantenteile oder Grenzdesignelemente mit niedrigem Kontrast, die einen helleren Dichtepegel besitzen als der Schwellenwert A, zu weiß binarisiert. Dies bedeutet, daß es möglich ist, ein binarisiertes Bild mit einer klar definierten Grenze zwischen zum Dokument gehörigen und nicht zum Dokument gehörigen Teilen zu erhalten.
- Die vom zweiten Binarisierungsabschnitt 32 der Fig. 5 binarisierten Signale werden in eine Dokumentenkantendetektionsschaltung 33 eingegeben. Daten, die die Position der Dokumentenkanten anzeigen, wie sie von der Kantendetektionsschaltung 33 detektiert werden, werden in eine Innenregionverarbeitungsschaltung 34 zusammen mit den Bildsignalen eingegeben, die vom ersten Binarisierungsabschnitt 29 binarisiert worden sind, und vorgeschriebene Verarbeitungsvorgänge werden ausgeführt, um das Zielbild 16 zu extrahieren.
- Wenn das in Fig. 2 gezeigte Dokument von den Bildbinarisierungssystem dieser Erfindung binarisiert worden ist, wird das in Fig. 4 gezeigte Bild vom ersten Binarisierungsabschnitt 29 erzeugt, und das in Fig. 6 gezeigte Bild wird vom zweiten Binarisierungsabschnitt 32 erzeugt. Die Binärbilddaten, die vom zweiten Binarisierungsabschnitt 32 unter Verwendung eines niedrigen festen Schwellenwerts erzeugt worden sind, werden in die Kantendetektionsschaltung 33 eingegeben, die die Kantendetektion ausführt.
- Das Kantendetektionsverfahren sieht das Abtasten eines Kantendetektionsfensters in Richtung der Abtastung vor, die zu dieser Zeit verwendet wird. Sowohl die horizontalen als auch die vertikalen Richtungen sind in Fig. 7 gezeigt. Die Positionen, an denen es Übereinstimmungen zwischen den halbweißen, halbschwarzen Fenstermustern 38 oder 39 und den Binärbilddaten gibt, sehen die Detektion eines Satzes von Kantenpositionen innerhalb des Bildrahmens bzw. der Bildaufnahme 11 vor, und zwar in absoluter Hinsicht. Aus einem Satz von vier Punkten, an denen eine Dokumentenkante detektiert wird, wird eine Linearannäherung verwendet, um die Stelle der oberen linken Kante des Dokumentes zu berechnen.
- Wenn die Dokumentenkantenstelleninformation anzeigt, daß das Dokument beispielsweise geneigt ist, berechnet die Innenregionverarbeitungsschaltung 34 der Fig. 5 das Ausmaß der Neigung und kompensiert die Bilddaten entsprechend. Die Schaltung 34 führt auch die Verarbeitung aus, um die vorgeschriebene Region oder die Regionen des Dokumentes zu verarbeiten, und zwar unter Verwendung absoluter Positionsdaten, wie aus den Dokumentenecken gemessen. Das Bildbinarisierungssystem dieser Erfindung ermöglicht es somit, daß ein Zielbild 16' genau extrahiert wird, welches wenig Verwischungen bzw. Unklarheiten hat.
- Bei der herkömmlichen Bauart eines Systems muß zuerst der gesamte Bildrahmen bzw. die gesamte Bildaufnahme in den Speicher gelesen werden. Während das Bild ausgelesen wird, wird die Dokumentenumrandung gesucht und der erforderliche Teil wird extrahiert und verarbeitet. Dies macht es schwierig, kontinuierlich mehrfache Bilder zu verarbeiten, die in schneller Aufeinanderfolge eingegeben werden. Ein weiterer Nachteil ist, daß eine große Speicherkapazität erforderlich ist, um mehrere bzw. mehrfache Bildaufnahmen zu halten oder zu speichern.
- Das Bildbinarisierungssystem mit fester Schwelle gemäß der vorliegenden Erfindung sieht andererseits eine Echtzeit-Verarbeitung vor. Die Verwendung der Kantendetektionsschaltung 33, um die Dokumentenkanten zu detektieren, macht es möglich, nur den erforderlichen Teil des Dokumentes für die sofortige Verarbeitung zu extrahieren und zu speichern. Mit Bezug auf Fig. 10 wird dies durchgeführt durch Detektieren der oberen Kante des Dokumentes 17 in der Region bzw. im Gebiet 43 und durch Konstruieren einer linearen Annäherung der oberen Kante. Diese Detektion wird für die linke (oder rechte) Kante wiederholt, und zwar unter Verwendung des Stromes von hereinkommenden Signalen. Basierend auf diesen beiden geraden Linien wird die Position der oberen linken (oder rechten) Kante berechnet, und zwar gefolgt von der Berechnung der Adresse der Zielbildregion 44 innerhalb des zwei-dimensionalen Bildrahmens bzw. der zwei-dimensionalen Bildaufnahme 11.
- Die vertikale Bildrahmenabtastungsadresse wird kontinuierlich überwacht und an dem Punkt, an dem die Zieladresse erreicht worden ist, wird eine Signaleingabe in einem Bildspeicher 35 (Fig. 5) begonnen und wird angehalten, wenn die Adreßstellen überschritten werden. Die Vertikaladressenüberwachung wird eingestellt, um die Adressen der linken/rechten Kanten alle 32 Abtastzeilen zu überwachen.
- Fig. 10 zeigt den Wechsel zwischen den beiden Schwellenschaltungen. Diese Anordnung ermöglicht, daß eine Verarbeitung auf kontinuierlicher Basis ausgeführt wird und minimiert zusätzlich die erforderliche Speichermenge, was die Schaltung vereinfacht. Für OCR- bzw. Zeichenerkennungssysteme und andere solche Systeme, bei denen eine kontinuierliche schnelle Verarbeitung erforderlich ist, ist die Anordnung gemäß der vorliegenden Erfindung stark wirksam.
- Das Ausführungsbeispiel der Erfindung der Fig. 5 ist mit Bezug auf eine simultane Binarisierung durch die zwei Binarisierungsabschnitte beschrieben worden. Für komplexe Binarisierungsvorgänge, die nicht in Echtzeit handgehabt werden können, wie beispielsweise jene unter Verwendung von relativ weitreichenden Fehlerdiffusionstechniken, kann die im Ausführungsbeispiel der Fig. 8 gezeigte Anwendung verwendet werden. In dieser Konfiguration wird zuerst der zweite Binarisierungsabschnitt 32 verwendet, um eine zugeordnete bzw. bezeichnete Region 43 zu binarisieren, in dem die Dokumentenkante existieren bzw. auftreten soll. Die Kantendetektionsschaltung 33 wird verwendet, um die absolute Lage der Dokumentenregion 44 innerhalb der Bidlaufnahme bzw. des Bildrahmens zu erhalten, an der das Zielbild 16 gelegen ist. Dann wird gerade der umgebende Teil 42 durch eine Gate- bzw. Tor- bzw. Gatterschaltung 40 hindurchgegeben und in einem Mehrwertspeicher 41 gespeichert. Darauf folgt die Binarisierung durch den Binarisierungsabschnitt 29, wodurch eine effiziente Verarbeitung von nur den erforderlichen Teilen des Dokumentes 17 vorgesehen wird.
- Das Ausführungsbeispiel der Fig. 8 kann somit verwendet werden, um die zeitaufwendige Binarisierung von Teilen eines abgetasten Dokumentes 17 zu vermeiden, beispielsweise von Teilen 45 der Fig. 10, von denen bekannt ist, daß sie nicht interessant sind.
- Die Ausführungsbeispiele der Erfindung sind mit Bezug auf ein Kantendetektionsfenster beschrieben worden, welches von links nach rechts gescant bzw. abgetastet wird, und die linke Kante wird als Anfangsstelle verwendet, an der die Positionen des Fenstermusters und des Bildmusters zusammenfallen. Jedoch kann die rechte Kantenstelle stattdessen verwendet werden, und zwar unter Verwendung eines umgekehrten Schwarz- Weiß- Fenstermusters, und durch Speichern der Endstelle im Speicher, an der die Positionen des Fenstermusters und des Bildmusters zusammenfallen.
Claims (8)
1. Ein Bildbinarisierungssystem das ein in einer
willkürlichen Position angeordnetes Dokument (17)
innerhalb eines zweidimensionalen Bildfeldes oder
Bildrahmens (Aufnahme) (11) auf einem schwarzen
Hintergrund abtastet und die abgetasteten
Multipegelbildsignale in binäre Signale umwandelt, wobei das
Dokument einen durch Kanten begrenzten Innenteil
aufweist die die körperlichen oder physikalischen
Grenzen des Dokumentes definieren, wobei das
Binarisiersystem folgendes aufweist:
zweite Binarisiermittel (29) zum Binarisieren von
Halbtonbildzonen oder -regionen in dem erwähnten
Innenteil des Dokumentes unter Verwendung eines
veränderlichen bzw. schwimmenden Schwellenwertes der auf
Pixeldichtepegeln basiert;
erste Binarisierungsmittel (32) zum Binarisieren von
dem Gebiet innerhalb des Rahmens entsprechenden
Bildsignalen unter Verwendung eines vorbestimmten
festen Schwellenwertes; und Detektionsmittel (33)
zur Verwendung der binarisierten Signalausgangsgröße
von den ersten Binarisiermitteln zur Durchführung
einer kontinuierlichen Detektion der Kanten des
Dokuments und zur Definition des Innenteils des
Dokuments.
2. Bildbinarisierungssystem nach Anspruch 1, wobei
folgendes vorgesehen ist:
Abtastmittel (10) zum optischen Abtasten des
Dokumentes und zum Vorsehen von
Abtastzeilenbildintensitätsdaten für jedes abgetastete Pixel des Rahmens;
erste Schwelleneinstellmittel zum Vorsehen des
festen Schwellenintensitätspegels;
zweite Schwelleneinstellmittel zum Vorsehen des
veränderlichen bzw. schwimmenden
Schwellenintensitätspegels in Beziehung stehend mit dem
durchschnittlichen Intensitätspegel eines Satzes von
Bildpixeln benachbart zu jedem abgetasteten Pixel;
wobei die ersten Binarisierungsmittel (29) Mittel
(27) aufweisen zum Vergleichen der Intensitätsdaten
der abgetasteten Pixel mit der festen
Schwellenintensität und zum Vorsehen erster Binärausgangsdaten
für jedes abgetastete Pixel;
wobei die zweiten Binarisierungsmittel (32) Mittel
(30) aufweisen zum Vergleichen der Intensitätsdaten
der abgetasteten Pixel mit der veränderlichen bzw.
schwimmenden Schwellenintensität und zum Vorsehen
zweiter binärer Ausgangsdaten für jedes abgetastete
Pixel;
wobei die Kantendetektionsmittel (33) auf die ersten
binären Ausgangsdaten ansprechen, um die Kanten des
abgetasteten Dokumentes zu detektieren; und
Mittel die auf die Detektion der Dokumentkanten
ansprechen, um die zweiten binären Ausgangsdaten für
jedes abgetastete Pixel des Bildes auf dem Dokument
zu speichern und zu verarbeiten.
3. System nach Anspruch 2, wobei die
Kantendetektionsmittel (33) ferner folgendes aufweisen:
Mittel zur Definition eines
Kantendetektionsdatenfensters, welches ein Muster aus
Binärpixeldatenwerten aufweist, und zwar repräsentativ für eine
Dokumentenkante gegenüber dem Bildrahmen;
zum Vergleichen der ersten binären
Ausgangsdaten abgeleitet aus einer Reihe oder Serie von
Abtastlinien bzw. -zeilen zum
Kantendetektionsdatenfenster und zum Indentifizieren eines Satzes von
Indentitätsabtastpositionen die eine Anzeige bilden
für die Kante des Dokumentes gegenüber dem
Bildrahmen; und
Mittel zum Extrapolieren der Oberkanten- und
Seitenkanten-Positionen des Dokumentes in dem Bildfeld und
zum Indentifizieren irgendeiner relativen Neigung
dazwischen.
4. System nach Anspruch 3, wobei ferner folgendes
vorgesehen ist:
auf die Detektion der oberen und Seitenkantenteile
des Dokumentes ansprechende Mittel um zu bewirken,
daß die zweiten Binarisierungsmittel die zweiten
binären Ausgangsdaten für einen Teil des Dokumentes
innerhalb der oberen und Seitenkantenteile vorsehen.
5. Bildbinarisierungsverfahren, das ein in einer
willkürlichen Position angeordnetes Dokument innerhalb
eines zweidimensionalen Bildbereichs oder Rahmens
auf einem schwarzen Hintergrund abtastet und die
abgetasteten Multipegel- Bildsignale in binäre Signale
umwandelt, wobei das Dokument einen Innenteil
aufweist, der durch Kanten begrenzt ist, die die
physikalischen oder körperlichen Grenzen des Dokumentes
bilden, und wobei das Binarisierungsverfahren die
folgenden Schritte aufweist:
Binarisieren der abgetasteten Bildsignale von den
Halbtonbildregionen oder -zonen in einem Innenteil
des Dokumentes unter Verwendung eines veränderlichen
bzw. schwimmenden Schwellenwertes, der auf
Pixeldichtepegeln basiert;
Binarisierung der abgetasteten Bildsignale
entsprechend dem Gebiet innerhalb des Rahmens unter
Verwendung eines vorbestimmten festen Schwellenwertes; und
Verwendung der binarisierten Signalausgangsgröße von
dem zweiten Binarisierungsschritt zur Durchführung
einer kontinuierlichen Detektion der Kanten des
Dokumentes und zur Definition des Innenteus des
Dokumentes.
6. Bildbinarisierungsverfahren nach Anspruch 5, wobei
die folgenden Schritte vorgesehen sind:
optisches Abtasten des erwähnten Dokumentes
positioniert in dem erwähnten Bildrahmen und Vorsehen von
Abtastzeilenbildintensitätsdaten für jedes
abgetastete Pixel des Rahmens;
Vorsehen eines festen Schwellenintensitätspegels;
Vorsehen eines veränderlichen bzw. schwimmenden
Schwellenintensitätspegels in Beziehung stehend mit
dem durchschnittlichen Intensitätspegel eines Satzes
von Bildpixeln benachbart zu jedem abgetasteten
Pixel;
Vergleichen der Intensitätsdaten der abgetasteten
Pixel mit der festen Schwellenintensität und
Vorsehen erster Binärausgangsdaten für jedes abgetastete
Pixel;
Vergleichen der Intensitätsdaten der abgetasteten
Pixel mit der veränderlichen Schwellenintensität und
Vorsehen zweiter Binärausgangsdaten für jedes
abgetastete Pixel;
Detektieren der Kanten des erwähnten abgetasteten
Dokumentes ansprechend auf die ersten binären
Ausgangsdaten; und
Speichern und Verarbeiten der zweiten binären
Ausgangsdaten für jedes abgetastete Pixel des Bildes
auf dem Dokument ansprechend auf die Detektion der
Dokumentenkanten.
7. Verfahren nach Anspruch 6, wobei die
Kantendetektionsschritte ferner folgende Schritte aufweisen:
Definition eines Kantendetektionsdatenfensters,
welches ein Muster aus Binärpixeldatenwerten aufweist,
und zwar repräsentativ für eine Dokumentenkante
gegenüber dem Bildrahmen;
Vergleichen der ersten binären Ausgangssdaten
abgeleitet in einer Reihe von Abtastlinien oder -zeilen
mit dem Kantendetketionsdatenfenster und
Identifizieren eines Satzes von Identitätsabtastpositionen
die eine Anzeige bilden für die Kante des Dokumentes
gegenüber dem Bildrahmen; und
Extrapolieren der Oberkanten- und
Seitenkanten-Positionen des Dokumentes in dem Bildfeld und
Identifizieren jedweder relativer Neigung dazwischen.
8. Verfahren nach Anspruch 7, wobei ferner die
folgenden Schritte vorgesehen sind:
Vorsehen der zweiten binären Ausgangsdaten für einen
Teil des Dokumentes innerhalb der oberen und
Seitenkantenteile ansprechend auf die Detektion der oberen
und Seitenkantenteile des Dokumentes.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3066918A JPH04302375A (ja) | 1991-03-29 | 1991-03-29 | 画像二値化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69220118D1 DE69220118D1 (de) | 1997-07-10 |
DE69220118T2 true DE69220118T2 (de) | 1998-01-22 |
Family
ID=13329839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69220118T Expired - Lifetime DE69220118T2 (de) | 1991-03-29 | 1992-02-20 | Bildbinarisierungssystem |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0505729B1 (de) |
JP (1) | JPH04302375A (de) |
DE (1) | DE69220118T2 (de) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19517178C1 (de) * | 1995-05-09 | 1996-11-21 | Ibm | Hintergrundbereinigung bei elektronisch abgetasteten Bildern |
DE19536170A1 (de) * | 1995-09-29 | 1997-04-03 | Ibm | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
JPH1056569A (ja) * | 1996-08-07 | 1998-02-24 | Riso Kagaku Corp | 画像処理方法および装置 |
JP4250483B2 (ja) | 2003-08-25 | 2009-04-08 | キヤノン株式会社 | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 |
US7333656B2 (en) * | 2003-11-26 | 2008-02-19 | Matsushita Electric Industrial Co., Ltd. | Image processing method and image processing apparatus |
JP2010134958A (ja) * | 2010-02-08 | 2010-06-17 | Fujitsu Ltd | 境界検出方法、プログラムおよびこれを用いた装置 |
JP5725276B2 (ja) * | 2010-08-03 | 2015-05-27 | 富士ゼロックス株式会社 | 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム |
CN104184918B (zh) * | 2013-05-27 | 2017-07-07 | 富士通株式会社 | 图像处理装置和方法以及上置式图像扫描装置 |
US9495343B2 (en) * | 2014-09-30 | 2016-11-15 | Konica Minolta Laboratory U.S.A., Inc. | Horizontal and vertical line detection and removal for document images |
CN117830315B (zh) * | 2024-03-05 | 2024-05-10 | 渭南大东印刷包装机械有限公司 | 基于图像处理的印刷机实时监控方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4193093A (en) * | 1978-08-03 | 1980-03-11 | The United States Of America As Represented By The Secretary Of The Navy | CCD camera interface circuit |
US4220972A (en) * | 1979-05-22 | 1980-09-02 | Honeywell Inc. | Low contrast object extraction device |
-
1991
- 1991-03-29 JP JP3066918A patent/JPH04302375A/ja active Pending
-
1992
- 1992-02-20 EP EP92102849A patent/EP0505729B1/de not_active Expired - Lifetime
- 1992-02-20 DE DE69220118T patent/DE69220118T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0505729B1 (de) | 1997-06-04 |
EP0505729A3 (de) | 1994-01-05 |
EP0505729A2 (de) | 1992-09-30 |
JPH04302375A (ja) | 1992-10-26 |
DE69220118D1 (de) | 1997-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69533054T2 (de) | Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften | |
DE69926205T2 (de) | Artefaktentfernungstechnik für schiefenkorrigierte bilder | |
DE3881392T2 (de) | System und Verfahren für automatische Segmentierung. | |
DE60132315T2 (de) | Verbessertes verfahren zur bildbinarisierung | |
DE69226825T2 (de) | Verbessertes automatisches Segmentieren von Bildern | |
DE69728482T2 (de) | Zweidimensionaler Codeleser | |
DE60118240T2 (de) | Methode zur bildanalyse | |
DE3633743C2 (de) | ||
DE69511507T2 (de) | Verfahren und Vorrichtung zur automatischen Bildsegmentierung unter Verwendung von Standardvergleichsmustern | |
DE3851173T2 (de) | Verfahren und Gerät zur Erkennung von Halbtonbildmustern. | |
DE69230440T2 (de) | Verfahren und gerät zur adaptiven schwellwertverarbeitung von grauskalabildern | |
DE69925354T2 (de) | Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren | |
DE60308739T2 (de) | Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik | |
DE3686821T2 (de) | Halbtonbildverarbeitungseinrichtung. | |
DE4001613A1 (de) | Binaerumsetzungsverfahren | |
DE19956158A1 (de) | Bild-Binärisierungsverfahren auf Bereichsbasis | |
DE69330354T2 (de) | Bildverarbeitung zur Bestimmung und Änderung von den Hintergrund einer abgetasteten Dokumentenvorlage darstellenden Dichtewerten. | |
DE2858688C2 (de) | ||
DE3879609T2 (de) | Verfahren und Vorrichtung zum Erkennen von kennzeichnenden Unterschieden in einem Blattmaterial. | |
DE69220118T2 (de) | Bildbinarisierungssystem | |
DE102011051934A1 (de) | Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera | |
DE69210863T2 (de) | Bildabtaster | |
DE69516255T2 (de) | Verfahren und Vorrichtung zum Lesen eines Bildes | |
DE10027737B4 (de) | Digitaler Bildverarbeitungsapparat | |
DE69015238T2 (de) | Reliefbildabtaster. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: EASTMAN KODAK CO., ROCHESTER, N.Y., US |