ITTO20121174A1 - Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili - Google Patents
Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili Download PDFInfo
- Publication number
- ITTO20121174A1 ITTO20121174A1 IT001174A ITTO20121174A ITTO20121174A1 IT TO20121174 A1 ITTO20121174 A1 IT TO20121174A1 IT 001174 A IT001174 A IT 001174A IT TO20121174 A ITTO20121174 A IT TO20121174A IT TO20121174 A1 ITTO20121174 A1 IT TO20121174A1
- Authority
- IT
- Italy
- Prior art keywords
- window
- pixels
- background
- file
- data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000012545 processing Methods 0.000 claims description 11
- 230000004807 localization Effects 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 230000010339 dilation Effects 0.000 claims description 7
- 230000003628 erosive effect Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012882 sequential analysis Methods 0.000 claims description 7
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Facsimile Image Signal Circuits (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
Description
"DISPOSITIVO E METODO DI BINARIZZAZIONE PER DOCUMENTI DI PAGAMENTO
O CONTABILI "
TESTO DELLA DESCRIZIONE
La presente invenzione riguarda un dispositivo e un metodo di binarizzazione per documenti di pagamento o contabili includenti dati sensibili rappresentati da file immagini.
Più specificatamente, l’invenzione ha per oggetto un dispositivo e un metodo di binarizzazione per documenti di pagamento o contabili che opera su file immagini con pixel significativi appartenenti a regioni del documento contenenti dati sensibili e pixel di sfondo, in accordo con la parte introduttiva delle rivendicazioni principali.
I documenti di pagamento o contabili comprendono, ad esempio, assegni bancari, distinte di pagamento, assegni di viaggio o traveller's cheque e ordini di pagamento, come i documenti per il trasferimento di denaro via Western Union or Money Gram. Tali documenti sono costituiti da moduli con informazioni base, informazioni primarie e altre informazioni stampate con inchiostro magnetico (MICR) e ottenute seguendo specifiche di stampa molto stringenti. I documenti sono a disposizione di istituti finanziari e altri enti emittenti e vengono finalizzati per il pagamento aggiungendo dati sensibili in finestre dati destinate a questo scopo.
La stampa dei dati sensibili può essere eseguita da stampanti di sportello diverse da quelle che hanno generato le informazioni base e le informazioni primarie dei moduli. È anche consentita una compilazione a mano del documento da parte dell’utente finale. La qualità di inchiostratura dei dati sensibili può essere pertanto scadente e i dati sensibili confondibili con il fondo.
Quando il documento di pagamento à ̈ inoltrato a uno sportello bancario, esso viene scannerizzato dando luogo alla formazione di un file immagine in cui l’immagine à ̈ costituita da una matrice di punti con rispettivi valori di colore/intensità (pixel). Le informazioni ottenute sono quindi trasmesse a una banca di riferimento o ad altra istituzione finanziaria per completare il processo di pagamento finale (controllo di compensazione) e immagazzinamento dei dati relativi.
Per ridurre i tempi di elaborazione e limitare le informazioni da trasmettere e immagazzinare, la scannerizzazione può essere eseguita in scala di grigio con risoluzione medio-buona, ad esempio, intorno a 200 o 300 dpi. Successivamente, le informazioni vengono binarizzate per il trattamento con macchine automatiche e per il riconoscimento dei dati sensibili con dispositivi OCR e decodificatori CAR/LAR. Tale processo risulta adeguato per le informazioni base e per le informazioni primarie dei documenti ma, nel caso di qualità di stampa scadente, la binarizzazione può portare alla perdita di dati sensibili.
Nel corso dei controlli e della verifica del documento, l’immagine del documento binarizzato à ̈ opportunamente visualizzata, consentendo all’operatore di trattare il documento in modo manuale nel caso in cui rilevi nell’immagine visualizzate difetti o assenza di dati sensibili. Ciò provoca un rallentamento del procedimento di trasmissione e memorizzazione del documento, con aumento dei costi.
D’altra parte, se le immagini venissero catturate ad alta risoluzione e/o a colori, la binarizzazione potrebbe migliorare ma il tempo richiesto diventerebbe troppo lungo con file immagine di grosse dimensioni e tempi di trasmissione più lunghi, anche nel caso di documenti perfettamente riconoscibili con scannerizzazioni meno accurate. Tale possibilità à ̈ inoltre impraticabile per le apparecchiature attualmente impiegate e che seguono standard di fatto che non prevedono la possibilità di scansioni ad alta risoluzione.
I dispositivi di binarizzazione dati generalmente utilizzati possono risultare inadeguati in particolare, ad esempio, quando i dati sensibili siano stati stampati da stampanti ad aghi, largamente impiegate per ottenere documenti multicopie in transazioni da sportello. La stampa può risultare evanescente, soprattutto quando siano stati impiegati nastri inchiostrati prossimi all’esaurimento, rendendo inefficace l’intervento dei dispositivi di binarizzazione noti.
Un oggetto della presente invenzione à ̈ quindi di realizzare un dispositivo e un metodo di binarizzazione, da file immagini, per documenti di pagamento o contabili includenti dati sensibili, in cui tale dispositivo comprende mezzi di identificazione finestra per identificare e localizzare dal file immagine una finestra dati con pixel significativi che rappresentano dati sensibili e pixel di sfondo finestra, mezzi di stima sfondo per stimare il contributo dello sfondo nei pixel appartenenti alla finestra individuata e mezzi per elaborare il file finestra in accordo con le parti caratteristiche delle rivendicazioni principali.
Le caratteristiche dell'invenzione risulteranno chiare dalla descrizione che segue, fatta a titolo esemplificativo ma non limitativo, con l'ausilio degli annessi disegni, in cui:
Fig. 1 à ̈ una vista prospettica di un’apparecchiatura per il trattamento automatico di documenti di pagamento o contabili che impiega il dispositivo di binarizzazione in accordo con l’invenzione;
Fig. 2 mostra un documento di pagamento trattato dall’apparecchiatura di Fig.1;
Fig. 2a rappresenta un’immagine digitale del documento di Fig. 2 in una fase di trattamento da parte dell’apparecchiatura di Fig.1;
Fig. 2b rappresenta un’immagine digitale del documento di Fig. 2, binarizzata dal dispositivo di binarizzazione dell’invenzione, in accordo con un primo esempio di esecuzione;
Fig. 3 Ã ̈ uno schema del documento di Fig.2;
Fig. 3a mostra un dettaglio del documento di Fig.2;
Fig. 3b rappresenta alcuni dettagli dello schema di Fig.3;
Fig. 4 Ã ̈ un altro dettaglio del documento di Fig.2;
Fig. 4a mostra una elaborazione del dettaglio di Fig. 4 in una fase operativa del dispositivo di binarizzazione dell’invenzione;
Fig. 4b à ̈ una elaborazione del dettaglio di Fig.4 in un’altra fase operativa del dispositivo dell’invenzione;
Fig. 4c rappresenta una binarizzazione del dettaglio di Fig. 4 da parte del dispositivo dell’invenzione;
Fig. 4d à ̈ una binarizzazione del dettaglio di Fig.4 secondo l’arte nota; Fig. 5 mostra un altro documento di pagamento trattato dall’apparecchiatura di Fig.1;
Fig. 5a rappresenta un’immagine digitale del documento di Fig. 5 in una fase di trattamento da parte dell’apparecchiatura di Fig.1;
Fig. 5b rappresenta un’immagine digitale del documento di Fig. 5, binarizzata dal dispositivo di binarizzazione dell’invenzione, in accordo con un secondo esempio di esecuzione;
Fig. 6 Ã ̈ uno schema del documento di Fig.5;
Fig. 6a mostra un dettaglio del documento di Fig.5;
Fig. 6b rappresenta una binarizzazione di alcuni dettagli del documento di Fig. 5 da parte del dispositivo dell’invenzione;
Fig. 7 à ̈ uno schema a blocchi del dispositivo di binarizzazione dell’invenzione; e
Fig. 8 mostra un diagramma di flusso del metodo di binarizzazione dell’invenzione.
DESCRIZIONE GENERALE
La Fig. 1 mostra un’apparecchiatura 31 per il trattamento automatico di documenti di pagamento, rappresentati con 32, che impiega il dispositivo di binarizzazione in accordo con l’invenzione.
In estrema sintesi, l’apparecchiatura 31 comprende un vassoio d’ingresso 33 per i documenti da trattare e un vassoio di raccolta 36 per i documenti trattati e definisce un percorso 37 di movimentazione documenti tra il vassoio d’ingresso 33 e il vassoio di raccolta 36.
Lungo il percorso 37 sono disposti sensori di movimento, una o più testine di lettura per eventuali caratteri stampati con inchiostro magnetico, uno o due sensori d’immagine, schematicamente indicati con 38 e una stampante per la stampa della transazione effettuata e l’annullamento del documento. Il sensore o i sensori 38 sono, ad esempio, del tipo noto come CIS (Contact Image Sensor), disposto o disposti trasversalmente al percorso 37, per scannerizzare l’immagine di una faccia o di entrambe le facce del documento 32 in transito.
L’apparecchiatura 31 à ̈ di tipo noto e può essere costituita da uno scanner LS 150 prodotto dalla Società Richiedente CTS Electronics S.p.A. per trattare documenti finanziari quali assegni, bollette, bollettini postali e ordini di pagamento (quali ad esempio Money Order). La scannerizzazione à ̈ a scala di grigio, con risoluzione fino a 300 dpi.
L’apparecchiatura 31 ha una sua unità elettronica di controllo ed à ̈ collegata ad un terminale di sportello, non mostrato, dotato di visualizzatore, generalmente collegato ad un server locale, a sua volta in collegamento con un sistema centrale remoto. All’apparecchiatura 31 à ̈ associato un dispositivo di binarizzazione 39 (Ved. Fig.7), di tipo software, per binarizzare le immagini scannerizzate dei documenti trattati prima dell’inoltro al sistema centrale. Il dispositivo di binarizzazione 39 può avere parti operative nella stessa apparecchiatura 31 e/o nel terminale locale e/o nel server.
Le informazioni binarizzate dall’apparecchiatura 31 sono quindi trasmesse al sistema centrale della banca o della istituzione finanziaria, in modo noto, per completare il processo di pagamento finale (controllo di compensazione) e immagazzinare i dati relativi.
In Fig. 2 à ̈ mostrato un documento 32, rappresentato da un ordine di pagamento 41, ampiamente utilizzato per regolare transazioni commerciali e per pagare acquisti, trattabile dall’apparecchiatura 31 di Fig.1. Come schematizzato in Fig.3, l’ordine di pagamento 41 à ̈ costituito da un modulo (template) con informazioni base 42, 43, 44 e 46 includenti immagini e caratteri alfanumerici riguardanti l’ente emittente, tipologia del documento, indicazioni di pagamento e numero progressivo del documento. Sono anche riportate informazioni primarie 47 e 48 includenti, ad esempio, il nome e l’indirizzo del beneficiario e altre informazioni 49 stampate con inchiostro magnetico (MICR). Nell’ordine di pagamento 41 à ̈ inoltre previsto uno spazio o finestra dati 51 per dati sensibili, ad esempio riguardanti l’importo da pagare, a fianco di un rispettivo simbolo di valuta 52.
In Fig. 5 à ̈ mostrato un altro documento 32, rappresentato da un ordine di pagamento 54, anch’esso di ampia diffusione per transazioni commerciali e acquisti, trattabile dall’apparecchiatura 31 di Fig. 1. In Fig. 6, l’ordine di pagamento 54 à ̈ costituito schematicamente da un modulo con informazioni base 56, 57, 58, 59 e 61 includenti immagini e caratteri alfanumerici riguardanti l’ente emittente e un rispettivo logo, tipologia del documento, indicazioni di pagamento e numero progressivo del documento. Anche l’ordine di pagamento 54 riporta informazioni primarie 62 e 63 includenti, ad esempio, il nome e l’indirizzo del beneficiario e altre informazioni 64 stampate con inchiostro magnetico (MICR). Il modulo 51 include inoltre uno spazio o finestra dati 66 per dati sensibili formati da caratteri alfanumerici, ad esempio l’importo da pagare, la data di emissione e numeri di controllo.
Ordini di pagamento 41, 54 con i moduli dei tipi sopra citati, parzialmente riempiti con le informazioni base e le informazioni primarie sono a disposizione di istituti finanziari e vengono finalizzati per il pagamento aggiungendo i relativi dati sensibili nei rispettivi spazi 51 e 66 ed eventualmente altre informazioni.
Gli ordini di pagamento 41 e 54 includono dati sensibili che possono essere compilati tramite stampanti di sportello diverse da quelle che hanno generato le informazioni base o manualmente dall’utente. La qualità di stampa o di scrittura (inchiostratura) può essere scadente e i dati sensibili confondibili con il fondo, pur essendo riconoscibili visivamente. Ciò consente la circolazione dei documenti fino alla presentazione allo sportello bancario per le operazioni di controllo, accredito e annullamento, ma può provocare problemi nel trattamento con macchine automatiche in tali operazioni.
Nel caso specifico, gli ordini di pagamento 41, 54 vengono scannerizzati dall’apparecchiatura 31 (Figg. 1 e 7) con formazione di file immagini matriciali ScIm. Per ridurre i tempi di elaborazione e limitare le informazioni da trasmettere e immagazzinare, la scannerizzazione à ̈ eseguita con una risoluzione, ad esempio di 200 o 300 DPI, e informazione rappresentata a 8 bit, ossia 256 livelli di grigio. Il file immagine ScIm include in particolare pixel significativi, rappresentativi delle informazioni base e primarie e dei dati sensibili, e pixel di sfondo del documento.
Il dispositivo di binarizzazione 39 (Fig. 7) ha una prima sezione 71 che provvede a binarizzare l’immagine scannerizzata ScIm per il successivo trattamento con macchine automatiche in locale e per il riconoscimento dei dati sensibili con dispositivi OCR e decodificatori CAR/LAR. In particolare la sezione 71 ha una memoria 72 per l’immagine ScIm, memorizzata come file immagine scannerizzata StIm, una parte 73 che identifica i pixel di sfondo e da sottrarre al file immagine ScIm e un ultimo stadio 74, di binarizzazione dell’immagine privata dal contributo dello sfondo, che genera un file immagine binarizzata PrBn.
Per l’ultimo stadio di binarizzazione 74, la sezione 71 può utilizzare software di tipo noto come, ad esempio il metodo Niblack o il metodo Sauvola o il metodo di Otsu. Tale processo à ̈ adeguato per riconoscere le informazioni base e le informazioni primarie ma, nel caso di qualità di stampa scadente dei dati sensibili, la binarizzazione può comportare la perdita di dati.
Si à ̈ d’altra parte costatato che l’applicazione del metodo proposto all’intero documento non consente, in alcuni casi, di distinguere dallo sfondo i pixel significativi riguardanti i dati sensibili. L’impiego di scannerizzazioni ad alta risoluzione e/o a colori non à ̈ peraltro conveniente, per quanto à ̈ stato precedentemente riportato.
Il principio che sta alla base dell’invenzione prende spunto dal fatto che i dati sensibili sono stampati in aree ben definite dei moduli che costituiscono i documenti da binarizzare, ed à ̈ possibile identificare la finestra dati a partire dall’intero documento. Opportunamente, si impiegano operazioni morfologiche sui pixel di tale finestra al fine di eliminare il contributo dello sfondo, la binarizzazione e il filtraggio di pixel spuri che consentono di evidenziare i pixel significativi rispetto agli altri pixel della finestra anche nelle peggiori situazioni di stampe evanescenti dei dati sensibili.
Sulla base di queste considerazioni, si à ̈ osservato che, per alcuni moduli, ad esempio quelli simili agli ordini di pagamento 41, i dati sensibili relativi agli importi sono a fianco dei simboli di valuta e i limiti della finestra dati possono essere determinati in modo agevole dalla posizione di un punto di riferimento data dal simbolo di valuta stesso nel file immagine. Per moduli simili agli ordini di pagamento 54 si sono prese in considerazione, al fine di identificare i dati sensibili, immagini identificative grafiche o testuali, ad esempio il logo o la scritta dell’ente emittente. Alle immagini identificative sono state associate informazioni di localizzazione della finestra dati rilevate sui moduli stessi e riferiti a punti di riferimento delle immagini identificative e si à ̈ creata una banca dati dei moduli riconoscibili.
In accordo con l’invenzione, il dispositivo di binarizzazione 39 comprende pertanto una memoria immagini valuta e moduli 76, mezzi di identificazione finestra 77, mezzi di stima sfondo 78, mezzi di sottrazione sfondo finestra 79, mezzi di binarizzazione file finestra 81, mezzi di filtraggio 82, e mezzi di unione file 83.
La memoria immagini valuta e moduli 76 contiene i dati della banca dati dei moduli riconoscibili, con le rispettive indicazioni delle valute e delle immagini identificative.
I mezzi di identificazione finestra 77 sono designati per identificare e localizzare nel file immagine StIm un sottoinsieme avente i pixel significativi dei dati sensibili. Tale sottoinsieme viene isolato come file immagine finestra WnIm.
I mezzi di stima sfondo 78 sono previsti per stimare nel file immagine finestra WnIm un contributo dello sfondo BcWn. I mezzi di sottrazione sfondo finestra 79, a loro volta, sottraggono tale contributo BcWn dal file finestra WnIm, determinando un file finestra senza sfondo. I mezzi di binarizzazione 81 binarizzano il file finestra, dove i pixel significativi sono messi in evidenza rispetto a pixel di sfondo residui della finestra, ottenendo un file finestra binarizzato WnBn. I mezzi di filtraggio 82 provvedono infine a filtrare pixel spuri nel file finestra senza sfondo e binarizzato, formando un file finestra filtrato e binarizzato FlWn 81.
I mezzi di stima sfondo 78 comprendono mezzi di analisi sequenziale 84, mezzi di dilatazione pixel 86 e successivi mezzi di erosione pixel 87. I mezzi di analisi sequenziale 84 provvedono ad una analisi sequenziale per gruppi di pixel del file finestra WnIm, applicando operatori morfologici, in cui i mezzi di dilatazione pixel 86 espandono i bordi delle regioni dei pixel con maggior contributo dell’immagine, mentre i mezzi di erosione pixel 87 provvedono ad una successiva erosione per la determinazione di una stima dello sfondo del file finestra.
I mezzi di identificazione finestra 77 comprendono in particolare mezzi di identificazione simbolo di valuta 89 realizzate con tecniche di template matching, mezzi di riconoscimento e localizzazione logo 91 e mezzi di delimitazione finestra 92.
I mezzi di identificazione simbolo di valuta 89 identificano nei file StIm o PrBn dei documenti simili agli ordini 41, per confronto con i dati della memoria 76, il simbolo di valuta 52 (il dollaro $ nell’esempio) e, sulla base della posizione di un pixel di riferimento Xv, Yv, i mezzi di delimitazione finestra 92 aggiungono dati di localizzazione Ev1; Ev2, Ev3 ed Ev4 (Fig. 3b) per i margini: sinistro, destro, alto e basso della finestra dati 51.
I mezzi di riconoscimento e localizzazione logo 91 identificano nei file StIm o PrBn dei documenti simili agli ordini 54, per confronto con i dati della memoria 76, le informazioni di localizzazione della finestra dati associati agli stessi loghi. I mezzi di delimitazione finestra 92 estraggono dalla memoria 76 i dati di localizzazione Ew1; Ew2, Ew3 ed Ew4 (Fig.6) e definiscono i margini: sinistro, destro, alto e basso della finestra dati 66 rilevata sui moduli riconoscibili.
Il dispositivo di binarizzazione 39 può anche comprendere mezzi di integrazione pixel 93 per integrare, ai pixel significativi, pixel mancanti sulla base di elaborazioni vettoriali per una migliore riconoscibilità e binarizzazione dei dati sensibili.
Il dispositivo di binarizzazione 39 comprende inoltre mezzi di stima sfondo dell’immagine completa 94 nel caso in cui i mezzi di identificazione e localizzazione finestra 77 non riconoscano nella memoria 76 né il simbolo di valuta né alcuna immagine identificativa. I mezzi di stima sfondo dell’immagine completa 94 attivano i mezzi di stima sfondo 78 sopra definiti, i mezzi di sottrazione sfondo finestra 79, i mezzi di binarizzazione 81 e i mezzi di filtraggio 82 per l’intero file immagine del documento,.
I mezzi di binarizzazione primaria 74 possono ad esempio utilizzare nel processo di binarizzazione, dopo la sottrazione del contributo dello sfondo, il metodo di Otsu, il metodo Niblack o il metodo Sauvola.
Con una correzione del tipo sopra definito, il file binarizzato può essere ottenuto affidabilmente da scannerizzazione del documento con una risoluzione minima, ad esempio, di 200 dpi.
Il metodo di binarizzazione 101 (Figg. 7 e 8) in accordo con l’invenzione comprende pertanto una fase iniziale 102 in cui l’apparecchiatura 31 scannerizza il documento di pagamento 32, generando il file finestra ScIm, memorizzato nella memoria 72 come file immagine StIm in una fase 103. In una fase 104 si stima il contributo dello sfondo del file ScIm e lo si sottrae da tale file e, in una fase 106, il file risultante dalla sottrazione dello sfondo viene binarizzato dando luogo al file PrBn. Le visualizzazioni dei file PrBn sono rappresentate in Fig.2a con PrBn-41 per i documenti dagli ordini di pagamento 41 e con PrBn-54 in Fig. 5a per i documenti dagli ordini di pagamento 54. Da tali immagini risulta evidente che i dati sensibili non sono più evidenziati nelle rispettive finestre 51 e 56.
Il metodo di binarizzazione 102 (Figg. 7 e 8) comprende in particolare un bivio 107 in cui l’immagine StIm o l’immagine PrBn viene confrontata con le immagini della memoria 72 per identificare il simbolo di valuta. In caso positivo, fase 108, si procede con il calcolo e la localizzazione della finestra dati 51. In caso di mancato riconoscimento del simbolo, si procede con un bivio 109 in cui l’immagine StIm o l’immagine PrBn viene confrontata con le immagini della memoria 72 per identificare il file dell’immagine 56 o del logo 57. In caso positivo, fase 111, si estraggono dalla memoria i dati di localizzazione della finestra 54 associati al logo o all’immagine identificativa.
Dopo la localizzazione della finestra 51 o 66, si memorizza l’immagine della finestra dati come file WnIm, in una fase 112, e si procede ad una fase di stima sfondo finestra 113.
Segue una fase 114 in cui si sottrae la stima dei pixel di sfondo della finestra dai pixel del file finestra, con formazione di un file finestra senza sfondo avente pixel significativi in evidenza rispetto a pixel di sfondo residui della finestra. In una fase 117, si binarizza il file finestra senza sfondo formando il file WnBn, mentre, in una fase 116, si filtrano nel file finestra senza sfondo e binarizzato pixel spuri indicativi di rumore. Infine, in una fase 118 si uniscono i file WnBn e PrBn, generando il file di unione binarizzato MrBn.
Le visualizzazioni dei file MrBn sono rappresentate in Fig. 2b con MrBn-41 per i documenti da simili agli ordini 41, e con MrBn-54 in Fig.5b per i documenti simili agli ordini 54, con piena evidenza dei dati sensibili nelle rispettive finestre 51 e 66.
In dettaglio, la fase di stima sfondo finestra 113 comprende una fase di analisi sequenziale 121 per gruppi di pixel, applicazione, nel file finestra 51 (Ved. Fig. 4), di operatori morfologici con dilatazione di ciascun gruppo di pixel in una fase 122, e successiva erosione del gruppo di pixel in una fase 123. Ciò per una correzione dei pixel significativi.
In Fig. 4a à ̈ rappresentata con 51-Ex il file finestra dopo la fase di dilatazione ed espansione (in particolare la stima dello sfondo) e, in Fig. 4b, à ̈ indicato con 51-Er il file finestra dopo l’azione di sottrazione dello sfondo stimato.
In Fig. 4c à ̈ rappresentato con 51-Sb il file finestra dopo l’azione di binarizzazione attraverso, ad esempio, l’utilizzo dell’algoritmo di Otsu, con dati sensibili ben riconoscibili ancora prima della succesiva fase di filtraggio. In Fig.4d à ̈ infine mostrato come 51-NcBn, con dati sensibili non riconoscibili, la rappresentazione del file finestra se si applicasse il solo algoritmo di binarizzazione senza sottrazione dello sfondo.
Qualora nel bivio 109 (Fig. 8) non sia stata riconosciuta alcuna immagine identificativa del modulo, il metodo 101 prevede la fase di stima dello sfondo globale 126 comprendente, nel file StIm, una fase di analisi sequenziale 127 per gruppi di pixel e l’applicazione di operatori morfologici con dilatazione di ciascun gruppo di pixel in una fase 128 ed erosione in una fase 129.
A queste fasi, seguono: una fase 130, uguale alla fase 114, una fase di binarizzazione 131, uguale alla fase 116 e una fase 132. Nella fase 130 si determina e si sottrae il contributo dello sfondo dai pixel del file StIm, con formazione di un file documento senza sfondo avente pixel significativi in evidenza rispetto a pixel di sfondo residui della finestra. Nella fase 131 si binarizza il file documento senza sfondo, mentre nella fase 132 si filtrano nel file documento senza sfondo e binarizzato i pixel spuri indicativi di rumore, formando il file MrBn.
Il dispositivo e il metodo dell’invenzione sono realizzati come applicazione software eseguita come strumento autonomo di editing di immagini digitali o può essere incorporato in altre applicazioni di editing disponibili per fornire funzionalità avanzate per le applicazioni di editing di immagini digitali.
Il software può includere moduli di programma comprensivi di routine, programmi, oggetti componenti, strutture di dati, ecc ed essere realizzato come codice di programma leggibile da computer memorizzato su un supporto leggibile. Il programma può essere anche distribuito in rete o in sistemi informatici accoppiati in modo da poter essere memorizzato ed eseguito in modo distribuito.
Naturalmente, fermo restando il principio del trovato, le forme di attuazione e i particolari di realizzazione potranno essere ampiamente variati rispetto a quanto à ̈ stato descritto e illustrato a puro titolo di esempio non limitativo, senza per questo uscire dall’ambito della presente invenzione.
Claims (10)
- RIVENDICAZIONI 1. Dispositivo di binarizzazione per documenti di pagamento o contabili includenti dati sensibili, in cui detti documenti sono rappresentati da file immagini con pixel significativi associati ai dati sensibili e pixel di sfondo e in cui i dati sensibili sono localizzati in una rispettiva finestra dati e possono essere costituiti da caratteri alfanumerici, il suddetto dispositivo comprendendo mezzi di binarizzazione primaria per ottenere file immagini binarizzati dei documenti ed essendo caratterizzato da ciò che comprende mezzi di memoria per memorizzare, relativamente ad una serie di moduli, file di identificazione aventi immagini identificative e informazioni di localizzazione identificative della tipologia del documento e di localizzazione riguardanti la finestra dati; mezzi di identificazione finestra per identificare e localizzare nel file immagine, per confronto con i file di identificazione, un file finestra includente i pixel significativi rappresentati dai dati sensibili; mezzi di stima sfondo per stimare il contributo dello sfondo fra i pixel del file finestra; mezzi di sottrazione sfondo finestra per sottrarre il contributo dello sfondo dal file finestra, formando un file finestra senza sfondo avente pixel significativi in evidenza rispetto a pixel di sfondo residui; mezzi di binarizzazione per binarizzare il file finestra senza sfondo con formazione di un file finestra binarizzato; mezzi di filtraggio per filtrare pixel spuri dal file finestra senza sfondo, formando un file finestra filtrato; e mezzi di unione per unire il file immagine binarizzato del documento con il file finestra binarizzato; ed in cui i mezzi di stima sfondo comprendono mezzi per un’analisi sequenziale su gruppi di pixel, applicando operatori morfologici di dilatazione di ciascun gruppo di pixel e successiva erosione del suddetto gruppo di pixel per una stima del contributo dello sfondo della finestra da sottrarre ai pixel della finestra in esame.
- 2. Dispositivo di binarizzazione in accordo con la rivendicazione 1 caratterizzato da ciò che le immagini identificative comprendono il logo o altra immagine grafica o testuale identificativa dell’ente emittente e in cui i mezzi di identificazione finestra identificano e localizzano la finestra dati in risposta ai dati di localizzazione associati al logo o altra immagine grafica o testuale riconosciuta.
- 3. Dispositivo di binarizzazione in accordo con la rivendicazione 1 o 2 caratterizzato da ciò che comprende mezzi di memoria per una immagine simbolo di valuta presente in dati documenti di pagamento o contabili e mezzi di analisi documento per riconoscere in un file immagine da binarizzare la suddetta immagine simbolo di valuta e una rispettiva posizione dati e in cui i mezzi di identificazione finestra localizzano e definiscono la finestra dati in risposta alla posizione dati dell’immagine simbolo di valuta.
- 4. Dispositivo di binarizzazione in accordo con la rivendicazione 3 caratterizzato da ciò che i mezzi di identificazione finestra localizzano e definiscono la finestra dati aggiungendo parametri di localizzazione bordi alla posizione dati dell’immagine simbolo di valuta.
- 5. Dispositivo di binarizzazione in accordo con una delle rivendicazioni precedenti caratterizzato da ciò che comprende mezzi per integrare ai pixel significativi pixel mancanti sulla base di elaborazioni vettoriali per una migliore riconoscibilità e binarizzazione dei dati sensibili.
- 6. Dispositivo di binarizzazione in accordo con una delle rivendicazioni precedenti caratterizzato da ciò che, in assenza di identificazione della finestra dati, i mezzi di stima sfondo, i mezzi di sottrazione dello sfondo e i mezzi di filtraggio operano sull’intero file immagine del documento.
- 7. Dispositivo di binarizzazione in accordo con una delle rivendicazioni precedenti caratterizzato da ciò che i mezzi di binarizzazione sono del tipo operante in accordo con un algoritmo di Otsu.
- 8. Dispositivo di binarizzazione in accordo con una delle rivendicazioni precedenti caratterizzato da ciò che i mezzi di binarizzazione primaria seguono il metodo Niblack o il metodo Sauvola o il metodo di Otsu.
- 9. Dispositivo di binarizzazione in accordo con una delle rivendicazioni precedenti caratterizzato da ciò che il file immagine à ̈ ottenuto per scannerizzazione del documento con una risoluzione minima di 200 dpi.
- 10. Metodo di binarizzazione per documenti di pagamento o contabili includenti dati sensibili, rappresentati da file immagini con pixel significativi associati ai dati sensibili e pixel di sfondo del documento, ed in cui i dati sensibili sono localizzati in una rispettiva finestra dati, il suddetto metodo essendo caratterizzato da ciò che comprende i seguenti passi: prevedere mezzi di memoria per memorizzare, relativamente ad una serie di moduli documento, file di identificazione aventi immagini identificative e informazioni di localizzazione associate alla tipologia del documento e alla localizzazione riguardanti la finestra dati; identificare e localizzare nel file immagine, per confronto con i file di identificazione, un file finestra includente i pixel significativi dei dati sensibili e pixel di sfondo della finestra dati; stimare il contributo dello sfondo fra i pixel del file finestra; sottrarre lo sfondo stimato dai pixel del file finestra con formazione di un file finestra senza sfondo avente pixel significativi in evidenza rispetto a pixel di sfondo residui della finestra; binarizzare il file finestra privato del contributo dello sfondo con formazione di un file finestra binarizzato; e filtrare nel file finestra senza sfondo pixel spuri, formando un file finestra filtrato; e in cui la stima dello sfondo comprende un’analisi sequenziale per gruppi di pixel, applicando, nel file finestra, operatori morfologici di dilatazione di ciascun gruppo di pixel e successiva erosione del suddetto gruppo di pixel.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT001174A ITTO20121174A1 (it) | 2012-12-31 | 2012-12-31 | Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili |
US14/143,746 US9171205B2 (en) | 2012-12-31 | 2013-12-30 | Device and method of binarization for payment or accounting documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT001174A ITTO20121174A1 (it) | 2012-12-31 | 2012-12-31 | Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili |
Publications (1)
Publication Number | Publication Date |
---|---|
ITTO20121174A1 true ITTO20121174A1 (it) | 2014-07-01 |
Family
ID=47953619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT001174A ITTO20121174A1 (it) | 2012-12-31 | 2012-12-31 | Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili |
Country Status (2)
Country | Link |
---|---|
US (1) | US9171205B2 (it) |
IT (1) | ITTO20121174A1 (it) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017050594A1 (en) * | 2015-09-10 | 2017-03-30 | Koninklijke Philips N.V. | Automatic image feature removal |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
CN109034149A (zh) * | 2017-06-08 | 2018-12-18 | 北京君正集成电路股份有限公司 | 一种字符识别方法及装置 |
US10922537B2 (en) * | 2018-05-01 | 2021-02-16 | Scribe Fusion, LLC | System and method for processing and identifying content in form documents |
US10528807B2 (en) * | 2018-05-01 | 2020-01-07 | Scribe Fusion, LLC | System and method for processing and identifying content in form documents |
CN108830186B (zh) * | 2018-05-28 | 2021-12-03 | 腾讯科技(深圳)有限公司 | 文本图像的内容提取方法、装置、设备及存储介质 |
US11200411B2 (en) * | 2019-10-16 | 2021-12-14 | The Toronto-Dominion Bank | Training a card type classifier with simulated card images |
US11144752B1 (en) * | 2020-05-12 | 2021-10-12 | Cyxtera Cybersecurity, Inc. | Physical document verification in uncontrolled environments |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7949176B2 (en) * | 2008-01-18 | 2011-05-24 | Mitek Systems, Inc. | Systems for mobile image capture and processing of documents |
EP2682901A4 (en) * | 2011-03-04 | 2014-09-03 | Glory Kogyo Kk | CUTTING PROCEDURE FOR TEXT ELEMENTS CUTTING DEVICE FOR TEXT ELEMENTS |
-
2012
- 2012-12-31 IT IT001174A patent/ITTO20121174A1/it unknown
-
2013
- 2013-12-30 US US14/143,746 patent/US9171205B2/en active Active
Non-Patent Citations (4)
Title |
---|
A. DE JESUS ET AL: "Segmentation of Brazilian bank check logos without a priori knowledge", PROCEEDINGS INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY: CODING AND COMPUTING (CAT. NO.PR00540), 1 January 2000 (2000-01-01), pages 259 - 263, XP055072848, ISBN: 978-0-76-950540-4, DOI: 10.1109/ITCC.2000.844231 * |
DONG LIU ET AL: "Binarizing the Courtesy Amount Field on Color Chinese Bank Check Images", 2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, 1 September 2011 (2011-09-01), pages 774 - 778, XP055072408, ISBN: 978-1-45-771350-7, DOI: 10.1109/ICDAR.2011.160 * |
INES BEN MESSAOUD ET AL: "New Binarization Approach Based on Text Block Extraction", 2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, 1 September 2011 (2011-09-01), pages 1205 - 1209, XP055071847, ISBN: 978-1-45-771350-7, DOI: 10.1109/ICDAR.2011.243 * |
R. JAYADEVAN ET AL: "Automatic processing of handwritten bank cheque images: a survey", INTERNATIONAL JOURNAL OF DOCUMENT ANALYSIS AND RECOGNITION (IJDAR), vol. 15, no. 4, 16 December 2012 (2012-12-16), pages 267 - 296, XP055071850, ISSN: 1433-2833, DOI: 10.1007/s10032-011-0170-8 * |
Also Published As
Publication number | Publication date |
---|---|
US20140185909A1 (en) | 2014-07-03 |
US9171205B2 (en) | 2015-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ITTO20121174A1 (it) | Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili | |
US8180137B2 (en) | Comparison of optical and magnetic character data for identification of character defect type | |
US7657091B2 (en) | Method for automatic removal of text from a signature area | |
JP2010225013A (ja) | 記番号認識装置、紙葉類処理装置、自動取引処理装置、及び記番号認識方法 | |
JP5241650B2 (ja) | 記番号認識装置、および紙葉類処理装置 | |
WO1994006102A1 (en) | Security document inspection | |
CN103729656A (zh) | 印鉴印痕的鉴别方法及鉴别系统 | |
US9436937B1 (en) | Highlight-based bill processing | |
CN112395995A (zh) | 一种根据移动财务票据自动填单及审核的方法及系统 | |
US20130182937A1 (en) | Optical waveform generation and use based on print characteristics for micr data of paper documents | |
EP2748754B1 (en) | Forensic authentication system and method | |
Chhabra et al. | Detecting fraudulent bank checks | |
US20160005008A1 (en) | Intelligent check deposit machine | |
US20170217208A1 (en) | Negotiable instruments with intelligent microprint | |
JP6202285B2 (ja) | 印刷物処理方法及び印刷物処理装置 | |
CN106161828A (zh) | 一种用于对证件进行安全信息标注的复印方法及复印机 | |
TWI684157B (zh) | 一種基於行動載具之智能理賠系統 | |
Sharma et al. | To study and compare the security features present in Canadian, Dubai and Indian cheque and limitation with suggestions | |
ALAMERİ et al. | Computational methods for forgery detection in printed official documents | |
US9367760B2 (en) | Coarse document classification in an imaging device | |
JP6039944B2 (ja) | 帳票種類判別装置および帳票種類判別方法 | |
JP3885885B2 (ja) | 有価証券の画像処理装置及び画像処理方法 | |
Koerich et al. | Automatic extraction of filled information from bankchecks | |
Koerich et al. | Automatic extraction of filled-in information from bankchecks based on prior knowledge about layout structure | |
CN205451261U (zh) | 带纸币厚度检测系统的纸币操作装置及现金自动交易装置 |