[go: up one dir, main page]

JPS5945585A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5945585A
JPS5945585A JP57155039A JP15503982A JPS5945585A JP S5945585 A JPS5945585 A JP S5945585A JP 57155039 A JP57155039 A JP 57155039A JP 15503982 A JP15503982 A JP 15503982A JP S5945585 A JPS5945585 A JP S5945585A
Authority
JP
Japan
Prior art keywords
memory
dictionary
character
counter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57155039A
Other languages
English (en)
Inventor
Kiyohiko Kobayashi
清彦 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57155039A priority Critical patent/JPS5945585A/ja
Publication of JPS5945585A publication Critical patent/JPS5945585A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、t、す数の文字]:)イ・1・に[−(1−
ろ文字、;ハ、゛、′:対象とし、それぞれの文字グ1
体に対114、“4゛ろ辞1“゛データを用いて文字の
昭6・幾を行なう9′ン翻、:、’j、 、Ml輝〕に
閂する。
最近の光学文字i′’pヱ1,1、ち′!1セトパでは
、/θ0〕η字/秒P度の高速処理4・要求されろため
、i−、、’、:みとつに一文字の特<C’<パラメー
タと辞:i’l−1:−りとt)) =y 、、) f
゛7グも高速処理を一升求される。(;ぜパのI4゛4
゛:1体に祠する文字を認WWt対角とするいわゆろマ
ル1−)」ントOCRにおいても、高速処理1がf1求
さス1.益み月7つり文字の111?徴パラノークのマ
ツチングをl’lY 2”+データごとに逐次処理する
ことでは宏バ!:、されろ高1−!μ・!L理が達成で
きない。このため高価な高速It A M(またはRO
M )を1[1いて、マツチングを並列処理することが
考えられるが、L・1πj弓ド1さとする文字書体の種
類を増やすという」k゛、・求もφばナラてきており、
そのようなマルチフォントOCRでは多数の高速RAM
を必要とするという問題があった。
本発明は上記事情を考慮してなされたもので、認識対象
とする文字n体の抽類が増えても高価な高速メモリを必
要最小限に抑えた上で高速文字認識が可能−γ″ある文
字認識装置を提供することを目的とする。
本発明は次に示す経験則を前提としている。
■マルチフォン)OCRにおいても、ひとつの$県中に
混在する文字書体の種部は多くて2〜3種類であり、す
べての文字書体が混在することはほとんどないこと。
■異なった文字病体の辞書データを用いて文字のj’t
j:4i訣をおこなったときは、リジェクトが続出ずろ
という特徴があること。
本発明はこれら経、lj%則をふオえて、並列処理に用
いろ、λ°で1速メモリを、2〜3種類の辞朗、データ
を格納でAる容叶にとどめ、リジェクトが読出1〜たと
きはこれら辞書データを他の種部の辞書データと交換l
〜て、高速文字認識の実現をしようとするものである。
本発明を図示の01111例にノ、1−づいマコ、す1
1する。
OCRコントローラlθOはつ“(−学夕1字i′勺+
’9 、(〕川用全体を制御するものであり、+1r1
常マイコンで41°・′1′成膏れるう文字91体のi
7(居f−タUよl:i’、i”j!)ご1−リ/θシ
と補助音別メモリ/θA(/こ分&Jて1、!1□i7
’i ;’7 ;IT、てい7)。主辞書メモリ10S
は文字冒i:I’&のマツ′−ンクトr: 用イラれる
辞キ;1データを格納したもので、例えば2種類の辞書
データを格納すべり41/、にバイトの81j4.を有
し、並列処理を可能とするため、)1価な品津RA )
、qにて(性成されていて、辞1fr検パスプロセッサ
lθ/内にある。補助辞書メモリ/θAQ土主Fl’j
”:°;メモリ10左に格納さイ′シた辞−1°f−タ
以外の文′jづ1体の辞書データを格納したもの1.1
名速処理さitろ)14要はないた。め、安価な低速大
容)、1メ′6リーp )+!成さi+、ろ。
カウンタ102&ま夕: ’t” N?j2辱哉のリジ
ェクト数全カウントするもので、木″!叉L・h丁′;
11ではレジスタlθすIrC1乙I内された?、71
 Mf直をセラl−L、リジェクト−)く芦3ころ7及
びVこデクリメントするようにしCいろ。フリップフロ
ップlO5はカウンタ10ユのボロー(にi’4により
セットされるように、00 Rコントローラlθθから
の読Jlp %+4作指示信月によりリセットさiLろ
ように接続されている。
OCRコントローラ100がスキャナ(図示せず)如対
して1す(票の7行分の文字列の読取動作を指示するt
元取動作指示信号7.2を発生する。この読取動(’l
l個信号2により、7行分の文字列の中でのりジェクト
数をカウントするカウンタ102&て、レジスタ101
/、中の初期値をデータ線/グによりロードする。寸だ
OCRコンI・ローラ/θθに対する辞書データの入れ
換え夷求信号を発生ずるフリップフロップ/θ3をリセ
ットする。スキャナにより読み取られた文字列のデータ
は特徴抽出プロセッサ(図示せず)を4−“βて、各文
字の特徴パラメータが辞¥1検索プロセッザ/θ/に渡
される。辞書検索プロセッサ10/は主辞書メモリ/θ
S内の辞書データを並列辞書検索する。主辞書メモリ/
θS内に該当する文字が見つからないときは、辞−V!
!検索プロセッザ/θ1t−IJシェクト信号10を発
生し、カウンタ10ユに入力する。リジェクト信号10
によりカウンタ10)はデクリメントされる。文字書体
が異なるためリジェクト赦が多いときIt’、t、、 
Kiらンハじめ一ドツトされた初期値に達し、カウンタ
/1))、はボロー信号//を発生ずる。このボロー4
F? ”t/ / It 、1フリ、ブフ「1ツブ10
3をセ、1・し、フリップ、/ 1−1.7プ/θ?は
信号/ダを発生する。、0FFRjント「1−−一ン1
0Cフは、411号/Sにより”7行分の文字列中−で
“リジェクトが4 、;1′1したととを知り、主音1
゛1メモリ/θ、〜にtili l’lJ辞−111′
メモリ/九中の他の文字jl (+の7.百;“データ
?i: +1−ドし7.同時に主辞YJメモリ10月(
=格、伯さ!1.ていた辞書データを補l:り辞書メモ
リ10贋i=n  ドする、−t−しイ新しい辞書デー
タを用いテ二・1(を列5.l−”;lj、I’jζ索
をしそ、文字認識をお2二なう。
レジスタIO’lに格納さ]Lティ/)1゛J ”; 
7 ノ’ / (7,7,0初期値は経験的に定められ
ろH,(″) ℃′;:’、) リ、予め7;′めらノ
1.でいろ、、また別に、二、1.11リタ一字舵のツ
ノウンタを設け、hノ”I:1取文字数にグIするリジ
、−り1・文字;゛vの割合を演算して、予め定められ
リジェクト率をil、′iえた場合には、フリップフロ
ップ/θダを一1ニットすZ。
こ?そ、してもよい、斗ブζ光学的手段を用いずに文字
を認識するものにも本発明を適用゛i′きイ)ことばい
う−片でもない、1 以上の通り本発明によれば、商運メモリを必要最少1(
vに抑えた上で高速文字認識が可能である。
またr2飛対象とする文字ユ体の種類が増えても高価な
高速メモリを増やす必要がないため、高信頼性で低価格
の光学文字認Hf&装置が実現できろ。更に自動的f辞
書データを入れ換えろため、オペレータによる文字書体
の操作等を不要にし光学文字認識装置の豫作性を向上で
きる。
【図面の簡単な説明】
図は本発明の一実施例による光学文字認F&装置のブロ
ック口1である。 /θ0・・・0(3Rコントローラ、/θ/・・・辞凹
検索プロセッサ、102・・・カウンタ、103・・・
フリ、ツブフロップ、IO’l・・・レジスタ、/(H
・・・主辞書メモリ、IO乙・・・補助辞書メモリウ

Claims (1)

  1. 【特許請求の範囲】 (;l数の文字書体に属する文字を認識対象とし、それ
    ぞれの文字書体に対応する辞書データを用いて文字の認
    識を行なう文字認識装置において、iイ!、、’Vへy
    に用いる辞書データを記憶する主辞書メモリと、この主
    辞書メモリVこ記憶された辞書データ以外の文字書体の
    辞書データを記憶する補助辞−書メモリと、この補[1
    す辞書メモリおよび111f記主辞書メモリに記1.)
    1される辞書データを管理する辞書メモリ1Y理装問と
    、リジェクト文字数をカウントするカウンタとを備え、 前記主辞書メモリに記憶された辞望)データを用いて文
    字を認藺した結果、予め定められたりジェクト文字数が
    前記カウンタによりカウントされたときは、前屈主辞書
    メモリに記憶された辞書データを前記補助辞書メモリに
    記1意された辞里1データと交換することをl[宵ゼ′
    1とするざ7二:′、:’ 1.;::2・jJ、 I
    I−,1,
JP57155039A 1982-09-06 1982-09-06 文字認識装置 Pending JPS5945585A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57155039A JPS5945585A (ja) 1982-09-06 1982-09-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57155039A JPS5945585A (ja) 1982-09-06 1982-09-06 文字認識装置

Publications (1)

Publication Number Publication Date
JPS5945585A true JPS5945585A (ja) 1984-03-14

Family

ID=15597329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57155039A Pending JPS5945585A (ja) 1982-09-06 1982-09-06 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5945585A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0555023A3 (ja) * 1992-02-07 1994-03-09 Canon Kk

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0555023A3 (ja) * 1992-02-07 1994-03-09 Canon Kk
US5901255A (en) * 1992-02-07 1999-05-04 Canon Kabushiki Kaisha Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments

Similar Documents

Publication Publication Date Title
KR910007752B1 (ko) 문자인식시스템
Misgar et al. Recognition of offline handwritten Urdu characters using RNN and LSTM models
Satti et al. Complexities and implementation challenges in offline urdu Nastaliq OCR
Ruiz-Parrado et al. A bibliometric analysis of off-line handwritten document analysis literature (1990–2020)
US4003025A (en) Alphabetic character word upper/lower case print convention apparatus and method
Bogacz et al. Automating transliteration of cuneiform from parallel lines with sparse data
JPS5945585A (ja) 文字認識装置
JPS592191A (ja) 手書き日本語文の認識処理方式
Ziaratban et al. Use of legal amount to confirm or correct the courtesy amount on Farsi bank checks
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
Dhurke et al. Intelligent dictionary elements extraction using optical character recognition and deep learning based object detection
JP3659688B2 (ja) 文字認識装置
Bentrcia et al. A Deep Learning Approach to Recognize Mixed Fonts Printed Arabic Characters
Yimer et al. Learning based Ge'ez character handwritten recognition
JPS6224382A (ja) 手書き文字の認識方法
Eldhose et al. Disambiguated archieve rectification
JPS6095689A (ja) 光学的文字読取装置
JPH01311390A (ja) 文字置換制御方式
JPH0514952B2 (ja)
Gader et al. Fuzzy methods in handwriting recognition: an overview
JPH0344355B2 (ja)
Bideault et al. A Hybrid BLSTM-HMM for Spotting Regular Expressions.
JPS5851390A (ja) 活字文字認識装置
JPH04290185A (ja) 縦書横書判別方法
JPH01183796A (ja) 文字認識装置