JPS5945585A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS5945585A JPS5945585A JP57155039A JP15503982A JPS5945585A JP S5945585 A JPS5945585 A JP S5945585A JP 57155039 A JP57155039 A JP 57155039A JP 15503982 A JP15503982 A JP 15503982A JP S5945585 A JPS5945585 A JP S5945585A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- dictionary
- character
- counter
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012015 optical character recognition Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 2
- XTKDAFGWCDAMPY-UHFFFAOYSA-N azaperone Chemical compound C1=CC(F)=CC=C1C(=O)CCCN1CCN(C=2N=CC=CC=2)CC1 XTKDAFGWCDAMPY-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、t、す数の文字]:)イ・1・に[−(1−
ろ文字、;ハ、゛、′:対象とし、それぞれの文字グ1
体に対114、“4゛ろ辞1“゛データを用いて文字の
昭6・幾を行なう9′ン翻、:、’j、 、Ml輝〕に
閂する。
ろ文字、;ハ、゛、′:対象とし、それぞれの文字グ1
体に対114、“4゛ろ辞1“゛データを用いて文字の
昭6・幾を行なう9′ン翻、:、’j、 、Ml輝〕に
閂する。
最近の光学文字i′’pヱ1,1、ち′!1セトパでは
、/θ0〕η字/秒P度の高速処理4・要求されろため
、i−、、’、:みとつに一文字の特<C’<パラメー
タと辞:i’l−1:−りとt)) =y 、、) f
゛7グも高速処理を一升求される。(;ぜパのI4゛4
゛:1体に祠する文字を認WWt対角とするいわゆろマ
ル1−)」ントOCRにおいても、高速処理1がf1求
さス1.益み月7つり文字の111?徴パラノークのマ
ツチングをl’lY 2”+データごとに逐次処理する
ことでは宏バ!:、されろ高1−!μ・!L理が達成で
きない。このため高価な高速It A M(またはRO
M )を1[1いて、マツチングを並列処理することが
考えられるが、L・1πj弓ド1さとする文字書体の種
類を増やすという」k゛、・求もφばナラてきており、
そのようなマルチフォントOCRでは多数の高速RAM
を必要とするという問題があった。
、/θ0〕η字/秒P度の高速処理4・要求されろため
、i−、、’、:みとつに一文字の特<C’<パラメー
タと辞:i’l−1:−りとt)) =y 、、) f
゛7グも高速処理を一升求される。(;ぜパのI4゛4
゛:1体に祠する文字を認WWt対角とするいわゆろマ
ル1−)」ントOCRにおいても、高速処理1がf1求
さス1.益み月7つり文字の111?徴パラノークのマ
ツチングをl’lY 2”+データごとに逐次処理する
ことでは宏バ!:、されろ高1−!μ・!L理が達成で
きない。このため高価な高速It A M(またはRO
M )を1[1いて、マツチングを並列処理することが
考えられるが、L・1πj弓ド1さとする文字書体の種
類を増やすという」k゛、・求もφばナラてきており、
そのようなマルチフォントOCRでは多数の高速RAM
を必要とするという問題があった。
本発明は上記事情を考慮してなされたもので、認識対象
とする文字n体の抽類が増えても高価な高速メモリを必
要最小限に抑えた上で高速文字認識が可能−γ″ある文
字認識装置を提供することを目的とする。
とする文字n体の抽類が増えても高価な高速メモリを必
要最小限に抑えた上で高速文字認識が可能−γ″ある文
字認識装置を提供することを目的とする。
本発明は次に示す経験則を前提としている。
■マルチフォン)OCRにおいても、ひとつの$県中に
混在する文字書体の種部は多くて2〜3種類であり、す
べての文字書体が混在することはほとんどないこと。
混在する文字書体の種部は多くて2〜3種類であり、す
べての文字書体が混在することはほとんどないこと。
■異なった文字病体の辞書データを用いて文字のj’t
j:4i訣をおこなったときは、リジェクトが続出ずろ
という特徴があること。
j:4i訣をおこなったときは、リジェクトが続出ずろ
という特徴があること。
本発明はこれら経、lj%則をふオえて、並列処理に用
いろ、λ°で1速メモリを、2〜3種類の辞朗、データ
を格納でAる容叶にとどめ、リジェクトが読出1〜たと
きはこれら辞書データを他の種部の辞書データと交換l
〜て、高速文字認識の実現をしようとするものである。
いろ、λ°で1速メモリを、2〜3種類の辞朗、データ
を格納でAる容叶にとどめ、リジェクトが読出1〜たと
きはこれら辞書データを他の種部の辞書データと交換l
〜て、高速文字認識の実現をしようとするものである。
本発明を図示の01111例にノ、1−づいマコ、す1
1する。
1する。
OCRコントローラlθOはつ“(−学夕1字i′勺+
’9 、(〕川用全体を制御するものであり、+1r1
常マイコンで41°・′1′成膏れるう文字91体のi
7(居f−タUよl:i’、i”j!)ご1−リ/θシ
と補助音別メモリ/θA(/こ分&Jて1、!1□i7
’i ;’7 ;IT、てい7)。主辞書メモリ10S
は文字冒i:I’&のマツ′−ンクトr: 用イラれる
辞キ;1データを格納したもので、例えば2種類の辞書
データを格納すべり41/、にバイトの81j4.を有
し、並列処理を可能とするため、)1価な品津RA )
、qにて(性成されていて、辞1fr検パスプロセッサ
lθ/内にある。補助辞書メモリ/θAQ土主Fl’j
”:°;メモリ10左に格納さイ′シた辞−1°f−タ
以外の文′jづ1体の辞書データを格納したもの1.1
名速処理さitろ)14要はないた。め、安価な低速大
容)、1メ′6リーp )+!成さi+、ろ。
’9 、(〕川用全体を制御するものであり、+1r1
常マイコンで41°・′1′成膏れるう文字91体のi
7(居f−タUよl:i’、i”j!)ご1−リ/θシ
と補助音別メモリ/θA(/こ分&Jて1、!1□i7
’i ;’7 ;IT、てい7)。主辞書メモリ10S
は文字冒i:I’&のマツ′−ンクトr: 用イラれる
辞キ;1データを格納したもので、例えば2種類の辞書
データを格納すべり41/、にバイトの81j4.を有
し、並列処理を可能とするため、)1価な品津RA )
、qにて(性成されていて、辞1fr検パスプロセッサ
lθ/内にある。補助辞書メモリ/θAQ土主Fl’j
”:°;メモリ10左に格納さイ′シた辞−1°f−タ
以外の文′jづ1体の辞書データを格納したもの1.1
名速処理さitろ)14要はないた。め、安価な低速大
容)、1メ′6リーp )+!成さi+、ろ。
カウンタ102&ま夕: ’t” N?j2辱哉のリジ
ェクト数全カウントするもので、木″!叉L・h丁′;
11ではレジスタlθすIrC1乙I内された?、71
Mf直をセラl−L、リジェクト−)く芦3ころ7及
びVこデクリメントするようにしCいろ。フリップフロ
ップlO5はカウンタ10ユのボロー(にi’4により
セットされるように、00 Rコントローラlθθから
の読Jlp %+4作指示信月によりリセットさiLろ
ように接続されている。
ェクト数全カウントするもので、木″!叉L・h丁′;
11ではレジスタlθすIrC1乙I内された?、71
Mf直をセラl−L、リジェクト−)く芦3ころ7及
びVこデクリメントするようにしCいろ。フリップフロ
ップlO5はカウンタ10ユのボロー(にi’4により
セットされるように、00 Rコントローラlθθから
の読Jlp %+4作指示信月によりリセットさiLろ
ように接続されている。
OCRコントローラ100がスキャナ(図示せず)如対
して1す(票の7行分の文字列の読取動作を指示するt
元取動作指示信号7.2を発生する。この読取動(’l
l個信号2により、7行分の文字列の中でのりジェクト
数をカウントするカウンタ102&て、レジスタ101
/、中の初期値をデータ線/グによりロードする。寸だ
OCRコンI・ローラ/θθに対する辞書データの入れ
換え夷求信号を発生ずるフリップフロップ/θ3をリセ
ットする。スキャナにより読み取られた文字列のデータ
は特徴抽出プロセッサ(図示せず)を4−“βて、各文
字の特徴パラメータが辞¥1検索プロセッザ/θ/に渡
される。辞書検索プロセッサ10/は主辞書メモリ/θ
S内の辞書データを並列辞書検索する。主辞書メモリ/
θS内に該当する文字が見つからないときは、辞−V!
!検索プロセッザ/θ1t−IJシェクト信号10を発
生し、カウンタ10ユに入力する。リジェクト信号10
によりカウンタ10)はデクリメントされる。文字書体
が異なるためリジェクト赦が多いときIt’、t、、
Kiらンハじめ一ドツトされた初期値に達し、カウンタ
/1))、はボロー信号//を発生ずる。このボロー4
F? ”t/ / It 、1フリ、ブフ「1ツブ10
3をセ、1・し、フリップ、/ 1−1.7プ/θ?は
信号/ダを発生する。、0FFRjント「1−−一ン1
0Cフは、411号/Sにより”7行分の文字列中−で
“リジェクトが4 、;1′1したととを知り、主音1
゛1メモリ/θ、〜にtili l’lJ辞−111′
メモリ/九中の他の文字jl (+の7.百;“データ
?i: +1−ドし7.同時に主辞YJメモリ10月(
=格、伯さ!1.ていた辞書データを補l:り辞書メモ
リ10贋i=n ドする、−t−しイ新しい辞書デー
タを用いテ二・1(を列5.l−”;lj、I’jζ索
をしそ、文字認識をお2二なう。
して1す(票の7行分の文字列の読取動作を指示するt
元取動作指示信号7.2を発生する。この読取動(’l
l個信号2により、7行分の文字列の中でのりジェクト
数をカウントするカウンタ102&て、レジスタ101
/、中の初期値をデータ線/グによりロードする。寸だ
OCRコンI・ローラ/θθに対する辞書データの入れ
換え夷求信号を発生ずるフリップフロップ/θ3をリセ
ットする。スキャナにより読み取られた文字列のデータ
は特徴抽出プロセッサ(図示せず)を4−“βて、各文
字の特徴パラメータが辞¥1検索プロセッザ/θ/に渡
される。辞書検索プロセッサ10/は主辞書メモリ/θ
S内の辞書データを並列辞書検索する。主辞書メモリ/
θS内に該当する文字が見つからないときは、辞−V!
!検索プロセッザ/θ1t−IJシェクト信号10を発
生し、カウンタ10ユに入力する。リジェクト信号10
によりカウンタ10)はデクリメントされる。文字書体
が異なるためリジェクト赦が多いときIt’、t、、
Kiらンハじめ一ドツトされた初期値に達し、カウンタ
/1))、はボロー信号//を発生ずる。このボロー4
F? ”t/ / It 、1フリ、ブフ「1ツブ10
3をセ、1・し、フリップ、/ 1−1.7プ/θ?は
信号/ダを発生する。、0FFRjント「1−−一ン1
0Cフは、411号/Sにより”7行分の文字列中−で
“リジェクトが4 、;1′1したととを知り、主音1
゛1メモリ/θ、〜にtili l’lJ辞−111′
メモリ/九中の他の文字jl (+の7.百;“データ
?i: +1−ドし7.同時に主辞YJメモリ10月(
=格、伯さ!1.ていた辞書データを補l:り辞書メモ
リ10贋i=n ドする、−t−しイ新しい辞書デー
タを用いテ二・1(を列5.l−”;lj、I’jζ索
をしそ、文字認識をお2二なう。
レジスタIO’lに格納さ]Lティ/)1゛J ”;
7 ノ’ / (7,7,0初期値は経験的に定められ
ろH,(″) ℃′;:’、) リ、予め7;′めらノ
1.でいろ、、また別に、二、1.11リタ一字舵のツ
ノウンタを設け、hノ”I:1取文字数にグIするリジ
、−り1・文字;゛vの割合を演算して、予め定められ
リジェクト率をil、′iえた場合には、フリップフロ
ップ/θダを一1ニットすZ。
7 ノ’ / (7,7,0初期値は経験的に定められ
ろH,(″) ℃′;:’、) リ、予め7;′めらノ
1.でいろ、、また別に、二、1.11リタ一字舵のツ
ノウンタを設け、hノ”I:1取文字数にグIするリジ
、−り1・文字;゛vの割合を演算して、予め定められ
リジェクト率をil、′iえた場合には、フリップフロ
ップ/θダを一1ニットすZ。
こ?そ、してもよい、斗ブζ光学的手段を用いずに文字
を認識するものにも本発明を適用゛i′きイ)ことばい
う−片でもない、1 以上の通り本発明によれば、商運メモリを必要最少1(
vに抑えた上で高速文字認識が可能である。
を認識するものにも本発明を適用゛i′きイ)ことばい
う−片でもない、1 以上の通り本発明によれば、商運メモリを必要最少1(
vに抑えた上で高速文字認識が可能である。
またr2飛対象とする文字ユ体の種類が増えても高価な
高速メモリを増やす必要がないため、高信頼性で低価格
の光学文字認Hf&装置が実現できろ。更に自動的f辞
書データを入れ換えろため、オペレータによる文字書体
の操作等を不要にし光学文字認識装置の豫作性を向上で
きる。
高速メモリを増やす必要がないため、高信頼性で低価格
の光学文字認Hf&装置が実現できろ。更に自動的f辞
書データを入れ換えろため、オペレータによる文字書体
の操作等を不要にし光学文字認識装置の豫作性を向上で
きる。
図は本発明の一実施例による光学文字認F&装置のブロ
ック口1である。 /θ0・・・0(3Rコントローラ、/θ/・・・辞凹
検索プロセッサ、102・・・カウンタ、103・・・
フリ、ツブフロップ、IO’l・・・レジスタ、/(H
・・・主辞書メモリ、IO乙・・・補助辞書メモリウ
ック口1である。 /θ0・・・0(3Rコントローラ、/θ/・・・辞凹
検索プロセッサ、102・・・カウンタ、103・・・
フリ、ツブフロップ、IO’l・・・レジスタ、/(H
・・・主辞書メモリ、IO乙・・・補助辞書メモリウ
Claims (1)
- 【特許請求の範囲】 (;l数の文字書体に属する文字を認識対象とし、それ
ぞれの文字書体に対応する辞書データを用いて文字の認
識を行なう文字認識装置において、iイ!、、’Vへy
に用いる辞書データを記憶する主辞書メモリと、この主
辞書メモリVこ記憶された辞書データ以外の文字書体の
辞書データを記憶する補助辞−書メモリと、この補[1
す辞書メモリおよび111f記主辞書メモリに記1.)
1される辞書データを管理する辞書メモリ1Y理装問と
、リジェクト文字数をカウントするカウンタとを備え、 前記主辞書メモリに記憶された辞望)データを用いて文
字を認藺した結果、予め定められたりジェクト文字数が
前記カウンタによりカウントされたときは、前屈主辞書
メモリに記憶された辞書データを前記補助辞書メモリに
記1意された辞里1データと交換することをl[宵ゼ′
1とするざ7二:′、:’ 1.;::2・jJ、 I
I−,1,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155039A JPS5945585A (ja) | 1982-09-06 | 1982-09-06 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57155039A JPS5945585A (ja) | 1982-09-06 | 1982-09-06 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5945585A true JPS5945585A (ja) | 1984-03-14 |
Family
ID=15597329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57155039A Pending JPS5945585A (ja) | 1982-09-06 | 1982-09-06 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5945585A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0555023A3 (ja) * | 1992-02-07 | 1994-03-09 | Canon Kk |
-
1982
- 1982-09-06 JP JP57155039A patent/JPS5945585A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0555023A3 (ja) * | 1992-02-07 | 1994-03-09 | Canon Kk | |
US5901255A (en) * | 1992-02-07 | 1999-05-04 | Canon Kabushiki Kaisha | Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR910007752B1 (ko) | 문자인식시스템 | |
Misgar et al. | Recognition of offline handwritten Urdu characters using RNN and LSTM models | |
Satti et al. | Complexities and implementation challenges in offline urdu Nastaliq OCR | |
Ruiz-Parrado et al. | A bibliometric analysis of off-line handwritten document analysis literature (1990–2020) | |
US4003025A (en) | Alphabetic character word upper/lower case print convention apparatus and method | |
Bogacz et al. | Automating transliteration of cuneiform from parallel lines with sparse data | |
JPS5945585A (ja) | 文字認識装置 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
Ziaratban et al. | Use of legal amount to confirm or correct the courtesy amount on Farsi bank checks | |
JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
Dhurke et al. | Intelligent dictionary elements extraction using optical character recognition and deep learning based object detection | |
JP3659688B2 (ja) | 文字認識装置 | |
Bentrcia et al. | A Deep Learning Approach to Recognize Mixed Fonts Printed Arabic Characters | |
Yimer et al. | Learning based Ge'ez character handwritten recognition | |
JPS6224382A (ja) | 手書き文字の認識方法 | |
Eldhose et al. | Disambiguated archieve rectification | |
JPS6095689A (ja) | 光学的文字読取装置 | |
JPH01311390A (ja) | 文字置換制御方式 | |
JPH0514952B2 (ja) | ||
Gader et al. | Fuzzy methods in handwriting recognition: an overview | |
JPH0344355B2 (ja) | ||
Bideault et al. | A Hybrid BLSTM-HMM for Spotting Regular Expressions. | |
JPS5851390A (ja) | 活字文字認識装置 | |
JPH04290185A (ja) | 縦書横書判別方法 | |
JPH01183796A (ja) | 文字認識装置 |