[go: up one dir, main page]

JPS61117671A - 文字切り出し処理方式 - Google Patents

文字切り出し処理方式

Info

Publication number
JPS61117671A
JPS61117671A JP59238874A JP23887484A JPS61117671A JP S61117671 A JPS61117671 A JP S61117671A JP 59238874 A JP59238874 A JP 59238874A JP 23887484 A JP23887484 A JP 23887484A JP S61117671 A JPS61117671 A JP S61117671A
Authority
JP
Japan
Prior art keywords
character
characters
circumscribed rectangle
unit
calculation unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59238874A
Other languages
English (en)
Inventor
Michiko Iwasaki
岩崎 美知子
Mitsuo Ishii
石井 光雄
Yasukazu Ito
伊藤 能一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59238874A priority Critical patent/JPS61117671A/ja
Publication of JPS61117671A publication Critical patent/JPS61117671A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字切り出し処理方式、特に図面等に手書き等
された文字を認識する際に、当該文字が相互に接触して
いても、文字間を正確に分割して文字を切り出すよう構
成した文字切り出し処理方式に関するものである。
〔従来の技術と発明が解決しようとする問題点)回路図
等に手書きされた文字をスキャナーによって走査して画
像信号の形に変換した後、計1γ機ノステムを用いて文
字認識が行われているが、当該認識を行うに当たっては
当該文字を1個重位に正確に区切ることが必要となる。
しかし、従来、当該文字を1個竪11位に区切る方式と
して、文字に対応する前記画像信号中から当該文字を構
成する1!ii素に連結しているものの外接矩形を算出
し、当該外接矩形を1文字に対応する領域として区切っ
ていた。このため、例えば2文字が相互に接触している
場合には、2文字を構成する画素の外接矩形が1文字に
対応するものとして切り出されζしまうという問題点が
あった。
(問題点を解決するための手段〕 本発明は、前記問題点を解決するために、図面等に手書
き等された文字をI!l#Rする際に、当該文字が相互
に接触している場合には、当該接触している文字の境界
近傍を走査して各走査における画素数の最小の走査位置
を文字の分割位置として抽出し、該抽出した分割位置で
前記文字を区切ることにより、例え相互に接触している
文字列であっても正確に文字を個別に切り出すようして
いる。
そのため、本発明の文字切り出し処理方式は、文字列を
文字単位に切り出す文字切り出し処理方式において、前
記文字列を画像信号の形に変換する画像入力部と、該画
像入力部によって変換された画像信号中から文字を構成
する画素に連結している画素を順次抽出して当該文字を
構成する画素群に外接する外接矩形を生成する文字切り
出し部と、該文字切り出し部によって生成された外接矩
形か複数の文字を含んだ形のものであるか台かをrIl
別する文字列判別部と、該文字列判別部によって前記外
接矩形が複数の文字を含んでいることが判明した場合に
、当該外接矩形に含まれる文字の境界近傍を走査して文
字を構成する画素の走査毎の個数を算出する画素故頻度
真出部と、該画素数頻度算出部によって算出された画素
数の個数が最小の走査位1を分割位置として算出する最
小頻度算出部と、譲最小頻度算出部によって算出された
分割位置で前記外接矩形を分割して当該外接矩形に含ま
れる夫々の文字に対応する形の新たな外接矩形を生成す
る文字抽出部とを備えることを特徴としている。
〔実施例〕
以下図面を参照しつつ本発明の実施例を詳細に説明する
第1図は本発明の1実施例構成図、第2図および第3図
は第1図図示本発明の1実施例構成の動作を説明する動
作説明図を示す。
図中、lは画像入力部、2は文字何分l!1部、2−1
は文字切り出し部、2−2は左右・上下文字列判別部、
2−3は中央付近画素数頻度算出部、2−4はii!I
素数級小頻度算出部、3は文字抽出部を表す。
第1図において、図中画像入力部lは回路図等に手書き
等された文字をスキャナーによって走査し、画像信号の
形に変換して文字列分割部2に人力するためのものであ
る。
図中文字列分割部2は、図示の如(文字切り出し部2−
1、左右 上下文字列判別部2−2、中央付近画素数頻
度算出部2−38よび画素故最小頬度算出部2−4によ
って構成され、前記画像信号中から文字を構成する1i
素に連結する全ての内素を内包する形の外接矩形を抽出
し、該抽出した外接矩形が複数の文字を内包するもので
ある場合、当該外接矩形を個々の文字を内包する新たな
外接矩形の形に切り出すためのものである。以下各構成
を詳細に説明する。
図中文字切り出し部2−1は、前記画像入力部lから人
力された画像信号中から文字を構成4る画素に連結する
他の画素を順次抽出し、当該抽出した画素群を内包する
形のいわゆる外接矩形を算出して文字が存在する矩形領
域を切り出すためのものである。この際、文字が相互に
接触していない場合には、当該外接矩形は1個の文字に
対応しており、文字毎に正確な切り出し処理が行われ゛
(いるから、本実施例に係わる分割処理を行う必要はな
い、一方、文字が相互に接触している場合には、当該外
接矩形は2個あるいは3個以上の文字を含めた形で切り
出し処理が行われているため、本発明に係わる文字毎に
正確に矩形領域を切り出す処理を行う必要がある。以下
説明する。
図中左右・上下文字列判別部2−2は、文字切り出し部
2−1によって抽出された文字を内包する形の外接矩形
が、左右あるいは上下いずれの方向に相互に接触してい
る文字に対応するものである否かを判別するだめのもの
である。これは、後述する第2図(ロ)図示左右方向に
相互に接触している文字あるいは第3図(ロ)図示上下
方向に相ηに接触している文字のうちいずれのものであ
るかを判別することを意味している。
図中中央付近画素数頻度算出部2−3は、例えば2個の
文字が接触している場合に、当該接触している中央付近
(文字の境界付近)を走査し、当該中央付近における画
像データ中の黒画素の頻度を位置と対応づけた形で算出
するためのものである。これにより、後述する如く例え
ば第2図(ハ)図中中央付近から両方向に図示“α″の
領域が夫々走査され、該走査した位置に対応した形で黒
画素が現れる頻度が算出される。
図中画素数最小頻度算出部2−4は、前記中央付近画素
数頻度算出部2−3によって算出された黒画素が現れた
頻度の内から、最小の頻度が現れる位lを分割位置とし
て算出するためのものである。これは、例えば2文字が
接触した外接矩形では、中央付近であってかつ黒画素の
画素数の頻度を最小とする位11<分割位置)が自動的
に算出さ、   れることを意味する。従って、例えば
相互に接触した文字であっても、自動的に′!J 2t
j接触している文字の境界付近(中央付近)−ζあって
かつ文才を構成する画素数の最も少ない位置が2個の外
接矩形の分割位置とされることとなる。
図中文字抽出部3は前記文字切り出し部2−1によって
抽出された外接矩形を前記画素数最小頻度算出部2−4
によって算出された分割位2で分割して個々の文字に対
応する形の外接矩形を生成するためのものである。これ
は、接触していたために1個の外接矩形の形で抽出され
たものを、後述する第2図(ニ)図示の如く夫々の文字
に対応する形の外接矩形l;生成することを意味してい
る。
以上の如き構成を採用することにより、例え相互に接触
している文字であっても、当該接触している文字の外接
矩形から個々の文字に対応する外接矩形を正確に切り出
すことが可能となる。
第2図は、左右方向に相互に接触している文字が、夫々
の文字に対応する外接矩形の形に切り出される順序を示
す。
第2図(イ)は回路図中に手書き等された文字“AB”
を示す、該文字“AB”は、図示の如く左右方向に相互
に接触しζおり、第1図図中中央付近部lによって画像
データの形に変換されるものである。
第2図(ロ)は第2図(イ)図示文字”AB“に対して
外接する外接矩形を算出したものを示す。
図中“2M“および“N”は当該外接矩形の横方向(X
方向)および縦方向(Y方向)の長さを夫々示す、該外
接矩形は前述した如く第1図図中文字切り出し部2−1
によって第2図(イ)図示文字を内包する形で生成され
る。そして、第1図図中左右・上下文字列判別部2−2
によってrji故の文字が左右方向に接触していると判
別された場合に、以下の分割処理を行う、この際、左右
方向に接触しているか否かは、例えば1文字の大きさを
MXN’″とし、文字切り出し部2−1によって抽出さ
れた外接矩形の大きさが第2図(ロ)図示の如(はぼM
数倍となる値例えば“2 M X N“である場合には
、左右力向に2文字が接触していることが判明する。上
下方向についても同様に1文字のほぼ整数倍になってい
るか否かによって何個の文字が接触しζいるかを判別す
ることができる。
第2図(ハ)は外接矩形の中央付近で画り向に距離”α
”だけ走査して文字中の黒画素の頻度を当該走査した距
離“α”に対応づけた形で抽出し、当該黒画素の頻度が
最小の位置を算出する状!虚を示す、これは、第1図図
中中央付近画素数頻IK算出部2−3によって当該外接
矩形の中央付近が走査され、文字中の黒画素の頻度を距
離と対応づけた形で抽出し、当該抽出した黒画素の頻度
から最小の頻度となる分割位置を算出することを意味し
ている。尚、図中中央付近は第2図(ロ)図示外接矩形
の横方向の長さ°2M”を半分にした位置として表され
、走査する距離は”α“として表される。
第2図(ニ)は前記算出された分割位置で当該外接矩形
を夫々の文字に対応する新たな外接矩形の形に生成した
ものを示す0図中新たな外接矩形“A”は横力向の長さ
が“M、  ”および縦方向の長さが“N、”によっ°
ζ表され、図中新たな外接矩形“Boは横方向の長さが
°M8 ゛および縦方向の長さが“Nz ′によって表
される1例えば図中横方向の長さM、  ″および“M
x”は、両者共に同し長さに分割されるとは限られず、
前述した如く中央付近ごあってかつ黒i!!素の頻度か
最小となる位置で分割される。このため、複数の文字を
より正確に分割することが可能となる。
第3図は、前述した第2図図示の場合と同様にして上下
方向に相互に接触している文字が、夫々の文字に対応す
る外接矩形の形に切り出される順序を示し、第3図(イ
)ないしく二)は夫々第2図(イ)ないしく二)に対応
している。
第3図(イ)は回路図中に上下方向に手書き等された文
字’FH”を示す、該文字”FH”は、図示の如く上下
方向に相互に接触しており、第1図図中画像入力部1に
よって画像データの形に変臭されるものである。
第3図(ロ)は第3図(イ)図示文字“FH”に対して
外接する外接矩形を算出したものを示す。
図中“M″bよひ“2N″は当該外接矩形の横方向(X
方向ンおよび縦方向(Y方向)の長さを人々示す、該外
接矩形は前述した如く第1図図中文字切り出し部2−1
によって第3図(イ)図示文字を内包する形で生成され
る。そして、第1図図中左右・上下文字列判別部2−2
によって複数の文字が上下方向に接触していると判別さ
れた場合に、以下の分割処理を行う。
第3図(ハ)は外接矩形の中央付近で両方向に距離“α
゛だけ走査して文字中の黒画素の頻度を当該走査した距
離”α°に対応づけた形で抽出し、当該黒画素の頻度が
最小の位置を算出する状態を示す、これは、第1図図中
中央付近画素数頻度算出部2−3によって当該外接矩形
の中央付近か走査され、文字中の黒i!!素の頻度を距
離と対応づけた形で抽出し、当1亥抽出した黒画素の頻
度から最小の頻度となる分割位置を算出することを意味
している。
I!13図(ニ)は前記算出された分割位置で当該外接
矩形を夫々の文字に対応する新たな外接矩形の形に生成
したものを示す9図中新たな外接矩形“F“は横方向の
長さが“Ml”および縦方向の長さが“N1 ”によっ
て表され、図中新たな外接矩形”H”は横方向の長さが
“M、“および縦方向の長さが“Nt  ”によって表
される0例えば図中寝方向の長さ“N1  ”および“
N2 ”は、両者共に同じ長さに分別されるとは限られ
ず、前述した如く中央付近であってかつ黒画素の頻度が
最小となる位置で分割される。このため、複数の文字を
より正確に分別することが可能となる。
〔発明の効果〕
以上説明した如く、本発明によれば、図面等に手書き等
された文字を認識する際に、当該文字が相互に接触して
いる場合には、当該接触している文字の境界近傍を走査
して画素数の最小位置を文字の分割位置として抽出し、
該抽出した分割1位置で前記文字を区切っているため、
相互に接触している文字列であっても正確に文字を個別
に切り出すことができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図および第3図
は第1図図示本発明の1実施例構成の動作を説明する動
作説明図を示す。 図中、lは画像入力部、2は文字列分割部、2−1は文
字切り出し部、2−2は左右・−上下文字列判別部、2
−3は中央付近画素数w度算出部、2−4は画素数最小
頻度算出部、3は文字抽出部を表す。

Claims (1)

    【特許請求の範囲】
  1. 文字列を文字単位に切り出す文字切り出し処理方式にお
    いて、前記文字列を画像信号の形に変換する画像入力部
    と、該画像入力部によって変換された画像信号中から文
    字を構成する画素に連結している画素を順次抽出して当
    該文字を構成する画素群に外接する外接矩形を生成する
    文字切り出し部と、該文字切り出し部によって生成され
    た外接矩形が複数の文字を含んだ形のものであるか否か
    を判別する文字列判別部と、該文字列判別部によって前
    記外接矩形が複数の文字を含んでいることが判明した場
    合に、当該外接矩形に含まれる文字の境界近傍を走査し
    て文字を構成する画素の走査毎の個数を算出する画素数
    頻度算出部と、該画素数頻度算出部によって算出された
    画素数の個数が最小の走査位置を分割位置として算出す
    る最小頻度算出部と、該最小頻度算出部によって算出さ
    れた分割位置で前記外接矩形を分割して当該外接矩形に
    含まれる夫々の文字に対応する形の新たな外接矩形を生
    成する文字抽出部とを備えることを特徴とする文字切り
    出し処理方式。
JP59238874A 1984-11-13 1984-11-13 文字切り出し処理方式 Pending JPS61117671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59238874A JPS61117671A (ja) 1984-11-13 1984-11-13 文字切り出し処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59238874A JPS61117671A (ja) 1984-11-13 1984-11-13 文字切り出し処理方式

Publications (1)

Publication Number Publication Date
JPS61117671A true JPS61117671A (ja) 1986-06-05

Family

ID=17036543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59238874A Pending JPS61117671A (ja) 1984-11-13 1984-11-13 文字切り出し処理方式

Country Status (1)

Country Link
JP (1) JPS61117671A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS58197581A (ja) * 1982-05-12 1983-11-17 Nec Corp 文字図形認識方法とその装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS58197581A (ja) * 1982-05-12 1983-11-17 Nec Corp 文字図形認識方法とその装置

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US4504969A (en) Rectangular pattern recognition apparatus
JPS5837779A (ja) 文書処理装置
GB1338867A (en) System for analysing engineering drawings or like documents
KR0167616B1 (ko) 화상 처리 장치 및 방법
JPS61117671A (ja) 文字切り出し処理方式
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JPS61117670A (ja) 文字切り出し処理方式
JP2868134B2 (ja) 画像処理方法及び装置
JPH0548510B2 (ja)
JPS63304387A (ja) 文書読取装置
EP0067236B1 (en) Character and figure isolating and extracting system
JPS61175880A (ja) 破線抽出装置
JP2789622B2 (ja) 文字/図形領域判定装置
JP2800192B2 (ja) 高速文字図形分離装置
JPH0564396B2 (ja)
JPH02253383A (ja) 画像処理装置
JPH0697470B2 (ja) 文字列抽出装置
JP2664895B2 (ja) 光学文字読取装置
JPS6199461A (ja) 画像デ−タの処理方法
JPH0514952B2 (ja)
JPH08202824A (ja) 文書画像認識装置
JP2784059B2 (ja) 2値画像のノイズ除去方法および装置
JPH01140274A (ja) 文字行認識方式
JPS5838063A (ja) 文書画像処理装置