JPH0782522B2 - 文書読取装置 - Google Patents
文書読取装置Info
- Publication number
- JPH0782522B2 JPH0782522B2 JP60047678A JP4767885A JPH0782522B2 JP H0782522 B2 JPH0782522 B2 JP H0782522B2 JP 60047678 A JP60047678 A JP 60047678A JP 4767885 A JP4767885 A JP 4767885A JP H0782522 B2 JPH0782522 B2 JP H0782522B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- document
- input
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 この発明は文字を含む文書から文字を認識して読取る文
書読取装置に係り、特に文書の読取りフォーマットを登
録する機構に関するものである。
書読取装置に係り、特に文書の読取りフォーマットを登
録する機構に関するものである。
従来この種の文書読取装置としては、いわゆる光学的文
字読取装置といわれるものに、第6図に示すものがあ
る。第6図は従来の文書読取装置を示すブロック構成図
である。同図に示すようにこの装置は、文書,すなわち
用紙1上に記入された文字を走査手段2で走査して光電
変換し、1行分の画像,すなわちイメージデータを行記
憶手段3に格納し、さらに1行分のイメージデータから
文字切出し手段4で1文字分の文字パターンを切出し、
切出された文字パターンから特徴を抽出し、上記抽出さ
れた特徴値と文字認識手段5内に格納されている認識基
準パターンの特徴値とを比較して認識し、認識結果とし
て文字コードを出力していた。また、上記処理を行なう
場合、事前に切出すべき位置や認識対象字種などを示す
読取りに必要な情報すなわち、読取フォーマットを入力
手段6から入力し、制御手段7の読取フォーマットテー
ブルに格納し、これにもとづき処理を行なっていた。す
なわち、用紙1上に記入される文字の位置や認識対象字
種を示す認識に必要な読取りフォーマットを事前に文書
に対応させて設定しておき、この読取フォーマットに従
って文字を切出して認識を行なっていた。
字読取装置といわれるものに、第6図に示すものがあ
る。第6図は従来の文書読取装置を示すブロック構成図
である。同図に示すようにこの装置は、文書,すなわち
用紙1上に記入された文字を走査手段2で走査して光電
変換し、1行分の画像,すなわちイメージデータを行記
憶手段3に格納し、さらに1行分のイメージデータから
文字切出し手段4で1文字分の文字パターンを切出し、
切出された文字パターンから特徴を抽出し、上記抽出さ
れた特徴値と文字認識手段5内に格納されている認識基
準パターンの特徴値とを比較して認識し、認識結果とし
て文字コードを出力していた。また、上記処理を行なう
場合、事前に切出すべき位置や認識対象字種などを示す
読取りに必要な情報すなわち、読取フォーマットを入力
手段6から入力し、制御手段7の読取フォーマットテー
ブルに格納し、これにもとづき処理を行なっていた。す
なわち、用紙1上に記入される文字の位置や認識対象字
種を示す認識に必要な読取りフォーマットを事前に文書
に対応させて設定しておき、この読取フォーマットに従
って文字を切出して認識を行なっていた。
ところで、この種装置が普及するに従って、文書作成時
に即座に文書を読取る用途が増え、また文書の種類が多
様化してきたため、極端な場合文書1枚1枚の読取りフ
ォーマットが異なる場合が増えてきた。しかしながら、
事前に読取り領域や認識対象字種を指示する上記従来装
置によると、多様化する文書に対応してそれぞれの読取
りフォーマットを入力するには膨大な時間が掛かり、文
書の多様化に対応することができないという問題点を有
していた。
に即座に文書を読取る用途が増え、また文書の種類が多
様化してきたため、極端な場合文書1枚1枚の読取りフ
ォーマットが異なる場合が増えてきた。しかしながら、
事前に読取り領域や認識対象字種を指示する上記従来装
置によると、多様化する文書に対応してそれぞれの読取
りフォーマットを入力するには膨大な時間が掛かり、文
書の多様化に対応することができないという問題点を有
していた。
この発明は、上記のような問題点を解消するためになさ
れたもので、その場で容易に読取フォーマットが入力で
き、多様化した文書に対応できる文書読取装置を得るこ
とを目的とする。
れたもので、その場で容易に読取フォーマットが入力で
き、多様化した文書に対応できる文書読取装置を得るこ
とを目的とする。
この発明に係る文書読取装置は、入力された文書の画像
を記憶する記憶手段と、この記憶手段に記憶された画像
を表示する表示手段と、この表示手段で表示された画像
の認識すべき文字領域とこの文字領域に表示されている
文字の字種等の属性とを選択する入力手段と、この入力
手段により選択された上記文字領域と上記属性とを格納
する格納手段と、この格納手段に格納されている上記選
択された文字領域の文字を切出す文字切出し手段と、こ
の文字切出し手段により切出された文字を上記格納手段
に格納されている上記選択された属性に基づき認識する
認識手段とを備えたものである。
を記憶する記憶手段と、この記憶手段に記憶された画像
を表示する表示手段と、この表示手段で表示された画像
の認識すべき文字領域とこの文字領域に表示されている
文字の字種等の属性とを選択する入力手段と、この入力
手段により選択された上記文字領域と上記属性とを格納
する格納手段と、この格納手段に格納されている上記選
択された文字領域の文字を切出す文字切出し手段と、こ
の文字切出し手段により切出された文字を上記格納手段
に格納されている上記選択された属性に基づき認識する
認識手段とを備えたものである。
この発明においては、記憶手段に文書全体の画像が一旦
記憶され、この内容が表示手段に表示される。表示手段
で表示された画像の認識すべき文字領域とこの文字領域
に表示されている文字の字種等の属性とを入力手段によ
り選択し、格納手段は選択された文字領域と属性とを格
納し、文字切出し手段は格納されている選択された文字
領域の文字を切出し、認識手段は格納されている選択さ
れた属性に基づき文字を認識する。
記憶され、この内容が表示手段に表示される。表示手段
で表示された画像の認識すべき文字領域とこの文字領域
に表示されている文字の字種等の属性とを入力手段によ
り選択し、格納手段は選択された文字領域と属性とを格
納し、文字切出し手段は格納されている選択された文字
領域の文字を切出し、認識手段は格納されている選択さ
れた属性に基づき文字を認識する。
以下、この発明の実施例を図示して説明する。
第1図はこの発明の文書読取装置の一実施例を示すブロ
ック構成図である。なお、第6図従来例と同一符号のも
のは同一構成要素を示しており、その説明は省略する。
同図において、8は文書全体の画像,すなわち1ページ
分のイメージデータを記憶するページ記憶手段、9は上
記ページ記憶手段8に記憶された全イメージデータを表
示する表示手段、10は上記表示手段の表示画面を見なが
ら、読取り領域の位置及びこの読取り領域内の文字を認
識するに必要な情報,すなわち読取りフォーマットを指
示入力する入力手段であり、ここではキーボードを用い
ている。一方、11は上記入力手段で入力された情報を読
取りフォーマットテーブルに格納し、文書の読取りフォ
ーマットを制御する制御手段、12は上記ページ記憶手段
に記憶されたイメージデータから上記制御手段の制御に
よりまず行を切出し、その行から文字パターンを切出す
文字切出し手段である。
ック構成図である。なお、第6図従来例と同一符号のも
のは同一構成要素を示しており、その説明は省略する。
同図において、8は文書全体の画像,すなわち1ページ
分のイメージデータを記憶するページ記憶手段、9は上
記ページ記憶手段8に記憶された全イメージデータを表
示する表示手段、10は上記表示手段の表示画面を見なが
ら、読取り領域の位置及びこの読取り領域内の文字を認
識するに必要な情報,すなわち読取りフォーマットを指
示入力する入力手段であり、ここではキーボードを用い
ている。一方、11は上記入力手段で入力された情報を読
取りフォーマットテーブルに格納し、文書の読取りフォ
ーマットを制御する制御手段、12は上記ページ記憶手段
に記憶されたイメージデータから上記制御手段の制御に
よりまず行を切出し、その行から文字パターンを切出す
文字切出し手段である。
次に同図を用いて本実施例の概略動作を説明し、更に第
2図ないし第5図を用いてその要部を詳細に説明する。
第1図に示すように、用紙1に記入された文字を走査手
段2で走査して光電変換し、1ページ分のイメージデー
タをページ記憶手段8に格納する。次いで上記1ページ
分のイメージを表示手段9に表示する。ここでオペレー
タは表示された文書イメージの表示画面を観測し、キー
ボードでカーソル走査を行なれる入力手段10から記入文
字領域を表示画面上で指示入力する。更に上記入力手段
10のキーボードを走査して認識対象字種に対応する番号
を先端入力してこれらを制御手段11に送る。入力され記
入文字領域及び認識対象字種セットは制御手段11内の読
取りフォーマットテーブル内に格納される。文字切出し
手段12では上記記入文字領域内において、まず文字の記
入されている行を自動的に切出し、さらに行内から1字
ずつ文字パターンを切出して文字認識手段5を送る。文
字認識手段5では切出された文字パターンを用いて特徴
を抽出し、抽出された特徴値と文字認識手段5内に格納
されている認識基準パターンの特徴値とを比較して認識
し、その結果として文字コードを出力する。
2図ないし第5図を用いてその要部を詳細に説明する。
第1図に示すように、用紙1に記入された文字を走査手
段2で走査して光電変換し、1ページ分のイメージデー
タをページ記憶手段8に格納する。次いで上記1ページ
分のイメージを表示手段9に表示する。ここでオペレー
タは表示された文書イメージの表示画面を観測し、キー
ボードでカーソル走査を行なれる入力手段10から記入文
字領域を表示画面上で指示入力する。更に上記入力手段
10のキーボードを走査して認識対象字種に対応する番号
を先端入力してこれらを制御手段11に送る。入力され記
入文字領域及び認識対象字種セットは制御手段11内の読
取りフォーマットテーブル内に格納される。文字切出し
手段12では上記記入文字領域内において、まず文字の記
入されている行を自動的に切出し、さらに行内から1字
ずつ文字パターンを切出して文字認識手段5を送る。文
字認識手段5では切出された文字パターンを用いて特徴
を抽出し、抽出された特徴値と文字認識手段5内に格納
されている認識基準パターンの特徴値とを比較して認識
し、その結果として文字コードを出力する。
第2図は文書のイメージを表示手段9の画面上に表示し
た一例である。また第3図は領域指定により切出された
矩形領域を示した一例である。まず上記文書例は、漢
字,ひらがな,カタカナ,記号,数字の字種を含む第1
の領域13と、図を含む第2の領域14と、英数字,記号の
字種を含む第3の領域15の3つの領域に分けることがで
きる。入力手段10のカーソル移動キーを用いて、表示さ
れるカーソル位置に対応する切出し指示点で文書のイメ
ージの領域を指示する。すなわち、第1の領域13は第1
の切出し指示点16と第2の切出し指示点17とで指示する
ことにより第3図に示す第1の矩形領域18を指定する。
また第2の領域14は第3の切出し指示点19と第4の切出
し指示点20とで指示することにより第2の矩形領域21を
指定する。同様に第3の領域15は第5の切出し指示点22
と第6の切出し指示点23とで指示することにより第3の
矩形領域24を指定する。
た一例である。また第3図は領域指定により切出された
矩形領域を示した一例である。まず上記文書例は、漢
字,ひらがな,カタカナ,記号,数字の字種を含む第1
の領域13と、図を含む第2の領域14と、英数字,記号の
字種を含む第3の領域15の3つの領域に分けることがで
きる。入力手段10のカーソル移動キーを用いて、表示さ
れるカーソル位置に対応する切出し指示点で文書のイメ
ージの領域を指示する。すなわち、第1の領域13は第1
の切出し指示点16と第2の切出し指示点17とで指示する
ことにより第3図に示す第1の矩形領域18を指定する。
また第2の領域14は第3の切出し指示点19と第4の切出
し指示点20とで指示することにより第2の矩形領域21を
指定する。同様に第3の領域15は第5の切出し指示点22
と第6の切出し指示点23とで指示することにより第3の
矩形領域24を指定する。
第4図は制御手段11内に格納されている読取りフォーマ
ットテーブルの内容を示す構成図である。第1の矩形領
域18の認識対象字種が漢字,ひらがな,カタカナ,記
号,数字であることを示す値“1"が字種の欄25に、また
第2の矩形領域21は図領域であり認識対象字種がないこ
とを示す値“0"が同じく字種の欄26に、また第3の矩形
領域24の認識対象字種が英数字,記号であることを示す
値“2"が同様に字種の欄27に格納されている。また、上
記第1の矩形領域18の文書イメージの位置に対応して、
第1及び第2の切出し指示点16及び17のX,Y方向の座標
値1,1及び20,16が切出し領域の欄28及び29に格納されて
いる。同様に第3の切出し指示点から第6の切出し指示
点19,20,22,23のX,Y方向の座標値がそれぞれ切出し領域
の欄30,31,32,33に格納されている。
ットテーブルの内容を示す構成図である。第1の矩形領
域18の認識対象字種が漢字,ひらがな,カタカナ,記
号,数字であることを示す値“1"が字種の欄25に、また
第2の矩形領域21は図領域であり認識対象字種がないこ
とを示す値“0"が同じく字種の欄26に、また第3の矩形
領域24の認識対象字種が英数字,記号であることを示す
値“2"が同様に字種の欄27に格納されている。また、上
記第1の矩形領域18の文書イメージの位置に対応して、
第1及び第2の切出し指示点16及び17のX,Y方向の座標
値1,1及び20,16が切出し領域の欄28及び29に格納されて
いる。同様に第3の切出し指示点から第6の切出し指示
点19,20,22,23のX,Y方向の座標値がそれぞれ切出し領域
の欄30,31,32,33に格納されている。
第5図は第1の矩形領域18内の文書イメージデータから
行を切出し、さらに行内の文字パターンを切出す方法の
一例を示した図である。これは、すでに広く用いられて
いる文字部の黒パターンの周辺分布を用いて行及び文字
パターンを切出す方法であり、まず、同図(a)に示す
ように第1の矩形領域18を行方向に走査して黒パターン
のヒストグラム33を求め、このヒストグラムの値が1以
上で連続する第1の部分34を第1の行35として切出し、
第2の部分36を第2の行37として切出す。更に、同図
(b)に示すように第1の行35内を列方向に走査して黒
パターンのヒストグラム38を求め、このヒストグラムの
値が1以上で連続する部分を切出すことにより、第1の
文字部分から第11の文字部分39〜49が切出される。
行を切出し、さらに行内の文字パターンを切出す方法の
一例を示した図である。これは、すでに広く用いられて
いる文字部の黒パターンの周辺分布を用いて行及び文字
パターンを切出す方法であり、まず、同図(a)に示す
ように第1の矩形領域18を行方向に走査して黒パターン
のヒストグラム33を求め、このヒストグラムの値が1以
上で連続する第1の部分34を第1の行35として切出し、
第2の部分36を第2の行37として切出す。更に、同図
(b)に示すように第1の行35内を列方向に走査して黒
パターンのヒストグラム38を求め、このヒストグラムの
値が1以上で連続する部分を切出すことにより、第1の
文字部分から第11の文字部分39〜49が切出される。
以上のようにして切出された文字パターンは第4図で示
す読取りフォーマットで指示される字種を認識対象とし
て文字認識手段5で認識される。なお、上記第2の矩形
領域21は図領域であり、文字切出し及び文字認識は行な
われない。
す読取りフォーマットで指示される字種を認識対象とし
て文字認識手段5で認識される。なお、上記第2の矩形
領域21は図領域であり、文字切出し及び文字認識は行な
われない。
従って本実施例によれば、読取られた文書のイメージを
表示しながら切出し領域や認識対象字種をオペレータが
即時に指示入力し、かつ指示された領域内の文字を自動
的に切出して認識することにより、読取りフォーマット
を作成する作業時間が大幅に短縮できかつ容易に入力で
き、読取りフォーマットの異なる文書でも効率よく入力
できる利点がある。また読取られた文書イメージを画面
上で観測してフォーマットを入力するため、切出し領域
が正確に設定できる利点がある。
表示しながら切出し領域や認識対象字種をオペレータが
即時に指示入力し、かつ指示された領域内の文字を自動
的に切出して認識することにより、読取りフォーマット
を作成する作業時間が大幅に短縮できかつ容易に入力で
き、読取りフォーマットの異なる文書でも効率よく入力
できる利点がある。また読取られた文書イメージを画面
上で観測してフォーマットを入力するため、切出し領域
が正確に設定できる利点がある。
なお、上記説明では読取りフォーマットテーブルに登録
する認識情報として、認識対象字種と切出し領域の位置
とについて説明したが、この発明はこれに限らず、認識
対象の文字が手書き文字か印刷文字かを示す情報を読取
りフォーマットテーブルに登録して使用してよい。ま
た、入力手段はキーボードについて説明したが、これに
限らず点座標入力と数値入力ができる入力手段ならばい
かなる入力手段を使用してもよい。
する認識情報として、認識対象字種と切出し領域の位置
とについて説明したが、この発明はこれに限らず、認識
対象の文字が手書き文字か印刷文字かを示す情報を読取
りフォーマットテーブルに登録して使用してよい。ま
た、入力手段はキーボードについて説明したが、これに
限らず点座標入力と数値入力ができる入力手段ならばい
かなる入力手段を使用してもよい。
以上説明したように、この発明による文書読取装置は、
表示手段で表示された画像の文字領域を選択し、文字切
出し手段が選択された文字領域から文字を切出すので、
あらかじめ認識領域の取捨選択を行うことで、高速に認
識処理を行うことができる。また、文字領域に表示され
ている文字の字種等の属性を選択することにより、精度
の高い認識処理を行うことができる。
表示手段で表示された画像の文字領域を選択し、文字切
出し手段が選択された文字領域から文字を切出すので、
あらかじめ認識領域の取捨選択を行うことで、高速に認
識処理を行うことができる。また、文字領域に表示され
ている文字の字種等の属性を選択することにより、精度
の高い認識処理を行うことができる。
第1図はこの発明による文書読取装置の一実施例を示す
ブロック構成図、第2図は文書イメージの表示画面の一
例を示す図、第3図は上記実施例により切出された矩形
領域を示す図、第4図は読取りフォーマットテーブルの
構成図、第5図は文字切出し方法の一例を示す図、第6
図は従来例を示すブロック構成図である。 1……文書、8……記憶手段、9……表示手段、10……
入力手段。 なお、図中同一又は相当部分には同一符号を用いてい
る。
ブロック構成図、第2図は文書イメージの表示画面の一
例を示す図、第3図は上記実施例により切出された矩形
領域を示す図、第4図は読取りフォーマットテーブルの
構成図、第5図は文字切出し方法の一例を示す図、第6
図は従来例を示すブロック構成図である。 1……文書、8……記憶手段、9……表示手段、10……
入力手段。 なお、図中同一又は相当部分には同一符号を用いてい
る。
Claims (1)
- 【請求項1】入力された文書の画像を記憶する記憶手段
と、この記憶手段に記憶された画像を表示する表示手段
と、この表示手段で表示された画像の認識すべき文字領
域とこの文字領域に表示されている文字の字種等の属性
とを選択する入力手段と、この入力手段により選択され
た上記文字領域と上記属性とを格納する格納手段と、こ
の格納手段に格納されている上記選択された文字領域の
文字を切出す文字切出し手段と、この文字切出し手段に
より切出された文字を上記格納手段に格納されている上
記選択された属性に基づき認識する認識手段とを備えた
ことを特徴とする文書読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047678A JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047678A JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61206087A JPS61206087A (ja) | 1986-09-12 |
JPH0782522B2 true JPH0782522B2 (ja) | 1995-09-06 |
Family
ID=12781934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60047678A Expired - Lifetime JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0782522B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61226885A (ja) * | 1985-03-30 | 1986-10-08 | Toshiba Corp | 光学的文字読取装置 |
JPH03229387A (ja) * | 1990-02-05 | 1991-10-11 | Mitsubishi Electric Corp | 文書読取方式 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58169682A (ja) * | 1982-03-31 | 1983-10-06 | Toshiba Corp | 文字画像処理装置 |
-
1985
- 1985-03-11 JP JP60047678A patent/JPH0782522B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS61206087A (ja) | 1986-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0444922B1 (en) | Modifying a graphics display image | |
JPH0554073A (ja) | デジタル翻訳装置 | |
EP0519713B1 (en) | Character input method and apparatus | |
JPH0782522B2 (ja) | 文書読取装置 | |
JPH0883331A (ja) | 画像処理装置 | |
JPH0728801A (ja) | イメージデータ処理方法及びその装置 | |
JP2578747B2 (ja) | 手書情報処理方法 | |
JP2517543B2 (ja) | 情報入力方法 | |
JP2000339405A (ja) | 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体 | |
JPH0668299A (ja) | 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置 | |
JP2682873B2 (ja) | 表形式文書の認識装置 | |
JPH0610447Y2 (ja) | 画像処理装置 | |
JPH03229387A (ja) | 文書読取方式 | |
JPH0266681A (ja) | 図面処理装置 | |
JP2939150B2 (ja) | 情報処理方法 | |
JPH04156694A (ja) | 文字認識方式 | |
JPS61276012A (ja) | 情報入力装置 | |
JPH0831092B2 (ja) | 文書処理装置 | |
JPH08123801A (ja) | 文書作成装置及び枠編集方法 | |
JPH0581467A (ja) | 画像処理方法及び装置 | |
JPS62217388A (ja) | 手書き文字読取装置 | |
JPS63231567A (ja) | 文書作成装置 | |
JPH0916717A (ja) | 文書読取装置 | |
JPS62190569A (ja) | 文字入力装置 | |
JPH0962778A (ja) | 文字認識装置 |