JPS61206087A - 文書読取装置 - Google Patents
文書読取装置Info
- Publication number
- JPS61206087A JPS61206087A JP60047678A JP4767885A JPS61206087A JP S61206087 A JPS61206087 A JP S61206087A JP 60047678 A JP60047678 A JP 60047678A JP 4767885 A JP4767885 A JP 4767885A JP S61206087 A JPS61206087 A JP S61206087A
- Authority
- JP
- Japan
- Prior art keywords
- character
- document
- input
- recognizing
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は文字を含む文書から文字を認識して読取る文
書読取装置に係り、特に文書の読取りラオーマットを登
録する機構に関するものである。
書読取装置に係り、特に文書の読取りラオーマットを登
録する機構に関するものである。
従来この種の文書読取装置としては、いわゆる光学的文
字読取装置といわれるものに、第6図に示すものがある
。第6図は従来の文書読取装置を示すブロック構成図で
ある。同図に示すようにこの装置は、文書、すなわち用
紙1上に記入された文字を走査手段2で走査して光電変
換し、1行分の画像、すなわちイメージデータを行記憶
手段3に格納し、さらに1行分のイメージデータから文
字切出し手段4で1文字分の文字パターンを切出し、切
出された文字パターンから特徴を抽出し、上記抽出され
た特徴値と文字認識手段5内に格納されている認識基準
パターンのW徴値とを比較して認識し、認識結果として
文字コードを出力していた。また、上記処理を行なう場
合、事前に切出すべき位置や認識対象字種などを示す読
取りに必要な情報すなわち、読取りフォーマットを入力
手段6から入力し、制御手段7内の読取りフォーマット
テーブルに格納し、これにもとづき処理を行なっていた
。すなわち、用紙1上に記入される文字の位置や認識対
象字種を示す認識に必要な読取りフォーマットを事前に
文書に対応させて設定しtおき、この読取りフォーマッ
トに従って文字を切出して認識を行なっていた。
字読取装置といわれるものに、第6図に示すものがある
。第6図は従来の文書読取装置を示すブロック構成図で
ある。同図に示すようにこの装置は、文書、すなわち用
紙1上に記入された文字を走査手段2で走査して光電変
換し、1行分の画像、すなわちイメージデータを行記憶
手段3に格納し、さらに1行分のイメージデータから文
字切出し手段4で1文字分の文字パターンを切出し、切
出された文字パターンから特徴を抽出し、上記抽出され
た特徴値と文字認識手段5内に格納されている認識基準
パターンのW徴値とを比較して認識し、認識結果として
文字コードを出力していた。また、上記処理を行なう場
合、事前に切出すべき位置や認識対象字種などを示す読
取りに必要な情報すなわち、読取りフォーマットを入力
手段6から入力し、制御手段7内の読取りフォーマット
テーブルに格納し、これにもとづき処理を行なっていた
。すなわち、用紙1上に記入される文字の位置や認識対
象字種を示す認識に必要な読取りフォーマットを事前に
文書に対応させて設定しtおき、この読取りフォーマッ
トに従って文字を切出して認識を行なっていた。
ところで、この種装置が普及するに従うて、文書作成時
に即座に文書を読取る用途が増え、また文書の種類が多
様化してきたため、極端な場合文書1枚1枚の読取りフ
ォーマットが異なる場合が増えてきた。しかしながら、
事前に読取り領域や認識対象字種を指示する上記従来装
置によると、多様化する文書に対応してそれぞれの読取
りフォーマットを入力するには膨大な時間が掛かり、文
書の多様化に対応することができないという問題点を有
していた。
に即座に文書を読取る用途が増え、また文書の種類が多
様化してきたため、極端な場合文書1枚1枚の読取りフ
ォーマットが異なる場合が増えてきた。しかしながら、
事前に読取り領域や認識対象字種を指示する上記従来装
置によると、多様化する文書に対応してそれぞれの読取
りフォーマットを入力するには膨大な時間が掛かり、文
書の多様化に対応することができないという問題点を有
していた。
この発明は、上記のような問題点を解消するためになさ
れたもので、その場で容易に読取りフォーマットが入力
でき、多様化した文書に対応できる文書読取装置を得る
ことを目的とする。
れたもので、その場で容易に読取りフォーマットが入力
でき、多様化した文書に対応できる文書読取装置を得る
ことを目的とする。
〔問題点を解決するための手段〕
この発明に係る文書読取装置は、文書全体の画像を記憶
する記憶手段と、この記憶手段に記憶された画像を表示
する表示手段と、この表示手段に表示された画像にもと
づき読取りフォーマットを入力する入力手段とを備えた
ものである。
する記憶手段と、この記憶手段に記憶された画像を表示
する表示手段と、この表示手段に表示された画像にもと
づき読取りフォーマットを入力する入力手段とを備えた
ものである。
この発明においては、記憶手段に文書全体の画像が一旦
記憶され、この内容が表示手段に表示される。オペレー
タは入力手段から文字の記入領域や認識対象字種などの
読取りフォーマットを表示画面を見ながら、即時に指示
入力できる。
記憶され、この内容が表示手段に表示される。オペレー
タは入力手段から文字の記入領域や認識対象字種などの
読取りフォーマットを表示画面を見ながら、即時に指示
入力できる。
以下、この発明を実施例を図示して説明する。
第1図はこの発明の文書読取装置の一実施例を示すブロ
ック構成図である。なお、第6図従来例と同一符号のも
のは同一構成要素を示しており、その説明は省略する。
ック構成図である。なお、第6図従来例と同一符号のも
のは同一構成要素を示しており、その説明は省略する。
同図において、8は文書全体の画像、すなわち1ペ一ジ
分のイメージデータを記憶するページ記憶手段、9は上
記ページ記憶手段8に記憶された全イメージデータを表
示する表示手段、10は上記表示手段の表示画面を見な
がら、読取り領域の位置及びこの読取り領域内の文字を
認識するに必要な情報、すなわち読取りフ、オーマット
を指示入力する入力手段であり、ここではキーボードを
用いている。一方、11は上記入力手段で入力された情
報を読取りフォーマットテーブルに格納し、文書の読取
りフォーマットを制御する制御手段、12は上記ページ
記憶手段に記憶されたイメージデータから上記制御手段
の制御によりまず行を切出し、その行から文字パターン
を切出す文字切出し手段である。
分のイメージデータを記憶するページ記憶手段、9は上
記ページ記憶手段8に記憶された全イメージデータを表
示する表示手段、10は上記表示手段の表示画面を見な
がら、読取り領域の位置及びこの読取り領域内の文字を
認識するに必要な情報、すなわち読取りフ、オーマット
を指示入力する入力手段であり、ここではキーボードを
用いている。一方、11は上記入力手段で入力された情
報を読取りフォーマットテーブルに格納し、文書の読取
りフォーマットを制御する制御手段、12は上記ページ
記憶手段に記憶されたイメージデータから上記制御手段
の制御によりまず行を切出し、その行から文字パターン
を切出す文字切出し手段である。
次に同図を用いて本実施例の概略動作を説明し、更に第
2図ないし第5図を用いてその要部を詳細に説明する。
2図ないし第5図を用いてその要部を詳細に説明する。
第1図に示すように、用紙1に記入された文字を走査手
段2で走査して光電変換し、1ペ一ジ分のイメージデー
タをページ記憶手段8に格納する。次いで上記1ペ一ジ
分のイメージを表示手段9に表示する。ここでオペレー
タは表示された文書イメージの表示画面を観測し、キー
ボードでカーソル操作を行なえる入力手段10から記入
文字領域を表示画面上で指示入力する。更に上記入力手
段lOのキーボードを操作して認識対象字種に対応する
番号を選択入力してこれらを制御手段11に送る。入力
された記入文字領域及び認識対象字種セットは制御手段
11内の読取りフォーマットテーブル内に格納される。
段2で走査して光電変換し、1ペ一ジ分のイメージデー
タをページ記憶手段8に格納する。次いで上記1ペ一ジ
分のイメージを表示手段9に表示する。ここでオペレー
タは表示された文書イメージの表示画面を観測し、キー
ボードでカーソル操作を行なえる入力手段10から記入
文字領域を表示画面上で指示入力する。更に上記入力手
段lOのキーボードを操作して認識対象字種に対応する
番号を選択入力してこれらを制御手段11に送る。入力
された記入文字領域及び認識対象字種セットは制御手段
11内の読取りフォーマットテーブル内に格納される。
文字切出し手段12では上記記入文字領域内において、
まず文字の記入されている行を自動的に切出し、さらに
行内から1字ずつ文字パターンを切出して文字認識手段
5に送る0文字認識手段5では切出された文字パターン
を用いて特徴を抽出し、抽出された特徴値と文字認識手
段5内に格納されている認識基準パターンの特徴値とを
比較して認識し、その結果として文字コードを出力する
。
まず文字の記入されている行を自動的に切出し、さらに
行内から1字ずつ文字パターンを切出して文字認識手段
5に送る0文字認識手段5では切出された文字パターン
を用いて特徴を抽出し、抽出された特徴値と文字認識手
段5内に格納されている認識基準パターンの特徴値とを
比較して認識し、その結果として文字コードを出力する
。
第2図は文書のイメージを表示手段9の画面上に表示し
た一例である。また第3図は領域指定により切出された
矩形領域を示した一例である。まず上記文書例は、漢字
、ひらがな、カタカナ、記号、数字の字種を含む第1の
領域13と、図を含む第2の領域14と、英数字、記号
の字種を含む第3の領域15の3つの領域に分けること
ができる。入力手段10のカーソル移動キーを用いて、
表示されるカーソル位置に対応する切出し指示点で文書
のイメージの領域を指示する。すなわち、第1の領域1
3は第1の切出し指示点16と第2の切出し指示点17
とで指示することにより第3図に示す第1の矩形領域1
8を指定する。また第2の領域14は第3の切出し指示
点19と第4の切出し指示点20とで指示することによ
り第2の矩形領域21を指定する。同様に第3の領域1
5は第5の切出し指示点22と第6の切出し指示点23
とで指示することにより第3の矩形領域24を指定する
。
た一例である。また第3図は領域指定により切出された
矩形領域を示した一例である。まず上記文書例は、漢字
、ひらがな、カタカナ、記号、数字の字種を含む第1の
領域13と、図を含む第2の領域14と、英数字、記号
の字種を含む第3の領域15の3つの領域に分けること
ができる。入力手段10のカーソル移動キーを用いて、
表示されるカーソル位置に対応する切出し指示点で文書
のイメージの領域を指示する。すなわち、第1の領域1
3は第1の切出し指示点16と第2の切出し指示点17
とで指示することにより第3図に示す第1の矩形領域1
8を指定する。また第2の領域14は第3の切出し指示
点19と第4の切出し指示点20とで指示することによ
り第2の矩形領域21を指定する。同様に第3の領域1
5は第5の切出し指示点22と第6の切出し指示点23
とで指示することにより第3の矩形領域24を指定する
。
第4図は制御手段11内に格納されている読取りフォー
マットテーブルの内容を示す構成図である。第1の矩形
領域18の認識対象字種が漢字。
マットテーブルの内容を示す構成図である。第1の矩形
領域18の認識対象字種が漢字。
ひらがな、カタカナ、記号、数字であることを示す値“
1”が字種の欄25に、また第2の矩形領域21は図領
域であり認識対象字種がないことを示す値“0”が同じ
く字種の欄26に、また第3の矩形領域24の認識対象
字種が英数字、記号であることを示す値“2”が同様に
字種の827に格納されている。また、上記第1の矩形
領域18の文書イメージの位置に対応して、第1及び第
2の切出し指示点16及び17のX、Y方向の座標値1
,1及び20.16が切出し領域の欄28及び29に格
納されている。同様に第3の切出し指示点から第6の切
出し指示点19.20,22゜23のx、Y方向の座標
値がそれぞれ切出し領域の欄30.31,32.33に
格納されている。
1”が字種の欄25に、また第2の矩形領域21は図領
域であり認識対象字種がないことを示す値“0”が同じ
く字種の欄26に、また第3の矩形領域24の認識対象
字種が英数字、記号であることを示す値“2”が同様に
字種の827に格納されている。また、上記第1の矩形
領域18の文書イメージの位置に対応して、第1及び第
2の切出し指示点16及び17のX、Y方向の座標値1
,1及び20.16が切出し領域の欄28及び29に格
納されている。同様に第3の切出し指示点から第6の切
出し指示点19.20,22゜23のx、Y方向の座標
値がそれぞれ切出し領域の欄30.31,32.33に
格納されている。
第5図は第1の矩形領域1g内の□文書イメージデータ
から行を切出し、さらに行内の文字パターンを切出す方
法の一例を示した図である。これは、すでに広く用いら
れている文字部の黒パターンの周辺分布を用いて行及び
文字パターンを切出す方法であり、まず、同図(alに
示すように第1の矩形領域18を行方向に走査して黒パ
ターンのヒストグラム33を求め、このヒストグラムの
値が1以上で連続する第1の部分34を第1の行35と
して切出し、第2の部分36を第2の行37として切出
す。更に、同図(blに示すように第1の行35内を列
方向に走査して黒パターンのヒストグラム38を求め、
このヒストグラムの値が1以上で連続する部分を切出す
ことにより、第1の文字部分から第11の文字部分39
〜49が切出される。
から行を切出し、さらに行内の文字パターンを切出す方
法の一例を示した図である。これは、すでに広く用いら
れている文字部の黒パターンの周辺分布を用いて行及び
文字パターンを切出す方法であり、まず、同図(alに
示すように第1の矩形領域18を行方向に走査して黒パ
ターンのヒストグラム33を求め、このヒストグラムの
値が1以上で連続する第1の部分34を第1の行35と
して切出し、第2の部分36を第2の行37として切出
す。更に、同図(blに示すように第1の行35内を列
方向に走査して黒パターンのヒストグラム38を求め、
このヒストグラムの値が1以上で連続する部分を切出す
ことにより、第1の文字部分から第11の文字部分39
〜49が切出される。
以上のようにして切出された文字パターンは第4図で示
す読取りフォーマットで指示される字種を認識対象とし
て文字認識手段5で認識される。
す読取りフォーマットで指示される字種を認識対象とし
て文字認識手段5で認識される。
なお、上記第2の矩形領域21は図領域であり、文字切
出し及び文字認識は行なわない。
出し及び文字認識は行なわない。
従って本実施例によれば、読取られた文書のイメージを
表示しながら切出し領域や認識対象字種をオペレータが
即時に指示入力し、かつ指示された領域内の文字を自動
的に切出して認識することにより、読取りフォーマット
を作成する作業時間が大幅に短縮できかつ容易に入力で
き、読取りフォーマットの異なる文書でも効率よく入力
できる利点がある。また読取られた゛文書イメージを画
面上で観測してフォーマットを入力するため、切出し領
域が正確に設定できる利点がある。
表示しながら切出し領域や認識対象字種をオペレータが
即時に指示入力し、かつ指示された領域内の文字を自動
的に切出して認識することにより、読取りフォーマット
を作成する作業時間が大幅に短縮できかつ容易に入力で
き、読取りフォーマットの異なる文書でも効率よく入力
できる利点がある。また読取られた゛文書イメージを画
面上で観測してフォーマットを入力するため、切出し領
域が正確に設定できる利点がある。
なお、上記説明では読取りフォーマットテーブルに登録
する認識情報として、認識対象字種と切出し領域の位置
とについて説明したが、この発明はこれに限らず、認識
対象の文字が手書き文字か印刷文字かを示す情報を読取
りフォーマントテーブルに登録して使用してよい、また
、入力手段はキーボードについて説明したが、これに限
らず点座標入力と数値入力ができる入力手段ならばいか
なる入力手段を使用してもよい。
する認識情報として、認識対象字種と切出し領域の位置
とについて説明したが、この発明はこれに限らず、認識
対象の文字が手書き文字か印刷文字かを示す情報を読取
りフォーマントテーブルに登録して使用してよい、また
、入力手段はキーボードについて説明したが、これに限
らず点座標入力と数値入力ができる入力手段ならばいか
なる入力手段を使用してもよい。
以上説明したように、この発明によれば、文書全体の画
像を記憶する□記憶手段と、この記憶手段に記憶された
画像を表示する表示手段と、この表示手段に表示された
画像にもとづき読取りフォーマットを入力する入力手段
とを備えたことにより、表示手段に表示された文書の画
像を見ながら、その場で容易に読取りフォーマットを入
力することができるので、多様化した文書に対応するこ
とができる文書読取装置が得られるという効果があ名。
像を記憶する□記憶手段と、この記憶手段に記憶された
画像を表示する表示手段と、この表示手段に表示された
画像にもとづき読取りフォーマットを入力する入力手段
とを備えたことにより、表示手段に表示された文書の画
像を見ながら、その場で容易に読取りフォーマットを入
力することができるので、多様化した文書に対応するこ
とができる文書読取装置が得られるという効果があ名。
第1図はこの発明による文書読取装置の一実施例を示す
ブロック構成図、第2図は文書イメージの表示画面の一
例を示す図、第3図は上記実施例により切出された矩形
領域を示す図、第4図は読取りフォーマットテーブルの
構成図、第5図は文字切出し方法の一例を示す図、第6
図は従来例を示すブロック構成図である。 1・・・文書、8・・・記憶手段、9・・・表示手段、
10・・・入力手段。 なお、図中間−又は相当部分には同一符号を用いている
。 代理人 大 岩 増 雄(ほか2名)第1図 1!3図 第4図 第5図 手続補正−鋤
ブロック構成図、第2図は文書イメージの表示画面の一
例を示す図、第3図は上記実施例により切出された矩形
領域を示す図、第4図は読取りフォーマットテーブルの
構成図、第5図は文字切出し方法の一例を示す図、第6
図は従来例を示すブロック構成図である。 1・・・文書、8・・・記憶手段、9・・・表示手段、
10・・・入力手段。 なお、図中間−又は相当部分には同一符号を用いている
。 代理人 大 岩 増 雄(ほか2名)第1図 1!3図 第4図 第5図 手続補正−鋤
Claims (1)
- 文書を画像として入力し、所定の読取りフォーマットに
もとづき上記画像から文字パターンを切出し、切出され
た文字パターンを認識して読取る文書読取装置において
、文書全体の画像を記憶する記憶手段と、この記憶手段
に記憶された画像を表示する表示手段と、この表示手段
に表示された画像にもとづき読取りフォーマットを入力
する入力手段とを備えたことを特徴とする文書読取装置
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047678A JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60047678A JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61206087A true JPS61206087A (ja) | 1986-09-12 |
JPH0782522B2 JPH0782522B2 (ja) | 1995-09-06 |
Family
ID=12781934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60047678A Expired - Lifetime JPH0782522B2 (ja) | 1985-03-11 | 1985-03-11 | 文書読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0782522B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61226885A (ja) * | 1985-03-30 | 1986-10-08 | Toshiba Corp | 光学的文字読取装置 |
JPH03229387A (ja) * | 1990-02-05 | 1991-10-11 | Mitsubishi Electric Corp | 文書読取方式 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58169682A (ja) * | 1982-03-31 | 1983-10-06 | Toshiba Corp | 文字画像処理装置 |
-
1985
- 1985-03-11 JP JP60047678A patent/JPH0782522B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58169682A (ja) * | 1982-03-31 | 1983-10-06 | Toshiba Corp | 文字画像処理装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61226885A (ja) * | 1985-03-30 | 1986-10-08 | Toshiba Corp | 光学的文字読取装置 |
JPH03229387A (ja) * | 1990-02-05 | 1991-10-11 | Mitsubishi Electric Corp | 文書読取方式 |
Also Published As
Publication number | Publication date |
---|---|
JPH0782522B2 (ja) | 1995-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0554073A (ja) | デジタル翻訳装置 | |
JP2740335B2 (ja) | 自動セル属性判定機能を有する表読取装置 | |
US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
JPS61206087A (ja) | 文書読取装置 | |
JPS61253587A (ja) | 光学文字読取装置 | |
JP2937607B2 (ja) | レイアウト作成装置 | |
JP3196603B2 (ja) | バーコード認識方法及びシステム | |
JP2682873B2 (ja) | 表形式文書の認識装置 | |
JPS63115283A (ja) | 文字認識装置における認識結果修正画面の表示方法 | |
JPH08137987A (ja) | 光学式文字読取装置 | |
JP3077359B2 (ja) | 文書作成装置 | |
JPH0581467A (ja) | 画像処理方法及び装置 | |
JPH03103996A (ja) | 光学的文字読取装置 | |
JPH0831092B2 (ja) | 文書処理装置 | |
JPH08339417A (ja) | 欧米文字認識装置及び欧米文字認識方法 | |
JPH03229387A (ja) | 文書読取方式 | |
JPH0345415B2 (ja) | ||
JPH07160811A (ja) | 文字認識装置 | |
JPH0459668B2 (ja) | ||
JPH0266681A (ja) | 図面処理装置 | |
JPH0459669B2 (ja) | ||
JPS6326789A (ja) | 文字認識装置 | |
JPH06119486A (ja) | 文字認識装置および表示方法 | |
JPS62190569A (ja) | 文字入力装置 | |
JPH01134584A (ja) | 文字認識装置 |