[go: up one dir, main page]

JPH04302070A - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JPH04302070A
JPH04302070A JP3065786A JP6578691A JPH04302070A JP H04302070 A JPH04302070 A JP H04302070A JP 3065786 A JP3065786 A JP 3065786A JP 6578691 A JP6578691 A JP 6578691A JP H04302070 A JPH04302070 A JP H04302070A
Authority
JP
Japan
Prior art keywords
character
character recognition
word
characters
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3065786A
Other languages
English (en)
Other versions
JP3083171B2 (ja
Inventor
Etsuo Ito
悦雄 伊藤
Kimito Takeda
武田 公人
Koichi Hasebe
浩一 長谷部
Masaie Amano
天野 真家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03065786A priority Critical patent/JP3083171B2/ja
Publication of JPH04302070A publication Critical patent/JPH04302070A/ja
Application granted granted Critical
Publication of JP3083171B2 publication Critical patent/JP3083171B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[発明の目的]
【0001】
【産業上の利用分野】本発明は、文字認識装置に関わる
【0002】
【従来の技術】近年の文書処理の電子化に伴い、紙に印
刷された文書を読み取り、電子メディア化する文字読み
取り装置が開発されている。従来の文字認識装置は、各
種文書が記載された原稿を読み取り部により読み取る。 この時、読み取り部は原稿を文字の集まりとして捕らえ
るのではなく、点の集まりからなる画像データとして読
み取る。そして、読み取った画像データから文字認識部
が任意の範囲を切り出し、認識用辞書に格納している標
準文字パターンとのパターン照合処理を行う。この結果
、文字認識部で照合ができれば、この文字は出力部へ出
力されると共に、記録部に記録される。これらの処理を
行うことにより装置内で原稿上の文字がコードに変換さ
れる。しかし、これらの処理では、数字の‘0’とアル
ファベット‘O’、小文字の‘1(エル)’、と大文字
の‘I(アイ)’、数字の‘1’など類似した文字の間
に曖昧性が残る場合があり、この部分をオペレータに教
示する必要があった。
【0003】また、文字認識部に曖昧性が無いと判断し
ても、原稿の文字掠れなどにより読み取り誤りがある場
合がある。このため、後処理として、読み取った文字を
単語毎にまとめ、その単語が語彙辞書に存在するか否か
を判断し(これを以降未知語判定と呼ぶ)、存在しない
場合には読み取り誤りである可能性があることをオペレ
ータに指示する必要があった。読み取り誤りの場合と曖
昧性が残る場合を合わせて認識誤りと呼ぶ。
【0004】しかし、従来の文字認識装置では、認識誤
り箇所の候補をオペレータに指示しても、オペレータに
はそれが、文字認識により曖昧性があると判断されたも
のであるか、未知語判定によって未知語と判断されたも
のであるかの情報を得ることができず、認識結果の修正
作業にかかる負担が大きかった。また、語彙辞書が整備
されていないため正しく認識されている語句を指摘した
り、曖昧性があるため正しく認識されている語句を指摘
したりすることがあり、煩わしかった。
【0005】
【発明が解決しようとする課題】このように従来の文字
認識装置では、認識誤り箇所の候補をオペレータに指示
しても、それが文字認識の曖昧性によるものか、未知語
であることによるものかがオペレータにはわからないた
め、以降の修正作業の負担が大きいという問題があった
。また、正しく認識されている語であるにも拘らず、語
彙辞書の未整備や曖昧性の判断不良のために認識誤りと
してしまうことを防ぐことができないという問題があっ
た。
【0006】本発明はかかる事情を考慮してなされたも
ので、その目的とするところは、認識誤り箇所の候補の
認識誤りの原因をオペレータに示し、修正作業の効率化
を図ることのできる文字認識装置を提供することにある
。 [発明の構成]
【0007】
【課題を解決するための手段】本発明にかかる文字認識
装置は、文字を画像パターンとして入力する入力部と、
入力した画像パターンと予め記憶された認識用辞書の文
字パターンとを照合して、類似度が所定値以上の文字パ
ターンの文字を選択する文字認識部と、得られた文字か
ら成る文字列が予め記憶された語彙辞書の文字列の中に
存在するか否かを判定する未知語判定部と、得られた文
字を表示する表示部とを備え、文字認識部において類似
度が所定値以上の文字パターンが複数ある中から選択さ
れた文字を含む文字列の場合識別子Aを、未知語判定部
において語彙辞書中に存在しない未知語であると判定さ
れた文字列の場合識別子Bを付与して記憶し、所定の条
件を満たすときに、文字列とこれに対応する識別子とを
表示することを特徴とするものである。
【0008】
【作用】本発明によれば、入力した文字を画像データか
ら文字データに変換する際に誤りがあった可能性のある
語句を修正必要候補語句として表示するのであるが、こ
の場合、認識用辞書を用いてパターン照合する際に近い
パターンが複数あったのか(A)、照合された結果が語
彙辞書中に存在しないと判定されたのか(B)を区別し
て表示あるいは記憶する。これによりオペレータは、表
示された状態を参照しながら修正等の後編集を行うこと
ができる。
【0009】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明を行う。図1に、本発明の一実施例に係る
文字認識装置の構成を表すブロック図を示す。
【0010】図1において入力部1は本発明における文
字認識装置の動作に必要なコマンドを入力したり、認識
結果に対する修正文字を入力したりできるもので通常、
キーボードやマウス、タッチパネルなどが用いられる。 表示部2は、入力部1より入力されたコマンドや文字を
表示したり、後述する読み取り部3からの読み取り結果
や文字認識部4による文字認識の途中状態や認識結果、
修正必要候補語句指示部8による指示内容を表示したり
できるもので、通常ビットマップディスプレイなどが使
用される。なお、画面を2分割して、片方を読み取り部
が読み取った画像イメージを表示させ、他方に本装置が
認識した文字を対応させて表示することもできる。読み
取り部3は原稿を読み取るためのもので、例えばライン
イメージセンサを備えたスキャナが用いられる。なお、
このスキャナの解像度により読み取れる文字の種類が決
まる。文字認識部4は読み取り部3が原稿を読み取った
結果得られた画像データを文字として認識するものであ
る。読み取り部3が原稿を読み取るときは、文字単位で
読み取っているのではなく、原稿の一端から順次スキャ
ンしていき、各点に情報が有るか無いかの2値で表して
画像データを得る。このため解像度を上げるほど、より
細かく原稿を読み取ることになり、より複雑な文字も読
み取ることができる。文字認識部4に供される画像デー
タは、読み取り部3で読み取る以外にも、イメージファ
イル12を入力する等の方法で得ることができる。そし
て、文字認識部4は画像データの任意の範囲を対象にし
て認識用辞書5に予め記録している標準文字パターンと
のパターン照合処理を行う。このパターン照合処理を画
像データの全てに対して行い、類似度が所定値以上とな
った標準文字パターンがマッチしたとして、画像データ
に対応する文字であると認識する。未知語判定部6は、
前述の文字認識部4により認識された結果を単語単位で
語彙辞書7に記録されているか否かを判定するものであ
る。修正必要候補語句指示部8は、文字認識部4による
パターン照合により複数のパターンと読み込みパターン
がマッチした場合あるいは読み込みパターンがどのパタ
ーンともマッチしない読み取りエラーの場合などの曖昧
な文字や、未知語判定部6により未知語であると判定さ
れた語は、文字認識において誤って認識されている可能
性があるとの判断により、その文字や語をオペレータに
指示するためのものである。識別子表示部9は、修正必
要候補語句指示部8により指摘された語句が文字認識部
と未知語判定部のどちらの判断により指示されているか
を区別して表示するためのものである。記録部10は、
読み取り部3で読み取った画像データや、文字認識部4
による文字認識の途中結果や最終結果などを記録するも
のである。制御部11は前記各部の制御やデータの仲介
を行うものである。
【0011】図2は、本発明における文字認識装置の全
体の処理の流れを示すフローチャートである。原稿を文
字データとして電子化するためには、先ず、原稿を読み
取り部3により読み取る(S201 )。次に、読み取
った結果に対して文字認識部4において文字認識を行う
(S202 )。このとき、認識結果に曖昧性が残る語
句が有る場合はそれらをAとする。例えば曖昧性を示す
フラグSP−Fを立ててその語句とともに記録部10に
記憶する。 つぎに、文字認識が終わったデータに対して未知語判定
部6において未知語判定を行う(S203 )。文字認
識の際に類似度が所定値以上となるパターンが複数出て
きたとき、最も類似度の高いものについてのみ未知語判
定するとしてもよいし、出てきたもの全てについて未知
語判定してもよい。このとき、未知語となった語句が有
る場合はそれ等をBとする。例えば未知語であることを
示すフラグundef−Fを立ててその語句とともに記
録部10に記憶する。以上で認識が終わり修正が必要で
あるかもしれない箇所が判定できたため、オペレータに
よる確認・修正を行うためにこのデータを表示部2によ
り表示する(S204 )。そして、オペレータの指示
に従い、修正必要候補語句の指摘とその語句に対する識
別子の表示を行う(S205 )。このとき、最も類似
度の高い第一候補とその識別子を表示するが、第二候補
以下がある場合には次候補キー等によりこれらも識別子
とともに表示するようにしてもよい。オペレータはこの
指示・表示を参照しながら入力部1より文書データの修
正を行い(S206 )、最終的な結果を得る。なお、
文字認識の際に類似度が所定値以上となるパターンが全
くなかったときには、未知語判定及び文字データの表示
はできないため、曖昧性の識別子のみ表示してもよいし
、別に「読み取りエラー」と表示してもよい。
【0012】図2の処理をさらに詳細に説明すると、い
くつかのバリエーションがあり、その例を図3〜図5に
示す。図3は、修正必要候補語句の指摘(修正必要候補
語句指示部8による)とその語句に対する識別子の表示
(識別子表示部9による)を行うステップの動作の説明
の為のフローチャートである。修正必要候補語句の指摘
とその語句に対する識別子の表示を行う場合は、まず、
処理を行う文書の最初の語句を取出し(S301,S3
02 )それをDとする。Dが文字認識の結果曖昧性が
ある文字を含んでいるか否か(Dが記録部10にある語
句群Aの中に存在するか否か)を判断し(S303)、
含まれていればDは修正必要候補語句であるため、表示
部2にその旨の指示を行う(S304 )。また、同時
にこの指示が文字認識の結果曖昧性がある文字を含んで
いる為であることを示す識別子を表示する(S305 
)。ステップ303 において、曖昧性のある文字が含
まれていないと判断された場合には、次にDが未知語で
あるか否か(Dが記録部10にある語句群Bの中に存在
するか否か)の判断を行う  (S306 )。未知語
である場合には、Dは修正必要候補語句であるため、表
示部2にその旨の指示を行う(S307 )。また、同
時にこの指示がDが未知語である為であることを示す識
別子を表示する(S308 )。オペレータは、Dが修
正必要候補語句であるとして識別子とともに表示部2に
表示されると、これを見て修正が必要ならば、適宜修正
を行う(図2S206 )。この様に、Dに対する修正
必要候補語句の指摘とその語句に対する識別子の表示を
行った後、オペレータに次の修正必要候補語句の指摘を
行うかの問い合わせを行い(S309 )、指摘を行う
場合には次の候補が発見されるかあるいはデータのおわ
りまでこれらの手順を繰り返す。図3の処理においては
、曖昧性のある語に対しては、未知語かどうかは問わず
、オペレータの確認・修正のみにより最終結果を得るよ
うになっている。
【0013】図4のフローチャートに示す処理は、曖昧
性のある語に対しても、未知語であるか否かの判断を行
う点が図3の処理とは異なる。図3と同様、処理を行う
文書の語句を順番に取り出してDとする。Dが文字認識
の結果曖昧性がある(語句群Aに含まれる)と判断され
れば(S403 yes)、Dを修正必要候補語句とし
て、曖昧性によることを示す識別子とともに表示する(
S404 ,S405 )。こうして表示されたDに対
してオペレータが確認・修正を行い(S406 )、こ
のDが未知語であるか否かの判断(S407 )にかけ
る。Dが曖昧性がないと判断された場合(S403 n
o)も、未知語か否かの判断(S407 )を行い、未
知語(語句群Bに含まれる)と判断されれば(S408
 yes)、Dを修正必要候補語句として、未知語であ
ることによることを示す識別子とともに表示する(S4
08 ,S409 )。こうして表示されたDに対して
オペレータが確認・修正を行う(S410 )。
【0014】図4の処理においては、曖昧性のために修
正必要候補語句とされたものが実際に認識誤りであった
場合には、オペレータが修正してから未知語かどうかの
検査をする。そこで、オペレータが修正した語に限って
は、S407 の時点で、修正結果D´を未知語判定部
6 にかけて、正しい語句D´が未知語であるかどうか
を改めて判定してもよい。こうすることにより、未知語
判定された語には曖昧性が含まれていないことになるの
で、純粋に未知語である語だけがS408 ,S409
 にて表示される。よって、S410 の時点で、オペ
レータが、表示された未知語を語彙辞書7に登録する旨
の指示を出すようにすれば、語彙辞書の充実が図れ、以
降語彙辞書の不備のために正しい語が修正必要候補とさ
れることがなくなる。
【0015】図5のフローチャートに示す処理は、修正
必要候補語句である旨の指摘を行う条件を、オペレータ
が設定できるようにしたものである。図3と同様、処理
を行う文書の語句を順番に取り出してDとする。Dが語
句群A,Bの両方に含まれる(曖昧性があり未知語でも
ある)場合(S503 )、Dが語句群Aに含まれBに
は含まれない(曖昧性があっても未知語ではない)場合
(S504 )、Dが語句群Bに含まれAには含まれな
い(曖昧性はないが未知語である)場合(S505 )
、Dが語句群AにもBにも含まれない(曖昧性はなく未
知語でもない)場合(S506)に分けて処理を行う。 S503は、認識誤りである可能性が高い。S504 
,S505 は、正しく認識しているにも拘らずそれぞ
れ、曖昧性の判断が間違ったこと、語彙辞書に十分な数
の語句が登録されていないことが原因で修正必要候補と
判断してしまう可能性のあるものなので、オペレータが
これらを修正必要候補として表示するか否かの設定をし
、表示する設定がなされているときのみ(S510 ,
S512 )表示する(S511 ,S513 )。こ
の表示をオペレータが見て、適宜修正を行い、(図2S
206 )、未知語を語彙辞書に登録する必要があれば
登録する。曖昧性があって未知語でもあるS503 の
場合には、これを修正必要候補語句として表示する際に
、その識別子を曖昧性として表示するか(S507 )
、未知語として表示するか(S508 )の優先順位を
オペレータが設定しておくことができる。上述したよう
な、修正必要候補語句として表示する論理条件の設定や
、識別子の優先順位の設定を、曖昧性のある語句の出現
割合によって変更するとしてもよい。
【0016】以上のような処理を行う場合の表示部2の
様子の例を図7(a)に示す。認識結果のデータ中修正
必要候補語句が反転して表示され、この語句Dに対応す
る識別子が、例えば、曖昧性があるときには「曖昧性+
」、ないときには「曖昧性−」(あるいは何も表示しな
い)、未知語であるときには「未知語+」、そうでない
ときには「未知語−」(あるいは何も表示しない)とい
うように表示される。
【0017】図5の処理においては曖昧性、未知語の両
方のフラグが同時に表示されるが、図3の処理において
は「曖昧性+」と表示された語句に対しては未知語のフ
ラグは表示されない。また、図4の処理においては「曖
昧性+」と表示された語句に対してユーザが確認・修正
を行った後に未知語のフラグが表示される。
【0018】なお、上記の実施例では、まず、文字認識
の曖昧性の検査を行い、次に未知語の検査を行っている
が、この順序は逆でもよい。また、上記の実施例では、
予め文字認識と未知語判定を別々に前もって行っていた
が、これを同時に行ってもよいし、さらに結果の表示に
併せて行ってもよい。例えば、図4においてS403 
のところで取り出した語Dを文字認識し、その曖昧性を
判断し、曖昧性があれば表示して(S404 ,S40
5 )修正し(S406 )、その後S407 でこの
Dが語彙辞書にない未知語であるかを調べ、未知語であ
れば表示・修正を行い、この一連の処理の後次の語をD
として取り出すという具合に、様々に変形できる。
【0019】ここで、上述した文字認識装置を翻訳装置
に用いた場合の構成例を図6に示す。読み取り部603
 では、第1言語(例えば英語)で書かれた文書をイメ
ージ情報として読み取り、文字認識部604 では、こ
のイメージ情報のパターンを認識用辞書605 の標準
文字パターンと照合して、文字コードとして認識する。 未知語判定部606 では、この文字コードを並べて作
られる語句が語彙辞書607 中に存在するかどうかで
未知語判定を行う。認識され未知語判定されたデータは
翻訳部612 に送られ、翻訳用辞書613 を用いて
第2言語(例えば日本語)の文章に変換される。語彙辞
書607 は、翻訳用辞書613 にある第1言語のデ
ータを圧縮して高速に検索できるように作成したもので
ある。よって、未知語を補充する際には、語彙辞書のみ
でなく翻訳用辞書にも未知語及びこれに対応する訳語を
登録する。
【0020】記憶部610 は、読み取り部603 の
イメージ情報、文字認識部604 の認識結果や途中経
過、未知語判定部606 の判定結果、翻訳部612 
の翻訳結果等を記憶する。修正必要候補語句指示部60
8 は、入力部(例えばキーボード)601 からの指
示に基づき、記憶部610 に記憶されたデータをもと
に、上述の文字認識装置で説明したように修正必要候補
語句の指摘を、表示部602 と識別子表示部609 
に対して行う。入力部601 は、オペレータが、指摘
された修正必要候補語句の修正や、その他各部への指示
を行うためのものである。
【0021】本翻訳装置においては、文字認識部604
 、未知語判定部606 の処理を施したデータを翻訳
にかける前に、ユーザが表示部602の表示を見ながら
入力部601 を介して修正を行い、文字認識装置にお
ける認識誤りをなくした状態のデータを翻訳部612 
に送る(a)手動モードと、人手を介さずに読み取りか
ら翻訳までを通して行ってしまい、翻訳部612 の処
理の終了したデータを表示部602 に表示して、ユー
ザに修正させる(b)自動モードとがある。
【0022】表示部602 における修正必要候補語句
の指摘の例を図7に示す。図7(a)は手動モードの場
合(図1の文字認識装置の表示部2における表示と同じ
になる)、図7(b)は自動モードの場合である。いず
れの場合にも、修正必要候補語句は順番に、例えば反転
表示されて示され、反転表示された語句に対応する識別
子は、同じ画面上のどこかに、曖昧性、未知語の少なく
とも一方のフラグが+となる形で示される。この表示方
法は、他にも例えば、反転表示の色を変えて識別子とす
る等の方法でも良い。(b)自動モードの場合は、文字
認識されたデータとその翻訳結果との両方が画面を区切
って表示される。図7(a)では、文字認識された原稿
中のclaimsなる語について、パターン照合の際他
にも近い文字があったことを曖昧性+で示し、clai
msが辞書にある語であることを未知語−で示している
。 図7(b)では、文字認識された原稿(原文)中のva
riuusなる語(もとの原稿ではvariousであ
った)について、曖昧性があり未知語であることを示し
ている。訳文中では未知語variuusに対応する部
分が、例えば空白の反転表示等で示される。
【0023】(a)手動モードの場合は、認識誤りのな
いデータが翻訳されるので、翻訳結果を修正する後編集
が簡単になるという効果がある。また、翻訳の前に、未
知語という識別子と共に出た語句の辞書への登録ができ
るので、翻訳の効率も良くなる。しかも、認識結果の段
階で修正する作業も、上述の文字認識装置で説明したよ
うに効率化される。(b)自動モードの場合は、従来は
、翻訳できない原因が、(1)翻訳元のデータに読み取
り誤りがあった。(2)辞書に登録されていない未知語
であった、(3)(1)でも(2)でもないが文脈理解
等ができなかった、のように様々であるにも拘らず、あ
る語が翻訳できなかったときにオペレータがその原因を
区別することができなかった。本翻訳装置では、この問
題点を解消し、図7(b)を例にすると、曖昧性の識別
子+ならば原因(1)、未知語の識別子+ならば原因(
2)、どちらでもないのに翻訳できていないならば原因
(3)、というように、翻訳できなかった原因をオペレ
ータが容易に推測することができるという効果がある。
【0024】ところで、従来の文字認識装置は、文字認
識の専用システムとして独立した形態で提供されている
。このため、文字認識され例えば装置のディスク等に記
憶された文字コードを、例えば、翻訳する場合において
はフロッピーディスケット等に保存後、翻訳システムに
登録するようなことが行なわれている。このため、オペ
レータは、文字認識された文書のファイル名、フロッピ
ーディスケット等の保存方法、コード体系等の知識を習
得する必要があり、この操作は繁雑でオペレータに多大
な労力を強いる欠点があった。
【0025】又、文字認識した文字コード列が誤ってい
るのかのチェックは、文字認識装置があらかじめ備えて
いるスペルチェック用の辞書(上記の実施例では語彙辞
書7,607 )を用いて行なわれているが、次に希望
する処理を行うシステム、例えば、機械翻訳システムが
利用する辞書に認識された文字コード列があるかないか
等の判断をすることができないという問題点があった。
【0026】そこで、認識された文字コード列に対して
次に行いたい処理方法を指示するだけで次の処理システ
ムに文字コード列を渡すことができるようにする制御手
段を文字認識装置側に設けることで、オペレータの労力
を軽減できる文字認識システムを第2の実施例として説
明する。
【0027】図8は、第2の実施例に係る文字認識シス
テムの概略構成を示すブロック図である。図8において
、81は入力部で、この入力部81の入力データは、文
字認識制御部83に送られる。入力部81は、文字の入
力を始め、文字認識システムを制御するための各種コマ
ンドの入力を可能にしたもので、キーボード、マウス等
が使用される。例えば、イメージ入力部82において原
稿の入力を開始する指示は、表示部89に表示される“
イメージ読取り”ボタンをマウスで選択することで行う
【0028】文字認識制御部83は、システム全体を制
御するためのもので、ここでは、入力部81、イメージ
入力部82、イメージ記憶部84、文字認識部85、文
字コード記憶部86、文字コード編集部87、次処理制
御部88、及び表示部89を制御するようになっている
【0029】イメージ入力部82は、印刷、又は手書き
された原稿を1枚、又は複数枚セットされた状態から、
紙面のイメージを光学的に読み取る。読み取ったイメー
ジは、文字認識制御部83へ送られ、圧縮等が施されて
イメージ記憶部84へ記憶される。複数の頁がセットさ
れている場合は、順に最後の頁まで読み取る。又、認識
処理の途中でオペレータの要求で再読み取りや頁の挿入
等をする時にも、このイメージ入力部82を用いる。イ
メージ記憶部84は、読み取ったイメージを頁単位に記
憶する。文字認識部85は、読み取ったイメージを文字
認識する。文字認識の技術については第1の実施例で説
明した通りである。文字コード記憶部86は、文字認識
部85で認識された文字コードを記憶する。このとき、
読み取った頁のイメージと対応付けして記憶する。
【0030】文字コード編集部87は、文字認識部85
で認識された文字コードを表示部89に表示し、ユーザ
の指示により挿入、削除等の編集を行う。例えば、文字
認識部85で認識された文字の中で、曖昧な文字につい
て検索することができる。このとき、この曖昧性のある
文字の近辺には、イメージ記憶部84にある読み取った
イメージの該当する部分を取り出して表示する等が行わ
れる。文字コード編集部87で編集が終了した文字コー
ド列は、再度、文字コード記憶部86へ記憶される。表
示部89は、文字読み取りイメージ等の情報を可視表示
可能なもの、例えばビットマップディスプレイ等が使用
される。
【0031】次処理制御部88は、文字認識、編集の終
った文字コード列を他の処理システムに渡す前に、渡す
先の処理システムでこの文字コード列に施したい処理内
容を、ユーザの指示により選択する。例えば、文字コー
ド列を翻訳システムに渡す場合、翻訳システムの文書と
して登録するだけでよいのか、登録するとともに翻訳を
するのか、又は翻訳後、その翻訳結果を印刷までするの
か等の処理方法を選択する。又、翻訳の場合は、翻訳で
利用する辞書の名前、翻訳環境等の情報を設定すること
ができる。
【0032】次にこのように構成した本システムの動作
を説明する。まず、図9は、本文字認識システムにおけ
る処理の流れを簡単に説明するための状態遷移図である
。図10〜19は、動作を説明するための画面例である
。 図10は文字認識システムの初期画面である。オペレー
タは、まず、読み取る文書の文書識別面を入力する。そ
の後、“イメージ読み取り”ボタンをマウスで選択する
と、イメージ入力部82が動作を開始する(ステップ2
01 )。
【0033】イメージ入力部82が動作中は図11に示
す読み取りイメージが順に画面に表示される。複数の頁
がイメージ入力部82にあるときは、頁のある限り読み
取りを繰り返し実行する(ステップ202 )。イメー
ジ読み取りが終了すると図10に戻る(ステップ203
 )。
【0034】初期画面に戻った状態では、文書識別名を
変更して別の原稿のイメージ入力をすることもできる。 また、文書識別名を変更せずに続けて次の原稿の入力が
要求された場合は、既に読み取った原稿に追加するのか
、既に読み取った原稿をキャンセルして新たに入力する
のかをオペレータに質問をする。
【0035】イメージ入力終了後、そのイメージの文字
認識を実行する場合は、“認識”ボタンをマウスで選択
する(ステップ204 )。本実施例の文字認識システ
ムでは、文字認識を開始する前に原稿のレイアウトを認
識する。認識したレイアウトに誤りがないかオペレータ
に提示する。図12にレイアウト認識の結果をオペレー
タに知らせる画面例を示す。この画面において、誤って
認識されたブロックの順番は、“入れ替え”ボタンを使
って変更する。また、“全指定”ボタンで順に指定する
こともできる。その他、文字認識をする範囲を指定する
こともできる。また認識する必要のない部分は“削除”
ボタンで削除することもできる。例えば、機械翻訳する
必要のない頁番号、ヘッダ、フッタ等を削除したり、認
識する範囲から外すことができる。
【0036】また、読み取ったイメージが鮮明でないと
きには、“再読み取り”ボタンを選択する(ステップ2
05 )。この操作でイメージ入力部82から読み取る
状態(濃淡、コントラスト、原稿位置等)を変更したイ
メージを再入力することができる。また、イメージ入力
の段階で抜けてしまった頁は“頁挿入”ボタンを選択す
ることで簡単に頁を挿入することができる。
【0037】図12で文字認識開始ボタンを選択すると
認識したレイアウトの順にしたがって、文字認識の実行
を開始する。認識中は図13の右側にどの位置を認識中
かが表示される(ステップ306 )。また、合わせて
、認識した文字コードが画面の右側に順に表示される。 文字認識が終了すると、図14が表示される。このとき
、読み取る原稿の濃度の指定を誤ったり、原稿を傾いて
置いたりすると、誤って認識される文字が多くなる。こ
のときは、“再読み取り”ボタンを選択することで再度
、該当する頁の原稿を読み直すことができる(ステップ
207 )。
【0038】“次候補”ボタンを選択するとカーソル位
置から文字認識において曖昧性のある文字を検索する(
ステップ208 )。曖昧性のある文字が見付かると図
15のように曖昧性のある文字の近辺にイメージが表示
される。オペレータは、そのイメージを参照しながら文
字の修正を行う。ここで、文字認識部85において未知
語判定をも行うとすると、第1の実施例で説明した、曖
昧性のある文字と未知語とをそれぞれの識別子を付けて
表示するという機能を付加することができる。
【0039】また、ここで翻訳システムが利用している
辞書に存在しない文字コード列についても提示すること
ができる。即ち、上記の未知語判定に用いる辞書と翻訳
システムが用いる辞書とで、収録されている語彙を一致
させておき、上記の未知語の識別子の付いた語句を提示
する。ここで、文字コード列に対する翻訳されるべき訳
語を入力することで、文字コード列とその訳語を翻訳シ
ステムで利用する辞書に登録する。さらに、この文字コ
ード列を未知語判定に用いる辞書にも登録する。ただし
、この機能は翻訳システムでは有効であるが、例えば、
他の計算機に送信するときは不要となる。
【0040】1頁分の編集が終了したら“次頁”ボタン
を選択する(ステップ209 )。続く頁イメージがあ
るときは、次の頁のレイアウト認識が開始される。続く
頁がないときは図10に戻る。このときは、全ての頁の
文字認識が終了しているので“イメージ入力”、“認識
”ボタンは網かけされた状態で表示される。これにより
、文書識別名で示される読み取った原稿には次の処理要
求(実施例では翻訳の要求)が残っていることがわかる
。また、例えば、5頁のイメージを読み取った状態で、
3頁まで文字認識、編集を実行し、途中で中断したとき
は、“イメージ入力”ボタンだけが網かけ状態で表示さ
れ、“認識”、“翻訳”ボタンは網かけとならず、まだ
認識を必要とするイメージが残っていることが示される
。また、認識を必要とするイメージが残っている状態で
“翻訳”ボタンを選択すると、図16の画面が表示され
オペレータに警告が発せられる。
【0041】“翻訳”ボタンを選択すると図17が表示
される(ステップ311 )。この画面では、オペレー
タが認識されたデータを渡す処理システムで次に行って
ほしい処理内容を選択する。実施例では、(1)翻訳シ
ステムに登録する、(2)登録後、翻訳する、または(
3)翻訳後、印刷するのどれかを番号で選択する。
【0042】処理内容が選択され、“確認”ボタンが選
択されると、文書識別名で示される複数の頁からなる文
字コード列を1つにまとめて施したい処理内容とともに
翻訳システムに連絡する(ステップ212 )。その後
、初期画面に戻る。この図17の画面が表示されている
間に次処理制御部88が行っている動作を以下に説明す
る。
【0043】図20は、文字認識が終り、文字コード記
憶部86の文書に対して、次に希望する処理方法が選択
され、頁単位で記憶される文字コード列がまとめられて
次の処理に渡される場合のデータの流れを示す。実施例
では、図17の画面で処理番号が選択され、“確認”ボ
タンが選択されると、この処理が開始される。図21は
、上記、“確認”ボタンが選択された場合の動作を説明
するためのフローチャートである。ステップ701 で
は、処理番号が選択されているか判定され、選択されて
いない場合は、オペレータに知らされる。次に、選択さ
れた処理方法が処理制御データに出力される(ステップ
702 )。 実施例では、文書識別名の後に識別子“ctl”を付け
て示す。
【0044】続いて、文字コード記憶部86に記憶され
る認識された頁単位の文字コード列を頁番号順に取出し
、1つにまとまったテキストデータに出力する(ステッ
プ703)。実施例では、文書識別名の後に識別子“t
xt”を付けて示す。
【0045】この出力された処理制御データとテキスト
データを次に希望する処理とあらかじめ決められた領域
に移動する(ステップ704 〜705 )。この次に
希望する処理とデータの受渡しのための領域として、あ
らかじめ決める領域は、例えば、ディスク等の共通する
領域等を利用する。また、この共通する領域は、システ
ムの中の領域でなく、ネットワーク等で接続された他の
計算機の領域を利用することもできる。
【0046】次に希望する処理を行う他の処理システム
側では、あらかじめ決めた領域に処理制御データとテキ
ストデータが文字認識システムから出力されるのを待つ
(ステップ706 )。あらかじめ決められた領域に処
理制御データが出力されると、この処理制御データに指
示される処理を開始する。又は、一定間隔で上記データ
が出力されるか判定する等で処理を開始する(ステップ
707 〜711 )。
【0047】例えば、機械翻訳においては、処理制御デ
ータの処理方法と翻訳で利用する辞書の種類等を取出し
、文字認識システムで入力されたテキストデータを翻訳
システムに文書登録、あるいは文書登録と翻訳、あるい
は翻訳された訳文の印刷までを自動的に行う。ここで、
図9の説明に戻る。
【0048】読み取った文書の状態を知るために文書の
一覧表を表示する機能がある(ステップ213 )。図
18に文書一覧表の画面例を示す。読み取られた文書の
文書名が、読み取られた頁数及びその内認識の終了した
頁数とともに表示されている。この文書一覧表の表示状
態において文書を選択すると文書識別名を入力する必要
がない(ステップ214 )。また、“削除”ボタンを
選択すると不要な文書を簡単に消すことができる(ステ
ップ215 )。
【0049】この他、翻訳システムに認識した文字コー
ド列を送って翻訳する際に利用する辞書は、“辞書選択
”、“翻訳環境設定”ボタンを選択することで簡単にで
きる(ステップ216 )。図19に辞書の選択の画面
例を示す。以上の読み取り、文字認識、編集、次処理制
御においては、頁単位に情報を管理しているが、これを
行う文字認識制御部83の動作を以下に説明する。図2
2は、イメージ入力部82で読取った複数頁のイメージ
を記憶するイメージ記憶部84と文字コード記憶部86
の関係を示す図である。
【0050】図22は、図10に示す初期画面で入力さ
れる文書識別名を利用して、データの対応を取った例で
ある。“roubun”と“manual”の2つの文
書識別名を持つ原稿がイメージ記憶部84から入力され
、“ronbun”の3頁分が文字認識されている状態
を示している。
【0051】実施例のデータの名前は、文書識別名の後
に読取った順に3桁のシーケンス番号を付加し、さらに
、その後にデータの識別子として“rf”、“txt”
等を付加して示す。図22において、“rf”の識別子
の付いているデータ、“rounbun004〜005
”と“patent001〜004”は読取ったイメー
ジが圧縮した状態でそのまま記載されていることを示す
。また、“ronbun001〜003”は、既に文字
認識され文字コードとして文字コード記憶部に記憶され
ているのでイメージ記憶部84から消されている。実施
例では、既に文字認識された頁イメージは消去する例で
示したが全て頁の認識が終るまでイメージ記憶部84に
記憶しても良い。また、文字コード記憶部86の“tx
t”の識別子の付いているデータ、“ronbun00
1〜003”は文字認識が終っていることを示している
。この他、“rounbun.ctl”で示されるデー
タは、図17、図19で選択された、次に希望する処理
方法、辞書の種類、原文識別名等を記憶する。
【0052】図23は、図22に示す状態で記憶される
読取りイメージに対して実施される再読取り、頁挿入、
頁削除の動作を説明するためのフローチャートである。 この場合、文字認識制御部83は、入力部81の処理要
求が頁に関する処理であるか判定する(ステップ101
 〜103 )。 頁削除、再読取り、頁挿入以外の処理要求は、他のファ
ンクション処理をする(ステップ104 )。
【0053】ステップ103 でオペレータの要求が頁
挿入であると判断した場合は、まず、イメージ記憶部8
4に頁単位で付けられているデータ識別名を取出すため
の比較カウンターをクリアする(ステップ105 )。 続いて、イメージ記憶部84から比較カウンターが示す
データ識別名を取出し、文書識別名(i)と頁番号(i
)を抽出する(ステップ106 )。
【0054】次に、ステップ106 で抽出された、文
書識別名(i)と処理中の文書識別名と比較する(ステ
ップ107 )。一致しない場合は、別の文書識別名で
あるから比較カウンタを1つ増加する(ステップ110
 )。文書識別名が一致する場合は、頁番号(i)と処
理中の頁番号と比較する(ステップ108 )。
【0055】頁番号(i)が処理中の頁、又は大きい場
合は、データ識別名の頁番号を1つ増加する(ステップ
109 )。その後、比較カウンターを増加して、まだ
イメージ記憶部84に別のデータ識別名があるか判定し
、別のデータ識別名がある場合は、ステップ106 に
戻る(ステップ110 〜111 )。
【0056】例えば、図22において、処理中の文書識
別名が“ronbun”の場合に、頁挿入の要求をする
と、3頁までは文字認識が終っているので処理中の頁は
4頁が該当する。このため、データ識別名は、“ron
bun.004.rf”→“ronbun.005.r
f”、“ronbun.005.rf”→“ronbu
n.006.rf”に変更される。
【0057】該当するデータ識別名の変更が終ると、イ
メージ入力部82から処理中のデータ識別名が示す領域
に挿入する頁のイメージを読取り、次の処理(実施例で
は、レイアウト認識)を開始する(ステップ112 )
。ステップ102 でオペレータの要求が再読取りであ
ると判断した場合は、データ識別名の変更をする必要が
ないので、ステップ112 を実行する。
【0058】ステップ101 でオペレータの要求が頁
削除であると判断した場合は、まず、イメージ記憶部8
4から処理中のデータ識別名と該当する読取りイメージ
を削除する(ステップ113 )。
【0059】続いて、頁挿入と同様にデータ識別名を変
更する。頁削除の場合は、データ識別名の頁番号を1つ
減少する(ステップ118 )。その他のステップ11
4 〜120 は頁挿入のステップ105 〜111と
同一であるので説明を省略する。
【0060】以上説明した第2の実施例の主旨は、印刷
、又は手書きされた原稿のイメージを読み取る手段と、
読み取ったイメージを文字認識する手段と、文字認識す
ることでコード化された文字を編集する手段と、編集さ
れた文字コード列に対して次に施すべき処理内容を指示
する手段を具備したことを特徴とする文字認識システム
であり、また、複数頁の印刷、又は手書きされた原稿の
イメージを読み取る手段と、読み取った複数頁のイメー
ジを頁単位で記憶する手段と、読み取り手段において頁
単位に再読み取り、頁挿入、又は頁削除する手段と、記
憶された複数頁のイメージを頁単位に文字認識、編集す
る手段と、記憶された全ての頁の文字認識、編集が終了
後に、複数頁からなる文字コード列を1 つにまとめる
手段とを具備したことを特徴とする文字認識システムで
ある。
【0061】したがって、このように構成された文字認
識システムによれば、複数の頁のイメージを順に読み取
って文字認識、編集の処理を行う際、頁を意識すること
なく実行でき、全て読み取った頁イメージの文字認識、
編集が実行された後、その認識、編集された文字コード
列を1つにまとめ、そのまとめた文字コード列に対して
、次の処理システムで行いたい処理内容を指示すること
で、ファイル名、コード体系等を意識せずに、次の処理
を実行することができオペレータの労力を大幅に軽減で
きる。
【0062】なお、上述の実施例では認識した文字コー
ド列の処理を翻訳する例に対応させたが、他の計算機に
送信させてもよい。さらに、レイアウト情報をDTP文
書の形式に変換させるようにしてもよい。またイメージ
の入力をスキャナでなく、ファックスで送信されたデー
タを入力としてもよい。ファックスから入力されたイメ
ージを文字認識し、その認識された文字コード列を翻訳
システムで翻訳し、さらに印刷まで行うことができる。
【0063】
【発明の効果】以上説明したように、本発明に係る文字
認識装置によれば、認識誤り箇所の候補がいかなる理由
によって指摘されているのであるかをオペレータに示し
、また、指摘するために必要な条件のを設定を行うこと
ができるため、文字認識の後編集に於けるオペレータの
負担を軽減し、作業効率を向上させることができる等の
実用上多大なる効果が奏せられる。
【図面の簡単な説明】
【図1】  本発明の一実施例に係る文字認識装置の概
略構成を示すブロック図。
【図2】  本発明の一実施例に係る文字認識装置の動
作の概要を示すフローチャート。
【図3】  図2における修正必要候補語句の指摘とそ
の語句に対する識別子の表示を行うステップの動作の一
例を表すフローチャート。
【図4】  図2における修正必要候補語句の指摘とそ
の語句に対する識別子の表示を行うステップ以降の動作
の別の例を表すフローチャート。
【図5】  図2における修正必要候補語句の指摘とそ
の語句に対する識別子の表示を行うステップの動作の別
の例を表すフローチャート。
【図6】  本発明に係る文字認識装置を用いた翻訳装
置の構成例を示すブロック図。
【図7】  (a)図1における表示部2、(b)図6
における表示部602 、の画面の例を示す図。
【図8】  第2の実施例に係る文字認識システムの構
成を示すブロック図。
【図9】  第2の実施例の処理の流れを説明するため
の状態遷移図。
【図10】  本文字認識システムの初期画面図。
【図11】  本文字認識システムのイメージ入力中の
画面図。
【図12】  本文字認識システムのレイアウト認識結
果を示す画面図。
【図13】  本文字認識システムの文字認識中の画面
図。
【図14】  本文字認識システムの文字認識結果を示
す画面図。
【図15】  曖昧性のある文字を検索する際の画面図
【図16】  全頁の認識が終了していない時点での次
の処理(翻訳)の要求に対する警告を発する際の画面図
【図17】  オペレータに次に行いたい処理内容を選
択させる際の画面図。
【図18】  読み取った文書の一覧を表示する際の画
面図。
【図19】  翻訳のときに利用する辞書をオペレータ
に選択させる際の画面図。
【図20】  認識の終了したデータが次の処理に渡さ
れるときのデータの流れを示す図。
【図21】  認識の終了したデータに対して次の処理
システムで行う処理内容を指示する次処理制御部88の
動作を表すフロー図。
【図22】  複数頁のイメージを記憶するイメージ記
憶部84と文字コード記憶部86の関係を示す図。
【図23】  読み取り、文字認識、記憶、編集等を頁
単位で行うことに関する文字認識制御部83の動作を表
すフロー図。
【符号の説明】
1,601 …入力部 2,602 …表示部 3,603 …読み取り部 4,604 …文字認識部 5,605 …認識用辞書 6,606 …未知語判定部 7,607 …語彙辞書 8,608 …修正必要候補語句指示部9,609 …
識別子表示部 10,610 …記憶部 11,611 …制御部 12…イメージファイル 612 …翻訳部 613 …翻訳用辞書 81…入力部 82…イメージ入力部 83…文字認識制御部 84…イメージ記憶部 85…文字認識部 86…文字コード記憶部 87…文字コード編集部 88…次処理制御部 89…表示部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  文字を画像パターンとして入力する入
    力手段と、この入力手段により入力された画像パターン
    と、予め記憶された第1の辞書の文字パターンとを照合
    して、類似度が所定値以上の文字パターンの文字を選択
    する文字認識手段と、この文字認識手段により得られた
    文字から成る文字列が、予め記憶された第2の辞書の文
    字列の中に存在するか否かを判定する判定手段と、前記
    文字認識手段により得られた文字を表示する表示手段と
    を備えた文字認識装置において、前記表示手段により文
    字を表示する際に、この表示された文字から成る文字列
    が、前記文字認識手段において前記類似度が所定値以上
    の文字パターンが複数ある中から選択された文字を含む
    場合と、前記判定手段において前記第2の辞書の文字列
    の中に存在しないと判定された場合とを区別して表示す
    ることを特徴とする文字認識装置。
JP03065786A 1991-03-29 1991-03-29 文字認識装置及び方法 Expired - Lifetime JP3083171B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03065786A JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03065786A JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Publications (2)

Publication Number Publication Date
JPH04302070A true JPH04302070A (ja) 1992-10-26
JP3083171B2 JP3083171B2 (ja) 2000-09-04

Family

ID=13297068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03065786A Expired - Lifetime JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JP3083171B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279353A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 文字認識装置、その方法、および記録媒体
JP2002279349A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 自動文字認識に用いる辞書の提供方法
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279353A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 文字認識装置、その方法、および記録媒体
JP2002279349A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 自動文字認識に用いる辞書の提供方法
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Also Published As

Publication number Publication date
JP3083171B2 (ja) 2000-09-04

Similar Documents

Publication Publication Date Title
US7081975B2 (en) Information input device
US5265171A (en) Optical character reading apparatus for performing spelling check
US5905811A (en) System for indexing document images
US5384785A (en) Electronic image information scanning and filing apparatus
JPH0221024B2 (ja)
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3083171B2 (ja) 文字認識装置及び方法
JPH0793336A (ja) 画像記憶装置および画像記憶検索装置
JPH08180068A (ja) 電子ファイリング装置
JPH05303619A (ja) 電子スクラップブック
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JPH06162107A (ja) 電子ファイリングシステム
JPH06348889A (ja) 文字認識装置
JP2829186B2 (ja) 光学的文字読取装置
JP3424942B2 (ja) 対訳画像形成装置
JPH01194063A (ja) 文書ファイル目次作成方式
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPH1069494A (ja) 画像検索方法とその装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JPH06149889A (ja) 電子ファイリングシステム
JPH0581318A (ja) デジタル翻訳装置
JPH0785083A (ja) 画像記憶装置
JPH0668136A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090630

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 11