JPH113401A - 情報処理装置及びその方法 - Google Patents
情報処理装置及びその方法Info
- Publication number
- JPH113401A JPH113401A JP9155513A JP15551397A JPH113401A JP H113401 A JPH113401 A JP H113401A JP 9155513 A JP9155513 A JP 9155513A JP 15551397 A JP15551397 A JP 15551397A JP H113401 A JPH113401 A JP H113401A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- output
- information processing
- likelihood
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 37
- 230000010365 information processing Effects 0.000 claims description 39
- 238000003672 processing method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
行った場合に、その認識結果を訂正するためのユーザに
対する負担を軽減し、かつ画像データの検索を効率的に
実行することができる情報処理装置及びその方法を提供
する。 【解決手段】 イメージスキャナ1より入力された画像
データ中に含まれる文字をOCR処理部2で認識する。
次に、認識する文字に対する複数の認識候補の各認識尤
度を獲得する。そして、獲得した各認識尤度に基づい
て、複数の認識候補の内、少なくとも一つを文字の認識
結果として出力する。
Description
ータを認識する情報処理装置及びその方法に関するもの
である。
により認識を行う情報処理装置では、原稿画像に含まる
各文字に対する認識結果としてそれぞれ1つの認識結果
を出力していた。このような情報処理装置において、各
文字の誤認識対策は、認識結果として出力する認識候補
の認識尤度が低い場合には、その旨をユーザに報知し、
ユーザにより認識結果の是非を確認させていた。そし
て、認識結果が間違っている場合には、キーボード等か
ら正しい認識結果を入力させていた。
的に行う研究も行われており、知識データベースに認識
結果をつき合わせていき、誤認識された文字を自動的に
訂正する提案があった。
うな従来の情報処理装置では、認識結果が異なる毎にユ
ーザから正しい認識結果を入力してもらわなけらばなら
ず、ユーザに対する負担が大きかった。また、従来の、
知識データベースを用いて行う誤認識された文字の訂正
は、情報処理装置にかかる負荷が大きかった。
のであり、入力した画像データに含まれる文字の認識を
行った場合に、その認識結果を訂正するためのユーザに
対する負担を軽減し、かつ画像データの検索を効率的に
実行することができる情報処理装置及びその方法を提供
することを目的とする。
めの本発明による情報処理装置は以下の構成を備える。
即ち、入力された画像データを認識する情報処理装置で
あって、 前記画像データ中に含まれる文字を認識する
認識手段と、前記認識手段で認識する文字に対する複数
の認識候補の各認識尤度を獲得する獲得手段と、前記獲
得手段で獲得した各認識尤度に基づいて、前記複数の認
識候補の内、少なくとも一つを前記文字の認識結果とし
て出力する出力手段とを備えることを特徴とする情報処
理装置。
獲得手段で獲得した各認識尤度と第1の閾値とを比較
し、その比較結果に基づいて、前記複数の認識候補の
内、少なくとも一つを前記文字の認識結果として出力す
る。また、好ましくは、前記出力手段は、前記獲得手段
で獲得した各認識尤度の最大の認識尤度が前記第1の閾
値より大きい場合、該最大の認識尤度を有する認識候補
を前記文字の認識結果として出力する。
獲得手段で獲得した各認識尤度の最大の認識尤度が前記
第1の閾値より小さい場合、更に該各認識尤度と第2の
閾値とを比較し、その比較結果に基づいて、前記複数の
認識候補の内、少なくとも一つを前記文字の認識結果と
して出力する。また、好ましくは、前記出力手段は、前
記獲得手段で獲得した各認識尤度の内、前記第2の閾値
よりも大きい認識尤度を有する認識候補を前記文字の認
識結果として出力する。
獲得手段で獲得した各認識尤度が前記第2の閾値よりも
小さい場合、該各認識尤度の内、認識尤度の高いものか
ら所定個の認識候補を前記文字の認識結果として出力す
る。また、好ましくは、前記出力手段は、前記文字の認
識結果として、複数の認識候補群を出力する場合、該認
識候補群の前後に所定文字を付加して該認識候補群を出
力する。
れた認識結果と前記画像データを対応づけて管理する管
理手段とを更に備える。また、好ましくは、検索条件を
入力する入力手段と、前記管理手段に管理されている画
像データに対し、前記入力手段で入力された検索条件に
該当する前記認識結果に対応する画像データを検索する
検索手段とを更に備える。
情報処理方法は以下の構成を備える。即ち、入力された
画像データを認識する情報処理方法であって、 前記画
像データ中に含まれる文字を認識する認識工程と、前記
認識工程で認識する文字に対する複数の認識候補の各認
識尤度を獲得する獲得工程と、前記獲得工程で獲得した
各認識尤度に基づいて、前記複数の認識候補の内、少な
くとも一つを前記文字の認識結果として出力する出力工
程とを備える。
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された画像データを認識する情報処理のプログラム
コードが格納されたコンピュータ可読メモリであって、
前記画像データ中に含まれる文字を認識する認識工程の
プログラムコードと、前記認識工程で認識する文字に対
する複数の認識候補の各認識尤度を獲得する獲得工程の
プログラムコードと、前記獲得工程で獲得した各認識尤
度に基づいて、前記複数の認識候補の内、少なくとも一
つを前記文字の認識結果として出力する出力工程のプロ
グラムコードとを備える。
施形態を詳細に説明する。図1は本発明の実施形態にお
ける情報処理システムの構成を示すブロック図である。
図1において、イメージスキャナ1は認識対象となる文
書データの原稿画像を光学的に読み取る。キーボード/
マウス5は、オペレータによる各種コマンドや、指示情
報を入力する。また、検索処理を実行する場合の検索語
や検索条件もこのキーボード/マウス5によって入力す
る。表示装置6は、例えば、CRTや液晶表示器等の表
示手段であり、キーボード/マウス5から入力された情
報やイメージスキャナ1から入力された画像情報、処理
経過、処理結果等を表示する。
入力されたイメージデータ、テキスト情報、検索用ファ
イルを記憶する。コンピュータ10は、CPU10aの
制御により各種情報処理を行うものである。また、後述
するフローチャートに示すような各種情報処理の制御プ
ログラム101bはメモリ10bに格納されており、こ
の制御プログラム101bに従ってCPU10aは各種
情報処理の実行及び制御を行う。更に、メモリ10bに
は、文字認識に用いる認識用辞書102bも格納されて
いる。
ログラム101bは、外部記憶装置4より必要に応じて
読み込んだものであっても良い。また、本実施形態にお
いては、このコンピュータ10により実行される主な処
理を行なうものとして、OCR処理部2と文書検索部3
が構成されている。まず、イメージスキャナ1より入力
した原稿画像のイメージデータからテキスト情報へ変換
する変換処理について、図2を用いて説明する。
処理を示すフローチャートである。まず、外部記憶装置
4に記憶されているイメージスキャナ1より入力したイ
メージデータをOCR処理部2に入力する(ステップS
1)。次に、入力されたイメージデータに文字として切
り出せる文字データが存在するか否かを判定する(ステ
ップS2)。文字データが存在する場合(ステップS1
でYES)、ステップS3に進む。一方、文字データが
存在しない場合(ステップS1でNO)、処理を終了す
る。
合、1文字分の文字データを切り出す(ステップS
3)。次に、その切り出した文字データを認識用辞書1
02bとマッチングする。そして、認識候補として複数
の文字コード及び各文字コードの認識尤度を獲得する
(ステップS4)。ステップS4における認識候補とし
て得られた文字コードの各認識尤度のうち、最大の認識
尤度が所定の閾値Th1より大きいか否かを判定する
(ステップS5)。尚、この閾値Th1は、メモリ10
bに格納されている。
合(ステップS5でYES)、ステップS6に進み、認
識候補が正しいと判断して、その最大の尤認識度を有す
る文字コードを切り出した文字データの認識結果として
出力する。一方、最大の認識尤度が閾値Th1より小さ
い場合(ステップS5でNO)、ステップS7に進む。
合、 認識候補群である文字コードを識別するために、
その認識候補群である文字コードの先端を示すデリミタ
ーを出力する(ステップS7)。次に、複数の文字コー
ドの各認識尤度が閾値Th2より大きいか否かを判定す
る(ステップS8)。複数の文字コードの各認識尤度の
内、閾値Th2より大きい認識尤度がある場合(ステッ
プS8でYES)、ステップS9に進み、閾値Th2よ
り大きい認識尤度を有する文字コード群を切り出した文
字データの認識結果として出力する。
てが閾値Th2より小さい場合(ステップS8でN
O)、ステップS11に進み、その複数の文字コードの
内、認識尤度の大きなものから順にNmax個までの文字
コードを切り出した文字データの認識結果として出力す
る。ステップS8あるいはステップS11の処理によっ
て、切り出した文字データの認識結果が出力されたら、
その認識結果である文字コード群の終端を示すデリミタ
ーを出力する(ステップS10)。そして、ステップS
2に戻り、入力したイメージデータに文字データが存在
しないと判断されるまで、上述したステップS3からス
テップS11の処理を繰り返す。
コードのコード情報を、以下説明する検索用ファイルを
作成するためのテキスト情報として保存する必要があれ
ば外部記憶装置4に順次記憶する。一方、検索用ファイ
ルを作成するためのテキスト情報として保存する必要が
なければ、メモリ10b、あるいは外部記憶装置4上に
一時的に格納し、必要がなくなり次第消去する。
認識尤度に応じて、認識結果とする認識候補を出力する
ことができる。特に、認識尤度が低く認識精度が落ちる
可能性がある場合には、認識結果を1つの認識候補に絞
らずに、認識候補の認識尤度に応じて複数の認識候補を
認識結果として出力することが可能になる。次に、図2
のフローチャートで作成されたテキスト情報に基づい
て、検索に用いる検索用ファイルを作成する作成処理に
ついて、図3を用いて説明する。
処理を示すフローチャートである。まず、作成されたテ
キスト情報の各文字データと、単語辞書に登録されてい
る文字とを比較するために、その比較対象となる単語辞
書中の文字の比較開始位置を示すカウンタiを0に初期
化する。また、カウンタiが示す比較開始位置からの文
字数を計数するカウンタjを0に初期化する(ステップ
S21)。次に、外部記憶装置4に記憶されているある
いはメモリ10b上に一時的に格納されたテキスト情報
を、文書検索部3にロードする(ステップS22)。ロ
ードしたテキスト情報の先頭の文字データを読み出し、
その文字データに該当する単語辞書中の文字を選択する
(ステップS220)。
文字に派生する文字が枝として構成されるツリー構造と
なっており、図6では、「全」という文字に対しては、
その派生する文字として、「体」、「文」、「女」が登
録されている。また、「文」という文字に対しては、そ
の派生する文字として、「献」、「検」が登録されてい
る。また、自身の文字以降に派生する文字がない場合に
は、自身が最終端であることを示す終点マークが付加さ
れる。このような構成からなる単語辞書を用いて、読み
出された文字データに該当する文字を、単語辞書の先頭
から順に探索する。
い文字データが存在するか否かを判定する(ステップS
24)。文字データが存在する場合(ステップS23で
YES)、ステップS24に進む。一方、文字データが
存在しない場合(ステップS23でNO)、処理を終了
する。次に、カウントiの内容をi、カウンタjの内容
をjとする場合のテキスト情報中のi+j+1番目の文
字データを読み出す(ステップS24)。カウンタjの
内容を1インクリメントする(ステップS240)。読
み出した文字データがデリミターであるか否かを判定す
る(ステップS25)。デリミターである場合(ステッ
プS25でYES)、ステップS26に進み、次のデリ
ミターまでに挟まれる複数の文字データの各文字データ
と単語辞書中の文字を比較し、各文字データに一致する
文字を選択する。一方、デリミターでない場合(ステッ
プS25でNO)、ステップS27に進み、その文字デ
ータと単語辞書中の文字を比較し、その文字データに一
致する文字を選択する。
は、次のデリミターまでの複数の認識候補と単語辞書中
の文字を比較していくが、この際、一致する文字が複数
あればその複数の文字に関して同時進行で比較を行う。
次に、カウンタjの内容を1インクリメントする(ステ
ップS270)。次に、選択された文字に終点マークが
付加されているか否かを判定する(ステップS29)。
終点マークが付加されている場合(ステップS28でY
ES)、ステップS29に進み、選択された文字を外部
記憶装置4の検索用ファイルに検索用のインデックス情
報として格納する。一方、終点マークが付加されていな
い場合(ステップS28でNO)、ステップS30に進
み、カウンタjの内容が最大検索語サイズ(文字数)W
ordMax未満であるか、あるいは単語辞書中に比較
する文字がないかという条件を満たすか否かを判定す
る。
テップS30でNO)、ステップS24に戻る。一方、
上記の条件のどちらかを満たす場合(ステップS30で
YES)、ステップS31に進み、テキスト情報中のi
+1番目の文字データを読み出し、その文字データに該
当する単語辞書中の文字を選択する。次に、カウンタi
の内容を1インクリメントし、カウンタjの内容を0に
リセットして(ステップS32)、ステップS23に戻
る。
在する文字列の内、入力したイメージデータに含まれる
文字データの複数の認識候補の組み合わせからなる検索
用ファイルを、イメージデータと対応づけて記憶してお
くことができる。つまり、誤認識されそうな認識候補の
組み合わせも検索用ファイルとして記憶しておくので、
検索用ファイルを用いた検索を行う場合の検索の漏れを
少なくすることができる。
検索用ファイルを用いた検索処理について、図4を用い
て説明する。図4は本発明の実施形態で実行される検索
処理を示すフローチャートである。まず、キーボード/
マウス5より、検索条件である検索語を入力する(ステ
ップS31)。次に、図3のフローチャートで説明した
処理と同様の処理によって、入力された検索語の各文字
データと単語辞書との比較を行い、検索語を単数あるい
は複数の単語に分解する(ステップS32)。次に、分
解された単語群と、外部記憶装置4の検索用ファイルと
を照合する(ステップS33)。
イメージデータの格納位置を示す文書アドレスの論理積
演算を行い、これらの単語群を共通に含む文書アドレス
を獲得する(ステップS34)。そして、この獲得され
た文書アドレス情報が示す外部記憶装置4に記憶されて
いるイメージデータを表示装置6に検索結果として表示
する。
る。例えば、原稿画像上に記載されてる文字列「全文検
索」をイメージスキャナ1により入力し、「文」の認識
結果として認識尤度の高い順に「女」、「文」、
「丈」、「大」が得られ、それらの認識尤度がすべてT
h2以下であった場合は、ステップS11の処理が実行
される。そして、ステップS11の処理において、Nma
x個が4である場合は、認識結果として認識結果の認識
尤度の高いものから、「女」、「文」、「丈」、「大」
が出力される。
「文」に対する認識結果は、 ☆4女文丈大☆ となる。尚、先頭のデリミターの次の数字は、 Nmax個
が示す値である。更に、上記「全文検索」の「文」以外
の文字の認識結果が正しく認識されたとすると、「全文
字検索」に対する認識結果は、 全☆4女文丈大☆検索 となる。そして、これらの文字列に対応する文字コード
群を、検索用ファイルに用いるならば、テキスト情報と
して外部記憶装置4に記憶する。
文字コード群をテキスト情報として外部記憶装置4に記
憶した場合、文書検索部3では、このテキスト情報を用
いて、検索用ファイルを作成することができる。まず、
テキスト情報の先頭の文字である「全」に対応する単語
辞書中の「全」を選択する。尚、単語辞書中の「全」
は、図6に示すよう構成になっているとする。
丈大☆」と単語辞書中の「全」から派生する文字
「体」、「文」、「女」を比較する。この場合、テキス
ト情報(「☆4女文丈大☆」)と一致する文字として
「文」、「女」が選択される。次に、テキスト情報の次
の文字「検」と単語辞書中の「文」、「女」から派生す
る文字を比較する。この場合、テキスト情報(「検」)
として一致する文字として「文」に派生する「検」が選
択される。一方、「女」から派生する文字には、テキス
ト情報(「検」)に一致する文字はないので、「女」に
対する比較はここで終了する。
語辞書中の「検」から派生する文字「策」、「査」を比
較する。この場合、テキスト情報(「索」)と一致する
文字として「策」が選択される。また、「索」には、終
点マークが付加されているので、ここで、テキスト情報
と単語辞書との比較を終了し、検索用ファイルとして
「全文検索」という単語が抽出される。
ルとして、「全文検索」という単語が登録される。これ
により、キーボード/マウス5から「全文検索」という
検索語が入力された場合には、文書検索部3は「全文検
索」という文字を有するイメージデータを検索すること
ができる。尚、本実施形態においては、文書検索に用い
る例を説明したが、データベースを用いた検索にも応用
できる。
ーワード抽出等の応用も可能である。更に、OMRやバ
ーコードによる光学読み取り装置の一部情報の認識尤度
が低い場合への応用も同様の手法で行える。また、本実
施形態では、図4に示した検索処理を実行するために、
図3に示した検索用ファイルを作成する作成処理を予め
実行しておく場合を説明したが、以下に示す図5のよう
に、検索処理と並行して検索用ファイルを作成する作成
処理を実行しても良い。つまり、検索用ファイルを予め
作成することなく、検索処理が指示される毎に、テキス
ト情報から認識候補群の前後の文字と組み合わせて展開
を行い、入力された検索語と照合する。
処理を示すフローチャートである。まず、外部記憶装置
4に記憶されているテキスト情報に対して検索用ファイ
ルの作成が指示された場合に、その指示されたテキスト
情報を検索用ファイルに登録する際のインデックス用の
文字キー種類を指定する(ステップS41)。次に、検
索語を入力する(ステップS42)。次に、入力された
検索語を検索処理に適した検索キーに分解する(ステッ
プS43)。
装置4から文書検索部3にロードする(ステップS4
4)。次に、テキスト情報に文字データが存在するか否
かを判定する(ステップS45)。文字データが存在し
ない場合(ステップS45でNO)、処理を終了する。
一方、文字データが存在する場合(ステップS45でY
ES)、ステップS46に進む。
中の1文字分の文字データを読み込む(ステップS4
6)。次に、読み込んだ文字データがデリミターである
か否かを判定する(ステップS47)。デリミターであ
る場合(ステップS47でYES)、ステップS48に
進み、次のデリミターまでに挟まれる複数の文字データ
とこれまでに確定している文字データ列を組み合わせて
複数個の文字キーを展開する。一方、デリミターでない
場合(ステップS47でNO)、これまでに確定してい
る文字キーの文字列の最後に読み込んだ文字データを付
加する(S49)。
判定する(ステップS50)。文字キーの作成が完了し
ていない場合(ステップS50でNO)、ステップS4
5に戻る。一方、文字キーの作成が完了している場合
(ステップS50でYES)、ステップS51に進む。
文字キーの作成が完了した場合には、作成された文字キ
ー(単数又は複数)とステップS43において得た検索
キーとの照合を行い、文字キーと検索キーが同一である
か否かを判定する(ステップS51)。次に、同一であ
る場合(ステップS51でYES)、ステップS53に
進み、 検索結果として、その文字キーを有するイメー
ジデータが格納されている文書アドレスを出力する。一
方、同一でない場合(ステップS52でNO)、処理を
終了する。
ば、OCR処理部2の認識尤度が低く認識精度が落ちる
可能性がある場合には、認識結果を1つに絞らずに、認
識尤度に応じた最適な複数の認識結果を出力する。その
ため、有効な認識結果を蓄積、活用することができる。
また、認識尤度に応じて複数の認識候補を認識結果とし
て出力するので、ユーザはその複数の認識結果から所望
の認識結果を選択するだけで、所望の認識結果を決定す
ることができる。つまり、従来のように、間違った認識
結果が出力され場合に、ユーザが改めて正しい認識結果
を入力する作業をなくすことができる。これにより、作
業の効率化を図ることができる。
る文字データの複数の認識候補を組み合わせて、そのイ
メージデータを検索するための検索用ファイルを作成す
るので、誤認識による検索の洩れを少なくすることがで
きる。尚、本発明は、複数の機器(例えば、ホストコン
ピュータ、インタフェース機器、リーダ、プリンタ等)
から構成されるシステムに適用しても、一つの機器から
なる装置(例えば、複写機、ファクシミリ装置等)に適
用してもよい。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード、ROMなどを用いることができる。
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書き込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図7のメモリマップ例に示す各モジュールを
記憶媒体に格納することになる。すなわち、少なくとも
「認識モジュール」、「獲得モジュール」および「出力
モジュール」の各モジュールのプログラムコードを記憶
媒体に格納すればよい。
に含まれる文字を認識する。「獲得モジュール」は、認
識する文字に対する複数の認識候補の各認識尤度を獲得
する。「出力モジュール」は、獲得した各認識尤度に基
づいて、複数の認識候補の内、少なくとも一つを文字の
認識結果として出力する。
力した画像データに含まれる文字の認識を行った場合
に、その認識結果を訂正するためのユーザに対する負担
を軽減し、かつ画像データの検索を効率的に実行するこ
とができる情報処理装置及びその方法を提供できる。
構成を示すブロック図である。
フローチャートである。
フローチャートである。
フローチャートである。
フローチャートである。
る。
を格納した記憶媒体のメモリマップの構造を示す図であ
る。
Claims (19)
- 【請求項1】 入力された画像データを認識する情報処
理装置であって、 前記画像データ中に含まれる文字を認識する認識手段
と、 前記認識手段で認識する文字に対する複数の認識候補の
各認識尤度を獲得する獲得手段と、 前記獲得手段で獲得した各認識尤度に基づいて、前記複
数の認識候補の内、少なくとも一つを前記文字の認識結
果として出力する出力手段とを備えることを特徴とする
情報処理装置。 - 【請求項2】 前記出力手段は、前記獲得手段で獲得し
た各認識尤度と第1の閾値とを比較し、その比較結果に
基づいて、前記複数の認識候補の内、少なくとも一つを
前記文字の認識結果として出力することを特徴とする請
求項1に記載の情報処理装置。 - 【請求項3】 前記出力手段は、前記獲得手段で獲得し
た各認識尤度の最大の認識尤度が前記第1の閾値より大
きい場合、該最大の認識尤度を有する認識候補を前記文
字の認識結果として出力することを特徴とする請求項2
に記載の情報処理装置。 - 【請求項4】 前記出力手段は、前記獲得手段で獲得し
た各認識尤度の最大の認識尤度が前記第1の閾値より小
さい場合、更に該各認識尤度と第2の閾値とを比較し、
その比較結果に基づいて、前記複数の認識候補の内、少
なくとも一つを前記文字の認識結果として出力すること
を特徴とする請求項2に記載の情報処理装置。 - 【請求項5】 前記出力手段は、前記獲得手段で獲得し
た各認識尤度の内、前記第2の閾値よりも大きい認識尤
度を有する認識候補を前記文字の認識結果として出力す
ることを特徴とする請求項4に記載の情報処理装置。 - 【請求項6】 前記出力手段は、前記獲得手段で獲得し
た各認識尤度が前記第2の閾値よりも小さい場合、該各
認識尤度の内、認識尤度の高いものから所定個の認識候
補を前記文字の認識結果として出力することを特徴とす
る請求項4に記載の情報処理装置。 - 【請求項7】 前記出力手段は、前記文字の認識結果と
して、複数の認識候補群を出力する場合、該認識候補群
の前後に所定文字を付加して該認識候補群を出力するこ
とを特徴とする請求項1に記載の情報処理装置。 - 【請求項8】 前記出力手段で出力された認識結果と前
記画像データを対応づけて管理する管理手段とを更に備
えることを特徴とする請求項1に記載の情報処理装置。 - 【請求項9】 検索条件を入力する入力手段と、 前記管理手段に管理されている画像データに対し、前記
入力手段で入力された検索条件に該当する前記認識結果
に対応する画像データを検索する検索手段とを更に備え
ることを特徴とする請求項8に記載の情報処理装置。 - 【請求項10】 入力された画像データを認識する情報
処理方法であって、 前記画像データ中に含まれる文字を認識する認識工程
と、 前記認識工程で認識する文字に対する複数の認識候補の
各認識尤度を獲得する獲得工程と、 前記獲得工程で獲得した各認識尤度に基づいて、前記複
数の認識候補の内、少なくとも一つを前記文字の認識結
果として出力する出力工程とを備えることを特徴とする
情報処理方法。 - 【請求項11】 前記出力工程は、前記獲得工程で獲得
した各認識尤度と第1の閾値とを比較し、その比較結果
に基づいて、前記複数の認識候補の内、少なくとも一つ
を前記文字の認識結果として出力することを特徴とする
請求項10に記載の情報処理方法。 - 【請求項12】 前記出力工程は、前記獲得工程で獲得
した各認識尤度の最大の認識尤度が前記第1の閾値より
大きい場合、該最大の認識尤度を有する認識候補を前記
文字の認識結果として出力することを特徴とする請求項
11に記載の情報処理方法。 - 【請求項13】 前記出力工程は、前記獲得工程で獲得
した各認識尤度の最大の認識尤度が前記第1の閾値より
小さい場合、更に該各認識尤度と第2の閾値とを比較
し、その比較結果に基づいて、前記複数の認識候補の
内、少なくとも一つを前記文字の認識結果として出力す
ることを特徴とする請求項11に記載の情報処理方法。 - 【請求項14】 前記出力工程は、前記獲得工程で獲得
した各認識尤度の内、前記第2の閾値よりも大きい認識
尤度を有する認識候補を前記文字の認識結果として出力
することを特徴とする請求項13に記載の情報処理方
法。 - 【請求項15】 前記出力工程は、前記獲得工程で獲得
した各認識尤度が前記第2の閾値よりも小さい場合、該
各認識尤度の内、認識尤度の高いものから所定個の認識
候補を前記文字の認識結果として出力することを特徴と
する請求項13に記載の情報処理方法。 - 【請求項16】 前記出力工程は、前記文字の認識結果
として、複数の認識候補群を出力する場合、該認識候補
群の前後に所定文字を付加して該認識候補群を出力する
ことを特徴とする請求項10に記載の情報処理方法。 - 【請求項17】 前記出力工程で出力された認識結果と
前記画像データを対応づけて記憶媒体に管理する管理工
程とを更に備えることを特徴とする請求項10に記載の
情報処理方法。 - 【請求項18】 検索条件を入力する入力工程と、 前記管理工程で前記記憶媒体に管理されている画像デー
タに対し、前記入力工程で入力された検索条件に該当す
る前記認識結果に対応する画像データを検索する検索工
程とを更に備えることを特徴とする請求項17に記載の
情報処理方法。 - 【請求項19】 入力された画像データを認識する情報
処理のプログラムコードが格納されたコンピュータ可読
メモリであって、 前記画像データ中に含まれる文字を認識する認識工程の
プログラムコードと、 前記認識工程で認識する文字に対する複数の認識候補の
各認識尤度を獲得する獲得工程のプログラムコードと、 前記獲得工程で獲得した各認識尤度に基づいて、前記複
数の認識候補の内、少なくとも一つを前記文字の認識結
果として出力する出力工程のプログラムコードとを備え
ることを特徴とするコンピュータ可読メモリ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9155513A JPH113401A (ja) | 1997-06-12 | 1997-06-12 | 情報処理装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9155513A JPH113401A (ja) | 1997-06-12 | 1997-06-12 | 情報処理装置及びその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH113401A true JPH113401A (ja) | 1999-01-06 |
Family
ID=15607704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9155513A Pending JPH113401A (ja) | 1997-06-12 | 1997-06-12 | 情報処理装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH113401A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4726836U (ja) * | 1971-04-15 | 1972-11-27 | ||
US4850047A (en) * | 1986-08-29 | 1989-07-18 | Fujitsu Limited | Optical bus communication system utilizing frame format signals |
JP2012063883A (ja) * | 2010-09-14 | 2012-03-29 | Ricoh Co Ltd | 情報処理装置、情報処理方法、および情報処理プログラム |
JP2016224602A (ja) * | 2015-05-28 | 2016-12-28 | 株式会社デンソーウェーブ | 情報読取装置 |
-
1997
- 1997-06-12 JP JP9155513A patent/JPH113401A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4726836U (ja) * | 1971-04-15 | 1972-11-27 | ||
JPS5126441Y2 (ja) * | 1971-04-15 | 1976-07-05 | ||
US4850047A (en) * | 1986-08-29 | 1989-07-18 | Fujitsu Limited | Optical bus communication system utilizing frame format signals |
JP2012063883A (ja) * | 2010-09-14 | 2012-03-29 | Ricoh Co Ltd | 情報処理装置、情報処理方法、および情報処理プログラム |
CN102402576A (zh) * | 2010-09-14 | 2012-04-04 | 株式会社理光 | 信息处理设备、信息处理方法及计算机程序产品 |
JP2016224602A (ja) * | 2015-05-28 | 2016-12-28 | 株式会社デンソーウェーブ | 情報読取装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3689455B2 (ja) | 情報処理方法及び装置 | |
JP2957375B2 (ja) | 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法 | |
US7610193B2 (en) | Document based character ambiguity resolution | |
JP4533920B2 (ja) | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 | |
JP2973944B2 (ja) | 文書処理装置および文書処理方法 | |
EP0844583B1 (en) | Method and apparatus for character recognition | |
US7240062B2 (en) | System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location | |
JP4740916B2 (ja) | 画像文書処理装置、画像文書処理プログラムおよび画像文書処理プログラムを記録した記録媒体 | |
JPH0668298A (ja) | 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法 | |
US5905811A (en) | System for indexing document images | |
US7647303B2 (en) | Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program | |
JPH113401A (ja) | 情報処理装置及びその方法 | |
JP3727995B2 (ja) | 文書処理方法及び装置 | |
JP2586372B2 (ja) | 情報検索装置及び情報検索方法 | |
JPH08272813A (ja) | ファイリング装置 | |
JP2002157553A (ja) | 住所認識装置、記録媒体及びプログラム | |
JPH1069494A (ja) | 画像検索方法とその装置 | |
JPH06111079A (ja) | 単語読み取り装置 | |
JPH07160730A (ja) | 全文検索装置 | |
JP2996823B2 (ja) | 文字認識装置 | |
JPH10207909A (ja) | 文書検索システムおよび方法 | |
JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
JPH0863487A (ja) | 文書検索方法及び文書検索装置 | |
JP2008084132A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JPH11191107A (ja) | 文書処理方法とその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040601 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20040601 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070330 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070720 |