[go: up one dir, main page]

JP3260979B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3260979B2
JP3260979B2 JP16408694A JP16408694A JP3260979B2 JP 3260979 B2 JP3260979 B2 JP 3260979B2 JP 16408694 A JP16408694 A JP 16408694A JP 16408694 A JP16408694 A JP 16408694A JP 3260979 B2 JP3260979 B2 JP 3260979B2
Authority
JP
Japan
Prior art keywords
character
pattern
similar
recognition
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16408694A
Other languages
English (en)
Other versions
JPH0830732A (ja
Inventor
高志 齋藤
和典 高津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16408694A priority Critical patent/JP3260979B2/ja
Priority to US08/501,924 priority patent/US6272242B1/en
Publication of JPH0830732A publication Critical patent/JPH0830732A/ja
Application granted granted Critical
Publication of JP3260979B2 publication Critical patent/JP3260979B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、類似パターンの認識結
果を用いることにより文字認識の精度を向上させた文字
認識方法に関する。
【0002】
【従来の技術】従来の文字認識方法は、あるパターンが
どのような文字であるかを判別するものであった。しか
し、一般的にパターンは、フォント、サイズの違いや画
像の劣化などによって標準のパターンとは大きく異な
る。このため、認識結果を一意に特定することが難し
い。そこで、これを解決する従来の方法として、各文字
毎にいくつかの候補を挙げ、その候補文字列を使用して
言語処理によってこれを補うという手法がある(例え
ば、電子通信学会技術研究報告 PRU92−21,1
992年6月19日を参照)。この方法は、特に誤りや
すい文字を考慮して言語処理を適用したものであるが、
膨大な言語辞書(単語辞書)を必要とするなどの問題が
あった。
【0003】
【発明が解決しようとする課題】ところで、フォントの
違いやサイズの違いを別にすれば、印刷文書においては
同一の文字は原稿上では同一のパターンとなる。従っ
て、量子化誤差、つぶれ、かすれなどの画像劣化による
変動があるものの、同じ文字は類似したパターンの画像
となる(なお、これを利用した画像圧縮技術として、個
別文字を切りだし、切り出された文字画像から典型文字
パターンを生成し、これをテンプレートとして各文字パ
ターンを分類し、典型文字パターン情報と分類コードを
送信するようにした画像情報圧縮伝送方式(特開平3−
157064号公報)、画像圧縮方法および装置(US
P5,303,313)などがある)。
【0004】従って、あるパターンが画像劣化によって
標準パターンから大きくはずれていても、その類似パタ
ーンは比較的標準パターンに近い可能性がある。本発明
は、上記した性質を利用するものであって、本発明の目
的は、類似パターンを持つパターンの認識を精度よく行
う文字認識方法を提供することにある。
【0005】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から文字パター
ンを切り出し、該切り出された文字パターンの系列にお
いてパターンイメージが類似していて、同一の文字と判
断される類似パターンを抽出し、該抽出された類似パタ
ーン群を構成する各類似パターンが認識対象の第1文字
である確信度をそれぞれ求め、該求められた第1文字に
ついてのそれぞれの確信度を加算し、該加算した値(以
下、加算値)を、前記類似パターン群が前記認識対象の
第1文字である確信度とする処理を行い、上記した処理
を複数の認識対象の文字について行い、加算値が最大と
なる認識対象の文字を、前記類似パターン群が相当する
文字であると決定することを特徴としている。
【0006】
【作用】一実施例においては、入力画像から文字パター
ンを切り出し、切り出された文字パターンの内、類似し
たパターンを検出する。類似したパターンについてそれ
ぞれ文字認識を行い、それぞれのパターンが候補文字で
ある確信度を求める。確信度の最も高い候補文字を、類
似パターン群が相当する文字であると決定する。
【0007】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉 図1は、本発明の実施例の構成を示す。図において、1
01はスキャナなどの画像入力装置、102はパターン
切り出し部、103は切り出されたパターン列の中から
類似したパターンを抽出する類似パターン検出部、10
4は類似パターン群から一つの典型パターンを生成する
典型パターン生成部、105は個別パターンを認識する
文字認識部、106は類似パターン群の各パターン毎の
認識結果から、類似パターン群が相当する文字を決定す
る認識結果融合部、107は入力画像や生成データを記
憶する記憶部、108は全体を制御する制御部、109
はデータ通信路である。
【0008】図2は、本発明の処理動作に係るフローチ
ャートである。図2を参照しながら動作を説明すると、
まず、スキャナなどの画像入力装置101によって画像
を入力する(ステップ201)。次いで、パターン切り
出し部102は、入力画像から各文字パターンを切り出
す(ステップ202)。類似パターン検出部103は、
切り出されたパターンの内、類似していて同一の文字と
判断されるパターンを抽出する(ステップ203)。こ
の場合の類似度としては、例えば前掲した米国特許公報
の段落9で説明されているテスト方法を用いる。
【0009】つまり、この方法は、位置を補正しながら
パターンを重ね合わせて差異の出る画素の現れる位置、
現れる画素のパターンによって類似であるか否かを判別
する方法である。図3は、類似していて同一の文字と判
断されるパターンの例を示し、図4は、類似していて同
一の文字と判断されないパターンの例を示す。
【0010】抽出された類似パターンをP1,P
2,...Pnとすると、その集合Sは、S={P1,
P2...Pn}、類似パターンの集合(類似パターン
群)はいくつかあるので、Sj;j=1,2..mと表
される。
【0011】次にSjの各々に対して処理を行う(ステ
ップ204)。文字認識部105は、Sjを構成するパ
ターンのそれぞれ(Pji;i=1,2..n)につい
て辞書と照合することにより文字認識を行う。その結
果、それぞれのパターンについて幾つかの候補文字とそ
の確信度が求まる(ステップ205)。
【0012】続いて、認識結果融合部106は、それぞ
れの認識結果を基に、類似パターンの集合が相当する文
字を決定する。すなわち、図示しない辞書内にある認識
対象文字の集合を、A={C1,C2,..Cl}とす
ると、Piの認識結果は認識対象各文字に対して確信度
Dik;k=1,2,..lを持つものとして表せる
(この確信度としては、例えば特徴空間におけるPiと
Aとの距離を用いる)。
【0013】候補でない文字の確信度を0とし、他の確
信度は正規化されていて、数値の高い文字ほど確信度が
高い。従って、集合Sj(類似パターン群)が相当する
文字は、Djl=ΣDil(Σはiについて行う)で表
される確信度の最も高いものである(ステップ20
6)。
【0014】図5は、確信度から類似パターン群が相当
する文字の決定を説明する図である。いま、集合Sjの
類似パターンをP1、P2、P3とし、各パターンP
1、P2、P3がそれぞれ認識対象文字C1である確信
度を、それぞれD11、D21、D31としたとき、集
合Sjが認識対象文字C1である確信度Dj1は、Dj
1=D11+D21+D31で求められる。同様にし
て、集合Sjが認識対象文字C2である確信度Dj2
は、Dj2=D12+D22+D32となり、集合Sj
が認識対象文字Clである確信度Djlは、Djl=D
1l+D2l+D3lとなる。そして、確信度Dj1、
Dj2、...Djlの内、最も値の大きいものが例え
ばDj2であるとき、Sjが相当する文字をC2と決定
する。
【0015】上記した処理を繰り返すことによって、類
似パターンを持つパターンの認識がより精度よく行われ
る。類似パターンを持たない場合は、文字認識部105
でそれぞれ個別に認識処理が行われ(ステップ20
7)、最終的に認識結果が出力される(ステップ20
8)。
【0016】〈実施例2〉 図6は、実施例2の処理フローチャートである。画像入
力装置101によって画像を入力する(ステップ30
1)。次いで、パターン切り出し部102によって入力
画像から各文字パターンを切り出す(ステップ30
2)。類似パターン検出部103によって切り出された
パターンの内、類似していて同一の文字と判断されるパ
ターンを抽出する(ステップ303)。
【0017】実施例1と同様に、抽出された類似パター
ンをP1,P2,...Pnとすると、その集合Sは、
S={P1,P2...Pn}、類似パターンの集合は
いくつかあるので、Sj;j=1,2..mと表され
る。
【0018】次にSjの各々に対して処理を行う(ステ
ップ304)。典型パターン生成部104は、類似する
パターンの集合(類似パターン群)から、一つの典型パ
ターンを生成する(ステップ305)。これは例えばP
1,P2,..Pnを重ね合わせることにより生成す
る。図7は、典型パターン生成の一例を示し、所定数以
上黒画素である場合にその画素を黒であるとするもの
で、図7では、P1,P2,P3,P4のパターンの
内、2つ以上のパターンで黒画素ならば、黒と処理する
ことによって生成された典型パターン例である。
【0019】このように生成された典型パターンについ
て文字認識部105は文字認識を行う。また類似パター
ンを持たないパターンについても文字認識を行う(ステ
ップ306)。そして、その結果を認識結果として出力
する(ステップ307)。
【0020】〈実施例3〉 上記した各類似パターン群がそれぞれ一つの文字に相当
するものとすれば、処理対象となる画像での各文字の出
現頻度を測定することができる。つまり、英文あるいは
特定文書などによって各文字の出現頻度に偏りがあれ
ば、文字パターンの認識結果の候補からどの文字である
かを決定する際に、この頻度を利用することができる。
【0021】また、各文字の出現頻度に偏りがないよう
な文書であっても、連続して現れる文字の組で考える
と、その出現頻度に偏りがある場合がある。これも同様
に文字パターンの認識結果の候補からどの文字であるか
を決定する際に利用することができる(なお、文字認識
後に単語辞書を参照して、単語中の一部の文字の置き換
えを行って文字を修正する方式が特公平4−11914
号公報に記載されているが、該方式では単語の切り分け
が難しい上に、候補文字すべてを使用するとその組み合
わせが非常に多くなり、また単語辞書も必要になる)。
【0022】本実施例3は、出現する文字あるいは文字
の組の頻度に偏りがある場合に、その頻度を利用するこ
とにより高精度に文字を認識する実施例である。
【0023】図8は、実施例3の構成を示す。画像入力
装置501、パターン切り出し部502、典型パターン
生成部504、記憶部507、制御部508、通信路5
09は、実施例1のものと同様である。503は切り出
されたパターン列の中から類似していて同一文字と判断
されるパターンを抽出する類似パターン検出部であり、
類似するパターンの数を計測し、またはシンボル系列と
した場合に、その連続するシンボルの組の出現頻度も計
測する機能が組み込まれている。
【0024】505は個別パターンを認識し、候補文字
を出力する文字認識部、506は各シンボルの出現頻度
またはシンボル組の出現頻度によって各候補文字から相
当する文字を決定する認識結果決定部である。
【0025】図9は、実施例3の処理動作のフローチャ
ートである。図9を参照して実施例3を説明すると、実
施例1と同様に、画像入力装置101によって画像を入
力し(ステップ601)、パターン切り出し部502に
よって、入力画像から各文字パターンを切り出し(ステ
ップ602)、類似パターン検出部503によって、切
り出されたパターンの内、類似していて同一文字と判断
されるパターンを抽出する(ステップ603)。
【0026】このとき、類似パターン検出部503は、
類似するパターンの数を数える。または類似するパター
ンを一つのシンボルで置き換えた場合に、抽出した文字
パターンの集合はシンボル列で表現できるので、ある連
続するシンボルの組の出現頻度を測定する(ステップ6
03)。
【0027】なお、文字パターン列をシンボル列とその
位置で表現する手法は、前掲した米国特許公報に記載さ
れている。本発明ではこの手法を用いる。
【0028】図10は、シンボル系列とその組の関係を
説明する図である。文字パターン列が、例えば「文字認
識は文字を認識すること...」であるとき、これをシ
ンボル系列で表すと次のようになる。すなわち、最初の
文字である「文」にシンボルS1を付与し、次の「字」
にシンボルS2を付与し、以下、「認」にS3、「識」
にS4、「は」にS5を付与する。続いて、「文」は類
似パターンとして検出され、既に出現していてシンボル
が付与されているので、S1が付与され、同様に「字」
にはS2が付与され、「を」は初めて出現した文字であ
るので、新たシンボルS6が付与される。以下、同様に
して図10に示すようにシンボルが付与される。
【0029】頻度が測定されるシンボルの組は、図の例
では、S1S2(文字)、S2S3(字認)、S3S4
(認識)などである。
【0030】次に、各シンボルに相当する類似文字パタ
ーン群に対して文字認識を行う。これは、実施例2と同
様に、それぞれ典型文字パターンを作成して、これに対
して文字認識部505が文字認識を行う(ステップ60
4−606)。
【0031】認識処理によって各シンボルに対して候補
文字が得られる。認識結果決定部506は、シンボルの
出現頻度を参照して、候補文字から正しい文字を選択し
て(ステップ607)、その結果を出力する(ステップ
608)。すなわち、対象原稿における各シンボルの出
現頻度に偏りがあれば、例えば文字“A”が全体の約1
8%、文字“B”が全体の約10%の頻度で現れること
が予想される原稿を処理する場合、あるシンボルがシン
ボル系列の中で約20%の頻度で出現し、この候補文字
の一つが“A”であったならば、このシンボルは文字
“A”であると決定する。
【0032】また、シンボル系列における連続するシン
ボルの組(連続するとは、図10に示す、例えばS1S
2、S2S3などであり、例えばS1S6は連続した組
ではない)の頻度に偏りがある(例えば、図10でS1
S2の頻度が高く、S2S3の頻度が低い)ことが予想
される原稿の場合であれば、例えば「認識」という単語
の出現頻度が高いと予想される原稿を処理する場合に、
シンボル系列の中で出現頻度の高いシンボルの組で、シ
ンボルそれぞれの認識結果候補に「認」、「識」の文字
があれば、このシンボルをそれぞれ「認」、「識」と決
定する。また、特に頻度が高い単語でなくても、一般文
書の場合、例えば、“t”、“h”と続く場合が多いな
ど、頻度の高い文字の組やその頻度などについてあらか
じめ調べることができる。従って、上記したようにシン
ボルの頻度と連続するシンボルの組の頻度を参照するこ
とによって、候補文字の中から正しい文字を決定するこ
とができる。
【0033】このように、上記した実施例では、シンボ
ルあるいはシンボル組の頻度を利用しているが、着目す
るシンボル組を抽出するのは非常に簡単な処理であり、
またその後、候補文字をすべて処理しても処理量はそれ
ほど増加しない。
【0034】
【発明の効果】以上、説明したように、本発明によれ
ば、以下のような効果が得られる。 (1) 切り出された文字パターンの系列においてパター
ンイメージが類似していて、同一の文字と判断される類
似パターンを抽出し、抽出された類似パターン群を構成
する各類似パターンの認識結果を基に、類似パターン群
が相当する文字を決定しているので、画像劣化などで文
字パターンが変動しても精度のよい文字認識を行うこと
ができる。また、確信度を算出する簡単な処理によっ
て、認識結果を得ることができる。
【0035】(2)切り出された文字パターンの系列に
おいてパターンイメージが類似していて、同一の文字と
判断される類似パターンを抽出し、抽出された類似パタ
ーン群から典型パターンを作成し、典型パターンの認識
結果を基に類似パターン群が相当する文字を決定してい
るので、画像劣化などで文字パターンが変動しても精度
のよい文字認識を行うことができる。また、典型パター
ンについてのみ認識処理すればよいことから、認識処理
回数が削減され、処理速度が向上する。
【0036】(3)出現するシンボル(文字)の頻度を
測定し、その頻度を参照して候補文字から正しい文字を
選択しているので、出現するシンボル(文字)の頻度に
偏りがある場合に、精度のよい文字認識が可能となる。
【0037】(4)出現するシンボル(文字)の組の頻
度を測定し、その頻度を参照して候補文字から正しい文
字を選択しているので、出現するシンボル(文字)の組
の頻度に偏りがある場合に、高精度の文字認識が可能と
なる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】本発明の実施例の処理フローチャートである。
【図3】類似していて同一の文字と判断されるパターン
の例を示す。
【図4】類似していて同一の文字と判断されないパター
ンの例を示す。
【図5】確信度から類似パターン群が相当する文字の決
定を説明する図である。
【図6】本発明の他の実施例の処理フローチャートであ
る。
【図7】典型パターン生成の一例を示す。
【図8】本発明の他の実施例の構成を示す。
【図9】本発明のさらに他の実施例の処理フローチャー
トである。
【図10】シンボル系列とその組の関係を説明する図で
ある。
【符号の説明】
101 画像入力装置 102 パターン切り出し部 103 類似パターン検出部 104 典型パターン生成部 105 文字認識部 106 認識結果融合部 107 データ記憶部 108 制御部 109 データ通信路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−187499(JP,A) 特開 平5−46811(JP,A) 特開 平3−186985(JP,A) 特開 平3−174685(JP,A) 特開 昭59−149569(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 - 9/62 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像から文字パターンを切り出し、
    該切り出された文字パターンの系列においてパターンイ
    メージが類似していて、同一の文字と判断される類似パ
    ターンを抽出し、該抽出された類似パターン群を構成す
    る各類似パターンが認識対象の第1文字である確信度を
    それぞれ求め、該求められた第1文字についてのそれぞ
    れの確信度を加算し、該加算した値(以下、加算値)
    を、前記類似パターン群が前記認識対象の第1文字であ
    る確信度とする処理を行い、上記した処理を複数の認識
    対象の文字について行い、加算値が最大となる認識対象
    の文字を、前記類似パターン群が相当する文字であると
    決定することを特徴とする文字認識方法。
JP16408694A 1994-07-15 1994-07-15 文字認識方法 Expired - Fee Related JP3260979B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP16408694A JP3260979B2 (ja) 1994-07-15 1994-07-15 文字認識方法
US08/501,924 US6272242B1 (en) 1994-07-15 1995-07-13 Character recognition method and apparatus which groups similar character patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16408694A JP3260979B2 (ja) 1994-07-15 1994-07-15 文字認識方法

Publications (2)

Publication Number Publication Date
JPH0830732A JPH0830732A (ja) 1996-02-02
JP3260979B2 true JP3260979B2 (ja) 2002-02-25

Family

ID=15786516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16408694A Expired - Fee Related JP3260979B2 (ja) 1994-07-15 1994-07-15 文字認識方法

Country Status (2)

Country Link
US (1) US6272242B1 (ja)
JP (1) JP3260979B2 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000065917A (ja) 1998-06-11 2000-03-03 Japan Radio Co Ltd 三次元的表示レーダ
US7130487B1 (en) * 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium
CA2366057C (en) * 1999-03-05 2009-03-24 Canon Kabushiki Kaisha Database annotation and retrieval
JP4216433B2 (ja) * 1999-03-29 2009-01-28 株式会社クラレ 回路基板用金属張積層板の製造方法
JP3913985B2 (ja) * 1999-04-14 2007-05-09 富士通株式会社 文書画像中の基本成分に基づく文字列抽出装置および方法
US6882970B1 (en) * 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
US7212968B1 (en) 1999-10-28 2007-05-01 Canon Kabushiki Kaisha Pattern matching method and apparatus
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
US6999963B1 (en) 2000-05-03 2006-02-14 Microsoft Corporation Methods, apparatus, and data structures for annotating a database design schema and/or indexing annotations
US6993475B1 (en) * 2000-05-03 2006-01-31 Microsoft Corporation Methods, apparatus, and data structures for facilitating a natural language interface to stored information
GB0011798D0 (en) * 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
GB0015233D0 (en) * 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
GB0023930D0 (en) 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
GB0027178D0 (en) 2000-11-07 2000-12-27 Canon Kk Speech processing system
GB0028277D0 (en) 2000-11-20 2001-01-03 Canon Kk Speech processing system
JP3268772B1 (ja) 2001-05-22 2002-03-25 理世 野津 画像認識システム、認識管理サーバ及びその制御方法、プログラム
EP1296457B1 (en) * 2001-09-21 2009-04-29 Ricoh Company, Ltd. Multi-level data processing for recording
JP2004201069A (ja) * 2002-12-19 2004-07-15 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記憶した記録媒体
JP4200106B2 (ja) 2003-07-15 2008-12-24 株式会社リコー 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータプログラムを記憶する記憶媒体
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
WO2007035863A2 (en) 2005-09-21 2007-03-29 Intermec Ip Corp. Radio frequency identification tags based on coalition formation
US7558772B2 (en) * 2005-12-08 2009-07-07 Northrop Grumman Corporation Information fusion predictor
US8120461B2 (en) 2006-04-03 2012-02-21 Intermec Ip Corp. Automatic data collection device, method and article
JP2009537038A (ja) 2006-05-07 2009-10-22 バーコード リミティド 製品ロジスティックチェーンにおける品質管理を改善するためのシステムおよび方法
US7562811B2 (en) 2007-01-18 2009-07-21 Varcode Ltd. System and method for improved quality management in a product logistic chain
US8002173B2 (en) 2006-07-11 2011-08-23 Intermec Ip Corp. Automatic data collection device, method and article
US20080084573A1 (en) * 2006-10-10 2008-04-10 Yoram Horowitz System and method for relating unstructured data in portable document format to external structured data
DE102006059659B4 (de) * 2006-12-18 2009-12-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US20080225340A1 (en) * 2007-03-14 2008-09-18 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product
US7546955B2 (en) * 2007-03-16 2009-06-16 Intermec Ip Corp. Systems, devices, and methods for reading machine-readable characters and human-readable characters
JP2010526386A (ja) 2007-05-06 2010-07-29 バーコード リミティド バーコード標識を利用する品質管理のシステムと方法
WO2009016631A2 (en) 2007-08-01 2009-02-05 Ginger Software, Inc. Automatic context sensitive language correction and enhancement using an internet corpus
US9261979B2 (en) * 2007-08-20 2016-02-16 Qualcomm Incorporated Gesture-based mobile interaction
EP2191397B1 (en) * 2007-08-20 2019-01-23 Qualcomm Incorporated Enhanced rejection of out-of-vocabulary words
DE102007052622A1 (de) * 2007-11-05 2009-05-07 T-Mobile International Ag Verfahren zur Bildanalyse, insbesondere für ein Mobilfunkgerät
US8540156B2 (en) 2007-11-14 2013-09-24 Varcode Ltd. System and method for quality management utilizing barcode indicators
US8233726B1 (en) * 2007-11-27 2012-07-31 Googe Inc. Image-domain script and language identification
JP2009157482A (ja) * 2007-12-25 2009-07-16 Kyocera Corp 文書編集装置及び文書編集方法
US11704526B2 (en) 2008-06-10 2023-07-18 Varcode Ltd. Barcoded indicators for quality management
CN102884518A (zh) 2010-02-01 2013-01-16 金格软件有限公司 尤其用于小键盘装置的使用互联网语料库的自动的上下文相关的语言校正
JP5337194B2 (ja) * 2011-04-25 2013-11-06 シャープ株式会社 画像処理装置
US8807422B2 (en) 2012-10-22 2014-08-19 Varcode Ltd. Tamper-proof quality management barcode indicators
US9082071B2 (en) * 2013-11-26 2015-07-14 Canon Kabushiki Kaisha Material classification using object/material interdependence with feedback
CA2985160C (en) 2015-05-18 2023-09-05 Varcode Ltd. Thermochromic ink indicia for activatable quality labels
WO2017006326A1 (en) 2015-07-07 2017-01-12 Varcode Ltd. Electronic quality indicator
RU2626656C2 (ru) * 2015-12-02 2017-07-31 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и система определения ориентации изображения текста
GB2571530B (en) * 2018-02-28 2020-09-23 Canon Europa Nv An image processing method and an image processing system
CN111368576B (zh) * 2020-03-12 2023-04-21 成都信息工程大学 一种基于全局优化的Code128条码自动识读方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering
JPH0481988A (ja) * 1990-07-24 1992-03-16 Sharp Corp クラスタリング方式
US5239594A (en) * 1991-02-12 1993-08-24 Mitsubishi Denki Kabushiki Kaisha Self-organizing pattern classification neural network system
US5237628A (en) * 1991-06-03 1993-08-17 Nynex Corporation System and method for automatic optical data entry
KR0186025B1 (ko) * 1991-10-09 1999-05-15 이헌조 후보 문자 분류 방법
US5875263A (en) * 1991-10-28 1999-02-23 Froessl; Horst Non-edit multiple image font processing of records
JP3260843B2 (ja) * 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
US5526447A (en) * 1993-07-26 1996-06-11 Cognitronics Imaging Systems, Inc. Batched character image processing
US5852685A (en) * 1993-07-26 1998-12-22 Cognitronics Imaging Systems, Inc. Enhanced batched character image processing
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system

Also Published As

Publication number Publication date
JPH0830732A (ja) 1996-02-02
US6272242B1 (en) 2001-08-07

Similar Documents

Publication Publication Date Title
JP3260979B2 (ja) 文字認識方法
JP5647919B2 (ja) 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
JP2020527260A (ja) テキスト検出分析方法、装置及びデバイス
KR100412317B1 (ko) 문자인식/수정방법및장치
CN111401099B (zh) 文本识别方法、装置以及存储介质
US5862259A (en) Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
US6778712B1 (en) Data sheet identification device
Hong et al. Visual inter-word relations and their use in OCR postprocessing
CN114419636A (zh) 文本识别方法、装置、设备以及存储介质
US20050226516A1 (en) Image dictionary creating apparatus and method
US11972208B2 (en) Information processing device and information processing method
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP3162419B2 (ja) 認識辞書更新方法
JPH1069494A (ja) 画像検索方法とその装置
JP3595081B2 (ja) 文字認識方法
JPH0944606A (ja) 文字認識処理方法
JPH05128307A (ja) 文字認識装置
JP3243389B2 (ja) 文書識別方法
JP2950286B2 (ja) 画面イメージ読み取り装置
JP3226355B2 (ja) 認識結果評価方法
JPH08202830A (ja) 文字認識システム
JPH06243294A (ja) 文字認識後処理装置
JP2000172784A (ja) 文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131214

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees