[go: up one dir, main page]

JP4392907B2 - 文字切出し方法 - Google Patents

文字切出し方法 Download PDF

Info

Publication number
JP4392907B2
JP4392907B2 JP21715199A JP21715199A JP4392907B2 JP 4392907 B2 JP4392907 B2 JP 4392907B2 JP 21715199 A JP21715199 A JP 21715199A JP 21715199 A JP21715199 A JP 21715199A JP 4392907 B2 JP4392907 B2 JP 4392907B2
Authority
JP
Japan
Prior art keywords
pixel
character
image
black
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21715199A
Other languages
English (en)
Other versions
JP2001043313A (ja
Inventor
琢磨 赤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21715199A priority Critical patent/JP4392907B2/ja
Priority to EP00304765A priority patent/EP1073002B1/en
Priority to DE60024535T priority patent/DE60024535T2/de
Priority to KR10-2000-0032889A priority patent/KR100383858B1/ko
Priority to CNB001219472A priority patent/CN1192324C/zh
Publication of JP2001043313A publication Critical patent/JP2001043313A/ja
Application granted granted Critical
Publication of JP4392907B2 publication Critical patent/JP4392907B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、たとえば、入力された文字の濃淡画像を基に文字認識を行なう文字認識装置において、文字を1文字づつ切出す文字切出し方法に関する。
【0002】
【従来の技術】
文字認識技術は、一般的に、文字画像の入力、文字行の抽出、文字の切出し、文字認識などに大別される。
【0003】
一般的に文字の切出しは、入力された文字画像を2値化した後に行なう。入力された文字画像は文字領域と背景領域とに2分される。この際、複数の文字が接触した形で、1つの文字領域として切出されることがある。従来技術では、この接触文字を、接触の形状を基に構造解析的に切断点を求めることによって、切断していた。
【0004】
【発明が解決しようとする課題】
しかし、文字の接合点の形状にはさまざまなパターンが考えられ、従来技術で切断できたのは、このうちの少数である特殊な形状のみであった。
【0005】
一般に、手書き文字の文書画像の場合、文字切出しの際に文字同士が接触している場合の多くは、入力文書画像そのものでも文字同士が接触している場合が多い。
【0006】
これに対して、印刷活字の文書画像の場合、文字切出しの際に問題となる文字接触の原因の多くが、文字同士が実際に接触しているのではなく、スキャナ(文字画像入力手段)の解像度の低さによる量子化誤差と、2値化処理の際の2値化ミスによるものである。
【0007】
そこで、入力された文字画像を2値化した濃淡画像に立ち戻れば、文字と文字との接触点を比較的容易に発見できるはずである。
【0008】
しかし、単に濃淡画像だけを用いたのでは、文字領域の特定など、問題が複雑化し、処理速度が遅くなる上、文字位置推定ミスなどの弊害も起こり、かえって性能が低下することが多いという問題があった。
【0009】
そこで、本発明は、形状的には発見の難しい文字接触を高精度かつ効率よく発見して切断することができる文字切出し方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明の文字切出し方法は、入力された文字画像に応じて文字を認識する文字認識装置における文字切出し方法であって、前記入力された文字画像を当該文字画像中の各画素の少なくとも濃度値に基づいた第1の閾値により2値化することにより文字部分を表わす文字領域とそれ以外の背景領域とに分離する第1の2値画像を取得する第1のステップと、この第1のステップにより取得された第1の2値画像の文字領域に対応する部分を当該第1の2値画像の文字領域に対応する前記入力された文字画像の各画素の濃度値に基づいた第2の閾値により2値化することにより少なくとも2つの領域に分離する第2の2値画像を取得する第2のステップと、前記第1のステップにより取得された第1の2値画像と前記第2のステップにより取得された第2の2値画像との間で黒画素から白画素に変化した画素数の多い画素行または画素列を検知する第3のステップと、この第3のステップにより検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在するか否かをチェックする第4のステップと、この第4のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在する場合、当該画素行または画素列における黒画素の濃度値と当該画素行または画素列の両側の画素行または画素列における黒画素の濃度値とを比較し、当該両側の画素行または画素列の濃度値が前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の濃度値よりも小さいか否かをチェックする第5のステップと、前記第4のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在しない場合、あるいは、前記第5のステップによるチェックの結果、前記両側の画素行または画素列の濃度値が前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の濃度値よりも小さい場合、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の両側に文字が存在するか否かをチェックする第6のステップと、この第6のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の両側に文字が存在する場合、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列を切断点として前記第1の2値画像を個々の文字に切断する第7のステップとを具備している。
【0011】
また、本発明の文字切出し方法は、第2のステップは、第1のステップで取得された第1の2値画像の黒画素の位置に相当する前記入力された文字画像の画素の濃度値を用いてヒストグラムを形成し、この形成されたヒストグラムに基づいて少なくとも2つの領域に分離するステップを含むことを特徴とする。
【0015】
本発明によれば、文字画像を2値化して得られる濃淡画像から、黒画素となった部分だけを分離抽出して、その部分に対してだけヒストグラムをとり、そのヒストグラムを基に再び2値化することで、文字の接触部を発見して切断することにより、形状的には発見の難しい文字接触を高精度かつ効率よく発見して切断することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
【0017】
なお、以下の説明においては、画素の濃度値が低いほど、その画素は黒くなり、濃度値が高いほど、その画素は白くなるものとする。具体例をあげて説明すれば、たとえば、画素の濃度値を「0」から「3」の4値で示した場合、濃度値「0」が黒画素を示し、濃度値「3」が白画素を示し、濃度値「1」,「2」がそれらの中間の色(灰色)画素を示す。
【0018】
図1〜図4は、スキャナ(文字画像入力手段)の解像度の低さによる量子化誤差による文字接触を図式化したものである。図1は、スキャナで取込む前の入力文書画像を拡大したものであり、数字「1」と「2」とが近接して書かれているが、文字と文字との間には空白があり、文字同士は接触していない。このような文書画像をスキャナで読取る場合を考える。
【0019】
スキャナは、図2に示されるようなメッシュで、文書画像を区切り、それぞれの矩形の中で濃度の平均値を取り、その濃度値を、矩形に対応する画素の代表濃度として取込む。スキャナで取込まれた濃淡画像の例が図3である。この例では、縦6ドット、横12ドットの濃淡画像となる。
【0020】
なお、図3において、黒く塗り潰した部分aが濃度の一番高い画素、交差斜線で示した部分bが画素aよりも濃度の低い画素、太い斜線で示した部分cが画素bよりも濃度の低い画素、細い斜線で示した部分dが画素cよりも濃度の低い画素、黒い塗り潰しや斜線のない部分eが濃度の一番低い画素、をそれぞれ示している。
すなわち、図3を画素の濃度値で説明すると、前述したように、画素の濃度値が低いほどその画素は黒くなり、濃度値が高いほどその画素は白くなるものと仮定しているので、たとえば、画素の濃度値を「0」から「4」の5値で示した場合、濃度の一番高い画素aは濃度値が一番低い画素(濃度値「0」の黒画素)、画素aよりも濃度の低い画素bは濃度値が画素aよりも高い画素(濃度値「1」の画素)、画素bよりも濃度の低い画素cは濃度値が画素bよりも高い画素(濃度値「2」の画素)、画素cよりも濃度の低い画素dは濃度値が画素cよりも高い画素(濃度値「3」の画素)、濃度の一番低い画素eは濃度値が一番高い画素(濃度値「4」の白画素)、となる。
【0021】
文字と文字との間の空白の幅が、スキャナの取込みの矩形に比べて細い場合には、図3に見られるように、空白の部分にあたる画素でも、濃度の低い画素が得られる。このため、この画像を2値化した場合、図4のように、2つの文字が接触した形で2値画像が得られる。
【0022】
従来の文字切出し方法では、図4の2値画像のみを用いて、接触文字の切断を行なっていた。
【0023】
しかし、図3の濃淡画像で見ると、文字ストロークの輪郭は、文字ストロークの中心部よりも濃度値が高くなっている。文字の接触部分も例外ではなく、空白部分にあたる画素は、文字部分よりも濃度値が高くなっている。
【0024】
そこで、本発明では、この濃度値が高くなっている部分を効率よく見つけて、文字接触部分を決定することにより、文字領域を切断するものであり、以下、それについて詳細に説明する。
【0025】
図5は、本発明に係る文字切出し方法が適用される文字切出し装置の構成を概略的に示すものである。図5において、文字画像入力手段としてのスキャナ1は、入力文書画像を光学的に読取って、図3に示すような濃淡画像を入力する。スキャナ1で入力された濃淡画像は、第1の画像メモリ2に一時記憶される。
【0026】
第1の2値化部3は、第1の画像メモリ2に一時記憶された濃淡画像を、たとえば、周知の大津の2値化法(大津展之、“判別および最小2乗基準に基づく自動しきい値選定法”、信学論(D)、vol.J63−D、no.4、pp.349−356、1980参照)により2値化し、図4に示すような第1の2値画像を出力する。
【0027】
第1の2値化部3から出力された第1の2値画像は、第2の画像メモリ4に一時記憶される。文字接触推定部5は、第2の画像メモリ4に一時記憶された第1の2値画像に基づき、文字接触がありそうかどうかを推定(判定)する。推定の基準は、たとえば、黒画素領域の縦横比で、縦サイズに比べて横サイズが広い場合に、複数の文字が接触していると推定する。
【0028】
第2の2値化部6は、文字接触推定部5で複数の文字が接触していると推定されたとき動作し、第1の画像メモリ2に一時記憶された濃淡画像、および、第2の画像メモリ4に一時記憶された第1の2値画像が入力されることにより、まず、第1の2値画像の黒画素の位置に相当する濃淡画像の画素からのみ濃度値をとり、ヒストグラムに登録する。
【0029】
次に、第2の2値化部6は、得られたヒストグラムを基に、たとえば、上記した周知の大津の2値化法を用いて、ヒストグラムの濃度値を2分する閾値を求める。2値画像の黒画素のうち、濃淡画像の同じ座標の濃度値が得られた閾値よりも高い場合にのみ、黒画素→白画素反転を行ない、新たな2値画像を(第2の2値画像)作成する。
【0030】
第2の2値化部6から出力された第2の2値画像は、第3の画像メモリ7に一時記憶される。文字切断部8は、第1の画像メモリ2に一時記憶された濃淡画像、第2の画像メモリ4に一時記憶された第1の2値画像、および、第3の画像メモリ7に一時記憶された第2の2値画像を基に文字接触位置を決定し、この決定された文字と文字との接触位置情報を基に文字画像を切断する。この際、切断するのは、第1の2値化部3で得られた文字画像(第1の2値画像)である。
【0031】
選択部9は、文字接触推定部5の推定結果に基づき、第2の画像メモリ4の記憶内容あるいは文字切断部8の出力を選択する。すなわち、文字接触推定部5で複数の文字が接触していないと推定されたときは、第2の画像メモリ4の記憶内容を選択し、複数の文字が接触していると推定されたときは、文字切断部8の出力を選択する。
【0032】
次に、本発明に係る文字切出し方法について、図6に示すフローチャートを参照して詳細に説明する。まず、スキャナ1において、文字画像の濃淡画像が入力され、第1の画像メモリ2に一時記憶される(S1)。次に、第1の2値化部3において、第1の画像メモリ2内の濃淡画像を、大津の2値化法を用いて第1の2値画像に変換し、第2の画像メモリ4に一時記憶する(S2)。
【0033】
次に、文字接触推定部5は、得られた第2の画像メモリ4内の第1の2値画像を基に、文字接触がありそうかどうかを判定する(S3)。文字接触判定の基準は、黒画素領域の縦横比で、縦サイズに比べ横サイズが広い場合に、複数の文字が接触していると判定する。文字接触がないと判定された場合は、処理を終了する。この場合、選択部9は、第2の画像メモリ4内の第1の2値画像を選択して、次の認識処理へ送る。
【0034】
文字接触があると判定された場合、第2の2値化部6は、第1の2値化部3で得られた第1の2値画像の黒画素の位置に相当する濃淡画像の画素からのみ濃度値を取り、ヒストグラムに登録する(S4)。そして、得られたヒストグラムを基に、大津の2値化法を用いて、ヒストグラムの濃度値を2分する閾値を求める。2値画像の黒画素のうち、濃淡画像の同じ座標の濃度値が得られた閾値よりも高い場合にのみ黒画素→白画素反転を行ない、第2の2値画像を作成し、第3の画像メモリ7に一時記憶する(S5)。
【0035】
図7は、第1の2値化部3で2値化された第1の2値画像の一例、図8は、第2の2値化部6で2値化された第2の2値画像の一例であり、それぞれ黒い矩形が2値化によって黒画素とみなされた部分であり、白い矩形が2値化によって白画素とみなされた部分である。
【0036】
文字領域だけで、濃度ヒストグラムを取り直し、2値化を行なうと、前述したスキャナの量子化誤差によって黒画素となっていた部分、つまり、文字と文字とが近い部分や文字ストロークの輪郭は、濃度値が高いため、白画素に変わる。そのため、図8では、文字「2」と「5」、文字「5」と「3」との間に、新たに空白がてきていることがわかる(図の矢印部分)。
【0037】
次に、文字切断部8では、第2の2値化部6で得られた第2の2値画像、第1の2値化部3で得られた第1の2値画像、および、スキャナ1で入力された濃淡画像を基に、文字接触位置を決定する。文字接触位置の決定部については後で詳細を説明する。そして、決定された文字と文字との接触位置情報を基に、文字画像(第1の2値化部3で得られた第1の2値画像)を切断する。この場合、選択部9は、文字切断部8の出力を選択して、次の認識処理へ送る。
【0038】
次に、文字切断部8における文字接触位置の決定方法について、図9に示すフローチャートを参照して詳細に説明する。まず、第1の2値化部3で得られた第1の2値画像と、第2の2値化部6で得られた第2の2値画像とを比較し、新たに白画素となった画素が多い列を検知する(S11)。次に、ステップS11において検知された列について、第2の2値画像で、縦方向に黒画素が1画素もないかチェックする(S12)。
【0039】
このチェックの結果、縦方向に黒画素が1画素もない場合はステップS14へ進み、黒画素があった場合は、スキャナ1で入力された濃淡画像をチェックする(S13)。すなわち、濃淡画像の該列と同じ位置の列の第1の2値画像における黒画素の位置の平均的な濃度値を求める。該列の左右数列についても同じ処理を行なう。該列が、左右の列に対して尾根である場合、つまり、左右の列の濃度値の平均値の方が、該列の濃度値の平均値よりも低いか判定する。この判定の結果、低い場合はステップS14へ進み、そうでない場合は切断候補から外す(文字切断はしない)。
【0040】
次に、ステップS12の処理、あるいは、ステップS13の処理から得られた列において、その左右(両端)に文字が存在するかどうかをチェックする(S14)。図8のように、第2の2値画像で得られる白画素は、文字と文字との接触点の他に、文字のストロークのエッジにも現われる。このため、該列の両端に文字が存在するかを確かめる必要がある。その方法は、たとえば、該列の両端数列にわたり、第1の2値画像を基に黒画素をカウントすることにより、一定値以上存在すれば、文字が存在するとみなす。
【0041】
ステップS14でのチェックの結果、文字が存在しない場合は、切断候補から外し(文字切断はしない)、文字が存在する場合は、文字切断部8による文字の切断処理を行なう(S15)。
【0042】
なお、図8のフローチャートのステップS12において、文字画像を入力するスキャナ1の解像度が低い場合は、黒画素が多少ある場合でもステップS14にジャンプする。この場合、切断候補点決定の基準として、第1の2値化部3で得られた第1の2値画像と、第2の2値化部6で得られた第2の2値画像の黒画素部分での差分を取り、差分の大きい列を候補列とする。この場合、スキャナ1の解像度が低いほど、差分の大きさを表わす閾値を下げる。
【0043】
以上説明したように、上記実施の形態によれば、従来、2値画像のみでは接触文字の切断ができなかった、文字同士の接触を切断することができる。また、全ての処理を濃淡画像のみを用いて処理するよりも、はるかに負荷の軽い処理で行なえる。したがって、形状的には発見の難しい文字接触を高精度かつ効率よく発見して切断することができる。
【0044】
【発明の効果】
以上詳述したように本発明によれば、形状的には発見の難しい文字接触を高精度かつ効率よく発見して切断することができる文字切出し方法を提供できる。
【図面の簡単な説明】
【図1】スキャナで取込む前の入力文書画像の一例を拡大して示す図。
【図2】スキャナで文書画像をメッシュで区切って取込む様子を説明する図。
【図3】スキャナで取込まれた濃淡画像の一例を示す図。
【図4】図3の濃淡画像を2値化した2値画像の一例を示す図。
【図5】本発明に係る文字切出し方法が適用される文字切出し装置の構成を概略的に示すブロック図。
【図6】本発明に係る文字切出し方法を説明するフローチャート。
【図7】第1の2値化部で2値化された第1の2値画像の一例を示す図。
【図8】第2の2値化部で2値化された第2の2値画像の一例を示す図。
【図9】文字切断部における文字接触位置の決定方法を説明するフローチャート。
【符号の説明】
1……スキャナ(文字画像入力手段)
2……第1の画像メモリ
3……第1の2値化部
4……第2の画像メモリ
5……文字接触推定部
6……第2の2値化部
7……第3の画像メモリ
8……文字切断部
9……選択部

Claims (2)

  1. 入力された文字画像に応じて文字を認識する文字認識装置における文字切出し方法であって、
    前記入力された文字画像を当該文字画像中の各画素の少なくとも濃度値に基づいた第1の閾値により2値化することにより文字部分を表わす文字領域とそれ以外の背景領域とに分離する第1の2値画像を取得する第1のステップと、
    この第1のステップにより取得された第1の2値画像の文字領域に対応する部分を当該第1の2値画像の文字領域に対応する前記入力された文字画像の各画素の濃度値に基づいた第2の閾値により2値化することにより少なくとも2つの領域に分離する第2の2値画像を取得する第2のステップと、
    前記第1のステップにより取得された第1の2値画像と前記第2のステップにより取得された第2の2値画像との間で黒画素から白画素に変化した画素数の多い画素行または画素列を検知する第3のステップと、
    この第3のステップにより検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在するか否かをチェックする第4のステップと、
    この第4のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在する場合、当該画素行または画素列における黒画素の濃度値と当該画素行または画素列の両側の画素行または画素列における黒画素の濃度値とを比較し、当該両側の画素行または画素列の濃度値が前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の濃度値よりも小さいか否かをチェックする第5のステップと、
    前記第4のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列に黒画素が存在しない場合、あるいは、前記第5のステップによるチェックの結果、前記両側の画素行または画素列の濃度値が前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の濃度値よりも小さい場合、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の両側に文字が存在するか否かをチェックする第6のステップと、
    この第6のステップによるチェックの結果、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列の両側に文字が存在する場合、前記検知された黒画素から白画素に変化した画素数の多い画素行または画素列を切断点として前記第1の2値画像を個々の文字に切断する第7のステップと、
    を具備したことを特徴とする文字切出し方法。
  2. 前記第2のステップは、前記第1のステップで取得された第1の2値画像の黒画素の位置に相当する前記入力された文字画像の画素の濃度値を用いてヒストグラムを形成し、この形成されたヒストグラムに基づいて少なくとも2つの領域に分離するステップを含むことを特徴とする請求項1記載の文字切出し方法。
JP21715199A 1999-07-30 1999-07-30 文字切出し方法 Expired - Fee Related JP4392907B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP21715199A JP4392907B2 (ja) 1999-07-30 1999-07-30 文字切出し方法
EP00304765A EP1073002B1 (en) 1999-07-30 2000-06-06 Character extracting method
DE60024535T DE60024535T2 (de) 1999-07-30 2000-06-06 Verfahren zur Zeichentrennung
KR10-2000-0032889A KR100383858B1 (ko) 1999-07-30 2000-06-15 문자인식장치의 문자추출방법 및 장치
CNB001219472A CN1192324C (zh) 1999-07-30 2000-07-26 字符提取方法和设备 、字符分离方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21715199A JP4392907B2 (ja) 1999-07-30 1999-07-30 文字切出し方法

Publications (2)

Publication Number Publication Date
JP2001043313A JP2001043313A (ja) 2001-02-16
JP4392907B2 true JP4392907B2 (ja) 2010-01-06

Family

ID=16699666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21715199A Expired - Fee Related JP4392907B2 (ja) 1999-07-30 1999-07-30 文字切出し方法

Country Status (5)

Country Link
EP (1) EP1073002B1 (ja)
JP (1) JP4392907B2 (ja)
KR (1) KR100383858B1 (ja)
CN (1) CN1192324C (ja)
DE (1) DE60024535T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100872983B1 (ko) * 2001-12-22 2008-12-08 주식회사 포스코 슬래브의 문자인식 및 확인용 장치
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US8723964B2 (en) 2003-09-12 2014-05-13 Sony Corporation Method and device for communication using an optical sensor
CN1310182C (zh) * 2003-11-28 2007-04-11 佳能株式会社 用于增强文档图像和字符识别的方法和装置
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
CN100369049C (zh) * 2005-02-18 2008-02-13 富士通株式会社 灰度字符的精确分割装置及方法
JP4658848B2 (ja) * 2006-03-30 2011-03-23 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
EP2348487A3 (en) 2010-01-22 2017-09-13 Samsung Electronics Co., Ltd. Method and apparatus for creating animation message
CN103034855A (zh) * 2012-12-05 2013-04-10 曙光信息产业(北京)有限公司 在图像中识别字符区域的方法
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JP2615153B2 (ja) * 1988-08-24 1997-05-28 富士通株式会社 切断分離を伴う文字認識方法
JP2865697B2 (ja) * 1989-03-20 1999-03-08 株式会社日立製作所 エクスチャ分離方法
KR930014166A (ko) * 1991-12-30 1993-07-22 이헌조 문서인식장치의 개별문자 절출방법
JPH07200739A (ja) * 1994-01-07 1995-08-04 Nippon Steel Corp マーキング文字認識方法
JPH08129611A (ja) * 1994-10-31 1996-05-21 Sony Corp 文字識別方法及び検査基準文字登録方法
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
KR0186172B1 (ko) * 1995-12-06 1999-05-15 구자홍 문자 인식장치의 접촉문자 분리 및 특징 추출방법
KR19980068924A (ko) * 1997-02-25 1998-10-26 구자홍 선과 겹친문자 영상복원을 이용한 필기체 인식 방법
KR19990056813A (ko) * 1997-12-29 1999-07-15 구자홍 개별문자의 가로/세로비를 이용한 접촉문자 분리방법

Also Published As

Publication number Publication date
KR100383858B1 (ko) 2003-05-14
EP1073002B1 (en) 2005-12-07
EP1073002A3 (en) 2003-10-29
DE60024535T2 (de) 2006-08-17
EP1073002A2 (en) 2001-01-31
CN1192324C (zh) 2005-03-09
KR20010015025A (ko) 2001-02-26
DE60024535D1 (de) 2006-01-12
CN1291756A (zh) 2001-04-18
JP2001043313A (ja) 2001-02-16

Similar Documents

Publication Publication Date Title
US9158986B2 (en) Character segmentation device and character segmentation method
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4392907B2 (ja) 文字切出し方法
JP4339925B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
US20150278626A1 (en) Character recognition device and character segmentation method
US6141444A (en) Method for deleting ruled lines and a recording medium storing programs for performing the method
US7319776B2 (en) Image processing method and image processing program
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US12229942B2 (en) Image processing apparatus, image processing method, and medium
JP2003115031A (ja) 画像処理装置および方法
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP2861860B2 (ja) 宛名行抽出装置
JP7341758B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2827960B2 (ja) 宛名行抽出装置
JP3187895B2 (ja) 文字領域抽出方法
JP2021005315A (ja) 情報処理装置、プログラム及び制御方法
JP3019897B2 (ja) 行切出し方法
JP4242962B2 (ja) 文字切出装置
JP2877548B2 (ja) 文書画像の属性判別方法
JP2003281469A (ja) 文書画像処理方法
JPH01169686A (ja) 文字行検出装置
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2963807B2 (ja) 郵便番号枠検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees