JP4697387B2 - 原稿画像判定装置、原稿画像判定方法及びそのプログラム - Google Patents
原稿画像判定装置、原稿画像判定方法及びそのプログラム Download PDFInfo
- Publication number
- JP4697387B2 JP4697387B2 JP2004168230A JP2004168230A JP4697387B2 JP 4697387 B2 JP4697387 B2 JP 4697387B2 JP 2004168230 A JP2004168230 A JP 2004168230A JP 2004168230 A JP2004168230 A JP 2004168230A JP 4697387 B2 JP4697387 B2 JP 4697387B2
- Authority
- JP
- Japan
- Prior art keywords
- distance
- document
- character image
- distribution
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Input (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
上記目的を達成するために、本発明にかかる原稿画像判定装置は、原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得する特徴量取得手段と、前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出する特徴距離算出手段と、前記特徴距離算出手段により算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する方向判定手段とを有する。
また、本発明にかかる原稿画像判定方法は、原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得し、前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出し、前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する。
また、本発明にかかるプログラムは、コンピュータを含む原稿画像判定装置において、原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得するステップと、前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出するステップと、前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定するステップとを前記原稿画像判定装置のコンピュータに実行させる。
スキャナなどにより原稿から読み取られた画像(以下、原稿画像)は、人が読める方向(すなわち正立方向)を向いているとは限らず、他の方向(上下が反転した方向、右に90度傾いた方向、左に90度傾いた方向)を向いていることもある。したがって、読み取られた原稿画像に対して編集作業などを行う場合には、原稿画像の方向を修正する必要がある。特に、自動原稿送り装置を用いて大量の原稿に対してスキャン処理を実施した場合には、読み取られた原稿画像の方向を一枚ごとに目視確認して方向を修正することは面倒である。そこで、原稿画像の方向を自動的に判定して正立方向に修正する技術が提案されている。
例えば、原稿画像判定方法には、複数の文字領域を抽出し、抽出された複数の文字領域において複数の方向で文字認識処理(OCR)を行い、文字認識の信頼度が最も高くなる方向を当該文字領域の方向として判定する方法がある。この場合に、複数の文字領域に対する判定結果(判定方向)が互いに異なる場合には、複数の文字領域の大きさを判定方向別に合算し、算出された大きさが最も大きくなる判別方向を原稿の方向として判別する。しかし、この方法は、原稿中の文字を認識できること(すなわち、文字種が特定されていること)が前提である。
また、他の原稿画像判定方法としては、原稿画像中から句読点を抽出し、抽出された句読点が文字列中に占める位置を特定して原稿の方向を判定する方法がある。しかし、この方式では、原稿中から認識対象とする句読点を厳密に抽出し、それが文字列中に占める位置まで正確に把握しなければならない。例えば、アルファベット圏の言語では句読点をOCR技術なしに安定して判別することは容易ではない。
これらの原稿方法判定方法は、上記のように、予め対象となる原稿中の言語又は文字種が特定されていることを前提としており、汎用性に乏しい。
図1(A)に例示するように、原稿画像は、文字、写真及び表などの種々のオブジェクトからなる。これらのオブジェクトは、正立方向を基準として配置され、それぞれのオブジェクト内では、正立方向を基準として文字等の画像要素が配置される。したがって、この原稿画像から抽出される特徴量は、原稿の方向となんらかの相関関係を有する。なお、本例の特徴量は3つであり、例えば、文字領域における文頭及び文末の余白の分布(f1)、文字領域が配置されている位置(f2)、及び文字領域から隣接するオブジェクトまでの距離(f3)である。
図1(B)に例示するように、本例の文書処理装置2は、正立方向から左に90度回転した基準原稿群に対応する基準空間と、正立方向から右に90度回転した基準原稿群に対応する基準空間と、正立方向の基準原稿群に対応する基準空間と、正立方向から180度回転した基準原稿群に対応する基準空間とを予め準備している。基準空間とは、それぞれの特徴量の項目(評価項目)を軸とした多次元空間であり、本例では、3種類の特徴量(f1,f2,f3)をそれぞれ軸とした3次元空間である。また、本例の基準空間は、それぞれの基準特徴量の標準偏差に基づいて正規化されているため、特徴量のばらつきやすさも加味した類似度(相関度)の評価を可能にする。
本実施形態における文書処理装置2は、算出される特徴距離が最も短い基準空間を特定し、特定された基準空間に対応する方向を原稿画像の方向として判定する。本例では、正立方向に対応する基準空間で算出される特徴距離が最小となるため、文書処理装置2は、原稿画像が正立方向を向いていると判定する。
このように、文書処理装置2は、特定の画像特徴(例えば、句読点の位置)にのみ着目して論理的に方向の判定を実施するのではなく、様々な特徴量を統計的に処理することにより原稿の方向を判定するため、幅広い種類の原稿に対応できる。
次に、文書処理装置2のハードウェア構成を説明する。
図2は、本発明にかかる原稿画像判定方法が適応される文書処理装置2のハードウェア構成を、制御装置を中心に例示する図である。
図2に例示するように、文書処理装置2(原稿画像判定装置)は、本装置全体を制御するためのCPU202と、制御用プログラムあるいは制御用データなどを記憶するROM204と、各種データを一時的に記憶するためのRAM206と、CPU202に直結された高速バス214と、周辺機器を接続するための低速バス216と、これらのバスを結ぶバスブリッジ212と、各種表示を行う表示部218と、各種データを入力するためのマウス又はデジタイザなどのポインティングデバイスあるいはキーボード等を含む操作部220と、原稿を読み取って原稿画像のデータを生成するスキャナ222と、電子文書の出力を行うための電子写真方式又はインクジェット方式のプリンタ224とを備える。さらに、文書処理装置2には、原稿画像のデータ、及び、これに基づいて生成された電子文書データなどを蓄積するための記録装置208が高速バス214に設けられている。なお、本発明にかかる方向判定プログラム5(後述)は、例えば記録装置208に蓄積されており、CPU202により実行される。また、表示部218、操作部220、スキャナ222及びプリンタ224は、インタフェース(不図示)を介して低速バス216と接続されている。さらに、文書処理装置2は、通信部226を有し、ネットワーク228を介して外部との間で情報の伝達を行うことができる。
図3は、CPU202(図2)により実行され、本発明にかかる原稿画像判定方法を実現する方向判定プログラム5の機能構成を例示する図である。
図3に例示するように、方向判定プログラム5は、解像度変換部510、領域抽出部520、特徴量取得部530、基準空間選択部540、基準空間データベース(基準空間DB)550、特徴距離算出部560、方向判定部570及び画像回転部580を有する。
領域抽出部520は、レイアウト解析を適用して、文字領域の抽出処理を実施する。また、領域抽出部520は、原稿画像の画像データが多値データである場合には、レイアウト解析の前処理として原稿画像の画像データを二値化する。
特徴距離算出部560は、特徴量算出部530により各文字領域について算出された複数の特徴量を、基準空間選択部540により選択された基準特徴量空間群に属する複数の基準空間にマッピングし、それぞれの基準空間において、それぞれ基準特徴量とマッピングされた対象点との間の特徴距離を算出する。本実施形態における特徴距離算出部560は、基準空間選択部540により選択された基準空間のパラメータ(基準原稿について算出された平均値、標準偏差及び相関係数)に基づいて、マハラノビスの距離を特徴距離として算出する。
また、方向判定部570は、判定結果の信頼度をページごとに判定する。例えば、方向判定部570は、基準空間の方向毎に特徴距離を合算し、合算された特徴距離の大きさに基づいて信頼度を算出する。方向判定部570は、方向毎に合算された特徴距離が相対的に近いか否かに基づいて、信頼度を算出してもよい。すなわち、方向毎に合算された特徴量の差分が小さい場合には信頼度が低いと定義し、特徴量の差分が大きい場合には信頼度が高いと定義することができる。
図4に例示するように、基準空間DB550は、基準原稿の属性(言語及び文字種)に対応付けて、基準空間群を記憶する。また、基準空間群は、正立方向(基準方向)に対応付けられた基準空間「#1.1」と、右方向に対応付けられた基準空間「#1.2」と、左方向に対応付けられた基準空間「#1.3」と、反転方向に対応付けられた基準空間「#1.4」とを含む。例えば、基準空間「#1.1」は、文字種Aを用いた日本語の基準原稿を正立方向に配置して、この基準原稿から抽出された特徴量(基準特徴量)に基づいて作成されるマハラノビス空間である。同様に、基準空間「#1.2」、「#1.3」及び「#1.4」は、文字種Aを用いた日本語の基準原稿をそれぞれ右方向(基準方向から右に90度の方向)、左方向(基準方向から左に90度の方向)及び反転方向(基準方向と上下反転した方向)に配置して、それぞれの基準原稿から抽出された特徴量(基準特徴量)に基づいて作成されるマハラノビス空間である。
これにより、文書処理装置2は、利用者が頻繁に利用する原稿の属性に特化した基準空間を生成できるため、原稿画像の方向判定の精度(信頼度)を向上させることができる。
すなわち、文書処理装置2は、基準空間を作成する際の基準原稿として用途を限定することにより、利用環境に適した判定基準を容易に構築できる。例えば、文書処理装置2は、日本語原稿、韓国語原稿及び中国語原稿などの各国語の原稿を基準原稿として基準空間群を作成し基準空間DB550に登録することにより、それぞれの言語に特化した判定基準で原稿画像の方向を判定でき、それぞれの言語からなる原稿について高い判定精度を実現できる。また、文書処理装置2は、活字原稿及び手書き原稿をそれぞれ基準原稿として基準空間群を作成し基準空間DB550に登録することにより、活字原稿又は手書き原稿に特化した判定基準で原稿画像の方向を判定してもよい。同様に、文書処理装置2は、特定のフォーマットからなる原稿(帳票、はがきなど)を基準原稿として基準空間群を作成し基準空間DB550に登録することにより、各フォーマットの原稿に特化した判定基準で原稿画像の方向を判定してもよい。
なお、文書処理装置2は、ネットワーク228を介して基準空間のパラメータを取得し、取得された基準空間のパラメータを基準空間DB550に格納してもよい。
図5に例示するように、基準空間DB550は、それぞれの基準空間のパラメータを記憶する。記憶される基準空間パラメータは、複数ページからなる基準原稿により作成されたものである。より具体的には、基準空間パラメータは、基準原稿から抽出された複数の特徴量(すなわち、複数の評価項目に関する特徴量)の平均値(基準特徴量)と、これら特徴量の標準偏差とを含む。本例の基準空間パラメータは、利用者が方向を指定して入力した複数の原稿画像(基準原稿)から、それぞれのページごとに複数の特徴量を抽出し、抽出された特徴量に基づいて評価項目ごとに算出された平均値(基準特徴量)及び標準偏差である。この基準特徴量及び標準偏差に基づいてマハラノビス空間が定義され、マハラノビスの距離(特徴距離)が算出される。
また、本例の文書処理装置2は、図4に例示するように、4方向に対応した基準空間を作成することにより、90度を単位として原稿画像の方向を判定しているが、これに限定されるものではなく、より細かい単位(例えば45度)で原稿画像の方向を判定したい場合、又は、より大まかな単位(例えば180度)で原稿画像の方向を判定したい場合には、それぞれの方向に対応した基準空間を作成して方向判定を行う。
図6に例示するように、領域抽出部520は、原稿画像に対してレイアウト解析を行い、文字画像からなる文字領域と、写真画像又はCG画像からなるイメージ領域とを抽出する。レイアウト解析は、例えば、特開2000−90194号公報に記載されている手法を用いる。なお、領域抽出部520は、入力された原稿画像が二値画像でない場合に、レイアウト解析の前処理として二値化処理を実施してもよい。二値化処理は、既定のしきい値を用いて単純に二値化するものでもよいし、特開2001−60247号公報又は特開2002−175532号公報に記載されている手法であってもよい。
図6に例示するように、原稿画像から、写真画像からイメージ領域1、このイメージ領域1の右側に隣接する文字領域1、このイメージ領域の下方に隣接する文字領域2、罫線を構成するイメージ領域2、このイメージ領域2の上方に隣接する文字領域4、このイメージ領域2の中に配置された文字領域5及び文字領域6など、このイメージ領域2の左側に隣接する文字領域3、並びに、原稿画像のフッタ領域に配置された文字領域7などが抽出される。文字領域に含まれる文字は、原稿画像における位置によって異なることが多く、例えば、フッタ領域に配置される文字(ページ数など)は、原稿画像の中央部に配置される文字(原稿のコンテンツ)よりも小さい場合が多い。
また、罫線の中に配置される文字(文字領域5及び文字領域6の文字)は、罫線との関係において既定の位置(例えば、中央位置又は左寄せ位置)に配置されることが多い。
文書処理装置2は、これらの特性を特徴量として原稿画像から抽出して、基準原稿の基準特徴量と比較することにより、原稿画像と基準原稿との相関度(類似度)を判定する。
図7に示すように、基準原稿に関して特徴量1及び特徴量2は正の相関を有する。しがって、原稿画像の特徴量1及び特徴量2も、同様に正の相関を有するほうが基準原稿に近い(すなわち、基準原稿との相関が高い)と判定できる。そこで、本実施形態における文書処理装置2は、複数の特徴量の間の相関関係も加味したマハラノビスの距離を特徴距離として適用する。本例における点A及び点Bについて検討すると、原点からのユークリッド距離は同一であるが、特徴量1及び特徴量2の相関という観点も加味して比較すると、点Aは負の相関を有し、点Bは正の相関を有するため、点Bは点Aよりも基準原稿に近いと判定でき、等マハラノビス距離線を基準として比較しても同様の結論となる。
すなわち、文書処理装置2は、4方向に配置された基準原稿群から複数の特徴量を抽出し、抽出された特徴量に基づいて基準特徴量(平均値)及び標準偏差を方向毎に算出して4つのマハラノビス空間を作成しておく。そして、文書処理装置2は、これら4つのマハラノビス空間に、原稿画像から取得された複数の特徴量をそれぞれマッピングしてマハラノビスの距離を算出し、原稿画像と最も相関度の高い基準原稿の向きを特定する。
このように、本実施形態における文書処理装置2は、マハラノビス空間を適用するため、基準を正常状態としたとき正常状態の情報からのみ評価基準を作成することができるため、基準原稿に対する相関度(類似度)については汎用性の高い尺度を与えることができる。換言すると、本実施形態における文書処理装置2は、マハラノビス空間を適用することにより、異常状態における情報(特徴量)を入力せずに、評価基準を生成することができる。
図8に示すように、ステップ100(S100)において、文書処理装置2は、スキャナ222(図2)を介して、原稿から読み取られた原稿画像の画像データを取得し、取得された原稿画像の画像データを方向判定プログラム5(図3)に入力する。なお、方向判定プログラム5の基準空間選択部540(図3)は、予め、操作部220(図2)を介して、利用者から基準空間群の指定操作(言語、文字種などの指定)を受け付け、指定された基準空間群に属する各基準空間のパラメータを基準空間DB550から読み出し、読み出された基準空間パラメータを特徴距離算出部560に対して出力している。
ステップ115(S115)において、特徴量取得部530は、領域抽出部520により抽出された1つの文字領域から、複数の評価項目に関する特徴量を抽出する。
ステップ125(S125)において、特徴距離算出部540は、これら4つの基準空間において、基準特徴量(マハラノビス空間における原点)とマッピングされた対象点との距離(マハラノビスの距離)を特徴距離として算出する。
ステップ130(S130)において、方向判定プログラム5は、抽出された全ての文字領域について特徴距離の算出が終了したか否かを判定し、全ての文字領域について終了した場合に、S135の処理に移行し、これ以外の場合に、S115の処理に戻って次の文字領域に関する特徴距離を算出する。
ステップ140(S140)において、方向判定部570は、ページ方向の判定結果に対して信頼度を算出する。例えば、方向判定部570は、方向毎に合算された特徴距離の大きさを、評価項目の数などで正規化して信頼度とする。
ステップ150(S150)において、画像回転部580は、方向判定部570により判定されたページ方向に基づいて、原稿画像の方向が正立方向となるように原稿画像を回転させる。
また、文書処理装置2は、利用者が用意した原稿を基準原稿として用いることができる。これにより、それぞれの利用環境に特化した方向判定処理を行い、高い判定精度を実現することができる。
また、文書処理装置2は、マハラノビスの距離を適用することにより、複数の特徴量の相関も加味して原稿画像と基準原稿群との相関度を判定できるため、高い判定精度が期待できる。
222・・・スキャナ
5・・・方法判定プログラム
510・・・解像度変換部
520・・・領域抽出部
530・・・特徴量取得部
540・・・基準空間選択部
550・・・基準空間データベース
560・・・特徴距離算出部
570・・・方向判定部
580・・・画像回転部
Claims (12)
- 原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得する特徴量取得手段と、
前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出する特徴距離算出手段と、
前記特徴距離算出手段により算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する方向判定手段と
を有する原稿画像判定装置。 - 前記特徴距離算出手段は、前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれと、基準方向に配置された1枚以上の基準原稿からなる基準原稿群に基づいて算出された基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出する
請求項1に記載の原稿画像判定装置。 - 前記特徴距離算出手段は、原稿画像と基準画像群との間の特徴距離を、相対的に複数の方向で算出し、
前記方向判定手段は、複数の方向で判定された特徴距離に基づいて、原稿画像の方向を判定する
請求項2に記載の原稿画像判定装置。 - 前記特徴距離算出手段は、前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、基準方向、この基準方向から右に略90度回転した右方向、この基準方向から左に略90度回転した左方向、及び、この基準方向から略180度回転した反転方向にある基準原稿群それぞれに基づいて算出された基準分布、基準位置及び基準距離に対応する点それぞれと、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれとに基づいて、基準方向、右方向、左方向及び反転方向にある基準原稿群それぞれと原稿画像との特徴距離を算出する
請求項3に記載の原稿画像判定装置。 - 前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間は、マハラノビス空間であり、
前記方向判定手段は、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれと、基準方向に配置された1枚以上の基準原稿からなる基準原稿群に基づいて算出された基準分布、基準位置及び基準距離に対応する点それぞれとの間のマハラノビスの距離を算出する
請求項4に記載の原稿画像判定装置。 - 原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域を抽出する領域抽出手段
をさらに有し、
前記特徴距離算出手段は、前記領域抽出手段により抽出された文字画像領域ごとに、前記特徴距離を算出し、
前記方向判定手段は、文字画像領域ごとに判定された特徴距離に基づいて、原稿画像の方向を判定する
請求項1に記載の原稿画像判定装置。 - 複数の基準原稿群の中から1つの基準原稿群を選択する基準選択手段
をさらに有し、
前記特徴距離算出手段は、前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、基前記基準選択手段により選択された基準原稿群に基づいて算出された基準分布、基準位置及び基準距離に対応する点それぞれと前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれとの間の特徴距離を算出する
請求項1に記載の原稿画像判定装置。 - 基準原稿として入力された画像データに基づいて、基準原稿に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得する基準取得手段と、
原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得する特徴量取得手段と、
前記特徴量取得手段により取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記特徴量取得手段により取得された分布、位置及び距離に対応する点それぞれと、前記基準取得手段により取得された基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出する特徴距離算出手段と、
前記特徴距離算出手段により算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する方向判定手段と
を有する原稿画像判定装置。 - 原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得し、
前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出し、
前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する
原稿画像判定方法。 - 基準原稿として入力された画像データに基づいて、基準原稿に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得し、
原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得し、
前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、前記取得された基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出し、
前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定する
原稿画像判定方法。 - コンピュータを含む原稿画像判定装置において、
原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得するステップと、
前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、基準方向に対応付けられた基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出するステップと、
前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定するステップと
を前記原稿画像判定装置のコンピュータに実行させるプログラム。 - コンピュータを含む原稿画像判定装置において、
基準原稿として入力された画像データに基づいて、基準原稿に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得するステップと、
原稿から読み取られた原稿画像の画像データに基づいて、原稿画像に含まれる文字画像領域の文頭及び文末の余白の分布、該文字画像領域が配置されている位置、及び、該文字画像領域から該文字画像領域以外のオブジェクトまでの距離を取得するステップと、
前記取得される分布、位置及び距離それぞれを軸とした3次元空間において、前記取得された分布、位置及び距離に対応する点それぞれと、前記取得された基準分布、基準位置及び基準距離に対応する点それぞれとの間の特徴距離を算出するステップと、
前記算出された特徴距離に、文字画像領域の大きさ及び文字画像領域に含まれる文字数を重み付けた距離が最小となる3次元空間を特定し、特定された3次元空間に対応付けられた方向を文字画像領域の方向とし、この文字画像領域の方向に基づいて原稿画像の方向を判定するステップと
を前記原稿画像判定装置のコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168230A JP4697387B2 (ja) | 2004-06-07 | 2004-06-07 | 原稿画像判定装置、原稿画像判定方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004168230A JP4697387B2 (ja) | 2004-06-07 | 2004-06-07 | 原稿画像判定装置、原稿画像判定方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005346607A JP2005346607A (ja) | 2005-12-15 |
JP4697387B2 true JP4697387B2 (ja) | 2011-06-08 |
Family
ID=35498895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004168230A Expired - Fee Related JP4697387B2 (ja) | 2004-06-07 | 2004-06-07 | 原稿画像判定装置、原稿画像判定方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4697387B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340430B2 (en) | 2007-07-10 | 2012-12-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
US8160365B2 (en) | 2008-06-30 | 2012-04-17 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000113103A (ja) * | 1998-09-30 | 2000-04-21 | Ricoh Co Ltd | 文書画像の方向判定方法、装置および記録媒体 |
JP2000113106A (ja) * | 1998-10-09 | 2000-04-21 | Fuji Xerox Co Ltd | 文書画像処理装置 |
JP2002324236A (ja) * | 2001-04-25 | 2002-11-08 | Hitachi Ltd | 帳票識別方法及び帳票登録方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3186246B2 (ja) * | 1992-09-24 | 2001-07-11 | 株式会社日立製作所 | 文書読取装置 |
JP3534128B2 (ja) * | 1995-01-24 | 2004-06-07 | オムロン株式会社 | 書類の上下方向検知方法及び装置 |
-
2004
- 2004-06-07 JP JP2004168230A patent/JP4697387B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000113103A (ja) * | 1998-09-30 | 2000-04-21 | Ricoh Co Ltd | 文書画像の方向判定方法、装置および記録媒体 |
JP2000113106A (ja) * | 1998-10-09 | 2000-04-21 | Fuji Xerox Co Ltd | 文書画像処理装置 |
JP2002324236A (ja) * | 2001-04-25 | 2002-11-08 | Hitachi Ltd | 帳票識別方法及び帳票登録方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005346607A (ja) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100576233C (zh) | 检测文档图像中的字符的方向 | |
US7526128B2 (en) | Line extraction in digital ink | |
US5664027A (en) | Methods and apparatus for inferring orientation of lines of text | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
US20110043869A1 (en) | Information processing system, its method and program | |
JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
CN110503054B (zh) | 文本图像的处理方法及装置 | |
JP2006031546A (ja) | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 | |
JP6531738B2 (ja) | 画像処理装置 | |
Suresh et al. | Telugu Optical Character Recognition Using Deep Learning | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
CN112396057A (zh) | 一种字符识别方法、装置及电子设备 | |
KR102282025B1 (ko) | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 | |
JP7591915B2 (ja) | 書式定義装置、書式定義方法、及びプログラム | |
JP2002170079A (ja) | 文書書式識別装置および識別方法 | |
JP7410532B2 (ja) | 文字判定装置及び文字判定プログラム | |
KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 | |
JPH10134141A (ja) | 文書照合装置および方法 | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2023002090A (ja) | 情報処理システム、表示制御方法及びプログラム | |
CN115408497A (zh) | 表格图片中信息的检索方法及电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070517 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110114 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110215 |
|
LAPS | Cancellation because of no payment of annual fees |