[go: up one dir, main page]

JP6173542B1 - 画像処理装置、画像処理方法、および、プログラム - Google Patents

画像処理装置、画像処理方法、および、プログラム Download PDF

Info

Publication number
JP6173542B1
JP6173542B1 JP2016157937A JP2016157937A JP6173542B1 JP 6173542 B1 JP6173542 B1 JP 6173542B1 JP 2016157937 A JP2016157937 A JP 2016157937A JP 2016157937 A JP2016157937 A JP 2016157937A JP 6173542 B1 JP6173542 B1 JP 6173542B1
Authority
JP
Japan
Prior art keywords
character
region
area
gradation value
connected component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016157937A
Other languages
English (en)
Other versions
JP2018026005A (ja
Inventor
満 西川
満 西川
清人 小坂
清人 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2016157937A priority Critical patent/JP6173542B1/ja
Priority to US15/355,047 priority patent/US10049291B2/en
Application granted granted Critical
Publication of JP6173542B1 publication Critical patent/JP6173542B1/ja
Publication of JP2018026005A publication Critical patent/JP2018026005A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】画素の階調値順序に応じた包含関係を表す連結成分の階層構造に基づいて、OCR処理を行わずに、前景である文字領域の高精度な二値画像を取得できる画像処理装置、画像処理方法、および、プログラムを提供することを課題とする。【解決手段】本発明は、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、連結成分から構成される階層構造の階層構造データを生成し、階層構造データに基づいて、文字らしさの特徴を満たす連結成分を文字らしい領域として抽出し、文字らしい領域のみに用いる二値化の閾値を取得し、文字らしい領域を二値化した補正領域を取得し、補正領域以外の入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、補正領域と背景領域とから構成される二値画像の二値画像データを取得する。【選択図】図2

Description

本発明は、画像処理装置、画像処理方法、および、プログラムに関する。
従来から、画像中の文字列を抽出する技術が開示されている。
ここで、濃度値を所定範囲毎に区切って、当該所定範囲において画像から抽出された連結成分の成分ツリーを生成し、成分ツリーの接続関係に基づいて、テキスト抽出を行う技術が開示されている(特許文献1を参照)。
特開2015−26290号公報
しかしながら、従来の文字認識装置(特許文献1)においては、文字列抽出のため、連結成分に対してOCR(Optical Character Recognition)処理を実施して、候補文字の確からしさを求める必要があるという問題点を有していた。
本発明は、上記問題点に鑑みてなされたもので、画素の階調値順序に応じた包含関係を表す連結成分の階層構造に基づいて、OCR処理を行わずに、前景である文字領域の高精度な二値画像を取得できる画像処理装置、画像処理方法、および、プログラムを提供することを目的とする。
このような目的を達成するため、本発明に係る画像処理装置は、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成手段と、前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出手段と、前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正手段と、前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する画像取得手段と、を備えたことを特徴とする。
また、本発明に係る画像処理方法は、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成ステップと、前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出ステップと、前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正ステップと、前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する二値画像取得ステップと、を含むことを特徴とする。
また、本発明に係るプログラムは、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成ステップと、前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出ステップと、前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正ステップと、前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する二値画像取得ステップと、をコンピュータに実行させることを特徴とする。
この発明によれば、文字領域抽出をベースとする二値化手法を実施することにより、撮影環境または撮影装置に依存せずに、高い文字認識性を持つ二値画像を生成することができる。
また、この発明によれば、文字認識性を向上させることで、高いOCR精度を実現することができる。
図1は、本実施形態に係る画像処理装置の構成の一例を示すブロック図である。 図2は、本実施形態の画像処理装置における処理の一例を示すフローチャートである。 図3は、本実施形態における入力画像の一例を示す図である。 図4は、本実施形態における連結成分の階層構造の一例を示す図である。 図5は、本実施形態における連結成分の一例を示す図である。 図6は、本実施形態における連結成分の一例を示す図である。 図7は、本実施形態における連結成分の一例を示す図である。 図8は、本実施形態における連結成分の一例を示す図である。 図9は、本実施形態における連結成分の一例を示す図である。 図10は、本実施形態の画像処理装置における処理の一例を示すフローチャートである。 図11は、本実施形態における入力画像の一例を示す図である。 図12は、本実施形態における文字らしい領域の一例を示す図である。 図13は、本実施形態における補正領域の一例を示す図である。 図14は、本実施形態における面積の累積度数分布に基づく閾値設定の一例を示すグラフである。 図15は、本実施形態における入力画像の一例を示す図である。 図16は、本実施形態における二値画像の一例を示す図である。 図17は、本実施形態における入力画像の一例を示す図である。 図18は、本実施形態における二値画像の一例を示す図である。 図19は、本実施形態における入力画像の一例を示す図である。 図20は、本実施形態における二値画像の一例を示す図である。 図21は、本実施形態における入力画像の一例を示す図である。 図22は、本実施形態における二値画像の一例を示す図である。
以下に、本発明に係る画像処理装置、画像処理方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本発明が限定されるものではない。
[本実施形態の構成]
以下、本発明の実施形態に係る画像処理装置100の構成の一例について図1を参照して説明し、その後、本実施形態の処理等について詳細に説明する。図1は、本実施形態に係る画像処理装置100の構成の一例を示すブロック図である。
但し、以下に示す実施形態は、本発明の技術思想を具体化するための画像処理装置100を例示するものであって、本発明をこの画像処理装置100に特定することを意図するものではなく、請求の範囲に含まれるその他の実施形態の画像処理装置100にも等しく適用し得るものである。
また、本実施形態で例示する画像処理装置100における機能分散の形態は以下に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。
図1に示すように、画像処理装置100は、概略的に、制御部102と、記憶部106と、を備えて構成される。また、これら画像処理装置100の各部は任意の通信路を介して通信可能に接続されている。
ここで、画像処理装置100は、更に、入出力部を備えて構成されてもよい。ここで、入出力部は、データの入出力(I/O)を行う。
また、入出力部は、例えば、キー入力部、タッチパネル、コントロールパッド(例えば、タッチパッド、および、ゲームパッド等)、マウス、キーボード、および/または、マイク等の入力部であってもよい。
また、入出力部は、アプリケーション等の表示画面を表示する表示部(例えば、液晶または有機EL等から構成されるディスプレイ、モニタ、および、タッチパネル等)、および/または、音声情報を音声として出力する音声出力部(例えば、スピーカ等)等の出力部であってもよい。
また、画像処理装置100は、更に、インターフェース部を備えていてもよい。ここで、画像処理装置100は、インターフェース部を介して、外部装置(例えば、画像読取装置等)と相互に通信可能に接続されていてもよい。
また、インターフェース部は、通信回線および/または電話回線等に接続されるアンテナおよび/またはルータ等の通信装置に接続されるインターフェース(NIC等)であってもよく、画像処理装置100とネットワークとの間における通信制御を行う通信インターフェースであってもよい。
ここで、ネットワークは、有線通信および/または無線通信(例えば、WiFi等)の遠隔通信等を含む。また、インターフェース部は、画像読取装置等と制御部102との間の入出力制御を行う入出力インターフェースであってもよい。
なお、制御部102は、インターフェース部、および、入出力部を制御してもよい。
記憶部106は、各種のデータベース、テーブル、および/または、ファイルなどを格納する。また、記憶部106は、各種アプリケーションプログラム(例えば、ユーザアプリケーション等)を記憶していてもよい。
また、記憶部106は、ストレージ手段であり、例えばRAM・ROM等のメモリ、ハードディスクのような固定ディスク装置、SSD(Solid State Drive)、フレキシブルディスク、および/または、光ディスク等の有形の記憶装置、または、記憶回路を用いることができる。
記憶部106には、コントローラ等に命令を与え各種処理を行うためのコンピュータプログラム等が記録されている。
これら記憶部106の各構成要素のうち、画像データファイル106aは、画像データを記憶する。ここで、画像データは、カラー画像データ、グレースケール画像データ、二値画像データ、または、入力画像データ等であってもよい。
また、制御部102は、画像処理装置100を統括的に制御するCPU、メニーコアCPU、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、および/または、FPGA(Field−Programmable Gate Array)等を含む有形のコントローラ、または、制御回路から構成されてもよい。
制御部102は、制御プログラムと各種の処理手順等を規定したプログラムと所要データとを格納するための内部メモリを有し、これらプログラムに基づいて種々の処理を実行するための情報処理を行う。
ここで、制御部102は、大別して、階層構造生成部102a、領域抽出部102b、補正部102c、画像取得部102d、および、画像表示部102eを備える。
階層構造生成部102aは、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、連結成分から構成される階層構造の階層構造データを生成する。
ここで、階層構造生成部102aは、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、全階調値の連結成分から構成される階層構造の階層構造データを生成してもよい。
ここで、全階調値は、32、64、128、または、256階調等における全ての階調値であってもよい。
また、階層構造生成部102aは、入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、階調幅に基づく階層構造の階層構造データを生成してもよい。
ここで、階調幅に基づく階層構造とは、例えば、256階調の場合、1階調毎の256階層構造等であってもよい。
領域抽出部102bは、階層構造データに基づいて、連結成分が、文字らしさの特徴を満たすか否かを判定し、文字らしさの特徴を満たす連結成分を文字らしい領域として抽出する。
ここで、領域抽出部102bは、階層構造データに基づいて、連結成分が、文字らしいシャープネス性を満たすか否かを判定し、文字らしいシャープネス性を満たす連結成分を文字らしい領域として抽出してもよい。
また、領域抽出部102bは、階層構造データに基づいて、連結成分が、文字らしいコントラストを満たすか否かを判定し、文字らしいコントラストを満たす連結成分を文字らしい領域として抽出してもよい。
また、領域抽出部102bは、階層構造データに基づいて、連結成分が、文字らしい面積を満たすか否かを判定し、文字らしい面積を満たす連結成分を文字らしい領域として抽出してもよい。
また、領域抽出部102bは、階層構造データに基づいて、連結成分の面積と当該連結成分に階層構造上で隣接する連結成分の面積との差を被除数とし、当該隣接する連結成分の面積を除数とした場合の商が、文字らしいシャープネス性の閾値を満たすか否かを判定し、商が文字らしいシャープネス性の閾値を満たすと判定した場合、連結成分を文字らしい領域として抽出してもよい。
また、領域抽出部102bは、階層構造データに基づいて、連結成分に含まれる画素の最大階調値と最小階調値との差が、文字らしいコントラストの閾値を満たすか否かを判定し、差が文字らしいコントラストの閾値を満たすと判定した場合、連結成分を文字らしい領域として抽出してもよい。
また、領域抽出部102bは、階層構造データに基づいて、連結成分の面積が、文字らしい面積の閾値を満たすか否かを判定し、連結成分の面積が文字らしい面積の閾値を満たすと判定した場合、連結成分を文字らしい領域として抽出してもよい。
補正部102cは、文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、文字らしい領域を二値化した補正領域を取得する。
ここで、補正部102cは、文字らしい領域に含まれる画素の最大階調値と最小階調値との差に、所定のパラメータを乗じた値を、文字らしい領域のみに用いる二値化の閾値として取得し、当該二値化の閾値に基づいて、文字らしい領域を二値化した補正領域を取得してもよい。
また、補正部102cは、文字らしい領域に含まれる、最小階調値の画素から最大階調値の画素までの面積の累積度数分布を作成し、累積度数分布において相対累積度数が所定の割合となる階調値を、文字らしい領域のみに用いる二値化の閾値として取得し、当該二値化の閾値に基づいて、文字らしい領域を二値化した補正領域を取得してもよい。
画像取得部102dは、画像データを取得する。ここで、画像取得部102dは、二値画像の二値画像データを取得してもよい。
また、画像取得部102dは、補正領域以外の入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、補正領域と背景領域とから構成される二値画像の二値画像データを取得してもよい。
また、画像取得部102dは、入力画像の入力画像データを取得してもよい。ここで、入力画像は、カラー画像、または、グレースケール画像等の多値画像であってもよい。また、画像取得部102dは、画像データを画像データファイル106aに格納してもよい。
画像表示部102eは、画像データを表示させる。ここで、画像表示部102eは、画像データを入出力部を介して表示させてもよい。
[本実施形態の処理]
上述した構成の画像処理装置100で実行される処理の一例について、図2から図22を参照して説明する。図2は、本実施形態の画像処理装置100における処理の一例を示すフローチャートである。
図2に示すように、まず、画像取得部102dは、画像データファイル106aに記憶された、多値画像である入力画像の入力画像データを取得する(ステップSA−1)。
ここで、図3を参照して、本実施形態における入力画像の一例について説明する。図3は、本実施形態における入力画像の一例を示す図である。
図3に示すように、本実施形態においては、例えば、11×11画素サイズの4階調値の画素から構成される多値画像を入力画像としてもよい。
図2に戻り、階層構造生成部102aは、入力画像において、階調値毎に、当該階調値以下の画素が隣接して連結した連結成分を特定し、全階調値の連結成分から構成される、階調幅に基づく階層構造の階層構造データを生成する(ステップSA−2)。
ここで、図4から図9を参照して、本実施形態における連結成分の一例について説明する。図4は、本実施形態における連結成分の階層構造の一例を示す図である。図5から図9は、本実施形態における連結成分の一例を示す図である。
図4に示すように、本実施形態においては、図3に示す256階調における4階調値(Level1−4)の画素から構成される入力画像における連結成分から、リンクとノードとを用いた階層構造(Connected Component Tree)の階層構造データを生成してもよい。
なお、図4において、0から255まで縦に並ぶ256個の丸は、各階調値を示している。
ここで、図4において、隣接した連結関係にない連結成分Cと連結成分Eと連結成分Fとは、256階調において、最大階調値が等しい関係にある。
また、図4に示すように、本実施形態においては、最大階調値が異なる連結成分について、階調値の順序に応じた包含関係、すなわち、隣接し連結関係にある最大階調値の高い連結成分が最大階調値の低い連結成分を包含する関係を表す階層構造データを生成してもよい。
すなわち、本実施形態において、階層構造上、親ノードに該当する連結成分は、子ノード、および/または、孫ノードの連結成分を含む関係にある。
例えば、図4に示すように、本実施形態においては、階層構造上、連結成分Bは、子ノードとなる連結成分Cおよび連結成分D、ならびに、孫ノードとなる連結成分Eを含む関係にある。
また、図4に示すように、本実施形態においては、256階調の入力画像の階調幅と同じ刻みとなる256階層の階層構造の階層構造データを生成してもよい。
このように、本実施形態においては、256階調等の刻みが細かい階層構造とすることで、連結成分の精密な切り分けが可能となる。
そして、図5に示すように、本実施形態においては、Level3以下の画素が隣接して連結した領域を、連結成分A(11×11画素の白背景画像:255階調値)の下位の階層となる連結成分Bと特定してもよい。
また、図6に示すように、本実施形態においては、Level2以下の画素が隣接して連結した領域を、連結成分Aの下位の階層となり、連結成分Bの下位の階層となる連結成分Cと特定してもよい。
また、図7に示すように、本実施形態においては、Level2以下の画素が隣接して連結した領域を、連結成分Aの下位の階層となり、連結成分Bの下位の階層となる連結成分Eと特定してもよい。
また、図8に示すように、本実施形態においては、Level2以下の画素が隣接して連結した領域を、連結成分Aの下位の階層となる連結成分Fと特定してもよい。なお、本実施形態において、連結成分Fは、画像中のノイズである。
また、図9に示すように、本実施形態においては、Level1以下の画素が隣接して連結した領域を、連結成分Aの下位の階層となり、連結成分Bの下位の階層となり、連結成分Cの下位の階層となる連結成分D(0階調値)と特定してもよい。
図2に戻り、領域抽出部102bは、階層構造データに基づいて、各階調値の連結成分が、文字らしさの特徴を満たすか否かを判定し、文字らしさの特徴を満たす連結成分を文字らしい領域として抽出する(ステップSA−3)。
ここで、図10を参照して、本実施形態における文字らしい領域抽出処理の一例について説明する。図10は、本実施形態の画像処理装置100における処理の一例を示すフローチャートである。
図10に示すように、まず、領域抽出部102bは、階層構造データに基づいて、各階調値の連結成分の面積と当該連結成分に階層構造上で隣接する連結成分の面積との差を被除数とし、当該隣接する連結成分の面積を除数とした場合の商が、文字らしいシャープネス性の閾値を満たすか否かを判定し、商が文字らしいシャープネス性の閾値を満たすと判定した場合、処理をステップSB−2に移行させる(ステップSB−1)。
ここで、本実施形態における文字らしいシャープネス性判定は、下記数式1に表される指標を用いてもよい。
例えば、図4の階層構造において、λ=level3である場合、数式1における画素値λに該当する領域とは、連結成分Bであってもよい。
そして、本実施形態においては、シャープネス性判定として、階層構造上の各ノード(連結成分)について、数式1に対する閾値を設定して判定することで、閾値以下の領域をシャープネス性を満たすノードとして抽出してもよい。
また、本実施形態においては、抽出されたノードについて、階層構造上接合関係にあるノード間について、最も上位層に該当するノードのみを抽出してもよい。
具体的には、本実施形態においては、数式1を用いて下記のように、閾値を0.4に設定し、閾値より小さいか否かを判定するシャープネス性判定を行ってもよい。
そして、領域抽出部102bは、階層構造データに基づいて、文字らしいシャープネス性の閾値を満たす連結成分に含まれる画素の最大階調値と最小階調値との差が、文字らしいコントラストの閾値を満たすか否かを判定し、差が文字らしいコントラストの閾値を満たすと判定した場合、処理をステップSB−3に移行させる(ステップSB−2)。
ここで、本実施形態における文字らしいコントラスト判定は、下記数式2に表されるように、抽出された連結成分毎の最大画素値と最小画素値との差を指標として用いてもよい。
具体的には、本実施形態においては、数式2を用いて下記のように、閾値を50に設定し、閾値より大きいか否かを判定するコントラスト判定を行ってもよい。
そして、領域抽出部102bは、階層構造データに基づいて、文字らしいコントラストの閾値を満たすと判定した連結成分の面積が、文字らしい面積の閾値を満たすか否かを判定し、連結成分の面積が文字らしい面積の閾値を満たすと判定した場合、連結成分を文字らしい領域として抽出し(ステップSB−3)、処理を終了する。
ここで、本実施形態における文字らしい面積判定は、下記数式3に表されるように、抽出された連結成分の面積を指標として用いてもよい。
具体的には、本実施形態においては、数式3を用いて下記のように、最小閾値を5、および、最大閾値を20000に設定し、閾値内におさまるか否かを判定する面積判定を行ってもよい。
なお、一般的な画像データにおいて、文字らしい領域は、文字らしいシャープネス性、文字らしいコントラスト(領域内の画素の階調値の最大値と最小値との差)、および、文字らしい領域の面積に関する特徴を有するため、本実施形態においては、文字らしい領域の抽出基準としてこれらの特徴を採用した。
図2に戻り、補正部102cは、文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、文字らしい領域を二値化した補正領域を取得する(ステップSA−4)。
ここで、図11から図14を参照して、本実施形態における文字認識性補正の一例について説明する。図11は、本実施形態における入力画像の一例を示す図である。図12は、本実施形態における文字らしい領域の一例を示す図である。図13は、本実施形態における補正領域の一例を示す図である。図14は、本実施形態における面積の累積度数分布に基づく閾値設定の一例を示すグラフである。
本実施形態においては、抽出した文字らしい領域について、文字認識性が向上するように補正をかけている。
例えば、本実施形態において、図11に示す明朝体フォントの「典」という文字の画像を入力画像とした場合、図12に示すように、文字らしい領域は、文字認識性が低い画像として抽出される。
そこで、本実施形態においては、文字認識性が低い文字らしい領域に対する補正を行うために、文字らしい領域内のみの情報に基づき、下記数式4を用いて二値化の閾値を算出してもよい。
そして、本実施形態においては、数式4を用いて算出された閾値により、図12に示す文字らしい領域の二値化を実施することにより、図13に示す補正領域を取得することで、文字認識性を向上させている。
ここで、本実施形態においては、数式4に示すratio=1.0の場合、図12に示す無補正の文字らしい領域が補正領域として取得される。
また、本実施形態においては、数式4に示すratio=0.75の場合、図13に示す補正領域が取得される。
また、本実施形態においては、パラメータに依存せずに、二値化の閾値を算出してもよい。
例えば、本実施形態においては、図12に示す文字らしい領域内の最小階調値の画素から最大階調値の画素までの面積の累積度数分布を算出し、図14に示すグラフを作成している。
ここで、各種フォントについて、文字らしい領域の面積は、文字認識性の高い補正領域の面積の2倍程度となるケースが多いため、図14に示すグラフにおいては、二値化の閾値を相対累積度数が50%(0.5)となる階調値に設定している。
この閾値を採用することにより、本実施形態においては、図12に示す文字らしい領域から、文字認識性が向上した補正領域を取得することができた。
図2に戻り、画像取得部102dは、補正領域以外の入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、補正領域と背景領域とから構成される二値画像の二値画像データを取得し(ステップSA−5)、処理を終了する。
ここで、画像表示部102eは、更に、画像取得部102dにより取得された二値画像データを入出力部を介して表示させ、ユーザに確認させてもよい。
このように、本実施形態においては、補正領域とそれ以外の領域とを二分する二値画像を生成する。
なお、本実施形態においては、補正領域が黒(例えば、グレースケールの場合、階調値:0)の場合、それ以外の領域を白(例えば、グレースケールの場合、階調値:255)として二値画像を生成し、補正領域が白の場合、それ以外の領域を黒として二値画像を生成する。
ここで、図15から図22を参照して、本実施形態における二値化処理の一例について説明する。図15、図17、図19および図21は、本実施形態における入力画像の一例を示す図である。図16、図18、図20および図22は、本実施形態における二値画像の一例を示す図である。
図15に示す画質劣化要因が生じていない画像に対して、本二値化処理を適用した場合、画質劣化要因が無いため、本実施形態においては、図16に示すように、高精度の二値画像を得ることができる。
そこで、図17に示すモバイルカメラで撮影された低コントラストの画質劣化要因が生じている画像に対して、本二値化処理を適用した場合であっても、本実施形態においては、図18に示すように、高精度の二値画像を得ることができる。
また、図19に示すモバイルカメラで撮影された輝度ムラの画質劣化要因が生じている画像に対して、本二値化処理を適用した場合であっても、本実施形態においては、図20に示すように、文字部分に関しては画質劣化要因が無い場合と同様の高精度の二値画像を得ることができる。
また、図21に示すモバイルカメラで撮影されたボケの画質劣化要因が生じている画像に対して、本二値化処理を適用した場合であっても、本実施形態においては、図22に示すように、文字領域が少し収縮(Erosion)しているものの、高精度の二値画像を得ることができる。
このように、本実施形態においては、各種画質劣化要因が生じている画像であっても、文字領域を大きく変化させずに、ロバストに文字領域のみ抽出し、二値化させることができる。
なお、特許文献1記載の発明により取得された二値画像データに対してOCR処理を行った場合、OCR精度が平均88%であったのに対し、本実施形態における二値化処理により取得された二値画像データに対してOCR処理を行った場合、OCR精度が平均98%まで向上した。
従来から、モバイルカメラデバイスの高解像度化により、カメラ画像データに対するOCRの実施が可能となっている。例えば、個人認証のために、本人確認カード(運転免許証、マイナンバーカード、および、在留カード等)を気軽にカメラスキャンし、OCRの実施がされている。
しかしながら、カメラ画像においては、スキャナ画像と異なり、被写体の撮影環境、および、デバイス起因の画質劣化要因(輝度ムラ、ノイズ、ボケ、または、低コントラスト等)が画像内に多分に含まれてしまうという問題があった。
これらの画質劣化要因により、従来の二値化手法による二値画像には、OCR誤認識の原因となる文字切れ、および、ノイズ等が生じてしまうため、高いOCR精度を達成することができなかった。
そこで、本実施形態においては、画素の階調値順序に応じた包含関係を表す連結成分の階層的データ構造から、前景である文字領域を抽出し、抽出された領域から二値画像を生成している。
すなわち、本実施形態においては、階調値毎に、当該階調値以上または以下の画素が隣接して連結関係にある、当該階調値以上または以下の画素を連結成分(Connected Component)として特定している。
そして、本実施形態においては、連結成分間の階調値の順序に応じた包含関係を表す領域の階層構造(Connected Component Tree)を表すデータを作成している。
そして、本実施形態においては、生成されたデータから、文字らしい領域を抽出し、抽出された文字らしい領域において、文字認識性を補正し、補正された領域とそれ以外の領域とを二分する二値画像を生成している。
なお、従来から、階層構造から文字らしい領域を抽出する技術は、存在していたが、文字らしい領域の抽出にとどまり、文字認識性、特に、光学的文字認識(OCR)において高精度に認識可能な形状となるような領域に補正する処理は存在しなかった。
一方、本実施形態においては、文字らしい領域を抽出した上で、文字認識性が向上するよう、抽出された文字らしい領域を補正することを実施している。
また、本実施形態においては、文字認識性を向上させた領域を二値画像として取得することで、多様な用途として使用することができるようにしている。
ここで、多様な用途として使用することができる画像データとしては、カラー画像データと比べてデータ容量の少ない画像データ、または、多くのOCRエンジンが読取に必要とするレベルの画像データ等であってもよい。
[他の実施形態]
さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
例えば、画像処理装置100は、スタンドアローンの形態で処理を行ってもよく、クライアント端末(画像処理装置100とは別筐体である)からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。
また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
このほか、明細書中および図面中で示した処理手順、制御手順、具体的名称、各処理の登録データもしくは検索条件等のパラメータを含む情報、画面例、または、データベース構成については、特記する場合を除いて任意に変更することができる。
また、画像処理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、画像処理装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPUおよび当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。
なお、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて画像処理装置100に機械的に読み取られる。すなわち、ROMまたはHDDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
また、このコンピュータプログラムは、画像処理装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、DVD、および、Blu−ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OSに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶部106に格納される各種のデータベース等は、RAMもしくはROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および/または、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および/または、ウェブページ用ファイル等を格納してもよい。
また、画像処理装置100は、既知のパーソナルコンピュータ等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、画像処理装置100は、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
以上のように、画像処理装置、画像処理方法、および、プログラムは、産業上の多くの分野、特に画像を扱う画像処理分野で実施することができ、極めて有用である。
100 画像処理装置
102 制御部
102a 階層構造生成部
102b 領域抽出部
102c 補正部
102d 画像取得部
102e 画像表示部
106 記憶部
106a 画像データファイル

Claims (13)

  1. 入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成手段と、
    前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出手段と、
    前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正手段と、
    前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する画像取得手段と、
    を備えたことを特徴とする、画像処理装置。
  2. 前記階層構造生成手段は、
    前記入力画像において、前記階調値毎に、当該階調値以上または以下の画素が隣接して連結した前記連結成分を特定し、全階調値の前記連結成分から構成される前記階層構造の前記階層構造データを生成する、請求項1に記載の画像処理装置。
  3. 前記階層構造生成手段は、
    前記入力画像において、前記階調値毎に、当該階調値以上または以下の画素が隣接して連結した前記連結成分を特定し、階調幅に基づく前記階層構造の前記階層構造データを生成する、請求項1または2に記載の画像処理装置。
  4. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分が、文字らしいシャープネス性を満たすか否かを判定し、前記文字らしいシャープネス性を満たす前記連結成分を前記文字らしい領域として抽出する、請求項1から3のいずれか一つに記載の画像処理装置。
  5. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分が、文字らしいコントラストを満たすか否かを判定し、前記文字らしいコントラストを満たす前記連結成分を前記文字らしい領域として抽出する、請求項1から3のいずれか一つに記載の画像処理装置。
  6. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分が、文字らしい面積を満たすか否かを判定し、前記文字らしい面積を満たす前記連結成分を前記文字らしい領域として抽出する、請求項1から3のいずれか一つに記載の画像処理装置。
  7. 前記補正手段は、
    前記文字らしい領域に含まれる画素の最大階調値と最小階調値との差に、所定のパラメータを乗じた値を、前記文字らしい領域のみに用いる二値化の閾値として取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する、請求項1から6のいずれか一つに記載の画像処理装置。
  8. 前記補正手段は、
    前記文字らしい領域に含まれる、前記最小階調値の画素から前記最大階調値の画素までの面積の累積度数分布を作成し、前記累積度数分布において相対累積度数が所定の割合となる階調値を、前記文字らしい領域のみに用いる二値化の閾値として取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する、請求項1から6のいずれか一つに記載の画像処理装置。
  9. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分の面積と当該連結成分に前記階層構造上で隣接する連結成分の面積との差を被除数とし、当該隣接する連結成分の面積を除数とした場合の商が、前記文字らしいシャープネス性の閾値を満たすか否かを判定し、前記商が前記文字らしいシャープネス性の閾値を満たすと判定した場合、前記連結成分を前記文字らしい領域として抽出する、請求項4に記載の画像処理装置。
  10. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分に含まれる画素の最大階調値と最小階調値との差が、前記文字らしいコントラストの閾値を満たすか否かを判定し、前記差が前記文字らしいコントラストの閾値を満たすと判定した場合、前記連結成分を前記文字らしい領域として抽出する、請求項5に記載の画像処理装置。
  11. 前記領域抽出手段は、
    前記階層構造データに基づいて、前記連結成分の面積が、前記文字らしい面積の閾値を満たすか否かを判定し、前記連結成分の面積が前記文字らしい面積の閾値を満たすと判定した場合、前記連結成分を前記文字らしい領域として抽出する、請求項6に記載の画像処理装置。
  12. 入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成ステップと、
    前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出ステップと、
    前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正ステップと、
    前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する二値画像取得ステップと、
    を含むことを特徴とする、画像処理方法。
  13. 入力画像において、階調値毎に、当該階調値以上または以下の画素が隣接して連結した連結成分を特定し、前記連結成分から構成される階層構造の階層構造データを生成する階層構造生成ステップと、
    前記階層構造データに基づいて、前記連結成分が、文字らしさの特徴を満たすか否かを判定し、前記文字らしさの特徴を満たす前記連結成分を文字らしい領域として抽出する領域抽出ステップと、
    前記文字らしい領域に含まれる画素の最大階調値と最小階調値とに基づいて、前記文字らしい領域のみに用いる二値化の閾値を取得し、当該二値化の閾値に基づいて、前記文字らしい領域を二値化した補正領域を取得する補正ステップと、
    前記補正領域以外の前記入力画像中の領域に含まれる画素の階調値を背景となる階調値に変更した背景領域を取得し、前記補正領域と前記背景領域とから構成される二値画像の二値画像データを取得する二値画像取得ステップと、
    をコンピュータに実行させるためのプログラム。
JP2016157937A 2016-08-10 2016-08-10 画像処理装置、画像処理方法、および、プログラム Active JP6173542B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016157937A JP6173542B1 (ja) 2016-08-10 2016-08-10 画像処理装置、画像処理方法、および、プログラム
US15/355,047 US10049291B2 (en) 2016-08-10 2016-11-17 Image-processing apparatus, image-processing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016157937A JP6173542B1 (ja) 2016-08-10 2016-08-10 画像処理装置、画像処理方法、および、プログラム

Publications (2)

Publication Number Publication Date
JP6173542B1 true JP6173542B1 (ja) 2017-08-02
JP2018026005A JP2018026005A (ja) 2018-02-15

Family

ID=59505151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016157937A Active JP6173542B1 (ja) 2016-08-10 2016-08-10 画像処理装置、画像処理方法、および、プログラム

Country Status (2)

Country Link
US (1) US10049291B2 (ja)
JP (1) JP6173542B1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165187B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) * 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN110119741B (zh) * 2019-04-08 2022-09-27 浙江大学宁波理工学院 一种有背景的卡证图像信息识别方法
CN110490204B (zh) * 2019-07-11 2022-07-15 深圳怡化电脑股份有限公司 图像处理方法、图像处理装置及终端
CN110596746B (zh) * 2019-10-17 2024-03-01 中国测试技术研究院辐射研究所 使用剂量当量仪自动测试/校准/检定装置的方法
EP3843038B1 (en) * 2019-12-23 2023-09-20 HTC Corporation Image processing method and system
CN111557692B (zh) * 2020-04-26 2022-11-22 深圳华声医疗技术股份有限公司 目标器官组织的自动测量方法、超声测量装置及介质
CN112147047A (zh) * 2020-10-26 2020-12-29 浙江四点灵机器人股份有限公司 一种高速流体内颗粒浓度检测装置及方法
CN116033273A (zh) * 2022-12-15 2023-04-28 杭州海康慧影科技有限公司 消除激光分层的图像处理方法、系统及装置
CN117292136B (zh) * 2023-11-22 2024-04-12 江苏圣点世纪科技有限公司 一种静脉图像二值化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187495A (ja) * 1992-06-08 1994-07-08 Nec Corp 自動二値化装置
JP2001291056A (ja) * 2000-04-05 2001-10-19 Fujitsu Ltd 文書画像認識装置及び記録媒体
JP2002112044A (ja) * 2000-09-28 2002-04-12 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2016151978A (ja) * 2015-02-19 2016-08-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6157738A (en) * 1996-06-17 2000-12-05 Canon Kabushiki Kaisha System for extracting attached text
US6512848B2 (en) * 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
JP3886727B2 (ja) * 1999-02-25 2007-02-28 富士通株式会社 画像処理装置
US6757081B1 (en) * 2000-04-07 2004-06-29 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing and image and for controlling a scanner
US7672022B1 (en) * 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
WO2006066325A1 (en) * 2004-12-21 2006-06-29 Canon Kabushiki Kaisha Segmenting digital image and producing compact representation
WO2009137073A1 (en) * 2008-05-06 2009-11-12 Compulink Management Center, Inc. Camera-based document imaging
US8351691B2 (en) * 2008-12-18 2013-01-08 Canon Kabushiki Kaisha Object extraction in colour compound documents
US8254694B2 (en) * 2009-06-08 2012-08-28 Xerox Corporation Thin line detection in scanned image data
JP5455038B2 (ja) * 2009-12-28 2014-03-26 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
AU2010257298B2 (en) * 2010-12-17 2014-01-23 Canon Kabushiki Kaisha Finding text regions from coloured image independent of colours
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
TW201437925A (zh) * 2012-12-28 2014-10-01 Nec Corp 物體識別裝置、方法及電腦程式產品
US8965129B2 (en) * 2013-03-15 2015-02-24 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
JP6128683B2 (ja) 2013-07-26 2017-05-17 富士通株式会社 文字認識装置および文字認識方法並びに文字認識プログラム
US9274693B2 (en) * 2013-10-16 2016-03-01 3M Innovative Properties Company Editing digital notes representing physical notes
US9639755B2 (en) * 2013-12-03 2017-05-02 Digitalglobe, Inc. Automated compound structure characterization in overhead imagery

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187495A (ja) * 1992-06-08 1994-07-08 Nec Corp 自動二値化装置
JP2001291056A (ja) * 2000-04-05 2001-10-19 Fujitsu Ltd 文書画像認識装置及び記録媒体
JP2002112044A (ja) * 2000-09-28 2002-04-12 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2016151978A (ja) * 2015-02-19 2016-08-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
US10049291B2 (en) 2018-08-14
JP2018026005A (ja) 2018-02-15
US20180046876A1 (en) 2018-02-15

Similar Documents

Publication Publication Date Title
JP6173542B1 (ja) 画像処理装置、画像処理方法、および、プログラム
US20210209359A1 (en) Image processing apparatus, control method for image processing apparatus, and non-transitory storage medium
JP2015232869A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US9158987B2 (en) Image processing device that separates image into plural regions
JP6122988B1 (ja) 画像処理装置、画像処理方法、および、プログラム
JP2015115954A (ja) 文書画像処理装置及び方法
JP6115545B2 (ja) 画像処理装置及び画像処理方法
JP2005012768A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP6370080B2 (ja) 画像処理装置、画像処理方法及びプログラム。
JP2015060315A (ja) 代表色抽出装置、代表色抽出方法、プログラムおよび記録媒体
US10412265B2 (en) Information processing apparatus that displays a prompt to move the apparatus and information processing method
JPWO2011033744A1 (ja) 画像処理装置、画像処理方法および画像処理用プログラム
JP2012156839A (ja) 像域分離方法、それを実行させるためのプログラム及び像域分離装置
US20130083377A1 (en) Image processing apparatus and image processing method
JP6091400B2 (ja) 画像処理装置
JP2017169162A (ja) 画像読取装置、及び画像処理方法
JP6375778B2 (ja) 画像処理方法および画像処理装置
JP5862370B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5046119B2 (ja) プログラム、画像間変化箇所判読支援動画生成方法、及び画像間変化箇所判読支援動画生成装置
JP6442846B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP5589825B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP4829757B2 (ja) 罫線抽出装置および方法
JP6233842B2 (ja) 情報端末装置、方法及びプログラム
JP6194677B2 (ja) 画像処理装置およびプログラム
JP2007081794A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170704

R150 Certificate of patent or registration of utility model

Ref document number: 6173542

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150