JP2016057786A - 電子文書生成装置、プログラムおよび電子文書生成システム - Google Patents
電子文書生成装置、プログラムおよび電子文書生成システム Download PDFInfo
- Publication number
- JP2016057786A JP2016057786A JP2014182664A JP2014182664A JP2016057786A JP 2016057786 A JP2016057786 A JP 2016057786A JP 2014182664 A JP2014182664 A JP 2014182664A JP 2014182664 A JP2014182664 A JP 2014182664A JP 2016057786 A JP2016057786 A JP 2016057786A
- Authority
- JP
- Japan
- Prior art keywords
- image
- recognition
- processing
- cloud server
- electronic document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00236—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer
- H04N1/00241—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer using an image reading device as a local input to a computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/0034—Details of the connection, e.g. connector, interface
- H04N2201/0037—Topological details of the connection
- H04N2201/0039—Connection via a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】電子文書生成装置は、OCR処理の処理対象画像内の各単位認識領域(1行よりも大きな領域をそれぞれ含み得る領域)に対する文字認識結果の末尾にそれぞれ区切りコードを付加したOCR処理結果を生成するクラウドサーバ、と連携して電子文書を生成する。電子文書生成装置は、スキャン画像内の各行領域がそれぞれ単位認識領域としてクラウドサーバにより判定されるように、画像加工処理(例えば各行領域の相互間の離間間隔を最大高さH1以上の大きさにそれぞれ設定する処理)を施して認識対象画像500を生成する。電子文書生成装置は、認識対象画像500をクラウドサーバに送信し、クラウドサーバからのOCR処理結果内の区切りコードに基づき各行領域に対する文字認識結果を当該各行領域にそれぞれ配置して電子文書を生成する。
【選択図】図8
Description
<1−1.構成概要>
図1は、本発明に係る画像形成システム1を示す図である。図1に示すように、画像形成システム1は、画像形成装置10と外部端末50とクラウドサーバ90とを備える。
図2は、画像形成装置10の機能ブロックを示す図である。ここでは、画像形成装置10として、MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))を例示する。
次に外部端末50の構成について説明する。
この画像形成システム1において、上述のように、外部端末50は、スキャン画像200に対して「画像加工処理」を施して認識対象画像500を生成し、当該認識対象画像500をクラウドサーバ90に送信する。
まず、ユーザは、スキャン対象の原稿をMFP10の原稿台(たとえば、自動給紙装置(ADF:Auto Document Feeder )あるいは原稿載置用ガラス面等)に載置し、外部端末50の操作画面において電子文書600(601)の生成指示を外部端末50に付与する。外部端末50は、当該生成指示を受け付けると、当該生成指示に基づくスキャン画像生成指示をMFP10に転送する。
図4は、電子文書生成システム1における動作例を示すタイミングチャートである。外部端末50(およびクラウドサーバ90)は、MFP10からのスキャン画像200(201)を受信すると、図4に示すような処理を実行する。
第2実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
第3実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
第4実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
第5実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
第6実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
上記各実施形態では、クラウドサーバ90によって単位認識領域の判定に用いられる判定手法(たとえば、行領域間の離間間隔に基づいて単位認識領域を判定する手法)が外部端末50のプログラムの設計者等に知られていることを前提として、スキャン画像200に対して当該判定手法に応じた画像加工処理が施される態様を例示した。
第7実施形態では、外部端末50が、クラウドサーバ90によって単位認識領域の判定に用いられる判定手法を知得していない場合に、クラウドサーバ90に問い合わせることによって当該判定手法を知得し、当該判定手法に応じた画像加工処理を施す態様を例示した。
以上、この発明の実施の形態について説明したが、この発明は上記内容のものに限定されるものではない。
10 MFP(画像形成装置)
50 外部端末
90 クラウドサーバ
200,201 スキャン画像
400〜407 行領域
430〜436 末尾識別画像
451〜457 文字列データ
500〜506,511,541 認識対象画像
530〜533 テスト画像
570〜573 テスト結果
550,551,581 テキストデータ
600,601 電子文書
Claims (25)
- 光学文字認識処理の処理対象画像内の文字領域を、1行の行領域よりも大きな領域をそれぞれ含み得る複数の単位認識領域に区分するとともに当該複数の単位認識領域のそれぞれに対して前記光学文字認識処理を実行するクラウドサーバであって、前記複数の単位認識領域のそれぞれに対する文字認識結果を含むとともに各単位認識領域に対する文字認識結果の末尾にそれぞれ区切りコードを付加したテキストデータを、前記処理対象画像に対する前記光学文字認識処理の処理結果として生成するクラウドサーバ、と連携して電子文書を生成する電子文書生成装置であって、
原稿のスキャン画像の文字領域から複数の行領域をそれぞれ抽出する抽出手段と、
前記複数の行領域のそれぞれが単位認識領域として前記クラウドサーバにより判定されるように、前記スキャン画像に対して画像加工処理を施して認識対象画像を生成する画像生成手段と、
前記認識対象画像を前記光学文字認識処理の前記処理対象画像として前記クラウドサーバに送信する送信手段と、
前記認識対象画像に対する前記光学文字認識処理の処理結果である前記テキストデータを前記クラウドサーバから受信する受信手段と、
前記テキストデータに含まれる前記区切りコードに基づき前記テキストデータを複数の文字列データに区分するとともに前記複数の行領域と前記複数の文字列データとの対応関係を決定し、各文字列データに対応する各行領域に当該各文字列データをそれぞれ配置して前記電子文書を生成する文書生成手段と、
を備えることを特徴とする電子文書生成装置。 - 請求項1に記載の電子文書生成装置であって、
前記複数の行領域の前記スキャン画像内における位置をそれぞれ検出する検出手段、
をさらに備え、
前記文書生成手段は、前記各文字列データに対応する前記各行領域の検出位置に前記各文字列データをそれぞれ配置して前記電子文書を生成することを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、前記複数の行領域のそれぞれの高さを検出し、前記複数の行領域の相互間の離間間隔を前記複数の行領域のうち最も高い行領域の高さ以上の大きさにそれぞれ設定する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、前記複数の行領域のそれぞれの高さを検出し、前記複数の行領域のうち最終行以外の各行領域と当該各行領域のそれぞれの次の行領域との相互間の離間間隔を、前記各行領域のそれぞれの高さ以上の大きさにそれぞれ設定する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、前記複数の行領域の相互間の行間領域に区切線をそれぞれ付加する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、前記複数の行領域のうち少なくとも最終行以外の各行領域のそれぞれの末尾に、前記単位認識領域の末尾であることを示す末尾識別画像を付加する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、各行領域の文字色を、前記各行領域にそれぞれ隣接する隣接行領域の文字色とは異なる文字色に設定する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、各行領域の行頭位置を、前記各行領域にそれぞれ隣接する隣接行領域の行頭位置とは異なる位置に設定する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像加工処理は、各行領域の文字サイズを、前記各行領域にそれぞれ隣接する隣接行領域の文字サイズとは異なる文字サイズに設定する処理を含むことを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記送信手段は、前記クラウドサーバによって前記単位認識領域の判定に用いられる判定手法を、前記認識対象画像の生成に先立って前記クラウドサーバに問い合わせ、
前記受信手段は、前記判定手法に関する情報を前記クラウドサーバから受信し、
前記画像生成手段は、前記判定手法に応じた画像加工処理を前記スキャン画像に対して施して前記認識対象画像を生成することを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記画像生成手段は、互いに異なる複数の画像加工処理がそれぞれ施された互いに異なる複数のテスト画像であって前記複数の行領域のうち一部の行領域をそれぞれ含む複数のテスト画像を生成し、
前記送信手段は、前記複数のテスト画像を前記クラウドサーバに送信し、
前記受信手段は、前記複数のテスト画像に対してそれぞれ実行された前記光学文字認識処理の処理結果である複数のテスト結果を前記クラウドサーバから受信し、
前記画像生成手段は、
前記複数のテスト結果のそれぞれに含まれる区切りコードに基づいて、前記複数のテスト結果のそれぞれに含まれる文字列データの個数である文字列データ数を検出し、
前記複数のテスト結果のそれぞれについてその文字列データ数と前記一部の行領域の個数との差である個数差を求めるとともに、前記複数のテスト結果のうち、前記個数差が最も小さいテスト結果を最良テスト結果として求め、前記複数の画像加工処理のうち、前記最良テスト結果に対応する画像加工処理を最適加工処理として決定し、
前記複数の行領域のうち前記一部の行領域を除く残余の行領域に関して前記最適加工処理を施して前記認識対象画像を生成し、
前記文書生成手段は、前記最良テスト結果に含まれる区切りコードと前記テキストデータに含まれる区切りコードとに基づき、前記最良テスト結果と前記テキストデータとで構成されるデータを複数の文字列データに区分するとともに、前記複数の行領域と前記複数の文字列データとの対応関係を決定し、各文字列データに対応する各行領域に当該各文字列データをそれぞれ配置して前記電子文書を生成することを特徴とする電子文書生成装置。 - 請求項1または請求項2に記載の電子文書生成装置において、
前記送信手段は、サンプル画像に対して互いに異なる複数の画像加工処理をそれぞれ施して生成された複数のテスト画像を前記クラウドサーバに送信し、
前記受信手段は、前記複数のテスト画像に対してそれぞれ実行された前記光学文字認識処理の処理結果である複数のテスト結果を前記クラウドサーバから受信し、
前記画像生成手段は、
前記複数のテスト結果のそれぞれに含まれる区切りコードに基づいて、前記複数のテスト結果のそれぞれに含まれる文字列データの個数である文字列データ数を検出し、
前記複数のテスト結果のそれぞれについてその文字列データ数と前記サンプル画像に含まれる行領域の個数との差である個数差を求めるとともに、前記複数のテスト結果のうち、前記個数差が最も小さいテスト結果を最良テスト結果として求め、前記複数の画像加工処理のうち、前記最良テスト結果に対応する画像加工処理を最適加工処理として決定し、
前記スキャン画像に対して前記最適加工処理を施して前記認識対象画像を生成することを特徴とする電子文書生成装置。 - 光学文字認識処理の処理対象画像内の文字領域を、1行の行領域よりも大きな領域をそれぞれ含み得る複数の単位認識領域に区分するとともに当該複数の単位認識領域のそれぞれに対して前記光学文字認識処理を実行するクラウドサーバであって、前記複数の単位認識領域のそれぞれに対する文字認識結果を含むとともに各単位認識領域に対する文字認識結果の末尾にそれぞれ区切りコードを付加したテキストデータを、前記処理対象画像に対する前記光学文字認識処理の処理結果として生成するクラウドサーバ、と連携して電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
a)原稿のスキャン画像の文字領域から複数の行領域をそれぞれ抽出するステップと、
b)前記複数の行領域のそれぞれが単位認識領域として前記クラウドサーバにより判定されるように、前記スキャン画像に対して画像加工処理を施して認識対象画像を生成するステップと、
c)前記認識対象画像を前記光学文字認識処理の前記処理対象画像として前記クラウドサーバに送信するステップと、
d)前記認識対象画像に対する前記光学文字認識処理の処理結果である前記テキストデータを前記クラウドサーバから受信するステップと、
e)前記テキストデータに含まれる前記区切りコードに基づき前記テキストデータを複数の文字列データに区分するとともに前記複数の行領域と前記複数の文字列データとの対応関係を決定するステップと、
f)各文字列データに対応する各行領域に当該各文字列データをそれぞれ配置して前記電子文書を生成するステップと、
を実行させるためのプログラム。 - 請求項13に記載のプログラムにおいて、
前記コンピュータに、
g)前記複数の行領域の前記スキャン画像内における位置をそれぞれ検出するステップ、
をさらに実行させ、
前記ステップf)においては、前記ステップg)での検出位置に基づき、前記各文字列データに対応する前記各行領域の検出位置に前記各文字列データがそれぞれ配置されて、前記電子文書が生成されることを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、前記複数の行領域のそれぞれの高さを検出し、前記複数の行領域の相互間の離間間隔を前記複数の行領域のうち最も高い行領域の高さ以上の大きさにそれぞれ設定する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、前記複数の行領域のそれぞれの高さを検出し、前記複数の行領域のうち最終行以外の各行領域と当該各行領域のそれぞれの次の行領域との相互間の離間間隔を、前記各行領域のそれぞれの高さ以上の大きさにそれぞれ設定する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、前記複数の行領域の相互間の行間領域に区切線をそれぞれ付加する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、前記複数の行領域のうち少なくとも最終行以外の各行領域のそれぞれの末尾に、前記単位認識領域の末尾であることを示す末尾識別画像を付加する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、各行領域の文字色を、前記各行領域にそれぞれ隣接する隣接行領域の文字色とは異なる文字色に設定する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、各行領域の行頭位置を、前記各行領域にそれぞれ隣接する隣接行領域の行頭位置とは異なる位置に設定する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記画像加工処理は、各行領域の文字サイズを、前記各行領域にそれぞれ隣接する隣接行領域の文字サイズとは異なる文字サイズに設定する処理を含むことを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記コンピュータに、
h)前記クラウドサーバによって前記単位認識領域の判定に用いられる判定手法を、前記ステップb)に先立って前記クラウドサーバに問い合わせるステップと、
i)前記判定手法に関する情報を前記クラウドサーバから受信するステップと、
をさらに実行させ、
前記ステップb)においては、前記判定手法に応じた画像加工処理が前記スキャン画像に対して施されて前記認識対象画像が生成されることを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記コンピュータに、
h)前記ステップb)に先立って、互いに異なる複数の画像加工処理がそれぞれ施された互いに異なる複数のテスト画像であって前記複数の行領域のうち一部の行領域をそれぞれ含む複数のテスト画像を生成するステップと、
i)前記複数のテスト画像を前記クラウドサーバに送信するステップと、
j)前記複数のテスト画像に対してそれぞれ実行された前記光学文字認識処理の処理結果である複数のテスト結果を前記クラウドサーバから受信するステップと、
k)前記クラウドサーバから受信した前記複数のテスト結果のそれぞれに含まれる区切りコードに基づいて、前記複数のテスト結果のそれぞれに含まれる文字列データの個数である文字列データ数を検出するステップと、
l)前記複数のテスト結果のそれぞれについてその文字列データ数と前記一部の行領域の個数との差である個数差を求めるとともに、前記複数のテスト結果のうち、前記個数差が最も小さいテスト結果を最良テスト結果として求め、前記複数の画像加工処理のうち、前記最良テスト結果に対応する画像加工処理を最適加工処理として決定するステップと、
をさらに実行させ、
前記ステップb)においては、前記複数の行領域のうち前記一部の行領域を除く残余の行領域に関して前記最適加工処理が施されて前記認識対象画像が生成され、
前記ステップe)においては、前記最良テスト結果に含まれる区切りコードと前記テキストデータに含まれる区切りコードとに基づき、前記最良テスト結果と前記テキストデータとで構成されるデータが複数の文字列データに区分されるとともに、前記複数の行領域と前記複数の文字列データとの対応関係が決定されることを特徴とするプログラム。 - 請求項13または請求項14に記載のプログラムにおいて、
前記コンピュータに、
h)前記ステップb)に先立って、サンプル画像に対して互いに異なる複数の画像加工処理をそれぞれ施して生成された複数のテスト画像を前記クラウドサーバに送信するステップと、
i)前記複数のテスト画像に対してそれぞれ実行された前記光学文字認識処理の処理結果である複数のテスト結果を前記クラウドサーバから受信するステップと、
j)前記クラウドサーバから受信した前記複数のテスト結果のそれぞれに含まれる区切りコードに基づいて、前記複数のテスト結果のそれぞれに含まれる文字列データの個数である文字列データ数を検出するステップと、
k)前記複数のテスト結果のそれぞれについてその文字列データ数と前記サンプル画像に含まれる行領域の個数との差である個数差を求めるとともに、前記複数のテスト結果のうち、前記個数差が最も小さいテスト結果を最良テスト結果として求め、前記複数の画像加工処理のうち、前記最良テスト結果に対応する画像加工処理を最適加工処理として決定するステップと、
をさらに実行させ、
前記ステップb)においては、前記スキャン画像に対して前記最適加工処理が施されて前記認識対象画像が生成されることを特徴とするプログラム。 - 電子文書生成システムであって、
原稿のスキャン画像を生成する画像形成装置と、
クラウドサーバと連携し、前記スキャン画像に基づく電子文書を生成する電子文書生成装置と、
を備え、
前記クラウドサーバは、
光学文字認識処理の処理対象画像内の文字領域を、1行の行領域よりも大きな領域をそれぞれ含み得る複数の単位認識領域に区分するとともに当該複数の単位認識領域のそれぞれに対して前記光学文字認識処理を実行し、
前記複数の単位認識領域のそれぞれに対する文字認識結果を含むとともに各単位認識領域に対する文字認識結果の末尾にそれぞれ区切りコードを付加したテキストデータを、前記処理対象画像に対する前記光学文字認識処理の処理結果として生成し、
前記画像形成装置は、
前記スキャン画像を前記電子文書生成装置に送信する通信手段、
を有し、
前記電子文書生成装置は、
前記画像形成装置から受信した前記スキャン画像の文字領域から複数の行領域をそれぞれ抽出する抽出手段と、
前記複数の行領域のそれぞれが単位認識領域として前記クラウドサーバにより判定されるように、前記スキャン画像に対して画像加工処理を施して認識対象画像を生成する画像生成手段と、
前記認識対象画像を前記光学文字認識処理の前記処理対象画像として前記クラウドサーバに送信する送信手段と、
前記認識対象画像に対する前記光学文字認識処理の処理結果である前記テキストデータを前記クラウドサーバから受信する受信手段と、
前記テキストデータに含まれる前記区切りコードに基づき前記テキストデータを複数の文字列データに区分するとともに前記複数の行領域と前記複数の文字列データとの対応関係を決定し、各文字列データに対応する各行領域に当該各文字列データをそれぞれ配置して前記電子文書を生成する文書生成手段と、
を有することを特徴とする電子文書生成システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182664A JP6090269B2 (ja) | 2014-09-08 | 2014-09-08 | 電子文書生成装置、プログラムおよび電子文書生成システム |
CN201510562906.7A CN105407245B (zh) | 2014-09-08 | 2015-09-07 | 电子文件生成装置及其控制方法、电子文件生成系统 |
US14/847,611 US9485368B2 (en) | 2014-09-08 | 2015-09-08 | Electronic document generation apparatus, recording medium, and electronic document generation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182664A JP6090269B2 (ja) | 2014-09-08 | 2014-09-08 | 電子文書生成装置、プログラムおよび電子文書生成システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016057786A true JP2016057786A (ja) | 2016-04-21 |
JP6090269B2 JP6090269B2 (ja) | 2017-03-08 |
Family
ID=55438676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014182664A Active JP6090269B2 (ja) | 2014-09-08 | 2014-09-08 | 電子文書生成装置、プログラムおよび電子文書生成システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9485368B2 (ja) |
JP (1) | JP6090269B2 (ja) |
CN (1) | CN105407245B (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9544466B2 (en) * | 2014-10-09 | 2017-01-10 | Xerox Corporation | Security compliance checking of documents |
CN104793813B (zh) * | 2015-04-29 | 2017-12-08 | 京东方科技集团股份有限公司 | 一种显示基板、显示装置及遥控系统 |
JP6658078B2 (ja) * | 2016-02-25 | 2020-03-04 | ブラザー工業株式会社 | 画像処理装置、コンピュータプログラム、および、システム |
CN106485246B (zh) * | 2016-09-19 | 2019-07-16 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
JP6891073B2 (ja) * | 2017-08-22 | 2021-06-18 | キヤノン株式会社 | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム |
JP6992475B2 (ja) * | 2017-12-14 | 2022-01-13 | オムロン株式会社 | 情報処理装置、識別システム、設定方法及びプログラム |
JP6983675B2 (ja) * | 2018-01-23 | 2021-12-17 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム |
CN110321887B (zh) * | 2018-03-30 | 2023-09-19 | 佳能株式会社 | 文档图像处理方法、文档图像处理装置及存储介质 |
US11017498B2 (en) | 2019-03-14 | 2021-05-25 | International Business Machines Corporation | Ground truth generation from scanned documents |
JP7558644B2 (ja) * | 2019-03-29 | 2024-10-01 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
JP7225017B2 (ja) * | 2019-04-19 | 2023-02-20 | キヤノン株式会社 | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム |
US20220301326A1 (en) * | 2021-03-19 | 2022-09-22 | Kyocera Document Solutions Inc. | Ocr target area position acquisition system, computer-readable non-transitory recording medium storing ocr target area position acquisition program, hard copy, hard copy generation system, and computer-readable non-transitory recording medium storing hard copy generation program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981671A (ja) * | 1995-09-13 | 1997-03-28 | Toshiba Corp | 文字コード取得装置 |
JP2009098777A (ja) * | 2007-10-15 | 2009-05-07 | Fuji Xerox Co Ltd | データ処理装置及びデータ処理プログラム |
JP2013236234A (ja) * | 2012-05-08 | 2013-11-21 | Ricoh Co Ltd | 画像処理装置、画像処理システム及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612403A (ja) * | 1992-06-25 | 1994-01-21 | Ricoh Co Ltd | 入力装置 |
JP4070693B2 (ja) * | 2002-09-13 | 2008-04-02 | 株式会社リコー | 画像形成装置およびスキャンデータ処理方法 |
US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
JP2006012027A (ja) * | 2004-06-29 | 2006-01-12 | Seiko Epson Corp | 光学読取装置、認識処理装置、文字読取方法及びプログラム、並びに磁気インク文字読取装置、及びpos端末装置 |
JP2009048293A (ja) | 2007-08-15 | 2009-03-05 | Fuji Xerox Co Ltd | 情報処理システム、情報処理実行プログラム及び画像処理装置 |
CN101751567B (zh) * | 2008-12-12 | 2012-10-17 | 汉王科技股份有限公司 | 快速文本识别方法 |
JP2012073749A (ja) * | 2010-09-28 | 2012-04-12 | Kyocera Mita Corp | 画像形成装置及び画像形成プログラム |
US8996351B2 (en) * | 2011-08-24 | 2015-03-31 | Ricoh Company, Ltd. | Cloud-based translation service for multi-function peripheral |
-
2014
- 2014-09-08 JP JP2014182664A patent/JP6090269B2/ja active Active
-
2015
- 2015-09-07 CN CN201510562906.7A patent/CN105407245B/zh active Active
- 2015-09-08 US US14/847,611 patent/US9485368B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981671A (ja) * | 1995-09-13 | 1997-03-28 | Toshiba Corp | 文字コード取得装置 |
JP2009098777A (ja) * | 2007-10-15 | 2009-05-07 | Fuji Xerox Co Ltd | データ処理装置及びデータ処理プログラム |
JP2013236234A (ja) * | 2012-05-08 | 2013-11-21 | Ricoh Co Ltd | 画像処理装置、画像処理システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6090269B2 (ja) | 2017-03-08 |
CN105407245B (zh) | 2018-05-15 |
US9485368B2 (en) | 2016-11-01 |
US20160072968A1 (en) | 2016-03-10 |
CN105407245A (zh) | 2016-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6090269B2 (ja) | 電子文書生成装置、プログラムおよび電子文書生成システム | |
JP6107756B2 (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
JP2016021086A (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
JP6066108B2 (ja) | 電子文書生成システムおよびプログラム | |
JP2015043158A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US20160277627A1 (en) | Information processing apparatus and information processing system | |
JP2019159633A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US8867050B2 (en) | Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages | |
JP6249240B2 (ja) | 画像処理装置 | |
JP5983673B2 (ja) | 電子文書生成システム、画像形成装置およびプログラム | |
JP2013041496A (ja) | カラー二次元バーコード生成装置、カラー二次元バーコード読取装置、カラー二次元バーコード生成方法、カラー二次元バーコード読取方法、およびコンピュータープログラム | |
JP6879131B2 (ja) | スキャンシステム、情報処理装置、及び、スキャナドライバ | |
JP6458351B2 (ja) | 電子文書生成システム、画像形成装置、通信端末およびプログラム | |
US20150093031A1 (en) | Image determining apparatus, image processing system, and recording medium | |
JP6418180B2 (ja) | 画像送信装置 | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP2013074314A (ja) | 画像処理方法、画像読取装置、および画像処理プログラム | |
JP2017103616A (ja) | 画像形成装置およびプログラム | |
JP2016225701A (ja) | 画像処理装置及び画像処理方法 | |
JP6537021B2 (ja) | 画像読取装置 | |
CN105592244B (zh) | 图像处理装置 | |
JP2016091190A (ja) | 電子文書生成装置、プログラムおよび電子文書生成システム | |
JP6413450B2 (ja) | 画像処理装置、画像形成装置およびプログラム | |
JP6859903B2 (ja) | スキャナドライバ、情報処理装置、及び、スキャンシステム | |
JP2007028181A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6090269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |