JP2012073749A - 画像形成装置及び画像形成プログラム - Google Patents
画像形成装置及び画像形成プログラム Download PDFInfo
- Publication number
- JP2012073749A JP2012073749A JP2010217169A JP2010217169A JP2012073749A JP 2012073749 A JP2012073749 A JP 2012073749A JP 2010217169 A JP2010217169 A JP 2010217169A JP 2010217169 A JP2010217169 A JP 2010217169A JP 2012073749 A JP2012073749 A JP 2012073749A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character information
- target image
- character
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】高品質のサーチャブルファイルを円滑に生成する。
【解決手段】所定の画質の対象画像から文字情報を抽出するOCR解析部153と、前記文字情報と前記対象画像の出力イメージを表示するパネル13と、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のサーチャブルPDFデータを生成する画像処理部152と、を備え、パネル13は、変更された画質の前記対象画像から抽出した文字情報の出力イメージと前記対象画像の出力イメージを表示し、画像処理部152は、変更された画質の前記対象画像から抽出した文字情報の出力イメージと前記対象画像の出力イメージとにもとづきサーチャブルPDFを生成する構成としてある。
【選択図】図1
【解決手段】所定の画質の対象画像から文字情報を抽出するOCR解析部153と、前記文字情報と前記対象画像の出力イメージを表示するパネル13と、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のサーチャブルPDFデータを生成する画像処理部152と、を備え、パネル13は、変更された画質の前記対象画像から抽出した文字情報の出力イメージと前記対象画像の出力イメージを表示し、画像処理部152は、変更された画質の前記対象画像から抽出した文字情報の出力イメージと前記対象画像の出力イメージとにもとづきサーチャブルPDFを生成する構成としてある。
【選択図】図1
Description
本発明は、PDFなどのファイルデータを生成する画像形成装置及び画像形成プログラムに関し、特に、不可視のテキストデータが付されたサーチャブルファイルを生成する画像形成装置及び画像形成プログラムに関する。
近年、原稿をPDF(Portable Document Format)やXPS(XML Paper Specification)などのファイルデータに変換する際、原稿に含まれる文字情報を付加することによって、所望の文字列が検索可能なサーチャブルPDFやサーチャブルXPS等(以下、これらをサーチャブルファイルと総称する。)の利用が高まっている。
図9に示すように、サーチャブルファイルは、原稿から文字情報を抽出するため、画像データ(JPEGデータなど)を二値化したラスタデータからテキストデータを抽出するOCR(Optical Character Reader)の技術が用いられる。このためサーチャブルファイルの生成に際しては、文字オブジェクトの的確なパターンマッチングを実現すべく、適切な解像度変換が求められる。
すなわち、解像度は文字認識レベルに相当し、解像度の増減によって文字の認識精度を調整することができる(例えば、特許文献1参照)。
図9に示すように、サーチャブルファイルは、原稿から文字情報を抽出するため、画像データ(JPEGデータなど)を二値化したラスタデータからテキストデータを抽出するOCR(Optical Character Reader)の技術が用いられる。このためサーチャブルファイルの生成に際しては、文字オブジェクトの的確なパターンマッチングを実現すべく、適切な解像度変換が求められる。
すなわち、解像度は文字認識レベルに相当し、解像度の増減によって文字の認識精度を調整することができる(例えば、特許文献1参照)。
ところで、サーチャブルファイルは、図10に示すように、OCR処理によって抽出したテキストデータからなるテキストレイヤを非表示とし、このテキストレイヤと画像データのレイヤとが階層状に形成されたものである。
このため、ユーザーは、サーチャブルファイルに埋め込まれた文字列が正しいか否かを一見して判断することはできず、ビューワー等を介して実際に文字列検索を行ってみなければその精度を判別できない問題があった。
このような問題に対し、OCR処理によって抽出された文字列を表示するステップや、誤って抽出された文字を修正するステップを具備した文字認識方法が提案されている(例えば、特許文献2参照)。
このため、ユーザーは、サーチャブルファイルに埋め込まれた文字列が正しいか否かを一見して判断することはできず、ビューワー等を介して実際に文字列検索を行ってみなければその精度を判別できない問題があった。
このような問題に対し、OCR処理によって抽出された文字列を表示するステップや、誤って抽出された文字を修正するステップを具備した文字認識方法が提案されている(例えば、特許文献2参照)。
しかしながら、特許文献2に記載された文字認識方法によれば、文字そのものをユーザーの手作業により修正するようにしているため、二次的なミスが発生するおそれがあった。
また、特許文献1に記載された文字認識装置によれば、このようなミスは発生し得ないが、OCRの認識精度を判定するために種々のキーワードやキーワード毎のスコアを事前に設定しなければならず煩雑であった。さらに、読み取り解像度を任意の値に設定し、その結果を事前に確認する手段がないため、柔軟性に欠き、ユーザーにとって不便なものとなっていた。
また、特許文献1に記載された文字認識装置によれば、このようなミスは発生し得ないが、OCRの認識精度を判定するために種々のキーワードやキーワード毎のスコアを事前に設定しなければならず煩雑であった。さらに、読み取り解像度を任意の値に設定し、その結果を事前に確認する手段がないため、柔軟性に欠き、ユーザーにとって不便なものとなっていた。
本発明は、以上のような事情に鑑みなされたものであり、サーチャブルファイルの生成にあたり、ユーザーが任意に文字認識レベルを設定できるとともに、文字抽出の精度を確認することができ、また、これらの処理を繰り返し行うことで、高品質のサーチャブルファイルを円滑に生成することができる画像形成装置及び画像形成プログラムを提供する。
上記目的を達成するため、本発明の画像形成装置は、所定の画質の対象画像から文字情報を抽出する文字情報抽出手段と、前記文字情報と前記対象画像の出力イメージを表示する表示手段と、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段と、入力操作に応じ対象画像の画質を変更する文字精度変更手段と、を備え、前記表示手段が、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示し、前記ファイルデータ生成手段が、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成する構成としてある。
また、本発明の画像形成プログラムは、画像形成装置のコンピューターを、所定の画質の対象画像から文字情報を抽出する文字情報抽出手段、前記文字情報と前記対象画像の出力イメージを表示する表示手段、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段、及び、入力操作に応じ対象画像の画質を変更する文字精度変更手段、として機能させるとともに、前記表示手段に、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示させ、前記ファイルデータ生成手段に、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成させる構成としてある。
本発明の画像形成装置及び画像形成プログラムによれば、高品質のサーチャブルファイルを円滑に生成することができる。
以下、本発明の一実施形態について図面を参照して説明する。
図1は、本発明の一実施形態に係るMFP(画像形成装置)の構成を示すブロック図である。
図1に示すように、本実施形態のMFP10は、通信インターフェース11と、表示インターフェース12と、パネル13と、スキャナデバイス14と、制御部15とを備える。
図1は、本発明の一実施形態に係るMFP(画像形成装置)の構成を示すブロック図である。
図1に示すように、本実施形態のMFP10は、通信インターフェース11と、表示インターフェース12と、パネル13と、スキャナデバイス14と、制御部15とを備える。
通信インターフェース11は、LAN(Local Area Network)等のネットワークを介し、パーソナルコンピューター20(以下、PC20という。)との間で必要なデータや信号の通信を行うためのネットワークインターフェースである。例えば、PC20におけるユーティリティやWebブラウザの実行にもとづきPC20から出力された原稿の画像データ(例えば、JPEGやMMRなどのイメージデータ)を受信する。
表示インターフェース12は、パネル13との間で種々のデータを送受信する入出力インターフェースである。例えば、パネル13から出力されたサーチャブルPDFの作成要求を制御部15に受け渡す処理や、生成されたプレビュー画像をパネル13に受け渡す処理等を行う。
パネル13は、タッチパネルとカラーLCD(Liquid Crystal Display)とを組み合わせたタッチパネルユニット等から構成され、種々の画面を表示するとともに、ユーザーのタッチ操作により種々の操作指令を入力するための操作ボタンを表示する操作パネルを構成する。例えば、パネル13は、原稿のプレビュー画像や原稿から抽出した文字列のプレビュー画像を表示し、または、サーチャブルPDFの作成要求を行うための操作ボタンや他のユーザーインターフェースを表示する(図5,6参照)。
スキャナデバイス14は、スキャナユニットとして搭載されたイメージセンサなどのスキャナ装置であり、画像や文字が描かれた原稿を読み取って画像データ(JPEGやMMRなどのイメージデータ)を取得するものである。
なお、スキャナデバイス14は、取得した原稿の画像データを制御部15(後述するデータ送受信部151)に出力する。
なお、スキャナデバイス14は、取得した原稿の画像データを制御部15(後述するデータ送受信部151)に出力する。
制御部15は、CPU、制御プログラムやデータが記憶されたROM、ワークメモリとして機能するRAM、I/Oポートなどのマイクロコンピューターで構成される。制御部15は、記憶された制御プログラムを実行して、MFP10を構成する各部を制御する。
例えば、制御部15は、通信インターフェース11を介して受信した画像データやスキャナデバイス14を介して入力した画像データをラスタデータに変換する等の画像処理を行う。
なお、画像処理によって得られたラスタデータは、通常は出力画像(出力イメージ)として印刷処理に用いられる。具体的には、ラスタデータにもとづくトナー像が感光体ドラム上に形成され、このトナー像が一旦、転写ベルトに転写される。次いで、転写ベルト上のトナー像を用紙に転写し、転写ローラーによりトナー像を用紙に定着させることによって印刷処理が行われる(感光体ドラム、転写ドラム及び転写ローラーは非図示)。
例えば、制御部15は、通信インターフェース11を介して受信した画像データやスキャナデバイス14を介して入力した画像データをラスタデータに変換する等の画像処理を行う。
なお、画像処理によって得られたラスタデータは、通常は出力画像(出力イメージ)として印刷処理に用いられる。具体的には、ラスタデータにもとづくトナー像が感光体ドラム上に形成され、このトナー像が一旦、転写ベルトに転写される。次いで、転写ベルト上のトナー像を用紙に転写し、転写ローラーによりトナー像を用紙に定着させることによって印刷処理が行われる(感光体ドラム、転写ドラム及び転写ローラーは非図示)。
ここで、本発明の一実施形態に係るMFPの制御部について詳細に説明する。
制御部15は、図1に示すように、データ送受信部151と、画像処理部152と、OCR解析部153と、フォントラスタライザ154とを、各機能ブロックとして備える。
データ送受信部151は、制御部15と他の構成部との間で必要なデータ又は信号の受け渡しを行う。
例えば、通信インターフェース11やスキャナデバイス14から入力した画像データを画像処理部152に出力し、または、画像処理部152から入力したラスタデータを通信インターフェース11や表示インターフェース12に出力する。
制御部15は、図1に示すように、データ送受信部151と、画像処理部152と、OCR解析部153と、フォントラスタライザ154とを、各機能ブロックとして備える。
データ送受信部151は、制御部15と他の構成部との間で必要なデータ又は信号の受け渡しを行う。
例えば、通信インターフェース11やスキャナデバイス14から入力した画像データを画像処理部152に出力し、または、画像処理部152から入力したラスタデータを通信インターフェース11や表示インターフェース12に出力する。
画像処理部152は、入力した画像データを所定の出力画質(解像度)にもとづくピクセルに分解して2値データに変換することによって、出力画像(ラスタデータ)を生成する(出力画像生成手段)。
また、画像処理部152は、必要に応じ、解像度、画像サイズを変更し、又は、回転や色変換を行うなど、出力画質を変更したうえで出力画像を生成することもできる。
画像処理部152は、生成した出力画像をOCR処理部153に出力する。
さらに、画像処理部152は、出力画像をPDFデータに変換するとともに、OCR解析部153によって抽出されたテキストデータとPDFデータとを結合してPDFファイル(サーチャブルPDF)を生成する(ファイルデータ生成手段)。
また、画像処理部152は、必要に応じ、解像度、画像サイズを変更し、又は、回転や色変換を行うなど、出力画質を変更したうえで出力画像を生成することもできる。
画像処理部152は、生成した出力画像をOCR処理部153に出力する。
さらに、画像処理部152は、出力画像をPDFデータに変換するとともに、OCR解析部153によって抽出されたテキストデータとPDFデータとを結合してPDFファイル(サーチャブルPDF)を生成する(ファイルデータ生成手段)。
OCR解析部153は、出力画像を解析してテキストデータを抽出する(文字情報抽出手段)。具体的には、OCR解析部153は、ラスタデータから文字を構成するピクセルを取り出し、該当する文字コード、サイズ、位置などの属性情報を付する。
フォントラスタライザ154は、テキストデータをラスタデータに変換することで文字列のプレビュー画像を生成する。生成された文字列のプレビュー画像は、PC20やパネル13に送られて表示される(図5参照)。
フォントラスタライザ154は、テキストデータをラスタデータに変換することで文字列のプレビュー画像を生成する。生成された文字列のプレビュー画像は、PC20やパネル13に送られて表示される(図5参照)。
なお、PC20は、MFP10とLAN(Local Area Network)等のネットワークを介し電気的に接続されている。
PC20には、ビットマップ画像のプレビュー機能を有するWebブラウザその他のPCユーティリティがインストールされており、また、このPCユーティリティによりMFP20との各種情報の受け渡しを可能としている。
PC20には、ビットマップ画像のプレビュー機能を有するWebブラウザその他のPCユーティリティがインストールされており、また、このPCユーティリティによりMFP20との各種情報の受け渡しを可能としている。
つぎに、本発明の一実施形態の画像処理を詳細に説明する。具体的には、i)画像データ入力時における画像処理、ii)テキストデータを抽出しプレビュー表示する工程における画像処理、iii)文字認識レベルの再設定時における画像処理、及び、iv)サーチャブルPDFの生成時における画像処理についてそれぞれ説明する。
i)画像データ入力時における画像処理
図2は、本発明の一実施形態において画像データ入力時における画像処理を説明するための説明図である。
具体的には、図2に示すように、画像データの入力から出力画像をOCR解析部153に出力するまでの間に行われる画像処理を説明する。
図2は、本発明の一実施形態において画像データ入力時における画像処理を説明するための説明図である。
具体的には、図2に示すように、画像データの入力から出力画像をOCR解析部153に出力するまでの間に行われる画像処理を説明する。
図2に示すように、まず、PC20又はスキャナデバイス14を介して原稿の画像データを入力する。
例えば、PC20が、MFP10と情報の受け渡しが可能なWebブラウザその他のユーティリティを介し、サーチャブルPDFの作成要求信号と、原稿の画像データとを通信インターフェース11に出力する。通信インターフェース11は、入力した信号及びデータをデータ送受信部151に出力する。
他方、スキャナデバイス14で読み取った原稿の画像データを用いてサーチャブルPDFを生成する場合、パネル13が、サーチャブルPDFの作成要求信号をデータ送受信部151に出力し、スキャナデバイス14が、原稿の画像データをデータ送受信部151に出力する。
例えば、PC20が、MFP10と情報の受け渡しが可能なWebブラウザその他のユーティリティを介し、サーチャブルPDFの作成要求信号と、原稿の画像データとを通信インターフェース11に出力する。通信インターフェース11は、入力した信号及びデータをデータ送受信部151に出力する。
他方、スキャナデバイス14で読み取った原稿の画像データを用いてサーチャブルPDFを生成する場合、パネル13が、サーチャブルPDFの作成要求信号をデータ送受信部151に出力し、スキャナデバイス14が、原稿の画像データをデータ送受信部151に出力する。
データ送受信部151は、入力したサーチャブルPDFの作成要求信号及び原稿の画像データを画像処理部152に出力する。
画像処理部152は、入力した原稿の画像データを所定の出力画質(解像度)にもとづいて2値化し、ラスタデータからなる出力画像を取得する。
なお、画像処理部152は、取得した出力画像にもとづいて原稿のプレビュー画像を生成してこれを保持するとともに、この出力画像をOCR解析部153に出力する。
画像処理部152は、入力した原稿の画像データを所定の出力画質(解像度)にもとづいて2値化し、ラスタデータからなる出力画像を取得する。
なお、画像処理部152は、取得した出力画像にもとづいて原稿のプレビュー画像を生成してこれを保持するとともに、この出力画像をOCR解析部153に出力する。
ii)テキストデータを抽出しプレビュー表示する工程における画像処理
図3は、出力画像からテキストデータを抽出してからプレビュー表示するまでに行われる画像処理を説明するための説明図である。
図3は、出力画像からテキストデータを抽出してからプレビュー表示するまでに行われる画像処理を説明するための説明図である。
ここでは、まず、OCR解析部153が、出力画像から文字情報を抽出し、これをプレーンテキスト、リッチテキストなどのテキストデータに変換して画像処理部152に出力する。
つぎに、画像処理部152は、入力したテキストデータを、フォントラスタライザ154を使用してラスタデータに変換し、文字列のプレビュー画像として取得する。なお、画像処理部152は、入力したテキストデータを保持しておく。
また、画像処理部152は、保持しておいた原稿のプレビュー画像と文字列のプレビュー画像とをデータ送受信部151に出力する。なお、この際、画像処理部152は、原稿のプレビュー画像と文字列のプレビュー画像とを対比可能に並べて配置したプレビュー画像に加工してデータ送受信部151に出力することもできる。
次いで、画像処理部152は、このようなプレビュー画像と、OCR解析部153から入力したテキストデータとをデータ送受信部151に出力する。
つぎに、画像処理部152は、入力したテキストデータを、フォントラスタライザ154を使用してラスタデータに変換し、文字列のプレビュー画像として取得する。なお、画像処理部152は、入力したテキストデータを保持しておく。
また、画像処理部152は、保持しておいた原稿のプレビュー画像と文字列のプレビュー画像とをデータ送受信部151に出力する。なお、この際、画像処理部152は、原稿のプレビュー画像と文字列のプレビュー画像とを対比可能に並べて配置したプレビュー画像に加工してデータ送受信部151に出力することもできる。
次いで、画像処理部152は、このようなプレビュー画像と、OCR解析部153から入力したテキストデータとをデータ送受信部151に出力する。
データ送受信部151は、入力したプレビュー画像及びテキストデータを通信インターフェース11又は表示インターフェース12に出力する。
通信インターフェース11は、入力したプレビュー画像及びテキストデータをPC20に送信し、表示インターフェース12は、入力したプレビュー画像及びテキストデータをパネル13に出力する。
プレビュー画像を入力したPC20又はパネル13では、原稿のプレビュー画像と、文字列のプレビュー画像を表示する(表示手段)。なお、文字列のプレビュー画像に加え、認識文字数、言語、処理時間などの他の文字情報を表示することもできる。
このため、ユーザーは、表示された2つのプレビュー画像を比較しながら参照することができ、OCR解析部153によって抽出された文字の正否を容易に確認することができる。
通信インターフェース11は、入力したプレビュー画像及びテキストデータをPC20に送信し、表示インターフェース12は、入力したプレビュー画像及びテキストデータをパネル13に出力する。
プレビュー画像を入力したPC20又はパネル13では、原稿のプレビュー画像と、文字列のプレビュー画像を表示する(表示手段)。なお、文字列のプレビュー画像に加え、認識文字数、言語、処理時間などの他の文字情報を表示することもできる。
このため、ユーザーは、表示された2つのプレビュー画像を比較しながら参照することができ、OCR解析部153によって抽出された文字の正否を容易に確認することができる。
iii)文字認識レベルの再設定時における画像処理
図4は、文字認識レベルの再設定時における画像処理を説明するための説明図である。
文字認識レベルの再設定は、プレビュー画像を確認した結果、文字の誤りが多く許容できないと判断した場合等、ユーザーの判断で任意で行われる。
ユーザーは、図5や図6に示すように、PC20に接続された非図示のモニターやパネル13の表示領域に表示されたプレビュー画面を参照しつつ、操作ボタン、調整バーなどのユーザーインターフェースを介して文字認識レベルの再設定を行う。
図4は、文字認識レベルの再設定時における画像処理を説明するための説明図である。
文字認識レベルの再設定は、プレビュー画像を確認した結果、文字の誤りが多く許容できないと判断した場合等、ユーザーの判断で任意で行われる。
ユーザーは、図5や図6に示すように、PC20に接続された非図示のモニターやパネル13の表示領域に表示されたプレビュー画面を参照しつつ、操作ボタン、調整バーなどのユーザーインターフェースを介して文字認識レベルの再設定を行う。
具体的には、ユーザーは、図5に示された表示領域に表示される「認識レベル再調整」ボタンを選択する。「認識レベル再調整」ボタンが選択されると、図6に示す文字認識レベルの調整バー(操作部)を表示する(操作部表示手段)。この調整バーによれば、文字の認識精度(抽出精度)とパフォーマンス(処理速度)との割合をボタン操作やスライド操作によって調整できる(文字精度変更手段)。例えば、図6において、ユーザーは、レベル選択ボタンの左を選択して、精度を高く設定することができるが、この場合、パフォーマンスは低く設定される。また、レベル選択ボタンの右を選択すると、パフォーマンスを高く設定することができるが精度は低く設定される。
文字認識レベルが再設定され、「決定」ボタンが選択されると、この再設定した文字認識レベルの設定情報が出力される。
文字認識レベルが再設定され、「決定」ボタンが選択されると、この再設定した文字認識レベルの設定情報が出力される。
文字認識レベルの設定情報は、出力画質に関するパラメータである。具体的には、文字認識レベルの再設定に応じ、画像処理部152は、画像データを出力画像(ラスタデータ)に変換する際の解像度等の出力画質を変更する(文字精度変更手段)。つまり、文字認識レベルとしての認識精度を元の認識精度より高く設定した場合にはこれに相応して高解像度の出力画像が生成され、認識精度を元の認識精度より低く設定した場合にはこれに相応して低解像度の出力画像が生成される。
また、文字認識レベルの設定情報は、原稿の種類に応じて定めるようにしてもよい。例えば、スキャナデバイス14のプレスキャン機能等により、白黒文字の原稿、色文字原稿、イメージ混在など、原稿の種類を判別し、判別された原稿の種類に応じて出力画質(解像度)を設定し又は変更することもできる。
なお、解像度の他、画像サイズ、色変換などの画質に関する他のパラメータを文字認識レベルの設定情報として用いることもできる。
なお、解像度の他、画像サイズ、色変換などの画質に関する他のパラメータを文字認識レベルの設定情報として用いることもできる。
具体的な画像処理の流れは以下の通りである。
まず、PC20に付属するマウス等の操作を介して文字認識レベルの再設定を行った場合には、PC20が、再設定された文字認識レベルの設定情報を通信インターフェース11に送信し、通信インターフェース11は、この設定情報をデータ送受信部151に出力する。
他方、パネル13上のキー操作によって文字認識レベルの再設定を行った場合、パネル13が、再設定された文字認識レベルの設定情報を表示インターフェース12に出力し、表示インターフェース12が、この設定情報をデータ送受信部151に出力する。
次いで、データ送受信部151は、再設定に係る文字認識レベルの設定情報を画像処理部152に出力する。
まず、PC20に付属するマウス等の操作を介して文字認識レベルの再設定を行った場合には、PC20が、再設定された文字認識レベルの設定情報を通信インターフェース11に送信し、通信インターフェース11は、この設定情報をデータ送受信部151に出力する。
他方、パネル13上のキー操作によって文字認識レベルの再設定を行った場合、パネル13が、再設定された文字認識レベルの設定情報を表示インターフェース12に出力し、表示インターフェース12が、この設定情報をデータ送受信部151に出力する。
次いで、データ送受信部151は、再設定に係る文字認識レベルの設定情報を画像処理部152に出力する。
画像処理部152は、再設定に係る文字認識レベルの設定情報にもとづき、原稿の画像データを出力画像に変換してOCR解析部153に出力する。
例えば、文字認識レベルの再設定において、元の解像度より高い解像度が設定された場合、新たに設定されたその解像度にもとづいて原稿のイメージデータをラスタデータに変換し、これをOCR解析部153に出力する。
なお、前述したii)における画像処理と同様、OCR解析部153は、出力画像からテキストデータを抽出し、フォントラスタライザ154がこれをラスタデータに変換することで文字列のプレビュー画像を生成し、画像処理部153が、テキストデータとともに、PC20又はパネル13に出力する。
例えば、文字認識レベルの再設定において、元の解像度より高い解像度が設定された場合、新たに設定されたその解像度にもとづいて原稿のイメージデータをラスタデータに変換し、これをOCR解析部153に出力する。
なお、前述したii)における画像処理と同様、OCR解析部153は、出力画像からテキストデータを抽出し、フォントラスタライザ154がこれをラスタデータに変換することで文字列のプレビュー画像を生成し、画像処理部153が、テキストデータとともに、PC20又はパネル13に出力する。
iv)サーチャブルPDFの生成時における画像処理
図7は、本発明の一実施形態において、サーチャブルPDFの生成時における画像処理を説明するための説明図である。
図7に示すように、所定操作に応じ、PC20又はパネル13が、サーチャブルPDFのファイル作成の実行信号を出力する。この動作は、図5に示すプレビュー画面上に表示される「実行」キーを選択することにより実行される。
PC20を介してファイル作成の実行信号が出力されると、通信インターフェース11がこれをデータ送受信部151に出力する。他方、パネル13を介してファイル作成の実行信号が出力されると、表示インターフェース12がこれをデータ送受信部151に出力する。
データ送受信部151は、入力したファイル作成の実行信号を画像処理部152に出力する。
図7は、本発明の一実施形態において、サーチャブルPDFの生成時における画像処理を説明するための説明図である。
図7に示すように、所定操作に応じ、PC20又はパネル13が、サーチャブルPDFのファイル作成の実行信号を出力する。この動作は、図5に示すプレビュー画面上に表示される「実行」キーを選択することにより実行される。
PC20を介してファイル作成の実行信号が出力されると、通信インターフェース11がこれをデータ送受信部151に出力する。他方、パネル13を介してファイル作成の実行信号が出力されると、表示インターフェース12がこれをデータ送受信部151に出力する。
データ送受信部151は、入力したファイル作成の実行信号を画像処理部152に出力する。
ファイル作成の実行信号を入力した画像処理部152は、その時点において保持している原稿の出力画像をPDFデータに変換するとともに、その時点において保持しているテキストデータ(すなわち、直前に設定した文字認識レベルにもとづいてOCR解析部153が抽出したテキストデータ)とPDFデータとを結合することでサーチャブルPDFを生成する。サーチャブルPDFの生成に際しては、テキストデータを形成するテキストレイヤを非表示にしつつ、このテキストレイヤとPDFデータとを階層状に結合する。
ところで、PC20又はパネル13を介し、ユーザーが、テキストデータを修正する処理を介してサーチャブルPDFを生成することもできる。
この場合、ユーザーは、PC20のキーボード操作やパネル13のキー操作により、該当する文字の削除、加筆、変更を行う。そして、所定操作に応じ、PC20又はパネル13が、修正後のテキストデータとファイル作成の実行信号とをデータ送受信部151に出力する。
ファイル作成の実行信号を入力したデータ送受信部151は、この実行信号とともに入力した修正テキストデータを取り出す。そして、その時点において保持していた原稿の出力画像をPDFデータに変換するとともに、取り出した修正テキストデータとそのPDFデータとを結合することでサーチャブルPDFを生成する。
この場合、ユーザーは、PC20のキーボード操作やパネル13のキー操作により、該当する文字の削除、加筆、変更を行う。そして、所定操作に応じ、PC20又はパネル13が、修正後のテキストデータとファイル作成の実行信号とをデータ送受信部151に出力する。
ファイル作成の実行信号を入力したデータ送受信部151は、この実行信号とともに入力した修正テキストデータを取り出す。そして、その時点において保持していた原稿の出力画像をPDFデータに変換するとともに、取り出した修正テキストデータとそのPDFデータとを結合することでサーチャブルPDFを生成する。
次に、本発明の一実施形態に係る画像処理方法について図面を参照しながら説明する。
図8は、本発明の一実施形態に係る画像処理方法を示すフローチャートである。
図8に示すように、まず、MFP10は、サーチャブルPDFのファイル作成要求と原稿の画像データとを受信する(S1)。具体的には、PC20におけるユーザーの所定操作に応じ、サーチャブルPDFのファイル作成の要求信号と原稿の画像データとが出力され、通信インターフェース11を介しデータ送受信部151がこれを受信する。または、パネル13におけるユーザーの所定操作に応じ出力されたサーチャブルPDFのファイル作成の要求信号を、表示インターフェース12を介してデータ送受信部151が入力するとともに、スキャナデバイス14によって読み込まれた原稿の画像データをデータ送受信部151が入力する。
なお、データ送受信部151は、入力したファイル作成の要求信号と原稿の画像データを画像処理部152に出力する。
図8は、本発明の一実施形態に係る画像処理方法を示すフローチャートである。
図8に示すように、まず、MFP10は、サーチャブルPDFのファイル作成要求と原稿の画像データとを受信する(S1)。具体的には、PC20におけるユーザーの所定操作に応じ、サーチャブルPDFのファイル作成の要求信号と原稿の画像データとが出力され、通信インターフェース11を介しデータ送受信部151がこれを受信する。または、パネル13におけるユーザーの所定操作に応じ出力されたサーチャブルPDFのファイル作成の要求信号を、表示インターフェース12を介してデータ送受信部151が入力するとともに、スキャナデバイス14によって読み込まれた原稿の画像データをデータ送受信部151が入力する。
なお、データ送受信部151は、入力したファイル作成の要求信号と原稿の画像データを画像処理部152に出力する。
ファイル作成の要求信号を入力した画像処理部152は、この要求信号とともに入力した原稿の画像データを所定の出力画質(所定解像度)に調整して出力画像(ラスタデータ)を作成する。また、この出力画像にもとづき、原稿のプレビュー画像を生成する(S2)。
画像処理部152は、生成した原稿の出力画像をOCR解析部153に出力する。
OCR解析部153は、原稿の出力画像からテキストデータを抽出し(S3)、これを画像処理部152に出力する。
また、画像処理部152は、フォントラスタライザ154を使用してテキストデータをラスタデータに変換し、文字列のプレビュー画像を生成する(S4)。
次いで、画像処理部152は、生成した原稿のプレビュー画像と文字列のプレビュー画像及びテキストデータをPC20又はパネル13に送る(S5)。なお、画像処理部152は、テキストデータを保持しておく。
画像処理部152は、生成した原稿の出力画像をOCR解析部153に出力する。
OCR解析部153は、原稿の出力画像からテキストデータを抽出し(S3)、これを画像処理部152に出力する。
また、画像処理部152は、フォントラスタライザ154を使用してテキストデータをラスタデータに変換し、文字列のプレビュー画像を生成する(S4)。
次いで、画像処理部152は、生成した原稿のプレビュー画像と文字列のプレビュー画像及びテキストデータをPC20又はパネル13に送る(S5)。なお、画像処理部152は、テキストデータを保持しておく。
つぎに、PC20又はパネル13は、受信(入力)した原稿のプレビュー画像と文字列のプレビュー画像を表示する(S6)。なお、このとき、認識文字数、言語、処理時間等の他の文字情報をプレビュー画像とともに表示するようにしてもよい。
これにより、ユーザーは、プレビュー画像を見て、OCR解析部153による文字抽出の精度を確認することができる。
ここで、文字認識レベルの再設定がされた場合(S7:YES)、画像処理部152は、この再設定された文字認識レベルの設定情報を取得し、この設定情報にもとづいて原稿の画像データをラスタデータに変換して出力画像を生成する(S8)。なお、生成された原稿の出力画像はOCR解析部153に出力され、再度ステップS3以降の処理を行う。
これにより、ユーザーは、プレビュー画像を見て、OCR解析部153による文字抽出の精度を確認することができる。
ここで、文字認識レベルの再設定がされた場合(S7:YES)、画像処理部152は、この再設定された文字認識レベルの設定情報を取得し、この設定情報にもとづいて原稿の画像データをラスタデータに変換して出力画像を生成する(S8)。なお、生成された原稿の出力画像はOCR解析部153に出力され、再度ステップS3以降の処理を行う。
他方、文字認識レベルの再設定がされなかった場合(S7:NO)、テキストデータが修正されたか否かを判定する(S9)。すなわち、ユーザーの手作業によりテキストデータが修正されたか否かを判断する。
テキストデータが修正された場合(S9:YES)、データ送受信部151は、PC20又はパネル13から修正テキストデータを受信(入力)し、画像処理部152に出力する(S10)。
そして、画像処理部152が、出力画像のPDFデータと修正テキストデータとを結合してサーチャブルPDFを生成する(S11)。
テキストデータが修正されなかった場合(S9:NO)、画像処理部152が、出力画像のPDFデータと保持しておいたテキストデータとを結合してサーチャブルPDFを生成する(S11)。
テキストデータが修正された場合(S9:YES)、データ送受信部151は、PC20又はパネル13から修正テキストデータを受信(入力)し、画像処理部152に出力する(S10)。
そして、画像処理部152が、出力画像のPDFデータと修正テキストデータとを結合してサーチャブルPDFを生成する(S11)。
テキストデータが修正されなかった場合(S9:NO)、画像処理部152が、出力画像のPDFデータと保持しておいたテキストデータとを結合してサーチャブルPDFを生成する(S11)。
以上、本発明の実施形態に係るMFP10によれば、サーチャブルファイルの生成にあたり、ユーザーが文字認識レベル(出力画質)を変更してOCR処理を行わせることができるとともに、このOCR処理における文字抽出精度を確認することができる。
そして、このような再帰的なOCR処理を可能とすることで、精度の高いサーチャブルファイルを生成することができる。
そして、このような再帰的なOCR処理を可能とすることで、精度の高いサーチャブルファイルを生成することができる。
また、OCR解析部153における文字情報の抽出精度と文字情報の抽出速度との割合を設定し得る調整バーを表示し、この調整バーの設定によって定まる割合にもとづいて変更された出力画質にもとづいてOCR処理を行うことができるようにしている。
このため、速度パフォーマンスとのバランスを保ちつつ一定の精度を有するサーチャブルPDFを生成することができる。
このため、速度パフォーマンスとのバランスを保ちつつ一定の精度を有するサーチャブルPDFを生成することができる。
さらに、文字の修正を手作業で直接行うことも可能としているため、例えば、文書全体の修正を文字認識レベル(出力画質)の再設定により行い、微細な修正についてはユーザーがピンポイントで修正を行うなど、柔軟な対応が可能となる。
以上、本発明の画像形成装置について、好ましい実施形態を示して説明したが、本発明にかかる画像形成装置は、上述した各実施形態に限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。
例えば、本発明の実施形態に係るMFP10においては、サーチャブルPDFを生成する例について説明したが、テキストデータとの組み合わせが有用な他のドキュメントデータを用いてサーチャブルファイルを生成してもよい。例えば、XPSデータとテキストデータとの組み合わせからなるサーチャブルXPSを生成することができる。
また、前記実施形態においては、MFP10でサーチャブルPDFを生成するようにしているが、PC20が必要な構成をすべて備え、PC20単体でサーチャブルPDFを生成する構成であっても良い。
例えば、本発明の実施形態に係るMFP10においては、サーチャブルPDFを生成する例について説明したが、テキストデータとの組み合わせが有用な他のドキュメントデータを用いてサーチャブルファイルを生成してもよい。例えば、XPSデータとテキストデータとの組み合わせからなるサーチャブルXPSを生成することができる。
また、前記実施形態においては、MFP10でサーチャブルPDFを生成するようにしているが、PC20が必要な構成をすべて備え、PC20単体でサーチャブルPDFを生成する構成であっても良い。
本発明は、複写機、プリンター、複合機などの画像形成装置に好適に用いることができる。
10 MFP(画像形成装置)
13 パネル
14 スキャナデバイス
15 制御部
152 画像処理部
153 OCR解析部
154 フォントラスタライザ
20 PC(ホストコンピューター)
13 パネル
14 スキャナデバイス
15 制御部
152 画像処理部
153 OCR解析部
154 フォントラスタライザ
20 PC(ホストコンピューター)
Claims (5)
- 所定の画質の対象画像から文字情報を抽出する文字情報抽出手段と、
前記文字情報と前記対象画像の出力イメージを表示する表示手段と、
前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段と、
入力操作に応じ対象画像の画質を変更する文字精度変更手段と、を備え、
前記表示手段が、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示し、
前記ファイルデータ生成手段が、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成する
ことを特徴とする画像形成装置。 - 所定の画質又は変更された画質にもとづいて対象画像を二値化する出力画像生成手段を備え、
前記文字情報抽出手段が、
前記二値化された対象画像から文字情報を抽出する
請求項1記載の画像形成装置。 - 前記文字情報抽出手段における文字情報の抽出精度と文字情報の抽出速度との割合を設定する操作部を表示する操作部表示手段を備え、
前記文字精度変更手段が、前記操作部の設定によって定まる前記割合にもとづいて前記対象画像の画質を変更する請求項1又は2記載の画像形成装置。 - 前記文字精度変更手段が、対象画像の種類に応じて前記対象画像の画質を変更する請求項1〜3のいずれか一項記載の画像形成装置。
- 画像形成装置のコンピューターを、
所定の画質の対象画像から文字情報を抽出する文字情報抽出手段、
前記文字情報と前記対象画像の出力イメージを表示する表示手段、
前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段、及び
入力操作に応じ対象画像の画質を変更する文字精度変更手段、として機能させるとともに、
前記表示手段に、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示させ、
前記ファイルデータ生成手段に、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成させるための画像形成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217169A JP2012073749A (ja) | 2010-09-28 | 2010-09-28 | 画像形成装置及び画像形成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217169A JP2012073749A (ja) | 2010-09-28 | 2010-09-28 | 画像形成装置及び画像形成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012073749A true JP2012073749A (ja) | 2012-04-12 |
Family
ID=46169869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217169A Pending JP2012073749A (ja) | 2010-09-28 | 2010-09-28 | 画像形成装置及び画像形成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012073749A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013168590A1 (ja) * | 2012-05-11 | 2013-11-14 | シャープ株式会社 | 画像処理装置、画像形成装置、および記録媒体 |
JP2015032017A (ja) * | 2013-07-31 | 2015-02-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
JP2015225459A (ja) * | 2014-05-27 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN105407245A (zh) * | 2014-09-08 | 2016-03-16 | 柯尼卡美能达株式会社 | 电子文件生成装置及其控制方法、电子文件生成系统 |
JP2016118909A (ja) * | 2014-12-19 | 2016-06-30 | コニカミノルタ株式会社 | 文字画像処理システム、文字画像処理システムの制御プログラム、情報処理装置、および情報処理装置の制御プログラム |
US9398191B2 (en) | 2014-07-11 | 2016-07-19 | Konica Minolta, Inc. | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9473669B2 (en) | 2014-07-11 | 2016-10-18 | Konica Minolta, Inc | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9614984B2 (en) | 2014-04-16 | 2017-04-04 | Konica Minolta, Inc. | Electronic document generation system and recording medium |
JP2020102166A (ja) * | 2018-12-25 | 2020-07-02 | キヤノン株式会社 | 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置 |
US12166935B2 (en) | 2020-12-23 | 2024-12-10 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program without displaying screen for setting step of target image separately from screen for operation step of target image |
-
2010
- 2010-09-28 JP JP2010217169A patent/JP2012073749A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013168590A1 (ja) * | 2012-05-11 | 2013-11-14 | シャープ株式会社 | 画像処理装置、画像形成装置、および記録媒体 |
JP2015032017A (ja) * | 2013-07-31 | 2015-02-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
US9614984B2 (en) | 2014-04-16 | 2017-04-04 | Konica Minolta, Inc. | Electronic document generation system and recording medium |
US9449223B2 (en) | 2014-05-27 | 2016-09-20 | Kyocera Document Solutions Inc. | Image processing device and image forming apparatus |
JP2015225459A (ja) * | 2014-05-27 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
US9398191B2 (en) | 2014-07-11 | 2016-07-19 | Konica Minolta, Inc. | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9473669B2 (en) | 2014-07-11 | 2016-10-18 | Konica Minolta, Inc | Electronic document generation system, electronic document generation apparatus, and recording medium |
CN105407245A (zh) * | 2014-09-08 | 2016-03-16 | 柯尼卡美能达株式会社 | 电子文件生成装置及其控制方法、电子文件生成系统 |
US9485368B2 (en) | 2014-09-08 | 2016-11-01 | Konica Minolta, Inc. | Electronic document generation apparatus, recording medium, and electronic document generation system |
JP2016118909A (ja) * | 2014-12-19 | 2016-06-30 | コニカミノルタ株式会社 | 文字画像処理システム、文字画像処理システムの制御プログラム、情報処理装置、および情報処理装置の制御プログラム |
JP2020102166A (ja) * | 2018-12-25 | 2020-07-02 | キヤノン株式会社 | 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置 |
JP7277128B2 (ja) | 2018-12-25 | 2023-05-18 | キヤノン株式会社 | 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置 |
US12166935B2 (en) | 2020-12-23 | 2024-12-10 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program without displaying screen for setting step of target image separately from screen for operation step of target image |
JP7613092B2 (ja) | 2020-12-23 | 2025-01-15 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012073749A (ja) | 画像形成装置及び画像形成プログラム | |
CN102685348B (zh) | 复合机、复合机控制系统以及复合机的控制方法 | |
US9116651B2 (en) | Image processing apparatus, control method, and recording medium storing computer program for image processing | |
JP7387339B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
US8314964B2 (en) | Image processing apparatus and image processing method | |
JP2009043262A (ja) | インテリジェント電子書類コンテンツ処理のためのネットワーク装置 | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP6762722B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
US20120140275A1 (en) | Scan management system, scan management apparatus, controlling method of scan management system, and recording medium | |
JP2009165088A (ja) | 画像処理装置 | |
JP2021043650A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
CN112839141B (zh) | 图像处理系统、图像处理方法和存储介质 | |
CN113870387A (zh) | 数据输出系统及其方法,图像处理系统及其方法 | |
US10477055B2 (en) | Image forming apparatus | |
US20190197336A1 (en) | Image processing apparatus and image forming apparatus | |
JP2015227013A (ja) | 印刷装置、制御方法、及びプログラム | |
EP1441501A2 (en) | Image forming apparatus and image forming method for making image output setting easily | |
US20170201639A1 (en) | Image forming apparatus and recording medium | |
JP2021086188A (ja) | 画像処理システム、画像処理方法、及びプログラム | |
JP5071471B2 (ja) | 画像形成装置、画像形成方法および画像形成装置を制御する制御プログラム | |
JP2016096393A (ja) | 情報処理装置、システム、情報処理方法およびプログラム | |
US20100225980A1 (en) | Image processing device and system, and computer readable medium therefor | |
JP5234661B2 (ja) | 情報処理装置、情報処理システム、制御方法、プログラム | |
US20250039323A1 (en) | Storage medium, method of controlling image processing apparatus, and image processing apparatus |