JP2015158865A - Document generation device, searchable file generation device, and document generation device - Google Patents
Document generation device, searchable file generation device, and document generation device Download PDFInfo
- Publication number
- JP2015158865A JP2015158865A JP2014034361A JP2014034361A JP2015158865A JP 2015158865 A JP2015158865 A JP 2015158865A JP 2014034361 A JP2014034361 A JP 2014034361A JP 2014034361 A JP2014034361 A JP 2014034361A JP 2015158865 A JP2015158865 A JP 2015158865A
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- auxiliary
- document
- searchable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 claims abstract description 80
- 238000006243 chemical reaction Methods 0.000 claims abstract description 29
- 238000013075 data extraction Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、原稿画像とコード画像である補助画像とを表示した印刷物を作成する文書作成装置、及び印刷物を読み取ってサーチャブルファイルを作成するサーチャブルファイル作成装置に関する。 The present invention relates to a document creation device that creates a printed material on which an original image and an auxiliary image that is a code image are displayed, and a searchable file creation device that creates a searchable file by reading the printed material.
MFP(Multi Function Printer:プリンタ複合機)には、原稿をスキャナで読み取って電子ファイル化することができ、この機能を用いて原稿をサーチャブルファイルの一種であるサーチャブルPDF(Portable Document Format)ファイルを作成できるものがある。ここで、サーチャブルファイルとは、不可視のテキストデータ(文字コードデータ)が付加され、テキスト検索可能なファイルである。このような装置において、サーチャブルPDFファイルは、OCR(Optical Character Recognition:光学文字認識)技術を用いて、原稿に記載されているテキスト情報を抽出し、スキャンしたイメージ画像と共に、テキストデータをPDFファイル内に埋め込むことで作成される。このサーチャブルPDFファイルでは、走査したイメージ画像を視認できるだけでなく、テキストデータが埋め込まれているため、テキストデータを利用して電子的な検索を行ったり、テキストデータを容易にコピー・アンド・ペーストできたりする。 An MFP (Multi Function Printer) can read a document with a scanner and convert it to an electronic file. Using this function, a searchable PDF (Portable Document Format) file, which is a type of searchable file, can be converted. There is something that can be created. Here, the searchable file is a file to which text search is possible by adding invisible text data (character code data). In such an apparatus, the searchable PDF file uses OCR (Optical Character Recognition) technology to extract text information described in a document, and the scanned image and text data are stored in the PDF file. Created by embedding in. In this searchable PDF file, not only can the scanned image be viewed, but also the text data is embedded, so it is possible to perform electronic searches using text data and to easily copy and paste text data. Or
特許文献1には、サーチャブルファイル(サーチャブルPDFファイルやサーチャブルXPS(XML Paper Specification)ファイル等を含めた総称)を作成するにあたり、ユーザーが任意に文字認識レベルを設定できると共に、文字抽出の精度(認識精度)を確認することができ、また、これらの処理を繰り返し行うことで、高品質のサーチャブルファイルを円滑に生成することができる画像形成装置、及び、画像形成プログラムが記載されている。
In
OCR技術による文字認識率(認識精度)には限界があり、文字の形状や種類によっては正しく認識できない場合がある。この場合、文章として成り立たないレベルの内容に誤認識されていれば誤認識であることを検出しやすい。しかし、誤認識の結果はさまざまであり、例えば、文章自体は違和感無くつながっているが、全く逆の意味合いの文章が生成されることもある。サーチャブルPDFファイルの場合、ビューワーに表示される内容は、OCRで認識されたテキストデータではなく、イメージとして読み取ったものであるため、この時点では誤認識の影響は受けない。しかし、OCRによる誤認識が発生している場合、テキストデータを利用した電子的な検索時に検索漏れが発生する他、テキストデータのコピー時に誤った内容をコピーしてしまうこととなる。このため、使用用途によっては、人間が元文書と生成された文書とを見比べ、誤っている部分に対して修正を行うという作業が必要となる。 The character recognition rate (recognition accuracy) by the OCR technology has a limit, and depending on the shape and type of the character, it may not be recognized correctly. In this case, if it is misrecognized as content that does not hold as a sentence, it is easy to detect misrecognition. However, there are various misrecognition results. For example, sentences themselves are connected without a sense of incongruity, but sentences having completely opposite meanings may be generated. In the case of a searchable PDF file, the content displayed in the viewer is not text data recognized by OCR but is read as an image, and is not affected by erroneous recognition at this point. However, when misrecognition by OCR has occurred, search omissions occur during electronic search using text data, and erroneous contents are copied when text data is copied. For this reason, depending on the intended use, it is necessary for humans to compare the original document with the generated document and correct the erroneous part.
また、別の問題点として、MFPにてサーチャブルPDFを作成するとき、原稿のテキスト部分については、文字コードに置き換えるわけではなく、イメージデータとして保持する。このため、コンピュータ上でPDFファイルを直接作成し、テキスト部分を文字コードデータとして保持するPDFファイルに比べ、ファイルサイズが大きくなってしまうという問題がある。 As another problem, when a searchable PDF is created by the MFP, the text portion of the document is not replaced with a character code but held as image data. For this reason, there is a problem that the file size becomes larger than that of a PDF file in which a PDF file is directly created on a computer and a text portion is stored as character code data.
本発明は、上記課題に鑑みてなされたものであり、サーチャブルファイルを容易に作成でき、しかもファイル容量を小さくできる印刷物を作成する文書作成装置、及びこの印刷物からサーチャブルファイルを作成するサーチャブルファイル作成装置を提供することを目的とする。 The present invention has been made in view of the above-described problems. A document creation apparatus that creates a printed material that can easily create a searchable file and that can reduce the file capacity, and a searchable that creates a searchable file from the printed material. An object is to provide a file creation device.
上記課題を解決するため、原稿データに基づいて原稿画像が表示された本文表示面と、前記原稿データの少なくとも一部を含む補助データをコード画像化した補助画像が表示された補助資料表示面と、を備えた印刷物を作成する文書作成装置であって、前記原稿データから前記補助データを生成する補助データ生成手段と、前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換手段と、
を備えたことを特徴とする。
In order to solve the above problems, a text display surface on which a document image is displayed based on document data, and an auxiliary material display surface on which an auxiliary image in which auxiliary data including at least a part of the document data is converted into a code image are displayed. A document creation apparatus for creating a printed matter comprising: auxiliary data generation means for generating the auxiliary data from the document data; and an image of the auxiliary image from the auxiliary data generated by the auxiliary data generation means Image conversion means for generating data;
It is provided with.
本発明によれば、文書からサーチャブルファイルを容易に作成でき、しかもファイル容量を小さくできる。 According to the present invention, a searchable file can be easily created from a document, and the file capacity can be reduced.
以下、本発明を実施するための形態について説明する。本発明は、原稿画像が印刷された印刷物から電子検索が可能な電子ファイルであるサーチャブルファイルを高精度で作成可能とするため以下の特徴を有する。即ち、本発明では、印刷物として原稿画像が記録された本文シートを作成するとき、印刷によって失われたデジタル情報をコード画像化した補助画像を表示する記録媒体である補助資料シートを作成し、本文シートと補助資料シートとを1組として取り扱うものである。 Hereinafter, modes for carrying out the present invention will be described. The present invention has the following characteristics in order to make it possible to create a searchable file, which is an electronic file that can be electronically searched, from a printed material on which an original image is printed. That is, according to the present invention, when creating a body sheet on which an original image is recorded as a printed matter, an auxiliary material sheet, which is a recording medium for displaying an auxiliary image in which digital information lost by printing is converted into a code image, is created. A sheet and an auxiliary material sheet are handled as one set.
以下実施形態に係る印刷物、文書作成装置、及びサーチャブルファイル作成装置について説明する。
まず、実施形態に係る印刷物の作成から、この印刷物からサーチャブルファイルを作成するまでの手順について説明する。図1は本発明の実施形態における印刷物の作成からサーチャブルファイル作成までの流れを示す模式図である。
印刷物10を作成するには、文書作成装置100を使用する。文書作成装置100は、コンピュータ200とMFP(Multi Function Printer)300とで構成される。
また、印刷物10からサーチャブルファイルを作成するには、サーチャブルファイル作成装置400を使用する。サーチャブルファイル作成装置400はコンピュータ500とMFP600とで構成される。
この例では、印刷物10は、印刷用紙等のシート状の記録媒体であり、原稿画像30を印刷した本文シート20と、補助画像50を印刷した補助資料シート40とが2枚で1組として取り扱われる。補助画像50は、原稿画像30を印刷するための原稿データの一部をコード画像化したものである。
Hereinafter, a printed matter, a document creation device, and a searchable file creation device according to embodiments will be described.
First, a procedure from creation of a printed material according to the embodiment to creation of a searchable file from the printed material will be described. FIG. 1 is a schematic diagram showing a flow from creation of a printed matter to searchable file creation in the embodiment of the present invention.
In order to create the printed
In addition, the searchable
In this example, the printed
なお、1枚の本文シート20に対して1枚の補助資料シート40を1組とする他、1枚の本文シート20に複数枚の補助資料シート40を組とできる。また複数枚の印刷物10に対して1枚の補助資料シート40を組とできる。更に、1枚の記録媒体の両面に原稿画像30と補助画像50を印刷することができる他、1枚の記録媒体の1方の面に原稿画像30と補助画像50とを印刷することができる。このように、原稿画像30はシート状記録媒体の中で本文を表示する部位(本文表示面)に表示されていれば足りる。同様に、補助画像50はシート状記録媒体の中で補助データを表示する部位(補助資料表示面)に表示されていれば足りる。
シート状記録媒体に対してどのように原稿画像30と補助画像50を形成するかは、印刷物10の使用態様に応じて適宜選択すればよい。
In addition, one
How to form the
文書作成装置100では、コンピュータ200が格納した文書作成ソフト(ワードプロセッサソフト)で本文シート20に印刷すべき内容の原稿データを作成し、これをMFP300によって本文シート20に印刷する。このとき、ユーザーの指定によりサーチャブルファイルの作成を容易にする補助資料シート40の作成が指令される。すると、コンピュータ200は、ユーザーが作成した本文シート20を印刷するための原稿データの他に、補助資料シート40を印刷するための補助データを作成する。MFP300は、これらのデータに基づいて本文シート20に原稿画像30を、補助資料シート40に補助画像50を印刷する。
In the
印刷物10から、サーチャブルファイルを作成するには、本文シート20と補助資料シート40とを一組としてサーチャブルファイル作成装置400のMFP600で光学的に読み取り、原稿画像30及び補助画像50のイメージデータを取得する。そして、補助画像50から補助データを復号する。これにより、MFP600では、補助資料シート40の補助画像50から補助データとしてテキスト等が文字コード等に置き換えられた電子ファイルが作成され、本文シート20のイメージデータと共にコンピュータ500に伝送される。これを受けたコンピュータ500では、本文シート20の記載内容を、電子ファイルによって文字検索したり、カット・アンド・ペースト処理でテキスト等の内容を他の文書に貼り付けたりして利用できる。
次に、実施形態に係る印刷物について説明する。図2は本発明の実施形態に係る印刷物である文書シート及び補助資料シートを示す模式図である。印刷物10は、本文シート20と補助資料シート40とで構成される。本文シート20には、原稿画像30として、所望の文字列21、22、23、26、27、29、写真24、25等のイメージデータの他、表28が原稿画像30として印刷されている。
To create a searchable file from the printed
Next, the printed matter according to the embodiment will be described. FIG. 2 is a schematic diagram showing a document sheet and an auxiliary material sheet that are printed matter according to the embodiment of the present invention. The printed
一方、補助資料シート40には、補助画像50が表示されている。なお、この例では、補助資料シート40には、表題として文字列41が表示されている。補助画像50は、所定の書式で本文シート20のデジタルデータのうち選択したものをエンコード(符号化)してコード画像としたものである。このエンコードされる内容としては、例えば文字列のテキスト内容情報、図形のベクトル情報、イメージデータ参照箇所の情報等である。
On the other hand, an
ここで、補助資料内容の一例を示す。(1)文字列(テキスト)、(2)グラフ、(3)写真により構成されているとする。このような文書の印刷内容特性を表すデジタルデータとしては、(1)テキストのASCIIコード、サイズ、開始位置、字間、フォント名、(2)グラフ内容を作成するためのベクトル情報、(3)本文中に写真が印刷される位置、が挙げられる。これらのデジタルデータが画像変換部で、対応したイメージデータにされ、補助資料シート40に印刷される。なお、(3)本文中に写真が印刷される位置、とは、デジタル化時には、本文中にある写真を参照させる(使用させる)ことを意味し、補助資料シートに、写真自体を構成する内容を含ませていないことを意味している。これは、補助資料シートに許容される情報量によって取捨選択可能であり、(2)グラフ内容を作成するためのベクトル情報、についても、ベクトル情報の代わりに、本文中の図形を参照させても良い。
Here, an example of the contents of the auxiliary material is shown. It is assumed that (1) a character string (text), (2) a graph, and (3) a photograph are included. Digital data representing the print content characteristics of such a document includes (1) ASCII code of text, size, start position, character spacing, font name, (2) vector information for creating graph contents, (3) The position where the photo is printed in the text. These digital data are converted into corresponding image data by the image converter and printed on the
このように、本文シートと補助資料シートとを1組とした印刷物は、紙のため安価に配布ができる。例えば、この印刷物がセミナーテキストである場合、CD(Compact Disc)や他の媒体で配布するより、安価で容易に配布できる。また、この印刷物が広告媒体であるとすると、ユーザーにメリットのある情報を本文シートと一緒に、補助資料シート内に付加することで、電子データとして保存してもらうことが期待できるなどの効果がある。また、この印刷物からサーチャブルファイルを作成する場合には、データ変換時の正確さが期待できる。 As described above, the printed material including the text sheet and the auxiliary material sheet as a set can be distributed at low cost because it is paper. For example, when this printed matter is a seminar text, it can be easily distributed at a lower cost than when it is distributed on a CD (Compact Disc) or other medium. In addition, if this printed matter is an advertising medium, it can be expected to be stored as electronic data by adding information that is beneficial to the user along with the text sheet in the auxiliary material sheet. is there. In addition, when a searchable file is created from this printed matter, accuracy during data conversion can be expected.
次に文書作成装置100及びサーチャブルファイル作成装置400の構成について説明する。まず、文書作成装置100について説明する。図3は文書作成装置の構成を示すブロック図である。文書作成装置100は、コンピュータ200とMFP300とを備えて構成される。
コンピュータ200は、CPU、ROM、RAM等を有する公知の構成を備える。また、コンピュータ200には、ワードプロセッサソフト等の文書作成部210が搭載されている。文書作成部210は使用者の操作により公知の手法で原稿データを作成する。コンピュータ200には、キーボード、マウス等の入力装置220、液晶モニター等の表示装置230が接続されている。ユーザーは入力装置220、表示装置230を使用して文書作成部210で文書を作成する。
Next, the configuration of the
The
また、MFP300には、電子写真方式で画像を形成する画像形成部330の他、表示データ生成部310、及び画像変換部320を備える。表示データ生成部310は、生成された原稿データから補助資料シート40に表示する補助データを選択する。画像変換部320は表示データ生成部310が選択したデータをコード画像化して補助資料シート40の補助画像50を作成するためのイメージデータを作成する。
In addition, the
画像形成部330は、文書作成部210で作成された原稿データに基づいて本文シート20の原稿画像30を印刷し、画像形成部330で形成された画像データに基づいて補助資料シート40の補助画像50を印刷する。なお、本文シート20と補助資料シート40とは対となるが、1枚の本文シート20に対して1枚または2枚以上の補助資料シート40が形成できる。補助資料シート40の枚数は、表示データ生成部310で生成されたデータ量による。これにより、印刷物10として本文シート20及び補助資料シート40が出力される。また、複数枚の本文シートに対して1枚の補助資料シート40を作成することができる。
The
この例では、表示データ生成部310及び画像変換部320をMFP300に配置しているが、表示データ生成部310と画像変換部320は、コンピュータ200に配置することができる。この場合、MFP300に代え、印刷機能だけを備えたプリンタを使用することができる。
In this example, the display
次にサーチャブルファイル作成装置400について説明する。図4はサーチャブルファイル作成装置の構成を示すブロック図である。サーチャブルファイル作成装置400は、コンピュータ500とMFP600とを備えて構成される。コンピュータ500は、CPU、ROM、RAM等の公知の構成の他、サーチャブルファイル格納部510を備える。また、コンピュータ500には、キーボード、マウス等の入力装置520、及び液晶モニター等の表示装置530が接続されている。サーチャブルファイル格納部510は、検索用データ格納部511と、画像データ格納部512とを備える。サーチャブルファイル格納部510は、例えばHDD(Hard Disc Drive)から構成される。
Next, the searchable
MFP600は、スキャナ610と、データ抽出部620と、電子ファイル作成部630とを備える。スキャナ610は、印刷物10である本文シート20及び補助資料シート40をスキャンして画像データを取得する。データ抽出部620は、取得した補助資料シート40の画像データから電子データを抽出する。電子ファイル作成部630は取得した電子データをサーチャブルファイルに加工する。スキャナ610で得られた本文シート20の画像データは、コンピュータ500の画像データ格納部512に格納され、電子ファイル作成部630が作成した電子ファイルは検索用データ格納部511に格納される。そして、これらのデータはサーチャブルファイルとして利用できる。
The
この例ではデータ抽出部620及び電子ファイル作成部630をMFP600に配置しているが、データ抽出部620と電子ファイル作成部630は、コンピュータ500に配置することができる。この場合、MFP600に代え、スキャン機能だけを備えたスキャナを使用することができる。
In this example, the
次にMFP300のコントローラー部について説明する。MFP300は、文書作成装置100とサーチャブルファイル作成装置400とに共通に使用できるものとして説明する。図5は実施形態に係る文書作成装置及びサーチャブルファイル作成装置で使用するMFPのコントローラー部を示すブロック図である。MFP300は、CPU(Central Processing Unit)301、バス302、RAM(Random Access Memory)303、ROM(Read Only Memory)304、HDD(Hard Disc Drive)305、ネットワークIFコントローラー306、スキャナI/F307、プリンタI/F308、操作部309、表示データ生成部310、を備える。
Next, the controller unit of the
CPU301は、MFP300の全体を制御する。バス302は、各部を接続する。RAM303は、CPU301が各処理を行うときワーキングメモリとして使用される。ROM304は不揮発性のデータを記憶する。HDD305は、OS(Operating System)、プログラム、データなどを記憶する。ネットワークIFコントローラー306はネットワークとMFP300とを接続する。スキャナI/F307はスキャナ610が接続されるインターフェースである。プリンタI/F308は、画像形成部330が接続されるインターフェースである。操作部309は、ユーザーがMFP300を操作するためのマン・マシン・インターフェースを構成する。
A
以上の構成は、従来使用されている一般的なMFPのコントローラー部の構成と同じである。本実施形態で使用するMFP300は、文書作成装置100及びサーチャブルファイル作成装置400に使用するため、特徴的な機能を備える。即ち、MFP300は、デジタルデータ/イメージデータエンコード部311、イメージデータ/デジタルデータデコード部312、及びサーチャブルファイル作成部313を備える。
The above configuration is the same as the configuration of a controller unit of a general MFP conventionally used. The
表示データ生成部310は、MFP300で印刷する原稿画像30の内容を表すデジタルデータを、原稿データから抽出した補助データを生成する。具体的には、テキストのコード、フォント名、フォントサイズ、描画位置、イメージデータとして取り扱う画像の描画位置、図形のベクター情報などを抽出する。
Display
デジタルデータ/イメージデータエンコード部311は、前述の表示データ生成部310によって抽出されたデジタルデータに対し、その内容に対応したコード画像のイメージデータに変換する。デジタルデータ/イメージデータエンコード部311は、図3の画像変換部320に相当する。ここで、デジタルデータ/イメージデータエンコード部311は、画像をイメージデータとして取り扱い、イメージデータそのものはエンコードしない。従って、補助画像50に変換する情報量を削減でき、補助資料シート40の枚数を低減できる。
なお、イメージデータへのエンコードにあたり、ユーザーから操作部やPC経由でエンコードパラメータ(変換パラメータ)を設定できる。即ち、デジタルデータ/イメージデータエンコード部311は、エンコードパラメータを設定するエンコードパラメータ設定手段(変換パラメータ設定手段)としても機能する。
The digital data / image
Note that when encoding to image data, an encoding parameter (conversion parameter) can be set from the user via the operation unit or the PC. That is, the digital data / image
作成されたコード画像が、補助画像50として、画像形成部330によって補助資料シート40に印刷される。なお、前述のように、ユーザーにより、エンコードパラメータを設定可能となっているため、コンピュータ200で作成した同一データを印字する場合であっても、パラメータ設定を変えることで、エンコード方法が変わり、結果として、異なる補助画像50が印刷される。従って、パラメータを知っている人のみが、補助資料シート40を正常に活用できることになり、一種の暗号を施すことができる。
エンコードパラメータにより変更できる補助画像50の部分は、例えば(1)ブロック領域エッジ部分のガイドの有無、及び、サイズの差異、(2)サブブロックの縦/横の数の差異、(3)サブブロック周囲のガイドの有無、及び、サイズの差異、(4)1マトリックスのサイズの差異、等を挙げることができる。なお、これらは外観上、補助画像におけるフォーマットの差異として現れる。
The generated code image is printed on the
The parts of the
イメージデータ/デジタルデータデコード部312は、前述のデジタルデータ/イメージデータエンコード部311の逆の処理をするものであり、補助資料シート40をMFP600でスキャンした補助画像50をデコード(復号化)して補助データを抽出する。イメージデータ/デジタルデータデコード部312は、図4のデータ抽出部620に相当する。
サーチャブルファイル作成部313は、イメージデータ/デジタルデータデコード部312によって抽出された補助データと、スキャナI/F307に接続されたスキャナ610による本文シート20のスキャナ結果を使って、サーチャブルファイルを生成する。サーチャブルファイル作成部313は、図4の電子ファイル作成部630に相当する。
The image data / digital
The searchable
サーチャブルファイル作成部313は、サーチャブルファイルを生成するにあたり、スキャナ結果(イメージデータ)の一部を電子データに置き換える。即ち、サーチャブルファイル作成部313は、補助データ部分に含まれる情報を利用して、テキストのコード、フォント名、フォントサイズ、描画位置、図形のベクター情報などを電子データに置き換えたサーチャブルファイルを生成する。これにより、電子データに置換可能なデータをイメージデータのまま保持する場合に比べて、サーチャブルファイルのファイルサイズを削減できる。また、これらを電子データとして取り扱えるので、サーチャブルファイルの取り扱い性や利便性が向上する。なお、サーチャブルファイル作成部313は、補助画像50に含まれる「イメージデータとして取り扱う画像の描画位置」を参照して本文シート中の画像を抽出し、サーチャブルファイル中にイメージデータとして保持する。
The searchable
なお、補助画像50をデコードするにあたり、ユーザーから操作部やPC経由でデコードパラメータ(抽出パラメータ)を設定できる。即ち、イメージデータ/デジタルデータデコード部312は、デコードパラメータを設定するデコードパラメータ設定手段(抽出パラメータ設定部)としても機能する。もちろん、ユーザーは、補助画像50に施されたエンコードパラメータに対応するデコードパラメータを設定しなければ、補助画像50を正常にデコードすることはできない。即ち、補助画像50に含まれる情報を利用できるユーザーの範囲を制限できる。
Note that when decoding the
次に補助資料シート40の補助画像50について説明する。図6は補助資料シートに描かれる補助画像の様式を示す模式図である。図7は図2に示した本文シートに対応する補助資料シートの補助画像が格納したデータを示す図である。図6に示す補助画像50は、2次元コード画像の一種である。
Next, the
図6(a)に示すように、補助資料シート40に形成する補助画像50には、周囲に縦線及び横線として示されるガイド51が表示される。このガイド51で囲まれた四角形領域が1つブロック52とされる。ガイド51は、補助画像50を補助データへデコードするときに、基準位置として使用される。1つのブロック52には、8行8列からなるマトリックスから構成されるサブブロック53が配置される(同図(b)、(c))。各マトリックス単位で白、黒が選択されて印刷される。これにより、各ブロック52の64個の各領域はそれぞれ1ビットの情報を表示し、1つのブロック52で、「8Byte」の情報を表示できる(同図(c))。本実施形態では、補助画像50により、デジタルデータ内容に対応した印字が可能となる。
As shown in FIG. 6A, the
補助資料シート40の補助画像50として、一番左上のブロック52から、8bit=1Byte単位で、2進数1に対応するbitを黒、2進数0に対応するbitを白として描画していく。図6に示した例では、1つのマトリックスを、300dpi画素相当で構成している。この場合、A4縦サイズで、横270ブロック分、縦380ブロック分程度のマトリックスが配置でき、1ブロックで、8Byte分の情報が表示可能である。この例では、270×380×8/1024=801kByte分の情報を表現できることになる。この描画方法は一例であり、ユーザー指示により、冗長性を持たせて描画することもできるし、与えられたパラメータを元にデジタルデータに既知の手法でスクランブルをかけた上で描画しても良い。
また、補助画像50としては、他の形式の一次元コード画像(例:一次元バーコード)、二次元コード画像(例:二次元バーコード)等を使用できる。補助画像50の形式は、補助画像に含む情報量に応じて適宜選択することができる。また、補助画像50として具現化されたコード画像は、機械的に100%の精度でデコード可能な画像であり、OCRのような誤認識を生じさせない。
As the
As the
次に本文シート20の例と、この本文シート20の原稿画像30に対応した補助画像50に格納されるデータについて説明する。図7は図2に示した本文シートに対応する補助資料シートの補助画像が格納したデータを示す図である。図7に示した例では、図2の本文シート20には、原稿画像30として、所望の文字列21、22、23、26、27、29、写真24,25等のイメージデータの他、表28が原稿画像30として印刷されている。
Next, an example of the
そして、補助資料シート40の補助画像50は、原稿画像30を表すデータのうち、選択したデータに基づいて作成される。即ち、補助画像50は、以下のデータに基づいて描かれる。これらは、図7に示すように、文字列21、22、23、26、27の位置、フォント、フォントサイズ、テキストデータ、表28が表す文字列の位置、フォント、フォントサイズ、テキストデータ、文字列29の位置、フォント、フォントサイズ、テキストデータ、写真24、25の位置、表28の罫線の位置が含まれる。この例では表示されるデータは、2Kbyteであり、1枚の補助資料シートに十分格納できる。
The
〔実施態様とその効果〕
以上の実施形態により説明した本発明は、以下の態様にて実施できる。
<印刷物の実施態様1>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備える印刷物10を特徴とする。
ここで、本文表示面とは、シート状記録媒体の中で、本文である原稿画像30が表示されている部位である。また、補助資料表示面とは、シート状記録媒体の中で補助データである補助画像50が表示されている部位である。
本態様の印刷物10では、補助資料表示面に、原稿データの少なくとも一部が機械的に100%の精度でデコード可能な補助画像50に変換されているので、OCRのような誤認識を生じることなく、サーチャブルファイルを容易に作成できる。また、印刷物10からサーチャブルファイルを作成するにあたり、補助画像50から電子データを生成することができるので、サーチャブルファイルのファイルサイズを小さくできる。
[Embodiment and its effects]
The present invention described in the above embodiments can be implemented in the following manner.
<
In this aspect, a text display surface on which a
Here, the text display surface is a portion of the sheet-like recording medium where the
In the printed
<印刷物の実施態様2>
本態様に係る印刷物10は、補助画像50が、原稿データ中の文字のコード、フォント名、フォントサイズ、及び描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、並びに図形のベクター情報の少なくとも1つを画像データに変換したものに基づいて描かれていることを特徴とする。
印刷物10に形成された補助画像50が有する情報は、印刷物10を用いてサーチャブルファイルを生成する場合に、生成されたサーチャブルファイルの取り扱い性や利便性を向上させるような情報である。例えば、補助画像50中にコード画像化された文字コードをデコードし、当該文字コードを埋め込んだサーチャブルファイルを生成すれば、電子的な検索を正確に行うことができるサーチャブルファイルを提供できる。
<印刷物の実施態様3>
本態様は、補助画像50は、一次元または二次元のコード画像である印刷物10を特徴とする。
補助画像50の形式は、補助画像に含む情報量に応じて適宜選択することができる。
<Embodiment 2 of printed matter>
In the printed
The information included in the
<Embodiment 3 of printed matter>
This aspect is characterized in that the
The format of the
<第一の実施態様〜文書作成装置>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10を作成する文書作成装置100の実施態様である。即ち、原稿データから補助データを生成する補助データ生成手段(表示データ生成部310)と、補助データ生成手段により生成された補助データから、補助画像の画像データを生成する画像変換部320と、を備えた文書作成装置100を特徴とする。
本態様の文書作成装置100は、利便性の高いサーチャブルファイルを容易に生成可能な印刷物10を形成するための補助データを生成する。
<第二の実施態様〜文書作成装置>
本態様は、補助データ生成手段(表示データ生成部310)が生成する補助データは、原稿データ中の文字のコード、フォント名、フォントサイズ、及び描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、並びに図形のベクター情報の少なくとも1つを含む文書作成装置100を特徴とする。
表示データ生成部310が生成する補助データは、印刷物10を用いてサーチャブルファイルを生成する場合に、生成されたサーチャブルファイルの取り扱い性や利便性を向上させるような情報を含む。このような補助データをコード画像化した補助画像50を有する印刷物10からは、電子的な検索を正確に行うことができるサーチャブルファイルを作成できる。
<First Embodiment-Document Creation Device>
In this aspect, a text display surface on which a
The
<Second Embodiment-Document Creation Device>
In this aspect, auxiliary data generated by auxiliary data generation means (display data generation unit 310) includes character code, font name, font size, and drawing position information in original data, and drawing position of an image handled as image data. The
The auxiliary data generated by the display
<第三の実施態様〜文書作成装置>
本態様は、補助データから補助画像50の画像データを生成する際に画像変換部320(デジタルデータ/イメージデータエンコード部311)が使用する変換パラメータを設定する変換パラメータ設定手段(画像変換部320、デジタルデータ/イメージデータエンコード部311)を備えた文書作成装置100を特徴とする。
変換パラメータを用いることにより、補助画像50には一種の暗号を施すことができる。
<第四の実施態様〜文書作成装置>
本態様は、記録媒体に原稿画像30及び補助画像50を印刷する印刷手段(MFP300)を備えた文書作成装置100を特徴とする。
原稿画像30及び補助画像50を含む印刷物10を作成できる。
<Third Embodiment-Document Creation Device>
In this aspect, conversion parameter setting means (
By using the conversion parameter, the
<Fourth Embodiment-Document Creation Device>
This aspect is characterized by a
The printed
<第五の実施態様〜サーチャブルファイル作成装置>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10から、電子検索が可能なサーチャブルファイルを作成するサーチャブルファイル作成装置400の実施態様である。即ち、補助画像50を光学的に読み取って補助画像の画像データを取得するスキャナ610と、取得した補助画像の画像データを復号化して、補助データを抽出する補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)と、抽出した補助データから、原稿画像についての電子検索が可能な電子ファイルを作成する電子ファイル作成部630と、を備えたサーチャブルファイル作成装置400を特徴とする。
本態様のサーチャブルファイル作成装置400は、印刷物10から利便性の高いサーチャブルファイルを生成する。
<Fifth Embodiment-Searchable File Creation Device>
In this aspect, a text display surface on which a
The searchable
<第六の実施態様〜サーチャブルファイル作成装置>
本態様は、補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)で抽出されるデジタルデータは、文字のコード、フォント名、フォントサイズ、並びに描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、及び図形のベクター情報の少なくとも一部を含むサーチャブルファイル作成装置400を特徴とする。
データ抽出部620が抽出するデジタルデータを含むサーチャブルファイルは、電子的な検索を正確に行うことができる等、取り扱い性や利便性が高い。
<第七の実施態様〜サーチャブルファイル作成装置>
本態様は、補助画像の画像データから補助データを抽出する際に補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)が使用する抽出パラメータを設定する抽出パラメータ設定手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)を備えたサーチャブルファイル作成装置を特徴とする。
補助画像50を生成する際のパラメータは、一種の暗号として使用することができる。補助画像50に施された変換パラメータに対応する抽出パラメータを設定しなければ、補助画像50を正常にデコードすることはできない。補助画像50に含まれる情報を利用できるユーザーの範囲を制限できる。
<Sixth Embodiment-Searchable File Creation Device>
In this aspect, the digital data extracted by the auxiliary data extraction means (
The searchable file including the digital data extracted by the
<Seventh embodiment-searchable file creation device>
In this aspect, the extraction parameter setting means (data) for setting the extraction parameters used by the auxiliary data extraction means (
The parameters for generating the
<第八の実施態様〜文書作成方法>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10を作成する文書作成方法の実施態様である。この方法は、例えば文書作成装置100によって実行される。即ち、補助データ生成手段(表示データ生成部310)が、原稿データから補助データを生成する補助データ生成ステップと、画像変換手段(画像変換部320)が、補助データ生成手段により生成された補助データから、補助画像の画像データを生成する画像変換ステップと、を含むことを特徴とする。
本態様の文書作成方法では、利便性の高いサーチャブルファイルを容易に生成可能な印刷物10を形成するための補助データを生成する。
<Eighth Embodiment-Document Creation Method>
In this aspect, a text display surface on which a
In the document creation method of this aspect, auxiliary data for forming a printed
10…印刷物、20…本文シート、30…原稿画像、40…補助資料シート、50…補助画像、100…文書作成装置、200…コンピュータ、210…文書作成部、300…MFP、310…表示データ生成部、320…画像変換部、330…画像形成部、400…サーチャブルファイル作成装置、500…コンピュータ、510…サーチャブルファイル格納部、600…MFP、610…スキャナ、620…データ抽出部、630…電子ファイル作成部
DESCRIPTION OF
Claims (8)
前記原稿データから前記補助データを生成する補助データ生成手段と、
前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換手段と、
を備えたことを特徴とする文書作成装置。 A printed matter having a body display surface on which an original image is displayed based on the original data and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the original data into a code image is created. A document creation device,
Auxiliary data generating means for generating the auxiliary data from the document data;
Image conversion means for generating image data of the auxiliary image from the auxiliary data generated by the auxiliary data generation means;
A document creation device characterized by comprising:
前記補助画像を光学的に読み取って前記補助画像の画像データを取得するスキャナと、
取得した前記補助画像の画像データを復号化して、前記補助データを抽出する補助データ抽出手段と、
抽出した前記補助データから、前記原稿画像についての電子検索が可能な電子ファイルを作成する電子ファイル作成手段と、
を備えたことを特徴とするサーチャブルファイル作成装置。 From a printed matter comprising: a text display surface on which a document image is displayed based on document data; and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the document data into a code image is displayed. A searchable file creation device for creating a searchable file capable of electronic search,
A scanner for optically reading the auxiliary image to obtain image data of the auxiliary image;
Auxiliary data extracting means for decoding the acquired image data of the auxiliary image and extracting the auxiliary data;
An electronic file creation means for creating an electronic file that can be electronically searched for the document image from the extracted auxiliary data;
A searchable file creation device characterized by comprising:
請求項5又は6に記載のサーチャブルファイル作成装置。 The searchable according to claim 5 or 6, further comprising extraction parameter setting means for setting an extraction parameter used by the auxiliary data extraction means when extracting the auxiliary data from the image data of the auxiliary image. File creation device.
補助データ生成手段が、前記原稿データから前記補助データを生成する補助データ生成ステップと、
画像変換手段が、前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換ステップと、を含むことを特徴とする文書作成方法。 A printed matter having a body display surface on which an original image is displayed based on the original data and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the original data into a code image is created. A document creation method,
An auxiliary data generating means for generating the auxiliary data from the document data;
An image conversion method, wherein the image conversion means includes an image conversion step of generating image data of the auxiliary image from the auxiliary data generated by the auxiliary data generation means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014034361A JP2015158865A (en) | 2014-02-25 | 2014-02-25 | Document generation device, searchable file generation device, and document generation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014034361A JP2015158865A (en) | 2014-02-25 | 2014-02-25 | Document generation device, searchable file generation device, and document generation device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015158865A true JP2015158865A (en) | 2015-09-03 |
Family
ID=54182791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014034361A Pending JP2015158865A (en) | 2014-02-25 | 2014-02-25 | Document generation device, searchable file generation device, and document generation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015158865A (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991363A (en) * | 1995-09-27 | 1997-04-04 | Canon Inc | Information processor and its method |
JP2001274976A (en) * | 2000-03-24 | 2001-10-05 | Riso Kagaku Corp | Document data creation method and apparatus, and character data restoration method and apparatus |
JP2002318535A (en) * | 2001-04-23 | 2002-10-31 | Canon Inc | Information processor, information processing method, information processing system and information processing program |
JP2004246500A (en) * | 2003-02-12 | 2004-09-02 | Minolta Co Ltd | Documents management program |
JP2006134020A (en) * | 2004-11-05 | 2006-05-25 | Fuji Xerox Co Ltd | Information notification system, information processor, information processing method and computer program |
JP2007318569A (en) * | 2006-05-26 | 2007-12-06 | Kyocera Mita Corp | Electronic device |
US20080089594A1 (en) * | 2006-10-13 | 2008-04-17 | Bayer Theodore F | Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text |
-
2014
- 2014-02-25 JP JP2014034361A patent/JP2015158865A/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991363A (en) * | 1995-09-27 | 1997-04-04 | Canon Inc | Information processor and its method |
JP2001274976A (en) * | 2000-03-24 | 2001-10-05 | Riso Kagaku Corp | Document data creation method and apparatus, and character data restoration method and apparatus |
JP2002318535A (en) * | 2001-04-23 | 2002-10-31 | Canon Inc | Information processor, information processing method, information processing system and information processing program |
JP2004246500A (en) * | 2003-02-12 | 2004-09-02 | Minolta Co Ltd | Documents management program |
JP2006134020A (en) * | 2004-11-05 | 2006-05-25 | Fuji Xerox Co Ltd | Information notification system, information processor, information processing method and computer program |
JP2007318569A (en) * | 2006-05-26 | 2007-12-06 | Kyocera Mita Corp | Electronic device |
US20080089594A1 (en) * | 2006-10-13 | 2008-04-17 | Bayer Theodore F | Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text |
Non-Patent Citations (1)
Title |
---|
田中 知朗、外1名: "トランスメディアシステムによる英文テキスト画像処理", 情報処理学会論文誌, vol. 第38巻,第7号, JPN6017046851, 15 July 1997 (1997-07-15), JP, pages 1389 - 1398, ISSN: 0003697318 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4854491B2 (en) | Image processing apparatus and control method thereof | |
KR101227874B1 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
US8520006B2 (en) | Image processing apparatus and method, and program | |
JP2010191944A (en) | Creation and placement of two-dimensional barcode stamp on printed document for storing authentication information | |
US20070177227A1 (en) | Code information printing apparatus, printing method, restoration apparatus, and restoration method | |
JP2009259220A (en) | Creation and placement of two-dimensional bar code stamp on printed document for storing authentication information | |
US20190138251A1 (en) | Image processing apparatus | |
US9864750B2 (en) | Objectification with deep searchability | |
WO2015140562A1 (en) | Steganographic document alteration | |
JP2012015775A (en) | Image processor | |
US7987494B1 (en) | Method and apparatus providing end to end protection for a document | |
JP6780380B2 (en) | Image processing equipment and programs | |
Ockerbloom | Archiving and preserving PDF files | |
JP2015158865A (en) | Document generation device, searchable file generation device, and document generation device | |
JP2003244424A (en) | Image forming system | |
JP2008158581A (en) | Image processor, its control method, program, and storage medium | |
JP2008160418A (en) | Apparatus, method and program for image processing, and storage medium | |
JP2007005950A (en) | Image processing apparatus and network system | |
JP2004072558A (en) | Electronic whiteboard and method for outputting data of electronic whiteboard | |
JP2016139869A (en) | Image processing device | |
JP5979950B2 (en) | Image processing apparatus, control method therefor, and program | |
JP2007328487A (en) | Two dimensional code generation device, two dimensional code generation method, two dimensional code generation program, information embedding device, information embedding method, information embedding program, and two dimensional code | |
JP2006148753A (en) | Printing data creating device, printing system, method for backing up printing data and program | |
TW591559B (en) | e-information method and system thereof | |
JP6108106B2 (en) | Information embedding device for document files |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180612 |