[go: up one dir, main page]

JP2015158865A - Document generation device, searchable file generation device, and document generation device - Google Patents

Document generation device, searchable file generation device, and document generation device Download PDF

Info

Publication number
JP2015158865A
JP2015158865A JP2014034361A JP2014034361A JP2015158865A JP 2015158865 A JP2015158865 A JP 2015158865A JP 2014034361 A JP2014034361 A JP 2014034361A JP 2014034361 A JP2014034361 A JP 2014034361A JP 2015158865 A JP2015158865 A JP 2015158865A
Authority
JP
Japan
Prior art keywords
image
data
auxiliary
document
searchable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014034361A
Other languages
Japanese (ja)
Inventor
山田 眞弘
Shinko Yamada
眞弘 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2014034361A priority Critical patent/JP2015158865A/en
Publication of JP2015158865A publication Critical patent/JP2015158865A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document generation device for generating a print which allows for easy generation of a searchable file and reduction in the size of the file, and a searchable file generation device which generates a searchable file from the print.SOLUTION: A document generation device 100 generates a print 10 having a text display surface on which a document image 30 based on document data is displayed, and an auxiliary material display surface on which is displayed an auxiliary image 50 having auxiliary data containing at least part of the document data converted into a code image. The document generation device 100 includes auxiliary data generation means 310 for generating the auxiliary data from the document data, and image conversion means 320 for generating image data of an auxiliary image from the auxiliary data generated by the auxiliary data generation means. A text sheet 20 and the document image 30 of the print 10 are read by a searchable file generation device 400 consisting of a computer 500 and a MFP 600, and a searchable file consisting of the document image and the auxiliary data is generated.

Description

本発明は、原稿画像とコード画像である補助画像とを表示した印刷物を作成する文書作成装置、及び印刷物を読み取ってサーチャブルファイルを作成するサーチャブルファイル作成装置に関する。   The present invention relates to a document creation device that creates a printed material on which an original image and an auxiliary image that is a code image are displayed, and a searchable file creation device that creates a searchable file by reading the printed material.

MFP(Multi Function Printer:プリンタ複合機)には、原稿をスキャナで読み取って電子ファイル化することができ、この機能を用いて原稿をサーチャブルファイルの一種であるサーチャブルPDF(Portable Document Format)ファイルを作成できるものがある。ここで、サーチャブルファイルとは、不可視のテキストデータ(文字コードデータ)が付加され、テキスト検索可能なファイルである。このような装置において、サーチャブルPDFファイルは、OCR(Optical Character Recognition:光学文字認識)技術を用いて、原稿に記載されているテキスト情報を抽出し、スキャンしたイメージ画像と共に、テキストデータをPDFファイル内に埋め込むことで作成される。このサーチャブルPDFファイルでは、走査したイメージ画像を視認できるだけでなく、テキストデータが埋め込まれているため、テキストデータを利用して電子的な検索を行ったり、テキストデータを容易にコピー・アンド・ペーストできたりする。   An MFP (Multi Function Printer) can read a document with a scanner and convert it to an electronic file. Using this function, a searchable PDF (Portable Document Format) file, which is a type of searchable file, can be converted. There is something that can be created. Here, the searchable file is a file to which text search is possible by adding invisible text data (character code data). In such an apparatus, the searchable PDF file uses OCR (Optical Character Recognition) technology to extract text information described in a document, and the scanned image and text data are stored in the PDF file. Created by embedding in. In this searchable PDF file, not only can the scanned image be viewed, but also the text data is embedded, so it is possible to perform electronic searches using text data and to easily copy and paste text data. Or

特許文献1には、サーチャブルファイル(サーチャブルPDFファイルやサーチャブルXPS(XML Paper Specification)ファイル等を含めた総称)を作成するにあたり、ユーザーが任意に文字認識レベルを設定できると共に、文字抽出の精度(認識精度)を確認することができ、また、これらの処理を繰り返し行うことで、高品質のサーチャブルファイルを円滑に生成することができる画像形成装置、及び、画像形成プログラムが記載されている。   In Patent Document 1, when creating a searchable file (generic name including a searchable PDF file, a searchable XPS (XML Paper Specification) file, etc.), the user can arbitrarily set the character recognition level and the character extraction accuracy ( (Recognition accuracy) can be confirmed, and an image forming apparatus and an image forming program that can generate a high-quality searchable file smoothly by repeating these processes are described.

OCR技術による文字認識率(認識精度)には限界があり、文字の形状や種類によっては正しく認識できない場合がある。この場合、文章として成り立たないレベルの内容に誤認識されていれば誤認識であることを検出しやすい。しかし、誤認識の結果はさまざまであり、例えば、文章自体は違和感無くつながっているが、全く逆の意味合いの文章が生成されることもある。サーチャブルPDFファイルの場合、ビューワーに表示される内容は、OCRで認識されたテキストデータではなく、イメージとして読み取ったものであるため、この時点では誤認識の影響は受けない。しかし、OCRによる誤認識が発生している場合、テキストデータを利用した電子的な検索時に検索漏れが発生する他、テキストデータのコピー時に誤った内容をコピーしてしまうこととなる。このため、使用用途によっては、人間が元文書と生成された文書とを見比べ、誤っている部分に対して修正を行うという作業が必要となる。   The character recognition rate (recognition accuracy) by the OCR technology has a limit, and depending on the shape and type of the character, it may not be recognized correctly. In this case, if it is misrecognized as content that does not hold as a sentence, it is easy to detect misrecognition. However, there are various misrecognition results. For example, sentences themselves are connected without a sense of incongruity, but sentences having completely opposite meanings may be generated. In the case of a searchable PDF file, the content displayed in the viewer is not text data recognized by OCR but is read as an image, and is not affected by erroneous recognition at this point. However, when misrecognition by OCR has occurred, search omissions occur during electronic search using text data, and erroneous contents are copied when text data is copied. For this reason, depending on the intended use, it is necessary for humans to compare the original document with the generated document and correct the erroneous part.

また、別の問題点として、MFPにてサーチャブルPDFを作成するとき、原稿のテキスト部分については、文字コードに置き換えるわけではなく、イメージデータとして保持する。このため、コンピュータ上でPDFファイルを直接作成し、テキスト部分を文字コードデータとして保持するPDFファイルに比べ、ファイルサイズが大きくなってしまうという問題がある。   As another problem, when a searchable PDF is created by the MFP, the text portion of the document is not replaced with a character code but held as image data. For this reason, there is a problem that the file size becomes larger than that of a PDF file in which a PDF file is directly created on a computer and a text portion is stored as character code data.

本発明は、上記課題に鑑みてなされたものであり、サーチャブルファイルを容易に作成でき、しかもファイル容量を小さくできる印刷物を作成する文書作成装置、及びこの印刷物からサーチャブルファイルを作成するサーチャブルファイル作成装置を提供することを目的とする。   The present invention has been made in view of the above-described problems. A document creation apparatus that creates a printed material that can easily create a searchable file and that can reduce the file capacity, and a searchable that creates a searchable file from the printed material. An object is to provide a file creation device.

上記課題を解決するため、原稿データに基づいて原稿画像が表示された本文表示面と、前記原稿データの少なくとも一部を含む補助データをコード画像化した補助画像が表示された補助資料表示面と、を備えた印刷物を作成する文書作成装置であって、前記原稿データから前記補助データを生成する補助データ生成手段と、前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換手段と、
を備えたことを特徴とする。
In order to solve the above problems, a text display surface on which a document image is displayed based on document data, and an auxiliary material display surface on which an auxiliary image in which auxiliary data including at least a part of the document data is converted into a code image are displayed. A document creation apparatus for creating a printed matter comprising: auxiliary data generation means for generating the auxiliary data from the document data; and an image of the auxiliary image from the auxiliary data generated by the auxiliary data generation means Image conversion means for generating data;
It is provided with.

本発明によれば、文書からサーチャブルファイルを容易に作成でき、しかもファイル容量を小さくできる。   According to the present invention, a searchable file can be easily created from a document, and the file capacity can be reduced.

本発明の実施形態における印刷物の作成からサーチャブルファイル作成までの流れを示す模式図である。It is a schematic diagram which shows the flow from creation of the printed matter to searchable file creation in the embodiment of the present invention. 本発明の実施形態に係る印刷物である文書シート及び補助資料シートを示す模式図である。It is a schematic diagram which shows the document sheet | seat and auxiliary material sheet | seat which are printed matter concerning embodiment of this invention. 文書作成装置の構成を示すブロック図である。It is a block diagram which shows the structure of a document preparation apparatus. サーチャブルファイル作成装置の構成を示すブロック図である。It is a block diagram which shows the structure of a searchable file creation apparatus. 実施形態に係る文書作成装置及びサーチャブルファイル作成装置で使用するMFPのコントローラー部を示すブロック図である。2 is a block diagram illustrating a controller unit of the MFP used in the document creation apparatus and the searchable file creation apparatus according to the embodiment. FIG. 補助資料シートに描かれる補助画像の様式を示す模式図である。It is a schematic diagram which shows the format of the auxiliary image drawn on an auxiliary material sheet. 図2に示した本文シートに対応する補助資料シートの補助画像が格納したデータを示す図である。It is a figure which shows the data which the auxiliary image of the auxiliary material sheet corresponding to the text sheet shown in FIG. 2 stored.

以下、本発明を実施するための形態について説明する。本発明は、原稿画像が印刷された印刷物から電子検索が可能な電子ファイルであるサーチャブルファイルを高精度で作成可能とするため以下の特徴を有する。即ち、本発明では、印刷物として原稿画像が記録された本文シートを作成するとき、印刷によって失われたデジタル情報をコード画像化した補助画像を表示する記録媒体である補助資料シートを作成し、本文シートと補助資料シートとを1組として取り扱うものである。   Hereinafter, modes for carrying out the present invention will be described. The present invention has the following characteristics in order to make it possible to create a searchable file, which is an electronic file that can be electronically searched, from a printed material on which an original image is printed. That is, according to the present invention, when creating a body sheet on which an original image is recorded as a printed matter, an auxiliary material sheet, which is a recording medium for displaying an auxiliary image in which digital information lost by printing is converted into a code image, is created. A sheet and an auxiliary material sheet are handled as one set.

以下実施形態に係る印刷物、文書作成装置、及びサーチャブルファイル作成装置について説明する。
まず、実施形態に係る印刷物の作成から、この印刷物からサーチャブルファイルを作成するまでの手順について説明する。図1は本発明の実施形態における印刷物の作成からサーチャブルファイル作成までの流れを示す模式図である。
印刷物10を作成するには、文書作成装置100を使用する。文書作成装置100は、コンピュータ200とMFP(Multi Function Printer)300とで構成される。
また、印刷物10からサーチャブルファイルを作成するには、サーチャブルファイル作成装置400を使用する。サーチャブルファイル作成装置400はコンピュータ500とMFP600とで構成される。
この例では、印刷物10は、印刷用紙等のシート状の記録媒体であり、原稿画像30を印刷した本文シート20と、補助画像50を印刷した補助資料シート40とが2枚で1組として取り扱われる。補助画像50は、原稿画像30を印刷するための原稿データの一部をコード画像化したものである。
Hereinafter, a printed matter, a document creation device, and a searchable file creation device according to embodiments will be described.
First, a procedure from creation of a printed material according to the embodiment to creation of a searchable file from the printed material will be described. FIG. 1 is a schematic diagram showing a flow from creation of a printed matter to searchable file creation in the embodiment of the present invention.
In order to create the printed matter 10, the document creation device 100 is used. The document creation apparatus 100 includes a computer 200 and an MFP (Multi Function Printer) 300.
In addition, the searchable file creation device 400 is used to create a searchable file from the printed material 10. The searchable file creation device 400 includes a computer 500 and an MFP 600.
In this example, the printed material 10 is a sheet-like recording medium such as printing paper, and the body sheet 20 on which the original image 30 is printed and the auxiliary material sheet 40 on which the auxiliary image 50 is printed are handled as one set. It is. The auxiliary image 50 is obtained by converting a part of document data for printing the document image 30 into a code image.

なお、1枚の本文シート20に対して1枚の補助資料シート40を1組とする他、1枚の本文シート20に複数枚の補助資料シート40を組とできる。また複数枚の印刷物10に対して1枚の補助資料シート40を組とできる。更に、1枚の記録媒体の両面に原稿画像30と補助画像50を印刷することができる他、1枚の記録媒体の1方の面に原稿画像30と補助画像50とを印刷することができる。このように、原稿画像30はシート状記録媒体の中で本文を表示する部位(本文表示面)に表示されていれば足りる。同様に、補助画像50はシート状記録媒体の中で補助データを表示する部位(補助資料表示面)に表示されていれば足りる。
シート状記録媒体に対してどのように原稿画像30と補助画像50を形成するかは、印刷物10の使用態様に応じて適宜選択すればよい。
In addition, one auxiliary material sheet 40 is set as one set for one body sheet 20, and a plurality of auxiliary material sheets 40 can be set as one body sheet 20. Further, one auxiliary material sheet 40 can be paired for a plurality of printed materials 10. Furthermore, the original image 30 and the auxiliary image 50 can be printed on both sides of one recording medium, and the original image 30 and the auxiliary image 50 can be printed on one side of one recording medium. . As described above, it is sufficient that the document image 30 is displayed on the portion (text display surface) where the text is displayed in the sheet-like recording medium. Similarly, it is sufficient that the auxiliary image 50 is displayed on a portion (auxiliary material display surface) for displaying auxiliary data in the sheet-like recording medium.
How to form the original image 30 and the auxiliary image 50 on the sheet-like recording medium may be appropriately selected according to the usage mode of the printed matter 10.

文書作成装置100では、コンピュータ200が格納した文書作成ソフト(ワードプロセッサソフト)で本文シート20に印刷すべき内容の原稿データを作成し、これをMFP300によって本文シート20に印刷する。このとき、ユーザーの指定によりサーチャブルファイルの作成を容易にする補助資料シート40の作成が指令される。すると、コンピュータ200は、ユーザーが作成した本文シート20を印刷するための原稿データの他に、補助資料シート40を印刷するための補助データを作成する。MFP300は、これらのデータに基づいて本文シート20に原稿画像30を、補助資料シート40に補助画像50を印刷する。   In the document creation apparatus 100, document data having contents to be printed on the body sheet 20 is created by document creation software (word processor software) stored in the computer 200, and this is printed on the body sheet 20 by the MFP 300. At this time, creation of the auxiliary material sheet 40 that facilitates creation of the searchable file is instructed by the user's specification. Then, the computer 200 creates auxiliary data for printing the auxiliary material sheet 40 in addition to the original data for printing the body sheet 20 created by the user. Based on these data, the MFP 300 prints the original image 30 on the body sheet 20 and the auxiliary image 50 on the auxiliary material sheet 40.

印刷物10から、サーチャブルファイルを作成するには、本文シート20と補助資料シート40とを一組としてサーチャブルファイル作成装置400のMFP600で光学的に読み取り、原稿画像30及び補助画像50のイメージデータを取得する。そして、補助画像50から補助データを復号する。これにより、MFP600では、補助資料シート40の補助画像50から補助データとしてテキスト等が文字コード等に置き換えられた電子ファイルが作成され、本文シート20のイメージデータと共にコンピュータ500に伝送される。これを受けたコンピュータ500では、本文シート20の記載内容を、電子ファイルによって文字検索したり、カット・アンド・ペースト処理でテキスト等の内容を他の文書に貼り付けたりして利用できる。
次に、実施形態に係る印刷物について説明する。図2は本発明の実施形態に係る印刷物である文書シート及び補助資料シートを示す模式図である。印刷物10は、本文シート20と補助資料シート40とで構成される。本文シート20には、原稿画像30として、所望の文字列21、22、23、26、27、29、写真24、25等のイメージデータの他、表28が原稿画像30として印刷されている。
To create a searchable file from the printed material 10, the text sheet 20 and the auxiliary material sheet 40 are optically read by the MFP 600 of the searchable file creation device 400 as a set, and image data of the original image 30 and the auxiliary image 50 To get. Then, auxiliary data is decoded from the auxiliary image 50. Thus, in MFP 600, an electronic file in which text or the like is replaced as auxiliary data from auxiliary image 50 of auxiliary material sheet 40 is created and transmitted to computer 500 together with image data of body sheet 20. In response to this, the computer 500 can use the description content of the body sheet 20 by searching for characters using an electronic file, or pasting the content of text or the like in another document by cut-and-paste processing.
Next, the printed matter according to the embodiment will be described. FIG. 2 is a schematic diagram showing a document sheet and an auxiliary material sheet that are printed matter according to the embodiment of the present invention. The printed material 10 includes a body sheet 20 and an auxiliary material sheet 40. On the body sheet 20, as a document image 30, a table 28 is printed as a document image 30 in addition to image data such as desired character strings 21, 22, 23, 26, 27 and 29, photographs 24 and 25.

一方、補助資料シート40には、補助画像50が表示されている。なお、この例では、補助資料シート40には、表題として文字列41が表示されている。補助画像50は、所定の書式で本文シート20のデジタルデータのうち選択したものをエンコード(符号化)してコード画像としたものである。このエンコードされる内容としては、例えば文字列のテキスト内容情報、図形のベクトル情報、イメージデータ参照箇所の情報等である。   On the other hand, an auxiliary image 50 is displayed on the auxiliary material sheet 40. In this example, the auxiliary material sheet 40 displays a character string 41 as a title. The auxiliary image 50 is a code image obtained by encoding (encoding) selected digital data of the body sheet 20 in a predetermined format. The contents to be encoded include, for example, text content information of character strings, vector information of graphics, information on image data reference locations, and the like.

ここで、補助資料内容の一例を示す。(1)文字列(テキスト)、(2)グラフ、(3)写真により構成されているとする。このような文書の印刷内容特性を表すデジタルデータとしては、(1)テキストのASCIIコード、サイズ、開始位置、字間、フォント名、(2)グラフ内容を作成するためのベクトル情報、(3)本文中に写真が印刷される位置、が挙げられる。これらのデジタルデータが画像変換部で、対応したイメージデータにされ、補助資料シート40に印刷される。なお、(3)本文中に写真が印刷される位置、とは、デジタル化時には、本文中にある写真を参照させる(使用させる)ことを意味し、補助資料シートに、写真自体を構成する内容を含ませていないことを意味している。これは、補助資料シートに許容される情報量によって取捨選択可能であり、(2)グラフ内容を作成するためのベクトル情報、についても、ベクトル情報の代わりに、本文中の図形を参照させても良い。   Here, an example of the contents of the auxiliary material is shown. It is assumed that (1) a character string (text), (2) a graph, and (3) a photograph are included. Digital data representing the print content characteristics of such a document includes (1) ASCII code of text, size, start position, character spacing, font name, (2) vector information for creating graph contents, (3) The position where the photo is printed in the text. These digital data are converted into corresponding image data by the image converter and printed on the auxiliary material sheet 40. In addition, (3) the position where the photo is printed in the text means that the photo in the text is referred to (used) when digitized, and the contents constituting the photo itself in the auxiliary material sheet Is not included. This can be selected according to the amount of information allowed in the auxiliary material sheet. (2) For vector information for creating the graph contents, it is possible to refer to the figure in the text instead of the vector information. good.

このように、本文シートと補助資料シートとを1組とした印刷物は、紙のため安価に配布ができる。例えば、この印刷物がセミナーテキストである場合、CD(Compact Disc)や他の媒体で配布するより、安価で容易に配布できる。また、この印刷物が広告媒体であるとすると、ユーザーにメリットのある情報を本文シートと一緒に、補助資料シート内に付加することで、電子データとして保存してもらうことが期待できるなどの効果がある。また、この印刷物からサーチャブルファイルを作成する場合には、データ変換時の正確さが期待できる。   As described above, the printed material including the text sheet and the auxiliary material sheet as a set can be distributed at low cost because it is paper. For example, when this printed matter is a seminar text, it can be easily distributed at a lower cost than when it is distributed on a CD (Compact Disc) or other medium. In addition, if this printed matter is an advertising medium, it can be expected to be stored as electronic data by adding information that is beneficial to the user along with the text sheet in the auxiliary material sheet. is there. In addition, when a searchable file is created from this printed matter, accuracy during data conversion can be expected.

次に文書作成装置100及びサーチャブルファイル作成装置400の構成について説明する。まず、文書作成装置100について説明する。図3は文書作成装置の構成を示すブロック図である。文書作成装置100は、コンピュータ200とMFP300とを備えて構成される。
コンピュータ200は、CPU、ROM、RAM等を有する公知の構成を備える。また、コンピュータ200には、ワードプロセッサソフト等の文書作成部210が搭載されている。文書作成部210は使用者の操作により公知の手法で原稿データを作成する。コンピュータ200には、キーボード、マウス等の入力装置220、液晶モニター等の表示装置230が接続されている。ユーザーは入力装置220、表示装置230を使用して文書作成部210で文書を作成する。
Next, the configuration of the document creation device 100 and the searchable file creation device 400 will be described. First, the document creation apparatus 100 will be described. FIG. 3 is a block diagram showing the configuration of the document creation apparatus. The document creation apparatus 100 includes a computer 200 and an MFP 300.
The computer 200 has a known configuration including a CPU, a ROM, a RAM, and the like. Further, the computer 200 includes a document creation unit 210 such as word processor software. The document creation unit 210 creates document data by a known method by a user operation. An input device 220 such as a keyboard and a mouse and a display device 230 such as a liquid crystal monitor are connected to the computer 200. The user creates a document by the document creation unit 210 using the input device 220 and the display device 230.

また、MFP300には、電子写真方式で画像を形成する画像形成部330の他、表示データ生成部310、及び画像変換部320を備える。表示データ生成部310は、生成された原稿データから補助資料シート40に表示する補助データを選択する。画像変換部320は表示データ生成部310が選択したデータをコード画像化して補助資料シート40の補助画像50を作成するためのイメージデータを作成する。   In addition, the MFP 300 includes a display data generation unit 310 and an image conversion unit 320 in addition to an image forming unit 330 that forms an image by electrophotography. The display data generation unit 310 selects auxiliary data to be displayed on the auxiliary material sheet 40 from the generated document data. The image conversion unit 320 converts the data selected by the display data generation unit 310 into a code image and generates image data for generating the auxiliary image 50 of the auxiliary material sheet 40.

画像形成部330は、文書作成部210で作成された原稿データに基づいて本文シート20の原稿画像30を印刷し、画像形成部330で形成された画像データに基づいて補助資料シート40の補助画像50を印刷する。なお、本文シート20と補助資料シート40とは対となるが、1枚の本文シート20に対して1枚または2枚以上の補助資料シート40が形成できる。補助資料シート40の枚数は、表示データ生成部310で生成されたデータ量による。これにより、印刷物10として本文シート20及び補助資料シート40が出力される。また、複数枚の本文シートに対して1枚の補助資料シート40を作成することができる。   The image forming unit 330 prints the original image 30 of the body sheet 20 based on the original data created by the document creating unit 210, and the auxiliary image of the auxiliary material sheet 40 based on the image data formed by the image forming unit 330. 50 is printed. Although the text sheet 20 and the auxiliary material sheet 40 form a pair, one or two or more auxiliary material sheets 40 can be formed on one text sheet 20. The number of auxiliary material sheets 40 depends on the amount of data generated by the display data generation unit 310. As a result, the text sheet 20 and the auxiliary material sheet 40 are output as the printed matter 10. Also, one auxiliary material sheet 40 can be created for a plurality of body sheets.

この例では、表示データ生成部310及び画像変換部320をMFP300に配置しているが、表示データ生成部310と画像変換部320は、コンピュータ200に配置することができる。この場合、MFP300に代え、印刷機能だけを備えたプリンタを使用することができる。   In this example, the display data generation unit 310 and the image conversion unit 320 are arranged in the MFP 300, but the display data generation unit 310 and the image conversion unit 320 can be arranged in the computer 200. In this case, a printer having only a printing function can be used in place of the MFP 300.

次にサーチャブルファイル作成装置400について説明する。図4はサーチャブルファイル作成装置の構成を示すブロック図である。サーチャブルファイル作成装置400は、コンピュータ500とMFP600とを備えて構成される。コンピュータ500は、CPU、ROM、RAM等の公知の構成の他、サーチャブルファイル格納部510を備える。また、コンピュータ500には、キーボード、マウス等の入力装置520、及び液晶モニター等の表示装置530が接続されている。サーチャブルファイル格納部510は、検索用データ格納部511と、画像データ格納部512とを備える。サーチャブルファイル格納部510は、例えばHDD(Hard Disc Drive)から構成される。   Next, the searchable file creation device 400 will be described. FIG. 4 is a block diagram showing the configuration of the searchable file creation apparatus. The searchable file creation apparatus 400 includes a computer 500 and an MFP 600. The computer 500 includes a searchable file storage unit 510 in addition to a known configuration such as a CPU, a ROM, and a RAM. The computer 500 is connected to an input device 520 such as a keyboard and a mouse, and a display device 530 such as a liquid crystal monitor. The searchable file storage unit 510 includes a search data storage unit 511 and an image data storage unit 512. The searchable file storage unit 510 is composed of, for example, an HDD (Hard Disc Drive).

MFP600は、スキャナ610と、データ抽出部620と、電子ファイル作成部630とを備える。スキャナ610は、印刷物10である本文シート20及び補助資料シート40をスキャンして画像データを取得する。データ抽出部620は、取得した補助資料シート40の画像データから電子データを抽出する。電子ファイル作成部630は取得した電子データをサーチャブルファイルに加工する。スキャナ610で得られた本文シート20の画像データは、コンピュータ500の画像データ格納部512に格納され、電子ファイル作成部630が作成した電子ファイルは検索用データ格納部511に格納される。そして、これらのデータはサーチャブルファイルとして利用できる。   The MFP 600 includes a scanner 610, a data extraction unit 620, and an electronic file creation unit 630. The scanner 610 scans the text sheet 20 and the auxiliary material sheet 40 that are the printed matter 10 to acquire image data. The data extraction unit 620 extracts electronic data from the acquired image data of the auxiliary material sheet 40. The electronic file creation unit 630 processes the acquired electronic data into a searchable file. The image data of the body sheet 20 obtained by the scanner 610 is stored in the image data storage unit 512 of the computer 500, and the electronic file created by the electronic file creation unit 630 is stored in the search data storage unit 511. These data can be used as searchable files.

この例ではデータ抽出部620及び電子ファイル作成部630をMFP600に配置しているが、データ抽出部620と電子ファイル作成部630は、コンピュータ500に配置することができる。この場合、MFP600に代え、スキャン機能だけを備えたスキャナを使用することができる。   In this example, the data extraction unit 620 and the electronic file creation unit 630 are arranged in the MFP 600, but the data extraction unit 620 and the electronic file creation unit 630 can be arranged in the computer 500. In this case, instead of the MFP 600, a scanner having only a scan function can be used.

次にMFP300のコントローラー部について説明する。MFP300は、文書作成装置100とサーチャブルファイル作成装置400とに共通に使用できるものとして説明する。図5は実施形態に係る文書作成装置及びサーチャブルファイル作成装置で使用するMFPのコントローラー部を示すブロック図である。MFP300は、CPU(Central Processing Unit)301、バス302、RAM(Random Access Memory)303、ROM(Read Only Memory)304、HDD(Hard Disc Drive)305、ネットワークIFコントローラー306、スキャナI/F307、プリンタI/F308、操作部309、表示データ生成部310、を備える。   Next, the controller unit of the MFP 300 will be described. The MFP 300 will be described as being commonly used by the document creation apparatus 100 and the searchable file creation apparatus 400. FIG. 5 is a block diagram illustrating a controller unit of the MFP used in the document creation apparatus and the searchable file creation apparatus according to the embodiment. The MFP 300 includes a CPU (Central Processing Unit) 301, a bus 302, a RAM (Random Access Memory) 303, a ROM (Read Only Memory) 304, an HDD (Hard Disc Drive) 305, a network IF controller 306, a scanner I / F 307, a printer I. / F308, an operation unit 309, and a display data generation unit 310.

CPU301は、MFP300の全体を制御する。バス302は、各部を接続する。RAM303は、CPU301が各処理を行うときワーキングメモリとして使用される。ROM304は不揮発性のデータを記憶する。HDD305は、OS(Operating System)、プログラム、データなどを記憶する。ネットワークIFコントローラー306はネットワークとMFP300とを接続する。スキャナI/F307はスキャナ610が接続されるインターフェースである。プリンタI/F308は、画像形成部330が接続されるインターフェースである。操作部309は、ユーザーがMFP300を操作するためのマン・マシン・インターフェースを構成する。   A CPU 301 controls the entire MFP 300. A bus 302 connects each unit. The RAM 303 is used as a working memory when the CPU 301 performs each process. The ROM 304 stores nonvolatile data. The HDD 305 stores an OS (Operating System), programs, data, and the like. A network IF controller 306 connects the network and the MFP 300. A scanner I / F 307 is an interface to which a scanner 610 is connected. A printer I / F 308 is an interface to which the image forming unit 330 is connected. The operation unit 309 constitutes a man-machine interface for the user to operate the MFP 300.

以上の構成は、従来使用されている一般的なMFPのコントローラー部の構成と同じである。本実施形態で使用するMFP300は、文書作成装置100及びサーチャブルファイル作成装置400に使用するため、特徴的な機能を備える。即ち、MFP300は、デジタルデータ/イメージデータエンコード部311、イメージデータ/デジタルデータデコード部312、及びサーチャブルファイル作成部313を備える。   The above configuration is the same as the configuration of a controller unit of a general MFP conventionally used. The MFP 300 used in the present embodiment has a characteristic function to be used for the document creation apparatus 100 and the searchable file creation apparatus 400. That is, the MFP 300 includes a digital data / image data encoding unit 311, an image data / digital data decoding unit 312, and a searchable file creation unit 313.

表示データ生成部310は、MFP300で印刷する原稿画像30の内容を表すデジタルデータを、原稿データから抽出した補助データを生成する。具体的には、テキストのコード、フォント名、フォントサイズ、描画位置、イメージデータとして取り扱う画像の描画位置、図形のベクター情報などを抽出する。   Display data generation unit 310 generates auxiliary data obtained by extracting digital data representing the content of document image 30 to be printed by MFP 300 from the document data. Specifically, a text code, font name, font size, drawing position, drawing position of an image handled as image data, vector information of a figure, and the like are extracted.

デジタルデータ/イメージデータエンコード部311は、前述の表示データ生成部310によって抽出されたデジタルデータに対し、その内容に対応したコード画像のイメージデータに変換する。デジタルデータ/イメージデータエンコード部311は、図3の画像変換部320に相当する。ここで、デジタルデータ/イメージデータエンコード部311は、画像をイメージデータとして取り扱い、イメージデータそのものはエンコードしない。従って、補助画像50に変換する情報量を削減でき、補助資料シート40の枚数を低減できる。
なお、イメージデータへのエンコードにあたり、ユーザーから操作部やPC経由でエンコードパラメータ(変換パラメータ)を設定できる。即ち、デジタルデータ/イメージデータエンコード部311は、エンコードパラメータを設定するエンコードパラメータ設定手段(変換パラメータ設定手段)としても機能する。
The digital data / image data encoding unit 311 converts the digital data extracted by the display data generation unit 310 into code image image data corresponding to the content. The digital data / image data encoding unit 311 corresponds to the image conversion unit 320 in FIG. Here, the digital data / image data encoding unit 311 handles an image as image data, and does not encode the image data itself. Therefore, the amount of information to be converted into the auxiliary image 50 can be reduced, and the number of auxiliary material sheets 40 can be reduced.
Note that when encoding to image data, an encoding parameter (conversion parameter) can be set from the user via the operation unit or the PC. That is, the digital data / image data encoding unit 311 also functions as an encoding parameter setting unit (conversion parameter setting unit) for setting an encoding parameter.

作成されたコード画像が、補助画像50として、画像形成部330によって補助資料シート40に印刷される。なお、前述のように、ユーザーにより、エンコードパラメータを設定可能となっているため、コンピュータ200で作成した同一データを印字する場合であっても、パラメータ設定を変えることで、エンコード方法が変わり、結果として、異なる補助画像50が印刷される。従って、パラメータを知っている人のみが、補助資料シート40を正常に活用できることになり、一種の暗号を施すことができる。
エンコードパラメータにより変更できる補助画像50の部分は、例えば(1)ブロック領域エッジ部分のガイドの有無、及び、サイズの差異、(2)サブブロックの縦/横の数の差異、(3)サブブロック周囲のガイドの有無、及び、サイズの差異、(4)1マトリックスのサイズの差異、等を挙げることができる。なお、これらは外観上、補助画像におけるフォーマットの差異として現れる。
The generated code image is printed on the auxiliary material sheet 40 by the image forming unit 330 as the auxiliary image 50. As described above, since the encoding parameter can be set by the user, even when the same data created by the computer 200 is printed, changing the parameter setting changes the encoding method. Different auxiliary images 50 are printed. Therefore, only the person who knows the parameters can use the auxiliary material sheet 40 normally, and a kind of encryption can be applied.
The parts of the auxiliary image 50 that can be changed by the encoding parameter are, for example, (1) the presence / absence of the guide of the block area edge part and the size difference, (2) the difference in the vertical / horizontal number of the sub-block, The presence or absence of surrounding guides and the difference in size, (4) the difference in size of one matrix, and the like can be mentioned. Note that these appear as a format difference in the auxiliary image in appearance.

イメージデータ/デジタルデータデコード部312は、前述のデジタルデータ/イメージデータエンコード部311の逆の処理をするものであり、補助資料シート40をMFP600でスキャンした補助画像50をデコード(復号化)して補助データを抽出する。イメージデータ/デジタルデータデコード部312は、図4のデータ抽出部620に相当する。
サーチャブルファイル作成部313は、イメージデータ/デジタルデータデコード部312によって抽出された補助データと、スキャナI/F307に接続されたスキャナ610による本文シート20のスキャナ結果を使って、サーチャブルファイルを生成する。サーチャブルファイル作成部313は、図4の電子ファイル作成部630に相当する。
The image data / digital data decoding unit 312 performs the reverse process of the digital data / image data encoding unit 311 described above, and decodes (decodes) the auxiliary image 50 obtained by scanning the auxiliary material sheet 40 with the MFP 600. Extract auxiliary data. The image data / digital data decoding unit 312 corresponds to the data extraction unit 620 of FIG.
The searchable file creation unit 313 generates a searchable file using the auxiliary data extracted by the image data / digital data decoding unit 312 and the scanner result of the body sheet 20 by the scanner 610 connected to the scanner I / F 307. To do. The searchable file creation unit 313 corresponds to the electronic file creation unit 630 in FIG.

サーチャブルファイル作成部313は、サーチャブルファイルを生成するにあたり、スキャナ結果(イメージデータ)の一部を電子データに置き換える。即ち、サーチャブルファイル作成部313は、補助データ部分に含まれる情報を利用して、テキストのコード、フォント名、フォントサイズ、描画位置、図形のベクター情報などを電子データに置き換えたサーチャブルファイルを生成する。これにより、電子データに置換可能なデータをイメージデータのまま保持する場合に比べて、サーチャブルファイルのファイルサイズを削減できる。また、これらを電子データとして取り扱えるので、サーチャブルファイルの取り扱い性や利便性が向上する。なお、サーチャブルファイル作成部313は、補助画像50に含まれる「イメージデータとして取り扱う画像の描画位置」を参照して本文シート中の画像を抽出し、サーチャブルファイル中にイメージデータとして保持する。   The searchable file creation unit 313 replaces a part of the scanner result (image data) with electronic data when generating a searchable file. That is, the searchable file creation unit 313 uses the information included in the auxiliary data portion to convert a searchable file obtained by replacing text code, font name, font size, drawing position, graphic vector information, etc. with electronic data. Generate. As a result, the file size of the searchable file can be reduced as compared to the case where data that can be replaced with electronic data is held as image data. Moreover, since these can be handled as electronic data, the handleability and convenience of searchable files are improved. The searchable file creation unit 313 extracts the image in the text sheet with reference to “the drawing position of the image handled as image data” included in the auxiliary image 50, and holds it as image data in the searchable file.

なお、補助画像50をデコードするにあたり、ユーザーから操作部やPC経由でデコードパラメータ(抽出パラメータ)を設定できる。即ち、イメージデータ/デジタルデータデコード部312は、デコードパラメータを設定するデコードパラメータ設定手段(抽出パラメータ設定部)としても機能する。もちろん、ユーザーは、補助画像50に施されたエンコードパラメータに対応するデコードパラメータを設定しなければ、補助画像50を正常にデコードすることはできない。即ち、補助画像50に含まれる情報を利用できるユーザーの範囲を制限できる。   Note that when decoding the auxiliary image 50, a decoding parameter (extraction parameter) can be set by the user via the operation unit or the PC. In other words, the image data / digital data decoding unit 312 also functions as decoding parameter setting means (extraction parameter setting unit) for setting decoding parameters. Of course, the user cannot normally decode the auxiliary image 50 unless the decoding parameter corresponding to the encoding parameter applied to the auxiliary image 50 is set. That is, the range of users who can use the information included in the auxiliary image 50 can be limited.

次に補助資料シート40の補助画像50について説明する。図6は補助資料シートに描かれる補助画像の様式を示す模式図である。図7は図2に示した本文シートに対応する補助資料シートの補助画像が格納したデータを示す図である。図6に示す補助画像50は、2次元コード画像の一種である。   Next, the auxiliary image 50 of the auxiliary material sheet 40 will be described. FIG. 6 is a schematic diagram showing the format of the auxiliary image drawn on the auxiliary material sheet. FIG. 7 is a diagram showing data stored in the auxiliary image of the auxiliary material sheet corresponding to the body sheet shown in FIG. The auxiliary image 50 shown in FIG. 6 is a kind of two-dimensional code image.

図6(a)に示すように、補助資料シート40に形成する補助画像50には、周囲に縦線及び横線として示されるガイド51が表示される。このガイド51で囲まれた四角形領域が1つブロック52とされる。ガイド51は、補助画像50を補助データへデコードするときに、基準位置として使用される。1つのブロック52には、8行8列からなるマトリックスから構成されるサブブロック53が配置される(同図(b)、(c))。各マトリックス単位で白、黒が選択されて印刷される。これにより、各ブロック52の64個の各領域はそれぞれ1ビットの情報を表示し、1つのブロック52で、「8Byte」の情報を表示できる(同図(c))。本実施形態では、補助画像50により、デジタルデータ内容に対応した印字が可能となる。   As shown in FIG. 6A, the auxiliary image 50 formed on the auxiliary material sheet 40 is displayed with guides 51 shown as vertical lines and horizontal lines around it. One rectangular area surrounded by the guide 51 is a block 52. The guide 51 is used as a reference position when the auxiliary image 50 is decoded into auxiliary data. In one block 52, a sub-block 53 composed of a matrix of 8 rows and 8 columns is arranged (FIGS. (B) and (c)). White and black are selected and printed for each matrix unit. As a result, each of the 64 areas of each block 52 displays 1-bit information, and the information of “8 Bytes” can be displayed in one block 52 ((c) in the figure). In the present embodiment, the auxiliary image 50 enables printing corresponding to the digital data content.

補助資料シート40の補助画像50として、一番左上のブロック52から、8bit=1Byte単位で、2進数1に対応するbitを黒、2進数0に対応するbitを白として描画していく。図6に示した例では、1つのマトリックスを、300dpi画素相当で構成している。この場合、A4縦サイズで、横270ブロック分、縦380ブロック分程度のマトリックスが配置でき、1ブロックで、8Byte分の情報が表示可能である。この例では、270×380×8/1024=801kByte分の情報を表現できることになる。この描画方法は一例であり、ユーザー指示により、冗長性を持たせて描画することもできるし、与えられたパラメータを元にデジタルデータに既知の手法でスクランブルをかけた上で描画しても良い。
また、補助画像50としては、他の形式の一次元コード画像(例:一次元バーコード)、二次元コード画像(例:二次元バーコード)等を使用できる。補助画像50の形式は、補助画像に含む情報量に応じて適宜選択することができる。また、補助画像50として具現化されたコード画像は、機械的に100%の精度でデコード可能な画像であり、OCRのような誤認識を生じさせない。
As the auxiliary image 50 of the auxiliary material sheet 40, the bit corresponding to the binary number 1 is drawn in black, the bit corresponding to the binary number 0 is drawn as white in units of 8 bits = 1 byte from the upper left block 52. In the example shown in FIG. 6, one matrix is configured with 300 dpi pixels. In this case, a matrix of about 270 blocks in width and 380 blocks in length can be arranged in A4 vertical size, and information for 8 bytes can be displayed in one block. In this example, 270 × 380 × 8/1024 = 801 kBytes of information can be expressed. This drawing method is an example, and drawing can be performed with redundancy according to a user instruction, or drawing can be performed after scrambled digital data by a known method based on given parameters. .
As the auxiliary image 50, other types of one-dimensional code images (eg, one-dimensional barcode), two-dimensional code images (eg, two-dimensional barcode), and the like can be used. The format of the auxiliary image 50 can be appropriately selected according to the amount of information included in the auxiliary image. Further, the code image embodied as the auxiliary image 50 is an image that can be mechanically decoded with 100% accuracy, and does not cause erroneous recognition like OCR.

次に本文シート20の例と、この本文シート20の原稿画像30に対応した補助画像50に格納されるデータについて説明する。図7は図2に示した本文シートに対応する補助資料シートの補助画像が格納したデータを示す図である。図7に示した例では、図2の本文シート20には、原稿画像30として、所望の文字列21、22、23、26、27、29、写真24,25等のイメージデータの他、表28が原稿画像30として印刷されている。   Next, an example of the body sheet 20 and data stored in the auxiliary image 50 corresponding to the document image 30 of the body sheet 20 will be described. FIG. 7 is a diagram showing data stored in the auxiliary image of the auxiliary material sheet corresponding to the body sheet shown in FIG. In the example shown in FIG. 7, the text sheet 20 of FIG. 2 includes the image data such as desired character strings 21, 22, 23, 26, 27, 29, photographs 24, 25, etc. 28 is printed as a document image 30.

そして、補助資料シート40の補助画像50は、原稿画像30を表すデータのうち、選択したデータに基づいて作成される。即ち、補助画像50は、以下のデータに基づいて描かれる。これらは、図7に示すように、文字列21、22、23、26、27の位置、フォント、フォントサイズ、テキストデータ、表28が表す文字列の位置、フォント、フォントサイズ、テキストデータ、文字列29の位置、フォント、フォントサイズ、テキストデータ、写真24、25の位置、表28の罫線の位置が含まれる。この例では表示されるデータは、2Kbyteであり、1枚の補助資料シートに十分格納できる。   The auxiliary image 50 of the auxiliary material sheet 40 is created based on the selected data among the data representing the document image 30. That is, the auxiliary image 50 is drawn based on the following data. As shown in FIG. 7, these are the positions of character strings 21, 22, 23, 26, 27, font, font size, text data, the position of the character string represented by Table 28, font, font size, text data, character The position of the column 29, the font, the font size, the text data, the positions of the photographs 24 and 25, and the position of the ruled line in the table 28 are included. In this example, the displayed data is 2 Kbytes, which can be sufficiently stored in one auxiliary material sheet.

〔実施態様とその効果〕
以上の実施形態により説明した本発明は、以下の態様にて実施できる。
<印刷物の実施態様1>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備える印刷物10を特徴とする。
ここで、本文表示面とは、シート状記録媒体の中で、本文である原稿画像30が表示されている部位である。また、補助資料表示面とは、シート状記録媒体の中で補助データである補助画像50が表示されている部位である。
本態様の印刷物10では、補助資料表示面に、原稿データの少なくとも一部が機械的に100%の精度でデコード可能な補助画像50に変換されているので、OCRのような誤認識を生じることなく、サーチャブルファイルを容易に作成できる。また、印刷物10からサーチャブルファイルを作成するにあたり、補助画像50から電子データを生成することができるので、サーチャブルファイルのファイルサイズを小さくできる。
[Embodiment and its effects]
The present invention described in the above embodiments can be implemented in the following manner.
<Embodiment 1 of printed matter>
In this aspect, a text display surface on which a document image 30 is displayed based on document data, and an auxiliary material display surface on which an auxiliary image 50 in which auxiliary data including at least part of the document data is converted into a code image are displayed. The printed matter 10 is provided.
Here, the text display surface is a portion of the sheet-like recording medium where the document image 30 that is the text is displayed. Further, the auxiliary material display surface is a part where the auxiliary image 50 as auxiliary data is displayed in the sheet-like recording medium.
In the printed matter 10 of this aspect, since at least part of the document data is mechanically converted into the auxiliary image 50 that can be decoded with 100% accuracy on the auxiliary material display surface, erroneous recognition such as OCR occurs. And searchable files can be created easily. In addition, when creating a searchable file from the printed material 10, electronic data can be generated from the auxiliary image 50, so that the file size of the searchable file can be reduced.

<印刷物の実施態様2>
本態様に係る印刷物10は、補助画像50が、原稿データ中の文字のコード、フォント名、フォントサイズ、及び描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、並びに図形のベクター情報の少なくとも1つを画像データに変換したものに基づいて描かれていることを特徴とする。
印刷物10に形成された補助画像50が有する情報は、印刷物10を用いてサーチャブルファイルを生成する場合に、生成されたサーチャブルファイルの取り扱い性や利便性を向上させるような情報である。例えば、補助画像50中にコード画像化された文字コードをデコードし、当該文字コードを埋め込んだサーチャブルファイルを生成すれば、電子的な検索を正確に行うことができるサーチャブルファイルを提供できる。
<印刷物の実施態様3>
本態様は、補助画像50は、一次元または二次元のコード画像である印刷物10を特徴とする。
補助画像50の形式は、補助画像に含む情報量に応じて適宜選択することができる。
<Embodiment 2 of printed matter>
In the printed matter 10 according to this aspect, the auxiliary image 50 includes information on character codes, font names, font sizes, and drawing positions in document data, drawing position information of images handled as image data, and graphic vector information. It is drawn based on what converted at least one into image data.
The information included in the auxiliary image 50 formed on the printed material 10 is information that improves the handling and convenience of the generated searchable file when the searchable file is generated using the printed material 10. For example, if a character code converted into a code image in the auxiliary image 50 is decoded and a searchable file in which the character code is embedded is generated, a searchable file that can be accurately searched electronically can be provided.
<Embodiment 3 of printed matter>
This aspect is characterized in that the auxiliary image 50 is a printed material 10 that is a one-dimensional or two-dimensional code image.
The format of the auxiliary image 50 can be appropriately selected according to the amount of information included in the auxiliary image.

<第一の実施態様〜文書作成装置>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10を作成する文書作成装置100の実施態様である。即ち、原稿データから補助データを生成する補助データ生成手段(表示データ生成部310)と、補助データ生成手段により生成された補助データから、補助画像の画像データを生成する画像変換部320と、を備えた文書作成装置100を特徴とする。
本態様の文書作成装置100は、利便性の高いサーチャブルファイルを容易に生成可能な印刷物10を形成するための補助データを生成する。
<第二の実施態様〜文書作成装置>
本態様は、補助データ生成手段(表示データ生成部310)が生成する補助データは、原稿データ中の文字のコード、フォント名、フォントサイズ、及び描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、並びに図形のベクター情報の少なくとも1つを含む文書作成装置100を特徴とする。
表示データ生成部310が生成する補助データは、印刷物10を用いてサーチャブルファイルを生成する場合に、生成されたサーチャブルファイルの取り扱い性や利便性を向上させるような情報を含む。このような補助データをコード画像化した補助画像50を有する印刷物10からは、電子的な検索を正確に行うことができるサーチャブルファイルを作成できる。
<First Embodiment-Document Creation Device>
In this aspect, a text display surface on which a document image 30 is displayed based on document data, and an auxiliary material display surface on which an auxiliary image 50 in which auxiliary data including at least part of the document data is converted into a code image are displayed 1 is an embodiment of a document creation device 100 that creates a provided printed matter 10; That is, an auxiliary data generation unit (display data generation unit 310) that generates auxiliary data from document data, and an image conversion unit 320 that generates image data of an auxiliary image from auxiliary data generated by the auxiliary data generation unit. The document creation apparatus 100 is provided.
The document creation apparatus 100 of this aspect generates auxiliary data for forming the printed material 10 that can easily generate a highly convenient searchable file.
<Second Embodiment-Document Creation Device>
In this aspect, auxiliary data generated by auxiliary data generation means (display data generation unit 310) includes character code, font name, font size, and drawing position information in original data, and drawing position of an image handled as image data. The document creation apparatus 100 includes at least one of the following information and graphic vector information.
The auxiliary data generated by the display data generating unit 310 includes information that improves the handling and convenience of the generated searchable file when the searchable file is generated using the printed matter 10. From the printed matter 10 having the auxiliary image 50 obtained by converting such auxiliary data into a code image, a searchable file that can be accurately searched electronically can be created.

<第三の実施態様〜文書作成装置>
本態様は、補助データから補助画像50の画像データを生成する際に画像変換部320(デジタルデータ/イメージデータエンコード部311)が使用する変換パラメータを設定する変換パラメータ設定手段(画像変換部320、デジタルデータ/イメージデータエンコード部311)を備えた文書作成装置100を特徴とする。
変換パラメータを用いることにより、補助画像50には一種の暗号を施すことができる。
<第四の実施態様〜文書作成装置>
本態様は、記録媒体に原稿画像30及び補助画像50を印刷する印刷手段(MFP300)を備えた文書作成装置100を特徴とする。
原稿画像30及び補助画像50を含む印刷物10を作成できる。
<Third Embodiment-Document Creation Device>
In this aspect, conversion parameter setting means (image conversion unit 320, image conversion unit 320, setting conversion parameters used by the image conversion unit 320 (digital data / image data encoding unit 311) when generating image data of the auxiliary image 50 from auxiliary data. The document creation apparatus 100 includes a digital data / image data encoding unit 311).
By using the conversion parameter, the auxiliary image 50 can be subjected to a kind of encryption.
<Fourth Embodiment-Document Creation Device>
This aspect is characterized by a document creation apparatus 100 including a printing unit (MFP 300) that prints a document image 30 and an auxiliary image 50 on a recording medium.
The printed material 10 including the document image 30 and the auxiliary image 50 can be created.

<第五の実施態様〜サーチャブルファイル作成装置>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10から、電子検索が可能なサーチャブルファイルを作成するサーチャブルファイル作成装置400の実施態様である。即ち、補助画像50を光学的に読み取って補助画像の画像データを取得するスキャナ610と、取得した補助画像の画像データを復号化して、補助データを抽出する補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)と、抽出した補助データから、原稿画像についての電子検索が可能な電子ファイルを作成する電子ファイル作成部630と、を備えたサーチャブルファイル作成装置400を特徴とする。
本態様のサーチャブルファイル作成装置400は、印刷物10から利便性の高いサーチャブルファイルを生成する。
<Fifth Embodiment-Searchable File Creation Device>
In this aspect, a text display surface on which a document image 30 is displayed based on document data, and an auxiliary material display surface on which an auxiliary image 50 in which auxiliary data including at least part of the document data is converted into a code image are displayed. This is an embodiment of the searchable file creation device 400 that creates a searchable file that can be electronically searched from the provided printed material 10. That is, a scanner 610 that optically reads the auxiliary image 50 to acquire image data of the auxiliary image, and auxiliary data extraction means (a data extraction unit 620, which decodes the acquired image data of the auxiliary image and extracts auxiliary data. The searchable file creation device 400 includes an image data / digital data decoding unit 312) and an electronic file creation unit 630 that creates an electronic file that can be electronically searched for a document image from the extracted auxiliary data. To do.
The searchable file creation device 400 of this aspect generates a searchable file that is highly convenient from the printed material 10.

<第六の実施態様〜サーチャブルファイル作成装置>
本態様は、補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)で抽出されるデジタルデータは、文字のコード、フォント名、フォントサイズ、並びに描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、及び図形のベクター情報の少なくとも一部を含むサーチャブルファイル作成装置400を特徴とする。
データ抽出部620が抽出するデジタルデータを含むサーチャブルファイルは、電子的な検索を正確に行うことができる等、取り扱い性や利便性が高い。
<第七の実施態様〜サーチャブルファイル作成装置>
本態様は、補助画像の画像データから補助データを抽出する際に補助データ抽出手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)が使用する抽出パラメータを設定する抽出パラメータ設定手段(データ抽出部620、イメージデータ/デジタルデータデコード部312)を備えたサーチャブルファイル作成装置を特徴とする。
補助画像50を生成する際のパラメータは、一種の暗号として使用することができる。補助画像50に施された変換パラメータに対応する抽出パラメータを設定しなければ、補助画像50を正常にデコードすることはできない。補助画像50に含まれる情報を利用できるユーザーの範囲を制限できる。
<Sixth Embodiment-Searchable File Creation Device>
In this aspect, the digital data extracted by the auxiliary data extraction means (data extraction unit 620, image data / digital data decoding unit 312) is character code, font name, font size, drawing position information, and image data. The searchable file creation apparatus 400 includes at least part of information on drawing positions of images to be handled and vector information of graphics.
The searchable file including the digital data extracted by the data extraction unit 620 has high handleability and convenience, such as being able to perform an electronic search accurately.
<Seventh embodiment-searchable file creation device>
In this aspect, the extraction parameter setting means (data) for setting the extraction parameters used by the auxiliary data extraction means (data extraction unit 620, image data / digital data decoding unit 312) when extracting auxiliary data from the image data of the auxiliary image. A searchable file creation apparatus including an extraction unit 620 and an image data / digital data decoding unit 312) is characterized.
The parameters for generating the auxiliary image 50 can be used as a kind of encryption. The auxiliary image 50 cannot be normally decoded unless the extraction parameter corresponding to the conversion parameter applied to the auxiliary image 50 is set. The range of users who can use the information included in the auxiliary image 50 can be limited.

<第八の実施態様〜文書作成方法>
本態様は、原稿データに基づいて原稿画像30が表示された本文表示面と、原稿データの少なくとも一部を含む補助データをコード画像化した補助画像50が表示された補助資料表示面と、を備えた印刷物10を作成する文書作成方法の実施態様である。この方法は、例えば文書作成装置100によって実行される。即ち、補助データ生成手段(表示データ生成部310)が、原稿データから補助データを生成する補助データ生成ステップと、画像変換手段(画像変換部320)が、補助データ生成手段により生成された補助データから、補助画像の画像データを生成する画像変換ステップと、を含むことを特徴とする。
本態様の文書作成方法では、利便性の高いサーチャブルファイルを容易に生成可能な印刷物10を形成するための補助データを生成する。
<Eighth Embodiment-Document Creation Method>
In this aspect, a text display surface on which a document image 30 is displayed based on document data, and an auxiliary material display surface on which an auxiliary image 50 in which auxiliary data including at least part of the document data is converted into a code image are displayed. It is an embodiment of a document creation method for creating the printed matter 10 provided. This method is executed by the document creation apparatus 100, for example. That is, the auxiliary data generation unit (display data generation unit 310) generates auxiliary data from the document data, and the image conversion unit (image conversion unit 320) generates auxiliary data generated by the auxiliary data generation unit. And an image conversion step of generating image data of the auxiliary image.
In the document creation method of this aspect, auxiliary data for forming a printed matter 10 that can easily generate a highly convenient searchable file is generated.

10…印刷物、20…本文シート、30…原稿画像、40…補助資料シート、50…補助画像、100…文書作成装置、200…コンピュータ、210…文書作成部、300…MFP、310…表示データ生成部、320…画像変換部、330…画像形成部、400…サーチャブルファイル作成装置、500…コンピュータ、510…サーチャブルファイル格納部、600…MFP、610…スキャナ、620…データ抽出部、630…電子ファイル作成部   DESCRIPTION OF SYMBOLS 10 ... Printed matter, 20 ... Text sheet, 30 ... Original image, 40 ... Auxiliary material sheet, 50 ... Auxiliary image, 100 ... Document creation apparatus, 200 ... Computer, 210 ... Document creation part, 300 ... MFP, 310 ... Display data generation , 320 ... Image conversion unit, 330 ... Image forming unit, 400 ... Searchable file creation device, 500 ... Computer, 510 ... Searchable file storage unit, 600 ... MFP, 610 ... Scanner, 620 ... Data extraction unit, 630 ... Electronic file creation department

特開2012−073749公報JP2012-073749

Claims (8)

原稿データに基づいて原稿画像が表示された本文表示面と、前記原稿データの少なくとも一部を含む補助データをコード画像化した補助画像が表示された補助資料表示面と、を備えた印刷物を作成する文書作成装置であって、
前記原稿データから前記補助データを生成する補助データ生成手段と、
前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換手段と、
を備えたことを特徴とする文書作成装置。
A printed matter having a body display surface on which an original image is displayed based on the original data and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the original data into a code image is created. A document creation device,
Auxiliary data generating means for generating the auxiliary data from the document data;
Image conversion means for generating image data of the auxiliary image from the auxiliary data generated by the auxiliary data generation means;
A document creation device characterized by comprising:
前記補助データ生成手段が生成する前記補助データは、前記原稿データ中の文字のコード、フォント名、フォントサイズ、及び描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、並びに図形のベクター情報の少なくとも1つを含むことを特徴とする請求項1に記載の文書作成装置。   The auxiliary data generated by the auxiliary data generating means includes character code, font name, font size, and drawing position information in the document data, drawing position information of an image handled as image data, and graphic vector information. The document creation apparatus according to claim 1, comprising at least one of the following. 前記補助データから前記補助画像の画像データを生成する際に前記画像変換手段が使用する変換パラメータを設定する変換パラメータ設定手段を備えたことを特徴とする請求項1又は2に記載の文書作成装置。   3. The document creation apparatus according to claim 1, further comprising conversion parameter setting means for setting a conversion parameter used by the image conversion means when generating image data of the auxiliary image from the auxiliary data. . 記録媒体に前記原稿画像及び前記補助画像を印刷する印刷手段を備えたことを特徴とする請求項1乃至3のいずれか一項に記載の文書作成装置。   4. The document creation apparatus according to claim 1, further comprising a printing unit that prints the document image and the auxiliary image on a recording medium. 原稿データに基づいて原稿画像が表示された本文表示面と、前記原稿データの少なくとも一部を含む補助データをコード画像化した補助画像が表示された補助資料表示面と、を備えた印刷物から、電子検索が可能なサーチャブルファイルを作成するサーチャブルファイル作成装置であって、
前記補助画像を光学的に読み取って前記補助画像の画像データを取得するスキャナと、
取得した前記補助画像の画像データを復号化して、前記補助データを抽出する補助データ抽出手段と、
抽出した前記補助データから、前記原稿画像についての電子検索が可能な電子ファイルを作成する電子ファイル作成手段と、
を備えたことを特徴とするサーチャブルファイル作成装置。
From a printed matter comprising: a text display surface on which a document image is displayed based on document data; and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the document data into a code image is displayed. A searchable file creation device for creating a searchable file capable of electronic search,
A scanner for optically reading the auxiliary image to obtain image data of the auxiliary image;
Auxiliary data extracting means for decoding the acquired image data of the auxiliary image and extracting the auxiliary data;
An electronic file creation means for creating an electronic file that can be electronically searched for the document image from the extracted auxiliary data;
A searchable file creation device characterized by comprising:
前記補助データ抽出手段で抽出されるデジタルデータは、文字のコード、フォント名、フォントサイズ、並びに描画位置の情報、イメージデータとして取り扱う画像の描画位置の情報、及び図形のベクター情報の少なくとも一部を含むことを特徴とする請求項5に記載のサーチャブルファイル作成装置。   The digital data extracted by the auxiliary data extraction means includes at least a part of character code, font name, font size, drawing position information, image drawing position information handled as image data, and graphic vector information. The searchable file creation device according to claim 5, further comprising: 前記補助画像の画像データから前記補助データを抽出する際に前記補助データ抽出手段が使用する抽出パラメータを設定する抽出パラメータ設定手段を備えたことを特徴とする
請求項5又は6に記載のサーチャブルファイル作成装置。
The searchable according to claim 5 or 6, further comprising extraction parameter setting means for setting an extraction parameter used by the auxiliary data extraction means when extracting the auxiliary data from the image data of the auxiliary image. File creation device.
原稿データに基づいて原稿画像が表示された本文表示面と、前記原稿データの少なくとも一部を含む補助データをコード画像化した補助画像が表示された補助資料表示面と、を備えた印刷物を作成する文書作成方法であって、
補助データ生成手段が、前記原稿データから前記補助データを生成する補助データ生成ステップと、
画像変換手段が、前記補助データ生成手段により生成された前記補助データから、前記補助画像の画像データを生成する画像変換ステップと、を含むことを特徴とする文書作成方法。
A printed matter having a body display surface on which an original image is displayed based on the original data and an auxiliary material display surface on which an auxiliary image obtained by converting auxiliary data including at least a part of the original data into a code image is created. A document creation method,
An auxiliary data generating means for generating the auxiliary data from the document data;
An image conversion method, wherein the image conversion means includes an image conversion step of generating image data of the auxiliary image from the auxiliary data generated by the auxiliary data generation means.
JP2014034361A 2014-02-25 2014-02-25 Document generation device, searchable file generation device, and document generation device Pending JP2015158865A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014034361A JP2015158865A (en) 2014-02-25 2014-02-25 Document generation device, searchable file generation device, and document generation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014034361A JP2015158865A (en) 2014-02-25 2014-02-25 Document generation device, searchable file generation device, and document generation device

Publications (1)

Publication Number Publication Date
JP2015158865A true JP2015158865A (en) 2015-09-03

Family

ID=54182791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014034361A Pending JP2015158865A (en) 2014-02-25 2014-02-25 Document generation device, searchable file generation device, and document generation device

Country Status (1)

Country Link
JP (1) JP2015158865A (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991363A (en) * 1995-09-27 1997-04-04 Canon Inc Information processor and its method
JP2001274976A (en) * 2000-03-24 2001-10-05 Riso Kagaku Corp Document data creation method and apparatus, and character data restoration method and apparatus
JP2002318535A (en) * 2001-04-23 2002-10-31 Canon Inc Information processor, information processing method, information processing system and information processing program
JP2004246500A (en) * 2003-02-12 2004-09-02 Minolta Co Ltd Documents management program
JP2006134020A (en) * 2004-11-05 2006-05-25 Fuji Xerox Co Ltd Information notification system, information processor, information processing method and computer program
JP2007318569A (en) * 2006-05-26 2007-12-06 Kyocera Mita Corp Electronic device
US20080089594A1 (en) * 2006-10-13 2008-04-17 Bayer Theodore F Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991363A (en) * 1995-09-27 1997-04-04 Canon Inc Information processor and its method
JP2001274976A (en) * 2000-03-24 2001-10-05 Riso Kagaku Corp Document data creation method and apparatus, and character data restoration method and apparatus
JP2002318535A (en) * 2001-04-23 2002-10-31 Canon Inc Information processor, information processing method, information processing system and information processing program
JP2004246500A (en) * 2003-02-12 2004-09-02 Minolta Co Ltd Documents management program
JP2006134020A (en) * 2004-11-05 2006-05-25 Fuji Xerox Co Ltd Information notification system, information processor, information processing method and computer program
JP2007318569A (en) * 2006-05-26 2007-12-06 Kyocera Mita Corp Electronic device
US20080089594A1 (en) * 2006-10-13 2008-04-17 Bayer Theodore F Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田中 知朗、外1名: "トランスメディアシステムによる英文テキスト画像処理", 情報処理学会論文誌, vol. 第38巻,第7号, JPN6017046851, 15 July 1997 (1997-07-15), JP, pages 1389 - 1398, ISSN: 0003697318 *

Similar Documents

Publication Publication Date Title
JP4854491B2 (en) Image processing apparatus and control method thereof
KR101227874B1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
US8520006B2 (en) Image processing apparatus and method, and program
JP2010191944A (en) Creation and placement of two-dimensional barcode stamp on printed document for storing authentication information
US20070177227A1 (en) Code information printing apparatus, printing method, restoration apparatus, and restoration method
JP2009259220A (en) Creation and placement of two-dimensional bar code stamp on printed document for storing authentication information
US20190138251A1 (en) Image processing apparatus
US9864750B2 (en) Objectification with deep searchability
WO2015140562A1 (en) Steganographic document alteration
JP2012015775A (en) Image processor
US7987494B1 (en) Method and apparatus providing end to end protection for a document
JP6780380B2 (en) Image processing equipment and programs
Ockerbloom Archiving and preserving PDF files
JP2015158865A (en) Document generation device, searchable file generation device, and document generation device
JP2003244424A (en) Image forming system
JP2008158581A (en) Image processor, its control method, program, and storage medium
JP2008160418A (en) Apparatus, method and program for image processing, and storage medium
JP2007005950A (en) Image processing apparatus and network system
JP2004072558A (en) Electronic whiteboard and method for outputting data of electronic whiteboard
JP2016139869A (en) Image processing device
JP5979950B2 (en) Image processing apparatus, control method therefor, and program
JP2007328487A (en) Two dimensional code generation device, two dimensional code generation method, two dimensional code generation program, information embedding device, information embedding method, information embedding program, and two dimensional code
JP2006148753A (en) Printing data creating device, printing system, method for backing up printing data and program
TW591559B (en) e-information method and system thereof
JP6108106B2 (en) Information embedding device for document files

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180612