JP2012008942A - Document management system, document management device, document management method and document management program - Google Patents
Document management system, document management device, document management method and document management program Download PDFInfo
- Publication number
- JP2012008942A JP2012008942A JP2010146438A JP2010146438A JP2012008942A JP 2012008942 A JP2012008942 A JP 2012008942A JP 2010146438 A JP2010146438 A JP 2010146438A JP 2010146438 A JP2010146438 A JP 2010146438A JP 2012008942 A JP2012008942 A JP 2012008942A
- Authority
- JP
- Japan
- Prior art keywords
- document
- data
- template
- metadata
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Facsimiles In General (AREA)
- Storage Device Security (AREA)
Abstract
Description
本発明は、文書管理システム、文書管理装置、文書管理方法、及び文書管理プログラムに関する。 The present invention relates to a document management system, a document management apparatus, a document management method, and a document management program.
従来、電子文書の管理を行うには、文書管理サーバを自社に立てて専用ソフトをインストールして運用するケースが考えられていた。文書管理では、一般にWindows(登録商標)のエクスプローラと同じようにフォルダ階層を構成し、そのフォルダ内に文書を保存する。 Conventionally, in order to manage electronic documents, there has been considered a case where a document management server is set up in-house and dedicated software is installed and operated. In document management, a folder hierarchy is generally configured in the same manner as a Windows (registered trademark) explorer, and documents are stored in the folder.
文書の登録方法として、パーソナルコンピュータ上での手動登録だけでなく、登録する先をバーコードに記録させ、このバーコードを印刷したものと紙文書を合わせてMFP(Multifunction Peripheral)にスキャンさせることで登録する方法が考えられている。 As a document registration method, not only manual registration on a personal computer, but also the registration destination is recorded in a barcode, and the printed barcode and a paper document are combined and scanned by an MFP (Multifunction Peripheral). A way to register is considered.
また、SaaS型の文書管理サーバを用いる文書管理サービスが既に知られている。この文書管理サーバでは、文書の登録先の情報を記憶させたバーコードのシートを作成することができ、紙文書の一番上にこのバーコードシートを置いてMFPでスキャンさせることで、意図したフォルダに文書を登録する。 A document management service using a SaaS type document management server is already known. In this document management server, a barcode sheet storing information on the registration destination of the document can be created, and the barcode sheet is placed on the top of a paper document and scanned by the MFP. Register the document in the folder.
例えば、特許文献1(特開2007−166595)には、出力後の紙文書を業務との関連を持たせた状態で管理する目的で、文書のテンプレートとこれに基づいたメタデータを埋め込んだ文書を生成する手段と、この文書データを紙文書として印刷する印刷手段と、印刷された文書から埋め込まれたメタデータを取り出す手段と、取り出したメタデータに基づいて処理が変更されるシステムが開示されている。 For example, Patent Document 1 (Japanese Patent Application Laid-Open No. 2007-166595) discloses a document in which a document template and metadata based on the document template are embedded for the purpose of managing an output paper document in a state of being related to business. Generating means, printing means for printing the document data as a paper document, means for taking out the embedded metadata from the printed document, and a system whose processing is changed based on the taken-out metadata is disclosed ing.
しかしながら、従来技術では、紙文書を印刷し、そこに捺印して再度スキャン・登録をすることで文書を更新する場合、紙に付与された情報を基にその文書を更新するだけでなく、中身が改ざんされていないかを確認する必要がある場合もある。例えば、他社との契約書や見積もり書の場合、契約書などに付与されたバーコードに文書IDが入っており、そのバーコードを切り取り、別の文書に貼り付けてスキャンする。この場合、改ざんチェックをしないと、別の文書が登録されてしまうという問題点がある。 However, in the prior art, when a paper document is printed, and the document is updated by scanning and registering again, not only updating the document based on the information given to the paper, but also the contents It may be necessary to check whether the file has been tampered with. For example, in the case of contracts and quotations with other companies, the document ID is contained in a barcode given to the contract, etc., and the barcode is cut and pasted on another document and scanned. In this case, there is a problem that another document is registered unless the alteration check is performed.
そこで、本発明は、上記問題に鑑みてなされたものであり、格納先が付与された文書をスキャンして文書管理する場合に、改ざんチェックを行うことができる文書管理システム、文書管理装置、文書管理方法、及び文書管理プログラムを提供することを目的とする。 Therefore, the present invention has been made in view of the above problems, and a document management system, a document management apparatus, and a document that can perform a tampering check when a document with a storage destination is scanned and managed. An object is to provide a management method and a document management program.
本発明における一態様の文書管理システムは、画像形成装置と文書管理装置とがネットワークを介して接続された文書管理システムであって、前記画像形成装置は、文書識別情報及びテンプレート識別情報を含むメタデータが付与された紙文書を読み込む読込手段と、読み込まれた前記紙文書の画像データを前記文書管理装置に配信する配信手段とを備え、前記文書管理装置は、指定領域を含む文書のテンプレートを文書識別情報に関連付けて記憶するテンプレート記憶手段と、前記テンプレートに基づいて作成された文書データを文書識別情報に関連付けて記憶する文書記憶手段と、前記画像形成装置から受信した画像データからメタデータを抽出する抽出手段と、前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識手段と、文字認識された前記画像データの文書データと、前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合手段と、抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて前記画像データを記憶する画像記憶手段とを備える。 A document management system according to an aspect of the present invention is a document management system in which an image forming apparatus and a document management apparatus are connected via a network, and the image forming apparatus includes a meta data including document identification information and template identification information. A reading unit that reads a paper document to which data is attached; and a distribution unit that distributes image data of the read paper document to the document management device, wherein the document management device stores a template of a document including a designated area. Template storage means for storing in association with document identification information, document storage means for storing document data created based on the template in association with document identification information, and metadata from image data received from the image forming apparatus Extracting means for extracting; in the image data, a template included in the extracted metadata; Character recognition means for performing character recognition on the same region as the designated region of the template indicated by the image identification information, document data of the image data that has been character-recognized, and document data indicated by the document identification information included in the metadata A collation unit that collates the document data in the same area as the designated area, and an image storage unit that includes the collation result in the extracted metadata and stores the image data in association with the metadata.
また、本発明における他の態様の文書管理装置は、画像形成装置とネットワークを介して接続された文書管理装置であって、指定領域を含む文書のテンプレートを文書識別情報に関連付けて記憶するテンプレート記憶手段と、前記テンプレートに基づいて作成された文書データを文書識別情報に関連付けて記憶する文書記憶手段と、前記画像形成装置から受信された、文書識別情報及びテンプレート識別情報を含むメタデータが付与された画像データから前記メタデータを抽出する抽出手段と、前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識手段と、文字認識された前記画像データの文書データと、抽出された前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合手段と、抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて前記画像データを記憶する画像記憶手段とを備える。 A document management apparatus according to another aspect of the present invention is a document management apparatus connected to an image forming apparatus via a network, and stores a template of a document including a designated area in association with document identification information. Means, document storage means for storing document data created based on the template in association with document identification information, and metadata including document identification information and template identification information received from the image forming apparatus. Extraction means for extracting the metadata from the image data, and character recognition means for performing character recognition on the same area as the template designated area indicated by the template identification information included in the extracted metadata in the image data Document data of the image data that has been character-recognized, and the extracted metadata Collation means for collating document data in the same area as the designated area in the document data indicated by the included document identification information, the collation result is included in the extracted metadata, and the image data is associated with the metadata Image storage means for storing.
また、本発明における他の態様の文書管理方法は、画像形成装置とネットワークを介して接続され、指定領域を含む文書のテンプレートを文書識別情報に関連付けて記憶するテンプレート記憶手段と、前記テンプレートに基づいて作成された文書データを文書識別情報に関連付けて記憶する文書記憶手段とを備える文書管理装置における文書管理方法であって、前記画像形成装置から受信された、文書識別情報及びテンプレート識別情報を含むメタデータが付与された画像データから前記メタデータを抽出する抽出ステップと、前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識ステップと、文字認識された前記画像データの文書データと、抽出された前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合ステップと、抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて画像記憶手段に前記画像データを記憶する記憶ステップとを有する。 According to another aspect of the present invention, there is provided a document management method that is connected to an image forming apparatus via a network and stores a template of a document including a designated area in association with document identification information, and based on the template. A document management method in a document management apparatus comprising document storage means for storing document data created in association with document identification information, including document identification information and template identification information received from the image forming apparatus An extraction step of extracting the metadata from the image data to which the metadata is attached, and character recognition for the same area as the template specified area indicated by the template identification information included in the extracted metadata in the image data A character recognition step for performing image recognition, and a document of the image data that has been character-recognized. A collation step for collating the data with document data in the same area as the designated area in the document data indicated by the document identification information included in the extracted metadata, and a collation result in the extracted metadata And storing the image data in the image storage means in association with the metadata.
また、本発明の文書管理装置は、コンピュータにより実行可能なプログラムにより実現することができ、また、プログラムを記録した記録媒体をコンピュータに読み取らせて実現することも可能である。 The document management apparatus according to the present invention can be realized by a program that can be executed by a computer, and can also be realized by causing a computer to read a recording medium that records the program.
本発明によれば、格納先が付与された文書をスキャンして文書管理する場合に、改ざんチェックを行うことができる。 According to the present invention, it is possible to perform a tampering check when scanning a document with a storage destination and managing the document.
以下、添付図面を参照して、本発明にかかる実施例を詳細に説明する。 Embodiments according to the present invention will be described below in detail with reference to the accompanying drawings.
また、以下に示す実施例では、画像データを入力、出力する装置として、プリンタ機能、スキャナ機能、コピー機能、ファクシミリ機能を一つの筐体に搭載した複合機(MFP:Multifunction Peripheral)を例にあげて説明しているが、これに限定されるものではなく、画像データを入力、出力可能であれば、スキャナ装置、ファクシミリ装置などいずれにも適用することができる。 In the embodiments shown below, a multifunction peripheral (MFP) in which a printer function, a scanner function, a copy function, and a facsimile function are mounted in one casing is taken as an example of an apparatus for inputting and outputting image data. However, the present invention is not limited to this, and the present invention can be applied to any scanner device, facsimile device, or the like as long as image data can be input and output.
<システムとハードウェア>
図1は、以下に示す本実施例における文書管理システムの一例を示す図である。図1に示すように、文書管理システム10は、ネットワークを介してMFP101、MFP103、情報処理装置105、文書管理サーバ107、文書処理サーバ109などが接続されている。
<System and hardware>
FIG. 1 is a diagram showing an example of a document management system in the present embodiment described below. As shown in FIG. 1, the
図1に示す文書管理システム10では、MFP101から送信された画像データを、文書管理サーバ107が取得し、管理する。この画像データには、文書の格納先が変換されたバーコードが付与されている。画像データは、バーコードが示す格納先に格納される。
In the
また、文書管理サーバ107は、他のMFP103からも画像データを取得し、バーコードが示す格納先に画像データを格納する。文書管理サーバ107は、取得した画像データに処理を加えたい場合は、文書処理サーバ109などに処理を依頼することもできる。なお、文書管理システム10に接続される装置は、上記に限られない。
The
本実施例におけるMFP101、103のハードウェアについて説明する。図2は、以下に示す本実施例におけるMFPのハードウェアの一例を示すブロック図である。図2に示すように、MFP101は、制御部201、主記憶部203、補助記憶部205、外部記憶装置I/F部207、ネットワークI/F部211、操作部213、表示部215、エンジン部217を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
The hardware of the MFPs 101 and 103 in this embodiment will be described. FIG. 2 is a block diagram illustrating an example of hardware of the MFP according to the present exemplary embodiment described below. As shown in FIG. 2, the MFP 101 includes a
制御部201は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部201は、主記憶部203や補助記憶部205に記憶されたプログラムを実行する演算装置であり、入力装置や記憶装置からデータを受け取り、演算、加工した上で、出力装置や記憶装置に出力する。
The
主記憶部203は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部201が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
The
補助記憶部205は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
The
外部記憶装置I/F部207は、USB(Universal Serial Bus)などのデータ伝送路を介して接続された記憶媒体209(例えば、フラッシュメモリ、SDカードなど)とMFP101とのインタフェースである。
The external storage device I /
また、記憶媒体209に、所定のプログラムを格納し、この記憶媒体209に格納されたプログラムは外部記憶装置I/F部207を介してMFP101にインストールされ、インストールされた所定のプログラムはMFP101により実行可能となる。
Also, a predetermined program is stored in the
ネットワークI/F部211は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器とMFP101とのインタフェースである。
The network I /
操作部213や表示部215は、キースイッチ(ハードキー)とタッチパネル機能(GUIのソフトウェアキーを含む:Graphical User Interface)を備えたLCD(Liquid Crystal Display)とから構成され、MFP101が有する機能を利用する際のUI(User Interface)として機能する表示及び/又は入力装置である。
The
エンジン部217は、画像データの入出力ユニットとして、紙原稿の読み取り転写紙への印刷を行う。エンジン部217は、スキャナエンジンなども備える。MFP103は、図2に示すハードウェアと同様の構成を有する。
The
次に、本実施例における文書管理サーバ107のハードウェアについて説明する。図3は、以下に示す本実施例における文書管理サーバ107のハードウェアの一例を示すブロック図である。図3に示すように、文書管理サーバ107は、制御部301、主記憶部303、補助記憶部305、外部記憶装置I/F部307、ネットワークI/F部311を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
Next, the hardware of the
制御部301は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部301は、主記憶部303に記憶されたプログラムを実行する演算装置であり、入力装置や記憶装置からデータを受け取り、演算、加工した上で、出力装置や記憶装置に出力する。
The
主記憶部303は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部301が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
The
補助記憶部305は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
The
外部記憶装置I/F部307は、USB(Universal Serial Bus)などのデータ伝送路を介して接続された記憶媒体209(例えば、フラッシュメモリなど)と文書管理サーバ107とのインタフェースである。
The external storage device I /
また、記憶媒体209に、所定のプログラムを格納し、この記憶媒体209に格納されたプログラムは外部記憶装置I/F部307を介して文書管理サーバ107にインストールされ、インストールされた所定のプログラムは文書管理サーバ107により実行可能となる。
Further, a predetermined program is stored in the
ネットワークI/F部311は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と文書間理サーバ107とのインタフェースである。
The network I /
また、文書管理サーバ107は、入力部や表示部を備えてもよい。入力部は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部の表示画面上でキーの選択等を行うためのマウスやスライスパット等を有する。また、入力部は、ユーザが制御部301に操作指示を与えたり、データを入力したりするためのユーザインタフェースである。
In addition, the
表示部は、CRTやLCD等により構成され、制御部301から入力される表示データに応じた表示が行われる。文書処理サーバ109は、図3に示すハードウェアと同様の構成を有する。
The display unit is configured by a CRT, LCD, or the like, and displays according to display data input from the
[実施例1]
次に、上記文書管理システム10を前提にした実施例1について説明する。まず、文書管理システム10の各装置の機能について説明する。
[Example 1]
Next, a first embodiment based on the
<機能>
図4は、実施例1における文書管理システム10の各装置の機能の一例を示すブロック図である。情報処理装置105は、文書作成部501、Webブラウザ507を含む。文書作成部501は、テンプレート作成部503、文書データ作成部505を含む。
<Function>
FIG. 4 is a block diagram illustrating an example of functions of each device of the
テンプレート作成部503は、Webブラウザ507を用いて文書管理サーバ107にアクセスし、テンプレート作成ツールなどを用いて文書のテンプレートを作成する。文書のテンプレートは、契約書や帳票などの紙文書のテンプレートである。テンプレート作成部503は、このテンプレートに対するメタデータの項目を設定する。項目は、例えば、ファイル名や、データを配信する場合の格納先、改ざんチェックを行うための対象領域(チェック領域ともいう)などである。また、テンプレート作成部503は、格納先が変換されたバーコードの位置又は埋込領域をメタデータとして設定してもよい。
The
図5〜7を用いて、領域を指定する場合の例について説明する。図5は、領域指定(その1)の一例を示す図である。図5に示す例は、マウスのドラッグで長方形や円・楕円を指定する例である。「Freehand」の場合は、書き込まれた線によって閉じられた領域の内部を対象領域とする。領域指定が完了した場合、ユーザは選択完了を押下することで、対象領域(チェック領域)が確定する。 An example of designating an area will be described with reference to FIGS. FIG. 5 is a diagram illustrating an example of area designation (part 1). The example shown in FIG. 5 is an example in which a rectangle, circle, or ellipse is designated by dragging the mouse. In the case of “Freehand”, the inside of the area closed by the written line is set as the target area. When the area designation is completed, the user presses “complete selection” to determine the target area (check area).
図6は、領域指定(その2)の一例を示す図である。文書データが複数ページある場合、プレビューの左右のボタンを表示し、ページ移動ができるようになっている。よって、ページ毎に領域指定することが可能になり、指定された領域の情報は、ページ毎にメタデータとして記憶される。 FIG. 6 is a diagram illustrating an example of area designation (part 2). When there are multiple pages of document data, the right and left buttons of the preview are displayed so that the page can be moved. Therefore, it is possible to designate an area for each page, and information on the designated area is stored as metadata for each page.
図7は、領域指定(その3)の一例を示す図である。図7に示す例では、タッチパネルの場合の領域指定の例である。この場合、指で2点を指定させ、その2点を対角線とする長方形を作成したり、1点目を中心とし、1点目と2点目の距離を半径とする円を作成したりして領域指定することができる。これにより、タッチパネルを有するモバイルでも領域指定することができるようになる。 FIG. 7 is a diagram illustrating an example of area designation (part 3). The example shown in FIG. 7 is an example of area designation in the case of a touch panel. In this case, specify two points with your finger and create a rectangle with the two points as diagonal lines, or create a circle with the first point as the center and the distance between the first and second points as the radius. Area can be specified. This makes it possible to specify an area even on a mobile having a touch panel.
図4に戻り、文書データ作成部505は、Webブラウザ507を用いて文書管理サーバ107にアクセスし、格納されている文書のテンプレートを用いて文書データを作成する。文書データ作成部505は、作成した文書データを文書管理サーバ107に送信する。
Returning to FIG. 4, the document
文書データ作成部505は、作成された文書データのメタデータを設定する。文書データ作成部505は、設定されているメタデータの項目毎に、入力値を設定する。入力値は、例えば、格納先を示すファイルパスなどである。Webブラウザ507は、インターネットに接続する。
The document
MFP101は、印刷部401、オペレーションパネル部403、スキャン部405、スキャン配信部407を含む。印刷部401は、文書データを用紙に印刷する。文書データは、文書管理サーバ107から取得してもよい。
The
オペレーションパネル部403は、Webブラウザの表示などのユーザインタフェースとしての機能を有する。スキャン部405は、紙文書をスキャンして画像データを生成する。スキャン配信部407は、スキャン部405により生成された画像データを文書管理サーバ107に配信する。
The
MFP103は、MFP101と同様の機能を持つ。印刷部601は印刷部401と、オペレーションパネル部603はオペレーションパネル部403と、スキャン部605はスキャン部405と、スキャン配信部607はスキャン配信部407と同様の機能を有する。
The
文書管理サーバ107は、テンプレート記憶部701、文書記憶部703、印刷データ作成部705、メタデータ記憶部707、テキスト記憶部709、照合部711、メタデータ暗号部713、メタデータ復号部715を含む。
The
テンプレート記憶部701は、契約書や帳票などの文書のテンプレートを記憶する。このテンプレートは、テンプレート作成手段503により作成されたテンプレートであってもよいし、文書管理サーバ107で作成されたプリセットのテンプレートなどであってもよい。テンプレートには、テンプレートIDが付与されている。テンプレート記憶部701は、改ざんチェック用に指定された対象領域をテンプレートに関連付けて保持する。
The
文書記憶部703は、テンプレートを用いて作成された文書データを記憶する。文書データは、文書データID、用いたテンプレートのテンプレートIDが関連付けられる。文書記憶部703は、フォルダの階層構造でデータを管理してもよい。
The
例えば、文書記憶部703は、各社毎にフォルダを作成したり、文書データのタイプ毎にフォルダを作成したりして文書データを記憶・管理する。文書データのタイプとは、例えば、契約書、見積書、納品書などである。
For example, the
また、文書記憶部701は、配信された画像データを記憶する画像記憶手段でもある。文書記憶部703に記憶される文書データや画像データは、文書IDなどでメタデータと関連付けられている。
The
印刷データ作成部705は、MFP101などから文書の印刷指示があった場合に、文書データに対応する印刷データを作成する。このとき、印刷データ作成部705は、印刷対象の文書データにメタデータが付与されている場合は、所定のメタデータを暗号化・変換する指示をメタデータ暗号部713に行う。印刷データ作成部705は、メタデータ暗号部713から変換されたメタデータを取得した場合、変換されたメタデータを印刷データの所定の位置に付与する。変換されたメタデータとは、例えばバーコードやQRコードである。
A print
メタデータ記憶部707は、文書データ毎に、バーコードなどに埋め込まれる格納先を示す格納情報や文書ID、文書データの基となるテンプレートのテンプレートID、文書名、チェック領域の情報などをメタデータとして記憶する。
For each document data, the
図8は、メタデータの一例を示す図である。図8に示すメタデータは、文書データ毎に文書名、文書ID、テンプレートID、格納情報A、格納情報Bなどである。図8に示す例では、格納先のフォルダは、会社毎に分ける例である。A社から文書データや画像データが送られてきた場合はフォルダAに記憶し、B社から文書データや画像データが送られてきた場合はフォルダBに記憶する。 FIG. 8 is a diagram illustrating an example of metadata. The metadata shown in FIG. 8 includes a document name, a document ID, a template ID, storage information A, storage information B, and the like for each document data. In the example shown in FIG. 8, the storage destination folder is an example divided for each company. When document data or image data is sent from company A, it is stored in folder A, and when document data or image data is sent from company B, it is stored in folder B.
図4に戻り、テキスト記憶部709は、文書データのうちチェック領域と同じ領域に含まれるテキストデータを、文書IDとともに記憶する。
Returning to FIG. 4, the
照合部711は、MFPから画像データが文書記憶部703に記憶された場合、画像データに付与されているバーコードの解析を行うようメタデータ復号部715に指示する。照合部711は、メタデータ復号部715からバーコードが解析されたメタデータを取得した場合、メタデータ内の文書IDを取得し、この文書IDに対応する文書データをテキスト記憶部709から取得する。
When image data is stored in the
照合部711は、画像データのメタデータに含まれるテンプレートIDを取得し、このテンプレートIDに対応するチェック領域を特定する。また、照合部711は、メタデータに含まれる文書IDから文書データを特定し、この文書データに関連付けられているテンプレートIDを特定し、このテンプレートIDに対応するチェック領域を特定してもよい。
The
照合部711は、特定したチェック領域と同じ領域における画像データに対し、OCR処理を行うようOCR処理部801に指示する。照合部711は、OCR処理部801からチェック領域に対する文書データ(テキスト)を取得すると、テキスト記憶部709から取得した同じ文書IDの文書データと、画像データ内のチェック領域に対する文書データとを照合する。照合部711は、照合結果をメタデータに含める。
The
テキスト記憶部709は、画像データからOCR処理された文書データを記憶してもよい。これにより、印刷元の文書データと、スキャン後の画像データからOCR処理した文書データとを管理することができる。
The
照合部711は、文書記憶部703内の予め設定された所定のフォルダに画像データが記憶された場合に、前述した照合処理を行うようにしてもよい。所定のフォルダとは、契約書などの改ざんチェックが必要な画像データを記憶するフォルダである。これにより、画像データの格納先に応じて、必要な画像データにだけ照合処理を行うことができる。
The
照合部711は、印刷元の文書データを作成したユーザ(A社)に対して、照合結果を通知してもよい。照合部711は、スキャンした画像データを配信したユーザ(B社)に対しても照合結果を通知するようにしてもよい。このとき、通知する相手のアドレスなどは、照合部711が予め保持しておいてもよいし、メタデータに含まれるアドレスに通知するようにしてもよい。
The
また、照合部711は、スキャンされた画像データの格納先のフォルダに応じて、照合結果の通知先を変えるようにしてもよい。例えば、契約書フォルダに画像データが格納された場合、印刷元のA社のみに照合結果が通知され、納品書フォルダに画像データが格納された場合、印刷元のA社と、配信元のB社それぞれに照合結果が通知されてもよい。所定のフォルダに通知先のアドレスなどを対応付けておけばよい。
The
これにより、スキャンされた画像データの格納先に応じて、必要な相手先にのみ照合結果を通知することができる。 Thereby, according to the storage location of the scanned image data, it is possible to notify the verification result only to the necessary counterpart.
メタデータ暗号部713は、印刷データを作成する際に、メタデータをバーコードやQRコードなどに暗号化・変換し、印刷データ作成部705に出力する。
When creating the print data, the
メタデータ復号部715は、バーコードやQRコードを復号し、メタデータを抽出し、抽出したメタデータを照合部711に出力する。なお、メタデータ復号部715は、スキャンデータの処理を行う別の装置で行われてもよい。
The
文書処理サーバ109は、OCR処理部801を含む。OCR処理部801は、照合部711から画像データを取得すると、OCR処理を行って文字認識し、文書データに変換する。OCR処理部801は、文字認識された文書データを照合部711に送信する。なお、OCR処理部801は、文書管理サーバ107に備えられてもよい。
The
なお、照合部711は、照合する文書データのテンプレートIDが分かればチェック領域が分かるので、文書記憶部703に記憶された文書データから、チェック領域と同じ領域の文書データを取得できる。すなわち、チェック領域における文書データを保持するテキスト記憶部709は、必ずしも必要ではない。
Note that the
<具体例>
次に、文書管理システム10を利用した業務の具体例について説明する。図9は、文書管理システム10を利用した具体例を示す図である。まず、A社のユーザが、B社との取引に使用する契約書や帳票などの紙文書を作成するためのテンプレートを作成する。テンプレートの作成は、テンプレート作成部503を用いて行う。
<Specific example>
Next, a specific example of a business using the
次に、テンプレート作成部503は、作成したテンプレートを保存するために、Webブラウザ507を通じてインターネットに接続し、テンプレート記憶部701に接続する。
Next, the
テンプレート作成部503は、テンプレート記憶部701にテンプレートを記憶し、そのテンプレートを使用して作成された文書を記憶する際に記録するメタデータの項目の設定を行う。また、テンプレート作成部503は、そのテンプレートを使用して作成された文書の画像データをOCR処理する際に、OCR処理の対象とするチェック領域の設定を行う。
The
次に、ユーザは、文書データ作成部505により、登録したテンプレートを使用して、文書を作成する。文書作成部505は、Webブラウザ507を介して、文書記憶部703にアクセスし、作成した文書の文書データを文書記憶部703に記憶する。このとき、文書データ作成部505は、テンプレート作成時に設定されたメタデータの項目をユーザに設定させ、ユーザが入力した値をメタデータ記憶部707に記憶する。文書管理サーバ107では、文書記憶部703に記録された文書データのチェック領域のテキストデータを作成し、テキストデータをテキスト記憶部709に記憶する。保存したテキストデータは、照合部711により使用される。
Next, the user uses the document
次に、A社のユーザが、作成した文書をB社と共有する場合、MFP101のオペレーションパネル部403に表示されるWebブラウザ(MFPブラウザ)から、文書管理サーバ10に接続し、印刷対象の文書を開く。
Next, when a user of company A shares a created document with company B, a document to be printed is connected to the
次に、対象文書の印刷をユーザが指示すると、文書管理サーバ107のメタデータ暗号部713では、印刷対象の文書に対応するメタデータを、印刷時に付与するバーコードなどに暗号化・変換する。印刷データ作成部705は、メタデータ暗号部713により変換されたバーコードを付与した形の印刷データを作成する。文書管理サーバ107は、この印刷データを印刷指示のあったMFP101に送信する。MFP101は、受信した印刷データを印刷部401が印刷する。A社のユーザは、印刷された紙文書を郵送などでB社に渡す。
Next, when the user instructs printing of the target document, the
次に、紙文書を受け取ったB社では、紙文書に対して署名や押印といった加工を行う。そして、加工後の紙文書をB社内のMFP103にスキャンさせ、MFP103のスキャン配信部607が、スキャンした紙文書の画像データを文書管理サーバ107に送信する。
Next, Company B that receives the paper document performs processing such as signature and seal on the paper document. Then, the processed paper document is scanned by the
文書管理サーバ107は、MFP103から画像データを受信し、まず、メタデータ復号部715により画像データに付与されているバーコードを読み取らせる。メタデータ復号部715は、バーコードからメタデータを抽出する。このメタデータには、文書のテンプレートIDや印刷された文書のID、文書記憶部703内のフォルダを示す格納情報などの情報が含まれている。文書管理サーバ107は、メタデータに含まれる格納情報が示すフォルダに、取得した画像データを記憶する。このとき、画像データは、文書IDなどで、メタデータと関連付けられている。
The
次に、照合部711は、文書のテンプレートIDに基づき、画像データのチェック領域と同一の領域に対して、OCR処理を施すようOCR処理部801に指示する。照合部711は、OCR処理部801から取得したチェック領域に対する文書データと、この文書IDに対応する、文書記憶部703に記憶されている文書データとを照合する。
Next, the
照合部711は、照合結果(一致、又は不一致)を、取得された画像データと印刷した元文書とのメタデータに付与する。照合結果が一致していれば、原本保証がされていることを示す。また、照合部711は、所定のユーザに照合結果を通知する。
The
これにより、A社のユーザは、印刷元の文書のメタデータを確認することで、B社によりスキャンされた画像データと印刷元の文書との内容の同一性を確認することができる。 Thus, the user of company A can confirm the identity of the contents of the image data scanned by company B and the document of the printing source by confirming the metadata of the document of the printing source.
<動作>
次に、実施例1における文書管理システムの動作について説明する。以下、文書のテンプレート登録処理、文書データの登録処理、文書の印刷処理、原本保証処理の順に説明する。
<Operation>
Next, the operation of the document management system in the first embodiment will be described. The document template registration process, document data registration process, document print process, and original document guarantee process will be described in this order.
(文書のテンプレート登録処理)
図10は、文書のテンプレート登録処理の一例を示すフローチャートである。図10に示すステップS101で、ユーザが、テンプレート作成手段503を用いて、文書を作成するためのテンプレートを自社内のシステムやパーソナルコンピュータなどで作成する。
(Document template registration process)
FIG. 10 is a flowchart illustrating an example of a document template registration process. In step S101 shown in FIG. 10, the user uses the
ステップS102で、ユーザが、パーソナルコンピュータ上のWebブラウザ507を使用して文書管理サーバ107に接続し、作成したテンプレートをテンプレート記憶部701にアップロードする。
In step S102, the user connects to the
ステップS103で、ユーザは、テンプレート作成部503を用いて、登録された文書テンプレートファイルから画像データを作成し、テンプレート作成部503はOCR処理の対象領域をユーザに指定させるための画面を作成する。テンプレート作成部503は、ユーザがテンプレートの登録のために開いているWebブラウザ507に、この画面を表示する。ユーザは、表示された画面上で、OCR処理の対象領域(チェック領域)を設定する。チェック領域は、OCR対象外の領域であってもよい。
In step S103, the user uses the
ステップS104で、テンプレート作成部503は、テンプレートの画像データとOCR処理の対象領域を重ねた画像を作成する。テンプレート作成部503は、作成した画面を、メタデータの暗号化データ(例えばバーコード)を配置する領域を設定する画面として、ユーザが開いているWebブラウザ507に表示する。ユーザは、Webブラウザ507に表示された画像で、メタデータの暗号化データの配置領域を指定する。ここで指定する領域は、OCR処理の対象外から選択する。
In step S104, the
ステップS105で、文書管理サーバ107は、テンプレートの画像データと、ユーザが指定したメタデータの配置領域と、文書のテンプレートIDと、OCR処理領域(チェック領域)とをセットにして、文書テンプレートとしてテンプレート記憶部701に保存する。
In step S105, the
これにより、文書のテンプレートを作成したユーザが、改ざんチェックを行いたい領域を自由に設定することができる。また、文書のテンプレートを作成したユーザが、メタデータの配置領域も設定することができる。 As a result, the user who created the document template can freely set an area in which the tampering check is desired. Also, the user who created the document template can also set the metadata placement area.
(文書データの登録処理)
図11は、文書データの登録処理の一例を示すフローチャートである。図11に示すステップS201で、ユーザは、文書データ作成部505を用いて、図10の処理で登録した文書テンプレートを使用し、自社の情報処理装置(例えばPC)等で文書データを作成する。情報処理装置105は、Webブラウザ507を使用して文書管理サーバ107に接続する。
(Document data registration process)
FIG. 11 is a flowchart illustrating an example of document data registration processing. In step S201 shown in FIG. 11, the user uses the document
ステップS202で、文書記憶部703は、文書の登録に必要なメタデータの入力画面をWebブラウザ507に表示する。このメタデータには、文書のテンプレートが何か(テンプレートID)、この文書を扱う会社(アカウント)がどこかといった情報と、文書名、スキャン画像のデータの配信先(格納先)などの文書管理で登録するメタデータが含まれる。
In step S <b> 202, the
ステップS203で、メタデータ記憶部707は、ユーザが入力したメタデータを文書データと関連付けて記憶し、文書記憶部703は、メタデータと関連付けて文書データを記憶する。
In step S203, the
ステップS204で、文書データ作成部505により作成された文書データのうち、このテンプレートIDに対応するチェック領域の文書データをテキスト記憶部709に記憶する。
In step S <b> 204, the document data in the check area corresponding to the template ID among the document data created by the document
これにより、文書データの作成時に、この文書の印刷データをスキャンするときに、どこに配信するかをメタデータに含めておくことができる。 Thus, when document data is created, when the print data of the document is scanned, the distribution location can be included in the metadata.
(文書の印刷処理)
図12は、文書の印刷処理の一例を示すフローチャートである。図12に示すステップS301で、ユーザは、MFP101に搭載されているWebブラウザ507を使用して、文書管理サーバ107の文書記憶部703に接続し、印刷対象の文書を選択する。ユーザは、印刷対象の文書を選択した後、その文書に対し、印刷指示を出す。
(Document printing process)
FIG. 12 is a flowchart illustrating an example of a document printing process. In step S301 illustrated in FIG. 12, the user connects to the
ステップS302で、印刷指示を受けた文書管理サーバ107は、文書に付与するメタデータの暗号化データ(例えばバーコード)をメタデータ暗号部713で作成する。また、印刷データ作成部705は、指示された文書データの画像データに、メタデータの配置領域に暗号化されたメタデータを付与した、印刷用のデータを作成する。
In step S <b> 302, the
ステップS303で、文書管理サーバ107は、作成した印刷データを、印刷指示のあったMFP101に送信する。
In step S303, the
ステップ304で、MFP101の印刷部401は、受信した印刷データを印刷する。これにより、メタデータが付与された文書データ(例えば契約書)を印刷することができる。
In step 304, the
(原本保証処理)
図13は、原本保証処理の一例を示すフローチャートである。図13に示す処理の前に、図12の処理で印刷された紙文書を例えばA社からB社に郵送などで渡す。B社では文書の内容を確認し、紙文書に署名や押印といった加工を施す。
(Original guarantee processing)
FIG. 13 is a flowchart illustrating an example of the original guarantee process. Before the process shown in FIG. 13, the paper document printed in the process of FIG. 12 is delivered from company A to company B by mail or the like. Company B confirms the contents of the document and applies processing such as signature and seal to the paper document.
図13に示すステップS401で、MFP103のスキャン部605は、署名や押印といった処理が施された紙文書をスキャンする。
In step S401 illustrated in FIG. 13, the
ステップS402で、スキャン配信部607は、スキャンされた画像データを、文書管理サーバ107に送信する。
In step S <b> 402, the
ステップS403で、文書管理サーバ107は、画像データを受信する。メタデータ復号部715は、受信された画像データから、格納先のPathや文書テンプレートのID、印刷時の元データのIDといったメタデータを、復号し、抽出する。
In step S403, the
ステップS404で、文書記憶部703は、メタデータ復号部715により抽出された格納先のパスが示すフォルダに画像データを記憶する。
In step S404, the
ステップS405で、照合部711は、スキャンされた画像データと、文書テンプレートIDから画像データのOCR処理の対象領域(チェック領域)を判別し、OCR処理部801にOCR処理を要求する。
In step S405, the
ステップS406で、照合部711は、OCR処理部801から処理した結果を取得し、テキスト記憶部709に記憶する。
In step S406, the
ステップS407で、照合部711は、文書IDに基づき、テキスト記憶部709から印刷元の文書データと、画像データのチェック領域の文書データとを取得し、これらが同一か否かを検証する。
In step S407, the
ステップS408で、照合部711は、照合結果が同一か否かを判定する。ステップS408の判定結果がYES(同一)であればステップS409に進み、判定結果がNO(不一致)であればステップS410に進む。
In step S408, the
ステップS409で、照合部711は、文書データが一致する場合、OCR対象領域(基本的には署名や押印以外の場所)に改竄がないということなので、スキャンされて記憶された画像データのメタデータと、印刷元の文書データのメタデータに原本を保証する旨を追加する。
In step S409, if the document data match, the
ステップS410で、照合部711は、全文データが一致しない場合、OCR対象領域(基本的には署名や押印以外の場所)に改ざんがあるということなので、スキャンされて記憶された画像データのメタデータと、印刷元の文書のメタデータに原本保証ができない旨を追加する。
In step S410, if the full-text data does not match, the
これにより、ユーザは、画像データ、又は文書データのメタデータを参照すれば、それらの文書に対して改ざんがあるか否かを判別することができる。 Thus, the user can determine whether or not the documents are falsified by referring to the metadata of the image data or the document data.
以上、実施例1によれば、格納先が付与された文書をスキャンして文書管理する場合に、改ざんチェックを行うことができる。また、実施例1によれば、所定のフォルダに格納されたか否かにより、照合処理を行うか否かを決定することもできる。また、実施例1によれば、照合結果をユーザに通知することもできる。 As described above, according to the first embodiment, it is possible to perform a tampering check when scanning a document with a storage destination and managing the document. Further, according to the first embodiment, whether or not to perform the collation process can be determined based on whether or not the data is stored in a predetermined folder. Further, according to the first embodiment, it is possible to notify the user of the collation result.
また、MFP101、103の印刷部401、601及びスキャン部405、605は、例えば制御部201及びエンジン部217により実現され、オペレーションパネル部403、603は、例えば操作部213及び表示部215により実現されうる。スキャン配信部407、607は、例えば制御部201及びネットワークI/F部211により実現されうる。
The
文書管理サーバ107のテンプレート記憶部701、文書記憶部703、メタデータ記憶部707、テキスト記憶部709は、例えば主記憶部303及び/又は補助記憶部305により実現され、印刷データ作成部705、照合部711、メタデータ暗号部713、メタデータ復号部715は、例えば制御部301及び主記憶部303などにより実現されうる。
The
[実施例2]
次に、実施例2における文書管理サーバ側の構成について説明する。文書管理サーバ側では、文書管理やOCR処理やバーコード処理をそれぞれの装置に行わせてもよい。
[Example 2]
Next, the configuration on the document management server side in the second embodiment will be described. On the document management server side, document management, OCR processing, and barcode processing may be performed by each device.
<機能>
図14は、実施例2における文書管理サーバ側の機能の一例を示すブロック図である。図14に示す例では、MFP103は、取得した画像データ(例えば、スキャン画像)に対し、文書管理サーバ107に配信する。
<Function>
FIG. 14 is a block diagram illustrating an example of functions on the document management server side according to the second embodiment. In the example illustrated in FIG. 14, the
図14に示すように文書管理サーバ側では、例えば、ファイアウォール901、ユーザマネジメント902、ストレージ903、タスクフロント904、タスクマスタ905、タスクキュー906、OCRワーカー907、バーコードワーカー908、サービスログ909、Webサービス910の機能を有する。
As shown in FIG. 14, on the document management server side, for example, a
ファイアウォール901は、不正アクセスを検出するためのファイアウォールでもあり、さらに、負荷分散を行うためのロードバランサーでもある。ロードバランサーは、外部ネットワークからの要求を一元的に管理し、同等の機能を持つ複数のサーバに要求を転送する機能を有する。
The
ユーザマネジメント902は、タスクフロント904、ストレージ903、サービスログ909にシングルサインオンできる機能を提供するアプリケーションである。
The
ストレージ903は、各種アプリケーションが共通で使用できる格納手段である。ストレージ903は、文書管理サーバ107において、処理前ファイル、処理済ファイルを一時的に格納するウェブアプリケーションの役割を担う。例えば、印刷元の文書データを保持したり、スキャンされた画像データを保持したりする。ストレージ903は、実施例1におけるテンプレート記憶部701、文書記憶部703、メタデータ記憶部707、テキスト記憶部709に対応する。
The
タスクフロント904は、MFP103から、画像データや画像データに対するタスクのタスク情報を受け付けたり、MFP103にタスクの処理結果情報を返したりするウェブアプリケーションである。
The
タスクマスタ905は、タスクフロント904や他のアプリケーションから例えばOCRなどの処理タスクを受け付けるウェブアプリケーションである。また、タスクマスタ905は、タスクキュー906、タスクワーカー(OCRワーカー907、バーコードワーカー908など)を管理する。タスクマスタ905は、ストレージ903に記憶されている印刷元の文書データと、OCRワーカー907により文字認識された文書データとの照合を行う。例えば、タスクマスタ905は、実施例1における照合部711に対応する。
The
タスクキュー906は、MFP103から受信した画像データに対する処理タスクを先入れ先出し(FIFO)により保存する。
A
OCRワーカー907は、タスクマスタ905から仕事を受け取り、OCRのタスクを処理するサービスプログラムである。これにより、画像データのチェック領域に対して文字認識処理を行うことができる。OCRワーカー907は、実施例1におけるOCR処理部801に対応する。
The
バーコードワーカー908は、タスクマスタ905から仕事を受け取り、バーコード読取のタスクを処理するサービスプログラムである。これにより、画像データに付与されたバーコードからメタデータを取得することができる。バーコードワーカー908は、実施例1におけるメタデータ暗号部713、メタデータ復号部715に対応する。
The
サービスログ909は、各種アプリケーションのログを一括して保存するウェブアプリケーションである。画像処理サービスでは、例えばOCRタスクのログを閲覧することができる。
The
Webサービス910は、インターネット上で提供されていて、XMLベースのプロトコルでアクセスできる機能を有する。
The
以上、実施例2では、前述した構成により、OCR処理やバーコード処理の負荷分散を行って文書管理サーバ107側を実現してもよい。
As described above, in the second embodiment, the
[変形例]
次に、変形例における文書管理サーバについて説明する。変形例における文書管理サーバでは、ファイルのデータ構造やメタデータのデータ構造に特徴がある。その特徴とは、ファイルの階層構造に意味を持たせてデータを管理する。
[Modification]
Next, the document management server in the modification will be described. The document management server according to the modification is characterized by a file data structure and a metadata data structure. The feature manages data by giving meaning to the hierarchical structure of files.
図15は、各データのデータ構造の一例を示す図である。図15に示す例では、フォルダ定義データは、フォルダ定義データの識別子、組織ID、フォルダ階層のタイトル、フォルダ階層の階層毎の定義、各階層のフォルダに付与され、該階層の定義に関連するメタデータの定義などを含む。 FIG. 15 is a diagram illustrating an example of a data structure of each data. In the example shown in FIG. 15, folder definition data includes folder definition data identifiers, organization IDs, folder hierarchy titles, definitions for each folder hierarchy, and folders associated with each hierarchy definition. Includes data definitions.
なお、図15に示す例では、複数の組織のデータを管理するために組織IDを付与するが、組織が一つの場合は、組織IDはなくてもよい。メタデータには、文字列を示すメタデータ「stag(string−tag)」と年月日を示すメタデータ「dtag(data−tag)」とがある。「layer_0_tags」1001では、第0階層のメタデータを定義している。「stag_0」1003では、例えば文字系列のメタデータ「Country」が定義されている。メタデータは、他にも「ntag(number tag)」や「btag(boolean tag)」などがあってもよい。 In the example illustrated in FIG. 15, an organization ID is assigned to manage data of a plurality of organizations. However, when there is one organization, the organization ID may not be provided. The metadata includes metadata “stag (string-tag)” indicating a character string and metadata “dtag (data-tag)” indicating a date. In “layer_0_tags” 1001, metadata of the 0th layer is defined. In “stag — 0” 1003, for example, character series metadata “Country” is defined. Other metadata may include “nttag (number tag)” and “btag (boolean tag)”.
フォルダデータは、フォルダ毎に、フォルダID、組織ID、フォルダ定義データの識別子、親フォルダの識別子、どの階層かを示すレベル、各階層の定義に対応するデータ、フォルダに付与されるメタデータの定義に対応するメタデータなどを含む。なお、フォルダデータの各階層は、自階層だけでなく自階層以上の階層のフォルダ定義に対応するデータも保持してもよい。例えば、階層(level)が「2」のフォルダデータとして、「layer_0」の「JP」、「layer_1」の「2009.01」、「layer_2」の「契約書」が保持されている。これにより、上位階層のフォルダの定義に対応するデータを取得する際、親フォルダを辿らなくても容易かつ高速に取得可能となる。また、階層の定義に対応するデータが、その階層のフォルダの名称とされてもよい。 Folder data includes folder ID, organization ID, folder definition data identifier, parent folder identifier, level indicating which hierarchy, data corresponding to the definition of each hierarchy, and metadata definition given to the folder. Including metadata corresponding to. In addition, each hierarchy of folder data may hold not only the own hierarchy but also data corresponding to the folder definition of the hierarchy higher than the own hierarchy. For example, “JP” of “layer_0”, “2009.01” of “layer_1”, and “contract” of “layer_2” are held as folder data of “2” in the hierarchy (level). As a result, when acquiring data corresponding to the definition of the upper-level folder, it is possible to acquire it easily and at high speed without following the parent folder. Further, data corresponding to the definition of the hierarchy may be the name of the folder of the hierarchy.
ファイルデータは、ファイルID、組織ID、どのフォルダに保存されているかを示すフォルダID、ファイルのタイトル、ファイルが格納されている位置を示すURL、ファイルサイズ、ファイルのメタデータなどを含む。なお、ファイルのメタデータは、フォルダのメタデータと識別可能である。例えば、ファイルのメタデータには、「e_stag」というように、ファイルのメタデータを示す「e_」が付与されている。これにより、フォルダのメタデータとファイルのメタデータとを区別して管理、検索などをすることができる。なお、フォルダに付与されるメタデータは、そのフォルダに保存されるファイルに対応付けられる。 The file data includes a file ID, an organization ID, a folder ID indicating in which folder the file is stored, a file title, a URL indicating the location where the file is stored, a file size, file metadata, and the like. Note that file metadata can be identified from folder metadata. For example, “e_” indicating the metadata of the file is added to the metadata of the file, such as “e_stag”. This makes it possible to manage and search the folder metadata and the file metadata separately. Note that metadata assigned to a folder is associated with a file stored in the folder.
上記のようなデータ構造を文書管理サーバが保持する場合、文書管理サーバでOCR処理対象のチェック領域の情報を保持するデータ構造について説明する。 In the case where the document management server holds the data structure as described above, a data structure that holds information on the check area to be subjected to OCR processing in the document management server will be described.
図16は、チェック領域のデータ構造(その1)を示す図である。図16に示すように、チェック領域と文書データとの関連付けに、「entry」のIDを使用したが、フォルダIDや文書タイプなどを用いてもよい。「interpolations」は、改ざんチェック用の対象領域(チェック領域)である。 FIG. 16 is a diagram illustrating a data structure (part 1) of the check area. As shown in FIG. 16, the “entry” ID is used for associating the check area with the document data. However, a folder ID, a document type, or the like may be used. “Interpolations” is a target area (check area) for tampering check.
「region_type」及び「region_value」により、チェック領域を特定することができる。「region_type」は、チェック領域のタイプを示す。チェック領域のタイプとは、長方形「rectangle」、円「circle」、フリーハンド「free」を示す。また、チェック領域は、OCR対象領域ではなく、OCR対象外の領域を指定してもよい。 The check area can be specified by “region_type” and “region_value”. “Region_type” indicates the type of the check area. The check area type indicates a rectangle “rectangle”, a circle “circle”, and a freehand “free”. In addition, the check area may specify an area that is not an OCR target area instead of an OCR target area.
図17は、チェック領域のデータ構造(その2)を示す図である。図17に示す例では、同一文書の複数のページに対し、異なるチェック領域を設定することができる。図17に示すように、複数のページに異なるチェック領域を複数設定する場合は、「interpolations」行を複数作成すればよい。「interpolations」の1行で1領域とする。 FIG. 17 is a diagram illustrating a data structure (part 2) of the check area. In the example shown in FIG. 17, different check areas can be set for a plurality of pages of the same document. As illustrated in FIG. 17, when setting a plurality of different check areas on a plurality of pages, a plurality of “interpolations” lines may be created. One line is one line of “interpolations”.
図17に示す例では、ファイルID「1」の文書データの1ページ目には、長方形のチェック領域が設定され、2ページ目には円のチェック領域が設定されることを示す。 In the example shown in FIG. 17, a rectangular check area is set for the first page of the document data with the file ID “1”, and a circle check area is set for the second page.
図18は、チェック領域のデータ構造(その3)を示す図である。図18に示す例では、チェック領域を1つのStringの値で定義した例を示す。また、ページ毎にチェック領域を指定する場合、「region_config」にページ毎のチェック領域を記入する。また、1ページに複数のチェック領域を指定する場合、「region_config」に複数のチェック領域を記入する。「region_config」は、XML形式やJSON形式で記入すればよい。 FIG. 18 is a diagram showing a data structure (part 3) of the check area. The example shown in FIG. 18 shows an example in which the check area is defined by one String value. When a check area is specified for each page, the check area for each page is written in “region_config”. When a plurality of check areas are specified for one page, a plurality of check areas are written in “region_config”. “Region_config” may be entered in XML format or JSON format.
また、複数のチェック領域を1つのグループとし、このグループを1つの文書に割り当てる方法もある。 There is also a method of assigning a plurality of check areas to one group and assigning this group to one document.
図19は、チェック領域のデータ構造(その4)を示す図である。図19に示す例では、「interpolations」が「entries」に関連付けられている。この例では、「interpolations」のIDが「entries」のメタデータとして含まれている。また、「interpolations」に回転角度のカラムを持たせ、自由に対象領域を回転させてもよい。以上に示したデータ構造により、文書管理サーバは、チェック領域を管理してもよい。 FIG. 19 is a diagram showing a data structure (No. 4) of the check area. In the example illustrated in FIG. 19, “interpolations” is associated with “entries”. In this example, the ID of “interpolations” is included as metadata of “entries”. Further, “interpolations” may have a column of rotation angles, and the target area may be freely rotated. With the data structure described above, the document management server may manage the check area.
各実施例の文書管理サーバで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。 The program executed in the document management server of each embodiment is a file in an installable format or an executable format, and is a computer such as a CD-ROM, a flexible disk (FD), a CD-R, a DVD (Digital Versatile Disk). It is recorded on a readable recording medium and provided.
また、各実施例の文書管理サーバで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、各実施例の文書管理サーバで実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。 The program executed by the document management server of each embodiment may be stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. In addition, the program executed by the document management server of each embodiment may be provided by being incorporated in advance in a ROM or the like.
各実施例の文書管理サーバで実行されるプログラムは、前述した各部を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が補助記憶部305からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部303上にロードされ、1又は複数の各部が主記憶部303上に生成されるようになっている。
The program executed by the document management server of each embodiment has a module configuration including the above-described units. As actual hardware, the CPU (processor) reads the program from the
なお、本発明は、上記実施例そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施例に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施例に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施例にわたる構成要素を適宜組み合わせても良い。 In addition, this invention is not limited to the said Example as it is, A component can be deform | transformed and embodied in the range which does not deviate from the summary in an implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the above embodiments. For example, some components may be deleted from all the components shown in the embodiments. Furthermore, constituent elements over different embodiments may be appropriately combined.
10 文書管理システム
101、103 MFP
105 情報処理装置
207 文書管理サーバ
209 文書処理サーバ
201 制御部
203 主記憶部
205 補助記憶部
211 ネットワークI/F部
213 操作部
215 表示部
217 エンジン部
301 制御部
303 主記憶部
305 補助記憶部
311 ネットワークI/F部
313 入力部
315 表示部
401、601 印刷部
403、603 オペレーションパネル部
405、605 スキャン部
407、607 スキャン配信部
501 文書作成部
503 テンプレート作成部
505 文書データ作成部
507 Webブラウザ
701 テンプレート記憶部
703 文書記憶部
705 印刷データ作成部
707 メタデータ記憶部
709 テキスト記憶部
711 照合部
713 メタデータ暗号部
715 メタデータ復号部
801 OCR処理部
10
105
Claims (9)
前記画像形成装置は、
文書識別情報及びテンプレート識別情報を含むメタデータが付与された紙文書を読み込む読込手段と、
読み込まれた前記紙文書の画像データを前記文書管理装置に配信する配信手段と
を備え、
前記文書管理装置は、
指定領域を含む文書のテンプレートをテンプレート識別情報に関連付けて記憶するテンプレート記憶手段と、
前記テンプレートに基づいて作成された文書データを文書識別情報に関連付けて記憶する文書記憶手段と、
前記画像形成装置から受信した画像データからメタデータを抽出する抽出手段と、
前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識手段と、
文字認識された前記画像データの文書データと、前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合手段と、
抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて前記画像データを記憶する画像記憶手段と
を備える文書管理システム。 A document management system in which an image forming apparatus and a document management apparatus are connected via a network,
The image forming apparatus includes:
Reading means for reading a paper document provided with metadata including document identification information and template identification information;
Distribution means for distributing image data of the read paper document to the document management device;
The document management apparatus includes:
Template storage means for storing a template of a document including the designated area in association with the template identification information;
Document storage means for storing document data created based on the template in association with document identification information;
Extraction means for extracting metadata from image data received from the image forming apparatus;
In the image data, a character recognition means for performing character recognition on the same area as the designated area of the template indicated by the template identification information included in the extracted metadata,
Collation means for collating document data of the image data that has been character-recognized and document data in the same area as the designated area in the document data indicated by the document identification information included in the metadata;
A document management system comprising: an image storage unit that includes a collation result in the extracted metadata and stores the image data in association with the metadata.
前記画像記憶手段は、前記格納情報が示す格納先に前記画像データを記憶し、
前記照合手段は、
前記格納情報が示す格納先に応じて、前記照合手段により照合を行うか否かを決定する請求項1記載の文書管理ステム。 The metadata includes storage information indicating a storage destination of the document management device,
The image storage means stores the image data in a storage location indicated by the storage information;
The verification means includes
The document management system according to claim 1, wherein the collation unit determines whether to perform collation according to a storage destination indicated by the storage information.
前記格納情報が示す格納先に応じて、前記照合結果を通知する相手先を決定する請求項2記載の文書管理システム。 The verification means includes
The document management system according to claim 2, wherein a destination to which the collation result is notified is determined according to a storage destination indicated by the storage information.
前記情報処理装置は、
文字認識を行う前記指定領域、及び前記メタデータを付与する領域を含む前記テンプレートを作成するテンプレート作成手段と、
前記テンプレートに基づいて文書データを作成する文書作成手段と、
作成された前記テンプレート及び前記文書データを前記文書管理装置に送信する送信手段と、
を備える請求項1乃至3いずれか一項に記載の文書管理システム。 The document management system is connected to an information processing apparatus via a network,
The information processing apparatus includes:
A template creating means for creating the template including the designated area for performing character recognition and the area for giving the metadata;
Document creation means for creating document data based on the template;
Transmitting means for transmitting the created template and the document data to the document management device;
A document management system according to any one of claims 1 to 3.
指定領域を含む文書のテンプレートを文書識別情報に関連付けて記憶するテンプレート記憶手段と、
前記テンプレートに基づいて作成された文書データを文書識別情報に関連付けて記憶する文書記憶手段と、
前記画像形成装置から受信された、文書識別情報及びテンプレート識別情報を含むメタデータが付与された画像データから前記メタデータを抽出する抽出手段と、
前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識手段と、
文字認識された前記画像データの文書データと、抽出された前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合手段と、
抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて前記画像データを記憶する画像記憶手段と
を備える文書管理装置。 A document management apparatus connected to an image forming apparatus via a network,
Template storage means for storing a template of a document including the designated area in association with the document identification information;
Document storage means for storing document data created based on the template in association with document identification information;
Extraction means for extracting the metadata from image data to which metadata including document identification information and template identification information is received, received from the image forming apparatus;
In the image data, character recognition means for performing character recognition on the same area as the designated area of the template indicated by the template information included in the extracted metadata,
Collation means for collating the document data of the image data that has been character-recognized with the document data in the same area as the designated area in the document data indicated by the document identification information included in the extracted metadata;
A document management apparatus comprising: an image storage unit that includes a collation result in the extracted metadata and stores the image data in association with the metadata.
前記画像記憶手段は、前記格納情報が示す格納先に前記画像データを記憶し、
前記照合手段は、
前記格納情報が示す格納先に応じて、前記照合手段により照合を行うか否かを決定する請求項5記載の文書管理装置。 The metadata includes storage information indicating a storage destination of the document management device,
The image storage means stores the image data in a storage location indicated by the storage information;
The verification means includes
The document management apparatus according to claim 5, wherein the collation unit determines whether to perform collation according to a storage location indicated by the storage information.
前記格納情報が示す格納先に応じて、前記照合結果を通知する相手先を決定する請求項6記載の文書管理装置。 The verification means includes
The document management apparatus according to claim 6, wherein a destination to notify the collation result is determined according to a storage destination indicated by the storage information.
前記画像形成装置から受信された、文書識別情報及びテンプレート識別情報を含むメタデータが付与された画像データから前記メタデータを抽出する抽出ステップと、
前記画像データにおいて、抽出された前記メタデータに含まれるテンプレート識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識ステップと、
文字認識された前記画像データの文書データと、抽出された前記メタデータに含まれる文書識別情報が示す文書データにおける、前記指定領域と同一領域の文書データとの照合を行う照合ステップと、
抽出された前記メタデータに照合結果を含め、該メタデータに関連付けて画像記憶手段に前記画像データを記憶する記憶ステップと
を有する文書管理方法。 A template storage unit connected to the image forming apparatus via the network and storing a template of a document including a designated area in association with the document identification information, and storing document data created based on the template in association with the document identification information A document management method in a document management apparatus comprising a document storage means for performing
An extraction step of extracting the metadata from the image data provided with metadata including document identification information and template identification information received from the image forming apparatus;
In the image data, a character recognition step for performing character recognition on the same region as the designated region of the template indicated by the template identification information included in the extracted metadata,
A collation step of collating the document data of the image data that has been character-recognized with the document data in the same area as the designated area in the document data indicated by the document identification information included in the extracted metadata;
And a storage step of storing a collation result in the extracted metadata and storing the image data in an image storage unit in association with the metadata.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146438A JP2012008942A (en) | 2010-06-28 | 2010-06-28 | Document management system, document management device, document management method and document management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010146438A JP2012008942A (en) | 2010-06-28 | 2010-06-28 | Document management system, document management device, document management method and document management program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012008942A true JP2012008942A (en) | 2012-01-12 |
Family
ID=45539374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010146438A Pending JP2012008942A (en) | 2010-06-28 | 2010-06-28 | Document management system, document management device, document management method and document management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012008942A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013182372A (en) * | 2012-03-01 | 2013-09-12 | Nec Corp | Difference detection system, difference detection method, and difference detection |
JP2014011698A (en) * | 2012-07-01 | 2014-01-20 | Brother Ind Ltd | Image processing system and program |
JP2019081315A (en) * | 2017-10-31 | 2019-05-30 | 京セラドキュメントソリューションズ株式会社 | Document management system and document management method |
JP2019128919A (en) * | 2018-01-26 | 2019-08-01 | 株式会社ナカムラ・マネージメントオフィス | Document management system |
JP2020021469A (en) * | 2018-07-20 | 2020-02-06 | 株式会社リコー | Information processing apparatus, information processing method, and information processing program |
JP6836643B1 (en) * | 2019-11-27 | 2021-03-03 | 株式会社スカイコム | Management server, document file management system, document file management method, and document file management program |
JP2022050640A (en) * | 2017-09-11 | 2022-03-30 | 株式会社日立システムズ | Computer device and document processing program |
CN114450677A (en) * | 2019-10-01 | 2022-05-06 | 富士胶片富山化学株式会社 | Drug matching device, drug matching system, drug management method, and program |
-
2010
- 2010-06-28 JP JP2010146438A patent/JP2012008942A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013182372A (en) * | 2012-03-01 | 2013-09-12 | Nec Corp | Difference detection system, difference detection method, and difference detection |
JP2014011698A (en) * | 2012-07-01 | 2014-01-20 | Brother Ind Ltd | Image processing system and program |
JP2022050640A (en) * | 2017-09-11 | 2022-03-30 | 株式会社日立システムズ | Computer device and document processing program |
JP7182022B2 (en) | 2017-09-11 | 2022-12-01 | 株式会社日立システムズ | computer equipment and word processing program |
JP2019081315A (en) * | 2017-10-31 | 2019-05-30 | 京セラドキュメントソリューションズ株式会社 | Document management system and document management method |
JP2019128919A (en) * | 2018-01-26 | 2019-08-01 | 株式会社ナカムラ・マネージメントオフィス | Document management system |
JP2020021469A (en) * | 2018-07-20 | 2020-02-06 | 株式会社リコー | Information processing apparatus, information processing method, and information processing program |
JP7346931B2 (en) | 2018-07-20 | 2023-09-20 | 株式会社リコー | Information processing device, information processing method, and information processing program |
CN114450677A (en) * | 2019-10-01 | 2022-05-06 | 富士胶片富山化学株式会社 | Drug matching device, drug matching system, drug management method, and program |
US12254974B2 (en) | 2019-10-01 | 2025-03-18 | Fujifilm Medical Co., Ltd. | Medicine collation device, medicine collation system, medicine management method, and program |
JP6836643B1 (en) * | 2019-11-27 | 2021-03-03 | 株式会社スカイコム | Management server, document file management system, document file management method, and document file management program |
JP2021087100A (en) * | 2019-11-27 | 2021-06-03 | 株式会社スカイコム | Management server, document file management system, document file management method, and document file management program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012008942A (en) | Document management system, document management device, document management method and document management program | |
US9537849B2 (en) | Service provision system, service provision method, and computer program product | |
JP5747434B2 (en) | Image forming apparatus, image processing apparatus, image processing system, image processing method, program, and recording medium | |
US10180814B2 (en) | User terminal, image processing device and cloud server to identify plural user information to execute an image processing job upon validating an user information | |
US9507953B2 (en) | Information processing system, information processing method, and information processing apparatus | |
JP6459398B2 (en) | Information processing system, information processing apparatus, access control method, and program | |
CN105931008A (en) | Method And System Of Merging Authentication Into Review And Approval Process, And Multifunctional Printer | |
JP2012134949A (en) | Scan management system, scan management apparatus, control method of the same, and program | |
JP5012525B2 (en) | Security policy server, security policy management system, and security policy management program | |
US20150040189A1 (en) | Service provision system, service provision method, and computer program product | |
JP2011248452A (en) | Display control program, storage medium, distribution system, display control method and information processing device | |
JP6898416B2 (en) | Contract management system | |
US20150081834A1 (en) | Information processing system and method | |
JP2012053856A (en) | Image delivery system, image processing device, image processing method, image processing program and recording medium | |
JP4506597B2 (en) | Printing system and server device | |
JP4917406B2 (en) | Document copy processing system, document copy processing method, and document copy processing program | |
JP2008040935A (en) | Document distribution system, document distribution server and document distribution server program | |
JP6470636B2 (en) | Information processing apparatus, control method thereof, and program | |
US9137420B1 (en) | Service-oriented multifunction devices | |
JP5515481B2 (en) | Document processing apparatus, document processing system, and program | |
JP2016063474A (en) | Image forming apparatus and program | |
JP2004341660A (en) | Application agency system and method, application agency program, and recording medium with the same recorded | |
JP7150055B2 (en) | Information processing device, data transfer management method, and program | |
JP5573998B2 (en) | Management system, management apparatus, control method thereof, and program | |
JP6981516B2 (en) | Image forming device, control terminal, information processing method and program |