JP2007128370A - Document management server, document management system, document management method, and document management program - Google Patents
Document management server, document management system, document management method, and document management program Download PDFInfo
- Publication number
- JP2007128370A JP2007128370A JP2005321592A JP2005321592A JP2007128370A JP 2007128370 A JP2007128370 A JP 2007128370A JP 2005321592 A JP2005321592 A JP 2005321592A JP 2005321592 A JP2005321592 A JP 2005321592A JP 2007128370 A JP2007128370 A JP 2007128370A
- Authority
- JP
- Japan
- Prior art keywords
- text data
- document management
- keyword
- user
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title 3
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 238000000605 extraction Methods 0.000 abstract 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
Abstract
Description
本発明は、紙媒体に記録された情報を電子データ化して管理および利用する技術に関し、特に情報の電子化のための作業量を軽減することができる文書管理方法等に関する。 The present invention relates to a technique for managing and using information recorded on a paper medium as electronic data, and more particularly to a document management method and the like that can reduce the amount of work for digitizing information.
紙資料はそれを入手した者が原本を保管し、必要に応じて複写機などで複写したコピーを関係者に配布して利用していた。この場合、原本を所持している者と仕事上で交流がなければ、紙資料の存在を知ることができず、有益な情報があるにも関わらず、それを利用することができないという問題点があった。
このような、紙資料の不便さを解消するための技術として、たとえば、複写機等を用いた文書管理システムが特許文献1に記載されている。この文書管理システムでは、印刷するデータにこのデータを特定する付加情報を加えて電子化データとして保管し、付加情報に基づいて文書データを検索する。
The paper material was stored by the person who acquired it, and copies were made using copiers, etc. as needed, and distributed to the parties concerned. In this case, if there is no interaction on the job with the person who owns the original document, it is impossible to know the existence of paper materials, and even though there is useful information, it cannot be used. was there.
As a technique for solving such inconvenience of paper materials, for example,
しかし、上記の従来の文書管理システムでは、電子化データは画像データであるから、付加情報により電子化データと画像データを関連付けることはできるものの、電子データをテキストとして検索することはできない。
そのため、テキスト検索を行う場合には、たとえば、スキャナーなどの装置を使って紙資料の内容を画像データ化し、このデータをOCRソフトに取り込んでテキストデータに変換し、テキストデータに適当なインデックスを付けてデータベースに登録するといった複雑な手順を踏まなければならなかった。
However, in the above-described conventional document management system, since the digitized data is image data, the digitized data and the image data can be associated with the additional information, but the electronic data cannot be retrieved as text.
Therefore, when text search is performed, for example, the contents of paper materials are converted into image data using a device such as a scanner, this data is taken into OCR software, converted into text data, and an appropriate index is attached to the text data. It had to go through complicated procedures such as registering in the database.
そこで、本発明は、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化し、これを複数の利用者により効率的に共有することができる文書管理システム等を提供することをその目的とする。 Accordingly, the present invention provides a document management system and the like that can convert information recorded on a paper medium into text data without forcing the user to perform complicated operations and efficiently share the information with a plurality of users. That is the purpose.
本発明の、文書管理サーバーは、データ変換手段を備え、複写装置により紙媒体の複写が行われたときに複写装置が取得した画像データを取得してこれをテキストデータに変換する。キーワード抽出手段がテキストデータからキーワードを抽出し、データベース登録手段がテキストデータとキーワードを対応付けて文書情報データベースに登録する。ここで、「紙媒体」とは、紙に限らず、合成樹脂製のフィルム等その表面に文字や図形を人間が肉眼で認識できるように記録する一切の記録媒体を言う(請求項1ないし請求項5)。 The document management server according to the present invention includes data conversion means, acquires image data acquired by the copying apparatus when the copying of the paper medium is performed by the copying apparatus, and converts it into text data. The keyword extraction means extracts keywords from the text data, and the database registration means associates the text data with the keywords and registers them in the document information database. Here, the “paper medium” is not limited to paper but refers to any recording medium that records characters and figures on the surface thereof such as a synthetic resin film so that a human can recognize it with the naked eye. Item 5).
上記文書管理サーバーによれば、画像データの取得は、利用者が紙媒体の複写を複写装置を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出は、データ変換手段とキーワード抽出手段により自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベース登録手段により自動的に文書情報データベースに登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
According to the document management server, acquisition of image data is automatically performed when a user copies a paper medium using a copying apparatus. The conversion of image data into text data and the extraction of keywords from the text data are automatically performed by the data conversion means and the keyword extraction means.
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
Further, since the text data and the keyword are automatically registered in the document information database by the database registration means, the text data can be efficiently shared by a plurality of users.
上記文書管理サーバーにおいて、利用者端末から受信した検索キーワードをキーとして文書情報データベースを検索し、検索キーワードと一致するキーワードを含むテキストデータを取得しこのテキストデータを利用者端末に送信するデータベース検索手段を備えるようにしてもよい(請求項2)。
このようにすれば、文書情報データベースに登録されているキーワードを用いて検索することができるから、テキストデータ全体を検索する場合に比べ、検索を高速に行うことができる。
Database search means for searching the document information database using the search keyword received from the user terminal as a key in the document management server, obtaining text data including a keyword matching the search keyword, and transmitting the text data to the user terminal (Claim 2).
In this way, the search can be performed using the keywords registered in the document information database, so that the search can be performed at a higher speed than when searching the entire text data.
上記文書管理サーバーにおいて、データベース検索手段は、検索キーワードを含むテキストデータのタイトル一覧を取得してこれを利用者端末に送信し、タイトル一覧から利用者端末が選択したタイトルに対応するテキストデータを利用者端末に送信するようにしてもよい(請求項3)。
このようにすれば、利用者端末と文書管理サーバーとの間で送受信されるデータの量を削減することができる。
In the document management server, the database search means acquires a title list of text data including the search keyword and transmits it to the user terminal, and uses the text data corresponding to the title selected by the user terminal from the title list. It may be transmitted to the person terminal (claim 3).
In this way, the amount of data transmitted and received between the user terminal and the document management server can be reduced.
上記文書管理サーバーにおいて、データベース登録手段は、複写を行った利用者を特定する複写者IDをテキストデータと対応付けて文書情報データベースに登録し、文書管理サーバーは、複写者IDと検索キーワードを送信した利用者を特定する利用者IDとが一致するテキストデータのキーワードから頻出キーワードを抽出し、この頻出キーワードに関連する語句を含み、かつ、複写者IDが利用者IDと異なるテキストデータを利用者端末に送信するようにしてもよい(請求項4)。
このようにすれば、検索キーワードを送信した利用者以外の利用者が過去に複写を行った紙媒体に記録された情報から、検索キーワードを送信した利用者が興味を持つ可能性が高い情報を選択することができる。
In the document management server, the database registration means registers the copy person ID for identifying the user who made the copy in the document information database in association with the text data, and the document management server transmits the copy person ID and the search keyword. Frequent keywords are extracted from the keywords of the text data that match the user ID that identifies the user, and the text data that includes the words and phrases related to the frequent keywords and whose copy ID is different from the user ID You may make it transmit to a terminal (Claim 4).
In this way, information that is highly likely to be of interest to the user who transmitted the search keyword is obtained from information recorded on a paper medium that has been copied in the past by a user other than the user who transmitted the search keyword. You can choose.
上記文書管理サーバーにおいて、文書情報データベースには、複写機を使用する事業者以外の者から提供された外部テキストデータも登録されていて、データベース検索手段は、外部テキストデータも検索対象に含めるようにしてもよい(請求項5)。
このようにすれば、より広い範囲の情報を検索し利用者に提供することができる。
In the document management server, external text data provided by a person other than the business operator who uses the copying machine is also registered in the document information database, and the database search means includes the external text data in the search target. (Claim 5).
In this way, a wider range of information can be retrieved and provided to the user.
本発明の文書管理システムは、複写装置と文書管理サーバーと文書情報データベースとにより構成される。
複写装置は、画像データ取得手段と画像データ送信手段を備え、複写の対象となった紙媒体から画像データを取得して文書管理サーバーに送信する
文書管理サーバーは、データ変換手段を備え、複写装置から受信した画像データをテキストデータに変換する。キーワード抽出手段がテキストデータからキーワードを抽出し、データベース登録手段がテキストデータとキーワードを対応付けて文書情報データベースに登録する。(請求項6ないし請求項10)。
The document management system of the present invention includes a copying apparatus, a document management server, and a document information database.
The copying apparatus includes an image data acquisition unit and an image data transmission unit, acquires image data from a paper medium to be copied, and transmits the image data to the document management server. The document management server includes a data conversion unit. The image data received from is converted to text data. The keyword extraction means extracts keywords from the text data, and the database registration means associates the text data with the keywords and registers them in the document information database. (
上記文書管理システムによれば、画像データの取得は、利用者が紙媒体の複写を複写装置を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出は、データ変換手段とキーワード抽出手段により自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベース登録手段により自動的に文書情報データベースに登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
According to the document management system, acquisition of image data is automatically performed when a user copies a paper medium using a copying apparatus. The conversion of image data into text data and the extraction of keywords from the text data are automatically performed by the data conversion means and the keyword extraction means.
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
Further, since the text data and the keyword are automatically registered in the document information database by the database registration means, the text data can be efficiently shared by a plurality of users.
上記文書管理システムにおいて、文書情報データベースに登録されたテキストデータを利用する利用者が操作する利用者端末を備え、利用者端末は、文書情報データベースに登録されたテキストデータを検索するための検索キーワードを文書管理サーバーに送信する検索キーワード送信手段を備え、文書管理サーバーは、利用者端末から受信した検索キーワードをキーとして文書情報データベースを検索し、検索キーワードと一致するキーワードを含むテキストデータを取得しこのテキストデータを利用者端末に送信するデータベース検索手段を備えるようにしてもよい(請求項7)。
このようにすれば、文書情報データベースに登録されているキーワードを用いて検索することができるから、テキストデータ全体を検索する場合に比べ、検索を高速に行うことができる。
The document management system includes a user terminal operated by a user who uses text data registered in the document information database, and the user terminal is a search keyword for searching the text data registered in the document information database. A search keyword transmission means for transmitting to the document management server, the document management server searches the document information database using the search keyword received from the user terminal as a key, and obtains text data including a keyword that matches the search keyword. You may make it provide the database search means which transmits this text data to a user terminal (Claim 7).
In this way, the search can be performed using the keywords registered in the document information database, so that the search can be performed at a higher speed than when searching the entire text data.
上記文書管理システムにおいて、データベースアクセス手段は、検索キーワードを含むテキストデータのタイトル一覧を取得してこれを利用者端末に送信し、タイトル一覧から利用者端末が選択したタイトルに対応するテキストデータを利用者端末に送信するようにしてもよい(請求項8)。
このようにすれば、利用者端末と文書管理サーバーとの間で送受信されるデータの量を削減することができる。
In the document management system, the database access means obtains a title list of text data including the search keyword and transmits it to the user terminal, and uses the text data corresponding to the title selected by the user terminal from the title list. It may be transmitted to the person terminal (claim 8).
In this way, the amount of data transmitted and received between the user terminal and the document management server can be reduced.
上記文書管理システムにおいて、画像データ送信手段は、複写を行った利用者を特定する複写者IDを文書管理サーバーに送信し、検索キーワード送信手段は、検索キーワードを指定した利用者を特定する利用者IDを文書管理サーバーに送信し、文書管理サーバーは、複写者IDと利用者IDとが一致するテキストデータのキーワードから頻出キーワードを抽出し、この頻出キーワードに関連する語句を含み、かつ、複写者IDが利用者IDと異なるテキストデータを利用者端末に送信する頻出キーワード抽出手段を備えるようにしてもよい(請求項9)。
このようにすれば、検索キーワードを送信した利用者以外の利用者が過去に複写を行った紙媒体に記録された情報から、検索キーワードを送信した利用者が興味を持つ可能性が高い情報を選択することができる。
In the above document management system, the image data transmission means transmits a copy person ID for identifying the user who performed the copy to the document management server, and the search keyword transmission means is a user for identifying the user who specified the search keyword. The ID is transmitted to the document management server, and the document management server extracts a frequent keyword from a keyword of text data in which the copy ID and the user ID match, includes a phrase related to the frequent keyword, and the copy person You may make it provide the frequent keyword extraction means which transmits text data in which ID differs from user ID to a user terminal (Claim 9).
In this way, information that is highly likely to be of interest to the user who transmitted the search keyword is obtained from information recorded on a paper medium that has been copied in the past by a user other than the user who transmitted the search keyword. You can choose.
上記文書管理システムにおいて、文書情報データベースには、複写機を使用する事業者以外の者から提供された外部テキストデータも登録されており、データベース検索手段は、外部テキストデータも検索対象に含め、タイトル一覧には、外部テキストデータのタイトルも含まれるようにしてもよい(請求項10)。
このようにすれば、より広い範囲の情報を検索し利用者に提供することができる。
In the document management system, external text data provided by a person other than the business operator who uses the copying machine is also registered in the document information database, and the database search means includes the external text data in the search target and the title. The list may include titles of external text data (claim 10).
In this way, a wider range of information can be retrieved and provided to the user.
本発明の文書管理方法は、紙媒体に記録された情報の複写を行った複写装置から情報を画像として電子データ化した画像データを受信し、画像データからテキストを抽出し画像データをテキストデータに変換するデータ変換工程と、テキストデータからキーワードを抽出するキーワード抽出工程と、テキストデータとキーワードを対応付けて文書情報データベースに登録するデータベース登録工程と、情報を利用する利用者が操作する利用者端末から受信した検索キーワードをキーとして文書情報データベースを検索し、検索キーワードと一致するキーワードを含むテキストデータを取得しこのテキストデータを利用者端末に送信するデータベース検索工程とを備える(請求項11)。 According to the document management method of the present invention, image data obtained by converting information recorded as an image into electronic data is received from a copying apparatus that has copied information recorded on a paper medium, text is extracted from the image data, and the image data is converted into text data. A data conversion step for conversion, a keyword extraction step for extracting a keyword from text data, a database registration step for registering text data and a keyword in association with each other in a document information database, and a user terminal operated by a user who uses the information A database search step of searching the document information database using the search keyword received from as a key, obtaining text data including a keyword matching the search keyword, and transmitting the text data to the user terminal (claim 11).
上記文書管理方法によれば、画像データの取得は、利用者が紙媒体の複写を複写装置を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出は、データ変換工程とキーワード抽出工程で自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベース登録工程で自動的に文書情報データベースに登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
さらに、データベース検索工程では、文書情報データベースに登録されているキーワードを用いて検索することができるから、テキストデータ全体を検索する場合に比べ、検索を高速に行うことができる。
According to the document management method, acquisition of image data is automatically performed when a user copies a paper medium using a copying apparatus. The conversion of image data into text data and the extraction of keywords from the text data are automatically performed in the data conversion process and the keyword extraction process.
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
In addition, since the text data and the keyword are automatically registered in the document information database in the database registration process, the text data can be efficiently shared by a plurality of users.
Furthermore, in the database search step, a search can be performed using keywords registered in the document information database, so that the search can be performed at a higher speed than when searching the entire text data.
本発明の文書管理プログラムは、コンピュータに、紙媒体に記録された情報の複写を行った複写装置から情報を画像として電子データ化した画像データを受信し、画像データからテキストを抽出し画像データをテキストデータに変換するデータ変換機能と、テキストデータからキーワードを抽出するキーワード抽出機能と、テキストデータとキーワードを対応付けて文書情報データベースに登録するデータベース登録機能と、情報を利用する利用者が操作する利用者端末から受信した検索キーワードをキーとして文書情報データベースを検索し、検索キーワードと一致するキーワードを含むテキストデータを取得しこのテキストデータを利用者端末に送信するデータベース検索機能とを実行させる(請求項12)。 The document management program of the present invention receives image data converted into electronic data as information from a copying apparatus that has copied information recorded on a paper medium to a computer, extracts text from the image data, and stores the image data A data conversion function for converting to text data, a keyword extraction function for extracting keywords from text data, a database registration function for registering text data and keywords in association with each other, and a user who uses the information operate The document information database is searched using the search keyword received from the user terminal as a key, text data including a keyword matching the search keyword is acquired, and a database search function for transmitting this text data to the user terminal is executed (invoice) Item 12).
上記文書管理プログラムによれば、画像データの取得は、利用者が紙媒体の複写を複写装置を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出は、データ変換機能とキーワード抽出機能により自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベース登録機能により自動的に文書情報データベースに登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
さらに、データベース検索機能は、文書情報データベースに登録されているキーワードを用いて検索することができるから、テキストデータ全体を検索する場合に比べ、検索を高速に行うことができる。
According to the document management program, acquisition of image data is automatically performed when a user copies a paper medium using a copying apparatus. Further, conversion of image data into text data and extraction of keywords from the text data are automatically performed by a data conversion function and a keyword extraction function.
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
Further, since the text data and the keyword are automatically registered in the document information database by the database registration function, the text data can be efficiently shared by a plurality of users.
Furthermore, since the database search function can search using keywords registered in the document information database, the search can be performed at a higher speed than when searching the entire text data.
本発明によれば、画像データの取得は、利用者が紙媒体の複写を複写装置を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出も自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベース自動的に文書情報データベースに登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
According to the present invention, acquisition of image data is automatically performed when a user copies a paper medium using a copying apparatus. Also, conversion of image data into text data and extraction of keywords from the text data are automatically performed.
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
Further, since the text data and keywords are automatically registered in the document information database, the text data can be efficiently shared by a plurality of users.
以下、図を参照しながら本発明の第1の実施形態である文書管理システム10の構成と動作について説明する。
図1は、文書管理システム10の構成を示すブロック図である。
文書管理システム10は、ユーザー企業1に設置された複写機20と利用者端末30および文書管理サービス事業者2に設置された文書管理サーバー40と文書情報データベース(DB)50と事業者情報DB51と利用者情報DB52を備えている。文書管理サービス事業者2は、文書管理サービスの提供者であり、ユーザー企業1は、文書管理サービス事業者2と利用契約を結んだサービスの利用者である。
The configuration and operation of the document management system 10 according to the first embodiment of the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram showing the configuration of the document management system 10.
The document management system 10 includes a copying
複写機(複写装置)20は、たとえば、PPC式複写機、ファクシミリ送受信機、プリンタ機能とコピー機能を備えた複合機能プリンタ、ハンディースキャナーなどの紙媒体に記録された情報を電子的な画像データとして取得する機能と、通信機能とを備えた機器である。複写機20は、図1には1台だけを図示しているが複数台設置されていてもよい。
利用者端末30は、ユーザー企業1に所属する利用者が文書管理システム10を利用するために用いる端末装置で、たとえばパーソナルコンピューターや携帯電話機などの通信機能を備えインターネット3に接続可能な情報端末装置である。利用者端末30も、複数台設置されていてもよい。
複写機20と利用者端末30は、それぞれ、ユーザーLAN(Local Area Network)4とインターネット3を介して、文書管理サーバー40との間で通信をすることができる。
The copying machine (copying apparatus) 20 is, for example, information recorded on a paper medium such as a PPC copying machine, a facsimile transmitter / receiver, a multifunction printer having a printer function and a copying function, and a handy scanner as electronic image data. It is a device having a function to acquire and a communication function. Although only one copying
The
The copying
文書管理サーバー40は、たとえば通信機能とデータベースアクセス機能を備えたサーバコンピュータであり、文書データをOCR(Optical Character Recognition)機能などを利用してテキストデータ化する機能と、テキスト化されたデータを分析しこのデータから主なキーワードを抽出する機能を備える。また、文書管理サーバー40は、利用者端末30からの要求に応じて、後述の文書情報DB50を検索し、タイトル一覧等の情報を利用者端末30に送信する機能も備えている。
文書情報DB50は、文書管理サーバー40によりテキスト化されたデータを蓄積するデータベース、事業者情報DB51は、文書管理サービスを使用するユーザー企業に関する情報を蓄積するデータベース、利用者情報DB52は、ユーザー企業に属し文書管理サービスを利用する利用者に関する情報を蓄積するデータベースである。これらのデータベースの詳細は、後述する。
The
The
図2は、複写機20の構成を示す機能ブロック図である。
制御手段21は、たとえば、図示しないCPUがオペレーティングシステムやデバイスドライバを実行することにより実現され、複写機20の各部の動作を制御する。
複写手段(画像データ取得手段)22は、たとえば、紙媒体を透過した光をフォトダイオード等の撮像素子により電気信号に変換し、この信号をビットマップ等の電子的な画像データに変換する。データ取得手段22は、取得した画像データを記憶手段25に一時的に格納する。
入力手段23は、たとえば、タッチパネルにより構成され、利用者はこれを用いて利用者IDを入力する。
通信手段(画像データ送信手段)24は、たとえばIEEE(Institute of Electrical and Electronic Engineers)802.3の通信方式をサポートするLANアダプタであり、ユーザーLAN3とインターネット3を介してデータ取得手段22が取得した画像データを文書管理サーバー40に送信する。
記憶手段25は、たとえばハードディスク装置により構成され、ユーザー企業1を特定する情報である事業者ID25aと複写機20を特定する情報である機器ID25bがあらかじめ格納されている。
FIG. 2 is a functional block diagram showing the configuration of the copying
The control means 21 is realized, for example, when a CPU (not shown) executes an operating system or a device driver, and controls the operation of each unit of the
The copying means (image data acquisition means) 22 converts, for example, light transmitted through a paper medium into an electrical signal by an imaging element such as a photodiode, and converts this signal into electronic image data such as a bitmap. The
The input means 23 is constituted by, for example, a touch panel, and the user inputs a user ID using this.
The communication means (image data transmission means) 24 is a LAN adapter that supports the communication system of IEEE (Institute of Electrical and Electronic Engineers) 802.3, for example, and is acquired by the data acquisition means 22 via the
The storage means 25 is constituted by, for example, a hard disk device, and stores in advance an
図3は、利用者端末30の構成を示す機能ブロック図である。
制御手段31は、たとえば、図示しないCPUがオペレーティングシステムやデバイスドライバを実行することにより実現され、利用者端末30の各部の動作を制御する。
入力手段32は、たとえばキーボードにより構成され、利用者が利用者ID等の情報を入力するために使用する。
出力手段33は、たとえば液晶ディスプレイ装置により構成され、文書管理サーバ40から送信されたデータ等を利用者が視認できるように表示する。
データベースアクセス手段(検索キーワード送信手段)34は、たとえばCPUにより実行されるデータベースアクセス用のクライアントソフトウェアにより実現される。データベースアクセス手段34は、通信手段35を介して、たとえばSQLにより文書情報DB50に問い合わせ(クエリー)を発行し、検索等を行う。
データベースアクセス手段34の別の実現方法としては、たとえばCPUにより実行され、文書管理サーバー40で実行されるWebアプリケーションソフトウェアと連携して動作するWebブラウザにより実現することもできる。この場合、データベース操作機能はWebアプリケーションが担い、データベースアクセス手段34は、利用者が検索キーワードを入力したり、検索結果を確認したりするためのユーザーインターフェイスとして機能する。
通信手段35は、たとえばIEEE802.3の通信方式をサポートするLANアダプタであり、ユーザーLAN3とインターネット3を介して文書管理サーバー40との間で情報の送受信を行う。
記憶手段36は、たとえばハードディスク装置により構成され、利用者端末が設置されている事業者を特定する情報である事業者ID36aがあらかじめ記憶されている。なお、事業者ID36aは、記憶手段36aには記憶しておかず、利用者が文書管理システム10を利用する都度入力するようにしてもよい。
FIG. 3 is a functional block diagram showing the configuration of the
The control unit 31 is realized by, for example, a CPU (not shown) executing an operating system or a device driver, and controls the operation of each unit of the
The input means 32 is configured by a keyboard, for example, and is used by a user to input information such as a user ID.
The output means 33 is constituted by a liquid crystal display device, for example, and displays the data transmitted from the
The database access means (search keyword transmission means) 34 is realized by, for example, client software for database access executed by the CPU. The database access unit 34 issues an inquiry (query) to the
Another method for realizing the database access unit 34 may be realized by a Web browser that is executed by, for example, a CPU and operates in cooperation with Web application software executed by the
The
The storage means 36 is composed of, for example, a hard disk device, and stores in advance an operator ID 36a that is information for specifying the operator in which the user terminal is installed. The business entity ID 36a may not be stored in the storage unit 36a but may be input every time the user uses the document management system 10.
図4は、文書管理サーバー40の構成を示す機能ブロック図である。
制御手段41は、たとえば、図示しないCPUがオペレーティングシステムやデバイスドライバを実行することにより実現され、文書管理サーバー40の各部の動作を制御する。
入力手段42は、たとえばキーボードにより構成され、文書管理サーバー40の管理者が、管理上必要なコマンド等を入力するために使用する。
データ変換手段43は、たとえばOCRソフトウェアをCPUが実行することにより実現される。データ変換手段43は、複写機20から受信し記憶手段44に格納されている画像データ47aを読み出して画像から文字を抽出し、たとえばユニコードで表現されたテキストデータに変換する。データ変換手段43は、生成したテキストデータを記憶手段47に格納する。
キーワード抽出手段44は、記憶手段47からテキストデータを読み出して、このデータからキーワードを抽出し、記憶手段47に格納する。
データベースアクセス手段(データベース登録手段、データベース検索手段)45は、たとえば、CPUにより実行されるデータベース操作ソフトウェアにより実現され、たとえばSQLを用いて文書情報DB50、事業者情報DB51、利用者情報52に対してデータの登録、問い合わせの発行等を行う。また、利用者端末30のデータベースアクセス手段34が、データベース操作機能を持たない場合には、Webアプリケーションとして構成し、利用者端末30に検索キーワード等を入力するユーザーインターフェイスを提供する。
データベースアクセス手段45は、記憶手段47からテキストデータ、キーワードを読み出し、これらのデータを通信手段46を介して送信し文書情報DB50に登録する。
通信手段46は、たとえばIEEE802.3の通信方式をサポートするLANアダプタであり、事業者LAN4とインターネット3を介して複写機20および利用者端末30との間で情報の送受信を行う。通信手段46は、また、事業者LAN40を介して文書情報DB50、事業者情報DB51、利用者情報DB52と通信を行う。
FIG. 4 is a functional block diagram showing the configuration of the
The control means 41 is realized, for example, when a CPU (not shown) executes an operating system or a device driver, and controls the operation of each unit of the
The input means 42 is composed of, for example, a keyboard, and is used by the administrator of the
The
The keyword extraction unit 44 reads text data from the storage unit 47, extracts keywords from this data, and stores them in the storage unit 47.
The database access means (database registration means, database search means) 45 is realized by, for example, database operation software executed by the CPU. For example, the database access means 45, the
The database access unit 45 reads text data and keywords from the storage unit 47, transmits these data via the communication unit 46, and registers them in the
The communication means 46 is a LAN adapter that supports, for example, the IEEE 802.3 communication method, and transmits and receives information between the
図5は、文書管理サービス事業者2に設置されている各データベースのデータ構造を示す図である。
図5(a)を参照すると、事業者情報DB51には、事業者ID51aに関連付けて、事業者名51b、住所51c、電話番号51dが登録されている。これらのデータは、事業者がサービスに加入した際に、文書管理サービス事業者2によって登録される。
事業者ID51aは、文書サービスシステム10を利用する事業者を特定する情報で、サービスへの加入時に文書管理サービス事業者により利用事業者に交付さる。
事業者名51bは、事業者ID51aに対応する事業者の名称を示す文字列である。
住所51cは、事業者ID51aに対応する事業者の住所を示す文字列である。
住所51dは、事業者ID51aに対応する事業者の電話番号を示す文字列である。
FIG. 5 is a diagram showing the data structure of each database installed in the document
Referring to FIG. 5A, in the business
The company ID 51a is information for identifying the company that uses the document service system 10, and is issued to the user company by the document management service company when subscribing to the service.
The company name 51b is a character string indicating the name of the company corresponding to the company ID 51a.
The address 51c is a character string indicating the address of the business operator corresponding to the business operator ID 51a.
The
図5(b)を参照すると、利用者情報DB52には、利用者ID52aに関連付けて、事業者ID52bと氏名52cが登録されている。これらのデータは、事業者がサービスに加入した際に、または新たな利用者の追加があった際に、文書管理サービス事業者2によって登録される。
利用者ID52aは、利用者個人を特定するための情報で、事業者がサービスへ加入した際に文書管理サービス事業者により利用者一人一人に交付される。
事業者ID52bは、利用者ID52aに対応する利用者が属する事業者の事業者IDである。
氏名52cは、利用者ID52aに対応する利用者の氏名を示す文字列である。
Referring to FIG. 5B, in the
The user ID 52a is information for identifying the individual user, and is issued to each user by the document management service provider when the provider subscribes to the service.
The business ID 52b is a business ID of a business to which a user corresponding to the user ID 52a belongs.
The
図5(c)を参照すると、文書情報DB50には、文書ID50aに関連付けて、事業者ID50b、利用者ID50c、機器ID50d、テキスト50e、複数のキーワード50gが登録されている。これらのデータは、文書管理サーバー40からテキストデータとそれに付随するデータを受信した際に、1レコードずつ追加される。
文書ID50aは、文書管理サーバー40から受信したテキストデータを特定するための情報で、たとえば受信順に付された通し番号である。
事業者ID50bは、文書ID50aに対応するテキストデータを送信した機器が設置されている事業者の事業者ID(複写者ID)である。
利用者ID50cは、文書ID50aに対応するテキストデータの抽出元となった紙文書の複写を行った利用者の利用者IDである。
機器ID50dは、文書ID50aに対応するテキストデータを抽出元となった画像データを取得した機器を特定するための情報であり、たとえば、機器の製造時に付与された製造番号である。
タイトル50eは、文書ID50aに対応するテキストデータのタイトルを示す文字列である。
テキスト50fは、文書ID50aに対応するテキストデータの内容である文字列である。
キーワード50gは、文書ID50aに対応するテキストデータから文書管理サーバー40が抽出したキーワードを示す文字列である。
Referring to FIG. 5C, in the
The document ID 50a is information for specifying text data received from the
The business operator ID 50b is a business operator ID (copyer ID) of the business operator in which the device that transmitted the text data corresponding to the document ID 50a is installed.
The
The
The title 50e is a character string indicating the title of text data corresponding to the document ID 50a.
The text 50f is a character string that is the content of text data corresponding to the document ID 50a.
The keyword 50g is a character string indicating a keyword extracted by the
次に、文書管理システム10の動作について説明する。
図6は、文書管理システム10のデータ登録動作を示すシーケンス図である。
利用者が複写機20に利用者IDを入力して紙資料の複写をする。利用者IDは、制御手段21によって記憶手段25に格納される。複写が行われたときに、複写機20のデータ取得手段22は、複写の対象となった紙資料に記録されたデータを画像データとして取得し(S101)、この画像データを記憶手段25に格納する。複写機20の通信手段24は、記憶手段25から画像データ、利用者ID、あらかじめ格納されている事業者ID23aと機器ID23b(以下、これら4個のデータを「登録データ」を呼ぶ)を読み出して、インターネット3を介して文書管理サーバー40に送信する(S102)。文書管理サーバー40は、登録データを通信手段46で受信し、記憶手段47に格納する。このとき、文書管理サーバー40の制御部41は、受信したテキストデータに対応する文書IDを生成し記憶手段47に格納する。
Next, the operation of the document management system 10 will be described.
FIG. 6 is a sequence diagram showing a data registration operation of the document management system 10.
The user inputs the user ID to the copying
文書管理サーバー40のデータ変換手段43は、記憶手段47から画像データを読み出して、たとえばユニコード表現されたテキストデータに変換し(S103)、後続の処理のために記憶手段47に格納する。この変換処理は、OCRソフトウェア等に用いられている公知の方法で行うことができる。
文書管理サーバー40のキーワード抽出手段44は、記憶手段47からテキストデータを読み出して、このデータからキーワードを抽出し(S104)、記憶手段47に格納する。このステップで、キーワード抽出手段44が、たとえば、テキストデータの最初の何文字かをテキストデータのタイトルとして抽出するようにしてもよい。
データベースアクセス手段45は、文書ID、事業者ID、利用者ID、機器ID、タイトル、テキストデータ、キーワードを記憶手段47から読み出し、通信手段46を介して文書情報DB50に送信し、登録する(S105)。
The
The keyword extraction unit 44 of the
The database access unit 45 reads out the document ID, business ID, user ID, device ID, title, text data, and keyword from the storage unit 47, transmits them to the
図7は、文書情報DB50にデータが蓄積された後、利用者が検索を行う場合の文書管理システム10の動作を示すシーケンス図である。
利用者端末30のデータベースアクセス手段34は、入力手段32を介して利用者により入力された検索キーワードを取得する(S111)。データベースアクセス手段34は、記憶手段36にあらかじめ記憶されている事業者ID36aを読み出し、検索キーワードとともに通信手段35を介して、文書管理サーバー40に送信する(S112)。
文書管理サーバー40は、文書情報データベースを検索し、受信したキーワードと事業者IDの両方を含むレコードのタイトル一覧を取得し(S113)、これを通信手段34を介して利用者端末30に送信する(S114)。
タイトル一覧を通信手段35により受信した利用者端末30は、これを出力手段33に表示し利用者に提示する。データベースアクセス手段34は、入力手段32を介して利用者により入力された選択タイトルを取得する(S115)。データベースアクセス手段34は、通信手段35を介して選択タイトルを文書管理サーバー40に送信する(S116)。
文書管理サーバー40のデータベースアクセス手段45は、選択タイトルを検索キーとして文書情報DB50を検索し、選択タイトルと対応するテキストデータを取得し(S117)、利用者端末30に送信する(S118)。
FIG. 7 is a sequence diagram illustrating an operation of the document management system 10 when a user performs a search after data is stored in the
The database access unit 34 of the
The
The
The database access unit 45 of the
図8は、文書情報データベース50に情報が蓄積された後、利用者が興味を持つと思われるデータを自動的に選択して利用者に提示する場合の文書管理システム10の動作を示すシーケンス図である。
利用者端末30のデータベースアクセス手段34は、記憶手段36にあらかじめ格納されている事業者ID36aと、入力手段32により利用者が入力した利用者IDを取得する(S121)。データベースアクセス手段34は、これら2個のデータを通信手段35を介して文書管理サーバー40に送信する(S122)。
文書管理サーバー40のデータベースアクセス手段45は、利用者IDと事業者IDを検索キーとして文書情報データベース50を検索し、利用者IDのフィールドが検索キーと一致するレコードに含まれるキーワードの集合を取得する(S123)
頻出キーワード抽出手段48は、S123で取得したキーワードの集合から頻出キーワードを抽出する。これは、たとえば、あらかじめ定めた閾値よりも出現回数の多いものを頻出キーワードと判定することにより行う(S124)。
FIG. 8 is a sequence diagram illustrating the operation of the document management system 10 when data that is likely to be of interest to the user is automatically selected and presented to the user after information is stored in the
The database access unit 34 of the
The database access means 45 of the
The frequent keyword extraction means 48 extracts frequent keywords from the keyword set acquired in S123. This is performed, for example, by determining a keyword that appears more frequently than a predetermined threshold as a frequent keyword (S124).
データベースアクセス手段45は、頻出キーワードと関連するキーワードを含み、かつ、利用者IDのフィールドが利用者端末から受信したものと一致せず、事業者IDのフィールドが利用者端末から受信したものと一致するレコードのタイトルの一覧を取得する(S125)。ここで、頻出キーワードと関連するキーワードの判定は、たとえば、文書管理サーバー40または文書情報DB50のいずれかにシソーラス(類義語辞書)をそなえ、このシソーラスで頻出キーワードと関連語とされている語を「関連するキーワード」と判定することができる。データベースアクセス手段45は、タイトル一覧を利用者端末30に送信する(S126)。
タイトル一覧を通信手段35により受信した利用者端末30は、これを出力手段33に表示し利用者に提示する。データベースアクセス手段34は、入力手段32を介して利用者により入力された選択タイトルを取得する(S127)。データベースアクセス手段34は、通信手段35を介して選択タイトルを文書管理サーバー40に送信する(S128)。
文書管理サーバー40のデータベースアクセス手段45は、選択タイトルを検索キーとして文書情報DB50を検索し、選択タイトルと対応するテキストデータを取得し(S129)、利用者端末30に送信する(S130)。
The database access means 45 includes keywords related to frequent keywords, and the user ID field does not match the one received from the user terminal, and the operator ID field matches the one received from the user terminal. A list of titles of records to be acquired is acquired (S125). Here, the determination of the keyword related to the frequent keyword includes, for example, a thesaurus (synonym dictionary) in either the
The
The database access unit 45 of the
文書管理システム10によれば、画像データの取得は、利用者が紙媒体の複写を複写機20を利用して行った際に自動的に行われる。また、画像データのテキストデータへの変換とテキストデータからのキーワードの抽出は、データ変換手段43とキーワード抽出手段44により自動的に行われる。
そのため、利用者に煩雑な操作を強いることなく紙媒体に記録された情報をテキストデータ化することができる。
また、テキストデータとキーワードはデータベースアクセス手段により自動的に文書情報DB50に登録されるから、テキストデータを複数の利用者により効率的に共有することができる。
According to the document management system 10, image data is automatically acquired when a user copies a paper medium using the copying
Therefore, the information recorded on the paper medium can be converted into text data without forcing the user to perform complicated operations.
Further, since the text data and the keyword are automatically registered in the
文書管理システム10によれば、データベースアクセス手段45は、文書情報DB50に登録されているキーワードを用いて検索することができるから、テキストデータ全体を検索する場合に比べ、検索を高速に行うことができる。
According to the document management system 10, the database access unit 45 can perform a search using a keyword registered in the
文書管理システム10によれば、データベースアクセス手段45は、テキストデータを送信する前にタイトル一覧を利用者端末30に送信し、利用者端末30により選択されたテキストデータを送信するから利用者端末30と文書管理サーバー40との間で送受信されるデータの量を削減することができる。
According to the document management system 10, the database access unit 45 transmits the title list to the
文書管理システム10によれば、頻出キーワード抽出手段48が、検索キーワードを送信した利用者が過去に複写をした紙媒体から取得したテキストデータから頻出キーワードを抽出する。データベースアクセス手段45は、頻出キーワードに関連のある語をキーワードとして含むテキストデータの一覧を利用者端末10に送信する。
そのため、検索キーワードを送信した利用者は、他の利用者が過去に複写を行った紙媒体に記録された情報から、自分が興味を持つ情報を選択し、取得することができる。利用者はキーワードと自己の利用者IDを送信するだけでよいから、利用者がテキストデータの取得元となった紙資料の存在を知らない場合でも、その資料に記録された情報を取得することができる。
According to the document management system 10, the frequent keyword extraction means 48 extracts a frequent keyword from text data acquired from a paper medium copied in the past by the user who transmitted the search keyword. The database access unit 45 transmits a list of text data including words related to the frequent keywords as keywords to the user terminal 10.
Therefore, the user who transmitted the search keyword can select and acquire information that he / she is interested in from information recorded on a paper medium that has been copied by another user in the past. Users only need to send the keyword and their user ID, so even if the user does not know the existence of the paper material from which the text data was acquired, the information recorded in that material must be acquired Can do.
次に、図を参照しながら本発明の第2の実施形態である文書管理システム11の構成と動作について説明する。文書管理システム11は、その構成の多くが文書管理システム10と共通するので、文書管理システム10と異なる点を中心に説明する。
図9は、文書管理システム11の構成を示すブロック図である。
文書管理システム11は、図1の文書管理システム1の構成要素に加えて、コンテンツ提供サービス事業者6に設置されたコンテンツ配信サーバー60とコンテンツDB61とを備えている。コンテンツ配信サーバー60とコンテンツDB61は、コンテンツ事業者LAN7を介してインターネット3に接続されている。
Next, the configuration and operation of the document management system 11 according to the second embodiment of the present invention will be described with reference to the drawings. Since the document management system 11 has many configurations in common with the document management system 10, the differences from the document management system 10 will be mainly described.
FIG. 9 is a block diagram showing the configuration of the document management system 11.
The document management system 11 includes a
コンテンツ配信サーバー60は、通信機能とデータベースアクセス機能とを備えたサーバコンピュータで、インターネット3を介して他の機器から送信された配信要求に応じて、コンテンツDB61に登録されている文書等の電子的データ(以下、コンテンツと言う)を要求元の機器に送信する。
コンテンツDB61は、配信用のコンテンツを格納したデータベースである。図11(a)に、コンテンツDB61のデータ構造の一例を示す。
コンテンツDB61には、コンテンツID61aに関連付けて、タイトル61b、日付61c、テキスト61d、キーワード61eが登録されている。
コンテンツID61aは、登録されているコンテンツを特定する情報であり、たとえば、データの取得順に付された通し番号である。
タイトル61bは、コンテンツのタイトルを示す文字列である。
日付61cは、コンテンツが作成された年月日を示す文字列である。
テキスト61dは、コンテンツの内容である文字列である。
キーワード61eは、テキスト61dに含まれるキーワードである。キーワードは複数登録することができる。
The
The content DB 61 is a database that stores content for distribution. FIG. 11A shows an example of the data structure of the content DB 61.
In the content DB 61, a
The content ID 61a is information for specifying the registered content, and is, for example, a serial number assigned in the data acquisition order.
The
The date 61c is a character string indicating the date when the content is created.
The text 61d is a character string that is the content of the content.
The
図10は、図9の文書管理サーバー40aの構成を示す機能ブロック図である。
文書管理サーバー40aは、図4に示した文書管理サーバー40の各構成要素に加えて課金処理手段49と課金処理DB62を備えている。
課金処理手段49は、コンテンツ配信サーバーから取得して利用者端末30に配信したコンテンツについての課金処理を実行する。
図11(b)に、課金処理DB62のデータ構造の一例を示す。
課金処理DB62には、コンテンツID62aに関連付けて、事業者ID62b、利用回数62c、単価62d、利用額62eが登録されている。
コンテンツID62aは、配信したコンテンツを特定する情報で、図11(a)のコンテンツID61aに対応する。
事業者ID62bは、コンテンツの配信を受けた事業者を特定する情報で、図5(a)の事業者ID51aに対応する。
利用回数62cは、コンテンツID62aに対応するコンテンツが事業者ID62bに対応する事業者に配信された回数を示す数値である。
単価62dは、コンテンツ毎にあらかじめ定められた配信1回あたりの利用料金である。
利用額62eは、コンテンツ毎に集計された利用料金で、利用回数62cと単価62dを乗じて得られた数値である。
FIG. 10 is a functional block diagram showing the configuration of the document management server 40a of FIG.
The document management server 40a includes a
The billing processing means 49 executes billing processing for the content acquired from the content distribution server and distributed to the
FIG. 11B shows an example of the data structure of the
In the
The content ID 62a is information for specifying the distributed content, and corresponds to the content ID 61a in FIG.
The business ID 62b is information for specifying the business that has received the content distribution, and corresponds to the business ID 51a in FIG.
The
The unit price 62d is a usage fee for one delivery determined in advance for each content.
The usage amount 62e is a usage fee aggregated for each content, and is a numerical value obtained by multiplying the
複写機20と利用者端末30の構成は、図2および図3に示した文書管理システム10の場合と同様であるから説明を省略する。文書情報DB50、事業者DB51、利用者情報DB52のデータ構造もそれぞれ図5(c)、(a)、(b)に示したものと同様であるから説明を省略する。
The configurations of the copying
図12は、文書管理システム11の動作を示すシーケンス図である。文書情報DB50には、図6に示したものと同様の手順でテキストデータ等が蓄積されているという前提で説明する。
利用者端末30のデータベースアクセス手段34は、入力手段32を介して利用者により入力された検索キーワードを取得する(S141)。データベースアクセス手段34は、記憶手段36にあらかじめ記憶されている事業者ID36aを読み出し、検索キーワードとともに通信手段35を介して、文書管理サーバー40に送信する(S142)。これを受信した文書管理サーバー40の通信手段46は、検索キーワードをコンテンツ配信サーバー60に転送する(S143)。
コンテンツ配信サーバー60は、受信した検索キーワードをキーとしてコンテンツDB61を検索し、検索キーワードと一致するキーワードを含むコンテンツのタイトル一覧を取得し(S144)、これを文書管理サーバー40に送信する(S145)。
文書管理サーバー40のデータベースアクセス手段45は、図7のS113に示したものと同様の手順で文書情報DB60を検索し、検索キーワードと一致するキーワードを含むテキストデータのタイトル一覧を取得する(S146)。データベースアクセス手段45は、このタイトル一覧とコンテンツ配信サーバー60から受信したタイトル一覧を通信手段46を介して利用者端末30に送信する(S147)。
FIG. 12 is a sequence diagram showing the operation of the document management system 11. Description will be made on the assumption that text data and the like are stored in the
The database access unit 34 of the
The
The database access means 45 of the
タイトル一覧を通信手段35により受信した利用者端末30は、これを出力手段33に表示し利用者に提示する。データベースアクセス手段34は、入力手段32を介して利用者により入力されたコンテンツまたはテキストデータの選択タイトルを取得する(S148)。ここでは、選択タイトルとしてコンテンツDBに格納されているコンテンツのタイトルが選択されてものとして説明する。利用者端末30のデータベースアクセス手段34は、通信手段35を介して選択タイトルを文書管理サーバー40に送信する(S149)。これを受信したコンテンツ配信サーバー40の通信手段45は、選択タイトルをコンテンツ配信サーバー60に転送する(S150)。
コンテンツ配信サーバー60は、選択タイトルを検索キーとしてコンテンツDB61を検索し、選択タイトルと対応するコンテンツを取得し(S151)、これを文書管理サーバー40に送信する(S152)。
文書管理サーバー40のデータベースアクセス手段45は、受信したコンテンツを文書情報DBに登録し(S153)、通信手段46は、利用者端末30に送信する(S154)。
課金処理手段49は、課金DB62の送信したコンテンツに対応するレコードの利用回数62cに1を加算するとともに更新後の利用回数62cと単価62dを乗じて得られた数値で利用額62eを更新する(S155)。
The
The
The database access unit 45 of the
The charging processing means 49 adds 1 to the
文書管理システム11によれば、データベースアクセス手段45が、コンテンツDB61に登録されているコンテンツも検索するから、利用者は、ユーザー企業1の社内で収集された情報だけでなく、コンテンツ提供サービス事業者6から提供された情報も利用することができる。
According to the document management system 11, since the database access means 45 also searches the content registered in the content DB 61, the user is not only the information collected in the
10、11 文書管理システム
20 複写機(複写装置)
21 制御手段
22 複写手段(画像データ取得手段)
23 入力手段
24 通信手段(画像データ送信手段)
25 記憶手段
30 利用者端末
31 制御手段
32 入力手段
33 出力手段
34 データベースアクセス手段(検索キーワード送信手段)
35 通信手段
36 記憶手段
40、40a 文書管理サーバー
41 制御手段
42 入力手段
43 データ変換手段
44 キーワード抽出手段
45 データベースアクセス手段(データベース登録手段、データベース検索手段)
46 通信手段
47 頻出キーワード抽出手段
50 文書情報DB
51 コンテンツDB
10, 11
21 Control means 22 Copying means (image data acquisition means)
23 input means 24 communication means (image data transmission means)
25 storage means 30 user terminal 31 control means 32 input means 33 output means 34 database access means (search keyword transmission means)
35 Communication means 36 Storage means 40, 40a Document management server 41 Control means 42 Input means 43 Data conversion means 44 Keyword extraction means 45 Database access means (database registration means, database search means)
46 Communication means 47 Frequent keyword extraction means 50 Document information DB
51 Content DB
Claims (12)
前記紙媒体に記録された情報の複写を行った複写装置から前記情報を画像として電子データ化した画像データを受信し、前記画像データからテキストを抽出し前記画像データをテキストデータに変換するデータ変換手段と、
前記テキストデータからキーワードを抽出するキーワード抽出手段と、
前記テキストデータと前記キーワードを対応付けて文書情報データベースに登録するデータベース登録手段とを備えたことを特徴とした文書管理サーバー。 In a document management server that manages information recorded on paper media,
Data conversion for receiving image data obtained by converting the information into electronic data from a copying apparatus that has copied information recorded on the paper medium, extracting text from the image data, and converting the image data into text data Means,
Keyword extracting means for extracting a keyword from the text data;
A document management server comprising database registration means for associating the text data with the keyword and registering them in a document information database.
前記複写者IDと前記検索キーワードを送信した前記利用者を特定する利用者IDとが一致する前記テキストデータの前記キーワードから頻出キーワードを抽出し、この頻出キーワードに関連する語句を含み、かつ、前記複写者IDが前記利用者IDと異なるテキストデータを前記利用者端末に送信する頻出キーワード抽出手段を備えたことを特徴とした請求項2または請求項3に記載の文書管理サーバー。 The database registration means registers a copy person ID for identifying the user who made the copy in the document information database in association with the text data,
The frequently used keyword is extracted from the keyword of the text data in which the copy ID and the user ID that identifies the user who transmitted the search keyword match, and includes a phrase related to the frequently used keyword, and 4. The document management server according to claim 2, further comprising frequent keyword extraction means for transmitting text data having a copy ID different from the user ID to the user terminal.
前記複写装置は、
前記複写を行う際に前記情報を画像データとして取得する画像データ取得手段と、
前記画像データを前記文書管理サーバーへ送信する画像データ送信手段とを備え、
前記文書管理サーバーは、
前記複写装置から受信した前記画像データからテキストを抽出し前記画像データをテキストデータに変換するデータ変換手段と、
前記テキストデータからキーワードを抽出するキーワード抽出手段と、
前記テキストデータと前記キーワードを前記文書情報データベースに登録するデータベース登録手段とを備えたことを特徴とした文書管理システム。 In a document management system comprising a copying apparatus for copying information recorded on a paper medium, a document management server for managing the information, and a document information database for storing the information converted into electronic data,
The copying apparatus includes:
Image data acquisition means for acquiring the information as image data when performing the copying;
Image data transmitting means for transmitting the image data to the document management server,
The document management server
Data conversion means for extracting text from the image data received from the copying apparatus and converting the image data into text data;
Keyword extracting means for extracting a keyword from the text data;
A document management system comprising: database registration means for registering the text data and the keyword in the document information database.
前記利用者端末は、
前記文書情報データベースに登録された前記テキストデータを検索するための検索キーワードを前記文書管理サーバーに送信する検索キーワード送信手段を備え、
前記文書管理サーバーは、
前記利用者端末から受信した前記検索キーワードをキーとして前記文書情報データベースを検索し、前記検索キーワードと一致するキーワードを含む前記テキストデータを取得しこのテキストデータを前記利用者端末に送信するデータベース検索手段を備えたことを特徴とした請求項6に記載の文書管理システム。 A user terminal operated by a user who uses text data registered in the document information database;
The user terminal is
Search keyword transmitting means for transmitting a search keyword for searching the text data registered in the document information database to the document management server,
The document management server
Database search means for searching the document information database using the search keyword received from the user terminal as a key, obtaining the text data including a keyword that matches the search keyword, and transmitting the text data to the user terminal The document management system according to claim 6, further comprising:
前記検索キーワード送信手段は、前記検索キーワードを指定した前記利用者を特定する利用者IDを前記文書管理サーバーに送信し、
前記文書管理サーバーは、
前記複写者IDと前記利用者IDとが一致する前記テキストデータの前記キーワードから頻出キーワードを抽出し、この頻出キーワードに関連する語句を含み、かつ、前記複写者IDが前記利用者IDと異なるテキストデータを前記利用者端末に送信する頻出キーワード抽出手段を備えたことを特徴とした請求項7または請求項8に記載の文書管理システム。 The image data transmission means transmits a copy person ID for identifying the user who performed the copy to the document management server,
The search keyword transmitting means transmits a user ID for specifying the user who specified the search keyword to the document management server,
The document management server
A frequently extracted keyword is extracted from the keyword of the text data in which the copy ID and the user ID match, the text includes a phrase related to the frequent keyword, and the copy ID is different from the user ID. 9. The document management system according to claim 7, further comprising frequent keyword extraction means for transmitting data to the user terminal.
前記データベース検索手段は、前記外部テキストデータも検索対象に含め、前記タイトル一覧には、前記外部テキストデータのタイトルも含まれることを特徴とした請求項7ないし請求項9のいずれかひとつに記載の文書管理システム。 In the document information database, external text data provided by a person other than the business operator who uses the copying machine is also registered,
The said database search means also includes the said external text data in a search object, The title of the said external text data is also included in the said title list, The said any one of Claim 7 thru | or 9 characterized by the above-mentioned. Document management system.
前記紙媒体に記録された情報の複写を行った複写装置から前記情報を画像として電子データ化した画像データを受信し、前記画像データからテキストを抽出し前記画像データをテキストデータに変換するデータ変換工程と、
前記テキストデータからキーワードを抽出するキーワード抽出工程と、
前記テキストデータと前記キーワードを対応付けて文書情報データベースに登録するデータベース登録工程と、
前記情報を利用する利用者が操作する利用者端末から受信した検索キーワードをキーとして前記文書情報データベースを検索し、前記検索キーワードと一致するキーワードを含む前記テキストデータを取得しこのテキストデータを前記利用者端末に送信するデータベース検索工程とを備えたことを特徴とした文書管理方法。 In a method for managing information recorded on a paper medium,
Data conversion for receiving image data obtained by converting the information into electronic data from a copying apparatus that has copied information recorded on the paper medium, extracting text from the image data, and converting the image data into text data Process,
A keyword extraction step of extracting keywords from the text data;
A database registration step of registering the text data and the keyword in the document information database in association with each other;
The document information database is searched using a search keyword received from a user terminal operated by a user who uses the information as a key, and the text data including a keyword that matches the search keyword is obtained, and the text data is used. A document management method comprising: a database search step for transmitting to a user terminal.
コンピュータに、
前記紙媒体に記録された情報の複写を行った複写装置から前記情報を画像として電子データ化した画像データを受信し、前記画像データからテキストを抽出し前記画像データをテキストデータに変換するデータ変換機能と、
前記テキストデータからキーワードを抽出するキーワード抽出機能と、
前記テキストデータと前記キーワードを対応付けて文書情報データベースに登録するデータベース登録機能と、
前記情報を利用する利用者が操作する利用者端末から受信した検索キーワードをキーとして前記文書情報データベースを検索し、前記検索キーワードと一致するキーワードを含む前記テキストデータを取得しこのテキストデータを前記利用者端末に送信するデータベース検索機能とを実行させることを特徴とした文書管理プログラム。 In a program for managing information recorded on paper media,
On the computer,
Data conversion for receiving image data obtained by converting the information into electronic data from a copying apparatus that has copied information recorded on the paper medium, extracting text from the image data, and converting the image data into text data Function and
A keyword extraction function for extracting keywords from the text data;
A database registration function for registering the text data and the keyword in the document information database in association with each other;
The document information database is searched using a search keyword received from a user terminal operated by a user who uses the information as a key, and the text data including a keyword that matches the search keyword is obtained, and the text data is used. A document management program for executing a database search function transmitted to a user terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005321592A JP2007128370A (en) | 2005-11-04 | 2005-11-04 | Document management server, document management system, document management method, and document management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005321592A JP2007128370A (en) | 2005-11-04 | 2005-11-04 | Document management server, document management system, document management method, and document management program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007128370A true JP2007128370A (en) | 2007-05-24 |
Family
ID=38150964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005321592A Pending JP2007128370A (en) | 2005-11-04 | 2005-11-04 | Document management server, document management system, document management method, and document management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007128370A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011526397A (en) * | 2008-06-27 | 2011-10-06 | キイ・インコーポレイテッド | Social mobile search |
US8612889B2 (en) | 2010-11-11 | 2013-12-17 | Canon Kabushiki Kaisha | Information processing device, method for controlling screen display and storage medium |
US8711410B2 (en) | 2010-08-06 | 2014-04-29 | Canon Kabushiki Kaisha | Image forming apparatus, information processing method, and storage medium for generating screen information |
JP2016532190A (en) * | 2013-07-22 | 2016-10-13 | ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド | Document format conversion apparatus and method |
US9864480B2 (en) | 2011-09-01 | 2018-01-09 | Canon Kabushiki Kaisha | Image forming apparatus, control method therefor, and storage medium storing control program therefor |
-
2005
- 2005-11-04 JP JP2005321592A patent/JP2007128370A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011526397A (en) * | 2008-06-27 | 2011-10-06 | キイ・インコーポレイテッド | Social mobile search |
US9152711B2 (en) | 2008-06-27 | 2015-10-06 | Kii Corporation | Social mobile search |
US8711410B2 (en) | 2010-08-06 | 2014-04-29 | Canon Kabushiki Kaisha | Image forming apparatus, information processing method, and storage medium for generating screen information |
US8612889B2 (en) | 2010-11-11 | 2013-12-17 | Canon Kabushiki Kaisha | Information processing device, method for controlling screen display and storage medium |
US9864480B2 (en) | 2011-09-01 | 2018-01-09 | Canon Kabushiki Kaisha | Image forming apparatus, control method therefor, and storage medium storing control program therefor |
JP2016532190A (en) * | 2013-07-22 | 2016-10-13 | ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド | Document format conversion apparatus and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3571515B2 (en) | Computer-readable storage medium storing a knowledge collection / storage / retrieval program | |
US6883001B2 (en) | Document information search apparatus and method and recording medium storing document information search program therein | |
US8370373B2 (en) | Document processing system and control method thereof, program, and storage medium | |
JP5129640B2 (en) | Output device and control method thereof | |
US20100079781A1 (en) | Document processing system and control method thereof, program, and storage medium | |
CN100545846C (en) | Document searching equipment and method | |
US20070133064A1 (en) | Scanned image management device | |
JP5278921B2 (en) | Scan management system, scan management apparatus, control method thereof, and program | |
JP5167662B2 (en) | Workflow management system | |
US8078584B2 (en) | Document retrieving system, document retrieving apparatus, method, program and storage medium therefor | |
US20070206215A1 (en) | Print Control System, Print Attribute Information Management Server, Print Controller, Print Control Method, Recording Medium, And Data Signal | |
CN101931729A (en) | Information processor and control method thereof | |
US8032524B2 (en) | Content management system and content management method | |
JP5127272B2 (en) | Workflow management system | |
JP5592747B2 (en) | File search device and file search program | |
US20090100061A1 (en) | Information processing apparatus and information processing method | |
JP2007128370A (en) | Document management server, document management system, document management method, and document management program | |
JP2008070777A (en) | Image forming apparatus and image forming system | |
JP2019023793A (en) | Journalizing information processing apparatus, journalizing information processing method, and program | |
JP2011138340A (en) | Server device, method for inspecting log of the same, and program | |
JP4979786B2 (en) | Search-linked stamp service providing device | |
WO2013146910A1 (en) | Data search system and data search method | |
JP7418238B2 (en) | Information processing device, information processing method, and program | |
JP2011159170A (en) | Collection device, management device, collection method, management method, programs therefor, and collection system | |
JP4591888B2 (en) | Print log collection device, print log management system, print log collection device processing method, print log management system processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100223 |