[go: up one dir, main page]

JP2023096460A - Text information extracting system, text information extracting method, and program - Google Patents

Text information extracting system, text information extracting method, and program Download PDF

Info

Publication number
JP2023096460A
JP2023096460A JP2021212252A JP2021212252A JP2023096460A JP 2023096460 A JP2023096460 A JP 2023096460A JP 2021212252 A JP2021212252 A JP 2021212252A JP 2021212252 A JP2021212252 A JP 2021212252A JP 2023096460 A JP2023096460 A JP 2023096460A
Authority
JP
Japan
Prior art keywords
information
extraction
text
data
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021212252A
Other languages
Japanese (ja)
Inventor
圭 堀口
Kei Horiguchi
豪 宮坂
Takeshi Miyasaka
大智 鈴木
Daichi Suzuki
拓也 塚本
Takuya Tsukamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraim Inc
Original Assignee
Fraim Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraim Inc filed Critical Fraim Inc
Priority to JP2021212252A priority Critical patent/JP2023096460A/en
Publication of JP2023096460A publication Critical patent/JP2023096460A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To provide a text information extracting system, a text information extracting method, and a program capable of improving workability by extracting information.SOLUTION: A server 1 executes the processing to extract item information meeting items from text data of a text file. The server executes the processing to create data after extraction of the contents including the item information after the item information is extracted. Afterward, the server executes the processing to transmit the data after extraction to a terminal 3. The terminal 3 receives the data after extraction transmitted from the server 1 and then creates display information to cause a display unit 36 to display the same, and afterward, executes the processing to cause the display unit 36 to display the created display information. A document in which an extraction position can be recognized is displayed in a display area DA2, and an automatic extraction result is displayed in a display area DA3.SELECTED DRAWING: Figure 1

Description

本発明は、テキスト情報抽出システム、テキスト情報抽出方法、及びプログラムに関する。 The present invention relates to a text information extraction system, a text information extraction method, and a program.

下記特許文献1には、企業同士や個人同士等で交わした契約書を、委託した管理会社の倉庫に保管する旨が記載されている。管理会社では、管理台帳を作成して、契約書に記載された、例えば、有効期限等の日付の管理や、金額等の管理が行われる。 Patent Literature 1 below describes that contracts signed between companies or between individuals are stored in a warehouse of a management company to which they are entrusted. The management company creates a management ledger, and manages dates such as the expiration date and the amount of money described in the contract, for example.

特開2021-71860号公報Japanese Unexamined Patent Application Publication No. 2021-71860

上述の管理会社では、契約書に記載された日付や金額等の様々な項目を管理台帳に入力する作業が必要になるが、この作業は、多大な労力がいることになる。 In the management company described above, it is necessary to input various items such as the date and amount described in the contract into the management ledger, and this work requires a great deal of labor.

本発明は、このような状況に鑑みてなされたものであり、情報抽出により作業性の向上を図ることが可能な、テキスト情報抽出システム、テキスト情報抽出方法、及びプログラムを提供することを目的とする。 SUMMARY OF THE INVENTION The present invention has been made in view of such circumstances, and an object of the present invention is to provide a text information extraction system, a text information extraction method, and a program capable of improving workability by extracting information. do.

上述の目的を達成するため、本発明の一態様のテキスト情報抽出システムは、
テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムであって、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信手段と、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断手段と、
前記テキストファイル判断手段により前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化手段と、
前記テキストファイル判断手段により判断された、又は、前記テキストファイル化手段により前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出手段と、
前記項目情報抽出手段により前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成手段と、
前記抽出後データ生成手段により生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信手段と、を備える。
To achieve the above object, a text information extraction system according to one aspect of the present invention comprises:
A text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes file receiving means for receiving a transmission file transmitted from the terminal;
Text file determination means for determining whether the transmission file is a text file;
a text file converting means for converting the transmission file into a text file when the text file determining means determines that the transmission file is negative;
An item for extracting item information that matches at least one item from the text data of the text file determined by the text file determination means or converted into the text file by the text file conversion means. information extraction means;
post-extraction data generation means for generating post-extraction data including the item information extracted by the item information extraction means;
post-extraction data transmission means for transmitting the post-extraction data generated by the post-extraction data generation means to the terminal that transmitted the transmission file.

本発明の一態様のテキスト情報抽出方法は、上述の本発明の一態様のテキスト情報抽出システムに対応する方法である。 A text information extraction method of one aspect of the present invention is a method corresponding to the text information extraction system of one aspect of the present invention described above.

また、本発明の一態様のプログラムは、上述の本発明の一態様のテキスト情報抽出システムに対応するプログラムである。 A program of one aspect of the present invention is a program corresponding to the text information extraction system of one aspect of the present invention described above.

本発明によれば、情報抽出により作業性の向上を図ることができる。即ち、本発明は、テキストデータから情報抽出が可能な情報処理装置と、一又は複数の端末とを備えるシステムであることから、情報処理装置や、情報処理装置と端末との協働により、情報抽出をすることができ、以て作業性の向上を図ることができる。 According to the present invention, workability can be improved by extracting information. That is, the present invention is a system comprising an information processing device capable of extracting information from text data and one or more terminals. Extraction can be performed, and thus workability can be improved.

本発明の一実施形態に係るテキスト情報抽出システムにより提供される本サービスの概要の一例を示す図である。It is a figure showing an example of an outline of this service provided by a text information extraction system concerning one embodiment of the present invention. テキスト情報抽出システムに関するシステム構成の一例を示すブロック図である。It is a block diagram which shows an example of the system configuration|structure regarding a text information extraction system. 図2のテキスト情報抽出システムのうち、サーバ及び端末のハードウェア構成の一例を示すブロック図である。3 is a block diagram showing an example of the hardware configuration of a server and a terminal in the text information extraction system of FIG. 2; FIG. 図2のテキスト情報抽出システムのうち、サーバの機能的構成の一例を示す機能ブロック図である。3 is a functional block diagram showing an example of a functional configuration of a server in the text information extraction system of FIG. 2; FIG. 図2のテキスト情報抽出システムのうち、端末の機能的構成の一例を示す機能ブロック図である。3 is a functional block diagram showing an example of a functional configuration of a terminal in the text information extraction system of FIG. 2; FIG. 図2のテキスト情報抽出システムのうち、サーバの処理動作の一例を示すフローチャートである。3 is a flow chart showing an example of a processing operation of a server in the text information extraction system of FIG. 2; 図2のテキスト情報抽出システムのうち、端末の処理動作の一例を示すフローチャートである。3 is a flowchart showing an example of processing operations of a terminal in the text information extraction system of FIG. 2; テキストデータの一例を示す図である。It is a figure which shows an example of text data. 項目情報の1つ目の例を示す図である。It is a figure which shows the 1st example of item information. 項目情報の2つ目の例を示す図である。It is a figure which shows the 2nd example of item information. 項目情報の3つ目の例を示す図である。It is a figure which shows the 3rd example of item information. 項目情報の4つ目の例を示す図である。It is a figure which shows the 4th example of item information. ファイルインポート部の一例を示す図である。It is a figure which shows an example of a file import part. インポートに成功したドキュメントを表示部に表示させた一例を示す図である。FIG. 10 is a diagram showing an example of displaying a successfully imported document on the display unit; 抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント先頭部分、抽出結果も先頭部分)を示す図である。FIG. 10 is a diagram showing an example of displaying display information based on post-extraction data on the display unit (the head portion of the document and the head portion of the extraction result as well). 抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント後尾部分、抽出結果は先頭部分)を示す図である。FIG. 10 is a diagram showing an example of display information based on post-extraction data displayed on the display unit (the tail part of the document, the extraction result is the head part); 抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント後尾部分、抽出結果は中間部分)を示す図である。FIG. 10 is a diagram showing an example of displaying display information based on post-extraction data on the display unit (the tail part of the document, the extraction result is the middle part); 抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント後尾部分、抽出結果も先頭部分)を示す図である。FIG. 10 is a diagram showing an example of display information based on post-extraction data displayed on the display unit (document trailing portion, extraction result also leading portion).

<本サービスの概要について>
図1は、本発明の一実施形態に係るテキスト情報抽出システムにより提供される本サービスの概要を示す図である。
<Overview of this service>
FIG. 1 is a diagram showing an overview of this service provided by a text information extraction system according to one embodiment of the present invention.

図1において、本サービスは、サービス提供者(図示省略)が管理するサーバ1(情報処理装置)により提供される。本一実施形態では、例えば、企業がサーバ1を管理する。サーバ1は、インターネット等の所定のネットワークN(図2参照)に接続される。このネットワークNには、ユーザー2が操作する端末3も接続される。
なお、端末3は、図示のような1つに限らず、複数あってもよいものとする。ユーザー2は、個人や企業の従業員等の何れであってもよいものとする。或いは、ユーザー2は、サーバ1を管理する企業の従業員等であってもよいものとする。
In FIG. 1, this service is provided by a server 1 (information processing device) managed by a service provider (not shown). In this embodiment, for example, a company manages the server 1 . The server 1 is connected to a predetermined network N (see FIG. 2) such as the Internet. A terminal 3 operated by a user 2 is also connected to this network N. FIG.
Note that the number of terminals 3 is not limited to one as shown in the drawing, and a plurality of terminals may be provided. The user 2 may be an individual, an employee of a company, or the like. Alternatively, the user 2 may be an employee of a company that manages the server 1, or the like.

本サービスでは、図1の左上側にある表示部36の表示エリアDA1に表示されるようなドキュメント(符号省略)をサーバ1へ送信し、そして、サーバ1で所定の処理を実行させ、その処理結果を端末3が受信すると、図1の左下側に示すとおり、表示部36の表示エリアDA3に自動抽出結果(符号省略)を表示させることができる。また、表示エリアDA2には、自動抽出結果を反映させたドキュメント(符号省略)も表示させることができる。 In this service, a document (reference numerals omitted) displayed in the display area DA1 of the display unit 36 on the upper left side of FIG. When the terminal 3 receives the results, the automatic extraction results (reference numerals omitted) can be displayed in the display area DA3 of the display unit 36 as shown in the lower left side of FIG. Documents (reference numerals omitted) on which automatic extraction results are reflected can also be displayed in the display area DA2.

本サービスでは、表示エリアDA2のドキュメント(自動抽出結果を反映させたドキュメント)と、表示エリアDA3の自動抽出結果とを、左右に並んで表示させることができる。本サービスでは、ドキュメントと自動抽出結果とをユーザー2が確認し易くなるように表示することができる。 In this service, the document in the display area DA2 (the document reflecting the result of automatic extraction) and the result of automatic extraction in the display area DA3 can be displayed side by side. In this service, the document and the automatic extraction result can be displayed so that the user 2 can easily check them.

本サービスにより、ユーザー2が、例えば、図1の左上側のようなドキュメントから、一々手作業で様々な項目の情報抽出をする必要性をなくすことができる。従って、本サービスにより、作業性を従来と比べて格段に向上させることができる。 This service eliminates the need for the user 2 to manually extract information on various items one by one from the document shown in the upper left of FIG. 1, for example. Therefore, this service can significantly improve the workability compared to the conventional one.

以下、表示エリアDA1のドキュメント(符号省略)から、表示エリアDA2のドキュメント及び表示エリアDA3の自動抽出結果が得られるまでの流れを概略説明する。 The flow from the document (reference numerals omitted) in the display area DA1 to the document in the display area DA2 and the automatic extraction result in the display area DA3 will be briefly described below.

ユーザー2が操作する端末3の表示部36の表示エリアDA1には、例えば、ドキュメントの一部が表示される(画面をスクロールすればドキュメント全体を見ることができる)。ドキュメントは、ここでは契約書に関する文章であるものとする。なお、契約書は一例であるものとし、他の例については後述するものとする。 A part of the document, for example, is displayed in the display area DA1 of the display unit 36 of the terminal 3 operated by the user 2 (the entire document can be viewed by scrolling the screen). A document is here assumed to be a text relating to a contract. Note that the contract is only an example, and other examples will be described later.

表示エリアDA1に表示された部分のドキュメントに関し、ブロック分けをして、ブロックBL1~ブロックBL3で説明すると、ブロックBL1の範囲(位置)には、「研究開発委託契約書」の内容の表示がある。また、ブロックBL2の範囲には、「株式会社YYYY(以下「甲」という。)は、ZZZZ株式会社(以下「乙」という。)とは、以下のとおり、研究開発委託契約(以下「本契約」という。)を締結する。」の内容の表示がある。また、ブロックBL3の範囲には、「(目的) 第1条 甲は、乙に対し、・・・」の内容の表示がある。 If the document displayed in the display area DA1 is divided into blocks and explained in terms of blocks BL1 to BL3, the range (position) of block BL1 shows the contents of the "research and development consignment agreement". . In addition, within the scope of block BL2, "YYYY Co., Ltd. (hereinafter referred to as "Party A") and ZZZZ Co., Ltd. ”). ” is displayed. In addition, in the range of block BL3, there is a display of the content of "(Purpose) Article 1 Party A to Party B...".

端末3では、上述のような内容のドキュメントに基づき、サーバ1へ送信するためのファイル(送信ファイル)を生成する処理を実行する。そして、端末3は、生成した送信ファイルをサーバ1に送信する処理を実行する。 The terminal 3 executes a process of generating a file (transmission file) to be transmitted to the server 1 based on the document having the contents as described above. Then, the terminal 3 executes processing for transmitting the generated transmission file to the server 1 .

サーバ1では、端末3からの送信ファイルがあると、これを受信する処理を実行する。なお、受信したファイル(送信ファイル)は、ここではテキストファイルであるものとする(テキストファイルでない場合は、サーバ1がテキストファイル化の処理を実行する)。サーバ1は、受信したファイルであるテキストファイルのテキストデータから、予め記憶部に記憶させておいた項目に合う項目情報を抽出する処理を実行する。項目情報が抽出されると、この項目情報を含んだ内容の抽出後データを生成する処理をサーバ1は実行する。その後、サーバ1は、抽出後データを端末3へ送信する処理を実行する。
上述の抽出後データは、「データ」に限らず「ファイル」形式等、様々あり得るものとする。例えば、「ファイル」形式で生成する場合には、「抽出後データ」を「抽出後ファイル」と読み替えてもよいものとする。
When there is a transmission file from the terminal 3, the server 1 executes processing for receiving it. It is assumed here that the received file (transmission file) is a text file (if it is not a text file, the server 1 executes processing to convert it into a text file). The server 1 executes a process of extracting item information that matches the items stored in advance in the storage unit from the text data of the text file that is the received file. After the item information is extracted, the server 1 executes processing for generating post-extraction data containing the item information. After that, the server 1 executes a process of transmitting the post-extraction data to the terminal 3 .
The post-extraction data described above is not limited to "data" but may be in various formats such as "file". For example, when generating in the "file" format, "post-extraction data" may be read as "post-extraction file".

端末3では、サーバ1からの抽出後データの送信があると、これを受信する処理を実行する。抽出後データを受信した後は、表示部36に表示させる表示情報を生成する処理を端末3は実行する。その後、端末3は、表示情報を表示部36に表示させる処理を実行する。 When the server 1 transmits the post-extraction data, the terminal 3 executes a process of receiving the data. After receiving the post-extraction data, the terminal 3 executes processing for generating display information to be displayed on the display unit 36 . After that, the terminal 3 executes processing for displaying the display information on the display unit 36 .

端末3は、表示情報を表示部36に表示させると、表示エリアDA2には、図1の左下側に示すようなドキュメントが表示される。また、表示エリアDA3には、自動抽出結果が表示される。 When the terminal 3 causes the display unit 36 to display the display information, a document as shown in the lower left side of FIG. 1 is displayed in the display area DA2. Further, the automatic extraction result is displayed in the display area DA3.

表示エリアDA2に表示された部分のドキュメントに関し、上述のようにブロックBL1~ブロックBL3で説明すると、ブロックBL1の範囲(位置)には、「研究開発委託契約書」の内容の表示がある。この「研究開発委託契約書」は、ここでは四角の枠囲みで示される。なお、四角の枠囲みは、ハイライトHL1であることを示す。ハイライトHL1で表示された「研究開発委託契約書」は、自動抽出がなされた箇所に該当する。ハイライトHL1は一例であるものとし、他の方法で抽出箇所を分らせるようにしてもよいものとする。ハイライトHL1は、少なくとも、上述の抽出後データに含まれた抽出位置に関する情報と、抽出位置からの文字長さに関する情報とによりライン状に引いて表示される。 As for the portion of the document displayed in the display area DA2, if block BL1 to block BL3 are explained as described above, the range (position) of block BL1 shows the content of the "research and development consignment agreement". This "research and development consignment agreement" is indicated here by a square frame. It should be noted that a square frame encloses the highlight HL1. The "research and development consignment agreement" displayed with the highlight HL1 corresponds to the part automatically extracted. The highlight HL1 is only an example, and another method may be used to identify the extraction point. The highlight HL1 is displayed by drawing a line based on at least the information on the extraction position contained in the post-extraction data and the information on the character length from the extraction position.

表示エリアDA2におけるブロックBL2の範囲には、「株式会社YYYY(以下「甲」という。)は、ZZZZ株式会社(以下「乙」という。)とは、以下のとおり、研究開発委託契約(以下「本契約」という。)を締結する。」の内容の表示がある。また、同じくブロックBL3の範囲には、「(目的) 第1条 甲は、乙に対し、・・・」の内容の表示がある。これら表示のうち、前者の「株式会社YYYY」と「ZZZZ株式会社」は、ハイライトHL2、ハイライトHL3で表示される。ハイライトHL2、ハイライトHL3は、上述のハイライトHL1と同じに四角の枠囲みで示され、自動抽出がなされた箇所に該当する。 In the range of block BL2 in display area DA2, "YYYY Co., Ltd. (hereinafter referred to as "Party A") and ZZZZ Co., Ltd. (hereinafter referred to as "Party B") enter into a research and development contract (hereinafter referred to as (hereinafter referred to as “this Agreement”). ” is displayed. Similarly, in the range of block BL3, there is a display of the contents of "(Purpose) Article 1. Party A is to Party B....". Among these displays, the former "YYYY Co., Ltd." and "ZZZZ Co., Ltd." are displayed with a highlight HL2 and a highlight HL3. Highlights HL2 and HL3 are indicated by square frames like the above-described highlight HL1, and correspond to portions automatically extracted.

なお、ハイライトHL1~ハイライトHL3に関しては、次のような例を採用してもよいものとする。即ち、後述する「項目」に関する表示情報や「項目情報」に関する表示情報を、例えば、マウスでクリックすると、その際にハイライトHL1~ハイライトHL3が出現するようにしてもよいものとする。 Note that the following example may be adopted for the highlights HL1 to HL3. That is, when display information related to "item" or display information related to "item information", which will be described later, is clicked with a mouse, for example, highlights HL1 to HL3 may appear.

自動抽出結果として、表示エリアDA3には、「・契約書タイトル」、「研究開発委託契約書」、「・契約元会社名」、「株式会社YYYY」、「・契約先会社名」、「ZZZZ株式会社」の文字で表示される。これらのうち、「・契約書タイトル」、「・契約元会社名」、「・契約先会社名」の文字は、「項目」に関する表示情報である。また、「研究開発委託契約書」、「株式会社YYYY」、「ZZZZ株式会社」の文字は、「項目情報」に関する表示情報である。
「研究開発委託契約書」、「株式会社YYYY」、「ZZZZ株式会社」の文字は、サーバ1により、上述のテキストデータから自動で情報抽出された項目情報の結果である。この項目情報の結果が表示情報として表示エリアDA3に表示される。
As a result of the automatic extraction, in the display area DA3, "・contract title", "research and development consignment contract", "・contractor company name", "YYYY Co., Ltd.", "・contractor company name", "ZZZZ Ltd.” is displayed. Among these, the characters ".contract title", "contractor company name", and "contractor company name" are display information related to "items". In addition, the characters “R&D consignment agreement”, “YYYY Co., Ltd.”, and “ZZZZ Co., Ltd.” are display information related to “item information”.
The characters “R&D consignment agreement”, “YYYY Co., Ltd.”, and “ZZZZ Co., Ltd.” are results of item information automatically extracted from the text data described above by the server 1 . The result of this item information is displayed in the display area DA3 as display information.

なお、特に図示しないが、サーバ1の記憶部に予め記憶させておいた「項目」としては、例えば、「契約日」があり、また、上述のテキストデータにも「契約日」の文字があるとすれば、表示エリアDA3には、「項目」に関する表示情報として「契約日」の文字が表示される。また、表示エリアDA3には、「項目情報」に関する表示情報として、「項目」に合うように抽出した「契約日」の文字も表示される。 It should be noted that, although not shown, the "item" pre-stored in the storage unit of the server 1 includes, for example, "contract date", and the above-mentioned text data also includes characters of "contract date". Then, in the display area DA3, characters of "contract date" are displayed as display information related to "item". Further, in the display area DA3, characters of "contract date" extracted to match the "item" are also displayed as display information related to the "item information".

上述の「契約日」に関し、本サービスの一例としては、「契約日」の文字だけでなく、日付となる数字が表示される例を挙げることができる。日付となる数字は、テキストデータの中に含まれていれば抽出することが可能になる。
なお、テキストデータの中に契約日の有効期間として、例えば、「1年間」の文字が含まれていれば、上述の日付となる数字から、有効期間の最終日を求め、そして、これを項目情報にすることもできる(テキストデータの中に契約日の有効期間がなくても、「1年間」から求めて、ユーザー2に提供することができる)。
As for the above-mentioned "contract date", as an example of this service, not only the characters of "contract date" but also numbers representing the date can be displayed. Numerical dates can be extracted if they are included in text data.
If the text data contains, for example, "one year" as the effective period of the contract date, the last date of the effective period is obtained from the above-mentioned date numbers, and this is added to the item It can also be information (even if the text data does not have a valid period of the contract date, it can be obtained from "one year" and provided to the user 2).

以上、図1を参照しながら本サービスの概要について説明してきたように、本サービスの提供を受けることにより、図1の例では、契約書に合う内容の項目で情報抽出を自動で行うことができる。本サービスによれば、様々な項目の情報抽出をユーザー2が一々手作業でする必要性がなくなることから、従来と比べて作業性の向上を図ることができる。 As described above with reference to Figure 1, by receiving the provision of this service, it is possible to automatically extract information from items that match the content of the contract in the example of Figure 1. can. According to this service, the user 2 does not have to manually extract information on various items one by one.

なお、図1では、ドキュメントの種類(データ種類)として契約書の例を挙げたが、これに限らないものとする。即ち、契約書の他、約款や規定、規則等を挙げることができる。また、マニュアルや技術文書、注文書、請求書、領収書等も挙げることができる。後述する「項目」に合う情報を抽出することができれば、ドキュメントの種類(データ種類)等は、特に限定されないものとする。例えば、動画の音声を文字起こししたり、例えば、ICレコーダーに録音された音声を文字起こししたりすれば、動画や音声からでも情報抽出を行うことができる。 In FIG. 1, an example of a contract is given as the type of document (data type), but it is not limited to this. In other words, in addition to the contract, it can include terms and conditions, regulations, rules, and the like. Also included are manuals, technical documents, purchase orders, invoices, receipts, and the like. The type of document (data type) is not particularly limited as long as information matching the "item" described later can be extracted. For example, it is possible to extract information from moving images and sounds by transcribing the sound of moving images or, for example, transcribing the sounds recorded in an IC recorder.

<テキスト情報抽出システム100のシステム構成について>
図2は、テキスト情報抽出システム100に関するシステム構成の一例を示すブロック図である。
<System Configuration of Text Information Extraction System 100>
FIG. 2 is a block diagram showing an example of a system configuration regarding the text information extraction system 100. As shown in FIG.

テキスト情報抽出システム100は、サーバ1(情報処理装置)と、このサーバ1が接続されるネットワークNと、ネットワークNを介してサーバ1に接続される複数の端末3とを備えて構成される。
サーバ1は、端末3の動作と協働して各種処理を実行する装置である。複数の端末3は、ユーザー2により操作される装置である。複数の端末3は、端末3-1から端末3-nまで複数備えられる(nは1以上の整数であるものとする)。
The text information extraction system 100 includes a server 1 (information processing device), a network N to which the server 1 is connected, and a plurality of terminals 3 connected to the server 1 via the network N. FIG.
The server 1 is a device that cooperates with the operation of the terminal 3 to execute various processes. A plurality of terminals 3 are devices operated by the user 2 . A plurality of terminals 3 are provided from terminal 3-1 to terminal 3-n (n is an integer equal to or greater than 1).

<サーバ1のハードウェア構成について>
図3は、図2のテキスト情報抽出システム100のうち、サーバ1及び端末3のハードウェア構成を示すブロック図である。
<Hardware Configuration of Server 1>
FIG. 3 is a block diagram showing the hardware configuration of the server 1 and terminal 3 in the text information extraction system 100 of FIG.

サーバ1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、表示部16(出力部)と、入力部17と、記憶部18と、通信部19と、ドライブ20とを備えて構成される。 The server 1 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, a bus 14, an input/output interface 15, a display section 16 (output section), It comprises an input unit 17 , a storage unit 18 , a communication unit 19 and a drive 20 .

CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
The CPU 11 executes various processes according to programs recorded in the ROM 12 or programs loaded from the storage unit 18 to the RAM 13 .
The RAM 13 also stores data necessary for the CPU 11 to execute various processes.

CPU11、ROM12及びRAM13は、バス14を介して相互に接続される。このバス14には、入出力インターフェース15が接続される。
入出力インターフェース15には、表示部16(出力部)、入力部17、記憶部18、通信部19及びドライブ20が接続される。
The CPU 11 , ROM 12 and RAM 13 are interconnected via a bus 14 . An input/output interface 15 is connected to the bus 14 .
A display unit 16 (output unit), an input unit 17 , a storage unit 18 , a communication unit 19 and a drive 20 are connected to the input/output interface 15 .

表示部16(出力部)は、ディスプレイ(画面)により構成され、各種画像を表示する。入力部17は、各種ハードウェア等で構成され、各種情報を入力する。
記憶部18は、ハードディスクやDRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、所定のネットワークNを介して他の装置(図2の場合、端末3)との間で行う通信を制御する。
The display unit 16 (output unit) is configured by a display (screen) and displays various images. The input unit 17 is composed of various hardware and the like, and inputs various information.
The storage unit 18 is configured by a hard disk, a DRAM (Dynamic Random Access Memory), or the like, and stores various data.
The communication unit 19 controls communication with another device (the terminal 3 in the case of FIG. 2) via a predetermined network N. FIG.

ドライブ20は、必要に応じて設けられる。ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア21が適宜装着される。
ドライブ20によってリムーバブルメディア21から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア21は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
A drive 20 is provided as required. A removable medium 21 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is mounted in the drive 20 as appropriate.
A program read from the removable medium 21 by the drive 20 is installed in the storage section 18 as necessary. In addition, the removable medium 21 can also store various data stored in the storage section 18 in the same manner as the storage section 18 .

以上のようなサーバ1と端末3とに関し、これらの各種ハードウェアと各種ソフトウェアとの協働により、後述する各種処理が実現されるようになるものとする。 With respect to the server 1 and the terminal 3 as described above, it is assumed that various types of processing, which will be described later, are realized through the cooperation of these various types of hardware and various types of software.

<端末3について>
図3において、端末3は、ユーザー2が操作する情報処理端末である。端末3は、例えば、パーソナルコンピュータ(PC)や、例えばスマートフォン、タブレット等の携帯端末であるものとする。パーソナルコンピュータ(PC)の場合は、所謂デスクトップパソコンやノートパソコンの何れであってもよいものとする。
端末3のハードウェア構成は、上述のサーバ1のハードウェア構成と基本的に同様であるものとする。即ち、CPU31と、ROM32と、RAM33と、バス34と、入出力インターフェース35と、表示部36と、入力部37と、記憶部38と、通信部39と、ドライブ40と、リムーバブルメディア41を備えて構成される。
<About terminal 3>
In FIG. 3, terminal 3 is an information processing terminal operated by user 2 . The terminal 3 is assumed to be, for example, a personal computer (PC) or a mobile terminal such as a smart phone or a tablet. In the case of a personal computer (PC), it may be either a so-called desktop personal computer or a notebook personal computer.
The hardware configuration of the terminal 3 is basically the same as the hardware configuration of the server 1 described above. That is, it has a CPU 31, a ROM 32, a RAM 33, a bus 34, an input/output interface 35, a display section 36, an input section 37, a storage section 38, a communication section 39, a drive 40, and a removable medium 41. consists of

<サーバ1の機能的構成について>
図4は、図2のテキスト情報抽出システム100のうち、サーバ1の機能的構成の一例を示す機能ブロック図である。
<Functional Configuration of Server 1>
FIG. 4 is a functional block diagram showing an example of the functional configuration of the server 1 in the text information extraction system 100 of FIG. 2. As shown in FIG.

図4において、サーバ1は、図3を参照しながら上述したように、CPU11と、記憶部18と、通信部19と、その他機能(図4での図示は省略)とを備えて構成される。 4, the server 1 includes the CPU 11, the storage unit 18, the communication unit 19, and other functions (not shown in FIG. 4), as described above with reference to FIG. .

CPU11は、項目登録処理部111と、ファイル受信処理部112(ファイル受信手段)と、テキストファイル判断処理部113(テキストファイル判断手段)と、テキストファイル化処理部114(テキストファイル化手段)と、データ種類特定処理部115(データ種類特定手段)と、項目選択処理部116(項目選択手段)と、項目情報抽出処理部117(項目情報抽出手段)と、抽出後データ生成処理部118(抽出後データ生成手段)と、抽出後データ送信処理部119(抽出後データ送信手段)とを備えて構成される。 The CPU 11 includes an item registration processing unit 111, a file reception processing unit 112 (file reception means), a text file judgment processing unit 113 (text file judgment means), a text file conversion processing unit 114 (text file conversion means), Data type identification processing unit 115 (data type identification means), item selection processing unit 116 (item selection unit), item information extraction processing unit 117 (item information extraction unit), post-extraction data generation processing unit 118 (post-extraction data generation means) and a post-extraction data transmission processing unit 119 (post-extraction data transmission means).

別な言い方をすれば、サーバ1のCPU11においては、動作する際に、項目登録処理部111と、ファイル受信処理部112と、テキストファイル判断処理部113と、テキストファイル化処理部114と、データ種類特定処理部115と、項目選択処理部116と、項目情報抽出処理部117と、抽出後データ生成処理部118と、抽出後データ送信処理部119とが機能する。 In other words, when the CPU 11 of the server 1 operates, the item registration processing unit 111, the file reception processing unit 112, the text file determination processing unit 113, the text file conversion processing unit 114, and the data A type identification processing unit 115, an item selection processing unit 116, an item information extraction processing unit 117, a post-extraction data generation processing unit 118, and a post-extraction data transmission processing unit 119 function.

記憶部18は、項目記憶部181と、受信ファイル記憶部182と、テキストファイル記憶部183と、項目情報記憶部184と、位置・長さ情報記憶部185と、抽出後データ記憶部186とを有する。 The storage unit 18 includes an item storage unit 181, a received file storage unit 182, a text file storage unit 183, an item information storage unit 184, a position/length information storage unit 185, and an extracted data storage unit 186. have.

CPU11の項目登録処理部111は、情報抽出の際に抽出対象となる「項目」を予め記憶部18の項目記憶部181に記憶させる処理を実行する。 The item registration processing unit 111 of the CPU 11 executes processing for pre-storing “items” to be extracted when information is extracted in the item storage unit 181 of the storage unit 18 .

上述の「項目」は、端末3から送信されたファイル(送信ファイル)のデータ種類に対応するように集められる。また、ここでは全て例に挙げて説明しないが、端末3から送信され得るファイル(送信ファイル)のデータ種類に対応するように集められる。
具体的には、送信ファイルのデータ種類が、例えば、契約書のデータである場合に、契約書に一般的に記載されるような項目が予め「項目」として集められ、そして、記憶される。
ここでは、契約書に記載されるような項目として、例えば、「タイトル」、「契約元会社」、「請負業者」、「契約日」、「自動更新」、「自動更新のお知らせ」等が該当するものとする。例えば、「契約日」を例に挙げれば、「契約の日」のような意味が同じでかつ文字は類似する場合、この「契約の日」も予め「項目」として記憶されるものとする。
The "items" described above are collected so as to correspond to the data type of the file transmitted from the terminal 3 (transmission file). In addition, although not explained here with all examples, they are collected so as to correspond to the data types of files that can be transmitted from the terminal 3 (transmission files).
Specifically, when the data type of the transmission file is contract data, for example, items generally described in the contract are collected in advance as "items" and stored.
Here, for example, "title", "contracting company", "contractor", "contract date", "automatic renewal", "notice of automatic renewal" etc. It shall be. For example, taking "contract date" as an example, if the meaning of "contract date" is the same and the characters are similar, this "contract date" is also stored in advance as an "item".

なお、後述するが、「項目」に合う項目情報(後述する)を抽出するようにCPU11(項目情報抽出処理部117)は動作する。その際、例えば、「契約日」や「契約の日」に合う項目情報の抽出では、「契約日」や「契約の日」の文字だけでなく日付(例えば、「20××年××月××日」、「20XX/XX/XX」、「20XX.XX.XX」等)も抽出可能にするものとする。
日付等の表記に関し、例えば、日付であれば様々な表記方法があり得る。具体的には、和暦、西暦、XX年XX月末、等様々あり得る。ここでは、値を正規化することが可能であるものとする。例えば、日付は、「yyyy/mm/dd」に統一すること等が可能であるものとする。
As will be described later, the CPU 11 (item information extraction processing unit 117) operates so as to extract item information (described later) matching the "item". At that time, for example, when extracting item information that matches "contract date" or "contract date", not only the characters of "contract date" or "contract date" but also the date (for example, "20 XX year XX month XX day”, “20XX/XX/XX”, “20XX.XX.XX”, etc.) can also be extracted.
Regarding notation of dates, for example, there are various notation methods for dates. Specifically, there are various possibilities such as the Japanese calendar, the Western calendar, the end of XX in XX. Here, it is assumed that the values can be normalized. For example, it is assumed that the date can be standardized to "yyyy/mm/dd".

ファイル受信処理部112は、端末3から送信された送信ファイルを受信する処理を実行する。また、ファイル受信処理部112は、受信した送信ファイルを受信ファイル記憶部182に記憶させる処理も実行する。 The file reception processing unit 112 executes processing for receiving a transmission file transmitted from the terminal 3 . The file reception processing unit 112 also executes processing for storing the received transmission file in the reception file storage unit 182 .

テキストファイル判断処理部113は、ファイル受信処理部112により受信したファイル(送信ファイル)がテキストファイルであるか否かを判断する処理を実行する。テキストファイル判断処理部113での判断が、テキストファイルである場合は、これをテキストファイル記憶部183に記憶させる処理を実行する。一方、テキストファイルでない(否)と判断された場合には、テキストファイル化処理部114が動作する。 The text file determination processing unit 113 executes processing for determining whether or not the file (transmission file) received by the file reception processing unit 112 is a text file. If the text file determination processing unit 113 determines that the file is a text file, a process of storing this in the text file storage unit 183 is executed. On the other hand, when it is determined that the file is not a text file (no), the text file processing unit 114 operates.

テキストファイル化処理部114は、テキストファイル判断処理部113により否と判断(テキストファイルでないと判断)された場合に、受信したファイル(送信ファイル)をテキストファイルに変換(テキストファイル化)する処理を実行する。また、テキストファイル化処理部114は、テキストファイル化した後のファイル(テキストファイル)をテキストファイル記憶部183に記憶させる処理も実行する。 The text file conversion processing unit 114 converts the received file (transmission file) into a text file (text file conversion) when the text file determination processing unit 113 determines No (determines that the file is not a text file). Execute. The text file conversion processing unit 114 also executes processing for storing the file converted into a text file (text file) in the text file storage unit 183 .

データ種類特定処理部115は、テキストファイル記憶部183に記憶させたテキストファイルにおける、テキストデータの一部または全部の内容に基づき、テキストデータがどのデータ種類のものであるかを特定する処理を実行する。もう少し詳しく説明すると、テキストデータが、例えば、契約書のデータであるか、約款のデータであるか、規定のデータであるか、規則のデータであるか、マニュアルのデータであるか、技術文書のデータであるか、注文書のデータであるか、請求書のデータであるか、領収書のデータであるか、等をデータ種類特定処理部115は特定する処理を実行する。
テキストデータがどのデータ種類のものであるかを特定することにより、データ種類(ドキュメントの種類)で項目を自動的に切り替えることができる。
The data type identification processing unit 115 executes processing for identifying the data type of the text data based on the content of part or all of the text data in the text file stored in the text file storage unit 183. do. To explain in a little more detail, the text data is, for example, contract data, clause data, regulation data, regulation data, manual data, technical document data The data type identification processing unit 115 executes processing for identifying data, order form data, invoice data, receipt data, and the like.
By specifying which data type the text data belongs to, items can be automatically switched according to the data type (document type).

項目選択処理部116は、データ種類特定処理部115により特定されたデータ種類(例えば、契約書のデータ)に対応する「項目」を項目記憶部181に記憶させた中から選択する処理を実行する。「項目」は様々あることから、項目選択処理部116は、項目記憶部181の「項目群」の中から選択するように動作する。 The item selection processing unit 116 selects an “item” corresponding to the data type (for example, contract data) specified by the data type specifying processing unit 115 from among items stored in the item storage unit 181 . . Since there are various “items”, the item selection processing unit 116 operates to select from among the “item group” of the item storage unit 181 .

項目情報抽出処理部117は、テキストファイル記憶部183に記憶させたテキストファイルのテキストデータの中から、少なくとも1つの項目に合う項目情報を抽出する(情報抽出する)処理を実行する。もう少し詳しく説明すると、上述の契約書での例を挙げれば、契約書のテキストデータの中から、「タイトル」、「契約元会社」、「請負業者」、「契約日」、「自動更新」、「自動更新のお知らせ」等の「項目」に合う項目情報を抽出する処理を項目情報抽出処理部117は実行する。例えば、「タイトル」に合う情報抽出により、「研究開発委託契約」や「業務委託契約書」と言う内容の項目情報を抽出するように項目情報抽出処理部117は動作する。抽出に関しては、正規表現や、自然言語処理における固有表現抽出が採用される(特に限定するものではない)。
なお、「契約元会社」、「請負業者」の抽出方法については特に限定されないが、例えば、契約書のテキストデータの中から最初に抽出された会社(企業)を「契約元会社」、次に抽出された会社を「請負業者」とするとよい。
The item information extraction processing unit 117 extracts item information matching at least one item from the text data of the text file stored in the text file storage unit 183 (extracts information). To explain in a little more detail, taking the example of the above contract, from the text data of the contract, "title", "contracting company", "contractor", "contract date", "automatic renewal", The item information extraction processing unit 117 executes a process of extracting item information that matches the "item" such as "notice of automatic update". For example, by extracting information matching the "title", the item information extraction processing unit 117 operates so as to extract item information such as "research and development consignment contract" or "business consignment contract". For extraction, regular expressions and named entity extraction in natural language processing are employed (not particularly limited).
The method of extracting "contracting company" and "contractor" is not particularly limited, but for example, the company (company) first extracted from the text data of the contract is "contracting company", and then The extracted companies should be referred to as "contractors".

項目情報抽出処理部117は、抽出した項目情報を項目情報記憶部184に記憶させる処理も実行する。また、項目情報抽出処理部117は、抽出した項目情報の、テキストデータにおける抽出位置に関する情報と、この抽出位置からの文字長さに関する情報とを項目情報に紐付けた上で位置・長さ情報記憶部185に記憶させる処理も実行する。 The item information extraction processing unit 117 also executes processing for storing the extracted item information in the item information storage unit 184 . In addition, the item information extraction processing unit 117 associates the extracted item information with the information on the extraction position in the text data and the information on the character length from this extraction position with the item information, and then extracts the position/length information. A process of storing in the storage unit 185 is also executed.

上述のテキストデータにおける抽出位置は、例えば、テキストデータの先頭の文字を「0」として、この先頭の文字から何番目に項目情報が出現するかを求めることにより得られるものとする(一例であるものとする。例えば、テキストデータの何行目等の求め方であってもよいものとする)。また、抽出位置からの文字長さは、項目情報が、例えば、「業務委託契約書」であればこの文字数を求めることにより得られるものとする(一例であるものとする)。この場合、抽出位置からの文字長さは、「7」となる。 The extraction position in the text data described above can be obtained, for example, by setting the first character of the text data to "0" and finding the order in which the item information appears from this first character (an example is (For example, the number of lines in the text data may be determined.). In addition, the character length from the extraction position is obtained by obtaining the number of characters if the item information is, for example, "outsourcing agreement" (this is an example). In this case, the character length from the extraction position is "7".

抽出後データ生成処理部118は、項目情報抽出処理部117により抽出された(情報抽出された)上述の項目情報を含む抽出後データを生成する処理を実行する。また、抽出後データ生成処理部118は、生成した抽出後データを抽出後データ記憶部186に記憶させる処理も実行する。なお、抽出後データは、テキストファイルの形式やユーザー2の要求する形式で生成されるものとする(例えば、「ファイル」形式で生成されるのであれば、「抽出後データ」を「抽出ファイル」と読み替えてもよいものとする)。
抽出後データ生成処理部118は、ここでは項目情報抽出処理部117により抽出された(情報抽出された)項目情報が整合性の取れた情報であるか否かを判断すると共に、項目情報が整合性の取れていない情報(後述する)であると判断した場合に、端末3(送信ファイルを送信してきた端末3)において警告が出るよう抽出後データを生成する処理を実行する。
上述の整合性の取れていない情報に関しては、例えば、次の例が挙げられる。即ち、(1)「契約開始日」が「契約日」より前になっている場合であり、この時に警告を出す。(2)存在しない日付になっている(例えば、「2021年2月29日」)場合であり、この時に警告を出す。(3)同一の項目情報が複数箇所で取得され、その取得内容が異なっている場合であり、この時に警告を出す。(4)「契約元会社」が、例えば、冒頭部分と署名欄とで抽出できたケースにおいて、その会社名が異なっている場合であり、この時に警告を出す。
抽出後データ生成処理部118では、整合性が取れていない情報であれば、例えば、項目情報に対し所定の警告情報を紐付けるように処理を実行する。
The post-extraction data generation processing unit 118 executes processing for generating post-extraction data including the above-described item information extracted (information extracted) by the item information extraction processing unit 117 . The post-extraction data generation processing unit 118 also executes processing for storing the generated post-extraction data in the post-extraction data storage unit 186 . It should be noted that the post-extraction data is generated in a text file format or in a format requested by the user 2 (for example, if it is generated in a "file" format, "extraction data" is replaced with "extraction file"). may be read as ).
The post-extraction data generation processing unit 118 determines whether or not the item information extracted (information extracted) by the item information extraction processing unit 117 is consistent information, and determines whether the item information is consistent. When it is determined that the information (described later) is unqualified, a process of generating post-extraction data is executed so that a warning is issued at the terminal 3 (the terminal 3 that has transmitted the transmission file).
Examples of the inconsistent information mentioned above include the following. (1) When the "contract start date" is earlier than the "contract date", a warning is issued at this time. (2) When the date does not exist (for example, "February 29, 2021"), a warning is issued at this time. (3) When the same item information is acquired at a plurality of locations and the acquisition contents are different, a warning is issued at this time. (4) When the "contracting company" can be extracted from, for example, the opening part and the signature field, the company name is different, and a warning is issued at this time.
In the post-extraction data generation processing unit 118, if the information is inconsistent, for example, processing is executed so as to associate predetermined warning information with the item information.

抽出後データ送信処理部119は、抽出後データ生成処理部118により生成された抽出後データを、送信ファイルを送信してきた端末3に送信する処理を実行する。 The post-extraction data transmission processing unit 119 executes processing for transmitting the post-extraction data generated by the post-extraction data generation processing unit 118 to the terminal 3 that has transmitted the transmission file.

記憶部18の項目記憶部181は、情報抽出の際に抽出対象となる「項目」を予め記憶しておく記憶領域である。項目記憶部181には、様々な「項目」が記憶される。様々な「項目」は、例えば、上述のデータ種類に分かれて「項目群」となるように記憶される。 The item storage unit 181 of the storage unit 18 is a storage area for pre-storing “items” to be extracted when extracting information. The item storage unit 181 stores various “items”. Various "items" are, for example, divided into the above data types and stored as "item groups".

受信ファイル記憶部182は、端末3から送信されて受信したファイル(送信ファイル)を記憶しておく記憶領域である。 The received file storage unit 182 is a storage area for storing files transmitted and received from the terminal 3 (transmission files).

テキストファイル記憶部183は、上述の受信したファイル(送信ファイル)がテキストファイルであった場合や、上述のテキストファイル化した後のファイル(テキストファイル)を記憶しておく記憶領域である。 The text file storage unit 183 is a storage area for storing the above-described received file (transmission file) which is a text file, or for storing the above-described text file (text file).

項目情報記憶部184は、項目情報抽出処理部117にて抽出した項目情報を記憶しておく記憶領域である。項目情報記憶部184には、例えば、「タイトル」という「項目」に合う情報抽出であれば、「研究開発委託契約」や「業務委託契約書」が項目情報として記憶される。なお、項目情報の例に関しては、図9乃至図12を参照しながら後述する。 The item information storage unit 184 is a storage area for storing item information extracted by the item information extraction processing unit 117 . The item information storage unit 184 stores, for example, "research and development consignment contract" and "business consignment contract" as item information in the case of information extraction matching the "item" of "title". Examples of item information will be described later with reference to FIGS. 9 to 12. FIG.

位置・長さ情報記憶部185は、抽出した項目情報の、テキストデータにおける抽出位置に関する情報と、この抽出位置からの文字長さに関する情報とを項目情報に紐付けた上で記憶しておく記憶領域である。 The position/length information storage unit 185 stores, in the extracted item information, information relating to the extraction position in the text data and information relating to the character length from this extraction position in association with the item information. area.

抽出後データ記憶部186は、抽出後データ生成処理部118にて生成された抽出後データを記憶しておく記憶領域である。 The post-extraction data storage unit 186 is a storage area for storing post-extraction data generated by the post-extraction data generation processing unit 118 .

<端末3の機能的構成について>
図5は、図2のテキスト情報抽出システム100のうち、端末3の機能的構成の一例を示す機能ブロック図である。
<Functional Configuration of Terminal 3>
FIG. 5 is a functional block diagram showing an example of the functional configuration of the terminal 3 in the text information extraction system 100 of FIG.

図5において、端末3は、図3を参照しながら上述したように、CPU31と、表示部36と、記憶部38と、通信部39と、その他機能(図5での図示は省略)とを備えて構成される。 5, the terminal 3 includes a CPU 31, a display unit 36, a storage unit 38, a communication unit 39, and other functions (not shown in FIG. 5), as described above with reference to FIG. configured with.

CPU31は、送信ファイル生成処理部311と、ファイル送信処理部312と、抽出後データ受信処理部313(抽出後データ受信手段)と、表示情報生成処理部314(表示情報生成手段)と、情報表示処理部315(情報表示手段)とを備えて構成される。 The CPU 31 includes a transmission file generation processing unit 311, a file transmission processing unit 312, a post-extraction data reception processing unit 313 (post-extraction data reception means), a display information generation processing unit 314 (display information generation means), and an information display. and a processing unit 315 (information display means).

別な言い方をすれば、端末3のCPU31においては、動作する際に、送信ファイル生成処理部311と、ファイル送信処理部312と、抽出後データ受信処理部313と、表示情報生成処理部314と、情報表示処理部315とが機能する。 In other words, in the CPU 31 of the terminal 3, when operating, a transmission file generation processing unit 311, a file transmission processing unit 312, a post-extraction data reception processing unit 313, and a display information generation processing unit 314 , and the information display processing unit 315 function.

記憶部38は、送信ファイル記憶部381と、抽出後データ記憶部382と、表示情報記憶部383とを有する。 The storage unit 38 has a transmission file storage unit 381 , an extracted data storage unit 382 , and a display information storage unit 383 .

CPU31の送信ファイル生成処理部311は、サーバ1へ送信するための送信ファイルを生成する処理を実行する。また、送信ファイル生成処理部311は、生成した送信ファイルを送信ファイル記憶部381に記憶させる処理も実行する。 A transmission file generation processing unit 311 of the CPU 31 executes processing for generating a transmission file to be transmitted to the server 1 . The transmission file generation processing unit 311 also executes processing for storing the generated transmission file in the transmission file storage unit 381 .

ファイル送信処理部312は、送信ファイル生成処理部311にて生成した送信ファイルをサーバ1へ送信する処理を実行する。 The file transmission processing unit 312 executes processing for transmitting the transmission file generated by the transmission file generation processing unit 311 to the server 1 .

抽出後データ受信処理部313は、サーバ1から送信された抽出後データを受信する処理を実行する。また、抽出後データ受信処理部313は、受信した抽出後データを抽出後データ記憶部382に記憶させる処理も実行する。 The post-extraction data reception processing unit 313 executes processing for receiving the post-extraction data transmitted from the server 1 . The post-extraction data reception processing unit 313 also executes processing for storing the received post-extraction data in the post-extraction data storage unit 382 .

表示情報生成処理部314は、受信した抽出後データから端末3の表示部36に表示させる表示情報を生成する処理を実行する。また、表示情報生成処理部314は、生成した表示情報を表示情報記憶部383に記憶させる処理を実行する。 The display information generation processing unit 314 executes processing for generating display information to be displayed on the display unit 36 of the terminal 3 from the received post-extraction data. Further, the display information generation processing unit 314 executes processing for storing the generated display information in the display information storage unit 383 .

尚、ここでは、抽出後データに含まれた上述の抽出位置に関する情報及び文字長さに関する情報を利用した第1表示情報と、上述の項目情報を含む第2表示情報とを生成し、そして、これら第1表示情報と第2表示情報とを表示情報記憶部383に記憶させる処理を表示情報生成処理部314は実行するものとする。
また、ここでは、抽出後データにおける項目情報に対し警告情報が紐付いている場合に、所定の警告が出るような処理を表示情報生成処理部314は実行するものとする。
Here, the first display information using the information about the extraction position and the information about the character length contained in the post-extraction data and the second display information including the item information are generated, and It is assumed that the display information generation processing unit 314 executes processing for storing the first display information and the second display information in the display information storage unit 383 .
Here, it is assumed that the display information generation processing unit 314 executes a process of issuing a predetermined warning when warning information is associated with item information in the post-extraction data.

情報表示処理部315は、表示情報生成処理部314にて生成された表示情報を表示部36に表示させる処理を実行する。尚、ここでは、第1表示情報と第2表示情報とを表示部36の、例えば、左右に画面表示させる処理を情報表示処理部315が実行するものとする。 The information display processing unit 315 executes processing for displaying the display information generated by the display information generation processing unit 314 on the display unit 36 . Here, it is assumed that the information display processing unit 315 executes the process of displaying the first display information and the second display information on the left and right screens of the display unit 36, for example.

記憶部38の送信ファイル記憶部381は、サーバ1へ送信するための送信ファイルを記憶しておく記憶領域である。
抽出後データ記憶部382は、サーバ1から送信された抽出後データを記憶しておく記憶領域である。
表示情報記憶部383は、表示情報生成処理部314にて生成された表示情報(第1表示情報と第2表示情報)を記憶しておく記憶領域である。
A transmission file storage unit 381 of the storage unit 38 is a storage area for storing transmission files to be transmitted to the server 1 .
The post-extraction data storage unit 382 is a storage area for storing post-extraction data transmitted from the server 1 .
The display information storage unit 383 is a storage area for storing display information (first display information and second display information) generated by the display information generation processing unit 314 .

<サーバ1の処理動作の一例について>
次に、サーバ1の処理動作の一例を説明する。
図6は、図2のテキスト情報抽出システム100のうち、サーバ1の処理動作の一例を示すフローチャートである。
<Example of processing operation of server 1>
Next, an example of processing operation of the server 1 will be described.
FIG. 6 is a flow chart showing an example of the processing operation of the server 1 in the text information extraction system 100 of FIG.

サーバ1におけるCPU11の動作として、ステップS1では、端末3から送信された送信ファイルをファイル受信処理部112(ファイル受信手段)が受信する。送信ファイルの受信等が完了するとステップS2へ移行する。 As an operation of the CPU 11 in the server 1, the file reception processing section 112 (file reception means) receives the transmission file transmitted from the terminal 3 in step S1. When the transmission file reception and the like are completed, the process proceeds to step S2.

ステップS2では、受信したファイル(端末3からの送信ファイル)がテキストファイルなのか、それともテキストファイルでないのかをテキストファイル判断処理部113(テキストファイル判断手段)が判断する。テキストファイルでない(否)と判断(ステップS2でNo)した場合は、ステップS3へ移行する。一方、テキストファイルであると判断(ステップS2でYes)した場合は、ステップS4へ移行する。 In step S2, the text file determination processor 113 (text file determination means) determines whether the received file (the file transmitted from the terminal 3) is a text file or not. If it is determined that the file is not a text file (No in step S2), the process proceeds to step S3. On the other hand, if it is determined that the file is a text file (Yes in step S2), the process proceeds to step S4.

ステップS3では、受信したファイル(端末3からの送信ファイル)がステップS2でテキストファイルでない(否)と判断されたことから、テキストファイル化処理部114(テキストファイル化手段)がテキストファイルに変換(テキストファイル化)する。テキストファイルへの変換後は、ステップS4へ移行する。 In step S3, since the received file (transmission file from the terminal 3) was determined not to be a text file (no) in step S2, the text file conversion processing unit 114 (text file conversion means) converts it into a text file ( text file). After conversion into the text file, the process proceeds to step S4.

ステップS4では、テキストファイルのデータ種類をデータ種類特定処理部115(データ種類特定手段)が特定する。即ち、テキストファイルのテキストデータの一部又は全部を見て、例えば、これは契約書のデータである、と特定する。データ種類を特定したら、ステップS5へ移行する。 In step S4, the data type identification processor 115 (data type identification means) identifies the data type of the text file. That is, by looking at some or all of the text data in the text file, it is specified that this is contract data, for example. After specifying the data type, the process proceeds to step S5.

ステップS5では、特定されたデータ種類(例えば、契約書のデータ)に対応する「項目」がどれであるかを項目選択処理部116(項目選択手段)が項目記憶部181の「項目群」の中から選択する。「項目」の選択が完了した後は、ステップS6へ移行する。なお、「項目」は、情報抽出の際に抽出対象となる。 In step S5, the item selection processing section 116 (item selection means) selects which "item" corresponds to the specified data type (for example, contract data) in the "item group" of the item storage section 181. to choose from. After completing the selection of the "item", the process proceeds to step S6. It should be noted that the "item" is an extraction target when information is extracted.

ステップS6では、テキストファイルのテキストデータの中からステップS5で選択した項目に合う項目情報を項目情報抽出処理部117(項目情報抽出手段)が抽出する。もう少し詳しく説明すると、上述の契約書での例を挙げれば、契約書のテキストデータの中から、「タイトル」、「契約元会社」、「請負業者」、「契約日」、「自動更新」、「自動更新のお知らせ」等の「項目」に合う項目情報を項目情報抽出処理部117が抽出する。抽出した項目情報には、テキストデータにおける抽出位置に関する情報と、この抽出位置からの文字長さに関する情報とが紐付けられる。項目情報の抽出後は、ステップS7へ移行する。 In step S6, the item information extraction processing unit 117 (item information extraction means) extracts item information matching the item selected in step S5 from the text data of the text file. To explain in a little more detail, taking the example of the above contract, from the text data of the contract, "title", "contracting company", "contractor", "contract date", "automatic renewal", The item information extraction processing unit 117 extracts item information that matches the "item" such as "notification of automatic update". The extracted item information is associated with information about the extraction position in the text data and information about the character length from this extraction position. After the item information is extracted, the process proceeds to step S7.

ステップS7では、抽出した(情報抽出した)項目情報を含む抽出後データを抽出後データ生成処理部118(抽出後データ生成手段)が生成する。抽出後データの生成後は、ステップS8へ移行する。
ステップS7では、抽出した項目情報が、整合性の取れた情報であるか否かの判断を行い、不整合の場合には、項目情報に対し警告情報が紐付けられる。
In step S7, the post-extraction data generation processing unit 118 (post-extraction data generation means) generates post-extraction data including the extracted (extracted) item information. After generating the post-extraction data, the process proceeds to step S8.
In step S7, it is determined whether or not the extracted item information is consistent information, and in the case of inconsistency, warning information is associated with the item information.

ステップS8では、生成した抽出後データを抽出後データ送信処理部119(抽出後データ送信手段)が端末3へ送信する。なお、抽出後データが送信され、これを端末3が受診すると、端末3は以下で説明するように動作する。 In step S<b>8 , the post-extraction data transmission processing section 119 (post-extraction data transmission means) transmits the generated post-extraction data to the terminal 3 . When the extracted data is transmitted and received by the terminal 3, the terminal 3 operates as described below.

<端末3の処理動作の一例について>
次に、端末3の処理動作の一例を説明する。
図7は、図2のテキスト情報抽出システム100のうち、端末3の処理動作の一例を示すフローチャートである。
<Example of processing operation of terminal 3>
Next, an example of processing operation of the terminal 3 will be described.
FIG. 7 is a flow chart showing an example of the processing operation of the terminal 3 in the text information extraction system 100 of FIG.

端末3におけるCPU31の動作として、ステップS21では、サーバ1へ送信するためのファイル(送信ファイル)を送信ファイル生成処理部311が生成する。送信ファイルの生成後は、ステップS22へ移行する。 As an operation of the CPU 31 in the terminal 3, the transmission file generation processing unit 311 generates a file (transmission file) to be transmitted to the server 1 in step S21. After generating the transmission file, the process proceeds to step S22.

ステップS22では、生成した送信ファイをファイル送信処理部312がサーバ1へ送信する。送信ファイルの送信後は、ステップS23へ移行する。 In step S22, the file transmission processing unit 312 transmits the generated transmission file to the server 1. FIG. After transmitting the transmission file, the process moves to step S23.

ステップS23では、サーバ1から送信された抽出後データを受信したかどうかを抽出後データ受信処理部313(抽出後データ受信手段)が判断する。抽出後データがまだ受信されていないと判断(ステップS23でNo)した場合は、再びステップS23を繰り返す。一方、抽出後データが受信されたと判断(ステップS23でYes)した場合は、ステップS24へ移行する。 In step S23, the post-extraction data reception processing section 313 (post-extraction data receiving means) determines whether or not the post-extraction data transmitted from the server 1 has been received. If it is determined that the post-extraction data has not yet been received (No in step S23), step S23 is repeated again. On the other hand, if it is determined that the post-extraction data has been received (Yes in step S23), the process proceeds to step S24.

ステップS24では、受信した抽出後データから端末3の表示部36に表示させる表示情報(第1表示情報及び第2表示情報)を表示情報生成処理部314(表示情報生成手段)が生成する。表示情報の生成後は、ステップS25へ移行する。 In step S24, the display information generation processing unit 314 (display information generation means) generates display information (first display information and second display information) to be displayed on the display unit 36 of the terminal 3 from the received post-extraction data. After generating the display information, the process proceeds to step S25.

ステップS25では、生成した表示情報を情報表示処理部315(情報表示手段)が表示部36の、例えば、左右に画面表示させる。なお、画面表示に関しては、図15乃至図18を参照しながら後述する。 In step S25, the information display processing unit 315 (information display means) displays the generated display information on the screen of the display unit 36, for example, on the left and right. The screen display will be described later with reference to FIGS. 15 to 18. FIG.

<テキストデータTD、項目情報EX1~EX10の例について>
図8は、テキストデータTDの一例を示す図である。
図9は、項目情報の1つ目の例(項目情報EX1~EX3)を示す図である。また、図10は、項目情報の2つ目の例(項目情報EX4~EX5)を示す図である。また、図11は、項目情報の3つ目の例(項目情報EX6~EX8)を示す図である。また、図12は、項目情報の4つ目の例(項目情報EX8~EX10)を示す図である。
<Examples of text data TD and item information EX1 to EX10>
FIG. 8 is a diagram showing an example of text data TD.
FIG. 9 is a diagram showing a first example of item information (item information EX1 to EX3). FIG. 10 is a diagram showing a second example of item information (item information EX4 to EX5). FIG. 11 is a diagram showing a third example of item information (item information EX6 to EX8). FIG. 12 is a diagram showing a fourth example of item information (item information EX8 to EX10).

図8において、テキストデータTDは、サーバ1の表示部16に、例えば、次のように表示される(図は後尾部分が含まれるように示した例である)。即ち、「~事者は、法令、規則、裁判所の決定・命令、行政庁の命令・指導等に基づき裁判所又は行政庁から開示を要求された場合には、相手方の機密情報を当該裁判所又は行政庁に開示、提供できるものとする。ただし、これらの事由が生じた場合、各当事者は相手方に対してすみやかに通知するものとする。¥n5. 各当事者は、相手方から開示された機密情報を本件委託業務以外の目的で使用してはならないとともに、機密情報を本件委託業務以外の目的で複製又は変更してはならない。¥n6. 各当事者は、善良なる管理者の注意をもって機密情報を厳重に管理するものとする。¥n7. 各当事者は、機密情報の漏えい、紛失、盗難、盗用等の事態が発生し、又はそのおそれがあることを知った場合は、直ちにその旨を相手方に書面をもって通知するものとする。¥n8. 各当事者は、次の各号のいずれかに該当する事由が生じたときは、相手方から受領した機密情報を当該相手方に返還、消去又は廃棄を行う。¥n(1) 本契約が終了したとき¥n(2) 相手方が返還を求めたとき¥n¥n第12条 (個人情報の取扱い)¥n甲及び乙は、乙の個人情報を乙の個人情報保護規程に基づき取り扱うものとする。¥n¥n第13条(解除)¥n1. 甲又は乙は、相手方が以下の各号のいずれかに該当した場合、何ら催告を要せず、直ちに本契約の全部又は一部を解除することができる。¥n(1) 本契約のいずれかの規定に違反し、相当の期間を定めて催告したにもかかわらず、是正されないとき¥n(2) 差押、仮差押、仮処分、公売処分その他公権力の処分を受け、又は破産、民事再生手続開始、会社更生手続開始、特別清算開始、特定調停申立、若しくはこれらのための保全手続の申立がなされ又は受けたとき¥n(3) 自己振出の手形又は小切手が不渡りとなったとき¥n(4) 公租公課の滞納処分を受けたとき¥n(5) その他、任意整理の通知を発する等、信用状態に重大な不安が生じたと判断される場合、若しくは将来において生じると判断されるとき¥n(6) ◎◎団、◎◎団員、◎◎団員でなくなった時から5年を経過しない者、◎◎団準構成員、◎◎団関係企業、総会屋等、社会運動等標ぼうゴロ又は特殊知能◎◎集団等、その他これらに準ずる者であるとき、又は、主要な株主に若しくは出資者に含まれるとき¥n(7) 自ら又は第三者を利用して、◎◎的な要求行為、法的責任を超えた不当な要求行為、取引に関する脅迫的な言動又は◎◎行為、及び風説の流布又は偽計・威力による信用毀損行為又は業務妨害行為、その他の違法行為を行ったとき¥n(8) 相手方の評判、名誉、信用を棄損したとき、又は、相手方との信頼関係を著しく破壊したとき¥n(9) その他本契約を継続しがたい重大な事由が発生したと甲が判断するとき¥n2. 甲は、前項にかかわらず、5営業日の予告期間をもって書面で乙に通知することにより、いつでも本契約を解約することができる。¥n3. 前2項の規定に従い、甲又は乙が本契約の全部又は一部を解除又は解約した場合でも、相手方に対して、損害賠償請求をすることを妨げない。¥n4. 第1項により本契約が解除された場合、契約の解除を受けた当事者は、当然に期限の利益を失い、相手方に対する一切の債務を直ちに履行するものとする。¥n¥n第14条 (損害賠償)¥n1. 甲及び乙は、本契約の履行に関し、相手方の責めに帰すべき事由により損害を被った場合、相手方に対して損害賠償を請求することができる。¥n2. 本契約の履行に関する損害賠償の累計総額は、債務不履行、不当利得、不法行為その他請求原因の如何にかかわらず、本契約に基づき甲が乙に対して実際に支払った委託料の合計金額を限度とする。¥n3. 前項は、損害が損害賠償義務者の故意又は重大な過失に基づくものである場合には適用しない。¥n¥n¥n第15条 (契約の変更)¥n甲及び乙は、本契約の変更又は修正を行う場合、甲乙双方の記名捺印した書面を交わすものとする。¥n¥n第16条 (協議)¥n本契約について甲乙間に疑義が生じたときは、甲乙協議の上、これを解決するものとする。¥n¥n第17条 (専属的合意管轄裁判所)¥n本契約について甲乙間に紛争が生じたときは、東京地方裁判所を第一審の専属的合意管轄裁判所とする。¥n¥n第18条 (準拠法)¥n本契約は、日本法に準じて解釈される。¥n¥n上記契約の証として本書2通を作成し、甲乙記名捺印の上、各自1通を保有する。¥n¥n2021年5月6日¥n¥n甲:¥n◎◎都◎区◎◎◎1丁目2番3号¥n株式会社YYYYYYYYYYY¥n代表取締役社長 AA A¥n¥n乙:¥n◎◎都◎◎区◎◎◎4-5-6¥nZZZZ株式会社¥n代表取締役 BB BB¥n¥n”」と表示部16に表示される(一例であるものとする)。 In FIG. 8, the text data TD is displayed on the display unit 16 of the server 1, for example, as follows (the figure shows an example in which the tail part is included). If disclosure is requested by a court or administrative agency based on laws and regulations, rules, court decisions/orders, administrative agency orders/guidance, etc., the party shall disclose the other party's confidential information to the court or administrative agency. However, if any of these events occur, each party shall promptly notify the other party.¥n5.Each party shall not disclose confidential information disclosed by the other party. Confidential Information shall not be used for purposes other than the Contracted Work, and Confidential Information shall not be reproduced or modified for any purpose other than the Contracted Work.\n6. \n7.If either party becomes aware of the occurrence or possible occurrence of a situation such as leakage, loss, theft or misappropriation of confidential information, it shall immediately notify the other party to that effect in writing. ¥n8.Each party shall return to the other party, erase or dispose of confidential information received from the other party in the event of any of the following events.\n8. n (1) When this contract ends¥n (2) When the other party requests a refund¥n¥nArticle 12 (Handling of Personal Information)¥nParty A and Party B shall handle Party B’s personal information It shall be handled in accordance with the information protection regulations.\n\nArticle 13 (Cancellation)\n1. This Agreement may be canceled in whole or in part.\n(1) If any provision of this Agreement is violated and is not corrected despite notice to set a reasonable period of time\n(2) ) Subject to seizure, provisional seizure, provisional disposition, public auction disposition, or other disposition of public authority, bankruptcy, commencement of civil rehabilitation proceedings, commencement of corporate reorganization proceedings, commencement of special liquidation, petition for special mediation, or petition for preservative procedures for these, or ¥n (3) When a self-drawn bill or check is dishonored ¥n (4) When receiving disposition for delinquency of taxes and public dues ¥n (5) If it is judged that serious anxiety has arisen in the state, or if it is judged that it will occur in the future ¥n (6) ◎◎ group, ◎◎ member, ◎◎ Person who has not been a member for less than 5 years, ◎◎Associate members, ◎◎Organization affiliated companies, corporate racketeers, etc., social activist trolls or special intelligence ◎◎Groups, etc., or other similar persons, or included in major shareholders or investors ¥n (7) By yourself or by using a third party, you make a request, an unreasonable request that exceeds legal responsibility, make a threatening statement or conduct a transaction, or disseminate rumors. Or when you commit an act of defamation or obstruction of business by fraudulent means or force, or other illegal act¥n (8) When you damage the reputation, honor, or credibility of the other party, or when you significantly destroy the relationship of trust with the other party ¥n (9) When Party A deems that other serious reasons that make it difficult to continue this Agreement have occurred ¥n2. Notwithstanding the preceding paragraph, Party A may terminate this Agreement at any time by notifying Party B in writing with five business days' notice. \n3. In accordance with the provisions of the preceding two paragraphs, even if Party A or Party B cancels or cancels all or part of this Agreement, it does not prevent the other party from claiming damages. \n4. In the event that this Agreement is terminated pursuant to paragraph 1, the party subject to the termination of the Agreement will of course lose the benefit of time and shall immediately perform all obligations to the other party. \n\nArticle 14 (Compensation for damages)\n1. Party A and Party B may claim damages from the other party in the event of damage due to reasons attributable to the other party in relation to the performance of this Agreement. \n2. The cumulative total of damages related to the performance of this contract shall be limited to the total amount of commission fees actually paid by Party A to Party B under this contract, regardless of default, unjust enrichment, tort or any other cause of claim. and \n3. The preceding paragraph shall not apply if the damage is caused intentionally or by gross negligence of the person obligated to compensate for damages. \n\n\nArticle 15 (Amendment of Agreement)\nWhen Party A and Party B change or amend this Agreement, they shall exchange documents signed and sealed by both Party A and Party B. ¥n¥nArticle 16 (Consultation)¥nIf any doubt arises between Party A and Party B regarding this Agreement, it shall be resolved through discussion between Party A and Party B. \n\nArticle 17 (Exclusive Court of Jurisdiction)\nIn the event of a dispute between Party A and Party B regarding this Agreement, the Tokyo District Court shall be the exclusive jurisdictional court of first instance. \n\nArticle 18 (Governing Law)\nThis Agreement shall be interpreted in accordance with the laws of Japan. \n\nAs a proof of the above contract, two copies of this document will be prepared, and each party will retain one copy after affixing their names and seals. ¥n¥nMay 6, 2021¥n¥nFirst Party:¥n◎◎Tokyo◎Ku◎◎◎1-chome 2-3 3¥n Co., Ltd. YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY… n◎◎City◎◎Ward◎◎◎4-5-6¥nZZZZ Co., Ltd.¥n CEO BB BB¥n¥n” is displayed on the display unit 16 (this is an example).

上述のようなテキストデータTDから「項目」に合う項目情報(項目情報EX1~EX10)が抽出(情報抽出)されると、サーバ1の表示部16に、例えば、次のように表示される。即ち、図9に示すように、項目情報EX1に関しては、「“label”:“title”」、「“value”:“業務委託契約書”」、「“index”:0」、「“length”:7」と表示される(これは、テキストデータTDの先頭部分から抽出されたものであり、ここでの図示は省略する)。
これらの表示は、次のように読むことができる。即ち、「項目」が「title」であり、これに合うように「業務委託契約書」が抽出され、そして、抽出された「業務委託契約書」は、テキストデータTDの先頭の文字を「0」とすると、先頭の「0」に位置し、この抽出位置からの文字長さは、「7」であると読むことができる(以下も同様に読むことができるので説明は省略する)。
When the item information (item information EX1 to EX10) matching the "item" is extracted (extracted) from the text data TD as described above, the display section 16 of the server 1 displays, for example, as follows. That is, as shown in FIG. 9, for the item information EX1, "label": "title", "value": "outsourcing contract", "index": 0, "length":7" (which is extracted from the beginning of the text data TD and is not shown here).
These indications can be read as follows. That is, the "item" is "title", and the "service consignment contract" is extracted to match this. , it can be read that it is positioned at the leading "0" and the character length from this extraction position is "7" (the following can also be read in the same way, so the explanation is omitted).

また、項目情報EX2に関しては、「“label”:“contract origin company”」、「“value”:“株式会社YYYYYYYYYYY”」、「“index”:10」、「“length”:15」と表示される。 Regarding the item information EX2, "label": "contract origin company", "value": "YYYYYYYYYYY", "index": 10, and "length": 15 are displayed. be.

また、項目情報EX3に関しては、「“label”:“contractor company”」、「“value”:“ZZZZ株式会社”」、「“index”:38」、「“length”:8」と表示される。 Regarding the item information EX3, "label": "contractor company", "value": "ZZZZ Corporation", "index": 38, and "length": 8 are displayed. .

また、図10に示すように、項目情報EX4に関しては、「“label”:“auto renew”」、「“value”:“、期間満了の1ヶ月前までに,甲及び乙による更新しない旨の書面による意思表示がない”」、「“index”:262」、「“length”:40」と表示される。 Further, as shown in FIG. 10, regarding the item information EX4, ““label”: “auto renew””, ““value”:”, and the fact that A and B will not renew by one month before the period expires. There is no written declaration of intention””, ““index”: 262”, and ““length”: 40” are displayed.

また、項目情報EX5に関しては、「“label”:“auto renew announcement”」、「“value”:“期間満了の1ヶ月前”」、「“index”:263」、「“length”:9」と表示される。 Further, regarding the item information EX5, ““label”: “auto renewal announcement””, ““value”: “one month before expiration”, ““index”: 263”, ““length”: 9”. is displayed.

また、図11に示すように、項目情報EX6に関しては、「“label”:“contract date”」、「“value”:“2021年5月6日”」、「“index”:3905」、「“length”:9」と表示される。 Further, as shown in FIG. 11, regarding the item information EX6, ““label”: “contract date””, ““value”: “May 6, 2021”, ““index”: 3905”, “ “length”: 9” is displayed.

また、項目情報EX7に関しては、「“label”:“contract origin company”」、「“value”:“株式会社YYYYYYYYYYY”」、「“index”:3936」、「“length”:15」と表示される。 Regarding the item information EX7, "label": "contract origin company", "value": "YYYYYYYYYYY", "index": 3936, and "length": 15 are displayed. be.

また、項目情報EX8に関しては、「“label”:“contract origin person”」、「“value”:“AA A”」、「“index”:3960」、「“length”:4」と表示される(図12も参照)。 Regarding the item information EX8, "label": "contract origin person", "value": "AA A", "index": 3960, and "length": 4 are displayed. (See also Figure 12).

また、図12に示すように、項目情報EX9に関しては、「“label”:“contractor company”」、「“value”:“ZZZZ株式会社”」、「“index”:3988」、「“length”:8」と表示される。 Further, as shown in FIG. 12, regarding the item information EX9, ““label”: “contractor company”, ““value”: “ZZZZ Corporation”, ““index”: 3988”, ““length” :8” is displayed.

また、項目情報EX10に関しては、「“label”:“contractor person”」、「“value”:“BB BB”」、「“index”:4004」、「“length”:5」と表示される。 As for the item information EX10, ““label”: “contractor person”, ““value”: “BB BB””, ““index”: 4004”, and ““length”: 5” are displayed.

以上のような項目情報(例えば、項目情報EX1~EX10)を含んで抽出後データが生成され、これが端末3へ送信される。 Post-extraction data is generated including the above item information (for example, item information EX1 to EX10), and is transmitted to the terminal 3. FIG.

<端末3でのファイル取り込み等について>
図13は、ファイルインポート部4の一例を示す図である。
端末3には、本サービスの利用に必要なアプリケーションプログラムが予めインストールされており、アプリケーションプログラムによってファイルインポート部4が表示部36に表示される。
<Regarding file import etc. on terminal 3>
FIG. 13 is a diagram showing an example of the file import section 4. As shown in FIG.
An application program necessary for using this service is installed in the terminal 3 in advance, and the file import section 4 is displayed on the display section 36 by the application program.

ファイルインポート部4には、新規作成のための新規作成部4aが設けられる。また、テンプレートから作成するためのテンプレート作成部4bも設けられる。また、ファイルをインポートして取り込むためのインポート部4cも設けられる。 The file import section 4 is provided with a new creation section 4a for new creation. A template creating unit 4b for creating from a template is also provided. An import unit 4c for importing and taking in files is also provided.

例えば、ドキュメントファイルをドラッグし、そして、インポート部4cの位置でドロップした場合、表示部36の表示エリアDA1aには、図14に示すような5つのブロック(ブロックBL1~ブロックBL5)で文字や数字が表示される。なお、ブロックBL1~ブロックBLnのうち、図14では、ブロックBL1~ブロックBL5で文字や数字が表示される。なお、表示エリアDA1bには、ここで(図14で)特に説明するような表示はない。 For example, when a document file is dragged and dropped at the position of the import section 4c, characters and numbers are displayed in the display area DA1a of the display section 36 in five blocks (blocks BL1 to BL5) as shown in FIG. is displayed. In FIG. 14, among blocks BL1 to BLn, characters and numbers are displayed in blocks BL1 to BL5. Note that the display area DA1b does not have any display that will be particularly described here (in FIG. 14).

ブロックBL1での表示は、「研究開発委託契約書」である。
また、ブロックBL2での表示は、「株式会社YYYYYYYYYYY(以下「甲」という。)は、ZZZZZZZZ株式会社(以下「乙」という。)とは、以下のとおり、研究開発委託契約(以下「本契約」という。)を締結する。」である(なお、図1では、図面スペースの都合上、「Y」や「Z」の文字数を少なくしてある)。
The display in block BL1 is "research and development consignment contract".
In addition, the display in block BL2 is as follows: "YYYYYYYYYYY Co., Ltd. (hereinafter referred to as "Party A") and ZZZZZZZZZ Co., Ltd. (hereinafter referred to as "Party B".) ”). (In FIG. 1, the number of letters "Y" and "Z" is reduced for convenience of drawing space).

また、ブロックBL3での表示は、「(目的)」、「第1条 甲は、乙に対し、別紙1(省略)記載の製品(以下「本製品」という。)の製造を事業化することを目的として、本製品の製造に関する研究開発(以下「本研究開発」という。)を乙に委託し、乙は、これを受託する。」である。 In addition, the indications in block BL3 are "(Purpose)" and "Article 1 Party A shall commercialize the manufacture of the product (hereinafter referred to as the "Product") described in Exhibit 1 (omitted) for Party B. For the purpose of this, we entrust Party B with research and development related to the manufacture of this product (hereinafter referred to as "this research and development"), and Party B will be entrusted with this. ”.

また、ブロックBL4での表示は、「(委託業務)」、「第2条 前条に基づいて甲が乙に委託する本研究開発の内容は、以下のとおりとする。」、「(1) 研究題目 文章作成効率化を目的とするXXX手法の研究開発」、「(2) 研究目的 XXXに適したXXXを開発し商品化すること」、「(3) 研究内容 XXXXXXXXXXXX」、「(4) 研究担当者 CC CC」、「(5) 研究に要する費用 金5,000,000円」、「(6) 研究期間 2021年5月1日から2022年4月30日まで」、「(7) 研究場所 乙のオフィス内」である。 In addition, the indications in block BL4 are: "(Commissioned work)", "Article 2. The content of this research and development entrusted to Party B by Party A based on the preceding article shall be as follows.", "(1) Research Title: Research and development of XXX method for the purpose of streamlining sentence creation”, “(2) Research purpose: Developing and commercializing XXX suitable for XXX”, “(3) Research content: XXXXXXXXXXXX”, “(4) Research Person in charge CC CC”, “(5) Expenses required for research 5,000,000 yen”, “(6) Research period May 1, 2021 to April 30, 2022”, “(7) Research Location: Inside Party B's office.

また、ブロックBL5での表示は、「(委託料の支払い)」、「第3条 甲は、本研究開発の委託料として、金5,000,000円を乙に支払うものとする。」、「2. 前項で定める委託料は、以下の時期に、以下の金額を、乙の指定する口座に振り込むことにより支払うものとする。」である。 In addition, the indications in block BL5 are "(Payment of consignment fee)", "Article 3 Party A shall pay Party B 5,000,000 yen as a consignment fee for this research and development." ``2. The commission fee specified in the preceding paragraph shall be paid by transferring the following amount to the account designated by Party B at the following time.''

以上のようなドキュメントファイルから、サーバ1へ送信するファイル(送信ファイル)を生成し、そして、これを送信すると、後にサーバ1から抽出後データが端末3に届く。この後、端末3の表示部36に表示させる表示情報(第1表示情報及び第2表示情報)を生成して、これを表示させると、図15に示すように左右に並んだ状態の画面表示になる。 A file (transmission file) to be transmitted to the server 1 is generated from the document file as described above. Thereafter, when the display information (the first display information and the second display information) to be displayed on the display unit 36 of the terminal 3 is generated and displayed, as shown in FIG. become.

<抽出後データに基づく表示情報について>
図15は、抽出後データに基づく表示情報を表示部36に表示させた一例(ドキュメント先頭部分、抽出結果も先頭部分)を示す図である。
<Display information based on extracted data>
FIG. 15 is a diagram showing an example of display information displayed on the display unit 36 based on the data after extraction (the head portion of the document and the head portion of the extraction result as well).

図15において、表示エリアDA2に示すブロックBL1では、「研究開発委託契約書」がハイライト表示される(以下、ハイライト表示を四角の枠囲みで表現する。なお、符号は省略する)。即ち、「研究開発委託契約書」が自動抽出されたことが分かる。 In FIG. 15, in block BL1 shown in display area DA2, "R&D consignment contract" is highlighted (hereafter, highlighting is represented by a square frame, and reference numerals are omitted). That is, it can be seen that the "R&D consignment contract" is automatically extracted.

また、ブロックBL2では、「株式会社YYYYYYYYYYY」、「ZZZZZZZZ株式会社」がハイライト表示される。即ち、「株式会社YYYYYYYYYYY」、「ZZZZZZZZ株式会社」が自動抽出されたことが分かる。 Also, in block BL2, "YYYYYYYYYYY Co., Ltd." and "ZZZZZZZZ Co., Ltd." are highlighted. That is, it can be seen that "YYYYYYYYYYY Co., Ltd." and "ZZZZZZZZ Co., Ltd." are automatically extracted.

また、ブロックBL3では、「別紙1(省略)記載の製品(以下「本製品」という。)の製造を事業化すること」がハイライト表示される。即ち、「別紙1(省略)記載の製品(以下「本製品」という。)の製造を事業化すること」が自動抽出されたことが分かる。 In addition, in block BL3, "to commercialize the manufacture of the product (hereinafter referred to as 'this product') described in Attachment 1 (omitted)" is highlighted. That is, it can be seen that "to commercialize the manufacture of the product described in Attachment 1 (omitted) (hereinafter referred to as "this product")" was automatically extracted.

なお、ブロックBL4、ブロックBL5では、ハイライト表示がないことから、抽出がなされてないことが分かる。 It can be seen that blocks BL4 and BL5 are not extracted because they are not highlighted.

表示エリアDA2の右隣にある表示エリアDA3には、所定の順序で、自動抽出結果が図の上下方向に並んで表示される。具体的には、項目として「契約書タイトル」が表示され、項目情報として「研究開発委託契約」が表示される。
また、項目として「契約目的」が表示され、項目情報として「別紙1(省略)記載の製品(以下「本製品」という。)の製造を事業化すること」が表示される。
In a display area DA3 to the right of the display area DA2, the results of automatic extraction are displayed in a predetermined order in the vertical direction of the drawing. Specifically, "contract title" is displayed as an item, and "research and development consignment contract" is displayed as item information.
In addition, "contract purpose" is displayed as an item, and "to commercialize the manufacture of the product (hereinafter referred to as "the product") described in Attachment 1 (omitted)" is displayed as item information.

また、項目として「契約元 会社名」が表示され、項目情報として「株式会社YYYYYYYYYYY」が表示される。
また、項目として「契約元 住所」が表示され、項目情報として「◎◎都◎区◎◎◎1-2-3」が表示される。
また、項目として「契約元 契約者役職名」が表示され、項目情報として「代表取締役」が表示される。
また、項目として「契約元 契約者氏名」が表示され、項目情報として「AA A」が表示される。
In addition, "contractor company name" is displayed as an item, and "YYYYYYYYYYY Co., Ltd." is displayed as item information.
In addition, "contract source address" is displayed as an item, and "◎◎ capital ◎ ward ◎◎◎ 1-2-3" is displayed as item information.
In addition, "contract source contractor title name" is displayed as an item, and "representative director" is displayed as item information.
In addition, "contract source contractor name" is displayed as an item, and "AAA" is displayed as item information.

また、項目として「契約先 会社名」が表示され、項目情報として「ZZZZZZZZ株式会社」が表示される。
また、項目として「契約先 住所」が表示され、項目情報として「◎◎都◎◎区◎◎◎4-5-6」が表示される。
また、項目として「契約先 契約者役職名」が表示され、項目情報として「代表取締役」が表示される。
Also, "contracted company name" is displayed as an item, and "ZZZZZZZZ Co., Ltd." is displayed as item information.
Also, "Contractor Address" is displayed as an item, and "◎◎City◎◎Ward◎◎◎4-5-6" is displayed as item information.
In addition, "contractor/contractor position name" is displayed as an item, and "representative director" is displayed as item information.

図16は、抽出後データに基づく表示情報を表示部36に表示させた一例(ドキュメント後尾部分、抽出結果は先頭部分)を示す図である。
表示エリアDA2の画面をスクロールすると、図16に示すような表示状態になる。
FIG. 16 is a diagram showing an example of display information based on post-extraction data displayed on the display unit 36 (the tail part of the document, the extraction result is the head part).
When the screen of the display area DA2 is scrolled, a display state as shown in FIG. 16 is obtained.

表示エリアDA2に示すブロックBLn-3では、「(契約期間)」、「第31条 本契約の有効期間は、本契約締結日から1年間とする。但し、契約期間満了の2ヶ月前までに、一方当事者より別段の書面による意思表示がなされない場合で、かつ、甲乙間で取引が継続している場合は、新たな期間を1年間として自動更新されるものとし、以後も同様とする。」、「2. 本契約の有効期間が終了した場合でも、第7条、第14条ないし第25条、本状本項、第27条ないし第33条の規定については、本契約終了後も存続するものとする。」が表示され、そして、「本契約締結日」、「1年間」、「契約期間満了の2ヶ月前までに、一方当事者より別段の書面による意思表示がなされない場合で、かつ、甲乙間で取引が継続している場合」、「1年間」がハイライト表示される。即ち、「本契約締結日」、「1年間」、「契約期間満了の2ヶ月前までに、一方当事者より別段の書面による意思表示がなされない場合で、かつ、甲乙間で取引が継続している場合」、「1年間」が自動抽出されたことが分かる。 In block BLn-3 shown in display area DA2, "(contract period)", "Article 31 The effective period of this contract shall be one year from the date of conclusion of this contract. However, two months before the expiration of the contract period , If there is no other manifestation of intention in writing from one party, and if the transaction between Party A and Party B continues, the new period shall be automatically renewed for one year, and the same shall apply thereafter. ", "2. Even if the effective period of this Agreement has expired, the provisions of Articles 7, 14 through 25, this paragraph, and Articles 27 through 33 shall remain applicable even after the termination of this Agreement. shall continue." is displayed, and if there is no separate written declaration of intent from either party at the "date of conclusion of this contract", "one year", or "two months prior to the expiration of the contract period" and the transaction continues between A and B" and "one year" are highlighted. In other words, "the date of conclusion of this contract", "one year", "up to two months before the expiration of the contract period, if there is no separate written declaration of intent from either party, and if the transaction between Party A and Party B continues. It can be seen that "if there is" and "one year" were automatically extracted.

表示エリアDA2に示すブロックBLn-2では、「(準拠法・合意管轄)」、「第32条 本契約は、日本法に従って解釈されるものとする。」、「2. 甲及び乙は、本契約に関して紛争が生じた場合は、東京地方裁判所を第一審の専属的管轄裁判所とすることを合意する。」が表示され、そして、「東京地方裁判所」がハイライト表示される。即ち、「東京地方裁判所」が自動抽出されたことが分かる。 In block BLn-2 shown in display area DA2, "(Governing Law/Agreed Jurisdiction)", "Article 32 This Agreement shall be interpreted in accordance with the laws of Japan", "2. In the event of any dispute regarding the contract, we agree to the exclusive jurisdiction of the Tokyo District Court for the first instance." is displayed, and "Tokyo District Court" is highlighted. That is, it can be seen that "Tokyo District Court" was automatically extracted.

表示エリアDA2に示すブロックBLn-1では、「(協議)」、「第33条 本契約に定めのない事項又は本契約の条項の解釈について疑義を生じたときは、甲乙協議のうえ、誠意をもって解決するよう努めるものとする。」が表示される。なお、ハイライト表示がないことから、抽出がなされてないことが分かる。 In the block BLn-1 shown in the display area DA2, "(Consultation)", "Article 33 If any doubt arises regarding matters not stipulated in this Agreement or the interpretation of the provisions of this Agreement, we will We will try to resolve it." is displayed. Since there is no highlight display, it can be seen that extraction has not been performed.

表示エリアDA2に示すブロックBLnでは、「本契約の成立の証として本書2通を作成し、甲乙両当事者記名押印のうえ、各1通を保有する。」、「2021年5月1日」、「甲:◎◎都◎区◎◎◎1-2-3」、「株式会社YYYYYYYYYYY」、「代表取締役 AA A」、「乙:◎◎都◎◎区◎◎◎4-5-6」、「ZZZZZZZZ株式会社」、「代表取締役 BB BB」が表示され、そして、「2021年5月1日」、「◎◎都◎区◎◎◎1-2-3」、「株式会社YYYYYYYYYYY」、「代表取締役」「AA A」、「◎◎都◎◎区◎◎◎4-5-6」、「代表取締役」「BB BB」がハイライト表示される。即ち、「2021年5月1日」、「◎◎都◎区◎◎◎1-2-3」、「株式会社YYYYYYYYYYY」、「代表取締役」「AA A」、「◎◎都◎◎区◎◎◎4-5-6」、「代表取締役」「BB BB」が自動抽出されたことが分かる。 In the block BLn shown in the display area DA2, "Two copies of this document have been prepared as a proof of the conclusion of this contract, and both parties A and B will affix their names and seals, and each party will hold one copy.", "May 1, 2021", "Party: ◎◎ Tokyo ◎ Ward ◎◎◎ 1-2-3", "YYYYYYYYYYY Co., Ltd.", "Representative Director AA A", "B: ◎ ◎ Tokyo ◎ Ward ◎◎◎ 4-5-6", "ZZZZZZZZ Co., Ltd.", "Representative Director BB BB" are displayed, and "May 1, 2021", "◎◎ Tokyo ◎ Ward ◎◎◎ 1-2-3", "YYYYYYYYYYY Co., Ltd.", " "Representative Director", "AA A", "◎◎City◎◎Ward◎◎◎4-5-6", and "Representative Director" and "BB BB" are highlighted. That is, "May 1, 2021", "◎◎ Tokyo ◎ Ward ◎◎◎ 1-2-3", "YYYYYYYYYYY Co., Ltd.", "Representative Director" "AAA", "◎◎ Tokyo ◎ Ward ◎ ◎◎4-5-6", "Representative Director" and "BB BB" were automatically extracted.

なお、表示エリアDA2の右隣にある表示エリアDA3は、スクロールしていないことから、図15と同じ状態である。スクロールすることにより、図17に示す表示状態になる。
図17は、抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント後尾部分、抽出結果は中間部分)を示す図である。
Note that the display area DA3 to the right of the display area DA2 is in the same state as in FIG. 15 because it is not scrolled. By scrolling, the display state shown in FIG. 17 is obtained.
FIG. 17 is a diagram showing an example of display information based on post-extraction data displayed on the display unit (the tail part of the document, the extraction result being the middle part).

図17において、図16の状態からスクロールすることにより、表示エリアDA3には、項目として「契約先 契約者役職名」が表示され、項目情報として「代表取締役」が表示される。
また、項目として「契約先 契約者氏名」が表示され、項目情報として「BB BB」が表示される。
また、項目として「契約日」が表示され、項目情報として「2021年4月21日」が表示される。
また、項目として「契約期間開始日」が表示され、項目情報として「本契約締結日」が表示される。なお、「本契約締結日」は、ここでは「契約日」となる「2021年4月21日」のことであることから、項目情報として「2021年4月21日」が表示されてもよいものとする。
また、項目として「契約期間終了日」が表示され、項目情報として「2022年4月30日」が表示される。
また、項目として「契約期間」が表示され、項目情報として「1年間」が表示される。
また、項目として「契約更新の条件」が表示され、項目情報として「契約期間満了の2ヶ月前までに、一方当事者より別段の書面による意思表示がなされない場合で、かつ、甲乙間で取引が継続している場合」が表示される。
In FIG. 17, by scrolling from the state of FIG. 16, in the display area DA3, "Contractor Contractor Job Title" is displayed as an item, and "Representative Director" is displayed as item information.
Also, "Contractor Contractor Name" is displayed as an item, and "BB BB" is displayed as item information.
Also, "contract date" is displayed as an item, and "April 21, 2021" is displayed as item information.
In addition, "contract period start date" is displayed as an item, and "contract conclusion date" is displayed as item information. In addition, since the "conclusion date of this contract" is "April 21, 2021" which is the "contract date" here, "April 21, 2021" may be displayed as the item information. shall be
Also, "contract term end date" is displayed as an item, and "April 30, 2022" is displayed as item information.
Also, "contract period" is displayed as an item, and "one year" is displayed as item information.
In addition, "Conditions for contract renewal" is displayed as an item, and "Conditions for renewal of contract" is displayed as item information, "If there is no separate written declaration of intent from one party at least two months before the expiration of the contract period, and there is no transaction between Party A and Party B If continuing" is displayed.

図17の状態から更にスクロールすることにより、表示エリアDA3には、図18に示すような項目や項目情報が表示される。
図18は、抽出後データに基づく表示情報を表示部に表示させた一例(ドキュメント後尾部分、抽出結果も先頭部分)を示す図である。
By further scrolling from the state of FIG. 17, items and item information as shown in FIG. 18 are displayed in the display area DA3.
FIG. 18 is a diagram showing an example of display information based on post-extraction data displayed on the display unit (the tail part of the document and the head part of the extraction result).

項目として「更新の契約期間」が表示され、項目情報として「1年間」が表示される。
また、項目として「自動更新の通知時期」が表示され、項目情報として「-」が表示される。なお、「-」は、該当する項目情報がなかったことを意味するが、例えば、ここをクリックすることによりサンプル例が出てきたりするようにしてもよい。
また、項目として「契約解除の通知時期」が表示され、項目情報として「契約期間満了の2ヶ月前」が表示される。なお、例えば、ここをクリックすることにより、日付が出てきたりするようにしてもよい。また、カーソルを合わせることにより、「契約期間満了の2ヶ月前」があるブロックの内容がポップアップ表示されるようにしてもよい。
そして、最後の項目として「管轄裁判所」が表示され、項目情報として「東京地方裁判所」が表示される。
なお、特に図示しないが、項目情報に対し警告情報が紐付いていた場合には、警告の対象となる項目情報が、例えば、ハイライトされた状態で表示される(一例であり、警告が出ていることが分かれば限定されないものとする)。そして、ハイライトされた項目情報を、例えば、クリック等すると、警告の具体内容が更に表示される。
"Renewal contract period" is displayed as an item, and "1 year" is displayed as item information.
In addition, "notification time of automatic update" is displayed as an item, and "-" is displayed as item information. Note that "-" means that there was no corresponding item information, but for example, sample examples may appear by clicking here.
In addition, "contract termination notification time" is displayed as an item, and "two months before expiration of contract period" is displayed as item information. For example, by clicking here, the date may appear. Also, by moving the cursor, the content of the block containing "two months before expiration of the contract period" may be displayed as a pop-up.
Then, "jurisdictional court" is displayed as the last item, and "Tokyo District Court" is displayed as item information.
Although not shown, if item information is associated with warning information, the item information to be warned is displayed in a highlighted state, for example (this is an example, and a warning is issued). shall not be limited if it is known that the Then, when the highlighted item information is clicked, for example, the specific content of the warning is further displayed.

<効果について>
以上、図2乃至図18を参照しながら説明してきたように、本サービスによれば、ユーザー2が端末3を用いて送信したファイル(送信ファイル)のデータ種類に合う項目で項目情報の抽出(情報抽出)を自動で行うことができる。本サービスによれば、様々な項目の項目情報の抽出をユーザー2が一々手作業でする必要性がなくなることから、従来と比べて作業性の向上を図ることができる。
<About effect>
As described above with reference to FIGS. 2 to 18, according to this service, item information is extracted (or information extraction) can be performed automatically. According to this service, it is not necessary for the user 2 to manually extract item information of various items one by one.

<まとめ>
以上、本発明のテキスト情報抽出システム100の一実施形態について説明したが、本発明は上述した本実施形態に限定されないものとする。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果の列挙に過ぎず、本発明による効果は、本実施形態に記載されたものに限定されないものとする。
<Summary>
An embodiment of the text information extraction system 100 of the present invention has been described above, but the present invention is not limited to this embodiment described above. Moreover, the effects described in the present embodiment are merely a list of the most suitable effects produced by the present invention, and the effects of the present invention are not limited to those described in the present embodiment.

本実施形態では、例えば、上述のように契約書に合う内容の項目で項目情報の抽出を行ってきたが、本発明の仕組みを利用すれば、例えば、文章のチェックを行うための情報抽出をすることも可能である(具体例は省略するものとする)。 In this embodiment, for example, item information has been extracted for items that match the content of the contract as described above. (Specific examples shall be omitted).

図3に示すハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されないものとする。また、図4及び図5に示す機能的構成も例示に過ぎず、特に限定されないものとする。即ち、上述した一連の処理を全体として実行できる機能がテキスト情報抽出システム100(サーバ1や端末3)に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図4及び図5の例に限定されないものとする。 The hardware configuration shown in FIG. 3 is merely an example for achieving the object of the present invention, and is not particularly limited. Also, the functional configurations shown in FIGS. 4 and 5 are merely examples, and are not particularly limited. That is, it is sufficient if the text information extraction system 100 (server 1 or terminal 3) has a function capable of executing the above-described series of processes as a whole. In particular, it shall not be limited to the examples of FIGS.

また、機能ブロックの存在場所も、図4及び図5に特に限定されず、任意でよいものとする。例えば、サーバ1の機能ブロックを端末3等に適宜移譲させてもよいものとする。また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよいものとする。 Also, the locations of the functional blocks are not particularly limited to those shown in FIGS. 4 and 5, and may be arbitrary. For example, the functional blocks of the server 1 may be transferred to the terminal 3 or the like as appropriate. Also, one functional block may be composed of hardware alone, software alone, or a combination thereof.

また、例えば、一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされるものとする。また、コンピュータは、専用のハードウェアに組み込まれるコンピュータであってもよいものとする。
コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバ1の他、汎用のスマートフォンやパーソナルコンピュータであってもよいものとする。
Also, for example, when a series of processes is executed by software, a program that constitutes the software is installed in a computer or the like from a network or a recording medium. Also, the computer may be a computer built into dedicated hardware.
The computer may be a computer capable of executing various functions by installing various programs, such as the server 1, or may be a general-purpose smart phone or personal computer.

また、例えば、このようなプログラムを含む記録媒体は、利用者にプログラムを提供するために、装置本体とは別に配布される図示しないリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態で利用者に提供される記録媒体等で構成されるものであってもよいものとする。 Further, for example, a recording medium containing such a program is not only constituted by a removable medium (not shown) that is distributed separately from the main body of the device in order to provide the program to the user, but also is preinstalled in the main body of the device. It may be composed of a recording medium or the like that is provided to the user in a state in which it is stored.

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものとする。また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。 In this specification, the steps of writing a program recorded on a recording medium are not necessarily processed chronologically according to the order, but may be executed in parallel or individually. It shall also include the processing performed. Further, in this specification, the term "system" means an overall device composed of a plurality of devices, a plurality of means, or the like.

このようなプログラムを含む記録媒体は、ユーザーにプログラムを提供するために装置本体とは別に配布される図3のリムーバブルメディア21により構成されるだけでなく、装置本体に予め組み込まれた状態で利用者に提供される記録媒体等で構成される。
リムーバブルメディア21は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini-Disk)等により構成される。
装置本体に予め組み込まれた状態でユーザー2に提供される記録媒体は、例えば、プログラムが記録されている図3のROM32や、図3の記憶部38に含まれるハードディスク等で構成される。
A recording medium containing such a program is not only configured by the removable medium 21 of FIG. It consists of a recording medium, etc. provided to a person.
The removable medium 21 is composed of, for example, a magnetic disk (including a floppy disk), an optical disk, or a magneto-optical disk. Optical discs are composed of, for example, CD-ROMs (Compact Disk-Read Only Memory), DVDs (Digital Versatile Disks), and the like. The magneto-optical disk is composed of an MD (Mini-Disk) or the like.
The recording medium provided to the user 2 in a state of being pre-installed in the apparatus main body includes, for example, the ROM 32 in FIG. 3 in which the program is recorded, the hard disk included in the storage unit 38 in FIG. 3, and the like.

以上まとめると、本発明が適用されるテキスト情報抽出システムは、次のような構成を取れば足り、各種各様な実施形態を取ることができる。
即ち、本発明が適用されるテキスト情報抽出システム(例えば、図2のテキスト情報抽出システム100)は、
テキストデータ(例えば、図8のテキストデータTD)から情報抽出が可能な情報処理装置(例えば、図2のサーバ1)と、前記情報処理装置に接続された一又は複数の端末(例えば、図2の端末3)とを備えるテキスト情報抽出システムであって、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信手段(例えば、図4のファイル受信処理部112)と、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断手段(例えば、図4のテキストファイル判断処理部113)と、
前記テキストファイル判断手段により前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化手段(例えば、図4のテキストファイル化処理部114)と、
前記テキストファイル判断手段により判断された、又は、前記テキストファイル化手段により前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目(例えば、図9の“label”:“title”)に合う項目情報(例えば、図9の“value”:“業務委託契約書”)を前記情報抽出する項目情報抽出手段(例えば、図4の項目情報抽出処理部117)と、
前記項目情報抽出手段により前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成手段(例えば、図4の抽出後データ生成処理部118)と、
前記抽出後データ生成手段により生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信手段(例えば、図4の抽出後データ送信処理部119)と、を備える。
To summarize the above, the text information extraction system to which the present invention is applied is sufficient if it has the following configuration, and can take various embodiments.
That is, a text information extraction system to which the present invention is applied (for example, the text information extraction system 100 in FIG. 2) is
An information processing device (eg, server 1 in FIG. 2) capable of extracting information from text data (eg, text data TD in FIG. 8), and one or more terminals (eg, FIG. 2) connected to the information processing device A text information extraction system comprising a terminal 3) of
The information processing apparatus includes file receiving means (for example, the file reception processing unit 112 in FIG. 4) for receiving a transmission file transmitted from the terminal;
Text file determination means (for example, text file determination processing unit 113 in FIG. 4) for determining whether the transmission file is a text file;
Text file conversion means (for example, the text file conversion processing unit 114 in FIG. 4) that converts the transmission file into a text file when the text file decision means determines the negative;
At least one item (for example, “label” in FIG. 9 : item information extraction means (for example, the item information extraction processing unit 117 in FIG. 4) for extracting the item information (for example, "value": "outsourcing contract" in FIG. 9) that matches the "title");
post-extraction data generation means for generating post-extraction data including the item information extracted by the item information extraction means (for example, post-extraction data generation processing unit 118 in FIG. 4);
post-extraction data transmission means (for example, post-extraction data transmission processing unit 119 in FIG. 4) for transmitting the post-extraction data generated by the post-extraction data generation means to the terminal that transmitted the transmission file; .

本発明によれば、情報抽出をすることができ、以て作業性の向上を図ることができる。即ち、本発明は、テキストデータから情報抽出が可能な情報処理装置と、一又は複数の端末とを備えるシステムであることから、情報処理装置や、情報処理装置と端末との協働により、情報抽出をすることができる。従って、作業性の向上を図ることができる。
例えば、図8のテキストデータTDから、項目として、例えば、図9の“title”に合う項目情報、即ち、例えば、図9の“業務委託契約書”を抽出することができる。従って、従来と比べ作業性の向上を図ることができる。
According to the present invention, information can be extracted, and workability can be improved. That is, the present invention is a system comprising an information processing device capable of extracting information from text data and one or more terminals. can be extracted. Therefore, workability can be improved.
For example, from the text data TD of FIG. 8, it is possible to extract item information that matches the "title" of FIG. 9, ie, "outsourcing agreement" of FIG. Therefore, it is possible to improve workability compared with the conventional one.

また、本発明が適用されるテキスト情報抽出システムは、
前記情報処理装置は、前記テキストデータの一部または全部の内容に基づき、前記テキストデータがどのデータ種類のものであるかを特定するデータ種類特定手段(例えば、図4のデータ種類特定処理部115)と、
前記データ種類特定手段により特定された前記データ種類に対応する前記項目を項目記憶部(例えば、図4の項目記憶部181)に記憶された中から選択する項目選択手段(例えば、図4の項目選択処理部116)と、を更に備える。
Also, the text information extraction system to which the present invention is applied is
The information processing apparatus includes data type identification means (for example, the data type identification processing unit 115 in FIG. 4) that identifies the data type of the text data based on the content of part or all of the text data. )and,
Item selection means (for example, item in FIG. 4) for selecting the item corresponding to the data type specified by the data type specification means from items stored in an item storage section (for example, item storage section 181 in FIG. 4) A selection processing unit 116) is further provided.

本発明によれば、テキストデータがどのデータ種類のものであるか特定することができ、このデータ種類の特定によって様々な項目の中から適した項目を選択することができる。従って、作業性の向上に寄与することができる。 According to the present invention, it is possible to specify which data type the text data belongs to, and by specifying the data type, a suitable item can be selected from among various items. Therefore, it can contribute to the improvement of workability.

また、本発明が適用されるテキスト情報抽出システムは、
前記抽出後データ生成手段は、前記項目情報に関し、前記テキストデータにおける抽出位置に関する情報(例えば、図9の“index”:0)と、前記抽出位置からの文字長さに関する情報(例えば、図9の“length”:7)とを紐付けた上で前記抽出後データを生成する。
Also, the text information extraction system to which the present invention is applied is
Regarding the item information, the post-extraction data generation means includes information on an extraction position in the text data (for example, "index": 0 in FIG. 9) and information on a character length from the extraction position (for example, The post-extraction data is generated after associating with the "length" of 7).

本発明によれば、項目情報に関し、テキストデータにおける抽出位置に関する情報と、抽出位置からの文字長さに関する情報とを紐付けて抽出後データを生成することから、抽出後データを受け取る側の端末では、抽出位置に関する情報と、抽出位置からの文字長さに関する情報とを利用することができる。 According to the present invention, regarding the item information, since the post-extraction data is generated by linking the information on the extraction position in the text data and the information on the character length from the extraction position, the terminal on the side that receives the post-extraction data can utilize information about the extraction position and information about the character length from the extraction position.

また、本発明が適用されるテキスト情報抽出システムは、
前記端末は、前記抽出後データを受信する抽出後データ受信手段(例えば、図5の抽出後データ受信処理部313)と、
前記抽出後データ受信手段により受信した前記抽出後データから前記端末の表示部に表示させる表示情報を生成する表示情報生成手段(例えば、図5の表示情報生成処理部314)と、
前記表示情報生成手段により生成された前記表示情報を前記表示部に表示させる情報表示手段(例えば、図5の情報表示処理部315)と、を備える。
Also, the text information extraction system to which the present invention is applied is
The terminal includes post-extraction data receiving means (for example, post-extraction data reception processing unit 313 in FIG. 5) for receiving the post-extraction data;
display information generating means for generating display information to be displayed on a display unit of the terminal from the extracted data received by the extracted data receiving means (for example, a display information generation processing unit 314 in FIG. 5);
and an information display unit (for example, the information display processing unit 315 in FIG. 5) that causes the display unit to display the display information generated by the display information generation unit.

本発明によれば、端末側では、受信した抽出後データから端末の表示部に表示させる表示情報を生成し、そして、この表示情報を表示部に表示させることかできる。ユーザーは、表示部に表示された表示情報から、抽出した項目や項目情報を確認することができる。 According to the present invention, the terminal side can generate display information to be displayed on the display section of the terminal from the received post-extraction data, and display this display information on the display section. The user can confirm the extracted items and item information from the display information displayed on the display unit.

また、本発明が適用されるテキスト情報抽出システムは、
前記端末は、前記抽出後データを受信する抽出後データ受信手段(例えば、図5の抽出後データ受信処理部313)と、
前記抽出後データ受信手段により受信した前記抽出後データから前記端末の表示部に表示させる表示情報を生成する表示情報生成手段(例えば、図5の表示情報生成処理部314)と、
前記表示情報生成手段により生成された前記表示情報を前記表示部に表示させる情報表示手段(例えば、図5の情報表示処理部315)と、を備え、
前記表示情報生成手段は、前記抽出位置に関する情報及び前記文字長さに関する情報を利用した第1表示情報(例えば、図15の表示エリアDA2に表示された情報)を生成すると共に、少なくとも前記項目情報を含む第2表示情報(例えば、図15の表示エリアDA3に表示された情報)を生成し、
前記情報表示手段は、前記表示情報生成手段により生成された前記第1表示情報及び前記第2表示情報を前記表示部に分けて表示させる。
Also, the text information extraction system to which the present invention is applied is
The terminal includes post-extraction data receiving means (for example, post-extraction data reception processing unit 313 in FIG. 5) for receiving the post-extraction data;
display information generating means for generating display information to be displayed on a display unit of the terminal from the extracted data received by the extracted data receiving means (for example, a display information generation processing unit 314 in FIG. 5);
Information display means for displaying the display information generated by the display information generation means on the display unit (for example, the information display processing unit 315 in FIG. 5);
The display information generating means generates first display information (for example, information displayed in the display area DA2 in FIG. 15) using the information about the extraction position and the information about the character length, and at least the item information to generate second display information (for example, the information displayed in the display area DA3 in FIG. 15),
The information display means divides and displays the first display information and the second display information generated by the display information generation means on the display section.

本発明によれば、抽出位置に関する情報及び文字長さに関する情報を利用した第1表示情報と、項目情報を含む第2表示情報とを表示部に分けて表示させることができる。従って、ユーザーによる確認のし易さ向上に寄与することができる。 According to the present invention, the first display information using the information on the extraction position and the information on the character length and the second display information including the item information can be displayed separately on the display section. Therefore, it is possible to contribute to improvement in ease of confirmation by the user.

また、本発明が適用されるテキスト情報抽出システムは、
前記抽出後データ生成手段は、前記項目情報抽出手段により前記情報抽出された前記項目情報が整合性の取れた情報であるか否かを判断すると共に、前記項目情報が前記整合性の取れていない情報であると判断した場合に、前記端末において警告が出るよう前記抽出後データを生成する。
Also, the text information extraction system to which the present invention is applied is
The post-extraction data generation means determines whether or not the item information extracted by the item information extraction means is consistent information, and determines whether the item information is not consistent. The post-extraction data is generated so that a warning is issued at the terminal when it is determined to be information.

本発明によれば、抽出後データ生成手段は、項目情報の整合性を判断した上で、不整合であれば、送信先の端末で警告を出せるように抽出後データを生成することができる。本発明によれば、項目情報の不整合をチェックすることができる。 According to the present invention, the post-extraction data generation means can generate post-extraction data so that a destination terminal can issue a warning if the item information is inconsistent after judging the consistency of the item information. According to the present invention, inconsistency of item information can be checked.

本発明が適用されるテキスト情報抽出方法は、
テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムが実行するテキスト情報抽出方法であって、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信ステップと、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断ステップと、
前記テキストファイル判断ステップにより前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化ステップと、
前記テキストファイル判断ステップにより判断された、又は、前記テキストファイル化ステップにより前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出ステップと、
前記項目情報抽出ステップにより前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成ステップと、
前記抽出後データ生成ステップにより生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信ステップと、を含む。
The text information extraction method to which the present invention is applied is
A text information extraction method executed by a text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes a file reception step of receiving a transmission file transmitted from the terminal;
a text file determination step of determining whether the transmission file is a text file;
a text file converting step of converting the transmission file into a text file when the text file determining step determines that the transmission file is negative;
Items for extracting item information that matches at least one item from the text data of the text file determined by the text file determination step or converted into the text file by the text file conversion step. an information extraction step;
a post-extraction data generating step of generating post-extraction data including the item information extracted by the item information extraction step;
and a post-extraction data transmission step of transmitting the post-extraction data generated by the post-extraction data generation step to the terminal that transmitted the transmission file.

本発明によれば、テキスト情報抽出システムが実行するテキスト情報抽出方法であることから、作業性の向上を図ることができる。 According to the present invention, since the text information extraction method is executed by the text information extraction system, workability can be improved.

本発明が適用されるプログラムは、
テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムを制御するコンピュータに、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信ステップと、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断ステップと、
前記テキストファイル判断ステップにより前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化ステップと、
前記テキストファイル判断ステップにより判断された、又は、前記テキストファイル化ステップにより前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出ステップと、
前記項目情報抽出ステップにより前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成ステップと、
前記抽出後データ生成ステップにより生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信ステップと、を含む制御処理を実行させる。
A program to which the present invention is applied is
A computer that controls a text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes a file reception step of receiving a transmission file transmitted from the terminal;
a text file determination step of determining whether the transmission file is a text file;
a text file converting step of converting the transmission file into a text file when the text file determining step determines that the transmission file is negative;
Items for extracting item information that matches at least one item from the text data of the text file determined by the text file determination step or converted into the text file by the text file conversion step. an information extraction step;
a post-extraction data generating step of generating post-extraction data including the item information extracted by the item information extraction step;
and a post-extraction data transmission step of transmitting the post-extraction data generated in the post-extraction data generation step to the terminal that transmitted the transmission file.

本発明によれば、テキスト情報抽出システムを制御するコンピュータに上述の制御処理を実行させることから、情報抽出をすることができ、以て作業性の向上を図ることができる。 According to the present invention, the computer that controls the text information extraction system is caused to execute the above-described control processing, so that information can be extracted, and workability can be improved.

1・・・サーバ
2・・・ユーザー
3・・・端末
4・・・ファイルインポート部
11・・・CPU
112・・・ファイル受信処理部(ファイル受信手段)
113・・・テキストファイル判断処理部(テキストファイル判断手段)
114・・・テキストファイル化処理部(テキストファイル化手段)
115・・・データ種類特定処理部(データ種類特定手段)
116・・・項目選択処理部(項目選択手段)
117・・・項目情報抽出処理部(項目情報抽出手段)
118・・・抽出後データ生成処理部(抽出後データ生成手段)
119・・・抽出後データ送信処理部(抽出後データ送信手段)
31・・・CPU
313・・・抽出後データ受信処理部(抽出後データ受信手段)
314・・・表示情報生成処理部(表示情報生成手段)
315・・・情報表示処理部(情報表示手段)
N・・・ネットワーク
1... Server 2... User 3... Terminal 4... File import unit 11... CPU
112 File reception processing unit (file reception means)
113 Text file determination processing unit (text file determination means)
114 Text file conversion processing unit (text file conversion means)
115 Data type identification processing unit (data type identification means)
116 Item selection processing unit (item selection means)
117 Item information extraction processing unit (item information extraction means)
118 ... Post-extraction data generation processing unit (post-extraction data generation means)
119 ... post-extraction data transmission processing unit (post-extraction data transmission means)
31 CPU
313 ... Post-extraction data reception processing unit (post-extraction data reception means)
314 Display information generation processing unit (display information generation means)
315... Information display processing unit (information display means)
N: network

Claims (8)

テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムであって、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信手段と、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断手段と、
前記テキストファイル判断手段により前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化手段と、
前記テキストファイル判断手段により判断された、又は、前記テキストファイル化手段により前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出手段と、
前記項目情報抽出手段により前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成手段と、
前記抽出後データ生成手段により生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信手段と、を備える、テキスト情報抽出システム。
A text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes file receiving means for receiving a transmission file transmitted from the terminal;
Text file determination means for determining whether the transmission file is a text file;
a text file converting means for converting the transmission file into a text file when the text file determining means determines that the transmission file is negative;
An item for extracting item information that matches at least one item from the text data of the text file determined by the text file determination means or converted into the text file by the text file conversion means. information extraction means;
post-extraction data generation means for generating post-extraction data including the item information extracted by the item information extraction means;
and post-extraction data transmission means for transmitting the post-extraction data generated by the post-extraction data generation means to the terminal that transmitted the transmission file.
前記情報処理装置は、前記テキストデータの一部または全部の内容に基づき、前記テキストデータがどのデータ種類のものであるかを特定するデータ種類特定手段と、
前記データ種類特定手段により特定された前記データ種類に対応する前記項目を項目記憶部に記憶された中から選択する項目選択手段と、を更に備える、
請求項1に記載のテキスト情報抽出システム。
The information processing apparatus includes data type identification means for identifying the data type of the text data based on the contents of part or all of the text data;
an item selection means for selecting the item corresponding to the data type specified by the data type specifying means from among items stored in an item storage unit;
The text information extraction system according to claim 1.
前記抽出後データ生成手段は、前記項目情報に関し、前記テキストデータにおける抽出位置に関する情報と、前記抽出位置からの文字長さに関する情報とを紐付けた上で前記抽出後データを生成する、
請求項1又は2に記載のテキスト情報抽出システム。
The post-extraction data generation means generates the post-extraction data after associating information regarding an extraction position in the text data and information regarding a character length from the extraction position with respect to the item information.
3. A text information extraction system according to claim 1 or 2.
前記端末は、前記抽出後データを受信する抽出後データ受信手段と、
前記抽出後データ受信手段により受信した前記抽出後データから前記端末の表示部に表示させる表示情報を生成する表示情報生成手段と、
前記表示情報生成手段により生成された前記表示情報を前記表示部に表示させる情報表示手段と、を備える、
請求項1乃至3のうち何れか1項に記載のテキスト情報抽出システム。
The terminal includes post-extraction data receiving means for receiving the post-extraction data;
display information generation means for generating display information to be displayed on a display unit of the terminal from the post-extraction data received by the post-extraction data reception means;
an information display means for displaying the display information generated by the display information generation means on the display unit;
A text information extraction system according to any one of claims 1 to 3.
前記端末は、前記抽出後データを受信する抽出後データ受信手段と、
前記抽出後データ受信手段により受信した前記抽出後データから前記端末の表示部に表示させる表示情報を生成する表示情報生成手段と、
前記表示情報生成手段により生成された前記表示情報を前記表示部に表示させる情報表示手段と、を備え、
前記表示情報生成手段は、前記抽出位置に関する情報及び前記文字長さに関する情報を利用した第1表示情報を生成すると共に、少なくとも前記項目情報を含む第2表示情報を生成し、
前記情報表示手段は、前記表示情報生成手段により生成された前記第1表示情報及び前記第2表示情報を前記表示部に分けて表示させる、
請求項3に記載のテキスト情報抽出システム。
The terminal includes post-extraction data receiving means for receiving the post-extraction data;
display information generation means for generating display information to be displayed on a display unit of the terminal from the post-extraction data received by the post-extraction data reception means;
information display means for displaying the display information generated by the display information generation means on the display unit;
The display information generating means generates first display information using the information about the extraction position and the information about the character length, and generates second display information including at least the item information,
The information display means divides and displays the first display information and the second display information generated by the display information generation means on the display section.
4. The text information extraction system according to claim 3.
前記抽出後データ生成手段は、前記項目情報抽出手段により前記情報抽出された前記項目情報が整合性の取れた情報であるか否かを判断すると共に、前記項目情報が前記整合性の取れていない情報であると判断した場合に、前記端末において警告が出るよう前記抽出後データを生成する、
請求項1乃至5のうち何れか1項に記載のテキスト情報抽出システム。
The post-extraction data generation means determines whether or not the item information extracted by the item information extraction means is consistent information, and determines whether the item information is not consistent. generating the post-extraction data so that a warning is issued on the terminal when it is determined to be information;
A text information extraction system according to any one of claims 1 to 5.
テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムが実行するテキスト情報抽出方法であって、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信ステップと、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断ステップと、
前記テキストファイル判断ステップにより前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化ステップと、
前記テキストファイル判断ステップにより判断された、又は、前記テキストファイル化ステップにより前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出ステップと、
前記項目情報抽出ステップにより前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成ステップと、
前記抽出後データ生成ステップにより生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信ステップと、を含む、テキスト情報抽出方法。
A text information extraction method executed by a text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes a file reception step of receiving a transmission file transmitted from the terminal;
a text file determination step of determining whether the transmission file is a text file;
a text file converting step of converting the transmission file into a text file when the text file determining step determines that the transmission file is negative;
Items for extracting item information that matches at least one item from the text data of the text file determined by the text file determination step or converted into the text file by the text file conversion step. an information extraction step;
a post-extraction data generating step of generating post-extraction data including the item information extracted by the item information extraction step;
and a post-extraction data transmission step of transmitting the post-extraction data generated in the post-extraction data generation step to the terminal that transmitted the transmission file.
テキストデータから情報抽出が可能な情報処理装置と、前記情報処理装置に接続された一又は複数の端末とを備えるテキスト情報抽出システムを制御するコンピュータに、
前記情報処理装置は、前記端末から送信された送信ファイルを受信するファイル受信ステップと、
前記送信ファイルがテキストファイルであるか否かを判断するテキストファイル判断ステップと、
前記テキストファイル判断ステップにより前記否と判断された場合に前記送信ファイルをテキストファイル化するテキストファイル化ステップと、
前記テキストファイル判断ステップにより判断された、又は、前記テキストファイル化ステップにより前記テキストファイル化された、前記テキストファイルの前記テキストデータの中から、少なくとも1つの項目に合う項目情報を前記情報抽出する項目情報抽出ステップと、
前記項目情報抽出ステップにより前記情報抽出された前記項目情報を含む抽出後データを生成する抽出後データ生成ステップと、
前記抽出後データ生成ステップにより生成された前記抽出後データを、前記送信ファイルを送信した前記端末に送信する抽出後データ送信ステップと、を含む制御処理を実行させるプログラム。
A computer that controls a text information extraction system comprising an information processing device capable of extracting information from text data and one or more terminals connected to the information processing device,
The information processing device includes a file reception step of receiving a transmission file transmitted from the terminal;
a text file determination step of determining whether the transmission file is a text file;
a text file converting step of converting the transmission file into a text file when the text file determining step determines that the transmission file is negative;
Items for extracting item information that matches at least one item from the text data of the text file determined by the text file determination step or converted into the text file by the text file conversion step. an information extraction step;
a post-extraction data generating step of generating post-extraction data including the item information extracted by the item information extraction step;
a post-extraction data transmission step of transmitting the post-extraction data generated in the post-extraction data generation step to the terminal that transmitted the transmission file.
JP2021212252A 2021-12-27 2021-12-27 Text information extracting system, text information extracting method, and program Pending JP2023096460A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021212252A JP2023096460A (en) 2021-12-27 2021-12-27 Text information extracting system, text information extracting method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021212252A JP2023096460A (en) 2021-12-27 2021-12-27 Text information extracting system, text information extracting method, and program

Publications (1)

Publication Number Publication Date
JP2023096460A true JP2023096460A (en) 2023-07-07

Family

ID=87005660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021212252A Pending JP2023096460A (en) 2021-12-27 2021-12-27 Text information extracting system, text information extracting method, and program

Country Status (1)

Country Link
JP (1) JP2023096460A (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09269940A (en) * 1996-03-29 1997-10-14 Sharp Corp Device for extracting date or the like
JP2007122661A (en) * 2005-10-31 2007-05-17 Toshiba Corp Document data processor and document data processing program
JP2016018279A (en) * 2014-07-04 2016-02-01 富士通株式会社 Document file search program, document file search apparatus, document file search method, document information output program, document information output apparatus, and document information output method
WO2019234865A1 (en) * 2018-06-06 2019-12-12 株式会社Pfu Inspection device, control method, and control program
JP2020021469A (en) * 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09269940A (en) * 1996-03-29 1997-10-14 Sharp Corp Device for extracting date or the like
JP2007122661A (en) * 2005-10-31 2007-05-17 Toshiba Corp Document data processor and document data processing program
JP2016018279A (en) * 2014-07-04 2016-02-01 富士通株式会社 Document file search program, document file search apparatus, document file search method, document information output program, document information output apparatus, and document information output method
WO2019234865A1 (en) * 2018-06-06 2019-12-12 株式会社Pfu Inspection device, control method, and control program
JP2020021469A (en) * 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program

Similar Documents

Publication Publication Date Title
Ghasemi et al. The impact of Information Technology (IT) on modern accounting systems
US20090282006A1 (en) Transaction Management
CN108734563B (en) Method for automatically generating intelligent accounting document
Wiatt From the mainframe to the blockchain
US8949612B1 (en) One-to-many electronic signature process
JP2015530689A (en) System and method for providing computer automated adjustable entry
US20170330288A1 (en) Method and system for formatting data from one software application source into a format compatible for importing into another software application
US8527376B1 (en) Income itemization
Doxey The fast close toolkit
JP2002297916A (en) Exchange transaction processing method and its system
JP2023096460A (en) Text information extracting system, text information extracting method, and program
US8280143B1 (en) Method and system for adding check information to an electronic transaction listing
WO2022149222A1 (en) Journalization device, journalization method, journalization display method, and journalization display program
Abdulla et al. Would blockchain disrupt the accounting and auditing professions? An exploratory study in the UAE
Lat Managing Data Integrity for Finance: Discover practical data quality management strategies for finance analysts and data professionals
Prasadhita et al. Development of Accounting Systems Using Blockchain Technology
Misra et al. Modelling change management and risk management in a financial organization due to information system adoption
JP2001312587A (en) Information processor, financial and accounting system, and medium
Sasongko et al. Triple-Entry Accounting Based on Blockchain Technology: How Can It Be Implemented in Indonesia?
KR101861058B1 (en) Customs refund and administrative judgment system using identification code
Ameliyaningsih et al. Review of Tax Coverage in Digital Insurance Companies PT XYZ Case Study
JP7557485B2 (en) Sales management system, sales management method, and sales management program
JP4966624B2 (en) Checklist management method, checklist management device, checklist management system, and checklist management program
JP7693565B2 (en) Order management device, order management method, and order management program
JP7557437B2 (en) Overseas payment operation support device, overseas payment operation support method, and overseas payment operation support program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250620