[go: up one dir, main page]

JP2008171109A - Information retrieval system, information retrieval method and program - Google Patents

Information retrieval system, information retrieval method and program Download PDF

Info

Publication number
JP2008171109A
JP2008171109A JP2007002278A JP2007002278A JP2008171109A JP 2008171109 A JP2008171109 A JP 2008171109A JP 2007002278 A JP2007002278 A JP 2007002278A JP 2007002278 A JP2007002278 A JP 2007002278A JP 2008171109 A JP2008171109 A JP 2008171109A
Authority
JP
Japan
Prior art keywords
information
relationship
search
relation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007002278A
Other languages
Japanese (ja)
Inventor
Rie Masuko
理絵 益子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007002278A priority Critical patent/JP2008171109A/en
Publication of JP2008171109A publication Critical patent/JP2008171109A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To display a network diagram showing the relationship between unique expressions (person name or organization name or the like) related to a retrieval key in a short time after the input of the retrieval key. <P>SOLUTION: In the case of registering a document to be retrieved, a relation analyzing part 2 extracts unique expressions included in the document, and generates relation information showing the relationship between the extracted unique expressions, and a relation information registration part 3 registers the relation information generated by the relation analyzing part 2 in a relation index storage device 5. In retrieving the document, when a user inputs a retrieval key, a retrieval part 7 retrieves the relation information adapted to the retrieval key from the relation index storage device 5, and a retrieval result integration part 8 perform the graphic display of the relationship between the unique expressions shown by the relation information retrieved by the retrieval part 7 by using a network diagram. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、文書を検索する情報検索技術に関し、特に、文書の検索時に入力した検索キーに関連する人物、組織、製品などの関係性をユーザが容易に認識することができる情報検索技術に関する。   The present invention relates to an information search technique for searching a document, and more particularly to an information search technique that allows a user to easily recognize the relationship between a person, an organization, a product, and the like related to a search key input when searching for a document.

文書を検索する従来の一般的な情報検索システムは、検索対象文書が登録された文書記憶部と、キーワードとそのキーワードを含んだ検索対象文書の文書IDとが登録されたインデックス記憶部とを備えている。そして、ユーザから検索キーが入力されると、インデックス記憶部から検索キーと同一のキーワードを含んでいる検索対象文書の文書IDを検索してそのリストをユーザに返し、その後、リストを見たユーザによって文書IDが指定されると、文書記憶部から上記文書IDの文書を検索してユーザに返すようにしている。   A conventional general information search system for searching documents includes a document storage unit in which a search target document is registered, and an index storage unit in which a keyword and a document ID of the search target document including the keyword are registered. ing. When the search key is input from the user, the document ID of the search target document including the same keyword as the search key is searched from the index storage unit, and the list is returned to the user. When the document ID is designated by the above, a document with the document ID is retrieved from the document storage unit and returned to the user.

このように、従来の一般的な情報検索システムは、検索キーが入力されたとき、検索キーを含んだ文書の文書IDのリストをユーザに返すだけであった。このため、ユーザは、検索キーに関連する人物、組織、製品などの関係性を認識するためには、実際に文書を読まなければならなかった。   As described above, when a search key is input, the conventional general information search system simply returns a list of document IDs of documents including the search key to the user. For this reason, the user must actually read the document in order to recognize the relationship between the person, organization, product, and the like related to the search key.

このような問題点を解決するため、従来、次のような情報検索システムが提案された(例えば、特許文献1参照)。   In order to solve such problems, the following information search system has been proposed (for example, see Patent Document 1).

特許文献1に記載されている情報検索システムは、複数の検索対象文書が登録された文書データベースと、検索対象文書毎に、その文書に現れる固有表現と文書IDとが対応付けて登録された固有表現データベースとを備えている。ここで、固有表現とは、人名、組織名、製品名、地名などといったカテゴリに含まれる固有名詞や、時間、割合といった単位に伴う数値表現の総称である。   The information search system described in Patent Document 1 is a document database in which a plurality of search target documents are registered, and for each search target document, a unique expression that appears in the document and a document ID that are registered in association with each other. And an expression database. Here, the specific expression is a generic name of numerical expressions associated with units such as proper nouns included in categories such as person names, organization names, product names, and place names, and time and ratio.

そして、特許文献1に記載されている情報検索システムは、ユーザによって検索キーが入力されると、文書データベースから検索キーに適合する文書(適合文書)を複数検索し、更に、各適合文書の文書IDで固有表現データベースを検索することにより、各適合文書に含まれている全ての固有表現を抽出する。次に、抽出した各固有表現と適合文書群との関連度を計算し、関連度が所定値以上の固有表現を含んだ関連固有表現リストを作成する。その後、関連固有表現リストに含まれている固有表現の共起関係を求め、固有表現(人名、企業名、製品名など)をノードとし、共起関係にある固有表現をアークで接続したグラフを表示する。   Then, the information search system described in Patent Document 1 searches a plurality of documents (conforming documents) that match the search key from the document database when a search key is input by the user, and further, documents for each conforming document. By searching the specific expression database by ID, all the specific expressions included in each relevant document are extracted. Next, the degree of association between each extracted unique expression and the corresponding document group is calculated, and a related unique expression list including a specific expression having a degree of association equal to or greater than a predetermined value is created. After that, the co-occurrence relationship of the specific expressions included in the related specific expression list is obtained, and a graph in which the specific expressions (person name, company name, product name, etc.) are used as nodes and the specific expressions in the co-occurrence relation are connected by arcs. indicate.

特開2005−50135号公報Japanese Patent Laid-Open No. 2005-50135

上述した特許文献1に記載されている情報検索システムによれば、ユーザが検索キーを入力することにより、検索キーに適合した適合文書群に現れる固有表現の内の、適合文書群との関連度が高い固有表現(人名、企業名、製品名など)間の関係がグラフによって表示されるので、ユーザは、文書を読まなくとも、検索キーに関連する人名、企業名、製品名などの間の関係性を認識することが可能になる。   According to the information search system described in Patent Document 1 described above, the degree of relevance with the relevant document group among the unique expressions that appear in the relevant document group that matches the search key when the user inputs the search key. Since the relationship between the unique expressions (person name, company name, product name, etc.) with high is displayed by the graph, the user does not read the document, but between the person name, company name, product name, etc. related to the search key It becomes possible to recognize the relationship.

しかし、特許文献1に記載されている情報検索システムは、ユーザによって検索キーが入力されてから、固有表現間の共起関係を表すグラフを表示するまでの間に、検索キーに適合した各適合文書に現れる固有表現と適合文書群との関連度を計算する処理や、関連度が所定値以上の固有表現間の共起関係を求める処理が行われるため、ユーザが検索キーに関連した人名、企業名、製品名などの間の関係を認識するまでに時間がかかってしまうという問題があった。   However, in the information search system described in Patent Document 1, each match that matches the search key after the search key is input by the user until the graph representing the co-occurrence relationship between the specific expressions is displayed. Since the process of calculating the relevance between the specific expressions that appear in the document and the matching document group and the process of obtaining the co-occurrence relationship between the specific expressions whose relevance is a predetermined value or more are performed, There was a problem that it took time to recognize the relationship between the company name, product name, and the like.

また、特許文献1に記載されている情報検索システムは、固有表現間の共起関係を関係内容として表示するが、共起する固有表現の間のつながりの内容については文書を読まないと具体的には分からないという問題がある。   In addition, the information search system described in Patent Document 1 displays the co-occurrence relationship between the unique expressions as the relation contents, but it is concrete that the contents of the connection between the co-occurring specific expressions are not read. Has the problem of not knowing.

〔発明の目的〕
そこで、本発明の第1の目的は、検索キーを入力した後、短時間で検索キーに関連する人名、企業名、製品名などの関係性をユーザが認識できるようにすることにある。
(Object of invention)
Therefore, a first object of the present invention is to allow a user to recognize the relationship between a person name, a company name, a product name, and the like related to a search key in a short time after inputting the search key.

また、本発明の第2の目的は、検索キーに関連する人名、企業名、製品名などの関係性とその関係の内容をユーザが文書を読まずとも認識できるようにすることにある。   A second object of the present invention is to enable the user to recognize the relationship between the search key, such as a person name, company name, and product name, and the contents of the relationship without reading the document.

本発明にかかる第1の情報検索システムは、
固有表現間の関係性を示す関係情報が登録される関係情報記憶部と、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部と、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部と、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部と、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部とを備えたことを特徴とする。
The first information retrieval system according to the present invention is:
A relationship information storage unit in which relationship information indicating the relationship between specific expressions is registered;
A relation analysis unit that extracts a specific expression included in the document at the time of registration of the document, and generates relation information indicating a relation between the extracted specific expressions;
A registration unit for registering the relationship information generated by the relationship analysis unit in the relationship information storage unit;
A search unit that searches the related information storage unit for related information that matches the search key;
And a search result integration unit that graphically displays the relationship between the unique expressions indicated by the relationship information searched by the search unit.

本発明にかかる第2の情報検索システムは、第1の情報検索システムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
A second information search system according to the present invention is the first information search system,
The relation information includes a related specific expression and a relation content between the specific expressions.

本発明にかかる第3の情報検索システムは、第2の情報検索システムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
A third information retrieval system according to the present invention is the second information retrieval system,
The relation analysis unit performs a unified process of notation of a specific expression included in the generated relation information.

本発明にかかる第4の情報検索システムは、第2の情報検索システムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fourth information search system according to the present invention is the second information search system,
The search result integration unit represents a specific expression included as a subject or object in each relationship information searched by the search unit by a node, and a relationship between the specific expressions is expressed by an arc connecting the nodes and a relationship content. A network diagram represented by a character string to be displayed is displayed.

本発明にかかる第5の情報検索システムは、第4の情報検索システムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fifth information search system according to the present invention is the fourth information search system,
A network diagram in which the search result integration unit represents a relationship between specific expressions by an arc connecting nodes, a character string indicating the relationship content, and a character string indicating geographic information or time information for modifying the relationship content. Is displayed.

本発明にかかる第6の情報検索システムは、第1の情報検索システムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
A sixth information search system according to the present invention is the first information search system,
The search unit is configured to search for relation information using a search key related to a specific expression included in the searched relation information for the number of hierarchies designated by the user.

本発明にかかる第1の情報検索方法は、
コンピュータを利用して情報を検索する方法であって、
前記コンピュータが、文書の登録時、前記文書に含まれている固有表現を抽出する抽出ステップと、
前記コンピュータが、前記抽出ステップで抽出された固有表現間の関係性を示す関係情報を生成する関係情報生成ステップと、
前記コンピュータが、前記関係情報生成ステップで生成された関係情報を関係情報記憶部に登録する登録ステップと、
前記コンピュータが、検索キーに適合する関係情報を前記関係情報記憶部から検索する検索ステップと、
前記コンピュータが、前記検索ステップで検索された関係情報によって示される固有表現間の関係性をグラフィック表示する表示ステップとを含むことを特徴とする。
A first information search method according to the present invention is as follows.
A method of searching for information using a computer,
An extraction step in which the computer extracts a specific expression included in the document when registering the document;
A relation information generation step in which the computer generates relation information indicating a relation between the unique expressions extracted in the extraction step;
A registration step in which the computer registers the relationship information generated in the relationship information generation step in a relationship information storage unit;
A search step in which the computer searches the relationship information storage unit for relationship information that matches a search key;
The computer further includes a display step for graphically displaying the relationship between the unique expressions indicated by the relationship information searched in the search step.

本発明にかかる第2の情報検索方法は、第1の情報検索方法において、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
A second information retrieval method according to the present invention is the first information retrieval method,
The relation information includes a related specific expression and a relation content between the specific expressions.

本発明にかかる第3の情報検索方法は、第2の情報検索方法において、
前記関係情報生成ステップでは、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
A third information retrieval method according to the present invention is the second information retrieval method,
In the relationship information generation step, the notation of the unique expression included in the generated relationship information is performed.

本発明にかかる第4の情報検索方法は、第2の情報検索方法において、
前記表示ステップでは、前記検索ステップで検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fourth information search method according to the present invention is the second information search method,
In the display step, a specific expression included as a subject or object in each relationship information searched in the search step is represented by a node, and a relationship between the specific expressions is represented by an arc connecting the nodes and a character indicating the content of the relationship. A network diagram represented by columns is displayed.

本発明にかかる第5の情報検索方法は、第4の情報検索方法において、
前記表示ステップでは、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fifth information retrieval method according to the present invention is the fourth information retrieval method,
In the display step, a network diagram is displayed in which the relationship between the unique expressions is represented by an arc connecting the nodes, a character string indicating the relationship content, and a character string indicating the geographic information or time information for modifying the relationship content. It is characterized by doing.

本発明にかかる第6の情報検索方法は、第1の情報検索方法において、
前記検索ステップでは、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
A sixth information retrieval method according to the present invention is the first information retrieval method,
In the search step, the relationship information search using a search key related to the specific expression included in the searched relationship information is performed for the number of hierarchies designated by the user.

本発明にかかる第1のプログラムは、
固有表現間の関係性を示す関係情報が登録される関係情報記憶部を備えたコンピュータを、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部として機能させる。
The first program according to the present invention is:
A computer including a relationship information storage unit in which relationship information indicating the relationship between specific expressions is registered,
A relation analysis unit that extracts a specific expression included in the document and generates relation information indicating a relation between the extracted specific expressions when the document is registered;
A registration unit for registering the relationship information generated by the relationship analysis unit in the relationship information storage unit;
A search unit for searching related information matching the search key from the related information storage unit;
It is made to function as a search result integration unit that graphically displays the relationship between the unique expressions indicated by the relationship information searched by the search unit.

本発明にかかる第2のプログラムは、第1のプログラムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
The second program according to the present invention is the first program,
The relation information includes a related specific expression and a relation content between the specific expressions.

本発明にかかる第3のプログラムは、第2のプログラムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
A third program according to the present invention is the second program,
The relation analysis unit performs a unified process of notation of a specific expression included in the generated relation information.

本発明にかかる第4のプログラムは、第2のプログラムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fourth program according to the present invention is the second program,
The search result integration unit represents a specific expression included as a subject or object in each relationship information searched by the search unit by a node, and a relationship between the specific expressions is expressed by an arc connecting the nodes and a relationship content. A network diagram represented by a character string to be displayed is displayed.

本発明にかかる第5のプログラムは、第4のプログラムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
A fifth program according to the present invention is the fourth program,
A network diagram in which the search result integration unit represents a relationship between specific expressions by an arc connecting nodes, a character string indicating the relationship content, and a character string indicating geographic information or time information for modifying the relationship content. Is displayed.

本発明にかかる第6のプログラムは、第1のプログラムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
A sixth program according to the present invention is the first program,
The search unit is configured to search for relation information using a search key related to a specific expression included in the searched relation information for the number of hierarchies designated by the user.

〔作用〕
検索対象になる文書の登録時、関係解析部が、上記文書に含まれている固有表現を抽出し、抽出した固有表現間の関係性を示す関係情報を生成し、登録部が、関係解析部で生成された関係情報を関係情報記憶部に登録しておく。なお、関係情報には、例えば、関係する固有表現と、その関係内容とが含まれている。
[Action]
When registering a document to be searched, the relationship analysis unit extracts the specific expressions included in the document, generates relationship information indicating the relationship between the extracted specific expressions, and the registration unit displays the relationship analysis unit. The relationship information generated in step 1 is registered in the relationship information storage unit. Note that the relationship information includes, for example, related unique expressions and the related contents.

文書の検索時に、ユーザが検索キーを入力すると、検索部が上記検索キーに適合する関係情報を関係情報記憶部から検索し、検索結果統合部が、検索部で検索された関係情報によって示される固有表現間の関係性を、例えば、ネットワーク図などを用いてグラフィック表示する。   When a user inputs a search key when searching for a document, the search unit searches the related information storage unit for related information that matches the search key, and the search result integrating unit is indicated by the related information searched by the search unit. The relationship between the specific expressions is displayed graphically using, for example, a network diagram.

本発明によれば、ユーザが検索キーを入力した後、短時間で検索キーに関連する人物、組織、製品(固有表現によって表されている)などの関係性を認識することが可能になる。その理由は、文書の登録時に、上記文書に含まれる各固有表現間の関係性を示す関係情報を生成し、関係情報記憶部に登録しておくからである。即ち、本発明では、検索キーが入力された場合、検索キーに適合する関係情報を関係情報記憶部から検索し、検索された関係情報によって示される固有表現間の関係性をグラフィック表示する処理を行うだけで良いので、検索キーが入力されてから、検索キーに適合した各適合文書の現れる固有表現と適合文書群との関連度を計算する処理や、関連度が所定値以上の固有表現間の共起関係を求める処理を行わなければならなかった特許文献1に記載されている情報検索システムに比較して短時間で固有表現間の関係性をグラフィック表示することができ、その結果、ユーザは、短時間で検索キーに関連した人物、組織、製品などの関係性を認識することが可能になる。   According to the present invention, it is possible to recognize a relationship such as a person, an organization, and a product (represented by a unique expression) related to a search key in a short time after the user inputs the search key. The reason is that, when registering a document, relationship information indicating the relationship between each unique expression included in the document is generated and registered in the relationship information storage unit. That is, according to the present invention, when a search key is input, the relationship information storage unit is searched for the relationship information that matches the search key, and the relationship between the specific expressions indicated by the searched relationship information is displayed graphically. Since the search key is entered, processing to calculate the relevance between the specific expressions that appear in each relevant document that matches the search key and the relevant document group, and between the specific expressions whose relevance is greater than or equal to the specified value. Compared to the information retrieval system described in Patent Document 1 that had to perform the process of obtaining the co-occurrence relationship, the relationship between the unique expressions can be displayed in a graphic in a short time, and as a result, the user can Can recognize the relationship between a person, an organization, a product, and the like related to the search key in a short time.

更に、本発明によれば、検索キーに関連する人名、企業名、製品名などの関係性とその関係の内容をユーザが文書を読まずとも認識することが可能になる。その理由は、関係のある固有表現と、固有表現間の関係内容とを含む関係情報に基づいて、固有表現間の関係性をグラフィック表示するようにしているからである。   Furthermore, according to the present invention, it becomes possible for the user to recognize the relationship between the search key, such as a person name, company name, and product name, and the content of the relationship without reading the document. The reason is that the relationship between the unique expressions is graphically displayed based on the relationship information including the related specific expressions and the relationship contents between the specific expressions.

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。   Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.

〔実施の形態の構成の説明〕
図1を参照すると、本発明にかかる情報検索システム100の実施の形態は、登録文書入力部1と、関係解析部2と、関係情報登録部3と、文書登録部4と、関係インデックス記憶装置5と、文書記憶装置6と、検索部7と、検索結果統合部8と、キーボード等の入力部9と、LCD等の表示部10とから構成されている。
[Description of Configuration of Embodiment]
Referring to FIG. 1, an information retrieval system 100 according to an embodiment of the present invention includes a registered document input unit 1, a relationship analysis unit 2, a relationship information registration unit 3, a document registration unit 4, and a relationship index storage device. 5, a document storage device 6, a search unit 7, a search result integration unit 8, an input unit 9 such as a keyboard, and a display unit 10 such as an LCD.

登録文書入力部1は、検索対象となる自然言語で記述された文書を入力する機能を有する。   The registered document input unit 1 has a function of inputting a document described in a natural language to be searched.

文書登録部4は、登録文書入力部1から入力された文書にユニークな文書IDを付与して文書記憶装置6に登録する機能や、上記文書に付与した文書IDを関係情報登録部3に通知する機能を有する。   The document registration unit 4 gives the document input from the registered document input unit 1 a unique document ID and registers it in the document storage device 6, and notifies the related information registration unit 3 of the document ID assigned to the document. It has the function to do.

関係解析部2は、登録文書入力部1から入力された文書を解析し、その文書に含まれている人名、組織名、製品名、地名、時間などといった固有表現間の関係性を示す関係情報を生成し、生成した関係情報を関係情報登録部3に渡す機能を有する。   The relationship analysis unit 2 analyzes the document input from the registered document input unit 1, and shows relationship information indicating the relationship between specific expressions such as a person name, organization name, product name, place name, and time included in the document. And the generated relationship information is passed to the relationship information registration unit 3.

図2を参照すると、図1に示す関係解析部2の詳細な構成例が示されており、自然言語解析部21と、固有表現抽出部22と、関係抽出部23と、表記統一部24とを備えている。   Referring to FIG. 2, a detailed configuration example of the relationship analysis unit 2 illustrated in FIG. 1 is illustrated. A natural language analysis unit 21, a specific expression extraction unit 22, a relationship extraction unit 23, a notation unification unit 24, and the like. It has.

自然言語解析部21は、登録文書入力部1から入力された文書中の自然言語で記述された各文を解析し、文の係り受け構造の決定、指示代名詞・省略語の解決を行う。自然言語解析部21では、自然言語処理の基本解析である、形態素解析、構文解析、意味解析、文脈解析等を行う。各解析手法は、本発明と直接関係しないので、その詳細な構成は省略する。   The natural language analysis unit 21 analyzes each sentence described in the natural language in the document input from the registered document input unit 1, determines the dependency structure of the sentence, and resolves the pronoun / noun abbreviation. The natural language analysis unit 21 performs basic analysis of natural language processing, such as morphological analysis, syntax analysis, semantic analysis, and context analysis. Since each analysis method is not directly related to the present invention, its detailed configuration is omitted.

固有表現抽出部22は、登録文書入力部1から入力された文書中の各文を解析し、固有表現を抽出する。固有表現抽出部22では、人手で作成した抽出規則、機械学習(最大エントロピー法、隠れマルコフモデル、サポートベクターマシン等) で作成した抽出規則等といった、任意の抽出規則を利用して固有表現を抽出する。固有表現抽出方法については、本発明とは直接関係しないので、その詳細な構成は省略する。   The specific expression extraction unit 22 analyzes each sentence in the document input from the registered document input unit 1 and extracts a specific expression. The specific expression extraction unit 22 extracts a specific expression using an arbitrary extraction rule such as an extraction rule created manually or an extraction rule created by machine learning (maximum entropy method, hidden Markov model, support vector machine, etc.). To do. Since the specific expression extraction method is not directly related to the present invention, its detailed configuration is omitted.

関係抽出部23は、自然言語解析部21によって与えられる、文の係り受け構造情報、具体的な語に置換・挿入された指示代名詞・省略語の情報と、固有表現抽出部22によって与えられる、文中の固有表現情報を用いて、固有表現間の関係性を示す関係情報を生成する。   The relationship extraction unit 23 is provided by the natural language analysis unit 21, the dependency structure information of the sentence, the information of demonstrative pronouns and abbreviations that are replaced / inserted into specific words, and the specific expression extraction unit 22. Using the unique expression information in the sentence, relation information indicating the relationship between the unique expressions is generated.

表記統一部24は、関係抽出部23が生成した関係情報に含まれている固有表現の表記の統一処理を行う。より具体的には、時間を表す固有表現の統一処理や、同義語の統一処理を行う。ここで、時間を表す固有表現の統一処理としては、例えば、年月日を西暦に統一する処理などがある。また、同義語の統一処理としては、例えば、「JOC」などの略号を「日本オリンピック委員会」などの正式名称に統一する処理などがある。   The notation unifying unit 24 performs unification processing of the unique expression included in the relationship information generated by the relationship extracting unit 23. More specifically, unification processing of specific expressions representing time and unification processing of synonyms are performed. Here, as a process for unifying proper expressions representing time, for example, there is a process for unifying year, month and day in the Western calendar. The synonym unifying process includes, for example, a process of unifying an abbreviation such as “JOC” into an official name such as “Japan Olympic Committee”.

図3に、固有表現間の関係性を示す関係情報を例示する。図3には3つの関係情報が例示されている。図3の例では、カテゴリ「地名」、「時間表現」に含まれる固有表現が抽出されていることを仮定して、その他のカテゴリの固有表現であるNamed_Entity1(主語となる固有表現)とNamed_Entity2(目的語となる固有表現)が動作関係を示すActionで関係することを示し、更に、Actionの動作日時がDatetime、動作場所がLocationであることを示している。抽出する関係の内容は、固有表現間の関係を表すものであれば、図3の形式に束縛されない。   FIG. 3 illustrates the relationship information indicating the relationship between the specific expressions. FIG. 3 illustrates three pieces of relationship information. In the example of FIG. 3, assuming that the specific expressions included in the categories “place name” and “time expression” are extracted, the specific expressions of other categories, Named_Entity1 (subject specific expression) and Named_Entity2 ( It indicates that the specific expression (object) is related by an action indicating an action relationship, and further indicates that the action operation date is Datetime and the action location is a location. The content of the relationship to be extracted is not limited to the format shown in FIG. 3 as long as it represents the relationship between the specific expressions.

再び、図1に戻り、関係情報登録部3は、関係解析部2から渡された関係情報と文書登録部4から渡された文書IDとを関係インデックス記憶装置5に登録する。   Referring back to FIG. 1 again, the relationship information registration unit 3 registers the relationship information passed from the relationship analysis unit 2 and the document ID passed from the document registration unit 4 in the relationship index storage device 5.

関係インデックス記憶装置5には、関係情報と、その関係情報を生成する際に使用した文書の文書IDとの対が登録されている。図4に関係インデックス記憶装置5の内容例を示す。同図の例の第1行目は、ビンセント・クラーク氏が、2004/04/01にNNA Org.に所属したことを示す関係情報を含むと共に、この関係情報が文書ID「ID1」の文書に基づいて生成されたことを示している。   In the relation index storage device 5, a pair of relation information and a document ID of a document used when generating the relation information is registered. FIG. 4 shows an example of the contents of the relation index storage device 5. The first line of the example in the figure includes related information indicating that Vincent Clark belonged to NNA Org. On 04/01/2004, and this related information is included in the document with the document ID “ID1”. It is generated based on this.

文書記憶部6には、検索対象となる文書が複数登録されている。なお、各文書にはユニークな文書IDが付与されている。   A plurality of documents to be searched are registered in the document storage unit 6. Each document is given a unique document ID.

検索部7は、入力部9から入力された検索キーに適合する関係情報と文書IDとの対を関係インデックス記憶装置5から検索する機能や、検索した各対に含まれている関係情報を検索結果統合部8に渡す機能や、検索した各対に含まれている文書IDのリストを表示部10に表示する機能を有している。更に、検索部7は、入力部9から入力された文書IDの文書を文書記憶装置6から検索して表示部10に表示する機能を有する。   The search unit 7 searches the relationship index storage device 5 for a pair of relationship information and document ID that matches the search key input from the input unit 9 and searches for the relationship information included in each searched pair. It has a function to pass to the result integration unit 8 and a function to display a list of document IDs included in each searched pair on the display unit 10. Further, the search unit 7 has a function of searching the document storage device 6 for the document with the document ID input from the input unit 9 and displaying the document on the display unit 10.

検索結果統合部8は、検索部7から与えられた各関係情報(検索結果)を解析し、各関係情報によって示される固有表現間の関係性を表すネットワーク図を表示部10に表示する機能を有する。   The search result integration unit 8 has a function of analyzing each relationship information (search result) given from the search unit 7 and displaying a network diagram representing the relationship between the unique expressions indicated by each relationship information on the display unit 10. Have.

なお、情報検索システム100は、コンピュータによって実現可能であり、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータを情報検索システム100として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、関係解析部2、関係情報登録部3、文書登録部4、検索部7、及び検索結果統合部8を実現する。   Note that the information search system 100 can be realized by a computer, and when realized by a computer, for example, is as follows. A disk, a semiconductor memory, and other recording media on which a program for causing a computer to function as the information retrieval system 100 is recorded are prepared, and the computer is caused to read the program. The computer controls the operation of the computer according to the read program, thereby realizing the relationship analysis unit 2, the relationship information registration unit 3, the document registration unit 4, the search unit 7, and the search result integration unit 8 on the computer. .

〔実施の形態の動作の説明〕
次に、本実施の形態の動作について詳細に説明する。
[Description of Operation of Embodiment]
Next, the operation of the present embodiment will be described in detail.

〔文書登録時の動作〕
先ず、検索対象にする文書を登録する場合の動作を説明する。情報検索システム100の管理者は、検索対象にする文書を登録する場合、登録文書入力部1から文書を入力する。
[Operation when registering a document]
First, an operation when registering a document to be searched will be described. The administrator of the information search system 100 inputs a document from the registered document input unit 1 when registering a document to be searched.

これにより、文書登録部4は、図5のフローチャートに示すように、入力された文書にユニークな文書IDを付与して文書記憶装置6に登録し(ステップS51、S52)、その後、文書に付与した文書IDを関係情報登録部3に通知する(ステップS53)。   Thereby, as shown in the flowchart of FIG. 5, the document registration unit 4 assigns a unique document ID to the input document and registers it in the document storage device 6 (steps S51 and S52), and then assigns it to the document. The related document ID is notified to the related information registration unit 3 (step S53).

また、関係解析部2は、登録文書入力部1から文書が入力されると、図6のフローチャートに示すように、入力された文書中の1つの文に注目する(ステップS61)。その後、注目している文に含まれている人名、組織名、製品名、地名、日時といった固有表現どうしの間に存在する関係性を示す関係情報を生成し、更に、関係情報中の固有表現の表記の統一処理を行い、統一処理の済んだ関係情報を関係情報登録部3に渡す(ステップS63、S64)。図3に生成された関係情報の例を示す。図3では、1行に1つの関係情報を示しており、第1行目は「ABC Corp.(組織名)」から「ビンセント・クラーク氏(人名)」への関係として「2006/09/08(日時)」という時期に、「迎える」という関係があるということを表している。   When the document is input from the registered document input unit 1, the relationship analysis unit 2 pays attention to one sentence in the input document as shown in the flowchart of FIG. 6 (step S61). After that, it generates relationship information indicating the relationship that exists between the specific names such as person name, organization name, product name, place name, date and time included in the sentence of interest, and the specific name in the related information And the related information after the unified processing is passed to the related information registration unit 3 (steps S63 and S64). FIG. 3 shows an example of the relationship information generated. In FIG. 3, one relation information is shown in one line, and the first line is "ABC Corp. (organization name)" to "Mr. Vincent Clark (person name)" It shows that there is a relationship of “greeting” at the time of (date).

関係解析部2は、未注目の文がなくなるまで、上述した処理を繰り返し行い、未注目の文がなくなると(ステップS62がYES)、関係情報登録部3に対して終了通知を送る(ステップS65)。   The relationship analysis unit 2 repeatedly performs the above-described processing until there is no unfocused sentence. When there is no unfocused sentence (YES in step S62), an end notification is sent to the relationship information registration unit 3 (step S65). ).

また、関係情報登録部3は、登録文書入力部1から文書が入力されると、図7のフローチャートに示すように、文書ID、終了通知あるいは関係情報が入力されるのを待つ(ステップS71〜S73)。   Further, when the document is input from the registered document input unit 1, the relationship information registration unit 3 waits for input of a document ID, end notification, or relationship information as shown in the flowchart of FIG. 7 (steps S71 to S71). S73).

そして、文書登録部4から文書IDが入力された場合(ステップS71がYES)は、文書ID保持部(図示せず)に上記文書IDを格納し(ステップS76)、その後、ステップS71の処理に戻る。   If a document ID is input from the document registration unit 4 (YES in step S71), the document ID is stored in a document ID holding unit (not shown) (step S76), and then the process of step S71 is performed. Return.

また、関係解析部2から関係情報が渡された場合(ステップS73がYES)は、文書ID保持部に文書IDが保持されているか否かを調べる(ステップS74)。   When the relationship information is passed from the relationship analysis unit 2 (YES in step S73), it is checked whether or not the document ID is held in the document ID holding unit (step S74).

そして、文書IDが保持されていない場合(ステップS74がNO)は、関係解析部2から入力された関係情報を関係情報保持部(図示せず)に格納し(ステップS77)、その後、ステップS71の処理に戻る。   If the document ID is not held (NO in step S74), the relation information input from the relation analysis unit 2 is stored in a relation information holding unit (not shown) (step S77), and then step S71. Return to the process.

これに対して、文書IDが保持されている場合(ステップS74がYES)は、関係解析部2から入力された関係情報と、文書ID保持部に保持されている文書IDとを関係インデックス記憶装置5に登録し(ステップS75)、再び、ステップS71の処理を行う。なお、ステップS75では、関係情報保持部に関係情報が保持されていれば、その関係情報も文書IDと共に関係インデックス記憶装置5に登録する。   On the other hand, when the document ID is held (YES in step S74), the relation index storage device displays the relation information input from the relation analysis unit 2 and the document ID held in the document ID holding unit. 5 (step S75), and the process of step S71 is performed again. In step S75, if related information is held in the related information holding unit, the related information is also registered in the related index storage device 5 together with the document ID.

また、関係解析部2から終了通知が入力された場合(ステップS72がYES)は、関係情報登録部3は、文書ID保持部に保持されている文書IDを削除した後(ステップS79)、処理を終了する。   If an end notification is input from the relationship analysis unit 2 (YES in step S72), the relationship information registration unit 3 deletes the document ID held in the document ID holding unit (step S79), and then performs processing. Exit.

以上の処理により、今回登録した文書に関する関係情報が関係インデックス記憶装置5に登録され、固有表現間の関係性を示す知識が更新される。今、例えば、関係インデックス記憶装置5の内容が図4に示すものであるとすると、関係インデックス記憶装置5に登録されている各関係情報によって表される固有表現間の関係性は、図8(A)に示すものとなる。なお、図8(A)では、ノード間の関係内容を示すアーク上の文字列は図示を省略している。その後、新たな文書の登録時に図3に示す3個の関係情報が関係インデックス記憶装置5に登録されたとすると、関係インデックス記憶装置5に登録されている各関係情報によって表される固有表現間の関係性は、図8(B)に示すものになる。   Through the above processing, the relationship information related to the document registered this time is registered in the relationship index storage device 5, and the knowledge indicating the relationship between the specific expressions is updated. Now, for example, if the contents of the relationship index storage device 5 are as shown in FIG. 4, the relationship between the unique expressions represented by the relationship information registered in the relationship index storage device 5 is as shown in FIG. As shown in A). In FIG. 8A, the character string on the arc indicating the relationship between the nodes is not shown. Thereafter, when the three pieces of relational information shown in FIG. 3 are registered in the relational index storage device 5 at the time of registration of a new document, between the unique expressions represented by the pieces of relational information registered in the relational index storage unit 5 The relationship is as shown in FIG.

〔文書検索時の動作〕
次に、文書検索時の動作について説明する。
[Operation when searching documents]
Next, the operation at the time of document search will be described.

ユーザは、文書を検索する場合、入力部9から検索キーを入力する。検索キーの形式は任意のものとすることができるが、本実施の形態では、図9に示す形式の検索キーを使用する。図9を参照すると、本実施の形態の検索キーでは、検索対象にする固有表現のフレーズと、検索対象にする固有表現が属するカテゴリと、抽出対象とする関係動作の内容と、抽出対象にする固有表現のカテゴリと、抽出対象とする時期範囲とを指定できるようになっている。なお、各項目は、オア条件で複数の条件を指定できるようになっている。例えば、「2004/11/12〜2006/11/12」の期間中に、「人物(人名)」である「ビンセント・クラーク氏」と関係する「人物(人名)」と「組織(名)」の情報を得たい場合、図10に示すような条件を入力する。   When searching for a document, the user inputs a search key from the input unit 9. The search key format can be arbitrary, but in this embodiment, the search key of the format shown in FIG. 9 is used. Referring to FIG. 9, in the search key of this embodiment, the phrase of the specific expression to be searched, the category to which the specific expression to be searched belongs, the contents of the relational operation to be extracted, and the extraction target The category of the specific expression and the time range to be extracted can be specified. Each item can be specified with a plurality of conditions under the OR condition. For example, during the period of “2004/11/12 to 2006/11/12”, “person (person name)” and “organization (name)” related to “person (person name)” “Mr. Vincent Clark” If it is desired to obtain this information, conditions as shown in FIG. 10 are input.

検索部7は、入力部9から検索キーが入力されると、図11のフローチャートに示すように、検索キーに適合する全ての関係情報と文書IDとの対を関係インデックス記憶装置5から検索する(ステップS111)。その後、検索部7は、検索した文書IDのリストを表示部10のリスト表示用の領域に表示し、更に、検索した関係情報のリストを検索結果統合部8に渡す(ステップS112、S113)。   When the search key is input from the input unit 9, the search unit 7 searches the relationship index storage device 5 for all relation information and document ID pairs that match the search key, as shown in the flowchart of FIG. 11. (Step S111). Thereafter, the search unit 7 displays the searched document ID list in the list display area of the display unit 10, and further passes the searched list of related information to the search result integration unit 8 (steps S112 and S113).

検索結果統合部8は、検索部7から関係情報のリストが渡されると、図12のフローチャートに示すように、リストに含まれている関係情報を解析し、関係情報によって示される固有表現間の関係性を示すネットワーク図を表示部10のネットワーク図表示領域に表示する(ステップS121、S122)。本実施の形態では、主語あるいは目的語となる固有表現をノード、固有表現間の動作関係(関係内容)をアーク(動作関係の内容を示す文字列を含む)とし、更に、動作関係を修飾する地理情報と時間情報を該当するアーク上に配置したネットワーク図を表示する。   When a list of relation information is passed from the search section 7, the search result integration section 8 analyzes the relation information included in the list as shown in the flowchart of FIG. A network diagram indicating the relationship is displayed in the network diagram display area of the display unit 10 (steps S121 and S122). In this embodiment, the specific expression that is the subject or object is a node, the operation relationship (relationship content) between the specific representations is an arc (including a character string indicating the content of the operation relationship), and the operation relationship is further modified. A network diagram in which geographical information and time information are arranged on the corresponding arc is displayed.

今、例えば、検索部7から渡された関係情報のリストが図13に示すものであるとすると、検索結果統合部8は、図14に示すネットワーク図を表示部10に表示することになる。このようなネットワーク図を参照することにより、ユーザは、検索キーに関係する人物、組織などの関係性を容易に確認することが可能になる。   Now, for example, if the list of relation information passed from the search unit 7 is as shown in FIG. 13, the search result integration unit 8 displays the network diagram shown in FIG. 14 on the display unit 10. By referring to such a network diagram, the user can easily confirm the relationship between persons, organizations, and the like related to the search key.

また、ユーザは、文書IDのリストに含まれている文書を参照する場合は、入力部9から参照したい文書の文書IDを入力する。検索部7は、文書IDが入力されると、図15のフローチャートに示すように、文書記憶装置6から上記文書IDの付与されている文書を検索し、表示部10に表示する(ステップS151、S152)。   Further, when referring to a document included in the list of document IDs, the user inputs the document ID of the document to be referred to from the input unit 9. When the document ID is input, the search unit 7 searches the document storage device 6 for the document with the document ID and displays it on the display unit 10 as shown in the flowchart of FIG. 15 (step S151, S152).

〔実施の形態の効果〕
本実施の形態によれば、ユーザが検索キーを入力した後、短時間で検索キーに関連する人物、組織、製品(固有表現によって表されている)などの関係性を認識することが可能になる。その理由は、文書の登録時に、関係解析部2が、上記文書に含まれる各固有表現間の関係性を示す関係情報を生成し、関係情報登録部3が、関係解析部2によって生成された関係情報を関係インデックス記憶装置5に登録しておくからである。即ち、本実施の形態では、検索キーが入力された場合、検索部7が検索キーに適合する関係情報を関係インデックス記憶装置5から検索する処理を行い、検索結果統合部8が、検索された関係情報によって示される固有表現間の関係性をグラフィック表示する処理を行うだけで良いので、検索キーが入力されてから、検索キーに適合した各適合文書の現れる固有表現と適合文書群との関連度を計算する処理や、関連度が所定値以上の固有表現間の共起関係を求める処理を行わなければならなかった特許文献1に記載されている情報検索システムに比較して短時間で固有表現間の関係性をグラフィック表示することができ、その結果、ユーザは、短時間で検索キーに関連した人物、組織、製品などの関係性を認識することが可能になる。
[Effect of the embodiment]
According to the present embodiment, it is possible to recognize a relationship such as a person, an organization, or a product (represented by a specific expression) related to the search key in a short time after the user inputs the search key. Become. The reason is that, when the document is registered, the relationship analysis unit 2 generates relationship information indicating the relationship between the unique expressions included in the document, and the relationship information registration unit 3 is generated by the relationship analysis unit 2. This is because the relationship information is registered in the relationship index storage device 5. That is, in this embodiment, when a search key is input, the search unit 7 performs a process of searching the related index storage device 5 for related information that matches the search key, and the search result integrating unit 8 is searched. Since it is only necessary to perform a graphic display of the relationship between the specific expressions indicated by the relationship information, after the search key is entered, the relationship between the specific expressions that appear in each relevant document that matches the search key and the relevant document group Compared to the information retrieval system described in Patent Document 1 in which processing for calculating the degree and processing for obtaining a co-occurrence relationship between specific expressions having a degree of association equal to or greater than a predetermined value must be performed. The relationship between expressions can be displayed graphically. As a result, the user can recognize the relationship between a person, an organization, a product, and the like related to the search key in a short time.

更に、本実施の形態によれば、検索キーに関連する人名、企業名、製品名などの関係性とその関係の内容をユーザが文書を読まずとも認識することが可能になる。その理由は、関係のある固有表現と、固有表現間の関係内容とを含む関係情報に基づいて、固有表現間の関係性をグラフィック表示するようにしているからである。   Furthermore, according to the present embodiment, it becomes possible for the user to recognize the relationship such as a person name, company name, and product name related to the search key and the content of the relationship without reading the document. The reason is that the relationship between the unique expressions is graphically displayed based on the relationship information including the related specific expressions and the relationship contents between the specific expressions.

また、本実施の形態では、関係解析部2が関係情報中の固有表現の表記の統一処理を行うので、文書中では異なる表現になっていた固有表現を関係付けることが可能になる。   Further, in the present embodiment, since the relationship analysis unit 2 performs the unification processing of the unique expressions in the relationship information, it is possible to relate the unique expressions that are different in the document.

〔他の実施の形態〕
なお、上述した実施の形態では、検索部7として、関係インデックス記憶装置5から検索キーに適合する関係情報と文書IDとの対を検索する、検索階層数が1階層の検索部を用いるようにしたが、その代わりに、ユーザによって指定された検索階層数分の検索を行う検索部を使用することもできる。即ち、ユーザによって入力部9から入力された検索キーを用いて第1階層の検索を行い、ユーザによって指定された階層数分の検索を行っていなければ、更に、第1階層で検索された関係情報に含まれている固有表現に関連した検索キーを用いて第2階層の検索を行うというように、ユーザによって指定された検索階層数分の検索を行うまで、検索を続ける検索部を使用するようにしても良い。
[Other Embodiments]
In the above-described embodiment, the search unit 7 is a search unit that searches for a pair of relation information and document ID matching the search key from the relation index storage device 5 and has one search hierarchy. However, instead, a search unit that performs a search for the number of search hierarchies designated by the user can also be used. That is, if the search is performed on the first layer using the search key input from the input unit 9 by the user, and if the search is not performed for the number of layers specified by the user, the relationship retrieved in the first layer is further included. Use a search unit that keeps searching until the number of search hierarchies specified by the user is searched, such as a search of the second hierarchy using a search key related to the specific expression included in the information You may do it.

〔他の実施の形態の効果〕
本実施の形態では、ユーザによって指定された検索階層数分の検索を行う検索部を使用するので、ユーザが入力した検索キーに関連した固有表現間の関係性だけでなく、上記固有表現の関連した固有表現間の関係性もグラフィック表示することが可能になる。
[Effects of other embodiments]
In this embodiment, since a search unit that performs a search for the number of search hierarchies specified by the user is used, not only the relationship between the specific expressions related to the search key input by the user, but also the relationship of the above specific expressions It is also possible to graphically display the relationship between the unique expressions.

本発明は、文書を検索する文書検索システムなどの情報検索システムに適用することができる。   The present invention can be applied to an information retrieval system such as a document retrieval system that retrieves a document.

本発明にかかる情報検索システムの実施の形態の構成例を示すブロック図である。It is a block diagram which shows the structural example of embodiment of the information search system concerning this invention. 関係解析部2の構成例を示すブロック図である。3 is a block diagram illustrating a configuration example of a relationship analysis unit 2. FIG. 関係情報の一例を示す図である。It is a figure which shows an example of relationship information. 関係インデックス記憶装置5の内容例を示す図である。It is a figure which shows the example of the content of the relationship index memory | storage device 5. FIG. 文書登録部4の処理例を示すフローチャートである。6 is a flowchart illustrating a processing example of a document registration unit 4. 関係解析部2の処理例を示すフローチャートである。5 is a flowchart illustrating a processing example of a relationship analysis unit 2. 関係情報登録部3の処理例を示すフローチャートである。5 is a flowchart illustrating a processing example of a relationship information registration unit 3. 関係インデックス記憶装置5に関係情報が登録されることにより、固有表現間の関係性を表す知識が蓄積されることを示す図である。It is a figure which shows that the knowledge showing the relationship between specific expressions is accumulate | stored by registering relationship information in the relationship index memory | storage device 5. FIG. 検索キーの形式の一例を示す図である。It is a figure which shows an example of the format of a search key. 検索キーの具体例を示す図である。It is a figure which shows the specific example of a search key. 検索キーが入力されたときの検索部7の処理例を示すフローチャートである。It is a flowchart which shows the process example of the search part 7 when a search key is input. 検索結果統合部8の処理例を示すフローチャートである。10 is a flowchart illustrating a processing example of a search result integration unit 8. 検索部7で検索された関係情報の一例を示す図である。It is a figure which shows an example of the relationship information searched in the search part. 図13の関係情報によって示される固有表現間の関係性を表すネットワーク図である。It is a network diagram showing the relationship between the specific expressions shown by the relationship information of FIG. 文書IDが入力されたときの検索部7の処理例を示す図である。It is a figure which shows the example of a process of the search part 7 when document ID is input.

符号の説明Explanation of symbols

1…登録文書入力部
2…関係解析部
21…自然言語解析部
22…固有表現抽出部
23…関係抽出部
24…表記統一部
3…関係情報登録部
4…文書登録部
5…関係インデックス記憶装置
6…文書記憶装置
7…検索部
8…検索結果統合部
9…入力部
10…表示部
100…情報検索システム
DESCRIPTION OF SYMBOLS 1 ... Registered document input part 2 ... Relation analysis part 21 ... Natural language analysis part 22 ... Specific expression extraction part 23 ... Relation extraction part 24 ... Notation unification part 3 ... Relation information registration part 4 ... Document registration part 5 ... Relation index memory | storage device 6 ... Document storage device 7 ... Search unit 8 ... Search result integration unit 9 ... Input unit 10 ... Display unit 100 ... Information search system

Claims (18)

固有表現間の関係性を示す関係情報が登録される関係情報記憶部と、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部と、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部と、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部と、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部とを備えたことを特徴とする情報検索システム。
A relationship information storage unit in which relationship information indicating the relationship between specific expressions is registered;
A relation analysis unit that extracts a specific expression included in the document at the time of registration of the document, and generates relation information indicating a relation between the extracted specific expressions;
A registration unit for registering the relationship information generated by the relationship analysis unit in the relationship information storage unit;
A search unit that searches the related information storage unit for related information that matches the search key;
An information search system comprising: a search result integration unit that graphically displays a relationship between specific expressions indicated by the relationship information searched by the search unit.
請求項1記載の情報検索システムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする情報検索システム。
The information search system according to claim 1,
The information search system, wherein the relation information includes a related specific expression and a relation content between the specific expressions.
請求項2記載の情報検索システムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする情報検索システム。
The information search system according to claim 2,
The information search system, wherein the relation analysis unit performs a unified process of notation of a specific expression included in the generated relation information.
請求項2記載の情報検索システムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索システム。
The information search system according to claim 2,
The search result integration unit represents a specific expression included as a subject or object in each relationship information searched by the search unit by a node, and a relationship between the specific expressions is expressed by an arc connecting the nodes and a relationship content. An information search system for displaying a network diagram represented by a character string to be displayed.
請求項4記載の情報検索システムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索システム。
The information search system according to claim 4,
A network diagram in which the search result integration unit represents a relationship between specific expressions by an arc connecting nodes, a character string indicating the relationship content, and a character string indicating geographic information or time information for modifying the relationship content. An information retrieval system characterized by displaying
請求項1記載の情報検索システムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする情報検索システム。
The information search system according to claim 1,
The information search system, wherein the search unit searches for related information using a search key related to a specific expression included in the searched related information for the number of hierarchies designated by the user.
コンピュータを利用して情報を検索する方法であって、
前記コンピュータが、文書の登録時、前記文書に含まれている固有表現を抽出する抽出ステップと、
前記コンピュータが、前記抽出ステップで抽出された固有表現間の関係性を示す関係情報を生成する関係情報生成ステップと、
前記コンピュータが、前記関係情報生成ステップで生成された関係情報を関係情報記憶部に登録する登録ステップと、
前記コンピュータが、検索キーに適合する関係情報を前記関係情報記憶部から検索する検索ステップと、
前記コンピュータが、前記検索ステップで検索された関係情報によって示される固有表現間の関係性をグラフィック表示する表示ステップとを含むことを特徴とする情報検索方法。
A method of searching for information using a computer,
An extraction step in which the computer extracts a specific expression included in the document when registering the document;
A relation information generation step in which the computer generates relation information indicating a relation between the unique expressions extracted in the extraction step;
A registration step in which the computer registers the relationship information generated in the relationship information generation step in a relationship information storage unit;
A search step in which the computer searches the relationship information storage unit for relationship information that matches a search key;
An information search method comprising: a display step in which the computer graphically displays a relationship between specific expressions indicated by the relationship information searched in the search step.
請求項7記載の情報検索方法において、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする情報検索方法。
The information search method according to claim 7,
The information search method, wherein the relation information includes a related specific expression and a relation content between the specific expressions.
請求項8記載の情報検索方法において、
前記関係情報生成ステップでは、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする情報検索方法。
The information search method according to claim 8, wherein
In the relation information generation step, an unification process of notation of specific expressions included in the generated relation information is performed.
請求項8記載の情報検索方法において、
前記表示ステップでは、前記検索ステップで検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索方法。
The information search method according to claim 8, wherein
In the display step, a specific expression included as a subject or object in each relationship information searched in the search step is represented by a node, and a relationship between the specific expressions is represented by an arc connecting the nodes and a character indicating the content of the relationship. An information retrieval method, characterized by displaying a network diagram represented by columns.
請求項10記載の情報検索方法において、
前記表示ステップでは、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索方法。
The information search method according to claim 10,
In the display step, a network diagram is displayed in which the relationship between the unique expressions is represented by an arc connecting the nodes, a character string indicating the relationship content, and a character string indicating the geographic information or time information for modifying the relationship content. An information retrieval method characterized by:
請求項7記載の情報検索方法において、
前記検索ステップでは、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする情報検索方法。
The information search method according to claim 7,
In the retrieval step, the retrieval of the relation information using the retrieval key related to the specific expression included in the retrieved relation information is performed for the number of hierarchies designated by the user.
固有表現間の関係性を示す関係情報が登録される関係情報記憶部を備えたコンピュータを、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部として機能させるためのプログラム。
A computer including a relationship information storage unit in which relationship information indicating the relationship between specific expressions is registered,
A relation analysis unit that extracts a specific expression included in the document and generates relation information indicating a relation between the extracted specific expressions when the document is registered;
A registration unit for registering the relationship information generated by the relationship analysis unit in the relationship information storage unit;
A search unit for searching related information matching the search key from the related information storage unit;
A program for functioning as a search result integration unit that graphically displays the relationship between specific expressions indicated by the relationship information searched by the search unit.
請求項13記載のプログラムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とするプログラム。
The program according to claim 13, wherein
The program characterized in that the relation information includes a related specific expression and a relation content between the specific expressions.
請求項14記載のプログラムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とするプログラム。
The program according to claim 14, wherein
A program characterized in that the relation analysis unit performs a unified process of notation of a specific expression included in the generated relation information.
請求項14記載のプログラムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とするプログラム。
The program according to claim 14, wherein
The search result integration unit represents a specific expression included as a subject or object in each relationship information searched by the search unit by a node, and a relationship between the specific expressions is expressed by an arc connecting the nodes and a relationship content. A program that displays a network diagram represented by a character string to be displayed.
請求項16記載のプログラムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とするプログラム。
The program according to claim 16, wherein
A network diagram in which the search result integration unit represents a relationship between specific expressions by an arc connecting nodes, a character string indicating the relationship content, and a character string indicating geographic information or time information for modifying the relationship content. A program characterized by displaying.
請求項13記載のプログラムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とするプログラム。
The program according to claim 13, wherein
A program characterized in that the search unit searches for relation information using a search key related to a specific expression included in the searched relation information for the number of hierarchies designated by the user.
JP2007002278A 2007-01-10 2007-01-10 Information retrieval system, information retrieval method and program Pending JP2008171109A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007002278A JP2008171109A (en) 2007-01-10 2007-01-10 Information retrieval system, information retrieval method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007002278A JP2008171109A (en) 2007-01-10 2007-01-10 Information retrieval system, information retrieval method and program

Publications (1)

Publication Number Publication Date
JP2008171109A true JP2008171109A (en) 2008-07-24

Family

ID=39699156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007002278A Pending JP2008171109A (en) 2007-01-10 2007-01-10 Information retrieval system, information retrieval method and program

Country Status (1)

Country Link
JP (1) JP2008171109A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225566A (en) * 2007-03-08 2008-09-25 Nippon Telegr & Teleph Corp <Ntt> Related information extraction apparatus and method
JP2010217973A (en) * 2009-03-13 2010-09-30 Toshiba Corp Member keyword relation display

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233730A (en) * 1992-02-18 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> Related information extraction / display device
JP2004110386A (en) * 2002-09-18 2004-04-08 Nri & Ncc Co Ltd Associative search system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05233730A (en) * 1992-02-18 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> Related information extraction / display device
JP2004110386A (en) * 2002-09-18 2004-04-08 Nri & Ncc Co Ltd Associative search system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225566A (en) * 2007-03-08 2008-09-25 Nippon Telegr & Teleph Corp <Ntt> Related information extraction apparatus and method
JP2010217973A (en) * 2009-03-13 2010-09-30 Toshiba Corp Member keyword relation display

Similar Documents

Publication Publication Date Title
Welbers et al. Text analysis in R
Uma et al. Formation of SQL from natural language query using NLP
US9563656B2 (en) Method and system to guide formulations of questions for digital investigation activities
Yosef et al. Aida: An online tool for accurate disambiguation of named entities in text and tables
JP5229226B2 (en) Information sharing system, information sharing method, and information sharing program
JP2006293731A (en) Question answering system, data retrieval method, and computer program
JPWO2005029379A1 (en) Information processing apparatus and information processing method
JP2011108085A (en) Knowledge construction device and program
CN101350027A (en) Content retrieval device and content retrieval method
Golpar-Rabooki et al. Feature extraction in opinion mining through Persian reviews
Vintar et al. Framing karstology: From definitions to knowledge structures and automatic frame population
Byrne et al. Automatic extraction of archaeological events from text
WO2021049485A1 (en) Legal analyzer and legal analysis method
JP2004133564A (en) Document search device
JP2005063185A (en) Document search system, question answering system, document search method
JP2008171109A (en) Information retrieval system, information retrieval method and program
Maynard et al. Adapting a robust multi-genre NE system for automatic content extraction
Khan et al. Keyword Extraction for Medium‐Sized Documents Using Corpus‐Based Contextual Semantic Smoothing
Paris et al. Linking spatial named entities to the Web of data for geographical analysis of historical texts
JP2005190100A (en) Question answering system and method
Kashyap et al. Insights on Hindi WordNet coming from the IndoWordNet
JP4155970B2 (en) Information processing apparatus, synonym database generation method, and synonym database generation program
CN111723211B (en) Information processing method, device, electronic device and computer storage medium
JP2002140338A (en) Dictionary construction support device and dictionary construction support method
JPWO2008114316A1 (en) Electronic document management apparatus and electronic document management program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090415

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090909

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110620

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120207