JP2008171109A - 情報検索システム及び情報検索方法並びにプログラム - Google Patents
情報検索システム及び情報検索方法並びにプログラム Download PDFInfo
- Publication number
- JP2008171109A JP2008171109A JP2007002278A JP2007002278A JP2008171109A JP 2008171109 A JP2008171109 A JP 2008171109A JP 2007002278 A JP2007002278 A JP 2007002278A JP 2007002278 A JP2007002278 A JP 2007002278A JP 2008171109 A JP2008171109 A JP 2008171109A
- Authority
- JP
- Japan
- Prior art keywords
- information
- relationship
- search
- relation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索対象になる文書の登録時、関係解析部2が、上記文書に含まれている固有表現を抽出し、抽出した固有表現間の関係性を示す関係情報を生成し、関係情報登録部3が、関係解析部2で生成された関係情報を関係インデックス記憶装置5に登録しておく。文書の検索時に、ユーザが検索キーを入力すると、検索部7が上記検索キーに適合する関係情報を関係インデックス記憶装置5から検索し、検索結果統合部8が、検索部7で検索された関係情報によって示される固有表現間の関係性を、ネットワーク図を用いてグラフィック表示する。
【選択図】図1
Description
そこで、本発明の第1の目的は、検索キーを入力した後、短時間で検索キーに関連する人名、企業名、製品名などの関係性をユーザが認識できるようにすることにある。
固有表現間の関係性を示す関係情報が登録される関係情報記憶部と、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部と、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部と、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部と、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部とを備えたことを特徴とする。
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
コンピュータを利用して情報を検索する方法であって、
前記コンピュータが、文書の登録時、前記文書に含まれている固有表現を抽出する抽出ステップと、
前記コンピュータが、前記抽出ステップで抽出された固有表現間の関係性を示す関係情報を生成する関係情報生成ステップと、
前記コンピュータが、前記関係情報生成ステップで生成された関係情報を関係情報記憶部に登録する登録ステップと、
前記コンピュータが、検索キーに適合する関係情報を前記関係情報記憶部から検索する検索ステップと、
前記コンピュータが、前記検索ステップで検索された関係情報によって示される固有表現間の関係性をグラフィック表示する表示ステップとを含むことを特徴とする。
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
前記関係情報生成ステップでは、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
前記表示ステップでは、前記検索ステップで検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記表示ステップでは、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記検索ステップでは、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
固有表現間の関係性を示す関係情報が登録される関係情報記憶部を備えたコンピュータを、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部として機能させる。
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする。
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする。
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする。
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする。
検索対象になる文書の登録時、関係解析部が、上記文書に含まれている固有表現を抽出し、抽出した固有表現間の関係性を示す関係情報を生成し、登録部が、関係解析部で生成された関係情報を関係情報記憶部に登録しておく。なお、関係情報には、例えば、関係する固有表現と、その関係内容とが含まれている。
図1を参照すると、本発明にかかる情報検索システム100の実施の形態は、登録文書入力部1と、関係解析部2と、関係情報登録部3と、文書登録部4と、関係インデックス記憶装置5と、文書記憶装置6と、検索部7と、検索結果統合部8と、キーボード等の入力部9と、LCD等の表示部10とから構成されている。
次に、本実施の形態の動作について詳細に説明する。
先ず、検索対象にする文書を登録する場合の動作を説明する。情報検索システム100の管理者は、検索対象にする文書を登録する場合、登録文書入力部1から文書を入力する。
次に、文書検索時の動作について説明する。
本実施の形態によれば、ユーザが検索キーを入力した後、短時間で検索キーに関連する人物、組織、製品(固有表現によって表されている)などの関係性を認識することが可能になる。その理由は、文書の登録時に、関係解析部2が、上記文書に含まれる各固有表現間の関係性を示す関係情報を生成し、関係情報登録部3が、関係解析部2によって生成された関係情報を関係インデックス記憶装置5に登録しておくからである。即ち、本実施の形態では、検索キーが入力された場合、検索部7が検索キーに適合する関係情報を関係インデックス記憶装置5から検索する処理を行い、検索結果統合部8が、検索された関係情報によって示される固有表現間の関係性をグラフィック表示する処理を行うだけで良いので、検索キーが入力されてから、検索キーに適合した各適合文書の現れる固有表現と適合文書群との関連度を計算する処理や、関連度が所定値以上の固有表現間の共起関係を求める処理を行わなければならなかった特許文献1に記載されている情報検索システムに比較して短時間で固有表現間の関係性をグラフィック表示することができ、その結果、ユーザは、短時間で検索キーに関連した人物、組織、製品などの関係性を認識することが可能になる。
なお、上述した実施の形態では、検索部7として、関係インデックス記憶装置5から検索キーに適合する関係情報と文書IDとの対を検索する、検索階層数が1階層の検索部を用いるようにしたが、その代わりに、ユーザによって指定された検索階層数分の検索を行う検索部を使用することもできる。即ち、ユーザによって入力部9から入力された検索キーを用いて第1階層の検索を行い、ユーザによって指定された階層数分の検索を行っていなければ、更に、第1階層で検索された関係情報に含まれている固有表現に関連した検索キーを用いて第2階層の検索を行うというように、ユーザによって指定された検索階層数分の検索を行うまで、検索を続ける検索部を使用するようにしても良い。
本実施の形態では、ユーザによって指定された検索階層数分の検索を行う検索部を使用するので、ユーザが入力した検索キーに関連した固有表現間の関係性だけでなく、上記固有表現の関連した固有表現間の関係性もグラフィック表示することが可能になる。
2…関係解析部
21…自然言語解析部
22…固有表現抽出部
23…関係抽出部
24…表記統一部
3…関係情報登録部
4…文書登録部
5…関係インデックス記憶装置
6…文書記憶装置
7…検索部
8…検索結果統合部
9…入力部
10…表示部
100…情報検索システム
Claims (18)
- 固有表現間の関係性を示す関係情報が登録される関係情報記憶部と、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部と、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部と、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部と、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部とを備えたことを特徴とする情報検索システム。 - 請求項1記載の情報検索システムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする情報検索システム。 - 請求項2記載の情報検索システムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする情報検索システム。 - 請求項2記載の情報検索システムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索システム。 - 請求項4記載の情報検索システムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索システム。 - 請求項1記載の情報検索システムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする情報検索システム。 - コンピュータを利用して情報を検索する方法であって、
前記コンピュータが、文書の登録時、前記文書に含まれている固有表現を抽出する抽出ステップと、
前記コンピュータが、前記抽出ステップで抽出された固有表現間の関係性を示す関係情報を生成する関係情報生成ステップと、
前記コンピュータが、前記関係情報生成ステップで生成された関係情報を関係情報記憶部に登録する登録ステップと、
前記コンピュータが、検索キーに適合する関係情報を前記関係情報記憶部から検索する検索ステップと、
前記コンピュータが、前記検索ステップで検索された関係情報によって示される固有表現間の関係性をグラフィック表示する表示ステップとを含むことを特徴とする情報検索方法。 - 請求項7記載の情報検索方法において、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とする情報検索方法。 - 請求項8記載の情報検索方法において、
前記関係情報生成ステップでは、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とする情報検索方法。 - 請求項8記載の情報検索方法において、
前記表示ステップでは、前記検索ステップで検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索方法。 - 請求項10記載の情報検索方法において、
前記表示ステップでは、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とする情報検索方法。 - 請求項7記載の情報検索方法において、
前記検索ステップでは、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とする情報検索方法。 - 固有表現間の関係性を示す関係情報が登録される関係情報記憶部を備えたコンピュータを、
文書の登録時、前記文書に含まれている固有表現を抽出し、該抽出した固有表現間の関係性を示す関係情報を生成する関係解析部、
該関係解析部で生成された関係情報を前記関係情報記憶部に登録する登録部、
検索キーに適合する関係情報を前記関係情報記憶部から検索する検索部、
該検索部で検索された関係情報によって示される固有表現間の関係性をグラフィック表示する検索結果統合部として機能させるためのプログラム。 - 請求項13記載のプログラムにおいて、
前記関係情報が、関係のある固有表現と、固有表現間の関係内容とを含むことを特徴とするプログラム。 - 請求項14記載のプログラムにおいて、
前記関係解析部が、生成した関係情報に含まれている固有表現の表記の統一処理を行うことを特徴とするプログラム。 - 請求項14記載のプログラムにおいて、
前記検索結果統合部が、前記検索部で検索された各関係情報に主語あるいは目的語として含まれている固有表現をノードによって表し、固有表現間の関係を、ノードを接続するアークと関係内容を示す文字列とによって表したネットワーク図を表示することを特徴とするプログラム。 - 請求項16記載のプログラムにおいて、
前記検索結果統合部が、固有表現間の関係を、ノードを接続するアークと、関係内容を示す文字列と、前記関係内容を修飾する地理情報あるいは時間情報を示す文字列とによって表したネットワーク図を表示することを特徴とするプログラム。 - 請求項13記載のプログラムにおいて、
前記検索部が、検索した関係情報に含まれている固有表現に関連した検索キーを用いた関係情報の検索を、ユーザによって指定された階層数分行うことを特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007002278A JP2008171109A (ja) | 2007-01-10 | 2007-01-10 | 情報検索システム及び情報検索方法並びにプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007002278A JP2008171109A (ja) | 2007-01-10 | 2007-01-10 | 情報検索システム及び情報検索方法並びにプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2008171109A true JP2008171109A (ja) | 2008-07-24 |
Family
ID=39699156
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007002278A Pending JP2008171109A (ja) | 2007-01-10 | 2007-01-10 | 情報検索システム及び情報検索方法並びにプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2008171109A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008225566A (ja) * | 2007-03-08 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置及びその方法 |
| JP2010217973A (ja) * | 2009-03-13 | 2010-09-30 | Toshiba Corp | メンバキーワード関係表示装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05233730A (ja) * | 1992-02-18 | 1993-09-10 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出・表示装置 |
| JP2004110386A (ja) * | 2002-09-18 | 2004-04-08 | Nri & Ncc Co Ltd | 連想検索システム |
-
2007
- 2007-01-10 JP JP2007002278A patent/JP2008171109A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05233730A (ja) * | 1992-02-18 | 1993-09-10 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出・表示装置 |
| JP2004110386A (ja) * | 2002-09-18 | 2004-04-08 | Nri & Ncc Co Ltd | 連想検索システム |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008225566A (ja) * | 2007-03-08 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置及びその方法 |
| JP2010217973A (ja) * | 2009-03-13 | 2010-09-30 | Toshiba Corp | メンバキーワード関係表示装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Welbers et al. | Text analysis in R | |
| Uma et al. | Formation of SQL from natural language query using NLP | |
| US9563656B2 (en) | Method and system to guide formulations of questions for digital investigation activities | |
| Yosef et al. | Aida: An online tool for accurate disambiguation of named entities in text and tables | |
| JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
| JP2006293731A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
| JPWO2005029379A1 (ja) | 情報処理装置及び情報処理方法 | |
| JP2011108085A (ja) | 知識構築装置およびプログラム | |
| CN101350027A (zh) | 内容检索设备和内容检索方法 | |
| Golpar-Rabooki et al. | Feature extraction in opinion mining through Persian reviews | |
| Vintar et al. | Framing karstology: From definitions to knowledge structures and automatic frame population | |
| Byrne et al. | Automatic extraction of archaeological events from text | |
| WO2021049485A1 (ja) | 法律分析装置、及び法律分析方法 | |
| JP2004133564A (ja) | 文書検索装置 | |
| JP2005063185A (ja) | 文書検索システム、質問応答システム、文書検索方法 | |
| JP2008171109A (ja) | 情報検索システム及び情報検索方法並びにプログラム | |
| Maynard et al. | Adapting a robust multi-genre NE system for automatic content extraction | |
| Khan et al. | Keyword Extraction for Medium‐Sized Documents Using Corpus‐Based Contextual Semantic Smoothing | |
| Paris et al. | Linking spatial named entities to the Web of data for geographical analysis of historical texts | |
| JP2005190100A (ja) | 質問応答システムおよび方法 | |
| Kashyap et al. | Insights on Hindi WordNet coming from the IndoWordNet | |
| JP4155970B2 (ja) | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム | |
| CN111723211B (zh) | 一种信息处理方法、装置、电子设备及计算机存储介质 | |
| JP2002140338A (ja) | 辞書構築支援装置および辞書構築支援方法 | |
| JPWO2008114316A1 (ja) | 電子文書管理装置及び電子文書管理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090415 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090909 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090909 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110620 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120207 |