JP2003216634A - 情報検索システム - Google Patents
情報検索システムInfo
- Publication number
- JP2003216634A JP2003216634A JP2002018239A JP2002018239A JP2003216634A JP 2003216634 A JP2003216634 A JP 2003216634A JP 2002018239 A JP2002018239 A JP 2002018239A JP 2002018239 A JP2002018239 A JP 2002018239A JP 2003216634 A JP2003216634 A JP 2003216634A
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- information
- search
- search word
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
テムの提供 【解決手段】同義語・類義語辞書は、同義語又は類義
語とされる語句を、予め関連付けて記憶している辞書で
ある。例えば、「紙詰まり」と「JAM」とが同義語又は
類義語として記録される。同義語・類義語辞書サーバ
ー21は、ハードディスク43に記録している同義語・
類義語辞書データベースDB1から取得したユーザーID
に対応する同義語・類義語辞書を取得し、この同義語・
類義語辞書に基づいて同義語・類義語の存在の有無を判
断する。検索サーバー23は、同義語・類義語辞書サ
ーバー21からキーワードに関連する同義語・類義語を
取得し、検索の結果とともに、ユーザー端末27へ送信
する。これにより、ユーザーは、容易に同義語・類義語
を知ることができ、検索結果に満足するものが含まれて
いない場合には、同義語・類義語に基づいた新たな検索
を行うことができる。
Description
に関し、特に、検索語に関する同義語・類義語辞書を利
用して検索効率を向上させるものに関する。
ト、イントラネットブームにより情報量が急増してい
る。こうしたある種の情報洪水の中で鮮度の高い付加価
値ある情報をタイムリーに探し出すことが重要なポイン
トになってきている。これらの膨大な情報から高速に必
要な情報を検索する為に超高速全文検索エンジンを組み
込んだアプリケーションが開発されている。例えば、イ
ンターネット上に存在するホームページを検索するため
に利用される検索サイトがそれである。
図28に示す。検索画面には、検索のためのキーワード
を記述・入力するためのキーワード記述領域A100が
表示されている。検索しようとするユーザー(以下、検
索者とする。)は、キーボード等を利用して、自らが検
索しようとする情報に関連するキーワードを、キーワー
ド記述領域A100に記述する。
選択する。これにより、検索サイトにおいて情報の検索
が行われる。検索者は、検索の結果を手に入れることが
でき、所望の情報を取得することができる。
イトには、以下に示すような問題点がある。検索サイト
においては、全文検索システムを利用している。この全
文検索システムの特徴は検索者が思い付いた言葉で検索
できるいわゆるフリーワード検索にある。
意味でも表記が異なる同義語・類義語が多数出現してい
る。検索者は、これら同義語の検索漏れを防ぐ為に、自
分で思い付いた検索語の同義語を考え、それらを含める
ORの検索式を作り検索を実行しなければならない。
を考える。一般的な乗用車の型で「セダン」があるが、
これはアメリカ式の乗用車の言い方で、同じ乗用車でも
イギリスなら「サルーン」、フランスでは「ベルリー
ヌ」、イタリアでは「ベルリーナ」、ドイツでは「リム
ジン」と呼ばれている。つまり、「セダン」で検索を行
うと、他の「サルーン」等の記事は、検索結果から漏れ
てしまうことになる。
する必要があり、検索作業が非常に煩雑なものとなる、
という問題点がある。また、検索者が自らどれ程の同義
語を想像できるかによって検索結果が大きく左右され、
所望する情報を獲得するまでに、何度も試行錯誤を繰り
返さなければならない、という問題点がある。
望の情報を獲得することができる情報検索システムの提
供を目的とする。
本発明に係る情報検索システムでは、前記通信装置は、
検索語情報を送信し、前記同義語・類義語抽出装置は、
前記検索語情報を獲得し、語句に対応する同義語若しく
は類義語が記録されている同義語・類義語辞書から、獲
得した検索語情報に対応する同義語若しくは類義語を、
対応同義語・類義語情報として抽出し、抽出した前記対
応同義語・類義語情報を送信し、前記検索結果情報生成
装置は、検索語情報を獲得し、獲得した前記検索語情報
に基づいて情報の検索を行い、検索結果情報を生成し、
前記対応同義語・類義語情報を獲得し、生成した前記検
索結果情報及び獲得した前記対応同義語・類義語情報に
基づいて統合検索結果情報を生成し、生成した統合検索
結果情報を送信する。
得することができるとともに、検索語情報に関する同義
語・類義語情報を獲得することができる。従って、検索
結果情報に所望する情報が存在しなかった場合、獲得し
た同義語・類義語情報に基づいて新たな検索を行うこと
ができるので、所望の情報を獲得することができる可能
性が高くなる。
は、前記通信装置は、検索語情報を送信し、前記同義語
・類義語抽出装置は、前記検索語情報を獲得し、語句に
対応する同義語若しくは類義語が記録されている同義語
・類義語辞書から、獲得した検索語情報に対応する同義
語若しくは類義語を、対応同義語・類義語情報として抽
出し、抽出した前記対応同義語・類義語情報を送信す
る。
る同義語・類義語情報を獲得することができる。従っ
て、獲得した同義語・類義語情報に基づいて新たな検索
を行うことができるので、所望の情報を獲得することが
できる可能性が高くなる。
置、同義語・類義語抽出用プログラム、及び同義語・類
義語抽出用プログラムを記録した記録媒体では、検索語
情報を獲得し、語句に対応する同義語若しくは類義語が
記録されている同義語・類義語辞書から、獲得した検索
語情報に対応する同義語若しくは類義語を、対応同義語
・類義語情報として抽出し、抽出した前記対応同義語・
類義語情報を送信する。
る同義語・類義語情報を獲得することができる。従っ
て、獲得した同義語・類義語情報に基づいて新たな検索
を行うことができるので、所望の情報を獲得することが
できる可能性が高くなる。
義語・類義語抽出装置、同義語・類義語抽出装置用プロ
グラム、及び同義語・類義語抽出用プログラムを記録し
た記録媒体では、前記同義語・類義語抽出装置は、情報
の検索を行う検索者を識別するための識別情報を受信
し、当該識別情報に対応する同義語・類義語辞書から対
応同義語・類義語情報を抽出する。
義語辞書から抽出された同義語・類義語情報を獲得する
ことができる。従って、獲得した同義語・類義語情報に
基づいて、より検索者が望む検索を行うことができる。
義語・類義語抽出装置、同義語・類義語抽出装置用プロ
グラム、及び同義語・類義語抽出用プログラムを記録し
た記録媒体では、前記同義語・類義語抽出装置は、情報
の検索を行う検索者を特定するための識別情報を受信
し、前記識別情報に対応する同義語・類義語辞書が存在
しないと判断した場合には、汎用同義語・類義語辞書か
ら前記対応同義語・類義語情報を抽出する。
語辞書から抽出された同義語・類義語情報を獲得するこ
とができる。従って、獲得した同義語・類義語情報に基
づいて、検索者はより幅広い検索を行うことができる。
置、検索結果情報生成用プログラム、及び検索結果情報
生成用プログラムを記録した記録媒体では、検索語情報
を獲得し、獲得した前記検索語情報に基づいた情報の検
索を行い、検索結果情報を生成し、語句に対応する同義
語若しくは類義語が記録されている同義語・類義語辞書
から、当該検索語情報に対応する同義語若しくは類義語
として抽出された対応同義語・類義語情報を獲得し、生
成した前記検索結果情報及び獲得した前記対応同義語・
類義語情報に基づいて同義語・類義語情報を生成し、生
成した同義語・類義語情報を送信する。
得することができるとともに、検索語情報に関する同義
語・類義語情報を獲得することができる。従って、検索
結果情報に所望する情報が存在しなかった場合、獲得し
た同義語・類義語情報に基づいて新たな検索を行うこと
ができるので、所望の情報を獲得することができる可能
性が高くなる。
索結果情報生成装置、検索結果情報生成用プログラム、
及び検索結果情報生成用プログラムを記録した記録媒体
では、前記検索結果情報生成装置は、前記対応同義語・
類義語情報に含まれる同義語若しくは類義語から、一又
は複数の同義語若しくは類義語の選択を可能とし、当該
選択に基づき選択同義語・類義語情報を生成するよう
に、前記統合検索結果情報を生成する。
報から必要なもののみを選択することができる。従っ
て、検索者は、選択した同義語・類義語情報に基づい
て、より容易に情報の検索を行うことができる。
索結果情報生成装置、検索結果情報生成用プログラム、
及び検索結果情報生成用プログラムを記録した記録媒体
では、前記検索結果情報生成装置は、前記選択同義語・
類義語情報を獲得すると、当該選択同義語・類義語情報
に含まれる同義語若しくは類義語に基づいて、情報の検
索を行う。
報から必要なもののみを選択し、選択した同義語・類義
語情報に基づいた検索を行うことができる。従って、検
索者は、より容易に情報の検索を行うことができる。
義語・類義語抽出装置、同義語・類義語抽出用プログラ
ム、及び同義語・類義語抽出用プログラムを記録した記
録媒体では、前記同義語・類義語抽出装置は、前記選択
同義語・類義語情報を獲得すると、当該選択同義語・類
義語情報に含まれない同義語・類義語情報を当該同義語
・類義語情報から削除する。
なかった同義語・類義語情報を削除する事ができる。従
って、利用する同義語・類義語情報のみを同義語・類義
語辞書に記録しておくことができる。
同義語・類義語抽出装置、同義語・類義語抽出用プログ
ラム、及び同義語・類義語抽出用プログラムを記録した
記録媒体では、前記同義語・類義語抽出装置は、前記選
択同義語・類義語情報を獲得すると、当該選択同義語・
類義語情報に含まれない同義語・類義語情報に関する非
選択回数を更新し、当該非選択回数に基づいて、当該選
択同義語・類義語情報に含まれない同義語・類義語情報
を前記同義語・類義語情報から削除する。
義語・類義語情報を削除することができる。従って、利
用する同義語・類義語情報のみを同義語・類義語辞書に
記録することができる。
生成装置では、検索において、第1の検索語情報及び第
2の検索語情報を獲得し、他の検索において、前記第1
の検索語情報及び第2の検索語情報を獲得した場合、当
該第1の検索語情報と第2の検索語情報とを同義語若し
くは類義語と判断し、前記第1の検索語情報と第2の検
索語情報とを関連付けて、同義語・類義語辞書に記録す
る。
情報及び第2の検索語情報を、同義語・類義語辞書に記
録することができる。従って、より利用価値の高い同義
語・類義語辞書を生成することができる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、同義語・類義語辞書生成装置は、ある検索と他
の検索とが、同じ検索者によって行われた場合に、前記
第1の検索語情報と第2の検索語情報とを関連付けて、
同義語・類義語辞書に記録する。
いて第1の検索語情報及び第2の検索語情報を使用した
場合に、第1の検索語情報と第2の検索語情報とを関連
づけて記録する。従って、検索者は、より自らの使用の
度合いに応じた第1の検索語情報と第2の検索語情報と
を記録する同義語・類義語辞書を獲得することができ
る。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、同義語・類義語辞書生成装置は、所定の検索に
おいて検索者に関する識別情報を獲得し、最初に前記第
1の検索語情報及び第2の検索語情報を獲得した検索に
おいて獲得した識別情報と他の検索において獲得した識
別情報とが同じ場合に、当該他の検索において、前記第
1の検索語情報及び第2の検索語情報を獲得すると、当
該第1の検索語情報と第2の検索語情報とを同義語若し
くは類義語と判断し、前記第1の検索語情報と第2の検
索語情報とを関連付けて、同義語・類義語辞書に記録す
る。
者であるか否かを判断できるので、容易に、検索者の使
用の度合いに応じた第1の検索語情報と第2の検索語情
報とを記録する同義語・類義語辞書を獲得することがで
きる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、検索者毎
に同義語・類義語辞書を有しており、前記第1の検索語
情報と第2の検索語情報とを関連付けて同義語・類義語
辞書に記録する際に、獲得した識別情報に対応する検索
者の同義語・類義語辞書に当該第1の検索語情報と第2
の検索語情報とを関連付けて記録する。
辞書を生成することができる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、ある検索
と他の検索とが、異なる検索者によって行われた場合
に、前記第1の検索語情報と第2の検索語情報とを関連
付けて、同義語・類義語辞書に記録する。
いて第1の検索語情報及び第2の検索語情報を使用した
場合だけでなく、他の検索者が検索において第1の検索
語情報及び第2の検索語情報を使用した場合に、第1の
検索語情報と第2の検索語情報とを関連づけて記録す
る。従って、検索者は、多くの検索者に使用されやすい
第1の検索語情報と第2の検索語情報とを記録する同義
語・類義語辞書を獲得することができる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、所定の検
索において検索者に関する識別情報を獲得し、最初に前
記第1の検索語情報及び第2の検索語情報を獲得した検
索において獲得した識別情報と他の検索において獲得し
た識別情報とが異なる場合に、当該他の検索において、
前記第1の検索語情報及び第2の検索語情報を獲得する
と、当該第1の検索語情報と第2の検索語情報とを同義
語若しくは類義語と判断し、前記第1の検索語情報と第
2の検索語情報とを関連付けて、同義語・類義語辞書に
記録する。
することができる。従って、容易に多くの検索者に使用
されやすい第1の検索語情報と第2の検索語情報とを記
録する同義語・類義語辞書を生成することができる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、前記第1
の検索語情報と第2の検索語情報とを関連付けて同義語
・類義語辞書に記録する際に、汎用同義語・類義語辞書
に当該第1の検索語情報と第2の検索語情報とを関連付
けて記録する。
る汎用同義語・類義語辞書を容易に生成することができ
る。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、前記第1
の検索語情報と第2の検索語情報とを同義語若しくは類
義語と判断する際に、電子辞書から当該第1の検索語情
報及び第2の検索語情報に対応する電子辞書情報を、そ
れぞれ第1の電子辞書情報、第2の電子辞書情報として
抽出し、抽出した第1の電子辞書情報と第2の電子辞書
情報に基づいて、前記第1の検索語情報と前記第2の検
索語情報との近似性を算出し、算出した近似性が所定の
値以上の場合、前記第1の検索語情報と第2の検索語情
報とを同義語若しくは類義語と判断する。
索語情報との近似性を容易に算出することができる。従
って、より容易に同義語・類義語辞書を生成することが
できる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、前記電子
辞書に前記第1の電子辞書情報及び第2の電子辞書情報
が存在しない場合、当該第1の検索語情報及び第2の検
索語情報に基づいて、前記第1の検索語情報と前記第2
の検索語情報に関する出現率を算出し、前出した出現率
が所定の条件を満たす場合に、前記第1の検索語情報と
第2の検索語情報とを同義語若しくは類義語と判断す
る。
及び第2の検索語情報に対応する情報が存在しない場合
でも、容易に同義語・類義語辞書を生成することができ
る。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、前記同義語・類義語辞書生成装置は、前記出現
率を、全ての検索回数及び前記第1の検索語情報及び前
記第2の検索語情報を取得した回数に基づいて算出す
る。
及び第2の検索語情報に対応する情報が存在しない場合
でも、容易に同義語・類義語辞書を生成することができ
る。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、一連の検索において、さらに、検索条件情報を
獲得し、獲得した検索条件情報が、前記第1の検索語情
報と前記第2の検索語情報とをand条件により検索を行
う旨のものであった場合、他の一連の検索において、前
記第1の検索語情報及び第2の検索語情報を獲得した場
合でも、当該第1の検索語情報と第2の検索語情報とを
同義語若しくは類義語と判断しない。
考慮した同義語・類義語辞書を生成することができる。
生成装置、同義語・類義語辞書生成用プログラム、及び
同義語・類義語辞書生成用プログラムを記録した記録媒
体では、一連の検索において、さらに、検索条件情報を
獲得し、獲得した検索条件情報が、前記第1の検索語情
報と前記第2の検索語情報とをor条件により検索を行う
旨のものであった場合には、他の一連の検索において、
前記第1の検索語情報及び第2の検索語情報を獲得した
場合、当該第1の検索語情報と第2の検索語情報とを同
義語若しくは類義語と判断する。
考慮した同義語・類義語辞書を生成することができる。
法では、検索語情報を獲得し、語句に対応する同義語若
しくは類義語が記録されている同義語・類義語辞書か
ら、獲得した検索語情報に対応する同義語若しくは類義
語を、対応同義語・類義語情報として抽出し、獲得した
前記検索語情報に基づいた情報の検索を行い、検索結果
情報を生成し、生成した前記検索結果情報及び抽出した
前記対応同義語・類義語情報に基づいて統合検索結果情
報を生成し、生成した統合検索結果情報を送信する。
得することができるとともに、検索語情報に関する同義
語・類義語情報を獲得することができる。従って、検索
結果情報に所望する情報が存在しなかった場合、獲得し
た同義語・類義語情報に基づいて新たな検索を行うこと
ができるので、所望の情報を獲得することができる可能
性が高くなる。
生成方法において、一連の検索において、第1の検索語
情報及び第2の検索語情報を獲得し、他の一連の検索に
おいて、前記第1の検索語情報及び第2の検索語情報を
獲得した場合、当該第1の検索語情報と第2の検索語情
報とを同義語若しくは類義語と判断し、前記第1の検索
語情報と第2の検索語情報とを関連付けて、同義語・類
義語辞書に記録する。
情報及び第2の検索語情報を、同義語・類義語辞書に記
録することができる。従って、より利用価値の高い同義
語・類義語辞書を生成することができる。
なプログラムだけでなく、ソース形式のプログラム、圧
縮処理がされたプログラム、暗号化されたプログラム等
を含む概念である。また、プログラムによって実現され
る機能は、当該プログラム単独で実現されるのもであっ
てもよく、他のプログラム(例えば、オペレーティング
・システム)と共同して実現されるものであってもよ
い。
録したROM、RΑM、フレキシブルディスク、CD−
ROM、メモリカード、ハードディスク等の記録媒体を
いう。CD−ROMやメモリ等のような形態で記録を行
うものだけでなく、通信回線、搬送波等のように、その
状態を変化させながら記録内容を伝達するようなものも
含む概念である。また、CPUに接続されて、記録され
たプログラムが直接的に実行されるハードディスクのよ
うな記録媒体だけでなく、一旦ハードディスク等にイン
ストールした後に実行されるプログラムを記録したCD
−ROM等の記録媒体を含む概念である。
成要素との対応関係を示す。同義語・類義語抽出装置及
び同義語・類義語辞書生成装置は、同義語・類義語辞書
サーバー21に、検索結果情報生成装置は検索サーバー
23に、通信装置はユーザー端末27に、それぞれ対応
する。
に、「識別情報」は「ユーザーID」に、それぞれ対応す
る。さらに、「第1の検索語情報」は「第1候補語句」
に、「第2の検索語情報」は「第2候補語句」に、「第
1の電子辞書情報」は「第1電子辞書情報」に、「第2
の電子辞書情報」は「第2電子辞書情報」に、それぞれ
対応する。
す。同義語・類義語辞書サーバー21は、ハードディス
ク33に同義語・類義語辞書データベースDB1を記録
している。
とする。)は、同義語又は類義語とされる語句を、予め
関連付けて記憶している辞書である。例えば、「紙詰ま
り」と「JAM」とが同義語又は類義語として記録され
る。
利用して情報の検索を行うことができる。このとき、検
索に用いるキーワード及びユーザーAのユーザーIDを
入力する。
aからキーワード及びユーザーIDを取得する。そし
て、同義語・類義語辞書サーバー21へキーワード及び
ユーザーIDを、検索サーバー23へキーワードを送信
する。
ハードディスク33に記録している辞書データベースか
ら取得したユーザーIDに対応する同義語・類義語辞書を
取得し、この同義語・類義語辞書に基づいて同義語若し
くは類義語の存在の有無を判断する。
ードに基づいた検索を情報データベースDB7に対して
行う。
辞書サーバー21からキーワードに関連する同義語・類
義語を取得し、検索の結果とともに、WWWサーバー25
を介してユーザーAに知らせる。
キーワードに関連する同義語・類義語を知ることができ
る。これにより、検索結果に満足するものが含まれてい
ない場合には、同義語・類義語に基づいた新たな検索を
行うことができる。例えば、キーワード「紙詰まり」を
入力したとしても、「JAM」もキーワードとした情報の
検索を行うことができる。従って、業界の慣用による語
句の違いを越えた情報の検索を行うことができ、より幅
広い情報の収集を行うことができる。
び検索サーバー23を利用した情報検索システム1のハ
ードウェア構成を図2に示す。情報検索システム1は、
検索結果情報提供装置である同義語・類義語辞書サーバ
ー21、検索サーバー23、WWWサーバー25、一般的
なユーザーが使用する通信装置であるパーソナルコンピ
ュータ(以下、ユーザー端末とする。)27を有してい
る。ユーザー端末27は、インターネットを介してWWW
サーバー25へ接続することができる。
21、検索サーバー23、WWWサーバー25、ユーザー
端末27のハードウェア構成を図3、4、5、6を用い
て説明する。
ハードウェア構成 まず、同義語・類義語辞書サーバー21のハードウェア
構成を図3に基づいて説明する。同義語・類義語辞書サ
ーバー21は、CPU31、メモリ32、ハードディスク
33、キーボード34、マウス35、ディスプレイ3
6、CD-ROMドライブ37および通信ボード38を備えて
いる。
れているオペレーティング・システム(OS)、同義語・
類義語辞書サーバープログラム等その他のアプリケーシ
ョンに基づいた処理を行う。メモリ32は、CPU31に
対して作業領域を提供する。ハードディスク33は、オ
ペレーティング・システム(OS)、同義語・類義語辞書
サーバープログラム等その他のアプリケーションを記録
保持する。また、同義語・類義語辞書に基づく同義語・
類義語辞書データベースDB1等のデータベース、及び
その他のデータを記録保持する。なお、ハードディスク
33に記録されているデータについては後述する。
の命令を受け付ける。ディスプレイ36は、ユーザーイ
ンターフェイス等の画像を表示する。CD-ROMドライブ3
7は、同義語・類義語辞書サーバープログラムが記録さ
れているCD-ROM39から同義語・類義語辞書サーバープ
ログラム及び他のCD-ROMからその他のアプリケーション
のプログラムを読み取る等、CD-ROMからのデータの読み
取りを行う。通信ボード38は、ネットワークに接続す
る通信回路を有しており、外部の通信機器とデータの送
受信を行う。
成 検索サーバー23のハードウェア構成を図4に基づいて
説明する。検索サーバー23は、CPU41、メモリ4
2、ハードディスク43、キーボード44、マウス4
5、ディスプレイ46、CD-ROMドライブ47および通信
ボード48を備えている。
れているオペレーティング・システム(OS)、検索サー
バープログラム等その他のアプリケーションに基づいた
処理を行う。メモリ42は、CPU41に対して作業領域
を提供する。ハードディスク43は、オペレーティング
・システム(OS)、検索サーバープログラム等その他の
アプリケーションを記録保持する。また、検索に使用す
る検索データベースを記録保持する。
の命令を受け付ける。ディスプレイ46は、ユーザーイ
ンターフェイス等の画像を表示する。CD-ROMドライブ4
7は、検索サーバープログラムが記録されているCD-ROM
49から検索サーバープログラム及び他のCD-ROMからそ
の他のアプリケーションのプログラムを読み取る等、CD
-ROMからのデータの読み取りを行う。通信ボード48
は、ネットワークに接続する通信回路を有しており、外
部の通信機器とデータの送受信を行う。
成 次に、WWWサーバー25のハードウェア構成を図5に基
づいて説明する。WWWサーバー25は、CPU51、メモリ
52、ハードディスク53、キーボード54、マウス5
5、ディスプレイ56、CD-ROMドライブ57および通信
ボード58を備えている。
れているオペレーティング・システム(OS)、WWWサー
バープログラム等その他のアプリケーションに基づいた
処理を行う。メモリ52は、CPU51に対して作業領域
を提供する。 ハードディスク53は、OS、WWWサーバ
ープログラム等その他のアプリケーション、検索ログ等
のデータを記録保持する。
の命令を受け付ける。ディスプレイ56は、ユーザーイ
ンターフェイス等の画像を表示する。CD-ROMドライブ5
7は、WWWサーバープログラムが記録されているCD-ROM
59からWWWサーバープログラム及びその他のアプリケ
ーションのプログラムを読み取る等、CD-ROMからのデー
タの読み取りを行う。通信ボード58は、インターネッ
ト及びイントラネットに接続する通信回路を有してお
り、外部の通信機器とデータの送受信を行う。
成 ユーザー端末27をCPUを用いて実現した場合のハード
ウェア構成を図6に示す。ユーザー端末27のハードウ
ェア構成は、図3に示す同義語・類義語辞書サーバー2
1のものと同様である。また、各部の動作も同義語・類
義語辞書サーバー21と同様である。
に記録されているOS、ウェブブラウザプログラム等その
他のアプリケーションに基づいた処理を行う。ハードデ
ィスク63は、OS及び各種アプリケーションのプログラ
ムを記録保持する。また、CD-ROMドライブ67は、OS、
各種プログラムが記録されているCD-ROM69からプログ
ラムを読み取る。
データ 次に、同義語・類義語辞書サーバー21のハードディス
ク33に記録されているデータを図7に示す。ハードデ
ィスク33には、同義語・類義語辞書データベースDB
1、電子辞書データベースDB3、およびOSを含む各種
アプリケーションが記録されている。
B1 同義語・類義語辞書データベースDB1のデータ構造を
図8を用いて説明する。同義語・類義語辞書データベー
スDB1は、登録ユーザーに対する同義語・類義語辞書
記述領域A11(以下、ユーザー同義語・類義語辞書記
述領域A11とする。)を有している。また、登録され
ていないユーザーに対する同義語・類義語辞書記述領域
A13(以下、汎用同義語・類義語辞書記述領域A13
とする。)を有している。
1は、ユーザーID記述領域A111、同義語・類義語
記述領域A113及びカテゴリー領域A115を有して
いる。
ザー毎に付与されているユーザーIDが記述されてい
る。図8においては、ユーザーAに関するユーザーID
「0001」が、ユーザーBに関するユーザーID「0
015」が記述されている。
義語若しくは類義語と判断された語句を記述する領域で
ある。図8においては、例えば、ユーザーAに関して、
「紙詰まり」、「紙つまり」、「JAM」が同義語・類
義語として記述されている。
類義語記述領域A113に記述されている語句が使用さ
れる分野(カテゴリー)を記述する領域である。図8に
いては、例えば、ユーザーAに関する同義語・類義語
「紙詰まり」、「紙つまり」、「JAM」に対しては、
カテゴリー「コンピュータ」が記述されている。
A13も、同義語・類義語記述領域A133(以下、汎
用同義語・類義語記述領域A133とする)及びカテゴ
リー記述領域A135(以下、汎用カテゴリー記述領域
A135とする。)を有している。
は、全てのユーザーの同義語・類義語記述領域A113
に記述されている語句が記述される。例えば、ユーザー
Aについて同義語・類義語として「紙詰まり」、「紙つ
まり」、「JAM」が、ユーザーBについて「紙詰ま
り」、「紙つまり」、「ジャム」が記述されている場
合、汎用同義語・類義語記述領域A133に記述される
のは「紙詰まり」、「紙つまり」となる。
同義語・類義語記述領域A133に記述されている語句
が使用される分野(カテゴリー)を記述する領域であ
る。例えば、語句「紙詰まり」に対しては、カテゴリー
「コンピュータ」が記述される。
て説明する。電子辞書データベースDB3は、見出し語
を記述する見出し語記述領域A81、見出し語に対応す
る英語等の外国語を記述する外国語記述領域A83、及
び見出し語の意味を記述する意味記述領域A85を有し
ている。意味記述領域A85は、複数の意味を記述でき
るように構成されている。
レイ」に対して、見出し語記述領域A81に「ディスプ
レイ」が、外国語記述領域A83にディスプレイの英語
表記「display」が、意味記述領域A85には、第1の
意味として「表示。展示。」が、また、第2の意味とし
て「コンピュータの出力として図形・文字等を画面に一
時的に表示する装置。」が記述される。
ゆる検索処理と同義語・類義語辞書データベースDB1
の更新処理とに大別することができる。以下において、
検索処理と同義語・類義語辞書データベースDB1の更
新処理とを分けて説明する。
索サーバー23のCPU41が行う検索処理を中心に、当
該検索処理に関係するWWWサーバー25のCPU51及びユ
ーザー端末27のCPU61の動作を説明する。
ードの送信 ユーザー端末27のCPU61及びWWWサーバー25のCPU
51の動作を図10に示す。ユーザーは、自らが使用す
るユーザー端末27を利用してWWWサーバー25の検索
ページへアクセスしようとすると(S11)、CPU61
は、検索ページ送信情報を送信する(S12)。
送信情報を受信すると(S21)、検索ページを対応す
るユーザー端末27に送信する(S23)。
ジを受信したと判断すると(S13)、当該検索ページ
をディスプレイ66(図6参照)に表示する(S1
4)。
66に送信される検索ページの一例を、図11を用いて
説明する。検索ページは、情報の検索を行う検索者であ
るユーザーを特定するためのユーザーIDを記述するため
のユーザーID記述領域A21、検索に使用するキーワー
ド記述領域A23、検索条件選択領域A25及び検索実
行ボタンB21を有している。
ーザーIDをユーザーID記述領域A21に、検索したい情
報に関するキーワードをキーワード記述領域A23に記
述する。また、ユーザーは、キーワード記述領域A23
に複数のキーワードを記述した場合、当該キーワードを
AND検索に使用するのか、それともOR検索に使用す
るのかを、検索条件選択領域A25に存在するラジオボ
タンにより選択する。
領域A21には「0001」が、キーワード記述領域A
23には「CRT」が記述されており、検索条件選択領域
A25では「OR検索」が選択されている。
等で選択すれば、WWWサーバー25等での検索処理が開
始される。
61は、検索実行ボタンB21が選択されたと判断する
と(S15)、キーワード及びキーワードに基づいて検
索を実行する旨を示す検索情報を送信する(S16)。
受信したと判断すると(S25)、当該検索情報からユ
ーザーID、キーワード及び検索条件を抽出する(S2
7)。そして、抽出したユーザーID、キーワード及び検
索条件を、同義語・類義語辞書サーバー21に送信する
(S28)。また、キーワード及び検索条件を検索サー
バー23へ送信する(S29)。
における同義語・類義語の抽出処理 同義語・類義語辞書サーバー21のCPU31の動作を図
12に示す。CPU31は、ユーザーID及びキーワードを
取得したと判断すると(S31)、取得したユーザーID
(以下、取得ユーザーIDとする。)に基づいて、同義語
・類義語辞書データベースDB1に対して、当該ユーザ
ーが登録されているか否かを判断する。まず、CPU31
は、登録同義語・類義語辞書のユーザーID記述領域A1
11に記述されているユーザーID(以下、登録ユーザー
IDとする。)を取得する(S32)。
ーIDとが合致すると判断した場合(S33)、つまり当
該ユーザーが登録されているユーザーであると判断した
場合には、該当するユーザーの登録ユーザー同義語・類
義語記述領域A113に記述されている同義語・類義語
(以下、登録同義語・類義語とする。)の一つを取得す
る(S34)。CPU31は、登録同義語・類義語と取得
したキーワードが一致するか否かを判断する(S3
5)。
とが一致すると判断した場合には、当該登録同義語・類
義語と関連付けられて同義語・類義語辞書記述領域A1
13に記述されている他の登録同義語・類義語を抽出す
る(S36)。全ての登録同義語・類義語について同様
の処理を行ったと判断した場合には(S37)、抽出し
た登録同義語・類義語を対応同義語・類義語情報とし
て、検索サーバー23へ送信する(S38)。
に対応する同義語・類義語辞書から、獲得したキーワー
ドに対応する同義語若しくは類義語を、対応同義語・類
義語情報として抽出する。
と取得ユーザーIDとが合致しないと判断した場合には、
全ての登録ユーザーIDを取得したか否かを判断する(S
43)。全ての登録ユーザーIDを取得したと判断した場
合、即ち該当する登録ユーザーが存在しないと判断した
場合には、汎用同義語・類義語辞書記述領域A13に関
して、ステップS34〜S37と同様の同義語・類義語
の抽出処理を行う(S44〜S47)。
に対応する登録同義語・類義語辞書が存在しないと判断
した場合には、汎用同義語・類義語辞書から、獲得した
キーワードに対応する同義語若しくは類義語を、対応同
義語・類義語情報として抽出する。
ーワードに合致する同義語・類義語が存在しないと判断
した場合には、全ての登録同義語・類義語について同様
の処理を行ったか否かを判断する。そして、全ての登録
同義語・類義語について同様の処理を行ったと判断した
場合には(S37、S47)、同義語・類義語が存在し
ない旨を対応同義語・類義語情報として検索サーバー2
3へ送信する(S38)。
理 検索サーバー23のCPU41が行う検索処理について、
図13を用いて説明する。CPU41は、ユーザーID及び
キーワードを受信したと判断すると(S51)、当該キ
ーワード及び検索条件に基づいて、情報データベースD
B7に対して情報の検索を行う(S53)。情報データ
ベースDB7とは、インターネット上に接続されている
ホームページ等の情報の内容を集約して記録保持してい
るデータベースである。
の結果に基づいて、検索結果情報を生成する(S5
4)。なお、当該検索処理に関してはキーワードを含む
か否かによる、いわゆるキーワード検索を利用してい
る。
信したと判断すると(S55)、当該対応同義語・類義
語情報及びステップS54で生成した検索結果情報に基
づいて、統合検索結果情報を生成する(S57)。
成する統合検索結果情報の一例を図14に示す。統合検
索結果情報は、キーワード記述領域A41、検索条件選
択領域A43、同義語・類義語表示領域A45、及び検
索結果表示領域A47を有している。
端末27から取得したキーワード(図10ステップS1
6参照)が表示される。図14においては、キーワード
「CRT」が記述されている。検索条件選択領域A43
には、ユーザーが今回の検索において選択した検索条件
が、予め、ラジオボタンにより選択されている。図14
においては、「OR検索」が選択されている。
同義語・類義語情報に対応する同義語・類義語が表示さ
れる。この際、各同義語・類義語に対応して選択意思表
示領域A49が設けられる。本実施形態においては、選
択意思表示領域A49として各キーワードに対応してチ
ェックボックスを表示するようにしている。これによ
り、対応同義語・類義語情報に含まれる同義語若しくは
類義語から、一又は複数の同義語若しくは類義語の選択
を可能となる。このようにして、CPU31は、同義語・
類義語の選択に基づき選択同義語・類義語情報を生成す
るように、統合検索結果情報を生成する。
索結果情報を表示する。
WWサーバー25へ送信する(S59)。
送信〜再検索 統合検索結果情報の受信以降のWWWサーバー25の処理
を図15を用いて、また、ユーザー端末27の処理を図
16を用いて説明する。
1は、統合検索結果情報を受信したと判断すると(S6
1)、当該統合検索結果情報をユーザー端末27へ送信
する(S63)。
1は、統合検索結果情報を取得したと判断すると(S8
1)、当該統合検索結果情報をディスプレイ66(図6
参照)に表示する(S83)。ユーザーは、図14に示
す検索結果情報の検索結果表示領域A47に自らが望む
情報が表示されている場合には、その情報を選択すれば
よい。この場合、CPU61は、ある情報について詳細を
要求されたと判断すると(S85)、当該情報の詳細を
要求する旨の詳細要求情報をWWWサーバー25に対して
送信する(S87)。
域A47に表示されていなかった場合、若しくは表示さ
れているか否か判断できない場合には、ユーザーは、同
義語・類義語表示領域A45に表示されている同義語・
類義語に関して、自らが指定したキーワードと関連する
と判断する語句のチェックボックスA49にチェックを
いれる。そして、ユーザーは、検索ボタンB41を選択
すればよい。
ンB41が選択され、再検索情報の送信を要求されたと
判断すると(S89)、チェックが入れられた同義語・
類義語に基づいて選択同義語・類義語情報を生成する
(S90)。そして、生成した選択同義語・類義語情報
に基づいて検索を行う旨の再検索情報をWWWサーバー2
5に対して送信する(S91)。
1は、詳細要求情報を受信すると(S65)、情報デー
タベースDB7から当該詳細要求情報に対応する情報を
対応情報として取得する(S67)。そして、CPU51
は、取得した対応情報をユーザー端末27へ送信する
(S69)。
(S71)、当該再検索情報から、キーワード、選択同
義語・類義語情報、検索条件等を抽出し、同義語・類義
語辞書サーバー21及び検索サーバー23へ送信する
(S73)。
ー25からキーワード、追選択義語・類義語情報等を取
得すると、当該キーワード及び選択同義語・類義語情報
に対応する同義語・類義語に基づいて、情報の再検索を
行う。なお、情報の検索については、図13におけるス
テップS51〜S59までの処理と同様であるので、詳
細な記述は省略する。
1は、検索結果情報を受信したと判断すると(S7
5)、受信した検索結果情報をユーザー端末27へ送信
する(S77)。
61は、対応情報を取得したと判断すると(S93)、
当該対応情報をディスプレイ66へ表示する(S9
5)。
たと判断すると(S97)、当該検索結果情報をディス
プレイ66へ表示する(S99)。
ー端末27から送信された再検索情報に基づいて、同義
語・類義語辞書から所定の同義語・類義語について登録
の削除処理を行う。この削除処理について、図17に示
すフローチャートを用いて説明する。
1は、図16のステップS91において、ユーザー端末
27から送信された再検索情報を取得したと判断すると
(S101)、取得した再検索情報から選択同義語・類
義語情報を抽出する(S103)。そして、取得した選
択同義語・類義語情報及び前回送信した対応同義語・類
義語情報に基づいて、選択同義語・類義語情報に含まれ
なかった対応同義語・類義語(以下、非選択同義語・類
義語とする。)を抽出する(S105)。
ディスク36の所定の場所から取得し(S107)、当
該非選択同義語・類義語についての非選択回数の値を更
新する(S109)。ここで、非選択同義語・類義語テ
ーブルについて図18を用いて説明する。
としてユーザーに提示したが、ユーザーが同義語・類義
語として採用することがなかった同義語・類義語につい
て、その採用されなかった回数を記録するテーブルであ
る。
するユーザーID記述領域A91、同義語・類義語のカテ
ゴリーを記述するカテゴリー記述領域A93、同義語・
類義語を記述する同義語・類義語記述領域A95、及び
各同義語・類義語候補の非選択回数を記録する非選択回
数記述領域A97を有している。図18においては、例
えば、ユーザーAがある検索において語句「CRT」の同
義語・類義語として示された「ディスプレイ」につい
て、当該同義語・類義語「ディスプレイ」を、これまで
に、3回、同義語・類義語として選択しなかった場合、
ユーザーID記述領域A91に「A」が、カテゴリー記述
領域A93に「コンピュータ」が、同義語・類義語記述
領域A95に語句「CRT」及び語句「ディスプレイ」の
組み合わせが、及び非選択回数記述領域A97に「3」
が記述される。
ーザーIDのユーザーに関する検索回数を取得し(S11
1)、取得した検索回数及び前述の非選択回数に基づい
て、当該同義語・類義語の組み合わせに関する非選択率
を算出する(S113)。
た値(以下、設定非選択率とする。)より、大きいか否
かを判断する(S115)。そして、CPU31は、非選
択率>設定非選択率と判断すれば、当該ユーザーIDに対
応するユーザーに関する同義語・類義語辞書から、組み
合わせに係る同義語・類義語を削除する(S117)。
なお、本実施形態においては設定非選択率を2%として
いる。
・類義語について、同様の処理を行ったか否かの判断を
行う(S119)。全ての非選択同義語・類義語につい
て、処理を行ったと判断した場合には、同義語・類義語
辞書の削除処理を終了する。一方、全ての非選択同義語
・類義語について同義語・類義語の削除処理を行ってい
ないと判断した場合には、ステップS103〜S117
までの処理を繰り返す。
新処理 同義語・類義語辞書サーバー21のCPU31は、所定の
期間毎にユーザーの同義語・類義語辞書データベースD
B1の更新を行う。以下において、この同義語・類義語
辞書データベースの更新処理について図19〜27を用
いて説明する。
U31は、所定の期間になると(S201)、これまで
の検索が行われた際のログ(以下、検索ログとする。)
を、WWWサーバー25から取得する(S203)。取得
した検索ログの一例を図22に示す。
号記述領域A51、検索ユーザーを特定するユーザーID
を記述するユーザーID記述領域A53、検索に使用した
カテゴリを記述するカテゴリ記述領域A55、検索に使
用したキーワードを記述するキーワード記述領域A5
7、検索における検索条件を記述する検索条件記述領域
A58及び検索時刻を記述する検索時刻記述領域A59
を有している。例えば、ユーザーAが、時刻2001年6月2
8日13時00分00秒にカテゴリー「コンピュータ」につい
て、キーワード「CRT」で検索を行い、当該検索が10
0番目の検索であった場合、検索番号記述領域A51の
検索番号「100」に対応する、ユーザーID記述領域A
53にユーザー「A」が、カテゴリ記述領域A55に
「コンピュータ」が、キーワード記述領域A57に「CR
T」が、検索時刻記述領域A59には「2001/06/28/13:0
0.00」が記述される。なお、この場合検索条件記述領域
A58には何も記述されない。
う同義語・類義語辞書データベースDB1の更新処理を
説明する。
項目「ユーザーID」に基づいて、各データの並べ替えを
行う(S205)。ユーザーIDに基づいて並び替えを行
った例を図23に示す。図23においては、ユーザーID
「A」から順番に「B」、「C」・・・と並び替えが行
われている。
に基づいて並び替えた検索ログについて、各ユーザー毎
に検索のブロック化を行う(S207)。このブロック
化は、ある検索から次の検索までの時間を算出し(以
下、算出時間とする。)、算出時間が所定の時間(以
下、規定ブロック化時間とする。)を越えるか否かによ
って行われる。例えば、図23においてユーザーAの番
号100の検索は時刻2001年6月28日13時00分00秒(200
1/06/28/13:00.00と表記されている。)に行われてお
り、番号104の検索は時刻2001/06/28/13:05.00とな
っている。従って、算出時間は5分となる。
時間は、30分としている。この場合、算出時間(=5
分)<規定ブロック化時間(=30分)となる。よっ
て、CPU31は、番号100の検索と番号104の検索
とは同一ブロックに属すると判断する。
いては、番号150の検索時刻(=2001/06/28/14:30.0
0)−番号104の検索時刻(=2001/06/28/13:05.00)
=算出時間(=1時間25分00秒)となる。この場
合、算出時間(=1時間25分00秒)>規定ブロック
化時間(=30分)となる。よって、CPU31は、番号
104の検索と番号150の検索とは別ブロックに属す
ると判断する。そして、所定のブロック番号を付与す
る。CPU31は、このようにして、検索時刻に基づくブ
ロック化を検索ログの全てのデータについて行う。
についてブロック番号を付与する(S209)。
た検索ログの一例を図24に示す。この場合、検索番号
「100」と「104」は同一ブロック(ブロック番号
50)に属し、検索番号「150」と「151」は同一
ブロック(ブロック番号51)に属することを意味す
る。
ると、CPU31は、同義語・類義語候補の抽出及び同義
語・類義語の登録処理を行う。CPU31は、同一ブロッ
クに属すると判断した検索に関して、各検索に使用した
キーワードは、同義語・類義語である可能性が高い、と
判断し、一時的に、メモリ32(図3参照)の同義語・
類義語候補バッファに記録する(S211)。
に関して、CPU31は、語句「CRT」及び語句「表示
装置」とは、同義語・類義語である可能性が高いと判断
し、一時的に、同義語・類義語候補バッファに記録す
る。
検索番号105において、検索条件「OR」が記述され
ている。この場合、語句「眼科」と語句「目医者」と
は、同義語・類義語である可能性が高いと判断して、同
義語・類義語候補バッファに記録する。
条件情報を獲得し、獲得した検索条件情報が、同義語・
類義語候補バッファに記録した語句をOR条件により検索
を行う旨のものであった場合には、他の検索において、
当該第1候補語句と第2候補語句とを同義語若しくは類
義語と判断する。
検索番号150において、検索条件「AND」が記述さ
れている。この場合、語句「プリンター」と語句「A
社」とは、同義語・類義語である可能性が低いと判断し
て、同義語・類義語候補バッファには記録しない。
情報を獲得し、獲得した検索条件情報が、同義語・類義
語候補バッファに記録した語句をAND条件により検索を
行う旨のものであった場合、同義語・類義語候補バッフ
ァに記録した語句を同義語若しくは類義語と判断しな
い。
には同義語・類義語である可能性が高いと判断し、検索
条件「AND」の場合には同義語・類義語である可能性
が低いと判断するのは、検索に関する一般的な経験則に
よるものである。
記録した同義語・類義語候補について、既に、同義語・
類義語候補テーブルに当該同義語・類義語に合致するデ
ータが存在するか否かを判断する(S212)。ここ
で、同義語・類義語候補テーブルについて、図25を用
いながら説明する。
・類義語である可能性が高いと判断された候補語句の組
み合わせを、同義語・類義語辞書データベースDB1に
記録する前に、記録しておくテーブルである。
IDを記述するユーザーID記述領域A61、検索に使用し
たカテゴリーを記述するカテゴリー記述領域A63、及
び同義語・類義語候補を記述する同義語・類義語候補記
述領域A65を有している。同義語・類義語候補記述領
域A65は、同義語・類義語候補語句を記述できるよう
に構成されている。
ユーザー「A」に関して検索カテゴリー「コンピュー
タ」について語句「CRT」と語句「ディスプレイ」とが
同義語・類義語候補である可能性が高いと判断した場
合、ユーザーID記述領域A61に「A」が、カテゴリー
記述領域A63に「コンピュータ」が、同義語・類義語
候補記述領域A65に語句「CRT」と語句「ディスプレ
イ」とが記述される。
て、同義語・類義語候補テーブルに同義語・類義語候補
バッファに記録した同義語・類義語候補が記録されてい
ると判断した場合には、CPU31は、同義語・類義語候
補バッファに登録されている語句の一つ(以下、第1候
補語句とする。)を取得する(S213)。
に記録されている電子辞書から、第1候補語句に関する
データの取得を行う(S214)。CPU31は、取得し
た第1候補語句に関する意味を図9に示す電子辞書デー
タベースDB3の意味記述領域A85から取得する。こ
の取得した意味を第1電子辞書情報とする。
いてユーザーAに関する第1候補語句が「CRT」であ
った場合、当該「CRT」に関するデータを、電子辞書か
ら取得する。この場合、電子辞書から取得したデータ
が、図9に示すものであったとすると、「コンピュータ
の端末の文字、画像表示に使われる陰極線」が第1電子
辞書情報となる。
において、第1候補語句の同義語・類義語候補として登
録されている語句(以下、第2候補語句とする。)を取
得する(S215)。CPU31は、第1候補語句の場合
と同様に、取得した第2候補語句に関する意味を図9に
示す電子辞書データベースDB3の意味記述領域A85
から取得する(S216)。ここで取得した意味を第2
電子辞書情報とする。
が、図9に示すものであったとすると、「表示。展
示」、「コンピュータの出力として図形・文字等を画面
に一時的に表示する装置」を第2電子辞書情報として取
得する。
214で取得した第1候補語句に関する電子辞書の意味
とステップS216で取得した第2候補語句に関する電
子辞書の意味との近似性を算出する(S217)。第1
位候補語句「CRT」の意味「コンピュータの端末の文
字、画像表示に使われる陰極線」と、第2候補語句「デ
ィスプレイ」の意味「表示。展示」、「コンピュータの
出力として図形・文字等を画面に一時的に表示する装
置」との近似性を算出する。なお、この近似性は、自然
語検索エンジンによって算出する。
7において算出した近似性が予め定められた規定値(以
下、規定近似性とする。)より大きいか否かを判断する
(S218)。このように、CPU31は、第1候補語句
と第2候補語句とを同義語若しくは類義語と判断する際
に、電子辞書から当該第1候補語句及び第2候補語句に
対応する電子辞書情報を、それぞれ第1の電子辞書情
報、第2の電子辞書情報として抽出し、抽出した第1の
電子辞書情報と第2の電子辞書情報に基づいて、第1候
補語句と第2候補語句との近似性を算出し、算出した近
似性が規定近似性以上の場合、第1候補語句と第2候補
語句とを同義語若しくは類義語と判断する。
算出した近似性が規定近似性より大きいと判断した場合
(S218)、取得したユーザーIDが、同義語・類義語
辞書データベースDB1に登録されているか否かを判断
する(S219)。
ると判断した場合には、当該ユーザーIDに対応する同義
語・類義語辞書へ、同義語・類義語候補バッファに登録
されている第1候補語句及び第2候補語句を同義語・類
義語として登録する(S220)。
T」と第2候補語句「表示装置」とは、同義語・類義語
であると判断され、両語句を同義語・類義語としてユー
ザーAに関する同義語・類義語辞書に登録する。
て、第1候補語句及び第2候補語句を獲得した場合、同
義語・類義語候補テーブルへ登録する。そして、他の検
索において、同義語・類義語候補テーブルへ登録した第
1候補語句及び第2候補語句を獲得した場合、当該第1
候補語句と第2候補語句とを同義語若しくは類義語と判
断し、第1候補語句と第2候補語句とを関連付けて、同
義語・類義語辞書に記録する。つまり、CPU31は、検
索において、第1候補語句及び第2候補語句を獲得し、
他の検索において、前記第1候補語句及び第2候補語句
を獲得した場合、当該第1候補語句と第2候補語句とを
同義語若しくは類義語と判断し、第1候補語句と第2候
補語句とを関連付けて、同義語・類義語辞書に記録す
る。
ーブルに第1候補語句及び第2候補語句を記録した際の
検索において獲得したユーザーIDと今回の検索において
獲得したユーザーIDとが同じ場合に、今回の検索におい
て、第1候補語句及び第2候補語句を獲得すると、当該
第1候補語句と第2候語句とを同義語若しくは類義語と
判断し、第1候補語句と第2候補語句とを関連付けて、
ユーザーIDに対応する同義語・類義語辞書に記録する。
つまり、ある検索と他の検索とが、同じユーザーによっ
て行われた場合に、第1候補語句と第2候補語句とを関
連付けて、ユーザーのユーザーIDに対応する登録同義語
・類義語辞書に記録する。
録されている全ての同義語・類義語候補について、登録
処理を行ったか否かを判断し(S221)、全てについ
て登録処理を行っていないと判断した場合は、他の同義
語・類義語候補について同様の処理を行う。
が算出近似性より小さいと判断した場合、出現回数テー
ブルの当該語句の組み合わせに対応する出現回数を更新
する(S231)。ここで、図26に示す出現回数テー
ブルを用いて、当該出現回数テーブルについて説明す
る。出現回数テーブルとは、ある候補語句の組み合わせ
がこれまで何回あったのかを記録しているテーブルであ
る。
るユーザーID記述領域A71、検索に使用したカテゴリ
ーを記述するカテゴリー記述領域A73、同義語・類義
語候補を記述する同義語・類義語候補記述領域A75、
及び各同義語・類義語候補の出現回数を記録する出現回
数記述領域A77を有している。図22においては、例
えば、ユーザーAが候補語句「CRT」と「ディスプレ
イ」との組み合わせを用いた検索を、これまでに、15
回行っていた場合、ユーザーID記述領域A71に「A」
が、カテゴリー記述領域A73に「コンピュータ」が、
同義語・類義語候補記述領域A75に語句「CRT」及び
語句「ディスプレイ」が、及び出現回数記述領域A77
に「15」が記述される。
ーザーIDのユーザーに関する検索回数を取得する(S2
33)。そして、取得した検索回数と予め設定した設定
検索回数とを比較する(S234)。このように、取得
した検索回数と設定検索回数との比較を行うのは、検索
回数が少ない場合には、次のステップS235で算出す
る出現率が大きくなる傾向があり、結果として、同義語
・類義語と判断される場合が多くなるからである。例え
ば、ユーザーAについての検索回数が2回で、出現回数
が1回であればステップS235で算出する出現率は5
0%となり、設定出現率を越えてしまうという現象が生
ずる。
回数であると判断すれば、取得した検索回数及び前述の
出現回数に基づいて、当該候補語句の組み合わせに関す
る出現率を算出する(S235)。
値(以下、設定出現率とする。)より、大きいか否かを
判断する(S237)。そして、CPU31は、出現率>
設定出現率と判断すれば、ステップS219〜S221
までの処理を繰り返す。なお、本実施形態においては設
定検索回数を10回、設定出現率を2%としている。
候補語句及び第2候補語句が存在しない場合、第1候補
語句及び第2候補語句に基づいて、第1候補語句と第2
候補語句に関する出現率を算出し、算出した出現率が設
定出現率より大きい場合に、第1候補語句と第2候補語
句とを同義語若しくは類義語と判断する。
回と第1候補語句及び第2候補語句を取得した取得回数
とに基づいて算出する。
検索回数と判断した場合、またはステップS237にお
いて出現率<設定出現率と判断した場合、CPU31は、
同義語・類義語候補バッファに記録されている全ての同
義語・類義語候補について、登録処理を行ったか否かを
判別する(S221)。そして、全てについて登録処理
を行っていないと判断した場合は、他の同義語・類義語
候補について同様の処理を行う。
て、CPU31は、第1候補語句と第2候補語句との組み
合わせが同義語・類義語候補テーブルに登録されていな
いと判断した場合には、当該第1候補語句及び第2候補
語句を同義語・類義語候補テーブルに登録する(S23
1)。
処理 CPU31は、図21のステップS221において、全て
の登録ユーザーについて、同義語・類義語の登録処理が
終了したと判断すると、同義語・類義語辞書データベー
スDB1の汎用同義語・類義語辞書記述領域A13(図
8参照)への同義語・類義語の登録処理を開始する。
語の登録処理の際のフローチャートを図27に示す。CP
U31は、登録同義語・類義語辞書に登録されている同
義語・類義語について、カテゴリー毎に分類する(S3
01)。そして、カテゴリー毎に、全てのユーザーに対
して登録されている同義語・類義語(以下、汎用同義語
・類義語とする。)があるか否かを判断する(S30
3)。例えば、図8に示す同義語・類義語辞書データベ
ースDB1においては、ユーザーA及びユーザーBにつ
いて、カテゴリー「コンピュータ」に対して、「紙詰ま
り」と「紙つまり」とが同義語・類義語として登録され
ている。図8には示していないが、他のユーザーについ
ても同様に、「紙詰まり」と「紙つまり」とが同義語・
類義語として登録されている場合には、当該「紙詰ま
り」と「紙つまり」を同義語・類義語として汎用同義語
・類義語であると判断する。
判断すると、当該汎用同義語・類義語を同義語・類義語
辞書データベースDB1の汎用同義語・類義語辞書記述
領域A13へ登録する(S305)。そして、全てのカ
テゴリーについて同義語・類義語辞書データベースDB
1への登録処理を行ったか否かを判断する(S30
7)。全てのカテゴリーについて同義語・類義語辞書デ
ータベースDB1への登録処理を行っていないと判断し
た場合には、ステップS301〜S307の処理を繰り
返す。
いて、汎用同義語・類義語が無いと判断した場合には、
同義語・類義語辞書データベースDB1への同義語・類
義語の登録処理を終了する。
いてユーザーIDを獲得し、最初に第1候補語句及び第2
候補語句を獲得した検索、つまり同義語・類義語候補テ
ーブルに当該第1候補語句及び第2候補語句を記録した
ときの検索において獲得したユーザーIDと今回の検索に
おいて獲得したユーザーIDとが異なる場合に、今回の検
索において、最初の検索と同様の第1候補語句及び第2
候補語句を獲得すると、当該第1候補語句と第2候補語
句とを同義語若しくは類義語と判断し、第1候補語句と
第2候補語句とを関連付けて、同義語・類義語辞書に記
録する。 また、CPU31は、第1候補語句と第2候補
語句とを関連付けて同義語・類義語辞書に記録する際
に、汎用同義語・類義語辞書に当該第1候補語句と第2
候補語句とを関連付けて記録する。
いては、同義語・類義語辞書サーバー21とWWW サーバ
ー25とを分けて設置することとした。しかし、同義語
・類義語辞書サーバー21とWWWサーバー25との機能
を併せ持ったサーバーとしてもよい。
ーバー23とWWWサーバー25とを分けて設置した。し
かし、検索サーバー23とWWWサーバー25との機能を
併せ持ったサーバーとしてもよい。
と検索サーバー23とを併せ持ったサーバーを設置する
ようにしてもよい。さらに、同義語・類義語辞書サーバ
ー21と検索サーバー23とWWWサーバー25の機能を
併せ持ったサーバーを設置するようにしてもよい。
・類義語辞書サーバー21、検索サーバー23、WWWサ
ーバー25、及びユーザー端末27により、情報検索シ
ステム1を構成することとしたが、同義語・類義語辞書
サーバー21、検索サーバー23及びユーザー端末27
により、情報検索システム101を構成するようにして
もよい。この場合、WWWサーバー25については、一般
的に設置されているものを利用する。
は、情報の検索を行うとともに、統合検索結果情報を生
成することとしたが、情報の検索に関しては、既存の検
索サーバーを利用するようにしてもよい。この場合、検
索サーバー23は、既存の検索サーバーから検索結果情
報を取得することになる。
を行う毎にユーザーIDを取得することとしたが、いわゆ
るログインの際にのみ、ユーザーIDを取得するようにし
てもよい。
サーバー23は、選択同義語・類義語に基づいて再検索
を行うことしたが、再検索を行わないようにしてもよ
い。
語・類義語に関する非選択回数に基づいて、同義語・類
義語辞書からの削除を行うこととしたが、選択回数rに
基づいて同義語・類義語辞書からの削除を行うようにし
てもよい。この場合、選択回数の少ない同義語・類義語
を削除するようにすればよい。
択率及び規定出現率を2%としたが、これに限定される
ものではない。
語・類義語辞書サーバー21は、登録同義語・類義語辞
書と汎用同義語・類義語辞書を有することとしたが、登
録同義語・類義語辞書のみを有するようにしてもよい。
さらに、汎用同義語・類義語辞書のみを有するようにし
てもよい。
語・類義語辞書サーバー21において、出現率によっ
て、同義語・類義語辞書に登録するか否かを判断するこ
ととしたが、第1候補語句と第2候補語句との組み合わ
せの回数によって、同義語・類義語辞書へ登録するか否
かを判断することとしてもよい。また、非選択率につい
ても同様である。
語検索エンジンにより近似性を算出することとしたが、
他の方法により近似性を算出するようにしてもよい。例
えば、文字検索エンジンを使用して同一単語の出現回数
をカウントすることにより算出するようにしてもよい。
辞書から取得した第1候補語句の意味と第2候補語句の
意味を用いて近似性を算出することとしたが、第1候補
語句そのものと第2候補語句そのものとの近似性を算出
するようにしてもよい。
語・類義語辞書サーバー21は、電子辞書データベース
DB3を有しているが、電子辞書データベースについて
は、インターネット上に存在するサーバーから取得する
ようにしてもよい。
検索及びOR検索により、同義語・類義語の判断を行うこ
ととしたが、このような同義語・類義語の判断を行わな
いようにしてもよい。
データベースDB7が検索サーバー23とLAN(Local A
rea Network)側にて接続されているものとしたが、情
報を蓄積し、当該情報に対して他のコンピュータからア
クセス可能であるものであれば、これに限定されない。
例えば、情報データベースDB7として、インターネッ
ト上に存在しているもの等、検索サーバー23からみて
WAN(Wide Area Network)側にて接続されるものであっ
てもよい。
に示した図である。
ア構成を示す図である。
ハードウェア構成を示す図である。
成を示す図である。
成を示す図である。
成を示す図である。
ータを示す図である。
B1のデータ構造の一例を示す図である。
タ構造の一例を示す図である。
末27の処理を示すフローチャートである。
する検索画面の一例を示す図である。
が行う同義語・類義語抽出処理のフローチャートであ
る。
を示すフローチャートである。
する検索結果の一例を示す図である。
トである。
トである。
義語・類義語辞書に対する同義語・類義語の削除処理を
示すフローチャートである。
ック化処理を示すフローチャートである。
同義語・類義語辞書への同義語・類義語の登録処理を示
すフローチャートである。
同義語・類義語辞書への同義語・類義語の登録処理を示
すフローチャートである。
えた場合を示す図である。
行った場合を示す図である。
である。
同義語・類義語辞書への同義語・類義語の登録処理を示
すフローチャートである。
示した図である。
Claims (30)
- 【請求項1】通信装置、検索結果情報生成装置及び同義
語・類義語抽出装置がネットワークにより接続されてお
り、互いに情報の送受信を行える情報検索システムにお
いて、 前記通信装置は、 検索語情報を送信し、 前記同義語・類義語抽出装置は、 前記検索語情報を獲得し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、獲得した検索語情報に対応す
る同義語若しくは類義語を、対応同義語・類義語情報と
して抽出し、 抽出した前記対応同義語・類義語情報を送信し、 前記検索結果情報生成装置は、 検索語情報を獲得し、 獲得した前記検索語情報に基づいて情報の検索を行い、
検索結果情報を生成し、 前記対応同義語・類義語情報を獲得し、 生成した前記検索結果情報及び獲得した前記対応同義語
・類義語情報に基づいて統合検索結果情報を生成し、 生成した統合検索結果情報を送信すること、 を特徴とする情報検索システム。 - 【請求項2】通信装置、検索結果情報生成装置及び同義
語・類義語抽出装置がネットワークにより接続されてお
り、互いに情報の送受信を行える情報検索システムにお
いて、 前記通信装置は、 検索語情報を送信し、 前記同義語・類義語抽出装置は、 前記検索語情報を獲得し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、獲得した検索語情報に対応す
る同義語若しくは類義語を、対応同義語・類義語情報と
して抽出し、 抽出した前記対応同義語・類義語情報を送信すること、 を特徴とする情報検索システム。 - 【請求項3】検索語情報を獲得し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、獲得した検索語情報に対応す
る同義語若しくは類義語を、対応同義語・類義語情報と
して抽出し、 抽出した前記対応同義語・類義語情報を送信すること、 を特徴とする同義語・類義語抽出装置。 - 【請求項4】コンピュータを、検索語情報に対応する対
応同義語・類義語情報を抽出する同義語・類義語抽出装
置として機能させるための同義語・類義語抽出用プログ
ラムにおいて、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、獲得した検索語情報に対応す
る同義語若しくは類義語を、対応同義語・類義語情報と
して抽出し、 抽出した前記対応同義語・類義語情報を送信すること、 を特徴とする同義語・類義語抽出用プログラム。 - 【請求項5】請求項4に係る同義語・類義語抽出用プロ
グラムを記録した記録媒体。 - 【請求項6】請求項1〜5に係る情報検索システム、同
義語・類義語抽出装置、同義語・類義語抽出装置用プロ
グラム、及び同義語・類義語抽出用プログラムを記録し
た記録媒体において、 前記同義語・類義語抽出装置は、 情報の検索を行う検索者を識別するための識別情報を受
信し、 当該識別情報に対応する同義語・類義語辞書から対応同
義語・類義語情報を抽出すること、 を特徴とするもの。 - 【請求項7】請求項1〜6に係る情報検索システム、同
義語・類義語抽出装置、同義語・類義語抽出装置用プロ
グラム、及び同義語・類義語抽出用プログラムを記録し
た記録媒体において、 前記同義語・類義語抽出装置は、 情報の検索を行う検索者を識別するための識別情報を受
信し、 前記識別情報に対応する同義語・類義語辞書が存在しな
いと判断した場合には、汎用同義語・類義語辞書から前
記対応同義語・類義語情報を抽出すること、 を特徴とするもの。 - 【請求項8】検索語情報を獲得し、 獲得した前記検索語情報に基づいた情報の検索を行い、
検索結果情報を生成し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、当該検索語情報に対応する同
義語若しくは類義語として抽出された対応同義語・類義
語情報を獲得し、 生成した前記検索結果情報及び獲得した前記対応同義語
・類義語情報に基づいて統合検索結果情報を生成し、 生成した統合検索結果情報を送信すること、 を特徴とする検索結果情報生成装置。 - 【請求項9】コンピュータを、検索語情報に対応する検
索結果情報を生成する検索結果情報生成装置として機能
させるための検索結果情報生成用プログラムにおいて、 前記検索結果情報生成装置は、 検索語情報を獲得し、 獲得した前記検索語情報に基づいた情報の検索を行い、
検索結果情報を生成し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、当該検索語情報に対応する同
義語若しくは類義語として抽出された対応同義語・類義
語情報を獲得し、 生成した前記検索結果情報及び獲得した前記対応同義語
・類義語情報に基づいて統合検索結果情報を生成し、 生成した統合検索結果情報を送信すること、 を特徴とする検索結果情報生成用プログラム。 - 【請求項10】請求項9に係る検索結果情報生成用プロ
グラムを記録した記録媒体。 - 【請求項11】請求項1、8〜10に係る情報検索シス
テム、検索結果情報生成装置、検索結果情報生成用プロ
グラム、及び検索結果情報生成用プログラムを記録した
記録媒体において、 前記検索結果情報生成装置は、 前記対応同義語・類義語情報に含まれる同義語若しくは
類義語から、一又は複数の同義語若しくは類義語の選択
を可能とし、当該選択に基づき選択同義語・類義語情報
を生成するように、前記統合検索結果情報を生成するこ
と、 を特徴とするもの。 - 【請求項12】請求項11に係る情報検索システム、検
索結果情報生成装置、検索結果情報生成用プログラム、
及び検索結果情報生成用プログラムを記録した記録媒体
において、 前記検索結果情報生成装置は、 前記選択同義語・類義語情報を獲得すると、当該選択同
義語・類義語情報に対応する同義語若しくは類義語に基
づいて、情報の検索を行うこと、 を特徴とするもの。 - 【請求項13】請求項11、12に係る情報検索システ
ム、請求項3〜7に係る同義語・類義語抽出装置、同義
語・類義語抽出用プログラム、及び同義語・類義語抽出
用プログラムを記録した記録媒体において、 前記同義語・類義語抽出装置は、 前記選択同義語・類義語情報を獲得すると、当該選択同
義語・類義語情報に含まれない同義語・類義語を前記同
義語・類義語情報から削除すること、 を特徴とするもの。 - 【請求項14】請求項13に係る情報検索システム、同
義語・類義語抽出装置、同義語・類義語抽出用プログラ
ム、及び同義語・類義語抽出用プログラムを記録した記
録媒体において、 前記同義語・類義語抽出装置は、 前記選択同義語・類義語情報を獲得すると、当該選択同
義語・類義語情報に含まれない同義語・類義語に関する
非選択回数を更新し、 当該非選択回数に基づいて、当該選択同義語・類義語情
報に含まれない同義語・類義語を前記同義語・類義語情
報から削除すること、 を特徴とするもの。 - 【請求項15】検索において、第1の検索語情報及び第
2の検索語情報を獲得し、他の検索において、前記第1
の検索語情報及び第2の検索語情報を獲得した場合、当
該第1の検索語情報と第2の検索語情報とを同義語若し
くは類義語と判断し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て、同義語・類義語辞書に記録すること、 を特徴とする同義語・類義語辞書生成装置。 - 【請求項16】コンピュータを検索語情報に基づいて同
義語・類義語辞書を生成する同義語・類義語辞書生成装
置として機能させるための同義語・類義語辞書生成用プ
ログラムにおいて、 検索において、第1の検索語情報及び第2の検索語情報
を獲得し、他の検索において、前記第1の検索語情報及
び第2の検索語情報を獲得した場合、当該第1の検索語
情報と第2の検索語情報とを同義語若しくは類義語と判
断し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て、同義語・類義語辞書に記録すること、 を特徴とする同義語・類義語辞書生成用プログラム。 - 【請求項17】請求項16に係る同義語・類義語辞書生
成用プログラムを記録した記録媒体。 - 【請求項18】請求項15〜17に係る同義語・類義語
辞書生成装置、同義語・類義語辞書生成用プログラム、
及び同義語・類義語辞書生成用プログラムを記録した記
録媒体において、 前記同義語・類義語辞書生成装置は、 ある検索と他の検索とが、同じ検索者によって行われた
場合に、前記第1の検索語情報と第2の検索語情報とを
関連付けて、同義語・類義語辞書に記録すること、 を特徴とするもの。 - 【請求項19】請求項18に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 所定の検索において検索者に関する識別情報を獲得し、 最初に前記第1の検索語情報及び第2の検索語情報を獲
得した検索において獲得した識別情報と他の検索におい
て獲得した識別情報とが同じ場合に、当該他の検索にお
いて、前記第1の検索語情報及び第2の検索語情報を獲
得すると、当該第1の検索語情報と第2の検索語情報と
を同義語若しくは類義語と判断し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て、同義語・類義語辞書に記録すること、 を特徴とするもの。 - 【請求項20】請求項19に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 所定の検索において検索者に関する識別情報を獲得し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て同義語・類義語辞書に記録する際に、獲得した識別情
報に対応する検索者の同義語・類義語辞書に当該第1の
検索語情報と第2の検索語情報とを関連付けて記録する
こと、 を特徴とするもの。 - 【請求項21】請求項15〜20に係る同義語・類義語
辞書生成装置、同義語・類義語辞書生成用プログラム、
及び同義語・類義語辞書生成用プログラムを記録した記
録媒体において、 前記同義語・類義語辞書生成装置は、 ある検索と他の検索とが、異なる検索者によって行われ
た場合に、前記第1の検索語情報と第2の検索語情報と
を関連付けて、同義語・類義語辞書に記録すること、 を特徴とするもの。 - 【請求項22】請求項21に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 所定の検索において検索者に関する識別情報を獲得し、 最初に前記第1の検索語情報及び第2の検索語情報を獲
得した検索において獲得した識別情報と他の検索におい
て獲得した識別情報とが異なる場合に、当該他の検索に
おいて、前記第1の検索語情報及び第2の検索語情報を
獲得すると、当該第1の検索語情報と第2の検索語情報
とを同義語若しくは類義語と判断し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て、同義語・類義語辞書に記録すること、 を特徴とするもの。 - 【請求項23】請求項22に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 前記第1の検索語情報と第2の検索語情報とを関連付け
て同義語・類義語辞書に記録する際に、汎用同義語・類
義語辞書に当該第1の検索語情報と第2の検索語情報と
を関連付けて記録すること、 を特徴とするもの。 - 【請求項24】請求項15〜23に係る同義語・類義語
辞書生成装置、同義語・類義語辞書生成用プログラム、
及び同義語・類義語辞書生成用プログラムを記録した記
録媒体において、 前記同義語・類義語辞書生成装置は、 前記第1の検索語情報と第2の検索語情報とを同義語若
しくは類義語と判断する際に、語句の意味を記録した電
子辞書から当該第1の検索語情報及び第2の検索語情報
に対応する電子辞書情報を、それぞれ第1の電子辞書情
報、第2の電子辞書情報として抽出し、 抽出した第1の電子辞書情報と第2の電子辞書情報に基
づいて、前記第1の検索語情報と前記第2の検索語情報
との近似性を算出し、 算出した近似性が所定の値以上の場合、前記第1の検索
語情報と第2の検索語情報とを同義語若しくは類義語と
判断すること、 を特徴とするもの。 - 【請求項25】請求項24に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 前記電子辞書に前記第1の電子辞書情報及び第2の電子
辞書情報が存在しない場合、当該第1の検索語情報及び
第2の検索語情報に基づいて、前記第1の検索語情報と
前記第2の検索語情報に関する出現率を算出し、 前出した出現率が所定の条件を満たす場合に、前記第1
の検索語情報と第2の検索語情報とを同義語若しくは類
義語と判断すること、 を特徴とするもの。 - 【請求項26】請求項25に係る同義語・類義語辞書生
成装置、同義語・類義語辞書生成用プログラム、及び同
義語・類義語辞書生成用プログラムを記録した記録媒体
において、 前記同義語・類義語辞書生成装置は、 前記出現率を、全ての検索回数及び前記第1の検索語情
報及び前記第2の検索語情報を取得した取得回数に基づ
いて算出すること、 を特徴とするもの。 - 【請求項27】請求項24〜26に係る同義語・類義語
辞書生成装置、同義語・類義語辞書生成用プログラム、
及び同義語・類義語辞書生成用プログラムを記録した記
録媒体において、 検索において、さらに、検索条件情報を獲得し、 獲得した検索条件情報が、前記第1の検索語情報と前記
第2の検索語情報とをand条件により検索を行う旨のも
のであった場合、他の検索において、前記第1の検索語
情報及び第2の検索語情報を獲得した場合でも、当該第
1の検索語情報と第2の検索語情報とを同義語若しくは
類義語と判断しないこと、 を特徴とするもの。 - 【請求項28】請求項24〜26に係る同義語・類義語
辞書生成装置、同義語・類義語辞書生成用プログラム、
及び同義語・類義語辞書生成用プログラムを記録した記
録媒体において、 検索において、さらに、検索条件情報を獲得し、 獲得した検索条件情報が、前記第1の検索語情報と前記
第2の検索語情報とをor条件により検索を行う旨のもの
であった場合には、他の検索において、前記第1の検索
語情報及び第2の検索語情報を獲得した場合、当該第1
の検索語情報と第2の検索語情報とを同義語若しくは類
義語と判断すること、 を特徴とするもの。 - 【請求項29】検索結果情報を提供する検索結果情報提
供方法において、 検索語情報を獲得し、 語句に対応する同義語若しくは類義語が記録されている
同義語・類義語辞書から、獲得した検索語情報に対応す
る同義語若しくは類義語を、対応同義語・類義語情報と
して抽出し、 獲得した前記検索語情報に基づいた情報の検索を行い、
検索結果情報を生成し、 生成した前記検索結果情報及び抽出した前記対応同義語
・類義語情報に基づいて統合検索結果情報を生成し、 生成した統合検索結果情報を送信すること、 を特徴とする検索結果情報提供方法。 - 【請求項30】同義語及び類義語を記録して同義語・類
義語辞書を生成する同義語・類義語辞書生成方法におい
て、 一連の検索において、第1の検索語情報及び第2の検索
語情報を獲得し、他の一連の検索において、前記第1の
検索語情報及び第2の検索語情報を獲得した場合、当該
第1の検索語情報と第2の検索語情報とを同義語若しく
は類義語と判断し、 前記第1の検索語情報と第2の検索語情報とを関連付け
て、同義語・類義語辞書に記録すること、 を特徴とする同義語・類義語辞書生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002018239A JP2003216634A (ja) | 2002-01-28 | 2002-01-28 | 情報検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002018239A JP2003216634A (ja) | 2002-01-28 | 2002-01-28 | 情報検索システム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008113972A Division JP2008234679A (ja) | 2008-04-24 | 2008-04-24 | 情報検索システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003216634A true JP2003216634A (ja) | 2003-07-31 |
Family
ID=27653663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002018239A Pending JP2003216634A (ja) | 2002-01-28 | 2002-01-28 | 情報検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003216634A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006285460A (ja) * | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | 情報検索システム |
JP2007034463A (ja) * | 2005-07-25 | 2007-02-08 | Yafoo Japan Corp | 情報検索システム、情報検索プログラム |
JP2007188225A (ja) * | 2006-01-12 | 2007-07-26 | Yafoo Japan Corp | 要約文抽出システム |
CN100399334C (zh) * | 2004-09-24 | 2008-07-02 | 株式会社东芝 | 搜索结构化文档的设备和方法 |
JP2008152454A (ja) * | 2006-12-15 | 2008-07-03 | Industrial Property Cooperation Center | 類義語統合システム |
KR101301534B1 (ko) | 2009-12-14 | 2013-09-04 | 한국전자통신연구원 | 이형태 자동 구축 방법 및 장치 |
JP2018197924A (ja) * | 2017-05-23 | 2018-12-13 | 株式会社日立製作所 | 情報処理装置、対話処理方法、及び対話処理プログラム |
JPWO2020079751A1 (ja) * | 2018-10-16 | 2021-10-28 | 株式会社島津製作所 | 文献検索方法および文献検索システム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6325774A (ja) * | 1986-07-18 | 1988-02-03 | Matsushita Electric Ind Co Ltd | 情報登録検索装置 |
JPH05181912A (ja) * | 1991-12-27 | 1993-07-23 | Toshiba Corp | 文書検索装置 |
JPH06314296A (ja) * | 1993-03-02 | 1994-11-08 | Fujitsu Ltd | 情報検索システム |
JPH086963A (ja) * | 1994-06-15 | 1996-01-12 | Fuji Xerox Co Ltd | 文字列検索装置 |
JPH09319767A (ja) * | 1996-05-29 | 1997-12-12 | Oki Electric Ind Co Ltd | 類義語辞書登録方法 |
JPH10320419A (ja) * | 1997-05-22 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報関連づけ装置およびその方法 |
WO1999066427A1 (en) * | 1998-06-15 | 1999-12-23 | Amazon.Com, Inc. | System and method for refining search queries |
JP2001092850A (ja) * | 2000-08-08 | 2001-04-06 | Hitachi Ltd | 情報検索用端末装置及び情報検索用端末装置にける情報表示・入出力方法 |
-
2002
- 2002-01-28 JP JP2002018239A patent/JP2003216634A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6325774A (ja) * | 1986-07-18 | 1988-02-03 | Matsushita Electric Ind Co Ltd | 情報登録検索装置 |
JPH05181912A (ja) * | 1991-12-27 | 1993-07-23 | Toshiba Corp | 文書検索装置 |
JPH06314296A (ja) * | 1993-03-02 | 1994-11-08 | Fujitsu Ltd | 情報検索システム |
JPH086963A (ja) * | 1994-06-15 | 1996-01-12 | Fuji Xerox Co Ltd | 文字列検索装置 |
JPH09319767A (ja) * | 1996-05-29 | 1997-12-12 | Oki Electric Ind Co Ltd | 類義語辞書登録方法 |
JPH10320419A (ja) * | 1997-05-22 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報関連づけ装置およびその方法 |
WO1999066427A1 (en) * | 1998-06-15 | 1999-12-23 | Amazon.Com, Inc. | System and method for refining search queries |
JP2002518748A (ja) * | 1998-06-15 | 2002-06-25 | アマゾン ドット コム インコーポレイテッド | 検索照会改善システムおよび方法 |
JP2001092850A (ja) * | 2000-08-08 | 2001-04-06 | Hitachi Ltd | 情報検索用端末装置及び情報検索用端末装置にける情報表示・入出力方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100399334C (zh) * | 2004-09-24 | 2008-07-02 | 株式会社东芝 | 搜索结构化文档的设备和方法 |
JP2006285460A (ja) * | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | 情報検索システム |
JP2007034463A (ja) * | 2005-07-25 | 2007-02-08 | Yafoo Japan Corp | 情報検索システム、情報検索プログラム |
JP2007188225A (ja) * | 2006-01-12 | 2007-07-26 | Yafoo Japan Corp | 要約文抽出システム |
JP2008152454A (ja) * | 2006-12-15 | 2008-07-03 | Industrial Property Cooperation Center | 類義語統合システム |
JP4656330B2 (ja) * | 2006-12-15 | 2011-03-23 | 一般財団法人工業所有権協力センター | 類義語統合システム |
KR101301534B1 (ko) | 2009-12-14 | 2013-09-04 | 한국전자통신연구원 | 이형태 자동 구축 방법 및 장치 |
JP2018197924A (ja) * | 2017-05-23 | 2018-12-13 | 株式会社日立製作所 | 情報処理装置、対話処理方法、及び対話処理プログラム |
JPWO2020079751A1 (ja) * | 2018-10-16 | 2021-10-28 | 株式会社島津製作所 | 文献検索方法および文献検索システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8606778B1 (en) | Document ranking based on semantic distance between terms in a document | |
JP3099756B2 (ja) | 文書処理装置、単語抽出装置及び単語抽出方法 | |
US6915295B2 (en) | Information searching method of profile information, program, recording medium, and apparatus | |
US7636713B2 (en) | Using activation paths to cluster proximity query results | |
US9576029B2 (en) | Trust propagation through both explicit and implicit social networks | |
US7428538B2 (en) | Retrieval of structured documents | |
US7406459B2 (en) | Concept network | |
US9092488B2 (en) | Determination of a desired repository for retrieving search results | |
US7096214B1 (en) | System and method for supporting editorial opinion in the ranking of search results | |
CN103106282B (zh) | 一种网页搜索与展示的方法 | |
US9613061B1 (en) | Image selection for news search | |
US20020099685A1 (en) | Document retrieval system; method of document retrieval; and search server | |
US20020143797A1 (en) | File classification management system and method used in operating systems | |
US9031898B2 (en) | Presentation of search results based on document structure | |
US20080134015A1 (en) | Web Site Structure Analysis | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
US20180004838A1 (en) | System and method for language sensitive contextual searching | |
US6941293B1 (en) | Methods and apparatus for determining equivalent descriptions for an information need | |
KR20040087205A (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
US9971782B2 (en) | Document tagging and retrieval using entity specifiers | |
US20020040363A1 (en) | Automatic hierarchy based classification | |
JP2004341753A (ja) | 検索支援装置、検索支援方法、およびプログラム | |
JP3584848B2 (ja) | 文書処理装置、項目検索装置及び項目検索方法 | |
JPH11102377A (ja) | データベースからドキュメントを検索する方法および装置 | |
JP2003216634A (ja) | 情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050301 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080424 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080526 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080807 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080926 |