JP3563682B2 - 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 - Google Patents
次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP3563682B2 JP3563682B2 JP2000277195A JP2000277195A JP3563682B2 JP 3563682 B2 JP3563682 B2 JP 3563682B2 JP 2000277195 A JP2000277195 A JP 2000277195A JP 2000277195 A JP2000277195 A JP 2000277195A JP 3563682 B2 JP3563682 B2 JP 3563682B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- candidate word
- relevance
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
近年、インターネットなどのコンピュータネットワークを通じて、大量の電子化された文書をやり取りしたり、不特定多数を対象にした情報発信ができるようになっている。そのため、そのような文書情報を対象に、個人が必要とする情報を検索できるようなサービスが不特定多数を対象にネットワーク上で実現されている。
【0003】
しかし、自分が欲しい結果を得ることができない場合が多い。その原因として、その結果を得るために用いた検索語が不十分であったり、検索語の表記の揺れ(例えば、英語表記とカタカナ表記:「search engine」「サーチエンジン」な ど)のためであったりする。それらを解消する方法として、検索サービス側から検索できる単語を次の検索時に利用できるように提案する手法が検討されている(「絞り込み検索語候補の抽出に関する一検討」、井上他、情報処理学会第56回全国大会、第3分冊、pp.3−95,1998)。
【0004】
次検索に利用される候補となる単語(次検索候補単語)を用意する方法として、大きく分けて3種類あると考えられる。(1)検索対象と全く別に独自に作成したもの、(2)文書内から抽出したもの、(3)検索サービス利用者の実際の入力から抽出したものである。(1)は、百科事典などのように検索対象が大きく変化しない場合は、表記の揺れを吸収するような辞書を用意しておく価値はあると思われるが、インターネットのWebページのように検索対象が日々変化する場合には不向きである。(2)は、検索対象内に存在する単語を提示するため、次検索時に単語を追加することで検索結果が非常に少なくなるような場合は避けることができるが、利用者からみれば検索しようとしている単語が提示されるとは限らず不便な場合がある。(3)は、次検索時に自分以外の検索サービス利用者が入力した同じような単語を見ることができるため、利用者にとっては理解しやすい検索語をサービス提供側から提供できる。
【0005】
また、検索入力から入力された単語と入力された時間、および検索入力した人を特定するためのIDから、検索語のグループを生成する手法は公知の事実である(「WWW検索ログに基づく情報ニーズの抽出」、大久保他、情報処理学会論文誌、Vol 39,No.7,pp.2250−2258,1998)。その利用方法としては、検索結果を 返す際に、入力された検索語を含むグループが抽出されたグループ内に存在するかどうかを調べ、存在する場合はそのグループ内に存在する単語を次検索候補単語として表示する。
【0006】
【発明が解決しようとする課題】
しかし、単純にグループ化された単語は確かに関連があるが、その中には表記の揺れによる単語やなんらかの特定の情報を求めようとするための単語が混合した状態で抽出されるため、次検索時の適切な単語を選択することが困難であるという問題がある。
【0007】
本発明は、上記に鑑みてなされたもので、その目的とするところは、次検索候補単語を提示する場合にグループ内で単語を分類してより細分化したグループを生成して提示する次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体を提供することにある。
【0008】
【課題を解決するための手段】
上記目的を達成するため、第1の本発明は、大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示方法であって、入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録し、この記録された検索入力履歴情報を分析し、検索語間の関連度を計算し、この計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出し、この抽出した次検索候補単語を提示し、前記検索語間の関連度の計算処理では、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、前記次検索候補単語の抽出処理では、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更にこの抽出された次検索候補単語を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出し、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化することを要旨とする。
【0009】
本発明にあっては、入力された検索語を入力時刻、検索者識別情報とともに検索入力履歴情報として記録し、この検索入力履歴情報を分析し、検索語間の関連度を計算し、この検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出して提示するため、検索利用者はこの提示された次検索候補単語を利用することにより所望の情報に容易に辿りつくことができる。
【0011】
また、本発明にあっては、検索入力履歴情報を用いて、検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、この計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更に間隔関連度および選択関連度を用いて次検索候補単語を抽出し、この抽出した次検索候補単語を検索語間の距離に基づきグループ化するため、次検索時に使用し得る適切な単語を適確に抽出することができる。
【0012】
第2の本発明は、大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示装置であって、入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録する検索語記録手段と、この記録された検索入力履歴情報を分析し、検索語間の関連度を計算する検索語解析手段と、この計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出する次検索候補単語抽出手段と、この抽出した次検索候補単語を提示する次検索候補単語提示手段とを有し、前記検索語計算手段は、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算する手段を有し、前記次検索候補単語抽出手段は、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更にこの抽出された次検索候補単語 を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出し、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化する手段を有することを要旨とする。
【0013】
本発明にあっては、入力された検索語を入力時刻、検索者識別情報とともに検索入力履歴情報として記録し、この検索入力履歴情報を分析し、検索語間の関連度を計算し、この検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出して提示するため、検索利用者はこの提示された次検索候補単語を利用することにより所望の情報に容易に辿りつくことができるた め、次検索時に使用し得る適切な単語を適確に抽出することができる。
【0015】
また、本発明にあっては、検索入力履歴情報を用いて、検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、この計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更に間隔関連度および選択関連度を用いて次検索候補単語を抽出し、この抽出した次検索候補単語を検索語間の距離に基づきグループ化する。
【0016】
第3の本発明は、大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示プログラムを記録した記録媒体であって、検索語記録手段に入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録させ、検索語解析手段にこの記録された検索入力履歴情報を分析させ、検索語間の関連度を計算させ、次検索候補単語抽出手段にこの計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出させ、次検索候補単語提示手段にこの抽出した次検索候補単語を提示させ、前記検索語計算手段に、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算させ、前記次検索候補単語抽出手段に、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出させ、更にこの抽出された次検索候補単語を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出させ、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化させる処理を実行する次検索候補単語提示プログラムを記録媒体に記録することを要旨とする。
【0017】
本発明にあっては、入力された検索語を入力時刻、検索者識別情報とともに検索入力履歴情報として記録し、この検索入力履歴情報を分析し、検索語間の関連度を計算し、この検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出して提示する次検索候補単語提示プログラムを記録媒体に記録しているため、該記録媒体を用いて、その流通性を高めることができる。
【0019】
また、本発明にあっては、検索入力履歴情報を用いて、検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、この計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更に間隔関連度および選択関連度を用いて次検索候補単語を抽出し、この抽出した次検索候補単語を検索語間の距離に基づきグループ化する次検索候補単語提示プログラムを記録媒体に記録しているため、該記録媒体を用いて、その流通性を高めることができる。
【0020】
【発明の実施の形態】
最初に、本発明の次検索候補単語提示方法の基本概念として検索サービスを利用する複数の人の検索入力履歴から単語のグループ化を行なう方法について説明する。
【0021】
まず、検索入力履歴として、(1)検索入力された単語、(2)入力された時間、(3)検索入力した人を特定するためのIDを取得する。同一の利用者によって利用された検索語は、その使用時間間隔が短ければ同じ情報を求めるために、長ければ別の情報を求めるために、それぞれ利用された可能性が高いと仮定できる。よって、利用者iの検索語x,yの使用時間差の最小値をtmini[x ,y]とし、単語x,yの間隔関連度をTxyとすと
【数1】
として定義する。ただし、0<t1<t2 であり、aは実数値とする。
【0022】
また、上記の検索入力履歴に加え、(4)検索入力された単語に対する検索結果から選択した項目を取得し、単語間の関連度の計算に利用する。(4)の情報を用いて、単語x,yの選択関連度CLxyを、
【数2】
として定義する。
【0023】
次に、単語間の関連度を用いて単語をグループ化する。その方法として(1)単語間の距離(類似度)を定義し、(2)距離の近い単語から1つのグループに割り当てる。
【0024】
単語間の距離は、当然、上記で求めた間隔関連度Txyや選択関連度CLxyなどをそのまま使うこともできるし、別の定義の方法もある。例えば、単語x,yの距離Disxyを、
【数3】
といった、いわゆるベクトルの内積(三角関数のcosθ)とし、値が大きい方が距離が近いと定義することができる。
【0025】
検索入力に対する間隔関連度のみを用いた距離Disxyの特徴として、表記の揺れによって入力された単語、あるいは別の単語に容易に置換可能な単語の距離が近くなる(例えば、「コンピュータ」「コンピューター」、「旅行」「国際旅行」「国内旅行」、「プロバイダ」「プロバイダー」など)。なぜなら、間隔関連度のみを用いた距離Disxyは、同じような分布を示す単語同士が値が大きくなる傾向があるからである。例をあげると、実際の入力として「旅行 格安」「 海外旅行 格安」「国内旅行 格安」という入力があれば「旅行」「海外旅行」「国内旅行」は同じような単語の使われ方をし、これらの距離の値は大きくなる。
【0026】
また、間隔関連度や選択関連度をそのまま単語間の距離として用いた場合、より詳細な検索を実現するための追加単語(例えば、「携帯電話」に対し「着信メロディ」「通話料金」「割引」「通話エリア」「着メロ」など)の距離が近くなる。
【0027】
(2)のグループ分けは、検索入力に対し距離の近い(すなわち、関連のある)単語を単純に並べて表示するのではなく、距離の近い単語集合内でもさらに距離の近い単語同士をグループ化して表示しようとするものである。例えば、先ほどの「携帯電話」と関連がある単語の例を用いると、「着信メロディ」「着メロ」、「通話料金」「割引」、「通話エリア」の3つのグループに分けて提示する。その方法として、まず、候補を出す検索語と関連のある単語を間隔関連度あるいは選択関連度を用いて抽出する。次に、抽出された単語グループ内の単語同士の距離Disxyを求めて、グループ分けを行なう。
【0028】
グループ分けをした結果の利用法として、例えば、表示の際にグループ化された単語集合の中から代表となる単語を抽出し提示することで、重複した不必要な次検索候補単語の提示を避けることが可能となる。
【0029】
以上、これらの関連度を使うことで、次検索のための単語として検索サービス利用者に対してどのような単語を追加することが必要かを容易に検討できるようになる。
【0030】
次に、図面を用いて、本発明の実施形態について説明する。図1は、本発明の一実施形態に係る次検索候補単語提示装置の構成を示すブロック図である。図1に示す次検索候補単語提示装置は、通常の検索サービスを行なっている時に入力された検索語を該検索語の入力時刻、コンピュータのアドレス、検索者を特定するための検索者識別情報である個人ID、および検索結果内で選択した項目の情報などとともに検索入力履歴情報として図2に示すように記録する検索語記録部1、この検索語記録部1において記録した検索入力履歴情報を分析し、検索時に入力された検索語間の関連度、具体的には前記単語間の間隔関連度Txy、単語間の選択関連度CLxy、単語間の距離Disxyを計算する検索語解析部3、検索サービスに対して入力された検索語を受け入れる検索語入力部5、前記検索語解析部3で計算した検索語間の関連度および検索語入力部5で受け入れた入力検索語を用いて、次検索候補として適した単語グループの抽出を行なう次検索候補作成部7、およびこの次検索候補作成部7で抽出した単語のグループを次検索時に利用できるように出力する次検索候補出力部9から構成されている。なお、検索語入力部5から入力された検索語は自動的に検索語記録部1に記録され、検索語解析部3での処理時に利用されることは勿論のことである。
【0031】
検索語解析部3は、上述したように検索語記録部1で記録した検索入力履歴情報を分析して単語間の間隔関連度Txy、単語間の選択関連度CLxy、単語間の距離Disxyを計算するとともに、抽出された全単語の集合をLWとする。この時、検索語記録部1で記録した情報は、記録を開始した時からある時点までのすべての検索入力の記録を利用する場合もあるし、またはある期間だけに限定して利用する場合も考えられる。
【0032】
期間を限定する例としては、例えば「各週の日曜日の0:00からそれ以前の2週間前の日曜日の0:00までの検索入力の記録から関連度を求める」といった限定方法がある。また、記録を開始した時からある時点までのすべての検索入力の記録を利用する方法では、長期にわたり普遍的に利用された単語間の関連度が高くなる傾向があり(例えば、距離Disxyを用いると「映画」と「映画館」)、期間を限定する方法では、短期間に利用された単語間の関連度が高くなる傾向がある(例えば、距離Disxyを用いると「映画」と「(流行している映画名)」)。
【0033】
図3は、検索語解析部3で計算された単語間の関連度を示す図である。図3(a)は、検索語記録部1で記録された図2に示したような検索語の記録から抽出された単語を示すものであり、図3(b)は、このように抽出された各単語間の関連度を記録した関連語テーブルを示しているものである。図3(b)に示す関連語テーブルは、間隔関連度Txy、選択関連度CLxy、距離Disxyのそれぞれ毎に同様なテーブルが作成される。
【0034】
選択関連度について図4を参照して説明する。例えば、「桜の名所」と「桜の花見」という2つの検索入力を考えると、この検索入力では同じ単語を含む入力を行なっているため、短期間に検索入力として投入されることは少なく、間隔関連度では、このような単語の関連度を計算できない。そこで、検索結果内から選択した項目を見ることにより、要求として関連があるかどうか判断するための関数が選択関連度である。すなわち、検索結果内で選択された項目が同じである割合が多い単語同士は関連があるとするものである。
【0035】
次検索候補作成部7は、検索語解析部3の解析結果である検索語間の関連度と検索語入力部5からの入力検索語から次検索候補として適した単語グループを抽出するが、更に具体的には図5および図6のフローチャートに示すような処理を行なう。
【0036】
次検索候補作成部7は、図5に示すフローチャートでは、まず検索語入力部5からの検索入力kに対して検索語解析部3で計算した距離Diskyが第1の閾値th1以上の上位n1個の単語を単語集合LWから抽出し、この抽出結果をRes1に保存する(ステップS11)。
【0037】
それから、このRes1に保存された単語を除いて、検索入力kに対して検索語解析部3で計算した間隔関連度Tkyが第2の閾値th2以上の上位n2個の単語を単語集合LWから抽出し、この抽出結果をRes2に保存する(ステップS13)。また更に、Res1,Res2に保存された単語を除いて、検索入力kに対して選択関連度CLkyが第3の閾値th3以上の上位n3個の単語を単語集合LWから抽出し、この抽出結果をRes3に保存する(ステップS15)。
【0038】
この結果、検索語入力部5からの入力検索語に対して、単語集合LWから関連度の高い単語として、所定の閾値以上の距離Disky、間隔関連度Tky、選択関連度CLkyを有する単語がそれぞれRes1,Res2,Res3に保存されることになる。なお、この処理では、検索語解析部3で抽出した図3(b)に示すような関連語テーブルの値を用いることにより、関連度の高い単語を容易に見つけることができる。
【0039】
また、次検索候補作成部7は、図6のフローチャートに示すように、単語集合Res2内に保存された単語を更に分類してグループ化する。すなわち、この図6に示す処理では、単語間の距離Diskyを用いるため、集合Res2内の単語wj の特徴ベクトルWVj=(Tj1 ,…,Tjn)を求める(ステップS21)。なお、Tijは間隔関連度である。それから、集合Res2内から距離Disxyを用いて、最も関連した単語の組(x,y)を探索する(ステップS23)。そして、終了条件を判定して(ステップS25)、終了条件が満たされていない場合には、新たなクラスタを生成して集合Res2に登録する(ステップS27)。それから、集合Res2内の単語x,yの情報を削除し(ステップS29)、ステップS23に戻り、終了条件が満たされるまで、同じ処理を繰り返して、Res2内の単語をグループ化する。
【0040】
すなわち、この処理では、分類のために間隔関連度Txyを用いた距離Disxyを使用し、単語間の関連度を定義し、最も関連した単語同士から1つの集合(クラスタ)に割り当てるという方法で分類を行なっているものである。
【0041】
例えば、「本」という検索入力に対して、単語集合Res2には{「検索」「カタログ」「予約」「通販」「通信販売」}が抽出されたとすると、図6に示す次検索候補作成部7の処理によりRes2内の単語は、{「検索」「カタログ」「予約」{「通販」「通信販売」}}というように「通販」「通信販売」を1つのクラスタに割り当てる。追加する単語として{「通販」「通信販売」}を選択した場合には、「本かつ(通販または通信販売)」という検索を次検索入力として生成することができるものである。
【0042】
次に、本実施形態の次検索候補単語提示装置の処理の流れを具体的に説明する。本次検索候補単語提示装置が検索対象とする文書は、コンピュータネットワークであるインターネット上のWWWページ(HTMLファイル)とする。検索サービスを行なっている場合に、入力された検索語は該検索語の入力時刻、コンピュータのアドレス、検索者を特定するための検索者識別情報である個人ID、および検索結果内で選択した項目の情報などとともに検索入力履歴情報として検索語記録部1で図2に示すように記録される。
【0043】
次に、検索語解析部3は、検索語記録部1で記録された検索語を分析し、単語間の関連度、すなわち単語間の間隔関連度Txy、単語間の選択関連度CLxy、単語間の距離Disxyを計算し、図3に示すようなテーブルを間隔関連度Txy、選択関連度CLxy、距離Disxy毎に作成する。
【0044】
次検索候補作成部7は、検索語解析部3で計算した単語間の関連度を用いて、検索語入力部5から入力された単語に対して再検索に有効な単語の抽出およびグループ化を行なう。
【0045】
例えば、図7に示すように、検索語記録部1から入力された単語が「インタネット」であったとする。この入力単語に対して、単語間の間隔関連度Txyを使用した距離Disxyを用いて、関連のある語を求めると、「インターネット」「Internet」などが関連語として抽出される。
【0046】
また、単語間の間隔関連度Txyを使用して関連のある語を求めると、「設定」「説明」「パソコン」「接続方法」「料金」「プロバイダ」などの検索を絞り込むような単語が抽出される。
【0047】
これらの抽出された単語に対して、更に単語間の間隔関連度Txyを使用した距離Disxyによって分類を行なうと、図7に示すように、「料金」「プロバイダ」というグループ、「接続方法」「パソコン」「設定」というグループ、および「説明」というグループに分けられることになる。
【0048】
また更に、単語間の選択関連度を使用して関連のある語を求めると、上記単語以外にその他の単語として、図8に示すように、「インターネットTV」「ケーブルインターネット」や、更には「LAN」「無線」「米国」「軍事ネットワーク」などのように更に多岐に渡る単語が抽出される。
【0049】
上述したように、次検索候補作成部7で抽出された単語グループは、次検索候補出力部9に送られ、次検索候補出力部9において検索結果とともに提示されることになる。
【0050】
なお、上記実施形態の次検索候補単語提示方法の処理手順をプログラムとして記録媒体に記録して、この記録媒体をコンピュータシステムに組み込むとともに、該記録媒体に記録されたプログラムをコンピュータシステムにダウンロードまたはインストールし、該プログラムでコンピュータシステムを作動させることにより、次検索候補単語提示方法を実施する次検索候補単語提示装置として機能させることができることは勿論であり、このような記録媒体を用いることにより、その流通性を高めることができるものである。
【0051】
【発明の効果】
以上説明したように、本発明によれば、入力された検索語を入力時刻、検索者識別情報とともに検索入力履歴情報として記録し、この検索入力履歴情報を分析し、検索語間の関連度を計算し、この検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出して提示するので、検索利用者はこの提示された次検索候補単語を利用することにより所望の情報に容易に辿りつくことができる。
【0052】
また、本発明によれば、検索入力履歴情報を用いて、検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、この計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更に間隔関連度および選択関連度を用いて次検索候補単語を抽出し、この抽出した次検索候補単語を検索語間の距離に基づきグループ化するので、次検索時に使用し得る適切な単語を適確に抽出することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る次検索候補単語提示装置の構成を示すブロック図である。
【図2】図1に示す次検索候補単語提示装置に使用されている検索語記録部で記録される検索の記録例である検索入力履歴情報を示す図である。
【図3】図1に示す次検索候補単語提示装置に使用されている検索語解析部で計算される単語間の関連度を示す図である。
【図4】図1に示す次検索候補単語提示装置に使用されている検索語解析部で計算される選択関連度の考え方を示す説明図である。
【図5】図1に示す次検索候補単語提示装置に使用されている次検索候補作成部による検索入力に対する次検索候補単語抽出処理(1)を示すフローチャートである。
【図6】図1に示す次検索候補単語提示装置に使用されている次検索候補作成部による検索入力に対する次検索候補単語抽出処理(2)を示すフローチャートである。
【図7】図1に示す次検索候補単語提示装置の出力イメージ(1)を示す説明図である。
【図8】図1に示す次検索候補単語提示装置の出力イメージ(2)を示す説明図である。
【符号の説明】
1 検索語記録部
3 検索語解析部
5 検索語入力部
7 次検索候補作成部
9 次検索候補出力部
Claims (3)
- 大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示方法であって、
入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録し、
この記録された検索入力履歴情報を分析し、検索語間の関連度を計算し、
この計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出し、
この抽出した次検索候補単語を提示し、
前記検索語間の関連度の計算処理では、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算し、
前記次検索候補単語の抽出処理では、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更にこの抽出された次検索候補単語を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出し、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化すること
を特徴とする次検索候補単語提示方法。 - 大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示装置であって、
入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録する検索語記録手段と、
この記録された検索入力履歴情報を分析し、検索語間の関連度を計算する検索語解析手段と、
この計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出する次検索候補単語抽出手段と、
この抽出した次検索候補単語を提示する次検索候補単語提示手段とを有し、
前記検索語計算手段は、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算する手段を有し、
前記次検索候補単語抽出手段は、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出し、更にこの抽出された次検索候補単語 を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出し、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化する手段
を有することを特徴とする次検索候補単語提示装置。 - 大量の文書から所望の情報を検索する場合において再検索を支援するための次検索候補単語を過去に検索要求として入力された検索語から抽出して提示する次検索候補単語提示プログラムを記録した記録媒体であって、
検索語記録手段に入力された検索語を該検索語の入力時刻、検索者を特定するための検索者識別情報とともに検索入力履歴情報として記録させ、
検索語解析手段にこの記録された検索入力履歴情報を分析させ、検索語間の関連度を計算させ、
次検索候補単語抽出手段にこの計算した検索語間の関連度および入力された検索語を用いて、次検索候補単語を抽出させ、
次検索候補単語提示手段にこの抽出した次検索候補単語を提示させ、
前記検索語計算手段に、前記検索入力履歴情報として記録されている検索語、入力時刻、検索者識別情報、および検索結果から選択した項目の情報を用いて、前記検索語間の間隔関連度、選択関連度、および検索語間の距離を計算させ、
前記次検索候補単語抽出手段に、前記計算した検索語間の距離を用いて、関連のある単語を次検索候補単語として抽出させ、更にこの抽出された次検索候補単語を除いた検索語から、前記計算した間隔関連度および選択関連度を用いて次検索候補単語を抽出させ、更にこの抽出した次検索候補単語を前記計算した検索語間の距離に基づきグループ化させる 処理を実行することを特徴とする次検索候補単語提示プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000277195A JP3563682B2 (ja) | 2000-09-12 | 2000-09-12 | 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000277195A JP3563682B2 (ja) | 2000-09-12 | 2000-09-12 | 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002092032A JP2002092032A (ja) | 2002-03-29 |
JP3563682B2 true JP3563682B2 (ja) | 2004-09-08 |
Family
ID=18762558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000277195A Expired - Lifetime JP3563682B2 (ja) | 2000-09-12 | 2000-09-12 | 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3563682B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316807A (ja) * | 2002-04-23 | 2003-11-07 | Communication Research Laboratory | 情報検索装置及び情報検索ソフトウェアを格納した記憶媒体 |
WO2004042615A1 (en) * | 2002-09-30 | 2004-05-21 | Ning-Ping Chan | Blinking annotation callouts highlighting cross language search results |
WO2004038547A2 (en) | 2002-10-21 | 2004-05-06 | Ebay Inc. | Listing recommendation in a network-based commerce system |
JP4144388B2 (ja) * | 2003-03-13 | 2008-09-03 | 日本電気株式会社 | 知識リンク提供プログラム、知能マップ生成プログラム、知能レイヤー管理プログラム、管理装置及び管理方法 |
JP4471737B2 (ja) * | 2003-10-06 | 2010-06-02 | 日本電信電話株式会社 | グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム |
US7158966B2 (en) | 2004-03-09 | 2007-01-02 | Microsoft Corporation | User intent discovery |
JP3868435B2 (ja) * | 2004-04-19 | 2007-01-17 | 株式会社ソニー・コンピュータエンタテインメント | ゲームキャラクタの制御方法 |
JP4535765B2 (ja) * | 2004-04-23 | 2010-09-01 | 富士通株式会社 | コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置 |
JP2005316699A (ja) * | 2004-04-28 | 2005-11-10 | Hitachi Ltd | コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム |
JP4453437B2 (ja) * | 2004-05-11 | 2010-04-21 | 日本電信電話株式会社 | 検索キーワード順位付け方法及び装置及びプログラム |
JP2006031391A (ja) * | 2004-07-15 | 2006-02-02 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索システム |
JP2006085389A (ja) * | 2004-09-15 | 2006-03-30 | Kyoto Univ | 検索装置 |
US8200687B2 (en) * | 2005-06-20 | 2012-06-12 | Ebay Inc. | System to generate related search queries |
JP4820627B2 (ja) * | 2005-11-16 | 2011-11-24 | パナソニック株式会社 | 対応付け装置 |
JP4750674B2 (ja) * | 2006-11-08 | 2011-08-17 | 富士通株式会社 | データ表示制御プログラム、データ表示制御方法およびデータ表示制御装置 |
JP4910817B2 (ja) * | 2007-03-26 | 2012-04-04 | 富士通株式会社 | 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法 |
JP4998038B2 (ja) * | 2007-03-26 | 2012-08-15 | 富士通株式会社 | 検索候補語句提示装置、検索候補語句提示プログラムおよび検索候補語句提示方法 |
CN101276361B (zh) * | 2007-03-28 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 一种显示相关关键词的方法及系统 |
CN101286150B (zh) | 2007-04-10 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 生成更新参数的方法和装置、展示相关关键词的方法和装置 |
JP2008262442A (ja) * | 2007-04-13 | 2008-10-30 | Yahoo Japan Corp | 検索キーデータを表示させる方法及びサーバ |
US8051040B2 (en) | 2007-06-08 | 2011-11-01 | Ebay Inc. | Electronic publication system |
JP2009064391A (ja) * | 2007-09-10 | 2009-03-26 | Sharp Corp | キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体 |
JP2009140306A (ja) * | 2007-12-07 | 2009-06-25 | Toshiba Corp | 情報提供サーバおよび情報提供方法 |
JP4962967B2 (ja) * | 2008-01-11 | 2012-06-27 | ヤフー株式会社 | Webページ検索サーバ及びクエリ推薦方法 |
CN101952825B (zh) * | 2008-02-20 | 2013-07-24 | 松下电器产业株式会社 | 对话式节目检索装置 |
JP5020170B2 (ja) * | 2008-06-26 | 2012-09-05 | ヤフー株式会社 | ユーザに固有のイベントを判定する情報管理装置、情報管理方法及びプログラム |
KR101042901B1 (ko) * | 2008-10-09 | 2011-06-21 | 엔에이치엔비즈니스플랫폼 주식회사 | 광고 구매 히스토리에 기초하여 검색 광고용 키워드 페어를생성하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
JP5080544B2 (ja) * | 2009-07-23 | 2012-11-21 | 楽天株式会社 | 適切な検索クエリを提示する情報処理装置、情報処理方法、および、情報処理プログラム |
JP5079845B2 (ja) * | 2010-05-28 | 2012-11-21 | 富士通株式会社 | コンテンツナビゲーションプログラム |
JP5208229B2 (ja) * | 2011-02-16 | 2013-06-12 | ヤフー株式会社 | 検索サジェスト装置及び方法 |
KR101576935B1 (ko) * | 2014-03-07 | 2015-12-21 | 네이버 주식회사 | 정답 키워드 제공 방법 및 장치 |
KR101916798B1 (ko) | 2016-10-21 | 2018-11-09 | 네이버 주식회사 | 검색 컨텍스트를 이용한 질의 추천 방법 및 시스템 |
JP6825039B2 (ja) * | 2019-06-10 | 2021-02-03 | 三井住友海上火災保険株式会社 | 検索支援装置、検索支援方法およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1185794A (ja) * | 1997-09-12 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 検索語入力装置および検索語入力プログラムを記録した記録媒体 |
JPH11161658A (ja) * | 1997-11-27 | 1999-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 追加検索語の優先度計算方法及び装置及び追加検索語の優先度計算プログラムを格納した記憶媒体 |
JPH11250086A (ja) * | 1998-03-03 | 1999-09-17 | Hitachi Ltd | 検索支援システム |
JPH11338873A (ja) * | 1998-05-26 | 1999-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体 |
-
2000
- 2000-09-12 JP JP2000277195A patent/JP3563682B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002092032A (ja) | 2002-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3563682B2 (ja) | 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体 | |
JP5083669B2 (ja) | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム | |
KR102488914B1 (ko) | 콘텐츠에서 키워드를 추출하고, 추출된 키워드를 이용하여 콘텐츠를 추천하는 방법, 장치 및 프로그램 | |
KR101571240B1 (ko) | 텍스트에 기반한 동영상 생성장치 및 그 생성방법 | |
CN108959586A (zh) | 响应于可视化查询标识文本词汇 | |
KR101354721B1 (ko) | 검색 시스템 및 검색 서비스 방법 | |
KR20090033989A (ko) | 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을수행하기 위한 시스템 | |
JP2004341940A (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
CN110928986A (zh) | 法律证据的排序和推荐方法、装置、设备及存储介质 | |
CN106372231A (zh) | 一种搜索方法及装置 | |
KR101178208B1 (ko) | 키워드 추출 장치 및 방법 | |
JP6662689B2 (ja) | 単語判定装置 | |
CN113381927B (zh) | 基于旅游信息的社交媒体交互方法、系统及存储介质 | |
JP3693514B2 (ja) | 文書検索・分類方法および装置 | |
JP2004220267A (ja) | 画像検索方法および装置と画像検索プログラムおよび該プログラムを記録した記録媒体 | |
CN108228609A (zh) | 信息过滤方法和装置 | |
JP7081155B2 (ja) | 選択プログラム、選択方法、及び選択装置 | |
JP4544047B2 (ja) | Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP7131075B2 (ja) | 検索処理装置およびプログラム | |
JP2003150601A (ja) | 地域別特徴算出方法および地域別特徴算出装置ならびに地域別特徴算出プログラム | |
JP2006251975A (ja) | テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置 | |
JP2019164438A (ja) | レコメンド動画決定装置、レコメンド動画決定方法、およびプログラム | |
JP2006293616A (ja) | 文書集約方法及び装置及びプログラム | |
KR102369324B1 (ko) | 스마트경로 생성방법 및 장치 | |
JP2020042545A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3563682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120611 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140611 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |