JP3547074B2 - データ検索方法、その装置および記録媒体 - Google Patents
データ検索方法、その装置および記録媒体 Download PDFInfo
- Publication number
- JP3547074B2 JP3547074B2 JP15067998A JP15067998A JP3547074B2 JP 3547074 B2 JP3547074 B2 JP 3547074B2 JP 15067998 A JP15067998 A JP 15067998A JP 15067998 A JP15067998 A JP 15067998A JP 3547074 B2 JP3547074 B2 JP 3547074B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- data
- word
- relevance
- related word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 24
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012886 linear function Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、コンピュータネットワークを用いたデータ検索装置およびその方法に係り、特に、検索の結果、多数のデータが選択された場合に、自動的に検索データを分類し、出力するデータ検索装置および方法に関する。
【0002】
【従来の技術】
データ検索とは、文書等の集合をデータベース等に蓄積し、利用者が与えた検索式に関連する文書を、そのデータベースから取り出す技術である。検索式とは、たとえば「通信」のような1つの単語だけではなく、「通信AND計算機」のように、「通信」と「計算機」との両方の単語に関連する文書の取り出しを指定したり、「通信OR計算機」のように、「通信」と「計算機」とのうちのいずれかの単語に関連する文書の取り出しを指定する式である。ここで「単語に関連する文書」とは、ある文書にキーワードとしてある単語が予め付与されている場合、そのキーワードに対応する文書であり、また、ある文書中にある単語が含まれている場合、その単語に対応する文書である。
【0003】
従来、入力された検索式に従って検索し、照合したデータを提供するデータ検索システムにおいて、適合するデータが複数である場合、データベースに格納されている順序で出力、表示されることが一般的である。しかし、多数のデータが選択された場合、検索データの中から利用者が所望のデータを得ることが困難であり、利用者の作業が膨大になるという問題がある。
【0004】
そこで、文献(Donna Harman,”Ranking Algorithms”,in William B.Frakes and Ricardo Baeza−Yates eds. Information Retrieval, pp.363−392, PrenticeHall, 1992)には、入力された検索式に含まれる各検索語の使用頻度に基づいて、検索式と各検索データとの関連度を求める方法について記載されている。
【0005】
また、特開平04−252376に記載されているデータベース検索装置は、ユーザ別フリーキーワード格納部を設け、キーワードを含有する数の多い順に検索データを並び替え、つまり、検索データを順位付けし、この順位付けされた検索データを表示するようにしている。
【0006】
【発明が解決しようとする課題】
ところで、従来の順位付け装置または方法では、検索式に含まれる各検索語と、検索データであるデータとの関連度とに基づいて、検索データを順位付けしている。このため、対象となるデータが変わらなければ、同一の検索式に対する検索データの順位は、常に同じである。
【0007】
しかし、実際には、利用者が検索しようとするデータは、同じ検索語を用いた場合でも、その時々で変化する。たとえば、「天気」という同一の検索語を用いて検索しようとするデータは、各地の天気であったり、台風の現在位置や進路であったり、大雪の状況や道路の交通規制・鉄道などの運行状況であったり、夏休み期間の天気の一覧であったり、というように、検索したいデータは、同じ検索語を用いた場合でも、その時々で異なる。
【0008】
または、「オリンピック」という検索語を用いて検索しようとするデータは、オリンピックの開催中では競技結果に関するデータであったり、開催後は次のオリンピックに関するデータであったり、というように検索したいデータは、その時々で変わる。
【0009】
ところが、従来のデータ検索システムではこのような情報ニーズの変化には対応できていない。
【0010】
本発明は、入力された検索式に含まれる検索語だけではなく、その関連語も含めて、検索式と検索データとの関連度を求めて順位付けすることによって、利用者の欲する情報を優先して出力させることができ、操作性の向上した情報検索方法および装置を提供することを目的とするものである。
【0011】
【課題を解決するための手段】
本発明は、端末装置から入力された検索式に基づいて、所定のサーバが、所定データを検索し、この検索されたデータを上記端末装置に提供するデータ検索装置において、所定の語と、この所定の語に関連する関連語とが対応して格納され、上記サーバに設けられている関連語辞書と、上記検索式が入力されると、過去の所定期間に行われた検索におけるデータに基づいて関連語を作成し、上記関連語辞書を更新するデータ関連づけ手段と、上記検索式に含まれている検索語の関連語を、上記関連語辞書を用いて抽出する関連語抽出手段と、上記関連語を用いて、上記検索式と検索結果である検索データとの関連度を計算する関連度計算手段と、上記関連度計算手段が計算した結果に基づいて、上記検索データを順位付けする検索データ順位付け手段とを有するデータ検索装置である。
【0012】
【発明の実施の形態および実施例】
図1は、本発明の一実施例であるデータ検索装置DS1を示すブロック図である。
【0013】
データ検索装置DS1は、情報サーバに設けられている装置であり、ネットワークを介して端末装置から送られた検索式を受信する検索式受信部10と、情報データベースDB1と、データ検索部20と、関連語抽出部30と、関連語辞書Dと、関連度計算部40と、検索データ順位付け部50と、検索データ送信部60とを有する装置である。
【0014】
データ検索装置DS1は、端末装置から入力された検索式に含まれる検索語の関連語を検索し、この関連語を用いて、検索結果である検索データを順位付けして端末装置に出力するものであり、また、関連語と、検索語と関連語との関連度とを関連語辞書に格納し、この関連語と関連度とを用いて、検索データに優先順位を付与して端末装置に出力するものである。
【0015】
関連語辞書Dは、所定の語と、この所定の語に関連する関連語とが対応して格納され、上記サーバに設けられている辞書であり、過去の所定期間に行われた検索におけるデータを解析し、この解析されたデータに基づいて、予め作成された辞書である。
【0016】
関連語抽出部30は、上記検索式に含まれている検索語の関連語を、関連語辞書Dを用いて抽出する手段である。
【0017】
図2は、上記実施例の動作を示すフローチャートである。
【0018】
まず、ネットワークを介して端末装置から入力された検索式を検索式受信部10が受信し(S1)、この入力された検索式に基づいて、情報データベースDB1から所定データを検索する(S2)。そして、受信された検索式を各検索語に分解し(S3)、この分解された各検索語に関する関連語を、関連語辞書Dを用いて抽出し(S4)、この抽出された関連語を用いて、上記検索された各検索データと検索式との関連度を求める(S5)。
【0019】
そして、この求められた関連度に基づいて、ステップS2で検索された検索データを順位付けし(S6)、この順位付けされた検索データを端末装置に送信する(S7)。
【0020】
なお、上記フローチャートにおいて、各検索語へ分解し、検索語の関連語を抽出した(S3、S4)後に、検索式に基づいてデータを検索する(S2)ようにしてもよい。
【0021】
関連語辞書Dは、過去の所定期間に行われた検索におけるデータを解析する後述のデータ関連付け装置70を用いて作成したものである。
【0022】
図3は、上記実施例におけるデータ関連付け装置70を示す図である。
【0023】
図3(1)に示すデータ関連付け装置70は、同一の利用者によって使用された検索語は、その使用時間間隔が短ければ同じデータを求めるために使用された検索語であり、その使用時間間隔が長ければ別のデータを求めるために使用された検索語であり、使用時間間隔が短い程、関連の度合い(関連度)が高いという考えに基づく装置である。また、データ関連付け装置70は、ユーザ別検索時刻・検索式抽出部71と、検索式分解部72と、最小時刻差計算部73と、関連度計算・集計部74とを有する。
【0024】
ユーザ別検索時刻・検索式抽出部71は、過去の所定期間中に行われた検索におけるデータから、検索ユーザ毎に、検索時刻と検索式とを抽出する手段である。検索式分解部72は、ユーザ別検索時刻・検索式抽出部71によって抽出された複数の検索式のうちの1つの検索式が使用された時刻と、上記抽出された複数の検索式のうちの別の検索式が使用された時刻との時刻差のうちの最小値である最小時刻差を、上記検索ユーザ毎に計算する手段である。
【0025】
最小時刻差計算部73は、所定の検索ユーザにおける上記最小時刻差に基づいて、上記最小時刻差に対応する上記1つの検索式と上記別の検索式との関連度を、上記所定の検索ユーザ毎に計算し、複数の上記検索ユーザについて計算された上記関連度を集計する手段である。関連度計算・集計部74は、最小時刻差に基づいて、2つの検索語同士の関連度を求め、全ユーザについて集計するものである。
【0026】
また、最小時刻差計算部73は、上記検索式を検索語に分解し、上記分解された検索語のうちの1つの検索語が使用された時刻と、上記分解された検索語のうちの別の検索語が使用された時刻との時刻差のうちの最小値である最小時刻差を、上記検索ユーザ毎に計算する手段である。
【0027】
関連度計算・集計部74は、所定の検索ユーザにおける上記最小時刻差に基づいて、上記最小時刻差に対応する上記1つの検索語と上記別の検索語との関連度を、所定の検索ユーザ毎に計算し、複数の検索ユーザについて計算された上記関連度を集計する手段である。
【0028】
また、関連度計算は、たとえば、最小時刻差が0秒であれば(同一検索式に2つの検索語が存在すれば)、検索語同士の関連度を「2」とし、最小時刻差が0〜60秒であれば、関連度を「1」とし、最小時刻差が300秒以上であれば、関連度を「0」とし、60〜300秒の間は、1次関数を用いて求める。
【0029】
図3(2)は、相関係数検出装置80を示すブロック図である。
【0030】
相関係数検出装置80は、ある一定の時期に、多数の利用者が同一のデータを求めた場合、その検索に使用された検索語の使用頻度傾向は似ているという考えに基づく装置であり、2つの検索語の使用頻度に応じて2つの検索語の間の相関係数を求める装置である。また、相関係数検出装置80は、時間別・ユーザ別集計部81と、検索式分解部82と、検索語集計部83と、相関係数計算部84とを有する装置である。
【0031】
時間別・ユーザ別集計部81は、使用された検索式を、日毎、ユーザ毎にまとめるものであり、つまり、過去の所定期間中に行われた検索におけるデータから、所定時間毎に検索ユーザ毎に、検索式を抽出する手段である。検索式分解部82は、検索ユーザ毎に、検索式を検索語へ分解し、重複を除く手段である。
【0032】
検索語集計部83は、日毎、検索語毎の使用頻度を集計するものであり、つまり、所定時間毎における各検索語の使用回数を検索ユーザ毎に計算し、検索ユーザ毎に計算された各検索語の使用回数を、全ての検索ユーザについて集計する手段である。相関係数計算部84は、日毎に集計された各検索語の使用頻度に基づき、それぞれの時系列間における2つの検索語の相関係数を求めるものであり、集計された所定時間毎における各検索語の使用回数に基づいて、2つの検索語相互間の相関係数を計算する手段である。
【0033】
上記実施例は、上記2つの関連度を用いて関連語辞書Dを作成するので、データニーズを直接反映した、タイムリーな関連語を求めることができ、一般的な同義語ではなく、その時期に同義語的に用いられた関連語を集約した関連語辞書Dを得ることができる。このように、上記実施例は、この関連語辞書Dを用いて広告データベースDB2を検索するので、データニーズを反映した、利用者が欲しい広告を選択することができ、宣伝効果を上げることができる。
【0034】
次に、上記実施例において、検索式と各検索データとの関連度の求め方について説明する。
【0035】
上記実施例では、入力された検索語をXとし、データD1 、D2 、……、Dm は、検索されたデータであるとする。
【0036】
図4は、上記実施例における関連語辞書Dの一例を示す図である。
【0037】
関連語辞書Dには、各検索語毎に、それと関連する関連語と、検索語とこの検索語と関連する関連語との関連度とが格納されている。
【0038】
図4に示す例において、検索語はXであり、関連語Y1 、Y2 、Y3 、……、Yn は、検索語Xと関連する関連語であり、関連度Z1 、Z2 、Z3 …、Zn は、検索語Xと、関連語Y1 、Y2 、Y3 、……、Yn のそれぞれとの関連度である。
【0039】
次に、検索データDj と検索語Xとの関連度SCORE(Dj ,X)を求める計算について説明する。ただしj=1、2、……、mである。なお、関連度SCORE(Dj ,X)は、文書(検索データDj )と語(検索語X)との関連度であり、一方、関連度Zは、語と語との関連度である。
【0040】
関連度SCORE(Dj ,X)は、次の式1で示される。なお、関数f(X,Dj )は、検索データDj に含まれる検索語(単語)Xの数であり、SIZE(Dj )は、検索データDj の大きさ(バイト数)であり、Zi ’は、各関連度Zi を0から1の間に正規化した値であり、たとえば、
Zi ’=Zi /(Z1 +Z2 +……+Zn )である。また、関数f(Y1 ,Dj )は、検索データDj に含まれる関連語Yの数である。
【0041】
SCORE(Dj ,X)=f(X,Dj )+f(Y1 ,Dj )+f(Y2 ,Dj )+……+f(Yn ,Dj ) (式1)
この式1は、各検索データに含まれている関連語の数に応じて、検索語Xとの関連度SCORE(Dj ,X)を求める式である。
【0042】
SCORE(Dj ,X)={f(X,Dj )+f(Y1 ,Dj )+f(Y2 ,Dj )+……+f(Yn ,Dj )}/SIZE(Dj ) (式2)
式2は、検索データが大きな場合における関連度SCORE(Dj ,X)を求める式であり、大きな検索データには、出てくる関連語の数も多くなるので、データの大きさSIZE(Dj )で正規化することによって、関連度SCORE(Dj ,X)を求める。
【0043】
SCORE(Dj ,X)=f(X,Dj )+Z1 ・f(Y1 ,Dj )+Z2 ・f(Y2 ,Dj )+……+Zn ・f(Yn ,Dj ) (式3)
式3は、検索語Xと各関連語Yi とが含まれる数と、関連度Zi とを掛け合わせることによって、関連の高い関連語Yi が多く出現する程、検索語Xとの関連度も大きくなることを考慮した式である。
【0044】
SCORE(Dj ,X)={f(X,Dj )+Z1 ・f(Y1 ,Dj )+Z2 ・f(Y2 ,Dj )+……+Zn ・f(Yn ,Dj )}/SIZE(Dj )(式4)
式4は、式3を、データの大きさで正規化した式である。
【0045】
SCORE(Dj ,X)=f(X,Dj )+Z1 ’・f(Y1 ,Dj )+Z2 ’・f(Y2 ,Dj )+……+Zn ’・f(Yn ,Dj ) (式5)
式5は、各関連度Zi を正規化して掛け合わせた式である。
【0046】
SCORE(Dj ,X)={f(X,Dj )+Z1 ’・f(Y1 ,Dj )+Z2 ’・f(Y2 ,Dj )+……+Zn ’・f(Yn ,Dj )}/SIZE(Dj ) (式6)
式6は、式5を、データの大きさで正規化した式である。
【0047】
上記式1〜式6は、検索語Xと、検索語Xによって検索された検索データDj との関連度を求める計算式の例であるが、検索語Xと、関連語または関連度とを用いた計算法であれば、上記式以外の式を使用するようにしてもよい。
【0048】
上記のように計算されたデータの関連度に基づいて、検索データをソートすることによって、関連性の高いデータから優先順位付けされて出力される。
【0049】
次に、「サッカー」という検索語を例にとって、関連度の計算を具体的に説明する。
【0050】
1997年に、サッカーのワールドカップ・フランス大会のアジア地区予選が行われ、11月16日にマレーシアで行われたイランチームとの試合に日本チームが勝利し、翌年のフランス大会への出場を決めた。
【0051】
ここで、利用者が、「サッカー」という語を用いて検索したい情報は、地区予選時には相手チームの情報や試合の速報結果等であり、フランス大会への出場を決めた16日以降は、フランスでの大会に関連した情報であると推測できる。
【0052】
図5は、上記実施例において、検索語「サッカー」との関連語と、これらの関連度との例を示す図である。
【0053】
図5(1)は、上記実施例において、11月の10日〜16日の1週間における検索ログ(過去の所定期間に行われた検索におけるデータ)に基づいて求めた検索語「サッカー」との関連語と、検索語「サッカー」と上記関連語との関連度とを示す図である。
【0054】
図5(2)は、11月17日〜23日の1週間における検索ログ(過去の所定期間に行われた検索におけるデータ)に基づいて求めた検索語「サッカー」との関連語と、検索語「サッカー」と上記関連語との関連度とを示す図であり、図5(1)に示す推測と一致している。
【0055】
さて、上記実施例を用いて、「サッカー」と、「サッカー」によって検索された各検索データとの関連度を計算する。
【0056】
アジア地区予選時には、「ワールドカップ」、「日本代表」、「イラン」、「速報」、「マレーシア」という語を多く含むほど、各検索データにおける「サッカー」との関連度は高くなる。
【0057】
図6は、上記実施例において、キーワードとして「サッカー」を使用して検索した場合、検索語「サッカー」とその検索データとを示す図である。
【0058】
サッカーに関連するデータには、学生サッカーやプロサッカーに関するもの、ルールや基本技術等に関するもの等様々であるが、この時期には、その中でも、特に、ワールドカップのアジア予選に関連した、チーム紹介や試合の速報等のデータが上位に順位付けされ、図6(1)に示すように構成され、利用者に提供される。
【0059】
一方、本戦出場の決定後は、「ワールドカップ」、「フランス」、「ツアー」、「チケット」、「観戦」という語を多く含んでいるデータとの関連度が大きくなるので、「サッカー」に関するデータの中でも、特に、翌年の本大会のチケット情報や観戦ツアー等のデータが上位に順位付けされ、図6(2)に示すように構成され、利用者に提供される。
【0060】
このように、関連語を用いてデータを順位付けして出力するので、多くの利用者が望んでいるデータを常に上位に提示することができ、利用者の検索を著しく効率化することができる。
【0061】
図7は、本発明の他の実施例であるデータ検索装置DS2を示すブロック図である。
【0062】
このデータ検索装置DS2は、基本的には、データ検索装置DS1と同じであり、情報関連付け部90が設けられている点が、データ検索装置DS1と異なる点である。
【0063】
データ関連づけ部90は、過去の所定期間に行われた検索における情報データベースと、データ関連づけ装置70とを有し、検索式が入力されるとその過去の所定期間に行われた検索におけるデータに基づいて関連語を作成し、関連語辞書Dを更新するものであり、これによって、常に、データニーズを反映した関連語が得られるようになっている。
【0064】
データ検索装置DS2は、情報関連付け部90を有するので、常に情報ニーズを反映した関連語を得ることができる。
【0065】
上記実施例によれば、従来と同様に入力された検索式を用いてデータベースから情報を選択することができるとともに、関連語辞書Dから得られる関連語を用いて検索データを順位付けするので、利用者の意図に沿ったデータから順に優先的に出力され、利用者が所望の情報を得るまでの時間、負担を軽減することができる。
【0066】
そして、多数の利用者が所定期間に使用した検索ログを解析して作成した関連語辞書Dを用いれば、一般的な同義語ではなく、その時期に同義語的に用いられた関連語を集約できるので、現在の情報ニーズを反映した抽出が可能であり、多くの利用者が欲した情報が上位に提示される。
【0067】
また、上記実施例を記録媒体の発明として把握することができる。つまり、上記実施例は、端末装置から入力された検索式に基づいて、所定のサーバが、所定データを検索し、この検索されたデータを上記端末装置に提供するデータ検索装置において、所定の語と、この所定の語に関連する関連語とが対応して格納されている関連語辞書をサーバに設ける関連語辞書設置手順と、端末装置から入力された検索式に含まれている検索語の関連語を、上記関連語辞書を用いて抽出する関連語抽出手順と、上記関連語を用いて、上記検索式と検索結果である検索データとの関連度を計算する関連度計算手順と、上記関連度計算手順で計算した結果に基づいて、上記検索データを順位付けする検索データ順位付け手順とをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の例である。この記憶媒体の例としては、CD、FD、ハードディスク、半導体メモリ等がある。
【0068】
【発明の効果】
本発明によれば、データニーズを、常に反映した関連語を得ることができ、したがって、多数の利用者が所定期間に使用した検索ログを解析して作成した関連語辞書を用いれば、一般的な同義語ではなく、その時期に同義語的に用いられた関連語を集約できるので、現在の情報ニーズを反映した抽出が可能であり、多くの利用者が欲しい情報が上位に提示されるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例であるデータ検索装置DS1を示すブロック図である。
【図2】上記実施例の動作を示すフローチャートである。
【図3】上記実施例におけるデータ関連付け装置70を示す図である。
【図4】上記実施例における関連語辞書Dの一例を示す図である。
【図5】上記実施例において、検索語「サッカー」との関連語と、これらの関連度との例を示す図である。
【図6】上記実施例において、キーワードとして「サッカー」を使用して検索した場合、検索語「サッカー」とその検索データとを示す図である。
【図7】本発明の他の実施例であるデータ検索装置DS2を示すブロック図である。
【符号の説明】
DS1、DS2…データ検索装置、
DB1…情報データベース、
D…関連語辞書、
10…検索式受信部、
20…データ検索部、
30…関連語抽出部、
40…関連度計算部、
50…検索データ順位付け部、
60…検索データ送信部、
70…データ関連付け装置、
80…相関係数検出装置、
90…データ関連付け部。
Claims (9)
- 端末装置から入力された検索式に基づいて、所定のサーバが、所定データを検索し、この検索されたデータを上記端末装置に提供するデータ検索装置において、
所定の語と、この所定の語に関連する関連語とが対応して格納され、上記サーバに設けられている関連語辞書と;
上記検索式が入力されると、過去の所定期間に行われた検索におけるデータに基づいて関連語を作成し、上記関連語辞書を更新するデータ関連づけ手段と;
上記検索式に含まれている検索語の関連語を、上記関連語辞書を用いて抽出する関連語抽出手段と;
上記関連語を用いて、上記検索式と検索結果である検索データとの関連度を計算する関連度計算手段と;
上記関連度計算手段が計算した結果に基づいて、上記検索データを順位付けする検索データ順位付け手段と;
を有することを特徴とするデータ検索装置。 - 請求項1において、
上記関連度計算手段は、
上記検索式と上記検索データとの関連度を計算する場合、各検索データに含まれる上記関連語の数を用いて計算する手段であることを特徴とするデータ検索装置。 - 請求項2において、
上記関連語辞書は、
関連語と、上記関連語と検索語との関連度とを格納する辞書であり、
上記関連度計算手段は、
上記検索式と上記各検索データとの関連度を計算する場合、上記各検索データに含まれる上記関連語の数と上記関連度とを用いて計算手段であることを特徴とするデータ検索装置。 - 請求項1〜3の少なくとも1項において、
上記関連語辞書は、
過去の所定期間に行われた検索におけるデータを解析し、この解析されたデータに基づいて、予め作成された辞書であることを特徴とするデータ検索装置。 - 端末装置から入力された検索式に基づいて、所定のサーバが、所定データを検索し、この検索されたデータを上記端末装置に提供するデータ検索方法において、
所定の語と、この所定の語に関連する関連語とが対応して格納されている関連語辞書を上記サーバに設ける関連語辞書設置段階と;
上記検索式が入力されると、過去の所定期間に行われた検索におけるデータに基づいて関連語を作成し、上記関連語辞書を更新するデータ関連づけ段階と;
上記検索式に含まれている検索語の関連語を、上記関連語辞書を用いて抽出する関連語抽出段階と;
上記関連語を用いて、上記検索式と検索結果である検索データとの関連度を計算する関連度計算段階と;
上記関連度計算段階で計算した結果に基づいて、上記検索データを順位付けする検索データ順位付け段階と;
を有することを特徴とするデータ検索方法。 - 請求項5において、
上記関連度計算段階は、
上記検索式と上記検索データとの関連度を計算する場合、各検索データに含まれる上記関連語の数を用いて計算する段階であることを特徴とするデータ検索方法。 - 請求項6において、
上記関連語辞書は、
関連語と、上記関連語と検索語との関連度とを格納する辞書であり、
上記関連度計算段階は、
上記検索式と上記各検索データとの関連度を計算する場合、上記各検索データに含まれる上記関連語の数と上記関連度とを用いて計算段階であることを特徴とするデータ検索方法。 - 請求項5〜7の少なくとも1項において、
上記関連語辞書は、
過去の所定期間に行われた検索におけるデータを解析し、この解析されたデータに基づいて、予め作成された辞書であることを特徴とするデータ検索方法。 - 端末装置から入力された検索式に基づいて、所定のサーバが、所定データを検索し、この検索されたデータを上記端末装置に提供するデータ検索装置において、
所定の語と、この所定の語に関連する関連語とが対応して格納されている関連語辞書をサーバに設ける関連語辞書設置手順と;
上記検索式が入力されると、過去の所定期間に行われた検索におけるデータに基づいて関連語を作成し、上記関連語辞書を更新するデータ関連づけ手順と;
端末装置から入力された検索式に含まれている検索語の関連語を、上記関連語辞書を用いて抽出する関連語抽出手順と;
上記関連語を用いて、上記検索式と検索結果である検索データとの関連度を計算する関連度計算手順と;
上記関連度計算手順で計算した結果に基づいて、上記検索データを順位付けする検索データ順位付け手順と;
をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15067998A JP3547074B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15067998A JP3547074B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11328221A JPH11328221A (ja) | 1999-11-30 |
JP3547074B2 true JP3547074B2 (ja) | 2004-07-28 |
Family
ID=15502111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15067998A Expired - Fee Related JP3547074B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3547074B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4471737B2 (ja) * | 2003-10-06 | 2010-06-02 | 日本電信電話株式会社 | グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム |
JP4547500B2 (ja) * | 2006-07-21 | 2010-09-22 | 国立大学法人群馬大学 | 検索装置及びプログラム |
JP5122795B2 (ja) * | 2006-11-28 | 2013-01-16 | 株式会社エヌ・ティ・ティ・ドコモ | 検索システムおよび検索方法 |
JP4773379B2 (ja) * | 2007-01-31 | 2011-09-14 | ヤフー株式会社 | イベント検索システム、イベント検索装置、イベント検索結果出力方法およびプログラム |
JP2009031931A (ja) * | 2007-07-25 | 2009-02-12 | Univ Waseda | 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体 |
JP2009122807A (ja) * | 2007-11-13 | 2009-06-04 | Nomura Securities Co Ltd | 連想検索システム |
JP4654238B2 (ja) * | 2007-12-26 | 2011-03-16 | みずほ情報総研株式会社 | 説明表示システム、説明表示方法及び説明表示プログラム |
US8600979B2 (en) * | 2010-06-28 | 2013-12-03 | Yahoo! Inc. | Infinite browse |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH021059A (ja) * | 1988-06-07 | 1990-01-05 | Hitachi Ltd | 連想検索システム |
JPH03296863A (ja) * | 1990-04-16 | 1991-12-27 | Ricoh Co Ltd | キーワード関係辞書管理装置 |
JPH0481973A (ja) * | 1990-07-24 | 1992-03-16 | Ricoh Co Ltd | 文書検索装置 |
JPH08137898A (ja) * | 1994-11-08 | 1996-05-31 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置 |
-
1998
- 1998-05-14 JP JP15067998A patent/JP3547074B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11328221A (ja) | 1999-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10671676B2 (en) | Multiple index based information retrieval system | |
US6389412B1 (en) | Method and system for constructing integrated metadata | |
US7636714B1 (en) | Determining query term synonyms within query context | |
KR100544514B1 (ko) | 검색 쿼리 연관성 판단 방법 및 시스템 | |
JP4944405B2 (ja) | 情報検索システムにおけるフレーズに基づくインデックス化方法 | |
US7702618B1 (en) | Information retrieval system for archiving multiple document versions | |
JP5175005B2 (ja) | 情報検索システムにおけるフレーズに基づく検索方法 | |
US20040049499A1 (en) | Document retrieval system and question answering system | |
US20150074102A1 (en) | Generation of refinement terms for search queries | |
EP1555625A1 (en) | Query recognizer | |
US7822752B2 (en) | Efficient retrieval algorithm by query term discrimination | |
US7523109B2 (en) | Dynamic grouping of content including captive data | |
JP2006048686A (ja) | フレーズに基づく文書説明の生成方法 | |
JP2006048683A (ja) | 情報検索システムにおけるフレーズ識別方法 | |
JP2001519952A (ja) | データ要約装置 | |
JP2011154467A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
US20050114317A1 (en) | Ordering of web search results | |
JP3547074B2 (ja) | データ検索方法、その装置および記録媒体 | |
US8838616B2 (en) | Server device for creating list of general words to be excluded from search result | |
JP2003173352A (ja) | 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
US20050234975A1 (en) | Related content linking managing system, method and recording medium | |
US20020062341A1 (en) | Interested article serving system and interested article serving method | |
JP3249743B2 (ja) | 文書検索システム | |
JPH10254888A (ja) | 情報処理装置及びその処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040409 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120423 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |