JP2014075064A - Web search device, web search method and program - Google Patents
Web search device, web search method and program Download PDFInfo
- Publication number
- JP2014075064A JP2014075064A JP2012222735A JP2012222735A JP2014075064A JP 2014075064 A JP2014075064 A JP 2014075064A JP 2012222735 A JP2012222735 A JP 2012222735A JP 2012222735 A JP2012222735 A JP 2012222735A JP 2014075064 A JP2014075064 A JP 2014075064A
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- document
- web page
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】検索結果のユーザへの提示順をユーザが目的とする結果に近いものとする。
【解決手段】Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点部と、指定された検索キーワードを受信する検索要求受信部と、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定部と、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新部と、を備えることを特徴とするウェブ検索装置。
【選択図】図1The order of presenting search results to a user is close to the target result of the user.
A document-to-word evaluation score part that collects Web pages and initializes document-to-word evaluation scores on the Web page, a search request receiving part that receives a specified search keyword, and a specified search keyword Refer to the keyword importance level determination unit that determines the importance level for each search keyword and the storage unit that stores the action vs. evaluation-based score indicating the correspondence between the operation content and the added point added to the importance level for each search keyword. And a document-to-word evaluation score update unit that updates the action-to-evaluation-based score for each Web page based on the operation content and the added points of the search keyword.
[Selection] Figure 1
Description
本発明は、ウェブ(以下Web)検索における検索結果の品質の向上に関する。 The present invention relates to improving the quality of search results in a Web (hereinafter referred to as Web) search.
Web上で日々大量に増え続ける文書から目的の文書を探すためのシステムは、現在では欠かせないものである。 A system for searching for a target document from a large number of documents on the Web every day is indispensable.
初期のWeb上では、事業者が人手でWebページを整理するディレクトリ型の検索システムなども存在したが、Web文書絶対量や増加ペースが増えたこともありそれでは追いつかなくなり、現在ではクローラと呼ばれるWeb上の文書を自動で集めてくるプログラムで収集し、収集した文書を解析し自動でインデックスを作成した上でそのインデックスをもとに利用者に検索結果を提示するシステムが主流となっている。 In the early days of the Web, there were directory-type search systems where operators manually organized Web pages. However, the amount of Web documents and the pace of increase have increased, making it impossible to keep up. The mainstream is a system that collects the above documents using a program that automatically collects, analyzes the collected documents, automatically creates an index, and presents search results to the user based on the index.
この際に、検索システムのユーザが効率よく目的の文書にたどり着けるようにするために、特定のアルゴリズムを用いてページをランク付けしランクが高いものから順にシステム利用者に提示して利便性を図るシステムが一般的である。 At this time, in order for the user of the search system to efficiently reach the target document, the pages are ranked using a specific algorithm and presented to the system user in descending order of the rank for convenience. The system is common.
本発明に関連する公知技術文献としては下記の特許文献1がある。
There is the following
特許文献1は、結果の組においてWebページをランク付けするコンピューティングシステムにおける方法であって、1つまたは複数のクエリ用語の組を含むクエリに応答して生成された結果の組において結果として列挙されているWebページに対する、ユーザによって行われるコンテンツに関する対話に応答して、前記Webページ(a)と、前記クエリ用語(b)に対する該Webページの関連性のレベルを反映して、前記クエリ用語の組の中の1つの該クエリ用語との組合せごとに評価得点を調整するステップと、1組の個別のクエリ用語を含む個別のクエリに応答して生成される個別の結果の組において結果として列挙されている複数のWebページごとに、前記Webページ(a)と前記個別の組のクエリ用語(b)の中の1つのクエリ用語との組合せごとに調整された評価得点を選択するステップと、 前記選択された評価得点を組合せることによって、前記個別のクエリ結果における前記Webページのランキング得点を決定するステップとを備えたことを特徴とする方法を開示する。
上記特許文献1におけるページランクを決定する手段はおよそ次のような動作である。1つまたは複数の検索キーワードの組を含む検索要求に応答して生成された検索結果リストの組に含まれるWebページに対応する結果に対する、ユーザによって行われる「見つけたページが目的に合致するページだった」場合に取り得るいくつかの内容対話(例えば、内容を印刷する、お気に入りに登録するなど)のそれぞれに応答して、システムは、Webページと検索キーワードの組の中の1つのキーワードとの組合せごとに評価得点を調整(増加)する。
The means for determining the page rank in
このようなユーザによる対話をWebページごとに繰り返す結果として、1組の個別の検索キーワードを含む個別の検索要求に応答して生成された個別の結果の組に含まれるWebページのそれぞれについて、それぞれのWebページにより関連が強いキーワードの評価得点が上昇していく。また、ユーザの検索要求に対するWebページに対するランキングは、検索キーワードの組においてWebページごとに算出した検索キーワードに対する評価得点の合計値が高い順に決定する。従って、ユーザの検索結果のWebページへの評価を繰り返すことにより、より検索キーワードに関連が強いWebページが高ランクのページとしてユーザに提示されるため検索結果リストの品質が向上する。 As a result of repeating such user interaction for each Web page, for each of the Web pages included in the individual result set generated in response to the individual search request including one set of individual search keywords, The evaluation score of keywords that are strongly related to the Web page will increase. In addition, the ranking of the Web page in response to the user's search request is determined in descending order of the total evaluation score for the search keyword calculated for each Web page in the set of search keywords. Therefore, by repeating the evaluation of the user's search result to the Web page, the Web page more strongly related to the search keyword is presented to the user as a high-rank page, so that the quality of the search result list is improved.
ところで、このシステムでは次のような問題が発生し得る。 By the way, the following problems may occur in this system.
例えば、非常にメジャーなプログラミング言語Aとマイナーなプログラミング言語Bがあったとする。その上で、WebページAにはプログラミング言語Aの言語仕様の文書と、単語として「プログラミング言語A」「プログラミング言語B」「仕様」を含み、WebページBにはプログラミング言語Bの言語仕様の文書と、単語として「プログラミング言語A」「プログラミング言語B」「仕様」を含んでいたとする。また、この際の、Webページごとの評価得点の初期値を簡便にするために以下の様な値としたとする。 For example, suppose you have a very major programming language A and a minor programming language B. In addition, Web page A contains the language specification document for programming language A and the words "programming language A", "programming language B", and "specification". Web page B contains the language specification document for programming language B. And “programming language A”, “programming language B”, and “specification” as words. In this case, the following values are assumed to simplify the initial value of the evaluation score for each Web page.
(1)WebページA…キーワード「プログラミング言語A」に対する評価得点=0、キーワード「プログラミング言語B」に対する評価得点=0、キーワード「仕様」に対する評価得点=0
(2)WebページB…キーワード「プログラミング言語A」に対する評価得点=0、キーワード「プログラミング言語B」に対する評価得点=0、キーワード「仕様」に対する評価得点=0
(1) Web page A: Evaluation score for keyword “programming language A” = 0, evaluation score for keyword “programming language B” = 0, evaluation score for keyword “specification” = 0
(2) Web page B: Evaluation score for keyword “programming language A” = 0, evaluation score for keyword “programming language B” = 0, evaluation score for keyword “specification” = 0
ここで、ユーザがプログラミング言語AまたはBの仕様を調査する目的で、検索キーワードとして「プログラミング言語A」と「仕様」のペアや、「プログラミング言語B」と「仕様」をペアとして指定することを考える。プログラミング言語Aはプログラミング言語Bよりもメジャーであるため、一般的にプログラミング言語Aに対するユーザによる検索要求(キーワード「プログラミング言語A」「仕様」による検索)はプログラミング言語Bに対する検索要求(キーワード「プログラミング言語B」「仕様」による検索)よりも多くなることが予想される。ユーザによる検索要求が多くなるということは、当然Webページが選択され評価得点が増加する機会も多くなる。 Here, for the purpose of investigating the specification of programming language A or B, the user must specify “programming language A” and “specification” as a search keyword or “programming language B” and “specification” as a pair. Think. Since programming language A is larger than programming language B, a user search request for programming language A (search by keyword `` programming language A '' or `` specification '') is generally a search request for programming language B (keyword `` programming language B ”and“ specification ”) are expected to be more. The increase in the number of search requests by the user naturally increases the chance that the Web page is selected and the evaluation score increases.
ここで、(検索キーワード「プログラミング言語A」と「仕様」でWebページAが評価された回数):(検索キーワード「プログラミング言語B」と「仕様」でWebページBが評価された回数)=10:1であるとすると、最終的なWebページの評価点はおよそ以下のようになると考えられる。 Here, (number of times Web page A is evaluated with the search keywords “programming language A” and “specification”): (number of times web page B is evaluated with the search keywords “programming language B” and “specification”) = 10 If it is: 1, the final Web page evaluation points will be as follows.
(1)WebページA…
キーワード「プログラミング言語A」に対する評価得点=10a、
キーワード「プログラミング言語B」に対する評価得点=0a(関連性が低いため評価されない)、キーワード「仕様」に対する評価得点=10a
(2)WebページB…
キーワード「プログラミング言語A」に対する評価得点=0a(関連性が低いため評価されない)、キーワード「プログラミング言語B」に対する評価得点=1a、
キーワード「仕様」に対する評価得点=1a
(1) Web page A ...
Evaluation score for keyword “programming language A” = 10a,
Evaluation score for keyword “programming language B” = 0a (not evaluated due to low relevance), evaluation score for keyword “specification” = 10a
(2) Web page B ...
Evaluation score for keyword “programming language A” = 0a (not evaluated due to low relevance), evaluation score for keyword “programming language B” = 1a,
Evaluation score for keyword "specification" = 1a
ここで、プログラミング言語Bの仕様を調査する目的で検索キーワードとして「プログラミング言語B」「仕様」を指定して検索を行ったとする。 Here, for the purpose of investigating the specification of programming language B, it is assumed that a search is performed by specifying “programming language B” and “specification” as search keywords.
この際のWebページAとWebページBのランキングを決定する評価得点の合計は次のような値になる。 At this time, the sum of the evaluation scores for determining the ranking of Web page A and Web page B is as follows.
(1)WebページA評価得点合計=「プログラミング言語B」評価得点0a+「仕様」評価得点10a=10a
(2)WebページB評価得点合計=「プログラミング言語B」評価得点1a+「仕様」評価得点1a=2a
(1) Web page A evaluation score total = “programming language B” evaluation score 0a + “specification” evaluation score 10a = 10a
(2) Web page B evaluation score total = "programming language B" evaluation score 1a + "specification" evaluation score 1a = 2a
この結果、「WebページA評価得点合計」>「WebページB評価得点合計」となってしまい、ユーザはプログラミング言語Bの仕様について知りたいにもかかわらずWebページAが優先で提示されることとなり、検索結果の品質が低下する問題が生じる。 As a result, "Web Page A Evaluation Score Total"> "Web Page B Evaluation Score Total", and Web page A is presented with priority even though the user wants to know the programming language B specifications. Therefore, there arises a problem that the quality of the search result is deteriorated.
本発明の目的は、ページランクの決定精度を上げ、ユーザに対してより利用しやすい検索結果を提示するシステムを提供することにある。 An object of the present invention is to provide a system that improves the accuracy of determining a page rank and presents a search result that is easier to use for a user.
本発明の一観点によれば、Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点部と、指定された検索キーワードを受信する検索要求受信部と、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定部と、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新部と、備えることを特徴とするウェブ検索装置が提供される。 According to one aspect of the present invention, a document-to-word evaluation score unit that collects a Web page and initializes a document-to-word evaluation score of the Web page, a search request receiving unit that receives a specified search keyword, Stores an action vs. evaluation base score indicating a correspondence relationship between a keyword importance determining unit that determines the importance for each search keyword from the specified search keyword and an operation content and a point added to the importance for each search keyword. A document-to-word evaluation score updating unit that updates the action-to-evaluation base score for each Web page based on the operation content and the added points of the search keyword with reference to a storage unit; A web search device is provided.
ユーザ内容対応(評価)からWebページの文書対単語評価得点を更新するためにキーワード評価得点に加算するキーワード毎の加算得点を決定する際に、加算得点に前述手段で決定したキーワードごとの重要度を重みとして掛けることにより、Webページを特徴付けるキーワード(情報のカテゴリを表すキーワード)の評価得点が上昇しやすくなる。相対的にどのようなカテゴリにも存在するような一般的な単語は評価が上がりにくくなる。また、あまり検索されないマイナーな単語でもその文書に対する重要なキーワードは評価が上がりやすくなる。 Importance score for each keyword determined by the above-mentioned means when adding score for each keyword to be added to keyword evaluation score to update document vs. word evaluation score of web page from user content correspondence (evaluation) As a weight, the evaluation score of a keyword that characterizes a Web page (a keyword that represents an information category) is likely to increase. A general word that exists in any category is less likely to be evaluated. In addition, even for a minor word that is not often searched, an important keyword for the document is easily evaluated.
前記文書対単語評価得点更新部は、前記Webページ毎に、前記検索キーワードの重み付けを減算する検索キーワードを示す減算ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新することを特徴とする。 The document-to-word evaluation score update unit updates the action-based evaluation base score for each Web page based on a subtraction point indicating a search keyword for subtracting the weight of the search keyword for each Web page. Features.
また、前記文書対単語評価得点更新部は、ある時間間隔で、Webページ毎の前記文書対単語評価得点に更新し、削除されたWebページの文書があれば、それについては文書対単語評価得点から削除する処理を継続することを特徴とする。 The document-to-word evaluation score update unit updates the document-to-word evaluation score for each Web page at a certain time interval, and if there is a deleted Web page document, the document-to-word evaluation score The process of deleting from is continued.
本発明の他の観点によれば、Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点ステップと、指定された検索キーワードを受信する検索要求受信ステップと、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定ステップと、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新ステップと有することを特徴とするウェブ検索方法が提供される。 According to another aspect of the present invention, a document-to-word evaluation scoring step for collecting a web page and initializing a document-to-word evaluation score for the web page; a search request receiving step for receiving a designated search keyword; , Memorize action vs. evaluation-based score indicating the correspondence between the keyword importance determination step for determining the importance for each search keyword from the specified search keyword and the operation content and the added points to be added to the importance for each search keyword And a document-to-word evaluation score update step for updating the action-to-evaluation base score for each Web page based on the operation content and the added points of the search keyword. A web search method is provided.
本発明は、上記に記載のウェブ検索方法を実行させるためのプログラムであり、当該プログラムを記憶するコンピュータ読みとり可能な記録媒体であっても良い。 The present invention is a program for executing the web search method described above, and may be a computer-readable recording medium storing the program.
本発明によれば、検索結果のユーザへの提示順ユーザが目的とする結果に近いものとなるという利点がある。 According to the present invention, there is an advantage that the search result is close to the target result of the user in the order of presentation to the user.
発明者は、ユーザの評価フィードバックによる効率の良いWeb検索結果提示システム及び方法において、「Webページにとってあまり重要ではない一般的な単語」と「Webページの重要なキーとなる単語」の評価得点を平等に扱うと、「WebページA評価得点合計」>「WebページB評価得点合計」となってしまい、ユーザはプログラミング言語Bの仕様について知りたいにもかかわらずWebページAが優先で提示されることとなり、検索結果の品質が低下する問題が生じると考えた。 The inventor gives evaluation scores of “common words that are not very important for Web pages” and “words that are important keys for Web pages” in an efficient Web search result presentation system and method based on user evaluation feedback. If treated equally, “Web Page A Evaluation Score Total”> “Web Page B Evaluation Score Total”, and the user is presented with Web Page A with priority even though he wants to know the programming language B specifications. As a result, there was a problem that the quality of search results deteriorated.
以下、本発明の実施の形態によるWeb検索技術について図面を参照しながら詳細に説明する。 Hereinafter, a Web search technique according to an embodiment of the present invention will be described in detail with reference to the drawings.
図1は、本発明の実施の形態によるWeb検索システムの一構成例を示す機能ブロック図である。本実施の形態によるWeb検索システムは、ホストシステム(検索装置)110と、それに接続された文書対単語評価得点データベース119とを有している。ホストシステム110は、インターネットなどのネットワーク120に接続されており、ネットワーク120には、本実施の形態によるWeb検索システムを利用する利用者端末100と、検索対象であるWebページの文書が収められたサーバ群130とが接続されている。
FIG. 1 is a functional block diagram showing a configuration example of a Web search system according to an embodiment of the present invention. The Web search system according to the present embodiment includes a host system (search device) 110 and a document-to-word
ホストシステム110は、サーバ群130群からWebページの文書を集めてくる文書収集部111、文書対単語評価得点データベース119のデータを初期化する文書対単語評価得点初期化部112、利用者端末100からの検索要求を受け取る検索要求受信部113、検索要求受信部113で受け取った検索要求キーワードからキーワードの重要度を決定するキーワード重要度決定部114、検索要求受信部113で受け取った検索要求キーワードと文書対単語評価得点データベース119の情報からページランクを決定し検索結果リストを生成する検索結果リスト生成部115、前述検索結果リストを利用者端末100に送信する検索結果リスト送信部116、利用者端末100に送信された前述検索結果リストのユーザ評価結果を受信する利用者評価受信部117、前述評価結果とキーワード重要度決定部114で決定したキーワードの重要度を用いて文書対単語評価得点データベース119のデータを更新する文書対単語評価得点更新部118を有している。
The host system 110 includes a document collection unit 111 that collects Web page documents from the
文書対単語評価得点データベース119には、図2に例示するような構造のデータが収められている。図2(a)に符号200で示すように、Webページアドレス毎にWebページ情報が複数収められている。Webページ情報のうちの1つずつは、符号210〜241に示すような複数の情報から構成されている。Webページアドレス210はWebページの文書のアドレスである。このアドレスの文書に含まれるキーワード全てでそれぞれ評価得点を持っている。図2の例では、文書中のキーワード1(220)に対する評価得点が評価得点1(221)、キーワード2(230)に対する評価得点が評価得点2(231)、キーワード3(240)に対する評価得点が評価得点3(241)、…という構成になっている。
The document-to-word
図3は、検索処理の流れを示すフローチャート図である。図3Aは、全体の処理の流れを示すフローチャート図である。 FIG. 3 is a flowchart showing the flow of search processing. FIG. 3A is a flowchart showing the overall processing flow.
まず、図3Aについて説明する。ステップS301は、文書収集部111を用いてネットワーク120に接続されたサーバ群130からWebページの文書を収集し、文書対単語評価得点初期化部112を用いてWebページ毎に例えば全キーワードを抽出しWebページアドレスの文書に評価得点を初期化して、図2(b)に示す文書対単語評価得点データベース119に格納する。ステップS302では、検索要求受信部113を用いてユーザからの検索要求を受信する。ステップS303では、検索結果リスト生成部115で文書対単語評価得点データベース119のWebページ情報とステップS302で受信した検索要求の検索キーワードを元にWebページランクを決定し検索結果リストを生成する。ステップS303の処理の詳細は後述する。ステップS304ではステップS303で生成した結果リストを利用者端末100に送信する。ステップS305では、提示した結果リストについてユーザがどのアドレス(アドレスA)のWebページにどのようなアクション(アクションX)を取ったかを利用者評価受信部117で受信する。
First, FIG. 3A will be described. A step S301 collects Web page documents from the
以降、ステップS306〜S309は文書対単語評価得点更新部118で行う得点更新処理である。ステップS306では、図4のような、操作(アクション)内容と加点ポイントとの対応関係を示すアクション対評価ベース得点の表から操作内容(アクション)Xをキーにして、評価ベース得点(以後、「評価ベース得点B」とする。)を決定する。例えば、ユーザが取ったアクション(アクションX)が「ページを印刷した(403)」であれば評価ベース得点Bは「評価ベース得点2(404)」となる。ステップS307では、検索キーワード毎にキーワード重要度決定部114でキーワードの重要度(ウェイト値)を決定する。ステップS307についての処理の詳細は後述する。 Thereafter, steps S306 to S309 are score update processing performed by the document-to-word evaluation score update unit 118. In step S306, as shown in FIG. 4, an evaluation-based score (hereinafter referred to as “ Evaluation base score B ”) is determined. For example, if the action (action X) taken by the user is “print page (403)”, the evaluation base score B is “evaluation base score 2 (404)”. In step S307, the keyword importance level determination unit 114 determines the keyword importance level (weight value) for each search keyword. Details of the processing in step S307 will be described later.
ステップS308では、ステップS306で決定した評価ベース得点とステップS307で決定したキーワード毎の重要度を乗算等の処理により関連付けしてキーワードごとの評価得点加算値を決定する。この処理の詳細は後述する。ステップS309では、文書対単語評価得点データベース119のWebページアドレスがアドレスAと一致するレコードに対して、キーワード毎の評価得点にステップS308で決定した加算点を加算する。詳細は後述する。その後、ステップS302の検索要求受付処理に戻る。このステップS302〜309の繰り返しにより、徐々に検索結果リストの改善を行うことができる。
In step S308, the evaluation score added value for each keyword is determined by associating the evaluation base score determined in step S306 with the importance for each keyword determined in step S307 by a process such as multiplication. Details of this processing will be described later. In step S309, the addition point determined in step S308 is added to the evaluation score for each keyword with respect to the record in which the Web page address in the document-to-word
図3Bは、ステップS309からステップS302に遷移するまでの処理を示す図である。ステップS302に戻るループの間に適時、次のような処理も行う。まず、ステップSA1で、サーバにWebページの文章が追加されるかどうかを判断し、Yesであれば、ステップSA2に進み、一定の間隔でステップS301の初期化処理をサーバ群130に新規に追加されたWebページの文書に対して行い、すなわち、ステップSA2で、Webページに関して一定の間隔でステップS301の初期化を行い、ステップSA3で、新規に追加されたWebページの文書を文書対単語評価得点データベース119に追加する。また、ステップSA4では、もし削除されたWebページの文書があれば、それについては文書対単語評価得点データベース119から削除し、ステップS302に進む。
FIG. 3B is a diagram illustrating processing from the transition from step S309 to step S302. The following processing is also performed at appropriate times during the loop returning to step S302. First, in step SA1, it is determined whether the text of the Web page is added to the server. If Yes, the process proceeds to step SA2, and the initialization process of step S301 is newly added to the
次に、図3Cを参照して、ステップS303(検索結果リスト生成処理)の詳細を述べる。ステップS303−1で、ステップS302で受け取った検索キーワード全てを含むWebページの文書を文書対単語評価得点データベース119から選択し評価得点の合計を計算する。例えば、検索キーワードが先頭から「キーワード1」「キーワード2」「キーワード3」であるとする。これらのキーワードを全て含むWebページ情報が、図2(b)の210から241までのようになっている場合に、このWebページの評価得点の合計は「評価得点1(221)」+「評価得点2(231)」+「評価得点3(241)」となる。このような計算を、キーワード「キーワード1」「キーワード2」「キーワード3」の全てを含むWebページ情報についてそれぞれ計算し、合計評価得点の高い順にWebページアドレス210を並べたリストを生成する。ステップ303−2において、全てのキーワードを含むWebページについて計算を行い、計算済みの場合に(YES)、ステップ303−3において、合計評価点の高い順にリストを作成する、そして、ステップS304でリストを送信する。
Next, details of step S303 (search result list generation processing) will be described with reference to FIG. 3C. In step S303-1, a Web page document including all the search keywords received in step S302 is selected from the document-to-word
次に、図3Dを参照して、ステップS307(検索キーワード重み算出)の詳細を述べる。ステップS302で受け取った検索キーワードが、先頭から「キーワード1」「キーワード2」…「キーワードn」である場合、それぞれ求めるキーワードの重みを「重みW1」「重みW2」…「重みWn」とする。
Next, details of step S307 (search keyword weight calculation) will be described with reference to FIG. 3D. If the search keywords received in step S302 are “
最初に、一般的な使用方法として先頭に指定したキーワードほど検索システムの利用者にとって重要なキーワードであるという仮定の基に、W1>W2>・・・>Wnとなる基本値を決定する(ステップS307−1)。例えば、以下のようにキーワード毎に重み付けを行う。
First, based on the assumption that the keyword specified at the top as a general usage method is an important keyword for the user of the search system, a basic value that satisfies W1>W2>. S307-1). For example, weighting is performed for each keyword as follows.
次に、「キーワード1」「キーワード2」…「キーワードn」の中に、図5のようなキーワード重みを下げるキーワードと減算値を対応付ける表に基づいて、その中に一致するキーワードがあるか否かを調べ(ステップS307−2)、一致するキーワードがあった場合(ステップS307−3でYes)、前述で決定した重みをキーワードに一致した「重要度減算値」の分だけ減らす減算処理を行う(ステップS307−4)。例えば、「キーワード2」が「キーワードB(503)」と一致した場合、「重みW2」から「重要度減算値B」を減算する。この際、「重みW2」は重みの最低値(>0)を下回らないように値を調整する。図5の表中のキーワードと一致しないキーワードの重みはそのままとする(ステップS307−3でNo)。
Next, in “
次に、図3Eを参照して、ステップS308(評価加算点を算出)の詳細について述べる。ステップS308−1で、キーワードと一致する評価加算項が有るかどうかを判定し、Yesの場合には、ステップS308−2で、評価加算により加算(キーワード毎)を行う。すなわち、ステップS306で決定した評価ベース得点BとステップS307で決定した重みWを掛けてキーワードごとの評価加算点Aを決定する。例えば、以下のようにキーワード毎に加算ポイントを求める。
Next, with reference to FIG. 3E, the details of step S308 (calculate evaluation addition points) will be described. In step S308-1, it is determined whether or not there is an evaluation addition term that matches the keyword. In the case of Yes, addition (for each keyword) is performed by evaluation addition in step S308-2. That is, the evaluation addition score A for each keyword is determined by multiplying the evaluation base score B determined in step S306 by the weight W determined in step S307. For example, the addition points are obtained for each keyword as follows.
より詳細には、以下のようになる。
「キーワード1」の「評価加算点A1」=「評価ベース得点B」×「重みW1」
「キーワード2」の「評価加算点A2」=「評価ベース得点B」×「重みW2」
:
「キーワードn」の「評価加算点An」=「評価ベース得点B」×「重みWn」
In more detail, it is as follows.
“Evaluation addition point A1” = “Evaluation base score B” × “Weight W1” of “
“Evaluation addition point A2” = “Evaluation base score B” × “Weight W2” of “Keyword 2”
:
“Evaluation addition point An” = “Evaluation base score B” × “Weight Wn” of “Keyword n”
図3Fを参照して、ステップS309(Webページの文書対単語評価得点の更新)の詳細を述べる。ステップS308で決定した評価加算点を文書対単語評価得点データベース119の情報に反映する(ステップS309−1)。ステップS305で取得したアドレスAとWebページアドレス(210)と一致するWebページ情報について(ステップS309−2でYes)、前述「キーワード1」〜「キーワードn」の評価得点にそれぞれ「評価得点A1」〜「評価得点An」の加算を行って(ステップS309−3)、文書対単語評価得点データベースDB119の更新を行う(ステップS309−4)。
With reference to FIG. 3F, details of step S309 (update of document-to-word evaluation score of Web page) will be described. The evaluation addition score determined in step S308 is reflected in the information of the document-to-word evaluation score database 119 (step S309-1). For the Web page information that matches the address A acquired in step S305 and the Web page address (210) (Yes in step S309-2), the evaluation score of the above-mentioned “
以上のように、本実施の形態による検索結果提示システムによれば、次のような利点がある。 As described above, the search result presentation system according to the present embodiment has the following advantages.
検索要求キーワードを解析し、キーワードごとの重要度を算定して、Webページの文書対単語評価得点のデータベースの評価得点を加算する際に重要度をWebページ毎のキーワードへの重みとして利用することにより、Webページ対キーワード評価得点のデータの精度が高まる。また、検索結果のユーザへの提示順を決定するためのページランクの算出結果がよりユーザが目的とする結果に近いものとなる。 Analyze search request keywords, calculate the importance of each keyword, and use the importance as a weight to the keyword for each Web page when adding the evaluation score of the database of document score vs. word evaluation score of the Web page This increases the accuracy of the Web page vs. keyword evaluation score data. In addition, the page rank calculation result for determining the order in which the search results are presented to the user is closer to the target result of the user.
尚、上記の実施の形態において、添付図面に図示されている構成等については、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。 In the above-described embodiment, the configuration and the like illustrated in the accompanying drawings are not limited to these, and can be changed as appropriate within the scope of the effects of the present invention. In addition, various modifications can be made without departing from the scope of the object of the present invention. Each component of the present invention can be arbitrarily selected, and an invention having a selected configuration is also included in the present invention.
また、本実施の形態で説明した機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。尚、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。 In addition, a program for realizing the functions described in the present embodiment is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed to execute processing of each unit. May be performed. The “computer system” here includes an OS and hardware such as peripheral devices.
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。 Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
本発明は、検索システムに利用可能である。 The present invention can be used in a search system.
100…検索システム利用者端末、110…検索ホストシステム、111…Webページ文書収集部、112…Webページ文書対単語評価得点初期化部、113…検索要求受信部、114…検索キーワード重要度決定部、115…検索結果リスト生成部、116…検索結果リスト送信部、117…利用者評価受信部、118…Webページの文書対単語評価得点更新部、119…Webページの文書対単語評価得点を収めたデータベース、120…ネットワーク、130…ネットワークに接続されたWebページ文書を収めたサーバ群。
DESCRIPTION OF
Claims (5)
前記Webページ毎に、前記検索キーワードの重み付けを減算する検索キーワードを示す減算ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新することを特徴とする請求項1に記載のウェブ検索装置。 The document-to-word evaluation score update unit
2. The web according to claim 1, wherein for each web page, the action vs. evaluation base score for each web page is updated based on a subtraction point indicating a search keyword from which the weight of the search keyword is subtracted. Search device.
ある時間間隔で、Webページ毎の前記文書対単語評価得点に更新し、削除されたWebページの文書があれば、それについては文書対単語評価得点から削除する処理を継続することを特徴とする請求項1又は2に記載のウェブ検索装置。 The document-to-word evaluation score update unit
Update to the document-to-word evaluation score for each Web page at a certain time interval, and if there is a deleted Web page document, continue to delete it from the document-to-word evaluation score The web search device according to claim 1 or 2.
指定された検索キーワードを受信する検索要求受信ステップと、
指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定ステップと、
操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新ステップと有することを特徴とするウェブ検索方法。 Document-to-word evaluation scoring step for collecting web pages and initializing document-to-word evaluation scores on the web pages;
A search request receiving step for receiving a specified search keyword;
A keyword importance determination step for determining the importance of each search keyword from the specified search keywords;
With reference to the storage unit storing action vs. evaluation-based score indicating the correspondence between the operation content and the point added to the importance for each search keyword, based on the operation content and the point added to the search keyword, A web search method comprising: a document vs. word evaluation score update step for updating the action vs. evaluation base score for each Web page.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222735A JP6042162B2 (en) | 2012-10-05 | 2012-10-05 | Web search device, web search method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222735A JP6042162B2 (en) | 2012-10-05 | 2012-10-05 | Web search device, web search method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014075064A true JP2014075064A (en) | 2014-04-24 |
JP6042162B2 JP6042162B2 (en) | 2016-12-14 |
Family
ID=50749164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012222735A Expired - Fee Related JP6042162B2 (en) | 2012-10-05 | 2012-10-05 | Web search device, web search method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6042162B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102239913B1 (en) * | 2020-08-28 | 2021-04-12 | 김영철 | Apparatus for Measuring Inside Diameter |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090109A (en) * | 1998-09-10 | 2000-03-31 | Sharp Corp | Information management device and recording medium recorded with program thereof |
JP2002251410A (en) * | 2001-02-26 | 2002-09-06 | Sharp Corp | Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program |
JP2008158893A (en) * | 2006-12-25 | 2008-07-10 | Jamu:Kk | Information search device, information search program, and program storage medium |
-
2012
- 2012-10-05 JP JP2012222735A patent/JP6042162B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090109A (en) * | 1998-09-10 | 2000-03-31 | Sharp Corp | Information management device and recording medium recorded with program thereof |
JP2002251410A (en) * | 2001-02-26 | 2002-09-06 | Sharp Corp | Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program |
JP2008158893A (en) * | 2006-12-25 | 2008-07-10 | Jamu:Kk | Information search device, information search program, and program storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP6042162B2 (en) | 2016-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489448B2 (en) | Method and system for dynamically ranking images to be matched with content in response to a search query | |
CN110362727B (en) | Third party search application for search system | |
US8612423B2 (en) | Search cache for document search | |
US7840547B1 (en) | Methods and systems for efficient query rewriting | |
US8849775B2 (en) | Caching web documents in two or more caches | |
US9177057B2 (en) | Re-ranking search results based on lexical and ontological concepts | |
US20100299343A1 (en) | Identifying Task Groups for Organizing Search Results | |
JP5084858B2 (en) | Summary creation device, summary creation method and program | |
US9135307B1 (en) | Selectively generating alternative queries | |
WO2007130914A2 (en) | Dynamic search engine results employing user behavior | |
JP2009252070A (en) | Method for calculating score for search query | |
US10282358B2 (en) | Methods of furnishing search results to a plurality of client devices via a search engine system | |
US20120233096A1 (en) | Optimizing an index of web documents | |
US9183299B2 (en) | Search engine for ranking a set of pages returned as search results from a search query | |
JP2022106948A (en) | Information display method, device, electronic apparatus, storage media, and computer program | |
JP2011248762A (en) | Classification device, content retrieval system, content classification method, content retrieval method, and program | |
JP4824070B2 (en) | Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log | |
JP2015022528A (en) | Trigger query acquisition device, trigger query acquisition method, and program | |
US9785676B2 (en) | Systems and methods for providing ordered results for search queries | |
WO2014021824A1 (en) | Search method | |
JP6042162B2 (en) | Web search device, web search method and program | |
JP2010123036A (en) | Document retrieval device, document retrieval method and document retrieval program | |
US9449095B1 (en) | Revising search queries | |
JP2006185167A (en) | File search method, file search device, and file search program | |
US9659064B1 (en) | Obtaining authoritative search results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150911 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6042162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |