[go: up one dir, main page]

JP2014075064A - Web search device, web search method and program - Google Patents

Web search device, web search method and program Download PDF

Info

Publication number
JP2014075064A
JP2014075064A JP2012222735A JP2012222735A JP2014075064A JP 2014075064 A JP2014075064 A JP 2014075064A JP 2012222735 A JP2012222735 A JP 2012222735A JP 2012222735 A JP2012222735 A JP 2012222735A JP 2014075064 A JP2014075064 A JP 2014075064A
Authority
JP
Japan
Prior art keywords
search
keyword
document
web page
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012222735A
Other languages
Japanese (ja)
Other versions
JP6042162B2 (en
Inventor
Tomoaki Hiraishi
智明 平石
Takao Konishi
貴生 小西
Noriko Asai
規子 朝井
Yusuke Ohashi
祐介 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2012222735A priority Critical patent/JP6042162B2/en
Publication of JP2014075064A publication Critical patent/JP2014075064A/en
Application granted granted Critical
Publication of JP6042162B2 publication Critical patent/JP6042162B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索結果のユーザへの提示順をユーザが目的とする結果に近いものとする。
【解決手段】Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点部と、指定された検索キーワードを受信する検索要求受信部と、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定部と、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新部と、を備えることを特徴とするウェブ検索装置。
【選択図】図1
The order of presenting search results to a user is close to the target result of the user.
A document-to-word evaluation score part that collects Web pages and initializes document-to-word evaluation scores on the Web page, a search request receiving part that receives a specified search keyword, and a specified search keyword Refer to the keyword importance level determination unit that determines the importance level for each search keyword and the storage unit that stores the action vs. evaluation-based score indicating the correspondence between the operation content and the added point added to the importance level for each search keyword. And a document-to-word evaluation score update unit that updates the action-to-evaluation-based score for each Web page based on the operation content and the added points of the search keyword.
[Selection] Figure 1

Description

本発明は、ウェブ(以下Web)検索における検索結果の品質の向上に関する。   The present invention relates to improving the quality of search results in a Web (hereinafter referred to as Web) search.

Web上で日々大量に増え続ける文書から目的の文書を探すためのシステムは、現在では欠かせないものである。   A system for searching for a target document from a large number of documents on the Web every day is indispensable.

初期のWeb上では、事業者が人手でWebページを整理するディレクトリ型の検索システムなども存在したが、Web文書絶対量や増加ペースが増えたこともありそれでは追いつかなくなり、現在ではクローラと呼ばれるWeb上の文書を自動で集めてくるプログラムで収集し、収集した文書を解析し自動でインデックスを作成した上でそのインデックスをもとに利用者に検索結果を提示するシステムが主流となっている。   In the early days of the Web, there were directory-type search systems where operators manually organized Web pages. However, the amount of Web documents and the pace of increase have increased, making it impossible to keep up. The mainstream is a system that collects the above documents using a program that automatically collects, analyzes the collected documents, automatically creates an index, and presents search results to the user based on the index.

この際に、検索システムのユーザが効率よく目的の文書にたどり着けるようにするために、特定のアルゴリズムを用いてページをランク付けしランクが高いものから順にシステム利用者に提示して利便性を図るシステムが一般的である。   At this time, in order for the user of the search system to efficiently reach the target document, the pages are ranked using a specific algorithm and presented to the system user in descending order of the rank for convenience. The system is common.

本発明に関連する公知技術文献としては下記の特許文献1がある。   There is the following Patent Document 1 as a known technical document related to the present invention.

特許文献1は、結果の組においてWebページをランク付けするコンピューティングシステムにおける方法であって、1つまたは複数のクエリ用語の組を含むクエリに応答して生成された結果の組において結果として列挙されているWebページに対する、ユーザによって行われるコンテンツに関する対話に応答して、前記Webページ(a)と、前記クエリ用語(b)に対する該Webページの関連性のレベルを反映して、前記クエリ用語の組の中の1つの該クエリ用語との組合せごとに評価得点を調整するステップと、1組の個別のクエリ用語を含む個別のクエリに応答して生成される個別の結果の組において結果として列挙されている複数のWebページごとに、前記Webページ(a)と前記個別の組のクエリ用語(b)の中の1つのクエリ用語との組合せごとに調整された評価得点を選択するステップと、 前記選択された評価得点を組合せることによって、前記個別のクエリ結果における前記Webページのランキング得点を決定するステップとを備えたことを特徴とする方法を開示する。   Patent document 1 is a method in a computing system that ranks Web pages in a result set, and enumerates as a result in a result set generated in response to a query that includes one or more query term sets. The query terms reflecting the level of relevance of the web page to the web page (a) and the query term (b) in response to content-related user interaction with the web page being As a result in a set of individual results generated in response to an individual query including a step of adjusting an evaluation score for each combination of the query terms in the set of For each of the listed web pages, one of the web page (a) and the individual set of query terms (b) Selecting an evaluation score adjusted for each combination with a query term; and determining a ranking score for the web page in the individual query result by combining the selected evaluation score. A method characterized by this is disclosed.

特願2009−503249Japanese Patent Application No. 2009-503249

上記特許文献1におけるページランクを決定する手段はおよそ次のような動作である。1つまたは複数の検索キーワードの組を含む検索要求に応答して生成された検索結果リストの組に含まれるWebページに対応する結果に対する、ユーザによって行われる「見つけたページが目的に合致するページだった」場合に取り得るいくつかの内容対話(例えば、内容を印刷する、お気に入りに登録するなど)のそれぞれに応答して、システムは、Webページと検索キーワードの組の中の1つのキーワードとの組合せごとに評価得点を調整(増加)する。   The means for determining the page rank in Patent Document 1 is approximately the following operation. A “page that finds a page that matches the purpose” is performed by the user for a result corresponding to a web page included in a set of search result lists generated in response to a search request including one or a plurality of search keyword sets. In response to each of a number of possible content interactions (for example, printing the content, registering in favorites, etc.), the system selects one keyword from the web page and search keyword pair. The evaluation score is adjusted (increased) for each combination.

このようなユーザによる対話をWebページごとに繰り返す結果として、1組の個別の検索キーワードを含む個別の検索要求に応答して生成された個別の結果の組に含まれるWebページのそれぞれについて、それぞれのWebページにより関連が強いキーワードの評価得点が上昇していく。また、ユーザの検索要求に対するWebページに対するランキングは、検索キーワードの組においてWebページごとに算出した検索キーワードに対する評価得点の合計値が高い順に決定する。従って、ユーザの検索結果のWebページへの評価を繰り返すことにより、より検索キーワードに関連が強いWebページが高ランクのページとしてユーザに提示されるため検索結果リストの品質が向上する。   As a result of repeating such user interaction for each Web page, for each of the Web pages included in the individual result set generated in response to the individual search request including one set of individual search keywords, The evaluation score of keywords that are strongly related to the Web page will increase. In addition, the ranking of the Web page in response to the user's search request is determined in descending order of the total evaluation score for the search keyword calculated for each Web page in the set of search keywords. Therefore, by repeating the evaluation of the user's search result to the Web page, the Web page more strongly related to the search keyword is presented to the user as a high-rank page, so that the quality of the search result list is improved.

ところで、このシステムでは次のような問題が発生し得る。   By the way, the following problems may occur in this system.

例えば、非常にメジャーなプログラミング言語Aとマイナーなプログラミング言語Bがあったとする。その上で、WebページAにはプログラミング言語Aの言語仕様の文書と、単語として「プログラミング言語A」「プログラミング言語B」「仕様」を含み、WebページBにはプログラミング言語Bの言語仕様の文書と、単語として「プログラミング言語A」「プログラミング言語B」「仕様」を含んでいたとする。また、この際の、Webページごとの評価得点の初期値を簡便にするために以下の様な値としたとする。   For example, suppose you have a very major programming language A and a minor programming language B. In addition, Web page A contains the language specification document for programming language A and the words "programming language A", "programming language B", and "specification". Web page B contains the language specification document for programming language B. And “programming language A”, “programming language B”, and “specification” as words. In this case, the following values are assumed to simplify the initial value of the evaluation score for each Web page.

(1)WebページA…キーワード「プログラミング言語A」に対する評価得点=0、キーワード「プログラミング言語B」に対する評価得点=0、キーワード「仕様」に対する評価得点=0
(2)WebページB…キーワード「プログラミング言語A」に対する評価得点=0、キーワード「プログラミング言語B」に対する評価得点=0、キーワード「仕様」に対する評価得点=0
(1) Web page A: Evaluation score for keyword “programming language A” = 0, evaluation score for keyword “programming language B” = 0, evaluation score for keyword “specification” = 0
(2) Web page B: Evaluation score for keyword “programming language A” = 0, evaluation score for keyword “programming language B” = 0, evaluation score for keyword “specification” = 0

ここで、ユーザがプログラミング言語AまたはBの仕様を調査する目的で、検索キーワードとして「プログラミング言語A」と「仕様」のペアや、「プログラミング言語B」と「仕様」をペアとして指定することを考える。プログラミング言語Aはプログラミング言語Bよりもメジャーであるため、一般的にプログラミング言語Aに対するユーザによる検索要求(キーワード「プログラミング言語A」「仕様」による検索)はプログラミング言語Bに対する検索要求(キーワード「プログラミング言語B」「仕様」による検索)よりも多くなることが予想される。ユーザによる検索要求が多くなるということは、当然Webページが選択され評価得点が増加する機会も多くなる。   Here, for the purpose of investigating the specification of programming language A or B, the user must specify “programming language A” and “specification” as a search keyword or “programming language B” and “specification” as a pair. Think. Since programming language A is larger than programming language B, a user search request for programming language A (search by keyword `` programming language A '' or `` specification '') is generally a search request for programming language B (keyword `` programming language B ”and“ specification ”) are expected to be more. The increase in the number of search requests by the user naturally increases the chance that the Web page is selected and the evaluation score increases.

ここで、(検索キーワード「プログラミング言語A」と「仕様」でWebページAが評価された回数):(検索キーワード「プログラミング言語B」と「仕様」でWebページBが評価された回数)=10:1であるとすると、最終的なWebページの評価点はおよそ以下のようになると考えられる。   Here, (number of times Web page A is evaluated with the search keywords “programming language A” and “specification”): (number of times web page B is evaluated with the search keywords “programming language B” and “specification”) = 10 If it is: 1, the final Web page evaluation points will be as follows.

(1)WebページA…
キーワード「プログラミング言語A」に対する評価得点=10a、
キーワード「プログラミング言語B」に対する評価得点=0a(関連性が低いため評価されない)、キーワード「仕様」に対する評価得点=10a
(2)WebページB…
キーワード「プログラミング言語A」に対する評価得点=0a(関連性が低いため評価されない)、キーワード「プログラミング言語B」に対する評価得点=1a、
キーワード「仕様」に対する評価得点=1a
(1) Web page A ...
Evaluation score for keyword “programming language A” = 10a,
Evaluation score for keyword “programming language B” = 0a (not evaluated due to low relevance), evaluation score for keyword “specification” = 10a
(2) Web page B ...
Evaluation score for keyword “programming language A” = 0a (not evaluated due to low relevance), evaluation score for keyword “programming language B” = 1a,
Evaluation score for keyword "specification" = 1a

ここで、プログラミング言語Bの仕様を調査する目的で検索キーワードとして「プログラミング言語B」「仕様」を指定して検索を行ったとする。   Here, for the purpose of investigating the specification of programming language B, it is assumed that a search is performed by specifying “programming language B” and “specification” as search keywords.

この際のWebページAとWebページBのランキングを決定する評価得点の合計は次のような値になる。   At this time, the sum of the evaluation scores for determining the ranking of Web page A and Web page B is as follows.

(1)WebページA評価得点合計=「プログラミング言語B」評価得点0a+「仕様」評価得点10a=10a
(2)WebページB評価得点合計=「プログラミング言語B」評価得点1a+「仕様」評価得点1a=2a
(1) Web page A evaluation score total = “programming language B” evaluation score 0a + “specification” evaluation score 10a = 10a
(2) Web page B evaluation score total = "programming language B" evaluation score 1a + "specification" evaluation score 1a = 2a

この結果、「WebページA評価得点合計」>「WebページB評価得点合計」となってしまい、ユーザはプログラミング言語Bの仕様について知りたいにもかかわらずWebページAが優先で提示されることとなり、検索結果の品質が低下する問題が生じる。   As a result, "Web Page A Evaluation Score Total"> "Web Page B Evaluation Score Total", and Web page A is presented with priority even though the user wants to know the programming language B specifications. Therefore, there arises a problem that the quality of the search result is deteriorated.

本発明の目的は、ページランクの決定精度を上げ、ユーザに対してより利用しやすい検索結果を提示するシステムを提供することにある。   An object of the present invention is to provide a system that improves the accuracy of determining a page rank and presents a search result that is easier to use for a user.

本発明の一観点によれば、Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点部と、指定された検索キーワードを受信する検索要求受信部と、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定部と、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新部と、備えることを特徴とするウェブ検索装置が提供される。   According to one aspect of the present invention, a document-to-word evaluation score unit that collects a Web page and initializes a document-to-word evaluation score of the Web page, a search request receiving unit that receives a specified search keyword, Stores an action vs. evaluation base score indicating a correspondence relationship between a keyword importance determining unit that determines the importance for each search keyword from the specified search keyword and an operation content and a point added to the importance for each search keyword. A document-to-word evaluation score updating unit that updates the action-to-evaluation base score for each Web page based on the operation content and the added points of the search keyword with reference to a storage unit; A web search device is provided.

ユーザ内容対応(評価)からWebページの文書対単語評価得点を更新するためにキーワード評価得点に加算するキーワード毎の加算得点を決定する際に、加算得点に前述手段で決定したキーワードごとの重要度を重みとして掛けることにより、Webページを特徴付けるキーワード(情報のカテゴリを表すキーワード)の評価得点が上昇しやすくなる。相対的にどのようなカテゴリにも存在するような一般的な単語は評価が上がりにくくなる。また、あまり検索されないマイナーな単語でもその文書に対する重要なキーワードは評価が上がりやすくなる。   Importance score for each keyword determined by the above-mentioned means when adding score for each keyword to be added to keyword evaluation score to update document vs. word evaluation score of web page from user content correspondence (evaluation) As a weight, the evaluation score of a keyword that characterizes a Web page (a keyword that represents an information category) is likely to increase. A general word that exists in any category is less likely to be evaluated. In addition, even for a minor word that is not often searched, an important keyword for the document is easily evaluated.

前記文書対単語評価得点更新部は、前記Webページ毎に、前記検索キーワードの重み付けを減算する検索キーワードを示す減算ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新することを特徴とする。   The document-to-word evaluation score update unit updates the action-based evaluation base score for each Web page based on a subtraction point indicating a search keyword for subtracting the weight of the search keyword for each Web page. Features.

また、前記文書対単語評価得点更新部は、ある時間間隔で、Webページ毎の前記文書対単語評価得点に更新し、削除されたWebページの文書があれば、それについては文書対単語評価得点から削除する処理を継続することを特徴とする。   The document-to-word evaluation score update unit updates the document-to-word evaluation score for each Web page at a certain time interval, and if there is a deleted Web page document, the document-to-word evaluation score The process of deleting from is continued.

本発明の他の観点によれば、Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点ステップと、指定された検索キーワードを受信する検索要求受信ステップと、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定ステップと、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新ステップと有することを特徴とするウェブ検索方法が提供される。   According to another aspect of the present invention, a document-to-word evaluation scoring step for collecting a web page and initializing a document-to-word evaluation score for the web page; a search request receiving step for receiving a designated search keyword; , Memorize action vs. evaluation-based score indicating the correspondence between the keyword importance determination step for determining the importance for each search keyword from the specified search keyword and the operation content and the added points to be added to the importance for each search keyword And a document-to-word evaluation score update step for updating the action-to-evaluation base score for each Web page based on the operation content and the added points of the search keyword. A web search method is provided.

本発明は、上記に記載のウェブ検索方法を実行させるためのプログラムであり、当該プログラムを記憶するコンピュータ読みとり可能な記録媒体であっても良い。   The present invention is a program for executing the web search method described above, and may be a computer-readable recording medium storing the program.

本発明によれば、検索結果のユーザへの提示順ユーザが目的とする結果に近いものとなるという利点がある。   According to the present invention, there is an advantage that the search result is close to the target result of the user in the order of presentation to the user.

本発明の実施の形態によるWeb検索システムの一構成例を示す機能ブロック図である。It is a functional block diagram which shows the example of 1 structure of the web search system by embodiment of this invention. 文書対単語評価得点データベースの一構成例を示す図である。It is a figure which shows the example of 1 structure of a document versus word evaluation score database. 検索処理の流れを示すフローチャート図である。It is a flowchart figure which shows the flow of a search process. 図3AのステップS309からステップS302に遷移するまでの処理を示す図である。It is a figure which shows the process until it changes from step S309 of FIG. 3A to step S302. 図3AのステップS303(検索結果リスト生成処理)の処理の詳細を示す図である。It is a figure which shows the detail of a process of step S303 (search result list generation process) of FIG. 3A. 図3AのステップS307(検索キーワード重み算出)の処理の詳細を示す図である。It is a figure which shows the detail of the process of step S307 (search keyword weight calculation) of FIG. 3A. 図3AのステップS308(評価加算点を算出)のの処理の詳細を示す図である。It is a figure which shows the detail of the process of step S308 (calculation evaluation addition point) of FIG. 3A. 図3AのステップS309(Webページの文書対単語評価得点の更新)の処理の詳細を示す図であるIt is a figure which shows the detail of a process of step S309 (update of the document versus word evaluation score of a web page) of FIG. 3A. 操作内容(アクション)と加点ポイントとの対応関係を示すアクション対評価ベース得点を示す図である。It is a figure which shows the action versus evaluation base score which shows the correspondence of operation content (action) and a score point. キーワード重みを下げるキーワードと減算値を対応付ける図である。It is a figure which matches the keyword which lowers keyword weight, and a subtraction value.

発明者は、ユーザの評価フィードバックによる効率の良いWeb検索結果提示システム及び方法において、「Webページにとってあまり重要ではない一般的な単語」と「Webページの重要なキーとなる単語」の評価得点を平等に扱うと、「WebページA評価得点合計」>「WebページB評価得点合計」となってしまい、ユーザはプログラミング言語Bの仕様について知りたいにもかかわらずWebページAが優先で提示されることとなり、検索結果の品質が低下する問題が生じると考えた。   The inventor gives evaluation scores of “common words that are not very important for Web pages” and “words that are important keys for Web pages” in an efficient Web search result presentation system and method based on user evaluation feedback. If treated equally, “Web Page A Evaluation Score Total”> “Web Page B Evaluation Score Total”, and the user is presented with Web Page A with priority even though he wants to know the programming language B specifications. As a result, there was a problem that the quality of search results deteriorated.

以下、本発明の実施の形態によるWeb検索技術について図面を参照しながら詳細に説明する。   Hereinafter, a Web search technique according to an embodiment of the present invention will be described in detail with reference to the drawings.

図1は、本発明の実施の形態によるWeb検索システムの一構成例を示す機能ブロック図である。本実施の形態によるWeb検索システムは、ホストシステム(検索装置)110と、それに接続された文書対単語評価得点データベース119とを有している。ホストシステム110は、インターネットなどのネットワーク120に接続されており、ネットワーク120には、本実施の形態によるWeb検索システムを利用する利用者端末100と、検索対象であるWebページの文書が収められたサーバ群130とが接続されている。   FIG. 1 is a functional block diagram showing a configuration example of a Web search system according to an embodiment of the present invention. The Web search system according to the present embodiment includes a host system (search device) 110 and a document-to-word evaluation score database 119 connected thereto. The host system 110 is connected to a network 120 such as the Internet. The network 120 stores a user terminal 100 that uses the Web search system according to the present embodiment and a Web page document to be searched. A server group 130 is connected.

ホストシステム110は、サーバ群130群からWebページの文書を集めてくる文書収集部111、文書対単語評価得点データベース119のデータを初期化する文書対単語評価得点初期化部112、利用者端末100からの検索要求を受け取る検索要求受信部113、検索要求受信部113で受け取った検索要求キーワードからキーワードの重要度を決定するキーワード重要度決定部114、検索要求受信部113で受け取った検索要求キーワードと文書対単語評価得点データベース119の情報からページランクを決定し検索結果リストを生成する検索結果リスト生成部115、前述検索結果リストを利用者端末100に送信する検索結果リスト送信部116、利用者端末100に送信された前述検索結果リストのユーザ評価結果を受信する利用者評価受信部117、前述評価結果とキーワード重要度決定部114で決定したキーワードの重要度を用いて文書対単語評価得点データベース119のデータを更新する文書対単語評価得点更新部118を有している。   The host system 110 includes a document collection unit 111 that collects Web page documents from the server group 130, a document-to-word evaluation score initialization unit 112 that initializes data in the document-to-word evaluation score database 119, and a user terminal 100. A search request receiving unit 113 that receives a search request from the keyword, a keyword importance determining unit 114 that determines the importance of the keyword from the search request keyword received by the search request receiving unit 113, and the search request keyword received by the search request receiving unit 113 A search result list generation unit 115 that determines a page rank from information in the document versus word evaluation score database 119 and generates a search result list, a search result list transmission unit 116 that transmits the search result list to the user terminal 100, and a user terminal The user evaluation result of the search result list transmitted to 100 is received. The user evaluation receiving unit 117 includes a document-to-word evaluation score updating unit 118 that updates data in the document-to-word evaluation score database 119 using the above-described evaluation result and the keyword importance determined by the keyword importance determining unit 114. ing.

文書対単語評価得点データベース119には、図2に例示するような構造のデータが収められている。図2(a)に符号200で示すように、Webページアドレス毎にWebページ情報が複数収められている。Webページ情報のうちの1つずつは、符号210〜241に示すような複数の情報から構成されている。Webページアドレス210はWebページの文書のアドレスである。このアドレスの文書に含まれるキーワード全てでそれぞれ評価得点を持っている。図2の例では、文書中のキーワード1(220)に対する評価得点が評価得点1(221)、キーワード2(230)に対する評価得点が評価得点2(231)、キーワード3(240)に対する評価得点が評価得点3(241)、…という構成になっている。   The document-to-word evaluation score database 119 stores data having a structure as illustrated in FIG. As indicated by reference numeral 200 in FIG. 2A, a plurality of pieces of web page information are stored for each web page address. Each piece of Web page information is composed of a plurality of pieces of information as indicated by reference numerals 210 to 241. The web page address 210 is the address of the document of the web page. Each keyword included in the document at this address has an evaluation score. In the example of FIG. 2, the evaluation score for keyword 1 (220) in the document is the evaluation score 1 (221), the evaluation score for keyword 2 (230) is the evaluation score 2 (231), and the evaluation score for keyword 3 (240) is Evaluation score 3 (241),...

図3は、検索処理の流れを示すフローチャート図である。図3Aは、全体の処理の流れを示すフローチャート図である。   FIG. 3 is a flowchart showing the flow of search processing. FIG. 3A is a flowchart showing the overall processing flow.

まず、図3Aについて説明する。ステップS301は、文書収集部111を用いてネットワーク120に接続されたサーバ群130からWebページの文書を収集し、文書対単語評価得点初期化部112を用いてWebページ毎に例えば全キーワードを抽出しWebページアドレスの文書に評価得点を初期化して、図2(b)に示す文書対単語評価得点データベース119に格納する。ステップS302では、検索要求受信部113を用いてユーザからの検索要求を受信する。ステップS303では、検索結果リスト生成部115で文書対単語評価得点データベース119のWebページ情報とステップS302で受信した検索要求の検索キーワードを元にWebページランクを決定し検索結果リストを生成する。ステップS303の処理の詳細は後述する。ステップS304ではステップS303で生成した結果リストを利用者端末100に送信する。ステップS305では、提示した結果リストについてユーザがどのアドレス(アドレスA)のWebページにどのようなアクション(アクションX)を取ったかを利用者評価受信部117で受信する。   First, FIG. 3A will be described. A step S301 collects Web page documents from the server group 130 connected to the network 120 using the document collection unit 111, and extracts, for example, all keywords for each Web page using the document-to-word evaluation score initialization unit 112. Then, the evaluation score is initialized to the document of the Web page address and stored in the document-to-word evaluation score database 119 shown in FIG. In step S302, the search request receiving unit 113 is used to receive a search request from the user. In step S303, the search result list generation unit 115 determines the Web page rank based on the Web page information in the document-to-word evaluation score database 119 and the search keyword of the search request received in step S302, and generates a search result list. Details of the processing in step S303 will be described later. In step S304, the result list generated in step S303 is transmitted to the user terminal 100. In step S <b> 305, the user evaluation receiving unit 117 receives what action (action X) the user has taken on the web page at which address (address A) in the presented result list.

以降、ステップS306〜S309は文書対単語評価得点更新部118で行う得点更新処理である。ステップS306では、図4のような、操作(アクション)内容と加点ポイントとの対応関係を示すアクション対評価ベース得点の表から操作内容(アクション)Xをキーにして、評価ベース得点(以後、「評価ベース得点B」とする。)を決定する。例えば、ユーザが取ったアクション(アクションX)が「ページを印刷した(403)」であれば評価ベース得点Bは「評価ベース得点2(404)」となる。ステップS307では、検索キーワード毎にキーワード重要度決定部114でキーワードの重要度(ウェイト値)を決定する。ステップS307についての処理の詳細は後述する。   Thereafter, steps S306 to S309 are score update processing performed by the document-to-word evaluation score update unit 118. In step S306, as shown in FIG. 4, an evaluation-based score (hereinafter referred to as “ Evaluation base score B ”) is determined. For example, if the action (action X) taken by the user is “print page (403)”, the evaluation base score B is “evaluation base score 2 (404)”. In step S307, the keyword importance level determination unit 114 determines the keyword importance level (weight value) for each search keyword. Details of the processing in step S307 will be described later.

ステップS308では、ステップS306で決定した評価ベース得点とステップS307で決定したキーワード毎の重要度を乗算等の処理により関連付けしてキーワードごとの評価得点加算値を決定する。この処理の詳細は後述する。ステップS309では、文書対単語評価得点データベース119のWebページアドレスがアドレスAと一致するレコードに対して、キーワード毎の評価得点にステップS308で決定した加算点を加算する。詳細は後述する。その後、ステップS302の検索要求受付処理に戻る。このステップS302〜309の繰り返しにより、徐々に検索結果リストの改善を行うことができる。   In step S308, the evaluation score added value for each keyword is determined by associating the evaluation base score determined in step S306 with the importance for each keyword determined in step S307 by a process such as multiplication. Details of this processing will be described later. In step S309, the addition point determined in step S308 is added to the evaluation score for each keyword with respect to the record in which the Web page address in the document-to-word evaluation score database 119 matches the address A. Details will be described later. Thereafter, the process returns to the search request receiving process in step S302. By repeating these steps S302 to S309, the search result list can be gradually improved.

図3Bは、ステップS309からステップS302に遷移するまでの処理を示す図である。ステップS302に戻るループの間に適時、次のような処理も行う。まず、ステップSA1で、サーバにWebページの文章が追加されるかどうかを判断し、Yesであれば、ステップSA2に進み、一定の間隔でステップS301の初期化処理をサーバ群130に新規に追加されたWebページの文書に対して行い、すなわち、ステップSA2で、Webページに関して一定の間隔でステップS301の初期化を行い、ステップSA3で、新規に追加されたWebページの文書を文書対単語評価得点データベース119に追加する。また、ステップSA4では、もし削除されたWebページの文書があれば、それについては文書対単語評価得点データベース119から削除し、ステップS302に進む。   FIG. 3B is a diagram illustrating processing from the transition from step S309 to step S302. The following processing is also performed at appropriate times during the loop returning to step S302. First, in step SA1, it is determined whether the text of the Web page is added to the server. If Yes, the process proceeds to step SA2, and the initialization process of step S301 is newly added to the server group 130 at regular intervals. In step SA2, initialization is performed in step S301 at regular intervals with respect to the web page. In step SA3, the newly added web page document is document-to-word evaluated. It adds to the score database 119. In step SA4, if there is a deleted Web page document, it is deleted from the document-to-word evaluation score database 119, and the process proceeds to step S302.

次に、図3Cを参照して、ステップS303(検索結果リスト生成処理)の詳細を述べる。ステップS303−1で、ステップS302で受け取った検索キーワード全てを含むWebページの文書を文書対単語評価得点データベース119から選択し評価得点の合計を計算する。例えば、検索キーワードが先頭から「キーワード1」「キーワード2」「キーワード3」であるとする。これらのキーワードを全て含むWebページ情報が、図2(b)の210から241までのようになっている場合に、このWebページの評価得点の合計は「評価得点1(221)」+「評価得点2(231)」+「評価得点3(241)」となる。このような計算を、キーワード「キーワード1」「キーワード2」「キーワード3」の全てを含むWebページ情報についてそれぞれ計算し、合計評価得点の高い順にWebページアドレス210を並べたリストを生成する。ステップ303−2において、全てのキーワードを含むWebページについて計算を行い、計算済みの場合に(YES)、ステップ303−3において、合計評価点の高い順にリストを作成する、そして、ステップS304でリストを送信する。   Next, details of step S303 (search result list generation processing) will be described with reference to FIG. 3C. In step S303-1, a Web page document including all the search keywords received in step S302 is selected from the document-to-word evaluation score database 119, and the total evaluation score is calculated. For example, it is assumed that the search keywords are “keyword 1”, “keyword 2”, and “keyword 3” from the top. When the Web page information including all of these keywords is from 210 to 241 in FIG. 2B, the total evaluation score of this Web page is “evaluation score 1 (221)” + “evaluation” Score 2 (231) "+" Evaluation score 3 (241) ". Such a calculation is performed for Web page information including all of the keywords “keyword 1”, “keyword 2”, and “keyword 3”, and a list in which the Web page addresses 210 are arranged in descending order of the total evaluation score is generated. In step 303-2, calculation is performed for the Web page including all keywords. If the calculation has been completed (YES), a list is created in descending order of the total evaluation score in step 303-3, and the list is calculated in step S304. Send.

次に、図3Dを参照して、ステップS307(検索キーワード重み算出)の詳細を述べる。ステップS302で受け取った検索キーワードが、先頭から「キーワード1」「キーワード2」…「キーワードn」である場合、それぞれ求めるキーワードの重みを「重みW1」「重みW2」…「重みWn」とする。   Next, details of step S307 (search keyword weight calculation) will be described with reference to FIG. 3D. If the search keywords received in step S302 are “keyword 1”, “keyword 2”,..., “Keyword n” from the top, the weights of the obtained keywords are “weight W1,” “weight W2,”.

最初に、一般的な使用方法として先頭に指定したキーワードほど検索システムの利用者にとって重要なキーワードであるという仮定の基に、W1>W2>・・・>Wnとなる基本値を決定する(ステップS307−1)。例えば、以下のようにキーワード毎に重み付けを行う。

Figure 2014075064
First, based on the assumption that the keyword specified at the top as a general usage method is an important keyword for the user of the search system, a basic value that satisfies W1>W2>. S307-1). For example, weighting is performed for each keyword as follows.
Figure 2014075064

次に、「キーワード1」「キーワード2」…「キーワードn」の中に、図5のようなキーワード重みを下げるキーワードと減算値を対応付ける表に基づいて、その中に一致するキーワードがあるか否かを調べ(ステップS307−2)、一致するキーワードがあった場合(ステップS307−3でYes)、前述で決定した重みをキーワードに一致した「重要度減算値」の分だけ減らす減算処理を行う(ステップS307−4)。例えば、「キーワード2」が「キーワードB(503)」と一致した場合、「重みW2」から「重要度減算値B」を減算する。この際、「重みW2」は重みの最低値(>0)を下回らないように値を調整する。図5の表中のキーワードと一致しないキーワードの重みはそのままとする(ステップS307−3でNo)。   Next, in “keyword 1” “keyword 2”... “Keyword n”, based on the table associating the keyword weighting and the subtraction value as shown in FIG. (Step S307-2), and if there is a matching keyword (Yes in step S307-3), a subtraction process is performed to reduce the weight determined above by the “importance subtraction value” that matches the keyword. (Step S307-4). For example, when “keyword 2” matches “keyword B (503)”, “importance subtraction value B” is subtracted from “weight W2”. At this time, the value of “weight W2” is adjusted so as not to fall below the minimum value (> 0) of the weight. The weights of keywords that do not match the keywords in the table of FIG. 5 are left as they are (No in step S307-3).

次に、図3Eを参照して、ステップS308(評価加算点を算出)の詳細について述べる。ステップS308−1で、キーワードと一致する評価加算項が有るかどうかを判定し、Yesの場合には、ステップS308−2で、評価加算により加算(キーワード毎)を行う。すなわち、ステップS306で決定した評価ベース得点BとステップS307で決定した重みWを掛けてキーワードごとの評価加算点Aを決定する。例えば、以下のようにキーワード毎に加算ポイントを求める。

Figure 2014075064
Next, with reference to FIG. 3E, the details of step S308 (calculate evaluation addition points) will be described. In step S308-1, it is determined whether or not there is an evaluation addition term that matches the keyword. In the case of Yes, addition (for each keyword) is performed by evaluation addition in step S308-2. That is, the evaluation addition score A for each keyword is determined by multiplying the evaluation base score B determined in step S306 by the weight W determined in step S307. For example, the addition points are obtained for each keyword as follows.
Figure 2014075064

より詳細には、以下のようになる。
「キーワード1」の「評価加算点A1」=「評価ベース得点B」×「重みW1」
「キーワード2」の「評価加算点A2」=「評価ベース得点B」×「重みW2」

「キーワードn」の「評価加算点An」=「評価ベース得点B」×「重みWn」
In more detail, it is as follows.
“Evaluation addition point A1” = “Evaluation base score B” × “Weight W1” of “Keyword 1”
“Evaluation addition point A2” = “Evaluation base score B” × “Weight W2” of “Keyword 2”
:
“Evaluation addition point An” = “Evaluation base score B” × “Weight Wn” of “Keyword n”

図3Fを参照して、ステップS309(Webページの文書対単語評価得点の更新)の詳細を述べる。ステップS308で決定した評価加算点を文書対単語評価得点データベース119の情報に反映する(ステップS309−1)。ステップS305で取得したアドレスAとWebページアドレス(210)と一致するWebページ情報について(ステップS309−2でYes)、前述「キーワード1」〜「キーワードn」の評価得点にそれぞれ「評価得点A1」〜「評価得点An」の加算を行って(ステップS309−3)、文書対単語評価得点データベースDB119の更新を行う(ステップS309−4)。   With reference to FIG. 3F, details of step S309 (update of document-to-word evaluation score of Web page) will be described. The evaluation addition score determined in step S308 is reflected in the information of the document-to-word evaluation score database 119 (step S309-1). For the Web page information that matches the address A acquired in step S305 and the Web page address (210) (Yes in step S309-2), the evaluation score of the above-mentioned “keyword 1” to “keyword n” is “evaluation score A1”. -"Evaluation score An" is added (step S309-3), and the document-to-word evaluation score database DB119 is updated (step S309-4).

以上のように、本実施の形態による検索結果提示システムによれば、次のような利点がある。   As described above, the search result presentation system according to the present embodiment has the following advantages.

検索要求キーワードを解析し、キーワードごとの重要度を算定して、Webページの文書対単語評価得点のデータベースの評価得点を加算する際に重要度をWebページ毎のキーワードへの重みとして利用することにより、Webページ対キーワード評価得点のデータの精度が高まる。また、検索結果のユーザへの提示順を決定するためのページランクの算出結果がよりユーザが目的とする結果に近いものとなる。   Analyze search request keywords, calculate the importance of each keyword, and use the importance as a weight to the keyword for each Web page when adding the evaluation score of the database of document score vs. word evaluation score of the Web page This increases the accuracy of the Web page vs. keyword evaluation score data. In addition, the page rank calculation result for determining the order in which the search results are presented to the user is closer to the target result of the user.

尚、上記の実施の形態において、添付図面に図示されている構成等については、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。   In the above-described embodiment, the configuration and the like illustrated in the accompanying drawings are not limited to these, and can be changed as appropriate within the scope of the effects of the present invention. In addition, various modifications can be made without departing from the scope of the object of the present invention. Each component of the present invention can be arbitrarily selected, and an invention having a selected configuration is also included in the present invention.

また、本実施の形態で説明した機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。尚、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。   In addition, a program for realizing the functions described in the present embodiment is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed to execute processing of each unit. May be performed. The “computer system” here includes an OS and hardware such as peripheral devices.

また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.

本発明は、検索システムに利用可能である。   The present invention can be used in a search system.

100…検索システム利用者端末、110…検索ホストシステム、111…Webページ文書収集部、112…Webページ文書対単語評価得点初期化部、113…検索要求受信部、114…検索キーワード重要度決定部、115…検索結果リスト生成部、116…検索結果リスト送信部、117…利用者評価受信部、118…Webページの文書対単語評価得点更新部、119…Webページの文書対単語評価得点を収めたデータベース、120…ネットワーク、130…ネットワークに接続されたWebページ文書を収めたサーバ群。 DESCRIPTION OF SYMBOLS 100 ... Search system user terminal, 110 ... Search host system, 111 ... Web page document collection part, 112 ... Web page document versus word evaluation score initialization part, 113 ... Search request reception part, 114 ... Search keyword importance determination part 115 ... Search result list generating unit 116 ... Search result list transmitting unit 117 ... User evaluation receiving unit 118 ... Web page document-to-word evaluation score update unit 119 ... Web page document-to-word evaluation score 120, network, 130, a server group storing web page documents connected to the network.

Claims (5)

Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点部と、指定された検索キーワードを受信する検索要求受信部と、指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定部と、操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新部と、を備えることを特徴とするウェブ検索装置。   Collecting Web pages and initializing document-to-word evaluation scores for Web pages, search-request receiving unit for receiving specified search keywords, and search keywords from specified search keywords Referring to the keyword importance level determination unit that determines the importance level of the operation, and the storage unit that stores the action vs. the evaluation-based score indicating the correspondence between the operation content and the added point added to the importance level for each search keyword, A web search apparatus, comprising: a document-to-word evaluation score update unit that updates the action-based evaluation base score for each Web page based on content and the added points of the search keyword. 前記文書対単語評価得点更新部は、
前記Webページ毎に、前記検索キーワードの重み付けを減算する検索キーワードを示す減算ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新することを特徴とする請求項1に記載のウェブ検索装置。
The document-to-word evaluation score update unit
2. The web according to claim 1, wherein for each web page, the action vs. evaluation base score for each web page is updated based on a subtraction point indicating a search keyword from which the weight of the search keyword is subtracted. Search device.
前記文書対単語評価得点更新部は、
ある時間間隔で、Webページ毎の前記文書対単語評価得点に更新し、削除されたWebページの文書があれば、それについては文書対単語評価得点から削除する処理を継続することを特徴とする請求項1又は2に記載のウェブ検索装置。
The document-to-word evaluation score update unit
Update to the document-to-word evaluation score for each Web page at a certain time interval, and if there is a deleted Web page document, continue to delete it from the document-to-word evaluation score The web search device according to claim 1 or 2.
Webページを収集してWebページの文書対単語評価得点の初期化をする文書対単語評価得点ステップと、
指定された検索キーワードを受信する検索要求受信ステップと、
指定された検索キーワードから検索キーワードごとの重要度を決定するキーワード重要度決定ステップと、
操作内容と検索キーワードごとの重要度に加点する加点ポイントとの対応関係を示すアクション対評価ベース得点を記憶する記憶部を参照して、前記操作内容と前記検索キーワードの加点ポイントに基づいて、前記Webページ毎の前記アクション対評価ベース得点を更新する文書対単語評価得点更新ステップと有することを特徴とするウェブ検索方法。
Document-to-word evaluation scoring step for collecting web pages and initializing document-to-word evaluation scores on the web pages;
A search request receiving step for receiving a specified search keyword;
A keyword importance determination step for determining the importance of each search keyword from the specified search keywords;
With reference to the storage unit storing action vs. evaluation-based score indicating the correspondence between the operation content and the point added to the importance for each search keyword, based on the operation content and the point added to the search keyword, A web search method comprising: a document vs. word evaluation score update step for updating the action vs. evaluation base score for each Web page.
コンピュータに請求項4に記載のウェブ検索方法を実行させるためのプログラム。   A program for causing a computer to execute the web search method according to claim 4.
JP2012222735A 2012-10-05 2012-10-05 Web search device, web search method and program Expired - Fee Related JP6042162B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012222735A JP6042162B2 (en) 2012-10-05 2012-10-05 Web search device, web search method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012222735A JP6042162B2 (en) 2012-10-05 2012-10-05 Web search device, web search method and program

Publications (2)

Publication Number Publication Date
JP2014075064A true JP2014075064A (en) 2014-04-24
JP6042162B2 JP6042162B2 (en) 2016-12-14

Family

ID=50749164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012222735A Expired - Fee Related JP6042162B2 (en) 2012-10-05 2012-10-05 Web search device, web search method and program

Country Status (1)

Country Link
JP (1) JP6042162B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102239913B1 (en) * 2020-08-28 2021-04-12 김영철 Apparatus for Measuring Inside Diameter

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090109A (en) * 1998-09-10 2000-03-31 Sharp Corp Information management device and recording medium recorded with program thereof
JP2002251410A (en) * 2001-02-26 2002-09-06 Sharp Corp Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program
JP2008158893A (en) * 2006-12-25 2008-07-10 Jamu:Kk Information search device, information search program, and program storage medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090109A (en) * 1998-09-10 2000-03-31 Sharp Corp Information management device and recording medium recorded with program thereof
JP2002251410A (en) * 2001-02-26 2002-09-06 Sharp Corp Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program
JP2008158893A (en) * 2006-12-25 2008-07-10 Jamu:Kk Information search device, information search program, and program storage medium

Also Published As

Publication number Publication date
JP6042162B2 (en) 2016-12-14

Similar Documents

Publication Publication Date Title
US10489448B2 (en) Method and system for dynamically ranking images to be matched with content in response to a search query
CN110362727B (en) Third party search application for search system
US8612423B2 (en) Search cache for document search
US7840547B1 (en) Methods and systems for efficient query rewriting
US8849775B2 (en) Caching web documents in two or more caches
US9177057B2 (en) Re-ranking search results based on lexical and ontological concepts
US20100299343A1 (en) Identifying Task Groups for Organizing Search Results
JP5084858B2 (en) Summary creation device, summary creation method and program
US9135307B1 (en) Selectively generating alternative queries
WO2007130914A2 (en) Dynamic search engine results employing user behavior
JP2009252070A (en) Method for calculating score for search query
US10282358B2 (en) Methods of furnishing search results to a plurality of client devices via a search engine system
US20120233096A1 (en) Optimizing an index of web documents
US9183299B2 (en) Search engine for ranking a set of pages returned as search results from a search query
JP2022106948A (en) Information display method, device, electronic apparatus, storage media, and computer program
JP2011248762A (en) Classification device, content retrieval system, content classification method, content retrieval method, and program
JP4824070B2 (en) Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log
JP2015022528A (en) Trigger query acquisition device, trigger query acquisition method, and program
US9785676B2 (en) Systems and methods for providing ordered results for search queries
WO2014021824A1 (en) Search method
JP6042162B2 (en) Web search device, web search method and program
JP2010123036A (en) Document retrieval device, document retrieval method and document retrieval program
US9449095B1 (en) Revising search queries
JP2006185167A (en) File search method, file search device, and file search program
US9659064B1 (en) Obtaining authoritative search results

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161109

R150 Certificate of patent or registration of utility model

Ref document number: 6042162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees