[go: up one dir, main page]

JP2006085474A - Item search device, method, and program - Google Patents

Item search device, method, and program Download PDF

Info

Publication number
JP2006085474A
JP2006085474A JP2004270215A JP2004270215A JP2006085474A JP 2006085474 A JP2006085474 A JP 2006085474A JP 2004270215 A JP2004270215 A JP 2004270215A JP 2004270215 A JP2004270215 A JP 2004270215A JP 2006085474 A JP2006085474 A JP 2006085474A
Authority
JP
Japan
Prior art keywords
item
search
input
list
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004270215A
Other languages
Japanese (ja)
Inventor
Nobuhide Yamazaki
信英 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004270215A priority Critical patent/JP2006085474A/en
Publication of JP2006085474A publication Critical patent/JP2006085474A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an item search device outputting a proper candidate for an item according to an optional relevant keyword even if a part or none of a name of a content/commodity is known. <P>SOLUTION: A list of item names serving as candidates is previously stored in an item list 203. A URL search part 201 searches a web page on the Internet based on the keyword. A text extraction part 202 acquires text information related to the keyword. A score counting part 204 counts a frequency of appearance of the item name included in the item list from the text information. An output part 205 outputs the items in the order of the frequency of appearance. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は、CDやDVDなどの音楽作品や映像作品等のコンテンツや各種の商品などのアイテムを検索するアイテム検索装置、アイテム検索方法およびアイテム検索プログラムに関する。   The present invention relates to an item search device, an item search method, and an item search program for searching for items such as contents such as music works and video works such as CDs and DVDs and various products.

従来、映像(ビデオ)、音楽、書籍、ゲームなどのレンタルおよび販売されるコンテンツを検索するシステムとしては、題名、作者名(監督、作家、演奏者)、製作年月、出演者名、販売元(レーベル、出版社)等のあらかじめ設定されている属性をキーワードとして、店舗端末を利用し、または、インターネット経由で店舗等のサーバにアクセスして所望のコンテンツ(アイテム)を検索することが行われている。   Conventionally, as a system for searching for contents to be rented and sold such as video (video), music, books, games, etc., the title, author name (director, writer, performer), production date, performer name, distributor Searching for a desired content (item) by using a store terminal or accessing a server such as a store via the Internet using a preset attribute such as (label, publisher) or the like as a keyword. ing.

また、インターネットを利用したオンライン店舗などで取扱商品を検索するシステムとしては、製品名、メーカ名、価格等のあらかじめ設定されている属性をキーワードとして所望の商品(アイテム)を検索することが行われている。   In addition, as a system for searching for handled products at an online store using the Internet, a desired product (item) is searched using a predetermined attribute such as a product name, a manufacturer name, and a price as a keyword. ing.

例えば、音楽に関するコンテンツであれば、演奏者名、アルバム名、曲名、ジャンル(邦楽、洋楽、ロック、クラシックなど)、レーベルなどのキーワードや分類因子を用いて、店舗端末やインターネット経由で検索することで、所望のコンテンツを検索することができるものである。   For example, content related to music can be searched via store terminals and the Internet using keywords and classification factors such as performer name, album name, song title, genre (Japanese music, Western music, rock, classical music, etc.) and label. Thus, the desired content can be searched.

上述した従来の検索のやり方は、例えば、あるアルバムを購入するときに、アルバム名は忘れたが、演奏者と曲名は知っているので、そのアルバムを見つけだすために、演奏者と曲名を掛け合わせて、各種の属性が設定されているコンテンツのデータベースの中から所望するコンテンツ(アルバム)を検索していた。   The conventional search method described above, for example, when purchasing an album, forgot the album name, but knows the performer and the song name. Thus, a desired content (album) is searched from a content database in which various attributes are set.

しかしながら、アイテムの検索としては、このように、あらかじめ定められた属性をキーワードとして検索するのではなく、任意のキーワードから検索したいという要求もある。例えば、○○という商品のテレビコマーシャルに使われていた曲の入っているCDを検索したい、ドラマ△△の主題歌の曲名を知りたい、○○映画祭で△△賞を受賞した映画のタイトルを知りたい、経営哲学について書かれた本を検索したい、というような検索の要求も存在する。しかし、このような属性に含まれないキーワードを用いてアイテムを検索する手段はこれまで存在しなかった。   However, as a search for items, there is a demand for searching from an arbitrary keyword instead of searching for a predetermined attribute as a keyword. For example, you want to search for a CD that contains a song used in a TV commercial for the product XX, want to know the title of the theme song of the drama △△, or the title of a movie that won the △△ award at the XX Film Festival There are also requests for searching such as wanting to know, or searching for books written about management philosophy. However, there has been no means for searching for items using keywords that are not included in such attributes.

この発明は、上記に鑑みてなされたものであって、任意のキーワードを用いて、所望のアイテムを検索することができるアイテム検索装置、アイテム検索方法およびアイテム検索プログラムを提供することを目的とする。   This invention is made in view of the above, Comprising: It aims at providing the item search device, the item search method, and the item search program which can search a desired item using arbitrary keywords. .

上述した課題を解決し、目的を達成するため、請求項1に記載の発明にかかるアイテム検索装置は、候補として出力するアイテム名を記憶するアイテムリスト記憶手段と、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト記憶手段に記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数手段と、前記計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、を備えたことを特徴とする。   In order to solve the above-described problems and achieve the object, an item search device according to the first aspect of the present invention relates to an item list storage means for storing item names to be output as candidates, and items to be searched. In the input means for receiving the keyword input, the search means for acquiring the content of the web page related to the keyword input by the input means from the Internet, and the content of the web page acquired by the search means, the item list storage A counting unit that counts the number of item names stored in the unit for each item name; and an output unit that outputs the item name based on the number of appearances counted by the counting unit. And

また、請求項2に記載の発明にかかるアイテム検索装置は、一次検索用の一次検索候補を記憶する一次検索リストを記憶する一時検索リスト記憶手段と、アイテムを前記一次検索候補毎に分類した属性アイテムリストを記憶する属性アイテムリスト記憶手段と、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容において、前記一次検索リスト記憶手段に記憶された一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数手段と、前記一次スコア計数手段によって計数された数と前記属性アイテムリスト記憶手段に記憶された属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成手段と、前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト生成手段によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数手段と、前記二次スコア計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、を備えたことを特徴とする。   The item search device according to the second aspect of the invention includes a temporary search list storage unit that stores a primary search list that stores primary search candidates for primary search, and an attribute that classifies items for each primary search candidate. Attribute item list storage means for storing an item list, input means for receiving an input of a keyword related to an item desired to be searched, and a search for acquiring contents of a web page related to the keyword input by the input means from the Internet And a primary score counting means for counting the number of appearance of primary search candidates stored in the primary search list storage means for each primary search candidate in the content of the web page acquired by the search means, and the primary score counting means The number counted by the score counting means and stored in the attribute item list storage means Item list generating means for generating an item list that lists item names that may be output as candidates based on the attribute item list, and the item list in the content of the web page obtained by the search means Based on the item list generated by the generating unit, a secondary score counting unit that counts the number of occurrences of the item name for each item name, and an item based on the number of appearances counted by the secondary score counting unit Output means for outputting a name.

また、請求項3に記載の発明にかかるアイテム検索方法は、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容において、候補として出力するアイテム名を記憶するアイテムリストに記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数工程と、前記計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、を含んだことを特徴とする。   An item search method according to a third aspect of the invention includes an input step of receiving an input of a keyword related to an item desired to be searched, and contents of a web page related to the keyword input by the input step on the Internet And a count for counting, for each item name, the number of item names stored in the item list for storing item names to be output as candidates in the contents of the web page acquired by the search step And an output step of outputting an item name based on the number of appearances counted by the counting step.

また、請求項4に記載の発明にかかるアイテム検索方法は、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容において、一次検索用の一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数工程と、前記一次スコア計数工程によって計数された数と、アイテムを前記一次検索候補毎に分類した属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成工程と、前記検索工程によって取得されたウェブページの内容において、前記アイテムリスト生成工程によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数工程と、前記二次スコア計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、を含んだことを特徴とする。   An item search method according to a fourth aspect of the invention includes an input step of receiving an input of a keyword related to an item desired to be searched, and contents of a web page related to the keyword input by the input step on the Internet A primary score counting step for counting the number of primary search candidates for primary search appearing for each primary search candidate in the content of the web page acquired by the search step, and the primary score counting An item list generation step for generating an item list that lists item names that may be output as candidates based on the number counted in the step and an attribute item list in which items are classified for each primary search candidate; In the content of the web page acquired by the search step, the item Based on the item list generated by the list generation step, a secondary score counting step for counting the number of occurrences of the item name for each item name, and based on the number of occurrences counted by the secondary score counting step And an output process for outputting an item name.

また、請求項5に記載の発明にかかるアイテム検索プログラムは、請求項3または4に記載のアイテム検索方法のいずれか一つをコンピュータに実行させることを特徴とする。   An item search program according to a fifth aspect of the present invention causes a computer to execute any one of the item search methods according to the third or fourth aspect.

この発明によれば、あらかじめ候補となるアイテム名のリストを記憶しておき、キーワードをもとにインターネット上のウェブページを検索し、キーワードに関連するテキスト情報を取得し、そのテキスト情報からアイテムリストに含まれるアイテム名の出現数をカウントして、その出現数の多いもの順に出力するようにしているので、そのアイテムに関連する任意のキーワードを指定するだけで、そのアイテム名を推定して出力するアイテム検索装置を提供することができるという効果を奏する。   According to this invention, a list of candidate item names is stored in advance, a web page on the Internet is searched based on a keyword, text information related to the keyword is obtained, and an item list is obtained from the text information. Counts the number of occurrences of item names included in, and outputs them in descending order of their appearance counts, so just specify any keyword related to that item and estimate and output the item name The effect that the item search device to perform can be provided is produced.

また、この発明によれば、キーワードをもとにインターネット上のウェブページを検索した後に、一次検索候補のリストをもとに検索を行うようにしたことで、アイテムの数が莫大であった場合にも高速に処理が可能なアイテム検索装置を提供することができるという効果を奏する。   In addition, according to the present invention, after searching a web page on the Internet based on a keyword, the search is performed based on a list of primary search candidates, so that the number of items is enormous. In addition, there is an effect that it is possible to provide an item search device capable of processing at high speed.

以下に添付図面を参照して、この発明にかかるアイテム検索装置の好適な実施の形態を詳細に説明する。   Exemplary embodiments of an item search device according to the present invention will be explained below in detail with reference to the accompanying drawings.

(実施の形態1)
図1は、この発明の実施の形態1にかかるアイテム検索装置を含む、システムの全体を示す構成図である。図1において、101は本実施の形態にかかるアイテム検索装置を備えたサーバであり、102はウェブページ等の膨大な情報を含んだインターネットであり、103は101のサーバとLAN等のネットワークで接続された入出力端末であり、104はインターネットに接続可能なパソコンまたはPDAなどである。
(Embodiment 1)
FIG. 1 is a configuration diagram showing the entire system including an item search device according to Embodiment 1 of the present invention. In FIG. 1, 101 is a server provided with the item search apparatus according to the present embodiment, 102 is the Internet including a huge amount of information such as a web page, and 103 is connected to the server 101 through a network such as a LAN. 104 is a personal computer or PDA that can be connected to the Internet.

このシステムにおいて、まずアイテムを検索したいユーザは入出力端末103を操作して、そのアイテムに関連する事項をキーワードとして入力する。例えば、曲名を検索する場合、その曲が使用されているコマーシャルの商品名、ドラマの主題歌に使われているのであればそのドラマ名などである。キーワードは複数指定することが可能である。次にそのキーワードをサーバ101に送る。キーワードを受信したサーバ101内のアイテム検索装置は、そのキーワードでインターネット102上の情報を検索し、その結果をもとにアイテム名候補を求め、その結果を入出力端末103に送る。そのアイテム名候補は入出力端末103に示される。   In this system, first, a user who wants to search for an item operates the input / output terminal 103 and inputs items related to the item as keywords. For example, when searching for a song name, the name of the commercial product in which the song is used, or the drama name if used for the theme song of the drama. Multiple keywords can be specified. Next, the keyword is sent to the server 101. Upon receiving the keyword, the item search device in the server 101 searches information on the Internet 102 with the keyword, obtains an item name candidate based on the result, and sends the result to the input / output terminal 103. The item name candidates are displayed on the input / output terminal 103.

また、入出力端末103の代わりに、インターネットに接続可能なパソコンまたはPDAなどの情報処理端末104を用いることもできる。検索端末を店舗におかずに、オンラインショッピングなどインターネットを経由して検索を行う場合にこのような形態が用いられる。同様にパソコンまたはPDAなどの情報処理端末104からアイテムに関するキーワードを入力し、アイテム検索装置を含むサーバ101へインターネットを介して送信し、アイテム候補をサーバ101からインターネットを介して受信する。なお、入出力端末103やパソコンまたはPDAなどの情報処理端末104はネットワーク上に複数個設けてもよい。   Instead of the input / output terminal 103, an information processing terminal 104 such as a personal computer or a PDA that can be connected to the Internet can be used. Such a form is used when searching via the Internet, such as online shopping, without placing the search terminal in a store. Similarly, a keyword relating to an item is input from an information processing terminal 104 such as a personal computer or a PDA, transmitted to the server 101 including the item search device via the Internet, and item candidates are received from the server 101 via the Internet. Note that a plurality of information processing terminals 104 such as the input / output terminals 103 and personal computers or PDAs may be provided on the network.

また、別のシステム構成として、サーバ101の機能の一部あるいは全部を入出力端末103に備えてもよく、また、アイテム検索装置の一部をパソコンまたはPDAなどの情報処理端末104の内部に備えるようにしてもよい。   As another system configuration, a part or all of the functions of the server 101 may be provided in the input / output terminal 103, and a part of the item search device is provided in the information processing terminal 104 such as a personal computer or a PDA. You may do it.

図2は、この発明の実施の形態1にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。実施の形態1のアイテム検索装置は、URL検索部201と、テキスト抽出部202と、アイテムリスト203と、スコア計数部204と、出力部205とを備えている。   FIG. 2 is a functional block diagram functionally showing the configuration of the item search device according to the first embodiment of the present invention. The item search device according to the first embodiment includes a URL search unit 201, a text extraction unit 202, an item list 203, a score counting unit 204, and an output unit 205.

URL検索部201は、受信したキーワードをもとにインターネット上のウェブページから得た膨大な情報の中から検索を行い、このキーワードを含むウェブページのURLを複数取得し、それをURLリストとしてテキスト抽出部202に出力するものである。このURL検索部201は既存のインターネット検索エンジン(Google(登録商標)やYahoo!(登録商標)など)の技術を用いて実現することができる。求めるURLの数はあらかじめ設定しておいてもよく、また、ユーザが別途指定できるようにしてもよい。   The URL search unit 201 performs a search from a vast amount of information obtained from a web page on the Internet based on the received keyword, acquires a plurality of URLs of the web page including the keyword, and stores the URL as a URL list. This is output to the extraction unit 202. The URL search unit 201 can be realized by using the technology of an existing Internet search engine (Google (registered trademark), Yahoo! (registered trademark), etc.). The number of URLs to be obtained may be set in advance, or may be specified separately by the user.

なお、検索効率を高めるために、受信したキーワードに加えて、検索目的に応じた固定のキーワードを含めて検索してもよい。例えば、曲名の検索の場合には「曲」とか、書籍の検索の場合には「本」などである。   In addition, in order to improve search efficiency, you may search including the fixed keyword according to the search objective in addition to the received keyword. For example, “Song” is used for searching for a song title, and “Book” is used for searching for a book.

テキスト抽出部202は、URLリストに従って、順次そのURLアドレスにアクセスを行い、そのページのテキスト情報を獲得(抽出)する。ここで、テキスト情報とは、ウェブページがHTML形式であれば、その中からタグ情報を除いたものを用いることができる。なお、テキスト情報すべてを取得せずに、キーワード周辺のテキスト情報のみを抽出するようにしてもよい。周辺としては、キーワード前後の所定の文字数や単語数を用いることができる。   The text extraction unit 202 sequentially accesses the URL addresses according to the URL list, and acquires (extracts) the text information of the page. Here, as the text information, if the web page is in the HTML format, the information obtained by removing the tag information from the web page can be used. Note that only the text information around the keyword may be extracted without acquiring all the text information. As the periphery, a predetermined number of characters and words before and after the keyword can be used.

また、周辺のテキストだけでなくタイトルの文字列もテキスト情報に加えてもよい。これはウェブページのタイトルも重要な意味を持っているためである。また、タグ情報のうちタイトル等、内容の構造や属性を示す情報をテキスト情報に残してもよい。このテキスト情報に含まれる構造や属性の情報は、スコアを求める際の重み付けに利用することができる。こうしてテキスト抽出部202は、取得したテキスト情報をスコア計数部204に出力する。   Further, not only the surrounding text but also the title character string may be added to the text information. This is because the title of the web page also has an important meaning. Moreover, you may leave the information which shows the structure and attribute of contents, such as a title, among text information in tag information. The structure and attribute information included in the text information can be used for weighting when obtaining a score. In this way, the text extraction unit 202 outputs the acquired text information to the score counting unit 204.

なお、その都度URLアドレスにアクセスせずに、あらかじめそのURLの内容をキャッシュに保存しておくこともできる。この場合、インターネット経由でテキスト情報を抽出する代わりにキャッシュの中からテキスト情報を取得すればよい。   Note that the contents of the URL can be stored in the cache in advance without accessing the URL address each time. In this case, text information may be acquired from the cache instead of extracting text information via the Internet.

アイテムリスト203は、候補となりえるアイテム名をリスト状に記憶しておく。これは単純に大量のアイテム名を並べて記憶するだけでもよい。例えば、CDのアルバム名を検索する場合には、候補となりえるすべてのアルバム名をリスト状に記憶しておく。このとき、アルバム名だけでなくアルバムを特定する一意のID番号を付与してもよい。このID番号は結果出力時に、アルバム名のほかにレーベル名、価格等の付加情報を表示するのに利用できる。   The item list 203 stores item names that can be candidates in a list form. In this case, a large number of item names may be simply stored side by side. For example, when searching for album names of CDs, all album names that can be candidates are stored in a list. At this time, not only the album name but also a unique ID number for identifying the album may be assigned. This ID number can be used to display additional information such as the label name and price in addition to the album name when outputting the result.

ここでアイテムとは、CDやDVDなどの音楽作品や映像作品、書籍、ゲーム等のコンテンツや各種の商品などの他、検索の対象となるものを広く含む。したがって、アイテム名はそのアイテムの名称を広く含む。すなわち、アイテム名としては、検索の対象となるアイテムがCD、DVD、書籍、ゲーム等のコンテンツの場合には、そのコンテンツのタイトルをアイテム名として指定することができ、また、例えば、アイテムが電気製品の場合には、その商品名や型番をアイテム名として記憶すればよい。   Here, the item widely includes items to be searched in addition to contents such as music works such as CDs and DVDs, video works, books, games, and various products. Therefore, the item name widely includes the name of the item. That is, as the item name, when the item to be searched is content such as CD, DVD, book, game, etc., the title of the content can be specified as the item name. In the case of a product, the product name or model number may be stored as an item name.

また、同じアイテムであっても何を検索候補にするのかによって、複数のアイテム名の記憶方法がある。例えば、CDというアイテムの検索であっても、アルバム名を出力候補とする場合にはアルバムのタイトルがアイテム名となり、曲名を出力候補とする場合にはCDに含まれる曲名がアイテム名となり、アーチスト名を出力候補とする場合にはアーチストがアイテム名を記憶する。   In addition, there is a method for storing a plurality of item names depending on what is a search candidate even for the same item. For example, even when searching for an item called CD, if the album name is an output candidate, the album title is the item name, and if the song name is an output candidate, the song name included in the CD is the item name. If the name is an output candidate, the artist stores the item name.

スコア計数部204は、テキスト情報とアイテムリスト203の照合を行い、アイテム名毎に、そのアイテム名がテキスト情報内に出現する数をカウントする。この数をそのアイテムに対するスコアとして出力する。   The score counting unit 204 collates the text information with the item list 203 and counts the number of occurrences of the item name in the text information for each item name. This number is output as a score for the item.

出力部205は、スコアの高いものから順に指定数のアイテム名を出力する。また、アイテム名だけでなく、そのアイテムに関わる情報(例えば、CDのアルバム名の検索の場合には、アルバム名のほかに、アーチスト名、価格、ジャンル、発売日、ジャケットの画像など)をあわせて出力するようにしてもよい。   The output unit 205 outputs a specified number of item names in descending order of score. In addition to the item name, information related to the item (for example, when searching for the album name of a CD, in addition to the album name, artist name, price, genre, release date, jacket image, etc.) May be output.

上記URL検索部201、テキスト抽出部202、スコア計数部204、出力部205は、図示を省略するROMやRAM、ハードディスク、着脱可能な記憶媒体に記憶されたプログラムをCPUが実行することによってその機能を実現する。   The URL search unit 201, text extraction unit 202, score counting unit 204, and output unit 205 function as the CPU executes a program stored in a ROM, RAM, hard disk, or removable storage medium (not shown). To realize.

次に、図3はこの発明の実施の形態1にかかるアイテム検索装置の処理の手順を示すフローチャートである。図3のフローチャートにおいて、まず、キーワードを入力する(ステップS301)。ここで、端末とサーバというシステム構成の場合には、サーバは端末からキーワードを受信する。なお、キーワードは複数個をAND条件、OR条件またはNOT条件として指定することが可能である。   Next, FIG. 3 is a flowchart showing a processing procedure of the item search apparatus according to the first embodiment of the present invention. In the flowchart of FIG. 3, first, a keyword is input (step S301). Here, in the case of a system configuration of a terminal and a server, the server receives a keyword from the terminal. A plurality of keywords can be designated as AND conditions, OR conditions, or NOT conditions.

その後、入力されたキーワードをもとにインターネット上にある膨大なウェブページの情報から検索を行い、そのキーワードを含むウェブページのURLを複数個取得する(ステップS302)。   Thereafter, a search is performed from information on a large number of web pages on the Internet based on the input keyword, and a plurality of URLs of web pages including the keyword are acquired (step S302).

続いて、ステップS302で得たURLにアクセスしてそのウェブページのテキスト情報を取得する(ステップS303)。ここではテキスト全体を取得してもよいし、その中でキーワードが現れる付近のテキストだけを抽出してもよい。なお、URL検索部201にウェブページのテキスト情報を記憶するキャッシュ機能を設ける場合には、インターネットにアクセスすることなく、そのキャッシュデータの記憶手段から読み出すようにすればよい。   Subsequently, the URL obtained in step S302 is accessed to obtain text information of the web page (step S303). Here, the entire text may be acquired, or only the text in the vicinity where the keyword appears may be extracted. In the case where the URL search unit 201 is provided with a cache function for storing the text information of the web page, the cache data may be read from the storage unit without accessing the Internet.

その後、ステップS302で得たURLリストのすべてのURLのテキスト情報を取得したか否かを判定し(ステップS304)、最後まで取得していないと判定した場合(ステップS304:No)は、ステップS303に戻る。一方、URLリストの最後まで取得したと判定した場合(ステップS304:Yes)は、ステップS305に移行する。   Thereafter, it is determined whether or not the text information of all URLs in the URL list obtained in step S302 has been acquired (step S304). If it is determined that the text information has not been acquired to the end (step S304: No), step S303 is performed. Return to. On the other hand, when it is determined that the URL list has been acquired to the end (step S304: Yes), the process proceeds to step S305.

続いて、アイテムリスト203からアイテム名を一つずつ読み出し、このアイテム名がステップS303で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をそのアイテムに対するスコアとする(ステップS305)。   Subsequently, the item names are read one by one from the item list 203, the number of appearances of how many of the item names are included in the text information acquired in step S303 is counted, and the number is used as a score for the item ( Step S305).

その後、アイテムリスト203からすべてのアイテム名を読み出したか否かを判定し(ステップS306)、最後まで取得していないと判定した場合(ステップS306:No)は、ステップS305に戻る。一方、アイテムリストからすべてのアイテム名を読み出したと判定した場合(ステップS306:Yes)には、ステップS307へ移行する。   Thereafter, it is determined whether or not all item names have been read from the item list 203 (step S306). If it is determined that all items have not been acquired (step S306: No), the process returns to step S305. On the other hand, if it is determined that all item names have been read from the item list (step S306: Yes), the process proceeds to step S307.

なお、アイテム名を一つずつカウントせずに、ハッシュテーブルを用いるなど文字列検索の技術を用いてステップS305、ステップS306の処理を並列的に行い、処理を高速化することも可能である。   Note that it is possible to speed up the processing by performing the processing of step S305 and step S306 in parallel using a character string search technique such as using a hash table without counting item names one by one.

続いて、スコアの高いものから順にアイテム名を出力し(ステップS307)、一連の処理を終了する。ここで図1に示すようなシステム構成の場合には、入出力端末103やパソコンまたはPDAなどの情報処理端末104にそれらのアイテム名を送信する。   Subsequently, the item names are output in order from the highest score (step S307), and the series of processing ends. In the case of the system configuration as shown in FIG. 1, the item names are transmitted to the input / output terminal 103, the information processing terminal 104 such as a personal computer or a PDA.

なお、アイテム名を出力するだけでなく、そのアイテムに関する付加情報を出力する場合には、アイテムリスト203のアイテムそれぞれに対する付加情報を記憶する手段から該当する付加情報を読み出して、アイテム名とともに出力すればよい。   When not only outputting the item name but also outputting additional information related to the item, the corresponding additional information is read from the means for storing additional information for each item in the item list 203 and output together with the item name. That's fine.

次に、この発明の実施の形態1にかかるアイテム検索装置の入出力画面の例を説明する。入出力画面は、本発明のシステム専用であってもよいし、既存のウェブページ閲覧用のブラウザで行ってもよい。なお、ここではCDのアルバム検索を例にとって説明する。図4は入力画面の例である。ここで、入力ボックス401はキーワードを入力する部分であり、ここに検索したいアイテムに関する様々なキーワードを入力する。複数のキーワードを入力するときは空白やタブなどで区切って入力する。ボタン402は検索を指示するボタンであり、キーワードを入力した後にこの検索ボタンを押すことによって、キーワードがサーバに送られ検索処理が開始される。検索処理後は図5の出力画面に移る。   Next, an example of an input / output screen of the item search device according to the first embodiment of the present invention will be described. The input / output screen may be dedicated to the system of the present invention, or may be performed by an existing browser for browsing web pages. Here, a CD album search will be described as an example. FIG. 4 is an example of an input screen. Here, an input box 401 is a part for inputting a keyword, and various keywords relating to an item to be searched are input here. When entering multiple keywords, separate them with spaces or tabs. A button 402 is a button for instructing a search. When the search button is pressed after inputting a keyword, the keyword is sent to the server and the search process is started. After the search process, the screen moves to the output screen of FIG.

図5は出力画面の例である。ここで出力501には、アイテムの候補がスコアの高い順に表示される。図5のようにアイテム(ここではアルバム名)の表示だけでなく、アイテムに関連する付加情報、例えば、アーチスト名、ジャンル等を同時に表示してもよい。また、アイテムを選択することで、そのアイテムに関する付加情報を表示するようにしてもよい。ボタン502を選択すると、さらに次の順位の候補が表示される。   FIG. 5 is an example of an output screen. Here, in the output 501, item candidates are displayed in descending order of score. As shown in FIG. 5, not only items (here, album names) but also additional information related to the items, such as artist names, genres, etc., may be displayed simultaneously. Moreover, you may make it display the additional information regarding the item by selecting an item. When the button 502 is selected, candidates for the next rank are displayed.

以上説明した実施の形態1によれば、あらかじめ、候補となるアイテム名のリストを用意するだけで、インターネット上に散在する膨大でかつ自動的に日々更新されるウェブページの情報をデータベースとして利用するので、これにより任意のキーワードからアイテムの候補を出力することができる。   According to the first embodiment described above, a list of candidate item names is prepared in advance, and information on web pages that are scattered on the Internet and automatically updated daily is used as a database. Thus, item candidates can be output from any keyword.

また、従来のようにサイト内でキーワードのマッチングを行うのではなく、キーワードで検索した情報の中からアイテム名とのマッチングを行う点で異なり、多岐のキーワードから高精度にアイテムを検索できる。   In addition, it is different from the conventional method that keywords are not matched in the site, but is matched with the item name from the information searched by the keyword, and items can be searched from various keywords with high accuracy.

また、データベースにサイト内情報を用いるのでなく、インターネットのウェブ情報を用いるため、常に新しい情報から検索が可能になる。   In addition, since Internet information is used in the database instead of in-site information, it is always possible to search from new information.

なお、図2のテキスト抽出部202でテキスト情報を取得した後で、テキスト情報の形態素解析を行い、あらかじめアイテムに関する品詞(例えば固有名詞や未知語)の部分だけを抜き出してもよい。これにより、スコア計数部204での処理を高速化することができる。   In addition, after acquiring text information by the text extraction part 202 of FIG. 2, the morphological analysis of text information may be performed and only the part of the part of speech (for example, a proper noun or an unknown word) regarding an item may be extracted beforehand. Thereby, the processing in the score counting unit 204 can be speeded up.

また、アイテムリストを分野別(例えば、CDのアルバム検索ならジャンル別、映画の検索なら洋画・邦画など)に用意し、キーワードの指定とともに分野を指定できるようにして、指定のあった分野のアイテムリストに対してだけスコアを求めるようにすることもできる。これにより検索処理の高速化と、より所望の検索結果が得られるようになる。   In addition, item lists are prepared for each field (for example, genre for CD album search, Western / Japanese film for movie search, etc.), and the field can be specified along with keyword specification. You can also get the score only for the list. As a result, the search process can be speeded up and a more desired search result can be obtained.

また、検索したいアイテムの属性(例えば、CDのアルバム検索ならジャンルや男性アーチストか女性アーチストなど)を複数指定できる場合は、アイテムリスト全体の中から指定した属性にあてはまるアイテムだけを抜き出して、このアイテムリストの部分集合で検索を行うようにしてもよい。これにより検索処理の高速化と、より所望の検索結果が得られるようになる。   Also, if you can specify multiple attributes of the item you want to search (for example, genre, male artist or female artist for CD album search), extract only the items that match the specified attribute from the entire item list. You may make it search with the subset of a list. As a result, the search process can be speeded up and a more desired search result can be obtained.

(実施の形態2)
さて、以下で説明する実施の形態2では、アイテムの検索を二段階に分割することで、検索処理の高速化を図るものである。例えば、検索するアイテムがCDの曲名である場合、この数はアーチスト名の2桁以上多くなることもある。このような場合には、アーチスト名で一次検索を行うことで処理の高速化を図る。
(Embodiment 2)
In the second embodiment described below, the search for an item is divided into two stages to speed up the search process. For example, when the item to be searched is a CD song name, this number may be two or more digits longer than the artist name. In such a case, the search is speeded up by performing a primary search using the artist name.

図6は、この発明の実施の形態2にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。図6において、実施の形態2のアイテム検索装置は、URL検索部601、テキスト抽出部602、一次スコア計数部603、一次検索リスト604、アイテムリスト生成部605、属性アイテムリスト606、二次スコア計数部607、出力部608を備えている。   FIG. 6 is a functional block diagram functionally showing the configuration of the item search device according to the second embodiment of the present invention. 6, the item search apparatus according to Embodiment 2 includes a URL search unit 601, a text extraction unit 602, a primary score counting unit 603, a primary search list 604, an item list generation unit 605, an attribute item list 606, and a secondary score count. A unit 607 and an output unit 608.

URL検索部601およびテキスト抽出部602は、それぞれ実施の形態1のURL検索部201およびテキスト抽出部202と同様であるため、ここではそれらの説明を省略する。   The URL search unit 601 and the text extraction unit 602 are the same as the URL search unit 201 and the text extraction unit 202 of the first embodiment, respectively, and thus description thereof is omitted here.

一次検索リスト604は、一次の検索候補となる文字列(一次検索候補)をリスト状に記憶しておく。この一次検索候補は、例えば、曲名検索の場合にはアーチスト名、また、書籍の検索の場合には著者名とすることができる。   The primary search list 604 stores character strings (primary search candidates) that are primary search candidates in a list form. This primary search candidate can be, for example, an artist name in the case of song name search, or an author name in the case of book search.

一次スコア計数部603は、テキスト情報と一次検索リスト604の照合を行い、一次検索候補(アーチスト名や著者名)毎に、それらがテキスト情報内に出現する数をカウントする。この数をその一次検索候補に対するスコアとして出力する。   The primary score counting unit 603 collates the text information with the primary search list 604, and counts the number of appearances of the text information in each primary search candidate (artist name or author name). This number is output as a score for the primary search candidate.

属性アイテムリスト606は、アイテムを一次検索候補毎に分類したものである。例えば、曲名検索の場合には、アーチスト毎にそのアーチストの曲名をリスト状に記憶したものである。また、書籍の検索の場合には、著者毎にその人の著作(書籍名)をリスト状に記憶したものである。   The attribute item list 606 is a classification of items for each primary search candidate. For example, in the case of a song name search, the artist's song name is stored in a list for each artist. In the case of searching for books, the author's works (book names) are stored in a list for each author.

アイテムリスト生成部605は、一次スコア計数部603の出力から、スコアの高い一次検索候補を一定の数だけ選択し、属性アイテムリスト606から該当する一次検索候補のアイテムを取り出し、それをまとめて一つのアイテムリストとして出力する。   The item list generation unit 605 selects a certain number of primary search candidates with high scores from the output of the primary score counting unit 603, takes out corresponding primary search candidate items from the attribute item list 606, collects them as one Output as a single item list.

二次スコア計数部607は、テキスト情報とアイテムリストの照合を行い、アイテム毎に、そのアイテムがテキスト情報内に出現する数をカウントする。この数をそのアイテムに対するスコアとして出力する。   The secondary score counting unit 607 collates the text information with the item list, and counts the number of occurrences of the item in the text information for each item. This number is output as a score for the item.

出力部608は、スコアの高いものから順に指定数のアイテムを出力する。また、アイテムだけでなく、そのアイテムに関わる情報(例えば、CDのアルバム名の検索の場合には、アルバム名のほかに、アーチスト名、価格、ジャンル、発売日、ジャケットの画像など)をあわせて出力するようにしてもよい。   The output unit 608 outputs a specified number of items in descending order of score. In addition to the item, information related to the item (for example, when searching for the album name of a CD, in addition to the album name, artist name, price, genre, release date, jacket image, etc.) You may make it output.

次に、図7はこの発明の実施の形態2にかかるアイテム検索装置の処理の手順を示すフローチャートである。図7のフローチャートにおいて、ステップS701のキーワード入力からステップS704のURLリストの最後の判定までは、実施の形態1のステップS301からステップS304までと同様であるので、その説明は省略する。   Next, FIG. 7 is a flowchart which shows the procedure of the process of the item search device concerning Embodiment 2 of this invention. In the flowchart of FIG. 7, the process from the keyword input in step S701 to the last determination in the URL list in step S704 is the same as that in steps S301 to S304 in the first embodiment, and thus the description thereof is omitted.

ステップS703を繰り返し行ってテキスト情報を取得した後、一次検索リスト604から一次検索候補を一つずつ読み出し、この一次検索候補がステップS703で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をその一次検索候補に対するスコアとする(ステップS705)。   After the text information is acquired by repeating step S703, primary search candidates are read one by one from the primary search list 604, and how many primary search candidates are included in the text information acquired in step S703, and the number of appearances. The number is counted and the number is set as a score for the primary search candidate (step S705).

その後、一次検索リスト604からすべての一次検索候補を読み出したか否かを判定し(ステップS706)、最後まで取得していないと判定した場合(ステップS706:No)は、ステップS705に戻る。一方、一次検索リスト604からすべての一次検索候補を読み出したと判定した場合(ステップS706:Yes)には、ステップS707へ移行する。   Thereafter, it is determined whether or not all primary search candidates have been read from the primary search list 604 (step S706). If it is determined that all the candidates have not been acquired (step S706: No), the process returns to step S705. On the other hand, when it is determined that all primary search candidates have been read from the primary search list 604 (step S706: Yes), the process proceeds to step S707.

続いて、スコア上位の一次検索候補から、アイテムリストを生成する。これには、属性アイテムリスト606を参照し、それぞれの一次検索候補から複数のアイテム名を取得し、これらのアイテム名をまとめて一つのアイテムリストとする(ステップS707)。   Subsequently, an item list is generated from the primary search candidates with higher scores. For this, the attribute item list 606 is referred to, a plurality of item names are acquired from the respective primary search candidates, and these item names are combined into one item list (step S707).

続いて、ステップS707で生成したアイテムリストからアイテム名を一つずつ読み出し、このアイテム名がステップS703で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をそのアイテムに対するスコアとする(ステップS708)。   Subsequently, the item names are read one by one from the item list generated in step S707, the number of appearances of the item names included in the text information acquired in step S703 is counted, and the number of the item names for the item is counted. A score is set (step S708).

その後、アイテムリストからすべてのアイテム名を読み出したか否かを判定し(ステップS709)、最後まで取得していないと判定した場合(ステップS709:No)は、ステップS708に戻る。一方、アイテムリストからすべてのアイテム名を読み出したと判定した場合(ステップS709:Yes)には、ステップS710へ移行する。   Thereafter, it is determined whether all item names have been read from the item list (step S709). If it is determined that all items have not been acquired (step S709: No), the process returns to step S708. On the other hand, if it is determined that all item names have been read from the item list (step S709: Yes), the process proceeds to step S710.

続いて、スコアの高いものから順にアイテム名を出力し(ステップS710)、一連の処理を終了する。ここで図1に示すようなシステム構成の場合には、入出力端末103やパソコンまたはPDAなどの情報処理端末104にそれらのアイテム名を送信する。   Subsequently, item names are output in descending order of score (step S710), and the series of processes is terminated. In the case of the system configuration as shown in FIG. 1, the item names are transmitted to the input / output terminal 103, the information processing terminal 104 such as a personal computer or a PDA.

なお、アイテム名を出力するだけでなく、そのアイテムに関する付加情報を出力する場合には、属性アイテムリスト606のアイテムそれぞれに対する付加情報を記憶する手段から該当する付加情報を読み出して、アイテム名とともに出力すればよい。   In addition to outputting the item name, when outputting additional information related to the item, the corresponding additional information is read from the means for storing additional information for each item in the attribute item list 606 and output together with the item name. do it.

実施の形態2において、曲名の検索を行う場合には、一次検索候補としてアーチスト名を、アイテム名として曲目を指定すればよい。また、CD等のアルバム名の検索を行う場合には、一次検索候補としてアーチスト名を、アイテム名としてアルバム名を指定すればよい。また、書籍の検索を行う場合には、一次検索候補として著者名を、アイテム名として書籍名を指定すればよい。また、商品の検索を行う場合には、一次検索候補としてメーカ名を、アイテム名として商品名を指定すればよい。   In the second embodiment, when searching for a song title, an artist name may be designated as a primary search candidate and a song title may be designated as an item name. When searching for an album name such as a CD, the artist name may be designated as the primary search candidate and the album name may be designated as the item name. When searching for books, the author name may be specified as the primary search candidate, and the book name may be specified as the item name. When searching for a product, a manufacturer name may be specified as a primary search candidate, and a product name may be specified as an item name.

この発明の実施の形態2にかかるアイテム検索装置の入出力例は、図4、図5に示した実施の形態1のそれと同様であるので、その説明は省略する。   Since the input / output example of the item search device according to the second embodiment of the present invention is the same as that of the first embodiment shown in FIGS. 4 and 5, the description thereof is omitted.

以上説明した実施の形態2によれば、検索を二段階に分割して行うことによって、検索対象のアイテム数が多い場合でも高速に検索処理を行うことができる。   According to the second embodiment described above, by performing the search in two stages, the search process can be performed at high speed even when the number of items to be searched is large.

なお、図2のスコア計数部204または図6の一次スコア計数部603、二次スコア計数部607において、文字列の完全一致だけでなく、表記のゆらぎを考慮したマッチングを行うようにしてもよい。   Note that the score counting unit 204 in FIG. 2 or the primary score counting unit 603 and the secondary score counting unit 607 in FIG. 6 may perform matching in consideration of not only complete matching of character strings but also notation fluctuations. .

また、図2のスコア計数部204または図6の一次スコア計数部603、二次スコア計数部607において、一致したアイテム名または一次検索候補が、ウェブページ中のタイトルであった場合のスコアの重みを大きくしてもよい。これにより、より精度の高い検索が可能になる。   Further, in the score counting unit 204 in FIG. 2 or the primary score counting unit 603 and the secondary score counting unit 607 in FIG. 6, the weight of the score when the matched item name or primary search candidate is a title in the web page May be increased. Thereby, a search with higher accuracy becomes possible.

また、本実施の形態で説明したアイテム検索方法は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The item search method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. Further, this program may be a transmission medium that can be distributed via a network such as the Internet.

以上のように、本発明にかかるアイテム検索装置は、所望のアイテムの名称等がわからない状況において、そのアイテムに関する様々なキーワードからそのアイテム名を推定する場合に適している。   As described above, the item search device according to the present invention is suitable for estimating the item name from various keywords related to the item in a situation where the name of the desired item is unknown.

また、本発明にかかるアイテム検索装置は、レンタルショップにおいて、レンタルされるコンテンツの検索に利用することができる。   Moreover, the item search apparatus according to the present invention can be used for searching for content to be rented in a rental shop.

また、本発明にかかるアイテム検索装置は、レコード店や音楽ダウンロードサイト等において、販売されるコンテンツの検索に利用することができる。   In addition, the item search device according to the present invention can be used for searching for content to be sold at a record store, a music download site, or the like.

また、本発明にかかるアイテム検索装置は、書店において、販売される書籍の検索に利用することができる。   The item search device according to the present invention can be used for searching for books to be sold in a bookstore.

また、本発明にかかるアイテム検索装置は、図書館の蔵書検索に利用することができる。   Moreover, the item search apparatus according to the present invention can be used for library collection search.

また、本発明にかかるアイテム検索装置は、カラオケ店での楽曲の検索に利用することができる。   Moreover, the item search apparatus concerning this invention can be utilized for the search of the music in a karaoke shop.

また、本発明にかかるアイテム検索装置は、商店での商品の検索に利用することができる。   Moreover, the item search device according to the present invention can be used for searching for merchandise at a store.

この発明の実施の形態1にかかるシステムの全体を示す構成図である。BRIEF DESCRIPTION OF THE DRAWINGS It is a block diagram which shows the whole system concerning Embodiment 1 of this invention. この発明の実施の形態1にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。It is a functional block diagram which shows functionally the structure of the item search device concerning Embodiment 1 of this invention. この発明の実施の形態1にかかるアイテム検索装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the item search device concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる入力画面の例を示す説明図である。It is explanatory drawing which shows the example of the input screen concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる出力画面の例を示す説明図である。It is explanatory drawing which shows the example of the output screen concerning Embodiment 1 of this invention. この発明の実施の形態2にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。It is a functional block diagram which shows functionally the structure of the item search device concerning Embodiment 2 of this invention. この発明の実施の形態2にかかるアイテム検索装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the item search device concerning Embodiment 2 of this invention.

符号の説明Explanation of symbols

101 本発明のアイテム検索装置を含んだサーバ
102 ウェブページを含んだインターネット
103 入出力端末
104 情報処置端末
201 URL検索部
202 テキスト抽出部
203 アイテムリスト
204 スコア計数部
205 出力部
401 キーワードを入力する入力ボックス
402 検索を指示するボタン
501 出力結果表示
502 次選択ボタン
601 URL検索部
602 テキスト抽出部
603 一次スコア計数部
604 一次検索リスト
605 アイテムリスト生成部
606 属性アイテムリスト
607 二次スコア計数部
608 出力部


DESCRIPTION OF SYMBOLS 101 Server including the item search apparatus of the present invention 102 Internet including web page 103 Input / output terminal 104 Information processing terminal 201 URL search unit 202 Text extraction unit 203 Item list 204 Score counting unit 205 Output unit 401 Input for inputting a keyword Box 402 Button for instructing search 501 Output result display 502 Next selection button 601 URL search unit 602 Text extraction unit 603 Primary score counting unit 604 Primary search list 605 Item list generating unit 606 Attribute item list 607 Secondary score counting unit 608 Output unit


Claims (5)

候補として出力するアイテム名を記憶するアイテムリスト記憶手段と、
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト記憶手段に記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数手段と、
前記計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、
を備えたことを特徴とするアイテム検索装置。
Item list storage means for storing item names to be output as candidates;
An input means for receiving an input of a keyword related to an item desired to be searched;
Search means for acquiring the contents of a web page related to the keyword input by the input means from the Internet;
In the content of the web page acquired by the search means, a counting means for counting the number of occurrences of item names stored in the item list storage means for each item name;
Output means for outputting an item name based on the number of appearances counted by the counting means;
An item search device comprising:
一次検索用の一次検索候補を記憶する一次検索リストを記憶する一時検索リスト記憶手段と、
アイテムを前記一次検索候補毎に分類した属性アイテムリストを記憶する属性アイテムリスト記憶手段と、
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容において、前記一次検索リスト記憶手段に記憶された一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数手段と、
前記一次スコア計数手段によって計数された数と前記属性アイテムリスト記憶手段に記憶された属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成手段と、
前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト生成手段によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数手段と、
前記二次スコア計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、
を備えたことを特徴とするアイテム検索装置。
Temporary search list storage means for storing a primary search list for storing primary search candidates for primary search;
Attribute item list storage means for storing an attribute item list in which items are classified for each primary search candidate;
An input means for receiving an input of a keyword related to an item desired to be searched;
Search means for acquiring the contents of a web page related to the keyword input by the input means from the Internet;
In the content of the web page acquired by the search means, a primary score counting means for counting the number of primary search candidates stored in the primary search list storage means for each primary search candidate;
Item list generation for generating an item list that lists item names that may be output as candidates based on the number counted by the primary score counting unit and the attribute item list stored in the attribute item list storage unit Means,
In the content of the web page acquired by the search means, based on the item list generated by the item list generation means, a secondary score counting means for counting the number of appearances of the item names for each item name;
Output means for outputting an item name based on the number of appearances counted by the secondary score counting means;
An item search device comprising:
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容において、候補として出力するアイテム名を記憶するアイテムリストに記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数工程と、
前記計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、
を含んだことを特徴とするアイテム検索方法。
An input process for receiving an input of a keyword related to an item desired to be searched;
A search step of acquiring the content of a web page related to the keyword input by the input step from the Internet;
In the content of the web page acquired by the search step, a counting step of counting the number of item names stored in the item list storing the item names to be output as candidates for each item name;
An output step of outputting an item name based on the number of occurrences counted by the counting step;
The item search method characterized by including.
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容において、一次検索用の一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数工程と、
前記一次スコア計数工程によって計数された数と、アイテムを前記一次検索候補毎に分類した属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成工程と、
前記検索工程によって取得されたウェブページの内容において、前記アイテムリスト生成工程によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数工程と、
前記二次スコア計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、
を含んだことを特徴とするアイテム検索方法。
An input process for receiving an input of a keyword related to an item desired to be searched;
A search step of acquiring the content of a web page related to the keyword input by the input step from the Internet;
In the content of the web page acquired by the search step, a primary score counting step for counting the number of primary search candidates for primary search that appear for each primary search candidate,
An item list that generates an item list that lists item names that may be output as candidates based on the number counted by the primary score counting step and an attribute item list that classifies items for each primary search candidate. Generation process;
In the content of the web page acquired by the search step, based on the item list generated by the item list generation step, a secondary score counting step of counting the number of appearance of the item name for each item name,
An output step of outputting an item name based on the number of occurrences counted by the secondary score counting step;
The item search method characterized by including.
請求項3または4に記載のアイテム検索方法のいずれか一つをコンピュータに実行させることを特徴とするアイテム検索プログラム。

An item search program that causes a computer to execute any one of the item search methods according to claim 3 or 4.

JP2004270215A 2004-09-16 2004-09-16 Item search device, method, and program Pending JP2006085474A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004270215A JP2006085474A (en) 2004-09-16 2004-09-16 Item search device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004270215A JP2006085474A (en) 2004-09-16 2004-09-16 Item search device, method, and program

Publications (1)

Publication Number Publication Date
JP2006085474A true JP2006085474A (en) 2006-03-30

Family

ID=36163930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004270215A Pending JP2006085474A (en) 2004-09-16 2004-09-16 Item search device, method, and program

Country Status (1)

Country Link
JP (1) JP2006085474A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6484368A (en) * 1987-09-26 1989-03-29 Toshiba Corp Document checking device
JP2003022276A (en) * 2001-07-06 2003-01-24 Toshiba Corp Device and method for retrieving document

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6484368A (en) * 1987-09-26 1989-03-29 Toshiba Corp Document checking device
JP2003022276A (en) * 2001-07-06 2003-01-24 Toshiba Corp Device and method for retrieving document

Similar Documents

Publication Publication Date Title
US9846744B2 (en) Media discovery and playlist generation
US9600533B2 (en) Matching and recommending relevant videos and media to individual search engine results
JP5256293B2 (en) System and method for including interactive elements on a search results page
US9323827B2 (en) Identifying key terms related to similar passages
US9177044B2 (en) Discovering and scoring relationships extracted from human generated lists
CN101223525B (en) Relationship networks
US20090254540A1 (en) Method and apparatus for automated tag generation for digital content
JP5083669B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
CN110795627B (en) Information recommendation method and device and electronic equipment
US20080154886A1 (en) System and method for summarizing search results
JP5066963B2 (en) Database construction device
WO2002101588A1 (en) Content management system
JP7451747B2 (en) Methods, devices, equipment and computer readable storage media for searching content
JP2011529600A (en) Method and apparatus for relating datasets by using semantic vector and keyword analysis
JP2008511075A5 (en)
JP2009500764A (en) Information retrieval method and apparatus reflecting information value
CN106294784B (en) resource searching method and device
JP2009223372A (en) Recommendation device, recommendation system, control method for recommendation device and control method for recommendation system
JP2006085474A (en) Item search device, method, and program
JP3943005B2 (en) Information retrieval program
Knees et al. Contextual music meta-data: comparison and sources
JP5360025B2 (en) Content reproduction apparatus, content reproduction method, and content reproduction program
JP2014191550A (en) Content search server, content search device, and content search method
Chang et al. Multimedia search capabilities of Chinese language search engines
KR101466403B1 (en) Apparatus and method for keyword generation using playlist information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100427