[go: up one dir, main page]

JP2009064391A - キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体 - Google Patents

キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2009064391A
JP2009064391A JP2007233959A JP2007233959A JP2009064391A JP 2009064391 A JP2009064391 A JP 2009064391A JP 2007233959 A JP2007233959 A JP 2007233959A JP 2007233959 A JP2007233959 A JP 2007233959A JP 2009064391 A JP2009064391 A JP 2009064391A
Authority
JP
Japan
Prior art keywords
keyword
keywords
unit
presentation
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007233959A
Other languages
English (en)
Other versions
JP2009064391A5 (ja
Inventor
Yasushi Ishizuka
康司 石塚
Keiko Hirukawa
慶子 蛭川
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007233959A priority Critical patent/JP2009064391A/ja
Publication of JP2009064391A publication Critical patent/JP2009064391A/ja
Publication of JP2009064391A5 publication Critical patent/JP2009064391A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者の趣味、嗜好、目的に合致するキーワードを抽出する装置、方法、プログラムを提供する。
【解決手段】本発明に係るキーワード抽出装置の提示キーワード制御部3は、検索キーワードとの関連度、各キーワードに対する利用者の嗜好度、以前に提示されたキーワード等に基づいて、検索用キーワード記憶部5から提示キーワードを抽出する。抽出された提示キーワードは提示キーワード記憶部6に記憶され、キーワード表示作成部4、表示制御部8を介して、表示部9に表示される。
【選択図】図1

Description

本発明は、利用者に提示するキーワードを抽出する技術に関し、特に、マルチメディアコンテンツをはじめ、あらゆるコンテンツの検索を支援する検索支援装置に応用可能である。
現在、様々な場面でキーワードに関する技術が用いられている。
例えば、キーワードと関連するキーワードを関連語辞書を用いて抽出する技術が、特許文献1に開示されている。特許文献2においては、利用者から入力される検索キーワードに基づいて文書を検索する方式が開示されている。
また、多種多様な機器で利用可能になりつつある多量のコンテンツ(インターネット上に分散する多量なテキストコンテンツの他、画像コンテンツ、音楽コンテンツ、動画コンテンツなど)から目的のコンテンツを検索するために、キーワードを用いた検索が用いられている。
特許文献3には、利用者がキーワードを入力すると、入力キーワードに関連するコンテンツをコンテンツ提供サーバにて検索し、検索されたコンテンツのリストを提示し、提示リストの中から利用者がコンテンツを選択すると、選択コンテンツを供給する技術が開示されている。非特許文献1で開示されている技術では、起動されると初期のキーワードが画面左側に表示され、任意のキーワードを選択すると、選択されたキーワードに適合する番組の情報が画面右側に表示される。画面左側のキーワードは、選択されたキーワードに適合する番組の上位番組の情報で出現する単語のうち頻度の高い単語を表示する。
また、インターネット上のウェブサービスにおいて、ウェブサービスのアクセスを解析し、「最近よく検索されるキーワード」、「検索数が急上場したキーワード」など複数のキーワードを利用者に提示し選ばせる方法が実現されている。利用者は提示されたキーワードから、好みのキーワードを選択し検索を行なうことで、コンテンツ検索を行なうことができる。
特開平5−282367号公報 特開2005−326482号公報 特開2007−133688号公報 WISS2006「Goromi-TV 撮りためた千以上のビデオを気ままに閲覧する方法」
しかしながら、利用者が検索などの目的でキーワードを入力する場合、目的のコンテンツを得るに必要となる適切なキーワードを、利用者が自ら発想することは利用者にとって負担となる。
また、文字の入力自体が負担となるケースもあり、特に、リモコンや携帯電話など、文字入力に適したキーボードを持たない入力デバイスでの文字の入力は、さらに負担が増大する。さらに、ネット上に存在する多量なコンテンツからコンテンツを選び出す検索において、一回の検索で利用者が満足できるコンテンツを得ることができるとは限らない。キーワード入力方式の検索では、キーワードを入力し、入力し終えると検索指示を行ない、検索結果を得るといったステップが必要となるが、検索結果が得られても、その中に目的のコンテンツを探し得ないときは、再度別のキーワードを入力するなどといった繰り返しの作業が必要になり、ユーザの負担が増える。特に膨大なコンテンツでの検索においては、このような作業の繰り返しを円滑に行なえるようにするため、キーワードの入力の負担を削減することが望ましい。
利用者にキーワードを入力する負担を削減する方法として、複数のキーワードを利用者に提示し選ばせる上述のインターネット上のサービスや、非特許文献1に記載の装置がある。しかし、前者では、利用者がキーワードを選択するたけで検索が可能であるが、提示されているキーワードは、利用者個人の嗜好に合致したキーワードではなく、利用者が目的とするキーワードが提示されない問題がある。これは、ウェブサービスのアクセス解析ではマクロの傾向であり、個々人の嗜好とは関連がないことによるものである。また、後者では、初期のキーワード中に利用者の好みのキーワードがない場合、好みのコンテンツにたどりつきにくいことが考えられる。初期キーワード画面でなんらかのキーワードを選択すると、以降のキーワードは選択したキーワードに適合する番組の情報の頻度の高いキーワードから抽出されるため、利用者の好みのキーワードがない場合が多い。また、キーワードを選択を繰り返しても、個人の嗜好とは関連のない方法でキーワード抽出が行なわれるので、好みのキーワードが提示されない可能性が高いことが考えられる。
また、特許文献1で開示されているような、関連キーワードを抽出する際に関連語辞書を利用する方法でも、利用者が求める関連キーワードを抽出するに十分でない。例えば、「肉」というキーワードがあった場合、食材としての「肉」の関連キーワードを提示してほしい場合には、「牛肉」、「鶏肉」、等の肉の種類や部位などのキーワードが上げられるが、レシピとしての「肉」の関連キーワードを提示してほしい場合には、「ハンバーグ」、「ステーキ」などのレシピ名がキーワードとしてあげられる。このように、利用者の検索意図や、検索コンテンツによって利用者が求める関連キーワードは異なる場合がある。従って、関連キーワードを抽出するための関連語辞書は、利用者の検索意図、検索コンテンツ毎に用意する必要があるが、利用者の検索意図は利用者によって様々であり、辞書やテーブル等で管理された固定的な関連語情報では、多様な検索意図、もしくは検索コンテンツに対応することができない。また、特許文献2において開示されている方式も、文書検索を目的とし、ユーザの検索目的を表す表現を提示しようとするものであり、利用者の嗜好情報の概念はない。すなわち、趣味・嗜好に基づくキーワードの提示はできない課題がある。
また、他のコンテンツ検索方法として、ディレクトリ検索がある。ディレクトリ検索では、キーワードもしくはコンテンツをあらかじめ分類し、階層構造化したデータベースを用意しておき、まず上位層の複数のキーワード(分類名)を利用者に提示し、利用者が選択すると、選択キーワードの下位キーワードを提示する。目的のキーワードもしくはコンテンツにたどり着くまでこれを繰り返す。階層構造化の際には、キーワードのシソーラス情報等言語学上でのキーワード評価や、コンテンツの分類結果などから階層構造が決定されるが、利用者の検索意図は多様であり、各利用者の検索ごとに適切なキーワードを提示するには、固定化された階層データベースでは対応困難である。また、このような固定化された階層データベースにおいて適切なキーワードを提示するためには、検索対象コンテンツによってキーワードの種類、階層構造を調節する必要があるが、検索対象コンテンツが変わると再度調節を行なわなければならない。
以上に述べたように、提示するキーワードを予め設定したキーワード間の関連情報、辞書やテーブル等で管理された固定的な関連語情報、あるいは、コンテンツのメタ情報を検索して求める手法では、利用者の個々人の嗜好に合致したキーワードを提示することはできない。実際には、提示するキーワードは利用者の趣味・嗜好に近く選択しやすいものであることが望ましい。
一方、個人の嗜好情報を蓄積し、キーワードを抽出する方法が考えられるが、嗜好情報だけでは目的外のキーワードが提示される課題がある。例えば、「サッカー」と「将棋」に興味がある利用者が、現時点で「将棋」に関する検索を行ないたい場合には、目的に近いキーワードが提示されることが期待されるが、嗜好情報のみを用いる方法では「サッカー」に関連するキーワードも提示してしまう。このように、利用者の嗜好と目的が一致していない場合は、嗜好情報の蓄積だけでは適切なキーワードが抽出されない問題がある。
本発明は上述の問題を解決するためになされたものであり、利用者の趣味、嗜好、目的に合致するキーワードを抽出する装置、方法、プログラムを提供することを課題とする。
1つの局面における本願発明は、キーワード抽出装置であって、複数のキーワードを記憶するキーワード記憶手段と、複数のキーワード間の関連度を記憶する関連記憶手段と、複数のキーワード各々について、複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶手段と、選択候補のキーワードを出力する出力手段と、出力手段により出力されたキーワードの中からキーワードを指定する指定手段と、指定手段により指定されたキーワードとの関連度と嗜好度とに基づき、複数のキーワードの中から次回に出力手段が出力する提示キーワードを抽出する抽出手段とを備える。
好ましくは、外部からの指示を受付ける入力手段と、出力手段により出力されたキーワードを利用者に提示する提示手段をさらに備え、指定手段は、指示に応じて、提示手段により提示された提示キーワードの中からキーワードを指定する。
さらに好ましくは、キーワードに関連付けられたコンテンツを検索する検索手段をさらに備え、提示手段は、検索手段により検索されたコンテンツを提示する。
好ましくは、指定手段によるキーワードの指定に応じて、嗜好度を更新する更新手段をさらに備える。
さらに好ましくは、嗜好記憶手段は、複数種類の嗜好度を記憶し、
各複数種類の嗜好度に対して異なった方法で更新を行なう更新手段をさらに備える。
さらに好ましくは、嗜好記憶手段は、長期嗜好度と短期嗜好度とを記憶し、
更新手段は、長期嗜好度の更新割合よりも短期嗜好度の更新割合のほうが大きくなるように嗜好情報の更新を行なう。
さらに好ましくは、更新手段は、以前に抽出手段により抽出された提示キーワードが再び抽出されることを抑制するように、嗜好度を更新する。
さらに好ましくは、更新手段は、以前に抽出手段により抽出された提示キーワードの嗜好度を下げる。
好ましくは、提示手段により提示されたキーワードの提示回を当該キーワードと関連付けて記憶する手段をさらに備え、
抽出手段は、記憶された提示回に基づき、提示手段により、第1の抑制回数の間、提示されていないキーワードを優先して提示キーワードを抽出する。
さらに好ましくは、指示に応じて、以前に提示手段により提示された提示キーワードを提示手段に再提示させる再提示手段と、
再提示手段に再提示を行なわせる指示または前記抽出手段に提示キーワードを抽出させる指示のいずれがなされたかに応じて、第1の抑制回数を増減させる抑制解除手段とをさらに備える。
好ましくは、指定手段により指定されたキーワードの提示回を当該キーワードと関連付けて記憶する手段をさらに備え、
抽出手段は、記憶された提示回に基づき、指定手段により、第2の抑制回数の間、指定されていないキーワードを優先して提示キーワードを抽出する。
さらに好ましくは、指示に応じて、以前に提示手段により提示された提示キーワードを提示手段に再提示させる再提示手段と、
再提示手段に再提示を行なわせる指示または前記抽出手段に提示キーワードを抽出させる指示のいずれがなされたかに応じて、第2の抑制回数を増減させる抑制解除手段とをさらに備える。
好ましくは、指示に基づき、操作単位を示すセッションを判定するセッション判定手段をさらに備え、
更新手段は、セッション判定手段の判定結果に基づき、嗜好度を更新する。
好ましくは、指示に基づき、操作単位を示すセッションを判定するセッション判定手段をさらに備え、
抽出手段は、セッション判定手段の結果により、キーワードの提示を抑制する回数を変化させる。
好ましくは、抽出手段は、指示に応じて、複数のキーワードの中からランダムに提示キーワードを抽出する。
好ましくは、抽出手段は、指示に応じて、すべての複数のキーワードを所定の順序で順に抽出する。
他の局面に係る本願発明は、複数のキーワードを記憶するキーワード記憶部と、複数のキーワード間の関連度を記憶する関連記憶部と、複数のキーワード各々について、複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶部と、選択候補のキーワードを出力する出力部と、キーワード記憶部、関連記憶部、嗜好記憶部、出力部の動作を制御する制御部を備えるコンピュータを用いて、次回に出力部が出力する提示キーワードを抽出するためのキーワード抽出方法であって、出力部により出力されたキーワードの中からキーワードを指定するステップと、指定部により指定されたキーワードとの関連度と嗜好度とに基づき、複数のキーワードの中から提示キーワードを抽出するステップとを備える。
さらに他の局面に係る本願発明は、複数のキーワードを記憶するキーワード記憶部と、複数のキーワード間の関連度を記憶する関連記憶部と、複数のキーワード各々について、複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶部と、選択候補のキーワードを出力する出力部と、キーワード記憶部、関連記憶部、嗜好記憶部、出力部の動作を制御する制御部を備えるコンピュータに、次回に出力部が出力する提示キーワードを抽出させるためのキーワード抽出プログラムであって、出力部により出力されたキーワードの中からキーワードを指定するステップと、指定部により指定されたキーワードとの関連度と嗜好度とに基づき、複数のキーワードの中から提示キーワードを抽出するステップとを制御部に実行させる。
さらに他の局面に係る本願発明は、上述のキーワード抽出プログラムを格納したコンピュータ読取可能な記録媒体である。
本発明によれば、ユーザのキーワードに対する嗜好情報とキーワード間の関連情報とに基づいて、提示キーワードが抽出される。したがって、利用者はキーワードを考える必要がなく、より利用者の趣味・嗜好に合致したキーワードで検索することが可能になる。
本発明の実施の一形態を図面に基づいて以下に説明する。
(1.本発明の機能的構成)
まず、図1を用いて本発明に係るキーワード抽出装置の構造について説明する。図1は、本発明に係るキーワード抽出装置の構造を示すブロック図である。キーワード提示装置は、入力部1、入力受付部2、提示キーワード生成制御部3、キーワード表示作成部4、検索用キーワード記憶部5、提示キーワード記憶部6、選択キーワード記憶部7、表示制御部8、表示部9を備える。入力部1には、利用者からの様々な選択情報、要求情報、指定情報が入力される。入力受付部2は、入力部からの情報を受け取り、入力情報に応じて各処理部に情報を渡す。提示キーワード生成制御部3は、利用者に提示するキーワードを記憶した検索用キーワード記憶部5から提示するキーワードを所定の方法に基づき抽出し、抽出した提示キーワードを提示キーワード記憶部6に記憶する。キーワード表示作成部4は、抽出された提示キーワードでもって表示画面を作成する。例えば、提示キーワード生成制御部3で抽出されたキーワードでもって表示用の検索ボタンを生成する。また、選択キーワード記憶部7は、利用者の操作により選択された検索キーワードを保存する。表示制御部8は、キーワード表示作成部4が作成した表示画面を受け取り、表示部9に表示させる。ただし、キーワード抽出装置自身が、表示部を持たなくても構わない。キーワード抽出装置は、提示キーワードを抽出し、出力する部分を備えていればよい。
図2は、本キーワード抽出装置を組み込んだ検索支援装置のブロック図である。検索支援装置は、入力部1、入力受付部2、提示キーワード生成制御部3、キーワード表示作成部4、検索用キーワード記憶部5、提示キーワード記憶部6、選択キーワード記憶部7、表示制御部8、表示部9に加え、検索要求部10、検索部12、検索結果取得部13、検索結果表示作成部14を備える。検索要求部10は、入力受付部2からの指示に応じて、検索部12にて検索を行なうための検索式を作成し、検索部12に検索要求を送る。ここで、検索式は、例えば、キーワード表示作成部4が作成した検索ボタンのうち、ユーザにより選択された検索ボタンに付されたキーワードに応じて作成される。検索部12は、検索要求部10からの検索要求に応じ、キーワードと関連するコンテンツなどの検索を行なう。なお、この検索は、検索支援を実行している装置内で行なわれていても、ネットワークで接続された外部の装置で行なわれていてもよい。検索結果取得部13は、検索部9で検索された検索結果を取得する。検索結果表示作成部14は、検索結果取得部13が取得した検索結果から表示用の検索結果情報を作成する。なお、以下では、コンテンツ検索支援装置に関する実施例について説明する。
(2.本発明のシステム構成)
本発明に係るキーワード提示装置は、実質的には、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとからなるコンピュータシステムにより実現される。以下、図3を用いて、このコンピュータシステムについて説明する。図3は、本発明を実現するためのコンピュータシステムの一例を示す図である。
図3を参照して、このコンピュータシステム200は、コンピュータ220と、モニタ203aと、リモコン204とを含む。
コンピュータ220は、光ディスクドライブ201、磁気ディスクドライブ202、ディスプレイインタフェース(I/F)203b、リモコンインタフェース(I/F)205、CPU(central processing unit、中央処理装置)206、ROM(read−only memory、読出専用メモリ)208、RAM(random−access memory、ランダムアクセスメモリ)209、およびこれらを互いに接続するバス207とを含む。また、ここでは示さないが、コンピュータ220はさらにネットワークへの接続を提供するネットワークアダプタボード、無線通信を行なう通信装置などを含んでもよい。
リモコンインタフェース205は、リモコン204からの信号を受信する。ROM208は、ブートアッププログラム等を記憶する。RAM209は、プログラム命令、システムプログラム、および作業データ等を記憶する。光ディスクドライブ201には、光ディスク210が挿入される。磁気ディスクドライブ202には、磁気ディスク211が挿入される。
コンピュータシステム200に検索支援装置の機能を実現させるためのプログラム、入力情報はいずれも、光ディスク210または磁気ディスク211に記憶され、さらにハードディスク212に転送される。または、プログラム、入力情報は図示しないネットワークを通じてコンピュータ220に送信され、ハードディスク212に記憶される。ハードディスクに記憶されたプログラムは、実行の際にRAM209にロードされる。あるいは、プログラムは、光ディスク210から、磁気ディスク211から、またはネットワークを介して、ハードディスク212を経由せず、直接にRAM209にロードされてもよい。
なお、検索支援装置の機能を実現するためのプログラム、入力情報が記録される記録媒体は、CD−ROM(コンパクトディスク読取専用メモリ)、MO(Magneto−Optical disc)、MD(Mini Disc)、およびDVD(Digital Versatile Disc)等の光ディスク210、FD(フレキシブルディスク)およびハードディスク等の磁気ディスク211に限られず、例えば、磁気テープあるいはカセットテープ等のテープ、IC(Integrated Circuit)カードあるいは光カード等のカード型記録媒体、並びにマスクROM、EPROM(Erasable Programable ROM)、EEPROM(Electrically Erasable Programable ROM)、およびフラッシュROM等の半導体メモリであってもよい。ただし、コンピュータシステム200は、プログラムを記憶するこれら記録媒体からの読出を行なうための読出装置を実装する必要がある。
このプログラムは、コンピュータ220に本実施の形態に係る検索支援装置の機能を実現させる複数の命令を含む。これら機能を実現させるのに必要な基本的機能のいくつかはコンピュータ220上で動作するオペレーティングシステム(OS)またはサードパーティのプログラム、若しくはコンピュータ220にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施の形態に係る検索支援装置の機能を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」を呼出すことにより、上記した検索支援装置の制御を実行する命令のみを含んでいればよい。
(3.キーワードの提示について)
次に、本発明によるキーワードの提示について、図4を用いて説明する。図4は、モニタ203aに表示される画面の一例を示す図である。表示画面には、検索キーワード401、提示キーワード402、検索結果403、PREVボタン404、NEXTボタン405、Genreボタン406、切替ボタン407が含まれる。ただし、図4は表示用に生成された画面の一例であり、検索キーワード401、提示キーワード402、操作ボタンの配置、検索結果403の表示は任意に変更することが可能である。
検索キーワード401は、ユーザが、コンテンツの検索のために指定したキーワードである。図4では、検索キーワード401として、「ニュース」が指定された場合の画面例を示している。
検索結果403は、検索キーワード401に応じて、検索部12が検索したコンテンツに対応する画像である。図4では、「ニュース」というキーワードに基づいて検索されたコンテンツのうち6つに対応する画像が表示されている。検索結果403の中から、画像を選択すると、コンテンツの視聴ができる。
また、検索キーワード401に応じて検索されたコンテンツが多数ある場合、その一部のみを表示し、切替ボタン407を選択することで、表示されていないコンテンツが、現在表示しているコンテンツにかえて表示されるようにしてもよい。
提示キーワード402は、検索キーワード401が指定されると、検索キーワード401との関連度、各キーワードに対する利用者の嗜好度、以前に提示されたキーワード等に基づいて、検索用キーワード記憶部5に記憶されたキーワードの中から抽出され、表示用に生成されたキーワードである。このキーワードの抽出の方法の詳細については後述する。本図においては、提示キーワード402は、9個であるとしているが、他の個数であっても構わないし、提示キーワード402に含まれるキーワードの配置も問わない。例えば、一列に並んでいても構わない。
利用者は、提示キーワード402の中から、次の検索キーワード401を選択することができる。入力部1に、提示キーワード402の中からキーワードを選択するための選択情報が利用者から入力されると、入力受付部2を介して、選択キーワード記憶部7に、選択されたキーワードが次の検索キーワード401として記憶される。利用者による検索キーワードの選択決定の方法は特に限定しない。例えば、図4に示すように、リモコン204が、十字方向にフォーカス移動制御可能な入力デバイスを備えている場合、十字方向への操作によって検索キーワードのフォーカスを移動させ、好みのキーワードの検索キーワードにフォーカスをあわせ、決定操作によってキーワード選択する。
本発明の手法により、操作履歴、嗜好度など利用者毎に異なる情報に基づいて提示キーワード402を選定、提示することによって、利用者はキーワードを考える必要がなく、より利用者の趣味・嗜好に合致したキーワードで検索することが可能になる。利用者は選択処理を行なうことで、利用者の嗜好に合致し、かつ現在求めるコンテンツにより近いキーワードの提示が可能となる。
本手法では、提示キーワードが固定化されないので、利用者の検索意図が反映されやすい。ディレクトリ検索で用いられるような固定化された階層データベースにおいて適切なキーワードを提示するためには、検索対象コンテンツによってキーワードの種類、階層構造を調節する必要があるが、検索対象コンテンツが変わると再度調節を行なわなければならない。これに対し、本手法では、検索対象コンテンツを限定することなく、利用者の検索意図にあったキーワードをそのつど提示することが可能である。
また、選択情報に応じて、入力受付部2は、提示キーワード生成制御部3に、次の提示キーワード402の生成要求を行なう。提示キーワード生成制御部3は、生成したキーワードを提示キーワード記憶部6に格納し、キーワード表示作成部4で提示キーワード402を生成する。さらに、選択情報に応じて、検索要求部10は検索式を作成し、検索部12に検索要求を行なう。そして、検索結果取得部13が検索結果を取得し、検索結果表示作成部11が表示用検索結果情報である図4における検索結果403を作成する。
表示制御部8は、検索キーワード401、提示キーワード402、検索結果403の表示の制御を行ない、表示部9に表示させる。つまり、検索キーワード401を指定すると、検索キーワード401に基づく検索結果403と、次回検索用キーワードの候補である提示キーワード402とが両方表示される。従って、利用者の入力の手間を軽減することができる。ただし、例えば、次の検索キーワード401を提示した後、ユーザが画面操作することにより、次の提示キーワード402の抽出要求、あるいは検索要求が行なわれるという構成であっても構わない。利用者は、表示されている検索結果に好みのものがあれば視聴し、気に入らなければ提示されている別のキーワードの選択を繰り返すことで、コンテンツの検索を繰り返すことができる。
なお、本発明の検索支援装置で、初回検索時(初回起動時)などであって、検索キーワード401が指定されていない場合がある。この場合、提示キーワード402を、以前に提示されたキーワードや嗜好度、関連度等によらず、利用者からの呼び出し要求に従い提示されるあらかじめ定められた固定キーワードにし、その中から利用者が検索キーワード401を選択するようにするとよい。特に、固定キーワードをカテゴリ名等に利用されるような広義な意味をもつキーワードとしておくと、初回検索時には複数のカテゴリが提示されることになるので、利用者がキーワードの選択をしやすい。
あるいは、利用者の年齢、性別、好みの分野などのプロファイル入力を要求し、その入力結果に基づいて提示するキーワードを選定することもできる。年齢、性別などでカテゴリ分けし、予め各カテゴリ毎に初回提示キーワードを設定しておくこともできる。ただし、初回以外の起動時は、所定のキーワード抽出の方法に基づき、提示キーワードの抽出が行なわれるほうが好ましい。
また、利用者が、キー入力などにより直接、検索キーワード401を指定することができるような構成であってもよい。また、その際、利用者が文字をいくつか入力すると、先頭の文字が一致するキーワードを検索用キーワード記憶部5から抽出し、表示部9に表示する構成であってもよい。この構成により、利用者のキー入力の手間が低減される。ただし、提示キーワード402が抽出、提示されている場合には、その中から、検索キーワード401を選択するほうが好ましい。
NEXTボタン405は、利用者が提示中のキーワードとは別のキーワードを要求する際に選択するボタンである。このボタンが選択されると、提示キーワード生成制御部3は、検索用キーワード記憶部5に格納されているキーワードのうち未提示のキーワードを提示する数だけ抽出し、キーワード表示作成部4は新たに抽出されたキーワードについて表示用の提示キーワード402を生成する。そして、表示制御部8は、現在表示中の提示キーワードにかえて新しく生成された提示キーワードを表示部9に表示させる。新しく提示されたキーワードについては、提示キーワード記憶部6で提示したことを記憶する。提示されたキーワードの中に適切なキーワードがない場合、簡単に別のキーワードに切り替えられることで、次々に新たな検索キーワードが提示され、次の検索へ移りやすくする。
また、PREVボタン404は、NEXTボタン405による提示キーワードの変更があった場合に、変更前の提示キーワードを再度提示する際に選択するボタンである。このキーワードが選択されると、提示キーワード生成制御部3は、提示キーワード記憶部6から以前に提示されていたキーワードを抽出し、キーワード表示作成部4は抽出されたキーワードについて表示用の提示キーワード402を生成する。そして、表示制御部8は、抽出された提示キーワードを表示部9に表示させる。以上の処理により再び提示されたキーワードについても、提示キーワード記憶部6で提示したことを記憶してもよい。このPREVボタン404を利用することにより、利用者は以前に提示されたキーワードを再び確認することができる。
なお、NEXTボタン405による提示キーワードの変更がなされていない場合、PREV404を選択すると、固定キーワードが表示されるような構成になっていてもよい。あるいは、表示制御部8がPREVボタン404を表示部9に表示しないようにしてもよい。また、表示はするが、PREVボタン404を選択できないようにしてもよい。図4は、そのような場合に対応する図であり、利用者が選択できないことを表すため、PREVボタン404が薄く表示されている。
PREVボタン404、NEXTボタン405により提示キーワード402の表示を変更する際の、検索結果403の表示については限定しない。提示キーワード402の表示を変更する前後で検索結果403の表示を変更しないでもよいし、別の検索結果を表示してもよい。
Genreボタン406は、利用者が固定キーワードを要求する際に選択するキーワードである。固定キーワードとは、前回提示したキーワードや嗜好度、関連度等によらず、利用者からの呼び出し要求に従い提示されるあらかじめ定められたキーワードのことをいう。検索用キーワード記憶部6で、キーワードと共に固定キーワードかどうかの情報も記憶している。
Genreボタン406が選択されると、提示キーワード生成制御部3は、検索用キーワード記憶部6から固定キーワードを抽出し、キーワード表示作成部4は固定キーワードについての表示用の提示キーワード402を生成する。そして、表示制御部8は、現在の提示キーワード402にかえて固定キーワードを表示する。このとき、検索結果の表示については限定しない。検索キーワードの表示を変更する前後で検索結果の表示を変更しないでもよいし、別の検索結果を表示するでもよい。
前回選択したキーワードに関連したキーワードを抽出する手法では、検索キーワードを繰り返し選択していると、提示するキーワードがある一部の分野に偏る場合がある。また、繰り返し検索しているうちに、利用者の検索意図が移り変わり、現在提示されているキーワード群と関連しない、全く別の分野のキーワードで検索したくなる場合も考えられる。この場合に、前回の選択キーワードによらず、固定キーワードを提示キーワードとして提示することで、別の分野での検索に移りやすくする。
固定キーワードは、限定しないが、例えば、言語的な意味によって階層化されたキーワードのうち上位層のキーワード、コンテンツを分類するカテゴリ名、分野名、ジャンル名等に利用されるキーワードにするとよい。
(4.本発明により行なわれる処理について)
図5は本発明に係る検索支援装置の処理の流れを示すフローチャート図である。この図に従って、本発明の具体的な動作について説明を行なう。
まず、CPU206は、ステップS1において、入力部1(例えば、リモコンI/F205)への入力の有無の判定を行なう。入力部1に入力がないと判断した場合(ステップS1においてNo)、ステップS1の処理を繰り返す。
入力部1になんらかの入力があると判断した場合(ステップS1においてYes)、CPU206は、ステップS2においてその入力が、利用者による検索キーワード401の指定あるいは選択を表す選択情報であるかどうかを判断する。
選択情報が入力されたと判断すれば(ステップS2においてYes)、CPU206は、ステップS3において、キーワード選択時の学習すなわち嗜好情報の更新を行なう。この嗜好情報の更新方法の詳細に関しては後述する。
嗜好情報の更新の後、CPU206は、ステップS4において、選択されたキーワードを用いて、検索部12に、コンテンツ検索の実行を指示する。コンテンツ検索が行なわれるは、コンテンツ検索支援を実行している装置内であっても、ネットワークで接続された外部の装置であっても本発明には影響はない。
続いて、CPU206は、ステップS5において、ステップS4で得られた検索結果を取得し、ステップS6において、取得された検索結果を表示部9に表示させる。
続いて、CPU206は、ステップS7において、所定の方法で提示キーワードの抽出処理を行なう。提示キーワードの抽出処理については後述する。CPU206は、ステップS7において抽出したキーワードを、抽出済みキーワードとして、提示キーワード記憶部6に記憶する(ステップS8)。ステップS9において、CPU206は、記憶した提示キーワードを表示部9に表示させる。この処理により、一連の処理が終了する。処理の終了後は、ステップS1からの処理を繰り返すことができる。
なお、ここでは、検索キーワードが指定された場合、コンテンツの検索、表示(ステップS4〜ステップS6)を、提示キーワードの抽出、表示(ステップS7〜ステップS9)の前に行なうように説明しているが、この順序は問わない、また、本発明を、コンテンツ検索装置に組み込まず、単にキーワード提示のために用いる場合は、ステップS4〜ステップS6の処理は不要である。
CPU206は、入力された情報が検索キーワードの選択情報でないと判断した場合(ステップS2においてNo)、ステップS10において別キーワード要求であるか、すなわち、NEXTボタン405が選択されたかの判定を行なう。
CPU206は、入力された情報が、別キーワード要求であると判断した場合には(ステップS10においてYes)、ステップS11において別キーワード要求時の学習、すなわち嗜好の更新を行なう。嗜好の更新方法の詳細は後述する。学習処理のあとは、上述したステップS7からステップS9の処理を行なう。
CPU206は、ステップS10において入力された情報が別キーワードの要求でないと判断した場合、ステップS12において、入力された情報が過去のキーワード要求であるか、すなわちPREVボタン404が選択されたかの判定を行なう。
過去のキーワード要求であれば(ステップS12においてYes)、CPU206は、ステップS13において、過去の提示キーワード時の学習、すなわち後述の嗜好情報の更新処理を行ない、ステップ14において過去の提示キーワードの有無を判定する。
過去に提示されたキーワードがあれば(ステップS14においてYes)、CPU120は、ステップS15において、1回前に提示されていたキーワードを抽出し、ステップS9でそのキーワードを利用者に提示する。
ステップS14において過去に提示されたキーワードがないと判定されれば(ステップS14においてNo)、CPU206は、ステップS18において予め定めた固定キーワードを抽出する。そして、抽出された固定キーワードを、提示キーワード記憶部6に記憶し(ステップS8)、ステップS9で表示部9に提示させる。なお、本フローチャートでは、過去に提示されたキーワードがない場合、CPU206が固定キーワードを提示するものとしているが、CPU206は、提示キーワードを変更せず、提示すべき過去のキーワードがないというメッセージを表示してもよい。
CPU206は、ステップS12において入力情報が過去のキーワード要求でないと判断した場合(ステップS12においてNo)、ステップS16で、入力情報が固定キーワード要求であるかを判定する。
固定キーワード要求であると判定すれば(ステップS16でYes)、CPU120は、ステップS17で固定キーワード要求時の学習、すなわち後述の嗜好情報の更新をした後、ステップS18で固定キーワードを抽出する。続いて、ステップS8で提示キーワードを記憶した後、提示キーワードを表示部9に表示させる。
固定キーワード要求でなければ(ステップS16でNo)、ステップS19において、利用者が指定した処理を実行する。指定された処理がコンテンツの視聴指示であればコンテンツを視聴できるように表示制御を行ない、終了操作であればコンテンツ検索支援処理を終了する。
(5.提示キーワードの抽出方法)
ここで、提示提示キーワード生成制御部3が提示キーワードを抽出する際に用いる方法について説明する。
本発明においては、提示キーワードの抽出にあたっては、利用者のキーワードに対する嗜好情報と、キーワード間の関連度情報を利用する。この嗜好情報、関連度情報は、各キーワードについて、検索用キーワード記憶部5に記憶される。
本実施例では、関連度情報は、図6に示すように、各キーワードについての、他のキーワードとの関連度からなる。各キーワードはIDによって識別される。例えば、キーワード「スポーツ」は、「音楽」との関連度は20、「コンサート」との関連度は10、「野球」との関連度は50、「サッカー」との関連度は50、「釣り」との関連度は30、「日本代表」との関連度は20となる。関連度の値が高いほど関連の度合いが大きいとする。
なお、本実施例では、関連度情報は、予め与えられているものとした。例えば、特許文献1に記載のような関連度辞書を用いて与えればよい。ただし、関連度情報は、固定でなくても構わない。例えば、2つのキーワードをともに含むコンテンツを検索し、検索されたコンテンツ数を利用して定めることもできる。
また、関連度を、提示キーワードの抽出にあたって、その都度計算してもよい。具体的には、図8に示すように、キーワード単位で特徴量を示す要素を保持する。あるキーワードと、別のキーワードの関連度は、この特徴量の類似度を用いることができる。すなわち、図8におけるキーワード間のすべての要素について特徴量の差を求め、この差から類似度を求める。例えば、各特徴量の差の2乗の総和に、その値が一定範囲内に収まるように定数を乗算し正規化した値を類似度として用いることができる。なお、この場合は、総和が小さいほうが関連度が高くなる。この手法の利点として、すべてのキーワード間の関連度を記憶する必要がないため、キーワード関連度の記憶する容量を削減できる効果がある。キーワードがN個の場合、単純に各キーワードと他のキーワードの関連度を表すと、N(N−1)個の関連度の値が必要である。一方、本手法の場合、特徴量をk個とすると、関連度算出のために保持すべきデータ数はNk個であるため、k<N−1なら、データ数、従って、使用する記憶容量を削減できる。
また、ユーザのキーワードへの嗜好情報は、利用者による検索キーワードの指定に基づいて定められる。従って、利用者がキーワード選択操作を繰り返すことで、より利用者の嗜好に近いキーワードを抽出、提示することができる。本実施例では、図8に示すように、嗜好情報は、各キーワードについての長期嗜好度、短期嗜好度、直近提示回数、直近選択回数、直前選択という項目からなる。
嗜好度は、利用者の選択頻度に相関を持つ値である。ここでは、嗜好度の値が高いほど好みの度合いが大きいものとする。つまり、利用者による選択頻度が高いキーワードほど、高い値を持つように更新されるものとする。
なお、本実施例では、嗜好度に、長期嗜好度、短期嗜好度という2種類の嗜好度が存在するものとする。ただし、嗜好度の種類についてはこれに限られない。例えば、1つのキーワードに対して、1種類の嗜好度だけが与えられていてもよい。また、3種類以上の嗜好度が存在してもよい。
また、図7ではキーワード単位で嗜好の値を数値化しているがほかの方法で保持してもかまわない。たとえば同一の特性を持つキーワードをグルーピングしてグループ単位で値を持つようにしても良い。
直近提示回数は、そのキーワードが、最後に提示キーワードとして提示されたのは、何回目のキーワード抽出処理に際してかを示すものである。例えば、これまでに、10回のキーワード抽出が提示キーワード生成制御部によって行なわれており、2回目、5回目、8回目のキーワード抽出でそのキーワードが抽出され、提示された場合、直近提示回数は、8となる。また、直近提示回数は、そのキーワードが、最後に検索キーワードとして選択されたのは、何回目のキーワード抽出処理に際してかを示すものである。例えば、これまでに、10回のキーワード抽出が提示キーワード生成制御部によって行なわれており、2回目、5回目のキーワード抽出でそのキーワードが抽出、提示され、かつ利用者により選択された場合、直近選択回数は、5となる。なお、直近提示回数、直近選択回数の決定に必要となる、キーワード抽出処理の回数は、例えば、提示キーワード記憶部6に記憶されているものとする。
直前選択は、1回前の操作において選択されたことを示すものであり、直前に選択されたキーワードに“1”が与えられ、その他のキーワードには“0”が与えられる。
図7では、1回目のキーワード抽出で、スポーツ、音楽が提示キーワードとして抽出されて、これらが提示され、スポーツが次の検索キーワードとして選択された場合を示している。
提示キーワード生成制御部3は、嗜好度の高いキーワード、関連度の高いキーワードほど優先的に抽出する。本実施例では、各キーワードについて、(スコア)=A×(長期嗜好度)+B×(短期嗜好度)+W1×(関連度)で定義されるスコアを算出し、スコアの高いものを優先的に抽出するものとする。ここで、A、B、W1は重みである。以下の説明では、A=1、B=1、W1=5とするが、値はこれに限られない。
今、「スポーツ」というキーワードが利用者によって選択されたとする。選択された検索キーワードのキーワード情報として「スポーツ」が渡されると、提示キーワード生成制御部3は、検索用キーワード記憶部6を参照し、各キーワードについて「スポーツ」との関連度と、キーワード自身の嗜好度からポイントを算出する。具体的には、キーワード「野球」の場合、野球への長期嗜好度が50、短期嗜好度が100、野球のスポーツとの関連度が25であるから、スコアは、50+100+5×25=275となる。同様に各キーワードについてスコアを算出し、スコアの高い順にソートして提示キーワード記憶部7に格納する。以上のように求めたスコアが大きい順にソートした際の上位のキーワードを抽出するとよい。任意の閾値を設け、閾値以上のキーワードを抽出する方法でも良い。
また、提示キーワードの抽出を行なう場合において、過去n回に提示キーワードとして提示された、あるいは過去m回に検索キーワードとして選択されたキーワードの提示を抑制することも可能である。ここで、n、mは任意の数字に設定ができる。
上記の提示抑制を行なうためには、直近提示回数、直近選択回数が用いられる。提示抑制処理について、図9を用いて説明する。
提示キーワードを抽出するための指示を受付けると、CPU206は、ステップS201において、検索用キーワード記憶部5に記憶されている、キーワード抽出回数N、直近提示回数、直近選択回数を更新する。
次に、CPU206は、ステップS202において、各キーワードの直近提示回数n’を抽出する。
そして、CPU206は、ステップS203において、N−n’とnの大きさを比較する。N−n’≦nのとき(ステップS203においてYes)、CPU206は、ステップS206において、そのキーワードのスコアを0にする。N−n’≦nのときは、過去n回にそのキーワードが提示キーワードとして提示されているからである。なお、ステップS206において、スコアを0にするとしているが、この処理はこれに限られず、そのキーワードの提示が抑制される処理であればよく、そのキーワードのスコアを減少させる処理、例えば、スコアに0以上1未満の定数をかける、あるいは、定数を引くような処理であっても構わない。
N−n’≦nでないとき(ステップS203においてNo)、ステップS204以下の処理に移る。ステップS204において、CPU206は、各キーワードの直近提示回数m’を抽出する。
そして、CPU206は、ステップS205において、N−m’とmの大きさを比較する。N−m’≦mのとき(ステップS205においてYes)、CPU206は、ステップS206において、そのキーワードのスコアを0にする。N−m’≦mのときは、過去m回にそのキーワードが検索キーワードとして選択されているからである。N−m’≦mでないとき(ステップS205においてNo)、キーワードのスコアの変更は行なわない。
以上のように、操作履歴に基づき、同一のキーワードを繰り返し提示することを抑制することで、より目的のコンテンツに近いキーワードに到達するまでの操作数を低減することができる。
なお、本実施例では、直近提示(あるいは選択)回数を、最後にそのキーワードを提示(あるいは選択)したのが、何回目のキーワード抽出処理に際してかを示すものとして定義したので、上記のような処理を行なうが、他の方法でキーワード提示の抑制を行なうこともできる。例えば、直近提示(あるいは選択)回数を、何回前に提示(あるいは選択)されたかを示すものとして定義し、n(あるいはm)と比較することで、定時の抑制を行なうことも可能である。この場合、CPU206は、例えば、ステップS105において、嗜好度を更新するとともに、直近選択回数を更新する。直前に選択されたキーワードの直近選択回数を1、その前に選択されたキーワードの直近選択回数を2、以降1ずつ増加するように、直近選択回数を更新する。直近提示回数についても同様に更新する。
また、キーワードの提示を抑制する回数(n、m)を、動的に変化させることもできる。例えば、PREVボタン404の選択により「前のキーワード」を提示させる操作、NEXTボタン405の選択により「他のキーワード」を提示する操作を連続して行なった回数によって、CPU206は、キーワードの提示を抑制する回数n、mを減らす。検索キーワードが指定された場合、CPU206は、n、mを所定の値に戻す。具体的には、例えば、検索キーワードの指定なしに、PREVボタン404あるいはNEXTボタン405の選択が行なわれる毎、あるいは、PREVボタン404あるいはNEXTボタン405がs回(s≧2)選択される毎にn、mとも1ずつ減らしていく。この際、n、mの下限(例えば2等)が定められていても構わない。
あるいは、提示キーワードの中からのキーワード選択指示が連続してs回(s≧2)選択される毎にn、mとも1ずつ加算していく減らしていくことも可能である。この際、n、mの上限値を予め定めておくことが望ましい。
利用者が提示されたキーワードを選択せず「前のキーワード」、「他のキーワード」などの操作を行なっていることは、以前に提示されたキーワードを探している状態を含んでいる。また、キーワード選択のみを続けていることは、利用者が以前に提示されたキーワードを求めていない状態と推定される。従って、このように提示しない回数を動的に変化させる、すなわち、「前のキーワード」、「他のキーワード」を再提示させる指示、または、提示キーワードの中からキーワードを指定し新たな提示キーワードを抽出させる指示のいずれがなされたかに応じて、以前に提示されたキーワードの提示しない回数を増減することで、利用者が所望するキーワードに到達しやすくすることができる。
キーワードの抽出にあたっては、上記のようにスコアを用いる方法のほか、ランダム値を用いてキーワードを抽出する方法、あるいは、予め定めた順序ですべての提示キーワードを順番に抽出していく方法を用いることも可能である。これらのランダム抽出、全キーワードを順に抽出する方法は、利用者の指示によって行なうことが望ましい。
また、利用者に提示するキーワードの中の一部のみランダムで選択する方法も可能である。このときランダムで選ばれるキーワードは、言語的な意味によって階層化されたキーワードのうち上位層のキーワードを抽出すると、キーワードが含有する範囲が広いため、利用者が選択する可能性が多くなるので好ましい。例えば、「スポーツカー」のような限定された意味をもつキーワードよりも、「車」のようなより広範囲を対象とするキーワードが望ましい。
キーワードのランダム提示、あるいは、一覧提示により、利用者が自ら嗜好情報とは異なった新たなキーワードを選択する機会を設けることを可能とする。このことは、利用者の嗜好による偏りを防止する、新たな発見的機会を提供することができる効果がある。
(6.嗜好情報の更新方法)
本発明においては、利用者の操作に応じて、嗜好情報を更新する。従って、利用者が操作を繰り返すことで、より利用者の嗜好に近いキーワードを提示することが可能になる。また、利用者が異なった時点で同一のキーワードを選択した場合、前回操作時から嗜好情報が更新されているため、前回選択時に提示されたキーワードとは必ずしも一致しない。このことにより、利用者の趣味に合致しつつ異なるキーワードが提示でき、利用者を異なったキーワードに基づく検索を行なうことなどで、より広範囲のコンテンツに誘導することが可能となる。
図10は、本発明に係る検索装置が行なう、利用者の操作に応じた嗜好学習、すなわち嗜好情報の更新のフローチャートである。このフローチャートに従って嗜好情報の更新方法を説明する。
まず、CPU206は、ステップS101において、検索用キーワード記憶部5に、嗜好情報が保存されているかどうかを判定する。CPU206は、保存された嗜好情報があると判定した場合(ステップS101においてYes)、ステップS102で、保存された嗜好情報をROM208上に読み出す。保存された嗜好情報がないと判定した場合(ステップS101においてNo)、ステップS103で初期化された嗜好情報を作成する。
つづいて、CPU206は、ステップS104において、利用者がキーワードを選択したかどうかを判定する。この処理は、図5におけるステップS2、ステップS10、ステップS12、ステップS16で行なわれる判定と対応する。図5のステップS2で提示キーワードの中から検索キーワードが選択されたと判定された場合が、ステップS104におけるYesである。提示キーワードの中から検索キーワードがされなかったが、他のキーワード(別キーワード、過去のキーワード、固定キーワード)の抽出のための指示が行なわれた時、つまり、ステップS10、ステップS12、ステップS16においてYesと判定された場合が、ステップS104におけるNoに相当する。
キーワードが選択されたと判定された時(ステップS104でYes)、CPU206は、ステップS105、S106の処理を行なう。
ステップS105において、選択キーワードに関する学習、すなわち選択されたキーワードの嗜好情報を更新する。その更新方法の一例を以下に示す。
本実施例では、長期嗜好度、短期嗜好度はそれぞれ、次の式(1)、式(2)で更新される。
Figure 2009064391
Figure 2009064391
ここで、tは提示キーワードの提示回数を示す時間パラメータ(自然数)であり、L(t)が長期嗜好度、S(t)が短期嗜好度である。また、WLは長期嗜好学習定数、Wsは短期嗜好学習定数であり、それぞれ0〜1の間の値をとる。本手法では短期嗜好の更新割合を大きくするため、Ws>WLであることが望ましい。αは嗜好定数である。なお、選択されたキーワードの漸近値は、関連するキーワードの漸近値より高くなるのが望ましいため、αはRの最大値より大きい値であるのが望ましい。また、選択されたキーワードの嗜好度が減少しないように、αは嗜好度のとりうる最大値であるのが望ましい。本実施例の場合、後述するように、嗜好度の最大値が100となるように正規化するため、α=100であるとする。
ただし、嗜好度の更新方法はこの方法に限られず、一般には、利用者の各キーワードへの嗜好が嗜好情報に反映されるように、選択された頻度が高いキーワードの嗜好度が高くなるように更新すればよい。例えば、選択されたキーワードの嗜好度に定数を加えるなどの更新方法でもよい。
次に、ステップS106において、関連キーワードの学習を行なう。具体的には、各々のキーワードに関して次の式(3)、式(4)で長期嗜好度、短期嗜好度の更新を行なう。
Figure 2009064391
Figure 2009064391
ここで、Rは、選択されたキーワードと学習対象のキーワードとの関連度である。このように選択されたキーワードと関連するキーワードの嗜好度を更新することで、利用者の嗜好がより反映されるようになる。ただし、本発明の処理の実現にあたっては必ずしも必要ではない。
次に、CPU206は、ステップS107において、提示キーワードのうち選択されなかったキーワードの学習を行なう。本実施例では、選択されていないキーワードの提示を抑制するために、次の式(5)で嗜好度を下げるように更新する。
Figure 2009064391
ここで、Wxは短期嗜好制限定数であり、0から1の間の値をとる。式(5)を用いることで、提示されたが選択されていないキーワードの短期嗜好度を下げることができる。なお、ここでは、短期嗜好度のみを更新するとしているが、長期嗜好度についても、長期嗜好制限定数Wyを設けて、式(5)と同様の式により更新してもよい。ただし、その場合、短期嗜好度の影響力が早く弱まるように、Wx>Wyであることが好ましい。また、提示されたキーワードすべてについて式(5)を適用しても構わない。
このように嗜好度を更新することで、次回以降の処理において、以前に提示されたキーワードと同一のキーワードを提示キーワードとして抽出し、繰り返し利用者に提示することを防ぐことが可能となる。同一のキーワードを繰り返し提示することを抑制することで、より目的のコンテンツに近いキーワードに到達するまでの操作数を低減することができる。
長期間保持される長期嗜好度と、短期間で影響力を失っていく短期嗜好度の2つの嗜好度を持つことで、利用者がキーワード提示されている時点の志向を強く反映させることが可能となり、より適切なキーワードを提示し、コンテンツまでの到達時間を短縮すると同時に、長期的な嗜好を学習し、次回以降の検索補助実行時でも適切なキーワード提示が可能となる。嗜好度を、現時点での嗜好と推測される短期嗜好度と、利用者がベースに持つ嗜好であると推測される長期嗜好度に分けて扱うことで、より適切なキーワードを提示することができる。
本実施例では、WL=0.01、Ws=0.05、Wx=0.99 という定数を用いるが、これらの値は、他の値であってもよい。また、提示回数t、選択した回数などの利用者の操作履歴に基づいて動的に変更しても良い。
ステップS108において、短期嗜好度および長期嗜好度の正規化を行なう。例えば長期嗜好度、短期嗜好度とも最大値が100となるように定数を乗算する単純正規化を行なう。最後にステップS109で更新された嗜好情報データを嗜好情報記憶部に保存する。
以上では、短期嗜好度と長期嗜好度に対して、利用者の操作履歴に基づいて、それぞれ異なった更新をする方法の一例を示した。この手法は、学習定数、制限定数の種類を増やすことにより、嗜好度の種類が3種類以上の嗜好度がある場合にも、それぞれの種類の嗜好度に対し、異なる更新を行なうようにすることができる。これにより、利用者の嗜好をより的確に反映できるようになる。また、嗜好度は1種類であっても構わない。
また、本コンテンツ検索支援装置は、セッション判定を行ない、その結果に基づき、嗜好情報の更新を行なってもよい。ここで、セッションとは、操作単位を示すものであり、装置が検索支援機能の利用開始の指示を受付け、検索支援機能の利用終了の指示を受付けるまでを1つのセッションとする。
検索支援機能の利用開始の指示は、例えば、検索支援のアプリケーションを立ち上げるための指示である。また、検索支援機能の利用終了の指示は、例えば、コンテンツの視聴を開始するための指示、アプリケーションを終了するための指示、あるいは、検索の再スタート操作を行なうための指示である。また、ジャンルを示すような固定キーワードを要求する指示を、検索支援機能の利用終了の指示としてもよい。CPU206は、これらの利用開始または利用終了の指示を受付け、セッションの判定を行なう。
CPU206は、セッション終了と判定した場合、各キーワードの嗜好情報を更新する。例えば、各キーワードの短期嗜好度を低下させる。特に、短期嗜好度を初期化し、過去の影響を完全になくすことも可能である。これに対し、長期嗜好度については更新を行なわないことで、短期的な嗜好情報の影響力を弱め、次回のコンテンツ検索支援利用時に、より利用者の一般的な嗜好により、提示キーワードを抽出することが可能となる。セッション内では利用者のキーワードの選択は短期嗜好度に強く反映されるので、目的のキーワード、あるいは、コンテンツまでの到達時間を短縮することができる。
検索の再開などの操作を行なった場合、現時点で目的のコンテンツに到達できていないと考えられる。従って、その場合に嗜好情報を更新することで、新たな探索を再開させ、利用者の所望するコンテンツに少ない操作で到達させることが可能となる。
また、利用者がコンテンツを視聴したことで一連の探索が終了したと判定し、嗜好情報の更新および保存を行なうことで、利用者の嗜好情報を確実に保存、記憶し、利用者の嗜好を反映した次の新たなキーワード提示を実行することができる。
また、セッション終了と判定した場合、CPU206は、直近提示回数、直近選択回数を初期化してもよい。前回の選択によるキーワード選出の抑制も解除することで、次回のコンテンツ検索支援利用時に、より利用者の一般的な嗜好により、提示キーワードを抽出することが可能となる。特定の操作、たとえば検索のやり直しを意図するような操作があった場合、提示の抑制を解除することで、過去の操作にかかわらず嗜好にのみに沿った検索の開始を実現できる。このことにより、検索の再スタートと、継続した検索との両立を実現する。
(7.その他の実施の形態について)
本実施例ではコンテンツ検索支援装置に適用した例で説明したが、本キーワード提示装置は他の装置、システムにも応用可能である。
例えば、和英、英和、国語などの各種辞書を検索する場合において、検索キーワードを入力した後、他の関連するキーワードが知りたい場合に適用可能である。この関連キーワード検索においては、過去に選択したキーワードを再提示しないように提示抑制回数を多くするとともに、過去に選択したキーワードを簡単に一覧できる機能を持つことが望ましい。
また、コンピュータに接続されたハードディスク、あるいはネットワークを経由して接続されるデータベースに保存されたデータを選び出す目的にも利用できる。このデータには、論文、電子書籍のほか、各種統計情報、商品の仕様表なども含まれる。このときキーワードの関連度情報は、データベースに含まれるデータのテキスト情報から関連度情報を求めておくと効率が良い。たとえば、あるキーワードと他のキーワードのとの関連度は、あるコンテンツに同時に含まれる確率値を用いることができる。コンテンツのタイトルや、キャッチコピーなど、新たにキーワードを設定する必要がある対象に対し、適切なキーワードを探索する場合にも適用可能である。
本発明は、大量に存在するマルチメディアコンテンツの検索支援技術に利用できる。
本発明に係るキーワード抽出装置の構造を示すブロック図である。 本キーワード抽出装置を組み込んだコンテンツ検索支援装置のブロック図である。 本発明を実現するためのコンピュータシステムの一例を示す図である。 モニタ203aに表示される画面の一例を示す図である。 本発明に係る検索支援装置の処理の流れを示すフローチャート図である。 記憶されている関連度情報の一例を示す図である。 記憶されている特徴量の一例を示す図である。 記憶されている嗜好情報の一例を示す図である。 キーワード提示抑制のための処理の流れを示すフローチャートである。 キーワード学習時に行なわれる処理の流れを示すフローチャートである。
符号の説明
1 入力部、2 入力受付部、3 提示キーワード生成制御部、4 キーワード表示作成部、5 検索用キーワード記憶部、6 提示キーワード記憶部、7 選択キーワード記憶部、8 表示制御部、9 表示部、10 検索要求部、11 指定情報記憶部、12 検索部、13 検索結果取得部、14 検索結果表示作成部、200 コンピュータシステム、201 光ディスクドライブ、202 磁気ディスクドライブ、203a モニタ、203b ディスプレイインタフェース、204 リモコン、205 リモコンインタフェース、206 CPU、207 バス、208 ROM、209 RAM、220 コンピュータ、401 検索キーワード、402 提示キーワード、403 検索結果、404 PREVボタン、405 NEXTボタン、406 Genreボタン、407 切替ボタン。

Claims (19)

  1. 複数のキーワードを記憶するキーワード記憶手段と、
    前記複数のキーワード間の関連度を記憶する関連記憶手段と、
    前記複数のキーワード各々について、前記複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶手段と、
    選択候補のキーワードを出力する出力手段と、
    前記出力手段により出力されたキーワードの中からキーワードを指定する指定手段と、
    前記指定手段により指定されたキーワードとの前記関連度と前記嗜好度とに基づき、前記複数のキーワードの中から次回に前記出力手段が出力する提示キーワードを抽出する抽出手段とを備える、キーワード抽出装置。
  2. 外部からの指示を受付ける入力手段と、
    前記出力手段により出力されたキーワードを利用者に提示する提示手段をさらに備え、
    前記指定手段は、前記指示に応じて、前記提示手段により提示された提示キーワードの中からキーワードを指定する、請求項1に記載のキーワード抽出装置。
  3. 前記キーワードに関連付けられたコンテンツを検索する検索手段をさらに備え、
    前記提示手段は、前記検索手段により検索されたコンテンツを提示する、請求項2に記載のキーワード抽出装置。
  4. 前記指定手段によるキーワードの指定に応じて、前記嗜好度を更新する更新手段をさらに備える、請求項1から3のいずれか1項に記載のキーワード抽出装置。
  5. 前記嗜好記憶手段は、複数種類の嗜好度を記憶し、
    各前記複数種類の嗜好度に対して異なった方法で更新を行なう更新手段をさらに備える、請求項4に記載のキーワード抽出装置。
  6. 前記嗜好記憶手段は、長期嗜好度と短期嗜好度とを記憶し、
    前記更新手段は、前記長期嗜好度の更新割合よりも前記短期嗜好度の更新割合のほうが大きくなるように嗜好情報の更新を行なう請求項5に記載のキーワード抽出装置。
  7. 前記更新手段は、以前に前記抽出手段により抽出された前記提示キーワードが再び抽出されることを抑制するように、前記嗜好度を更新する、請求項4から6のいずれか1項に記載のキーワード抽出装置。
  8. 前記更新手段は、以前に前記抽出手段により抽出された前記提示キーワードの嗜好度を下げる、請求項7に記載のキーワード抽出装置。
  9. 前記提示手段により提示されたキーワードの提示回を当該キーワードと関連付けて記憶する手段をさらに備え、
    前記抽出手段は、前記記憶された提示回に基づき、前記提示手段により、第1の抑制回数の間、提示されていないキーワードを優先して前記提示キーワードを抽出する、請求項2または3に記載のキーワード抽出装置。
  10. 前記指示に応じて、以前に前記提示手段により提示された前記提示キーワードを前記提示手段に再提示させる再提示手段と、
    前記再提示手段に前記再提示を行なわせる指示または前記抽出手段に提示キーワードを抽出させる指示のいずれがなされたかに応じて、前記第1の抑制回数を増減させる手段とをさらに備える、請求項9に記載のキーワード抽出装置。
  11. 前記指定手段により指定されたキーワードの提示回を当該キーワードと関連付けて記憶する手段をさらに備え、
    前記抽出手段は、前記記憶された提示回に基づき、前記指定手段により、第2の抑制回数の間、指定されていないキーワードを優先して前記提示キーワードを抽出する、請求項2または3のいずれかに記載のキーワード抽出装置。
  12. 前記指示に応じて、以前に前記提示手段により提示された前記提示キーワードを前記提示手段に再提示させる再提示手段と、
    前記再提示手段に前記再提示を行なわせる指示または前記抽出手段に提示キーワードを抽出させる指示のいずれがなされたかに応じて、前記第2の抑制回数を増減させる手段とをさらに備える、請求項11に記載のキーワード抽出装置。
  13. 前記指示に基づき、操作単位を示すセッションを判定するセッション判定手段をさらに備え、
    前記更新手段は、前記セッション判定手段の判定結果に基づき、前記嗜好度を更新する、請求項4から8のいずれか1項に記載のキーワード抽出装置。
  14. 前記指示に基づき、操作単位を示すセッションを判定するセッション判定手段をさらに備え、
    前記抽出手段は、前記セッション判定手段の結果により、キーワードの提示を抑制する回数を変化させる請求項9から12のいずれか1項に記載のキーワード抽出装置。
  15. 前記抽出手段は、前記指示に応じて、前記複数のキーワードの中からランダムに前記提示キーワードを抽出する、請求項1から14のいずれか1項に記載のキーワード抽出装置。
  16. 前記抽出手段は、前記指示に応じて、すべての前記複数のキーワードを所定の順序で順に抽出する、請求項1から15のいずれか1項に記載のキーワード抽出装置。
  17. 複数のキーワードを記憶するキーワード記憶部と、
    前記複数のキーワード間の関連度を記憶する関連記憶部と、
    前記複数のキーワード各々について、前記複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶部と、
    選択候補のキーワードを出力する出力部と、
    前記キーワード記憶部、前記関連記憶部、前記嗜好記憶部、前記出力部の動作を制御する制御部を備えるコンピュータを用いて、次回に前記出力部が出力する提示キーワードを抽出するためのキーワード抽出方法であって、
    前記出力部により出力されたキーワードの中からキーワードを指定するステップと、
    前記指定部により指定されたキーワードとの前記関連度と前記嗜好度とに基づき、前記複数のキーワードの中から前記提示キーワードを抽出するステップとを備える、キーワード抽出方法。
  18. 複数のキーワードを記憶するキーワード記憶部と、
    前記複数のキーワード間の関連度を記憶する関連記憶部と、
    前記複数のキーワード各々について、前記複数のキーワード各々が指定されてきた頻度と相関を持つ嗜好度を記憶する嗜好記憶部と、
    選択候補のキーワードを出力する出力部と、
    前記キーワード記憶部、前記関連記憶部、前記嗜好記憶部、前記出力部の動作を制御する制御部を備えるコンピュータに、次回に前記出力部が出力する提示キーワードを抽出させるためのキーワード抽出プログラムであって、
    前記出力部により出力されたキーワードの中からキーワードを指定するステップと、
    前記指定部により指定されたキーワードとの前記関連度と前記嗜好度とに基づき、前記複数のキーワードの中から前記提示キーワードを抽出するステップとを前記制御部に実行させる、キーワード抽出プログラム。
  19. 請求項18に記載のキーワード抽出プログラムを格納したコンピュータ読取可能な記録媒体。
JP2007233959A 2007-09-10 2007-09-10 キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体 Pending JP2009064391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007233959A JP2009064391A (ja) 2007-09-10 2007-09-10 キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007233959A JP2009064391A (ja) 2007-09-10 2007-09-10 キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2009064391A true JP2009064391A (ja) 2009-03-26
JP2009064391A5 JP2009064391A5 (ja) 2009-12-24

Family

ID=40558906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007233959A Pending JP2009064391A (ja) 2007-09-10 2007-09-10 キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2009064391A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294824A (ja) * 2008-06-04 2009-12-17 Sony Corp 情報処理装置および方法、並びにプログラム
JP2011118646A (ja) * 2009-12-03 2011-06-16 Ntt Communications Kk ユーザプロファイル処理装置、ユーザプロファイル処理方法、ユーザプロファイル処理プログラム及び記録媒体
JP2011133926A (ja) * 2009-12-22 2011-07-07 Yahoo Japan Corp 商品検索支援装置、方法及びプログラム
KR20160064576A (ko) * 2014-11-28 2016-06-08 한화테크윈 주식회사 영상 검색 방법 및 장치
JP2020149128A (ja) * 2019-03-11 2020-09-17 ヤフー株式会社 推定装置、推定方法および推定プログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863466A (ja) * 1994-08-19 1996-03-08 Fuji Xerox Co Ltd 文書作成支援装置
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH0946689A (ja) * 1995-07-28 1997-02-14 Hitachi Ltd 映像ソフト紹介システムおよび映像ソフト紹介方法
JPH10320419A (ja) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> 情報関連づけ装置およびその方法
JPH117452A (ja) * 1997-06-18 1999-01-12 Nippon Telegr & Teleph Corp <Ntt> ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
JP2002092032A (ja) * 2000-09-12 2002-03-29 Nippon Telegr & Teleph Corp <Ntt> 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863466A (ja) * 1994-08-19 1996-03-08 Fuji Xerox Co Ltd 文書作成支援装置
JPH0946689A (ja) * 1995-07-28 1997-02-14 Hitachi Ltd 映像ソフト紹介システムおよび映像ソフト紹介方法
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH10320419A (ja) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> 情報関連づけ装置およびその方法
JPH117452A (ja) * 1997-06-18 1999-01-12 Nippon Telegr & Teleph Corp <Ntt> ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
JP2002092032A (ja) * 2000-09-12 2002-03-29 Nippon Telegr & Teleph Corp <Ntt> 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009294824A (ja) * 2008-06-04 2009-12-17 Sony Corp 情報処理装置および方法、並びにプログラム
JP2011118646A (ja) * 2009-12-03 2011-06-16 Ntt Communications Kk ユーザプロファイル処理装置、ユーザプロファイル処理方法、ユーザプロファイル処理プログラム及び記録媒体
JP2011133926A (ja) * 2009-12-22 2011-07-07 Yahoo Japan Corp 商品検索支援装置、方法及びプログラム
KR20160064576A (ko) * 2014-11-28 2016-06-08 한화테크윈 주식회사 영상 검색 방법 및 장치
KR102392867B1 (ko) * 2014-11-28 2022-04-29 한화테크윈 주식회사 영상 검색 방법 및 장치
JP2020149128A (ja) * 2019-03-11 2020-09-17 ヤフー株式会社 推定装置、推定方法および推定プログラム
JP7080198B2 (ja) 2019-03-11 2022-06-03 ヤフー株式会社 推定装置、推定方法および推定プログラム

Similar Documents

Publication Publication Date Title
US7945864B2 (en) Operation assisting apparatus and operation assisting method
US7725486B2 (en) Information retrieval apparatus
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US8862615B1 (en) Systems and methods for providing information discovery and retrieval
US6556987B1 (en) Automatic text classification system
JP5740814B2 (ja) 情報処理装置および方法
US9213704B2 (en) Dictionary service
JP5161658B2 (ja) キーワード入力支援装置、キーワード入力支援方法及びプログラム
US20090077056A1 (en) Customization of search results
US20090132525A1 (en) Information retrieval apparatus and computer program
CN108475260A (zh) 基于评论的媒体内容项的语言识别的方法、系统和介质
JPWO2010021102A1 (ja) 関連シーン付与装置及び関連シーン付与方法
JP4434972B2 (ja) 情報提供システム、情報提供方法及びそのプログラム
JP2009064391A (ja) キーワード抽出装置、キーワード抽出方法、キーワード抽出プログラム、および、キーワード抽出プログラムを記録した記録媒体
US9832526B2 (en) Smart playback method for TV programs and associated control device
CN112650467B (zh) 语音播放方法及相关装置
JP2007199315A (ja) コンテンツ提供装置
JP2009069874A (ja) コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体
JP2007058562A (ja) コンテンツ分類装置、コンテンツ分類方法、コンテンツ分類プログラムおよび記録媒体
JP2004362121A (ja) 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体
JP2011090463A (ja) 文書検索システム、情報処理装置およびプログラム
US11838597B1 (en) Systems and methods for content discovery by automatic organization of collections or rails
JP2005242720A (ja) データベース検索方法、データベース検索装置およびデータベース検索プログラム
JP2005056154A (ja) 文書検索装置
CN116521925A (zh) 一种视频录播检索回放方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120522