[go: up one dir, main page]

JP4428036B2 - 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法 - Google Patents

情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法 Download PDF

Info

Publication number
JP4428036B2
JP4428036B2 JP2003403146A JP2003403146A JP4428036B2 JP 4428036 B2 JP4428036 B2 JP 4428036B2 JP 2003403146 A JP2003403146 A JP 2003403146A JP 2003403146 A JP2003403146 A JP 2003403146A JP 4428036 B2 JP4428036 B2 JP 4428036B2
Authority
JP
Japan
Prior art keywords
vector
matrix
content
information
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003403146A
Other languages
English (en)
Other versions
JP2005165632A5 (ja
JP2005165632A (ja
Inventor
則行 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003403146A priority Critical patent/JP4428036B2/ja
Priority to US10/987,158 priority patent/US7487151B2/en
Priority to CN2007101400694A priority patent/CN101101560B/zh
Priority to EP04028600A priority patent/EP1550976A3/en
Priority to CNB2004100979672A priority patent/CN100365628C/zh
Priority to EP08100595A priority patent/EP1909203A3/en
Publication of JP2005165632A publication Critical patent/JP2005165632A/ja
Publication of JP2005165632A5 publication Critical patent/JP2005165632A5/ja
Application granted granted Critical
Publication of JP4428036B2 publication Critical patent/JP4428036B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法に関し、特に、コンテンツを推薦する処理等で必要となる類似度演算処理において、適切なユーザの嗜好情報を使用することができる、情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法に関する。
従来、例えば、テレビジョン放送やラジオ放送などにおいて、ユーザに対して番組(コンテンツ)を推薦する場合には、電子番組ガイド(EPG:Electronic Program Guide)などの番組情報(番組メタデータ)を基に、ユーザの嗜好情報にマッチングする番組が選択された。ユーザへの番組の推薦方法は、ユーザの嗜好情報の取得方法によって異なり、様々な方法が知られている。具体的には、例えば、ユーザが過去に視聴した番組の履歴を利用して、番組を推薦する視聴履歴利用方式が知られている。
即ち、視聴履歴利用方式では、ユーザが番組を視聴するたびに、視聴された番組メタデータが蓄積され、ある程度、番組メタデータが蓄積されると、それらの番組メタデータ(或いは、幾つかの番組メタデータに共通する属性を示すデータ等)が、頻度或いはtf/idf法により重み付けされ、重み付けされた各番組メタデータのそれぞれを要素とするベクトル(以下、特徴ベクトルと称する)が生成される。さらに、1以上の特徴ベクトルに基づいてユーザの嗜好を示すベクトル(以下、ユーザ嗜好ベクトルと称する)が生成される。即ち、ユーザ嗜好ベクトルが、聴履歴方式におけるユーザ嗜好情報であるとも言える。そして、推薦候補となる番組に対するコンテンツメタベクトル(その推薦候補に対する番組メタデータの重み付け値等を要素とするベクトル)とユーザ嗜好ベクトルとの類似度が演算され、類似度が高いと演算された場合、その推薦候補が推薦番組としてユーザに提示される。
このような聴履歴利用方式では、聴されたコンテンツ(番組)の種類が増えるに従い(番組メタデータの蓄積数が増えるに従い)、ユーザ嗜好ベクトルの次元数(要素の数)が増大し、演算量が増大してしまう。このため、様々な次元圧縮手法が使われている。
具体的には、例えば、特異値分解(主成分分析)により最適基底(軸)に全ベクトルを射影した後に、次元を削減する手法が知られている(特許文献1、非特許文献1、および、非特許文献2参照)。なお、この手法は、LSI(Latent Semantic Indexing (潜在的インデクシング))法と称されている。
特開2001−155063号公報 Patent : "Computer information retrieval using latent semantic structure". U. S. Patent No. 4,839,853, Jun 13, 1989. Patent : "Computerized cross-language document retrieval using latent semantic indexing". U. S. Patent No. 5,301,109, Apr 5, 1994.
しかしながら、このような従来の聴履歴利用方式において利用されるユーザ嗜好ベクトル(推薦候補との類似度が演算される場合に基準となる基準情報)は、そのユーザにとって適切なベクトルであるとは一概に言えない。このため、そのようなユーザ嗜好ベクトルに基づいて推薦されたコンテンツ(番組)が、ユーザに拒絶されてしまうことが多々あるという課題があった。
本発明は、このような状況に鑑みてなされたものであり、コンテンツを推薦する処理等で必要となる類似度演算処理において、適切なユーザの嗜好情報を使用することができるようにするものである。
本発明の第1の情報処理装置は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、特徴ベクトル化手段により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、行列生成手段により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化手段と、所定のタイミングで個別情報取得手段により取得された個別情報を用いて特徴ベクトル生成し、特徴ベクトルと、基準ベクトル化手段により生成された基準ベクトルとの類似度を演算する類似度演算手段とを備え、類似度演算手段は、基準ベクトル化手段により1以上の基準ベクトルが既に生成されている第1のタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、第1のタイミングの後の第2のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトルを生成し、第2のタイミングで個別情報取得手段により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算することを特徴とする。
個別情報がコンテクスト情報である場合、個別情報に基づく値とは、ユーザの空間的な配置位置を示す場所情報に対して重み付けされた値、または、その値が正規化された値とすることができる。
個別情報がコンテクスト情報である場合、個別情報に基づく値とは、ユーザの情動を示す情動情報に対して重み付けされた値、または、その値が正規化された値とすることができる。
個別情報がコンテクスト情報である場合、個別情報に基づく値とは、ユーザ自身またはユーザの周囲に配置されるセンサが取得した値、または、その値が正規化された値とすることができる。
基準ベクトル化手段は、第2の行列におけるM個の列成分のうちの少なくとも一部分を選択し、選択した列成分の対応する要素同士を加算することで基準ベクトルを生成することができる。
基準ベクトル化手段は、第2の行列におけるM個の列成分の中から、コンテクスト情報に対応する要素同士の類似度が高い列成分を選択し、選択した列成分の対応する要素同士を加算することで基準ベクトルを生成するようにすることができる。
基準ベクトル化手段は、第1の行列におけるM個の列成分の中から、コンテクスト情報に対応する要素同士の類似度が高い列成分を選択し、さらに、第1の行列のうちの選択した列成分に対応する列成分を第2の行列から選択し、第2の行列のうちの選択した列成分の対応する要素同士を加算することで基準ベクトルを生成することができる。
基準ベクトル化手段は、行列生成手段により生成された第2の行列におけるM個の列成分のそれぞれをそのまま基準ベクトルとして採用することで、基準ベクトルを生成することができる。
個別情報がコンテンツメタ情報である場合、個別情報に基づく値とは、コンテンツ内での登場頻度、または、その登場頻度が正規化された値とすることができる。
特徴ベクトルの要素に代入される個別情報に基づく値とは、個別情報の値、若しくは、個別情報の内容に対して重み付けされた値、又は、それらの値が正規化された値に対して、可変係数が乗算された値とすることができる。
類似度演算手段は、新なコンテンツについてのコンテンツメタ情報が個別情報取得手段により取得された場合、コンテンツメタ情報を用いて特徴ベクトルを生成し、特徴ベクトルと特定コンテクスト基準ベクトルとの類似度を演算し、類似度演算手段により演算された類似度が閾値以上である場合、新たなコンテンツを推薦コンテンツとしてユーザに提示する提示手段をさらに設けることができる。
提示手段は、推薦コンテンツをユーザに提示する場合、さらに、特定コンテクスト基準ベクトルに基づいて、その推薦の理由を提示することができる。
行列生成手段は、第1の行列を、特異値分解により、N行N列の第1の成分行列、N行M列の第2の成分行列、および、M行M列の第3の成分行列の転置行列の積に分解し、第1の成分行列からN行K列(Kは、前記第1の行列のランクより小さい整数値)の第4の成分行列を生成し、第2の成分行列からK行K列の第5の成分行列を生成し、第3の成分行列からM行K列の第6の成分行列を生成し、第4の成分行列、第5の成分行列、および、第6の成分行列の転置行列の積を第2の行列として生成することができる。
類似度演算手段は、さらに、現状コンテクスト特徴ベクトルベクトルと1以上の基準ベクトルとのそれぞれに対して、第4の成分行列の転置行列を左から掛けることで、K次元に次元削減された比較ベクトルと1以上の基準ベクトルとのそれぞれを生成し、K次元に次元削減された、現状コンテクスト特徴ベクトルと基準ベクトルとの類似度を演算し、その演算結果に基づいて、K次元の特定コンテクスト基準ベクトルを設定し、第2のタイミングで生成された特徴ベクトルに対して第4の成分行列の転置行列を左から掛けることで、K次元に次元削減された特徴ベクトルをさらに生成し、K次元に次元削減された、特定コンテクスト基準ベクトルと特徴ベクトルとの類似度を演算することができる。
ベクトル特徴化手段は、1つの特徴ベクトルを生成する毎に、その特徴ベクトルを、ユーザの嗜好の正の要因を示す正特徴ベクトルと、ユーザの嗜好の負の要因を示す負特徴ベクトルのうちのいずれか一方に分類することができる。
行列生成手段は、特徴ベクトル化手段により生成されたM個の正特徴ベクトルを利用して第2の行列を生成することができる。
行列生成手段により生成された第2の行列の各列成分のそれぞれを訓練データとして分類学習することで分類器を生成する学習手段と、新たなコンテンツについてのコンテンツメタ情報が個別情報取得手段により取得された場合、コンテンツメタ情報を用いて特徴ベクトルを生成し、学習手段により生成された分類器を用いて、特徴ベクトルを、正特徴ベクトルと負特徴ベクトルとのうちのいずれか一方に分類する分類手段とをさらに設けることができる。
類似度演算手段は、分類手段により正特徴ベクトルであると分類された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算することができる。
行列生成手段により生成された第2の行列の各列成分の各要素の中から所定の要素を選択し、選択した要素を特定可能な単語をユーザの興味語または非興味語として設定し、ユーザの個人辞書に登録する登録手段をさらに設けることができる。
行列生成手段は、特徴ベクトル化手段によりM個の負特徴ベクトルが生成された場合、さらに、M個の負特徴ベクトルを利用して第2の行列を生成し、基準ベクトル化手段は、行列生成手段によりM個の正特徴ベクトに基づいて生成された第2の行列から第1の基準ベクトルを生成するとともに、行列生成手段により負特徴ベクトに基づいて生成された第2の行列から第2の基準ベクトルを生成し、類似度演算手段は、第2のタイミングで生成された特徴ベクトルと、1以上の第1の基準ベクトルに基づいて生成された特定コンテクスト基準ベクトルとの間の第1の類似度と、第2のタイミングで生成された特徴ベクトルと、1以上の第2の基準ベクトルに基づいて生成された特定コンテクスト基準ベクトルとの間の第2の類似度とのそれぞれを演算することができる。
類似度演算手段は、第2のタイミングで新なコンテンツについてのコンテンツメタ情報が個別情報取得手段により取得された場合、コンテンツメタ情報を用いて特徴ベクトルを取得し、特徴ベクトルについての第1の類似度と第2の類似度とのそれぞれを演算し、
類似度演算手段により演算された第1の類似度と第2の類似度に基づいて、新たなコンテンツが推薦コンテンツとして適しているか不適であるかを判定し、新たなコンテンツが推薦コンテンツとして適していると判定した場合、新たなコンテンツを推薦コンテンツとしてユーザに提示する提示手段をさらに設けることができる。
提示手段は、推薦コンテンツをユーザに提示する場合、さらに、基準ベクトルに基づいて、その推薦の理由を提示することができる。
提示手段は、第1の類似度が第1の閾値以上であり、かつ、第2の類似度が第2の閾値未満である場合、新たなコンテンツが推薦コンテンツとして適していると判定し、新たなコンテンツを推薦コンテンツとしてユーザに提示することができる。
提示手段は、第1の類似度が第2の類似度より大きく、かつ、第2の類似度が閾値未満である場合、新たなコンテンツが推薦コンテンツとして適していると判定し、新たなコンテンツを推薦コンテンツとして前記ユーザに提示することができる。
本発明の第1の情報処理方法は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段を備える情報処理装置が、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、所定のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトル生成し、特徴ベクトルと、基準ベクトル化ステップの処理により生成された基準ベクトルとの類似度を演算する類似度演算ステップとを含み、類似度演算ステップは、基準ベクトル化ステップの1以上の処理により1以上の基準ベクトルが既に生成されている第1のタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成するステップと、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定するステップと、第1のタイミングの後の第2のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトルを生成するステップと、第2のタイミングで個別情報取得ステップの処理により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算するステップとを含むことを特徴とする。
本発明の第1のプログラムは、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段を備える装置を制御するコンピュータに実行させるプログラムであって、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、所定のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトル生成し、特徴ベクトルと、基準ベクトル化ステップの処理により生成された基準ベクトルとの類似度を演算する類似度演算ステップとを含み、類似度演算ステップは、基準ベクトル化ステップの1以上の処理により1以上の基準ベクトルが既に生成されている第1のタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成するステップと、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定するステップと、第1のタイミングの後の第2のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトルを生成するステップと、第2のタイミングで個別情報取得ステップの処理により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算するステップとを含むことを特徴とする。
本発明の第1の情報処理装置および方法、並びに、第1のプログラムにおいては、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とが、それぞれ個別情報として取得され、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が取得された場合には個別情報に基づく値が代入され、取得されないには所定値が代入されることによって構成されるベクトルが、特徴ベクトルとして生成する処理がユーザがコンテンツを使用する毎に実行される。そして、生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列が生成され、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算が第1の行列に対して施されることで、N×M個の行列要素のうちの少なくとも一部の内容が更新された第2の行列が生成され、生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルが、基準ベクトルとして生成される。そして、所定のタイミングで取得された個別情報を用いて特徴ベクトル生成され、特徴ベクトルと基準ベクトルとの類似度が演算される。そして、1以上の基準ベクトルが既に生成されている第1のタイミングで、取得されたコンテクスト情報を用いて、特徴ベクトルが、現状コンテクスト特徴ベクトルとして生成され、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度が演算される。そして、類似度が最も高い基準ベクトルが、特定コンテクスト基準ベクトルとして設定され、第1のタイミングの後の第2のタイミングで取得された個別情報を用いて、特徴ベクトルが生成される。そして、第2のタイミングで取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度が演算される。
本発明の第2の情報処理装置は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、特徴ベクトル化手段により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、行列生成手段により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル手段と、基準ベクトル手段により1つの基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補を取得する候補取得手段と、基準ベクトル化手段により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算手段と、候補取得手段により事前に取得されたコンテンツの候補のうちの、類似度演算手段により設定された特定コンテクスト基準ベクトルに基づいて取得されたコンテンツの候補を、推薦コンテンツとしてユーザに提示する提示手段とを備えることを特徴とする。
本発明の第2の情報処理方法は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える情報処理装置が、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、基準ベクトルステップの処理により1つの基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補をコンテンツ取得手段により取得させる候補取得ステップと、基準ベクトル化ステップの処理により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、候補取得ステップの処理により事前に取得されたコンテンツの候補のうちの、類似度演算ステップの処理により設定された特定コンテクスト基準ベクトルに基づいて取得されたコンテンツの候補を、推薦コンテンツとしてユーザに提示手段により提示させる提示ステップとを含むことを特徴とする情報処理方法。
本発明の第2のプログラムは、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える装置を制御するコンピュータに実行させるプログラムであって、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、基準ベクトルステップの処理により1つの基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補をコンテンツ取得手段により取得させる候補取得ステップと、基準ベクトル化ステップの処理により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、候補取得ステップの処理により事前に取得されたコンテンツの候補のうちの、類似度演算ステップの処理により設定された特定コンテクスト基準ベクトルに基づいて取得されたコンテンツの候補を、推薦コンテンツとしてユーザに提示手段により提示させる提示ステップとを含むことを特徴とする。
本発明の第2の情報処理装置および方法、並びに、第2のプログラムにおいては、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とが、それぞれ個別情報として取得され、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が取得された場合には個別情報に基づく値が代入され、取得されない場合には所定値が代入することによって構成されるベクトルが、特徴ベクトルとして生成する処理がユーザがコンテンツを使用する毎に実行される。生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列が生成され、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施されて、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列が生成される。さらに、第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルが、基準ベクトルとして生成される。このようにして、1つの基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補が取得される。そして、1以上の基準ベクトルが既に生成されているタイミングで、取得されたコンテクスト情報を用いて、特徴ベクトルが、現状コンテクスト特徴ベクトルとして生成され、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度が演算され、類似度が最も高い基準ベクトルが、特定コンテクスト基準ベクトルとして設定される。そして、事前に取得されたコンテンツの候補のうちの、設定された特定コンテクスト基準ベクトルに基づいて取得されたコンテンツの候補が、推薦コンテンツとしてユーザに提示される。
本発明の第3の情報処理装置は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、特徴ベクトル化手段により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、行列生成手段により生成された第2の行列におけるM個の列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定手段と、行列生成手段により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化手段と、基準ベクトル化手段により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算手段と、類似度演算手段により設定された特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、ジャンル設定手段により設定された複数のジャンルのうちの何れか1つに分類する分類手段と、分類手段により特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された候補を、推薦コンテンツとしてユーザに提示する提示手段とを備えることを特徴とする。
ジャンル設定手段は、設定したジャンル毎に、対応するジャンルに属する列成分のそれぞれを訓練データとして分類学習することで分類器を生成することができ、また、ジャンル設定手段により生成された分類器を用いて、特定コンテクスト基準ベクトル及び複数の候補の各々のジャンルを分類することができる。
ジャンル設定手段は、1つのジャンルを設定する毎に、そのジャンルに属する列成分の各要素の中から所定の要素を選択し、選択した要素に基づいてそのジャンルの名称を決定することができる。
本発明の第3の情報処理方法は、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える情報処理装置が、
コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、基準ベクトル化ステップの処理により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、類似度演算ステップにより設定された特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、ジャンル設定ステップの処理により設定された複数のジャンルのうちの何れか1つに分類する分類ステップと、分類ステップの処理により特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された候補を、推薦コンテンツとしてユーザに提示する提示ステップとを含むことを特徴とする。
本発明の第3のプログラムは、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える装置を制御するコンピュータに実行させるプログラムであって、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、
行列生成ステップの処理により生成された第2の行列におけるM個の列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、基準ベクトル化ステップの処理により1以上の基準ベクトルが既に生成されているタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、類似度演算ステップにより設定された特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、ジャンル設定ステップの処理により設定された複数のジャンルのうちの何れか1つに分類する分類ステップと、分類ステップの処理により特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された候補を、推薦コンテンツとしてユーザに提示する提示ステップとを含むことを特徴とする。
本発明の第3の情報処理装置および方法、並びに、第3のプログラムにおいては、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とが、それぞれ個別情報として取得され、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が取得された場合には個別情報に基づく値が代入され、取得されない場合には所定値を代入することによって構成されるベクトルが、特徴ベクトルとして生成する処理がユーザがコンテンツを使用する毎に実行される。生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列が生成され、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算が第1の行列に対して施されて、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列が生成される。さらに、第2の行列におけるM個の列成分のそれぞれの間の類似度が演算され、それらの類似度に基づいてM個の列成分のそれぞれがクラス分類され、その結果得られる各クラスのそれぞれが1つのジャンルとして設定される。そして、生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルが、基準ベクトルとして生成され、1以上の基準ベクトルが既に生成されているタイミングで、取得されたコンテクスト情報を用いて、特徴ベクトルが、現状コンテクスト特徴ベクトルとして生成され、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度が演算され、類似度が最も高い基準ベクトルが、特定コンテクスト基準ベクトルとして設定される。そして、設定された特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々が、設定された複数のジャンルのうちの何れか1つに分類され、特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された候補が、推薦コンテンツとしてユーザに提示される。
本発明の情報処理システムは、サーバと、ユーザが使用するクライアントとからなる情報処理システムであって、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、特徴ベクトル化手段により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、行列生成手段により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトル手段と、所定のタイミングで個別情報取得手段により取得された個別情報を用いて特徴ベクトルを生成し、特徴ベクトルと、基準ベクトル手段により生成された基準ベクトルとの類似度を演算する類似度演算手段とを備え、類似度演算手段は、基準ベクトル化手段により1以上の基準ベクトルが既に生成されている第1のタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、第1のタイミングの後の第2のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトルを生成し、第2のタイミングで個別情報取得手段により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算し、サーバは、特徴ベクトル化手段、行列生成手段、基準ベクトル手段、および、類似度演算手段のうちの、少なくとも行列生成手段を備えることを特徴とする。
本発明の第4の情報処理方法は、サーバと、ユーザが使用するクライアントとからなる情報処理システムの情報処理方法であって、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段をサーバ又はクライアントが備え、コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が個別情報取得手段により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、特徴ベクトル化ステップの処理により、生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、行列生成ステップの処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、所定のタイミングで個別情報取得手段により取得された個別情報を用いて特徴ベクトルを生成し、特徴ベクトルと、基準ベクトルステップの処理により生成された基準ベクトルとの類似度を演算する類似度演算ステップとを含み、類似度演算ステップは、基準ベクトル化ステップの処理により1以上の基準ベクトルが既に生成されている第1のタイミングで、個別情報取得手段により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、第1のタイミングの後の第2のタイミングで個別情報取得手段により取得された個別情報を用いて、特徴ベクトルを生成し、第2のタイミングで個別情報取得手段により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算し、サーバは、特徴ベクトル化ステップ、行列生成ステップ、基準ベクトルステップ、および、類似度演算ステップのうちの、少なくとも行列生成ステップの処理を実行することを特徴とする。
本発明の情報処理システムおよび方法においては、サーバとクライアントとにより次の第1の処理乃至第の処理が少なくとも実行される。即ち、コンテンツ全体若しくはその一部分またはコンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する第1の処理と、
コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、N個の要素のそれぞれに、対応する種類の個別情報が第1の処理により取得された場合には個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理をユーザがコンテンツを使用する毎に実行するの処理と、
第2の処理により生成されたM個の特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を第1の行列に対して施すことで、N×M個の行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する第の処理と、
の処理により生成された第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる標準形のベクトルを、基準ベクトルとして生成する第の処理と、
所定のタイミングで第1の処理により取得された個別情報を用いて特徴ベクトルを生成し、特徴ベクトルと、第の処理により生成された基準ベクトルとの類似度を演算する第の処理である。第5の処理は、第4の処理により1以上の基準ベクトルが既に生成されている第1のタイミングで、第1の処理により取得されたコンテクスト情報を用いて、特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、現状コンテクスト特徴ベクトルと、既に生成されている1以上の基準ベクトルとの類似度を演算し、類似度が最も高い基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、第1のタイミングの後の第2のタイミングで第1の処理により取得された個別情報を用いて、特徴ベクトルを生成し、第2のタイミングで第1の処理により取得された個別情報を用いて生成された特徴ベクトルと、特定コンテクスト基準ベクトルとの類似度を演算する。
以上のごとく、本発明によれば、推薦コンテンツをユーザに提示することができる。特に、推薦コンテンツをユーザに提示する処理等で必要となる類似度演算処理において、適切なユーザの嗜好情報を使用することができる。
次に、図面を参照して、本発明の実施の形態について説明する。
なお、後述するように、本発明は様々な実施の形態を取ることが可能であり、以下、これらの様々な実施の形態のうちの、主要な5つの実施の形態について主に説明する。そこで、以下、これらの5つの実施の形態のそれぞれを第1実施形態乃至第5実施形態のそれぞれと称し、その順番で個別に順次説明していく。また、第1実施形態乃至第5実施形態以外の実施の形態については、他の実施形態と称し、最後(第5実施形態の説明後)に説明する。
(第1実施形態)
はじめに、図1乃至図17を参照して、第1実施形態について説明する。
図1は、第1実施形態の情報処理装置の構成例を表している。
図1に示されるように、第1実施形態の情報処理装置は、メタ情報取得部1、空間およびUPV生成部2(UPVは上述したユーザ嗜好ベクトルの別称)、マッチング部3、CCV記憶部4(CCVは上述した特徴ベクトルの別称)、成分行列記憶部5、UPV記憶部6、語彙辞書作成部7、関連情報取得部8、および、推薦提示部9から構成される。
なお、入力部41とセンサ42は、情報処理装置の一構成要素と捉えてもよいし、情報処理装置に接続されている外部機器と捉えてもよい。
また、メタ情報取得部1乃至推薦提示部9のそれぞれの形態は特に限定されない。特に、メタ情報取得部1、空間およびUPV生成部2、マッチング部3、語彙辞書作成部7、関連情報取得部8、および、推薦提示部9のそれぞれは、ソフトウエアで構成されてもよいし、ハードウエアで構成されてもよいし、或いは、ソフトウエアとハードウエアの組合せとして構成されてもよい。
メタ情報取得部1は、文書取得部11、文書解析部12、メタデータ取得部13、および、コンテクスト取得部14から構成される。
図1に示されるように、メタ情報取得部1には、コンテンツデータやEPGデータが入力される。このコンテンツデータは、ユーザが使用(聴または経験等)した或いはこれから使用するコンテンツのデータであれば特に限定されない。なお、ここでいうコンテンツとは、一般的にコンテンツと称されている、上述したテレビジョン放送番組、映画、写真、楽曲等(動画像、静止画像、若しくは音声、または、それらの組合せ等)の他、さらに、文書、商品(物品含)、会話等のユーザが使用可能なソフトウエアまたはハードウエアの全てを指す広い概念である。ただし、コンテンツが物品(ハードウエア)の場合、例えば、その物品が動画像や静止画像等に射影されてデータ化されたものが、コンテンツデータとして適用される。
文書取得部11は、供給されたコンテンツデータやEPGデータのうちの文書データ、例えば、図示せぬ電子メール閲覧ソフトウエアから供給された電子メールのテキストデータを取得し、文書解析部12に供給する。
文書解析部12は、供給された文書データを所定の単位(例えば、1文章や1段落等)で区分し、区分した文書データ毎にその内容(文書)を解析して、単語のデータ(後述する図5に示される“幼稚園”や“子供”等の単語のデータ)に分解し、空間およびUPV生成部2、またはマッチング部3に供給する。
メタデータ取得部13は、供給されたコンテンツデータやEPGデータのうちの文書データ以外のデータを分析し、単語のデータに分解し、或いは、単語のデータを新たに生成し、空間およびUPV生成部2、またはマッチング部3に供給する。また、メタデータ取得部13は、EPGデータ等に含まれる既に単語化されているデータも抽出し、空間およびUPV生成部2、またはマッチング部3にそのまま供給する。
なお、以下、文書解析部12またはメタデータ取得部13から出力される単語のデータを、後述するコンテクスト取得部14から出力されるデータと区別するために、コンテンツメタ情報と称する。即ち、本明細書において、コンテンツとは、上述したように、一般的なコンテンツ以外に、ユーザの私的な文書(例えば、後述するメール文書)等も指す。従って、本明細書において、コンテンツメタ情報とは、番組メタ情報等の一般的なメタ情報を単に指すのではなく、本明細書で言うコンテンツ(幅広い概念のコンテンツ)自身若しくはその一部分、またはそのコンテンツの属性等が単語化された情報(数値も単語化された情報の1つとして捉える)を指す。
ところで、上述した従来の課題が発生する主要因、即ち、推薦コンテンツがユーザの嗜好に合っているにも拘らず、その推薦コンテンツがユーザにより拒絶されてしまう主要因は、ユーザの現状のコンテクストにそぐわないコンテンツが推薦されてしまうことである。即ち、単に、ユーザが経験済みのコンテンツに対するコンテンツメタ情報のみに基づいて推薦されたコンテンツでは、ユーザの現状のコンテクストにそぐわない可能性がある。
なお、本明細書においては、コンテクスト(context)とは、ユーザの内的状態および外的状態の全てを指す。ユーザの内的状態とは、ユーザの体調、または、情動(気分や心理状態)等を指す。また、ユーザの外的状態とは、ユーザの空間的または時間的な配置位置(時間的な配置位置とは、例えば、現在時刻を指す)の他、ユーザの周囲の空間方向若しくは時間方向に分布する(または、いずれの方向にも分布する)所定の状態も指す。
しかしながら、従来、これらのコンテクストを示す情報(以下、コンテクスト情報と称する)がコンテンツ推薦に利用される例は非常に少ない。詳細には、従来、外的コンテクストについては時間情報や場所情報が利用される程度であり、内的コンテクストについてはユーザの手動入力による気分等が利用される程度であり、その結果、コンテンツ推薦自体もそれらのコンテクスト情報のうちの1つに見合うコンテンツが推薦される程度である。
即ち、従来においては、コンテンツメタ情報と、コンテクスト情報とは別なものとして取り扱われており、コンテンツメタ情報(コンテンツメタ情報に基づいて得られる推薦コンテンツ)と、コンテクスト(気分感情)との結びつけルールをサービスサイド側で予め生成しておく必要があった。従って、コンテクスト情報とコンテンツメタ情報とを別なものとして取り扱う従来のコンテンツ推薦手法では、変化に対応できず、提示された推薦コンテンツがユーザに拒絶されてしまうことが多々あった。即ち、このような従来のコンテンツ推薦手法では、従来の課題を解決することは困難である。さらに、このような従来のコンテンツ推薦手法では、上述したルール作りがサービス側で必須であり、サービス側に多大な労力がかかるという新たな課題も発生してしまう。
なお、多種センサから複数のコンテクスト情報がたとえ得られる場合であっても、従来、その解釈は最終的にはルールベースによることになり(たとえ統計処理などで事前に意味づけされていても)、複数のコンテクスト情報も非常に限定された情報(予め定められた情報のうちのいずれか)に帰着し、固定化されてしまう。即ち、結局、このような場合であっても、従来の課題を解決することは困難であり、また、上述した新たな課題も同様に発生してしまうことになる。
そこで、これらの課題を解決するために、本発明(ここでは、第1実施形態)においては、コンテクスト情報とコンテンツメタ情報とのいずれも同レベルで取り扱う。このため、メタ情報取得部1には、コンテンツメタ情報を取得する上述したブロック(文書取得部11、文書解析部12、および、メタデータ取得部13)の他にさらに、コンテクスト取得部14が設けられている。
即ち、コンテクスト取得部14は、入力部41またはセンサ42から入力される情報(必要に応じて変換した情報)をコンテクスト情報として、空間およびUPV生成部2、またはマッチング部3に供給する。
詳細には、例えば、入力部41は、キーボード、マウス、その他入力インタフェースで構成され、ユーザは入力部41を操作することで、様々なコンテクストをコンテクスト取得部14に入力させる。
すると、コンテクスト取得部14は、入力部41から入力されたコンテクストを解析して単語化し、この単語のデータをコンテクスト情報として、空間およびUPV生成部2、またはマッチング部3に供給する。
具体的には、例えば、情報処理装置は、図1には図示せぬ表示部(後述する図34の表示部424等)に、図2に示されるような選択型入力ユーザインタフェース用の画像を表示させることができる。そして、情報処理装置は、ユーザに入力部41を操作させて、図2の画像の「コンテクスト選択」の下方のボックスの中から、ユーザの現状のコンテクストに適合する単語を選択させることで、その単語をコンテクスト取得部14に入力させることができる。
より具体的には、例えば、図2の例では、ユーザの外的コンテクストを示す単語として、「Place(ユーザが対象コンテンツを使用した場所)」を示す単語(図2の例では、“会社”)と、「Occasion(ユーザが対象コンテンツを使用した機会(状態))」を示す単語(図2の例では、“仕事中”)とが、ユーザの判断で(入力部41から)入力される。
また、例えば、図2の例では、ユーザの内的コンテクストを示す単語して、「Mental(ユーザが対象コンテンツを使用した際の心理状態)」を示す単語(図2の例では、“新鮮”)、「Emotional(ユーザが対象コンテンツを使用した際の感情)」を示す単語(図2の例では、“楽しい”)、および、「Rating(ユーザが対象コンテンツを使用した際の評価)を示す単語(図2の例では、“重要”)が、ユーザの判断で(入力部41から)入力される。
このように、図2の例では、既に単語化されたデータが図1のコンテクスト取得部14に入力されるので、コンテクスト取得部14は、入力された単語のデータをそのままコンテクスト情報として、空間およびUPV生成部2、またはマッチング部3に供給する。
また、例えば、センサ42は、ユーザの外的コンテクストを検出するセンサや、その内的コンテクストを検出するセンサとして構成される。即ち、センサ42とは、1つのコンテクストを検出するセンサのみならず、2以上のコンテクストを検出可能な1つのセンサや、2以上のセンサ(検出可能なコンテクストの種類や数は限定されない)からなるセンサ群も指す。具体的には、例えば、外的コンテクストを検出するセンサとしては、ユーザの現在位置情報を検出するGPS(Global Positioning System)、現在時刻を計時(検出)する時計、または、ユーザの周辺に位置する人や物体を検出する無線通信機器等が挙げられる。また、例えば、内的コンテクストを検出するセンサとしては、脈拍、呼吸数、発汗、または、瞳孔の開き等を検出するセンサが挙げられる。
コンテクスト取得部14は、このようなセンサ42から入力された情報が数値データであった場合、その数値データ(数値を所定の規則で更新する場合もある)をコンテクスト情報として、空間およびUPV生成部2、またはマッチング部3に供給する。また、コンテクスト取得部14は、センサ42から入力された情報が数値データ以外の情報であった場合、その情報を解析して単語化し(数値も単語に含まれる)、この単語のデータをコンテクスト情報として、空間およびUPV生成部2、またはマッチング部3に供給する。
次に、空間およびUPV生成部2に着目すると、空間およびUPV生成部2は、特徴ベクトル(CCV)生成部21、行列演算部(空間生成部)22、および、ユーザ嗜好ベクトル(UPV)生成部23から構成される。
特徴ベクトル(CCV)生成部21は、メタ情報取得部1より供給された、1つのコンテンツに対する1以上のコンテンツメタ情報と1以上のコンテクスト情報とを要素とするベクトルを生成する。特徴ベクトル(CCV)生成部21により生成されるこのようなベクトルは、ユーザの嗜好の特徴、即ち、ユーザが体験したコンテンツの特徴や、そのコンテンツを体験した際のユーザのコンテクストの特徴を示すベクトルと言える。従って、以下、特徴ベクトル(CCV)生成部21により生成されるこのようなベクトルを、特徴ベクトルCCVと称する。
なお、後述するように、特徴ベクトルCCVは、マッチング部3等により生成されることもある。
また、特徴ベクトルCCVの形態は特に限定されないが、ここでは、次元数(要素数)が決められており、また、各次元のそれぞれに対応する情報(コンテンツメタ情報またはコンテクスト情報)も決められているとする。即ち、ここでは、特徴ベクトルCCVの要素数は固定され、各要素のそれぞれが示す情報とその順番も固定されているとする(なお、以下、このようなベクトル形態を標準形と称する)。なお、特徴ベクトルCCVの具体例については、図5等を参照して後述する。
このとき、特徴ベクトル(CCV)生成部21は、メタ情報取得部1より供給された、1つのコンテンツに対するコンテンツメタ情報とコンテクスト情報(数値を含む単語のデータ)のそれぞれに対して、例えば、頻度やtf法などの重み付け手法を利用して重み値を与え、その重み値を特徴ベクトルCCVの対応する要素に代入することで、1つの特徴ベクトルCCVを生成する。ただし、メタ情報取得部1より供給された、1つのコンテンツに対するコンテンツメタ情報とコンテクスト情報(数値を含む単語のデータ)の中に、特徴ベクトルCCVの所定の要素に対応付けられている情報が含まれていない場合、即ち、特徴ベクトルCCVの所定の要素に入れるべき重み値が存在しない場合、その要素には「0」が代入される。
なお、頻度を利用して重み付けを行う場合、重み値として、例えば、頻度そのものを適用してもよいし、その頻度を正規化した値等、所定の規則で頻度を変換した値を適用してもよい。
また、コンテクスト情報として、センサ42(周辺センサや人体センサ、或いはそれらの組み合わせ)により取得された値(実数値)が供給されてきた場合、重み値として、例えば、その値そのものを適用してもよいし、その値を正規化した値等、所定の規則でその値を変換した値を適用してもよい。同様に、コンテクスト情報として、入力部41により入力された単語データ等が供給されてきた場合、重み値として、例えば、その単語データを第1の規則で重み付けした第1の値を適用してもよいし、第1の値を正規化した値等、第1の値を第2の規則で変換した第2の値を適用してもよい。
さらに、例えば、コンテンツメタ情報の重み値と、コンテクスト情報の重み値とのそれぞれに対して可変係数のそれぞれを掛けた値を、最終的な重み値として適用することもできる。この場合、可変係数を単に変えることで、必要な重み値だけを容易に調整することが可能となる(例えば、後述する図4のステップS26参照)。
このように、ユーザが1つのコンテンツを使用する毎に、そのコンテンツに対する予め設定されたN個(Nは、2以上の任意の整数値)の個別情報(コンテンツメタ情報またはコンテクスト情報)から構成される情報群が、メタ情報取得部1から特徴ベクトル(CCV)生成部21に供給される。ただし、所定のコンテンツに対して、N個の個別情報の中に特に内容が無い個別情報(メタ情報取得部1が取得しなかった個別情報)が存在する場合、その個別情報は「0」であると捉える。すると、特徴ベクトル(CCV)生成部21は、供給された情報群を構成するN個の個別情報のそれぞれの内容に対して重み付けし(数値化し)、重み付けされたN個の個別情報(N個の数値)を要素とする特徴ベクトルCCVを生成する。
このようにして生成された、所定のコンテンツおよびそのコンテンツを使用した際のコンテクストに対する特徴ベクトルCCVは、CCV記憶部4に記憶される。即ち、ユーザが1つのコンテンツを使用する毎に、それに対する特徴ベクトルCCVが特徴ベクトル(CCV)生成部21により生成され、CCV記憶部4に蓄積されていく。
ここで、注目すべき点は、このようにしてCCV記憶部4に記憶される特徴ベクトルCCVにおいては、いずれのコンテクスト情報も、また、いずれのコンテンツメタ情報も、ベクトルの1つの要素として同レベルで扱われる点である。さらに、コンテクスト情報の個数、即ち、特徴ベクトルCCVの要素のうちのコンテクスト情報に対応する要素の数も1個に限定されず、複数個でよいと言う点である。そして、後述するように、このような特徴ベクトルCCVに基づいて推薦されたコンテンツは、上述した従来のコンテンツ推薦手法により推薦されたコンテンツと比較して、ユーザに拒絶される可能性が低くなると言う点である。
このような特徴ベクトルCCVがCCV記憶部4にM個(Mは2以上の整数値)蓄積されると、行列演算部(空間生成部)22は、これらのM個の特徴ベクトルCCVを列成分とする行列、即ち、N行M列の行列を生成する。このようにして生成された行列は、特徴ベクトルCCVの集合体、即ち、ユーザが嗜好する(経験した)コンテンツ自身やその属性を示すコンテンツメタ情報と、そのコンテンツを経験した時点のユーザのコンテクストを示すコンテクスト情報の集合体であると言える。そこで、以下、行列演算部(空間生成部)22により生成されるこのような行列を、後述する他の行列と区別するために、コンテンツコンテクスト行列と称する。ただし、以下、コンテンツコンテクスト行列を、単に行列CCMと記述して説明していく。
次に、行列演算部(空間生成部)22は、例えば、行列CCMに対して特異値分解と次元削減を施すことで、即ち、上述したLSI法を適用することで、行列CCM内の各要素(ユーザが経験したコンテンツ自身やその属性を示すコンテンツメタ情報と、そのコンテンツを経験した時点のユーザのコンテクストを示すコンテクスト情報)のそれぞれを主成分軸に射影する。
なお、以下、このとき得られる行列(行列CCMが次元削減された行列)を、行列CCMの近似行列と称する。ただし、以下、行列CCMの近似行列を、単に近似行列CCMと記述して説明していく。また、各要素が射影された空間を、最適空間UPSと称する。
詳細には、行列演算部(空間生成部)22は、N行M列の行列CCMに対して特異値分解を施すことで、行列CCMを次の式(1)を満たす成分行列U,Σ,Vのそれぞれに分解する。なお、式(1)において、行列Dは行列CCMを示している。成分行列UはN行N列の左特異ベクトルを、成分行列VはM行M列の右特異ベクトルを、成分行列ΣはN行M列の特異行列を、それぞれ示している。また、V~は成分行列Vの転置行列を示している。
D(=CCM) = UΣV~ ・・・(1)
ここで、行列CCMのランクをr(rは、N,M以下の整数値)とすると、成分行列Σは、r個の特異値が対角線上の要素として並び、他の要素は全て0の行列となる。また、成分行列Uの最初のr個の列成分(左特異ベクトル)が正規直交基底であり、左から順に重要な列成分であるので、k個(kは、rより小さい整数値)の左特異ベクトルを使って特徴ベクトルCCVを表現する(射影する)ことで最良の近似ができる。
そこで、行列演算部(空間生成部)22は、成分行列Uの先頭のk個の列成分(左特異ベクトル)からなる行列(以下、Ukと記述する)、即ち、N行k列の行列Ukを生成する(後述する図8参照)。
なお、後述するように、所定の特徴ベクトルCCV(N次元)に対して、この行列Ukの転置行列を左から掛けることで、k次元に次元削減された特徴ベクトルCCV(特徴ベクトルCCVの近似ベクトル)を生成することができる。即ち、特徴ベクトルCCVをk次元の最適空間UPSに射影することができる。従って、行列演算部(空間生成部)22は、このような行列Ukを生成することで、最適空間UPSを生成しているとも言える。
また、行列演算部(空間生成部)22は、成分行列Vについても同様に、最初のk 個の右特異ベクトルを用いるとして、成分行列Vの先頭のk個の列成分(右特異ベクトル)からなる行列(以下、Vkと称する)、即ち、M行k列の行列Vkを生成する(後述する図10参照)。
さらに、行列演算部(空間生成部)22は、成分行列Σの先頭のk個の列成分のうちの1行乃至k行までの要素(成分行列Σのうちの、k×k個の要素からなる左上成分)からなる行列(以下、Σkと称する)、即ち、k行k列の行列Σkを生成する(後述する図9参照)。
そして、行列演算部(空間生成部)22は、次の式(2)の右辺を演算することで、ランクがkに縮退した行列Dkを求め、この行列Dkを、行列CCMの近似行列CCMとしてユーザ嗜好ベクトル(UPV)生成部23に供給する。なお、式(2)において、Vk~は成分行列Vkの転置行列を示している。
Dk(=CCM)= UkΣkVk~ ・・・(2)
また、近似行列CCM(=Dk)の成分行列、即ち、上述したようにして生成された行列Uk(必要に応じて、行列Vkと行列Σk)は、語彙辞書作成部7に供給されるとともに、成分行列記憶部5に記憶される。
なお、第1実施形態においては、後述するように、成分行列Ukはマッチング部3に使用されないので、第1実施形態の情報処理装置にとっては、成分行列記憶部5は必須な構成要素ではない。これに対して、後述するように、第2実施形態においては、成分行列Ukは、射影マッチング部101(図18)により使用されるので、第2実施形態の情報処理装置にとっては、成分行列記憶部5は必須な構成要素となる。
ユーザ嗜好ベクトル(UPV)生成部23は、行列演算部(空間生成部)22より供給された近似行列CCMにおけるM個の列成分、即ち、M個の特徴ベクトル(ただし、上述した特徴ベクトルCCVと区別するために、近似行列CCMの列成分である特徴ベクトルを、以下、特徴ベクトルCCVと記述する)に基づいて、N個の要素からなる標準形のベクトルを生成する。ユーザ嗜好ベクトル(UPV)生成部23により生成されるこのベクトルは、後述するマッチング部3や推薦提示部9によってコンテンツの推薦処理が実行される際、ユーザの嗜好を示す基準のベクトルとして使用される。従って、以下、ユーザ嗜好ベクトル(UPV)生成部23により生成されるベクトルを、ユーザ嗜好ベクトルUPVと称する。
なお、本実施の形態(いまの場合、第1実施形態)においては、ユーザ嗜好ベクトルUPVは、行列演算部(空間生成部)22より供給された近似行列CCMに基づいて生成される(このため、UPVの後に、“*”を記述している)。即ち、ユーザ嗜好ベクトルUPVの生成方法は、行列演算部(空間生成部)22より供給された近似行列CCMを利用する方法であれば特に限定されない。
例えば、近似行列CCMの列成分、即ち、特徴ベクトルCCVのそれぞれを、ユーザ嗜好ベクトルUPVとしてそのまま適用することもできる。
或いは、例えば、近似行列CCMの列成分(特徴ベクトルCCV)の全てまたは一部分の各要素の総和のそれぞれを演算し、各演算結果(各要素の総和)のそれぞれを要素とする標準形のベクトルをユーザ嗜好ベクトルUPVとして適用することもできる。即ち、近似行列CCMの列成分(特徴ベクトルCCV)の全てまたは一部分の総和ベクトルを、ユーザ嗜好ベクトルUPVとして適用することもできる。
さらに、近似行列CCMの列成分(特徴ベクトルCCV)の一部分の各要素の総和を取る場合、その一部分の選択方法は特に限定されない。
具体的には、例えば、特徴ベクトルCCVの要素のうちの、コンテクスト情報を示す要素(コンテクスト情報の重み値)間で相関を演算し、相関の高い幾つかの特徴ベクトルCCVを選択し、これらの特徴ベクトルCCVの総和ベクトル(各要素の総和を要素とするベクトル)をユーザ嗜好ベクトルUPVとして適用することもできる。
或いは、例えば、元の行列CCMの列成分、即ち、元の特徴ベクトルCCVの要素のうちの、コンテクスト情報を示す要素(コンテクスト情報の重み値)間で相関を演算し、相関の高い幾つかの特徴ベクトルCCV(元の行列CCMの列成分)を選択し、さらに、選択した特徴ベクトルCCV(元の行列CCMの列成分)に対応する特徴ベクトルCCV(近似行列CCMの列成分)を選択し、これらの特徴ベクトルCCVの総和ベクトル(各要素の総和を要素とするベクトル)をユーザ嗜好ベクトルUPVとして適用することもできる。
なお、このようにコンテクストの類似度の高い特徴ベクトルCCVの総和ベクトルがユーザ嗜好ベクトルUPVとして適用された場合、そのユーザ嗜好ベクトルUPVは、所定のコンテクスト(1以上のコンテクストの組み合わせ)に対するユーザ嗜好ベクトルUPVであると言える。そこで、以下、所定のコンテクストに対するユーザ嗜好ベクトルUPVを、他のユーザ嗜好ベクトルUPVと区別するために、コンテクストユーザ嗜好ベクトルCUPVと称する。即ち、本明細書においては、例えば、コンテクストユーザ嗜好ベクトルCUPVと、単に近似行列CCMの列成分(特徴ベクトルCCV)がそのままユーザ嗜好ベクトルUPVとして適用された場合とを明確に区別する。
このようにして生成されたユーザ嗜好ベクトルUPV(コンテクストユーザ嗜好ベクトルCUPV含)は、関連情報取得部8に供給されるとともに、UPV記憶部6にも記憶される。
次に、マッチング部3に着目すると、このマッチング部3は、マッチング演算部31から構成される。マッチング演算部31は、メタ情報取得部1より供給される各情報の重み値を要素とする標準形のベクトル、即ち、特徴ベクトルCCVを生成し、この特徴ベクトルCCVと、UPV記憶部6に記憶されたユーザ嗜好ベクトルUPVとの類似度を演算し、その演算結果を推薦提示部9に供給する。
例えば、後述する推薦提示部9が、ユーザの現状のコンテクストに適したコンテンツを推薦する場合、マッチング演算部31は、はじめに、メタ情報取得部1から供給された、ユーザの現状のコンテクストを示すコンテクスト情報を取得し、そのコンテクスト情報の重み値を要素とする標準形のベクトル、即ち、コンテンツメタ情報を示す要素の全てが0となる特徴ベクトルCCVを生成する。そして、マッチング演算部31は、この特徴ベクトルCCVと、UPV記憶部6に記憶された複数のコンテクストユーザ嗜好ベクトルCUPVとの類似度を演算し、最も類似度の高いコンテクストユーザ嗜好ベクトルCUPVを、ユーザの現状コンテクストに対するコンテクストユーザ嗜好ベクトルCUPVとして設定する。
なお、このとき、マッチング演算部31により選択された、ユーザの現状コンテクストに対するコンテクストユーザ嗜好ベクトルUPVを、他のコンテクストユーザ嗜好ベクトルUPVと区別するために、特定コンテクストユーザ嗜好ベクトルsCUPVと称する。
或いは、UPV記憶部6に、コンテクストユーザ嗜好ベクトルCUPVではなく、単に近似行列CCMの列成分(特徴ベクトルCCV)がそのままユーザ嗜好ベクトルUPVとして記憶されている場合、マッチング演算部31は、ユーザの現状のコンテクストを示す特徴ベクトルCCVと、UPV記憶部6に記憶された複数のユーザ嗜好ベクトルUPVとの類似度を演算する。そして、マッチング演算部31は、閾値以上の類似度を有する幾つかのユーザ嗜好ベクトルUPVを選択し、これらの各要素の総和を要素とする標準形のベクトル(選択されたユーザ嗜好ベクトルUPVの総和ベクトル)を、ユーザの現状のコンテクストに対するユーザ嗜好ベクトルCUPV、即ち、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定することもできる。
次に、マッチング演算部31は、推薦候補となるコンテンツに対するコンテンツメタ情報がメタ情報取得部1より供給されてくる毎に、そのコンテンツメタ情報の重み値を要素とする標準形のベクトル、即ち、コンテクスト情報を示す要素の全てが0となる特徴ベクトルCCVを生成する。そして、マッチング演算部31は、この特徴ベクトルCCVと、特定コンテクストユーザ嗜好ベクトルsCUPVとの類似度を演算し、その演算結果を推薦提示部9に供給する。
推薦提示部9は、供給された演算結果(類似度)のうちの、特定コンテクストユーザ嗜好ベクトルsCUPVと最も類似度の高い特徴ベクトルCCVに対応するコンテンツを、推薦コンテンツとしてユーザに提示する。なお、推薦提示部9は、供給された演算結果(類似度)のうちの、閾値以上の類似度を持つ特徴ベクトルCCVに対応する1以上のコンテンツを、推薦コンテンツとしてユーザに提示することもできる。
このようにしてユーザに提示された推薦コンテンツに対する特徴ベクトルCCVは、上述したように、特定コンテクストユーザ嗜好ベクトルsCUPV(ユーザの現状のコンテクストに対するコンテクストユーザ嗜好ベクトルCUPV)と類似度が高いものである。従って、ユーザが嗜好するコンテンツの中でも、特に、ユーザの現状のコンテクスト(現在置かれているコンテクスト)に最も適したコンテンツが、推薦コンテンツとしてユーザに提示される。これにより、提示された推薦コンテンツがユーザにより拒絶される割合が従来に比較して下がる効果を奏することが可能になる。
なお、上述した例では、推薦候補に対する特徴ベクトルCCVにおいては、コンテクスト情報を示す要素の全てが0とされていたが、勿論、コンテクスト情報を示す要素に値が代入されていてもよい。この値は、特に限定されず、例えば、他のユーザがその推薦候補(コンテンツ)を使用した際のコンテクストの重み値であってもよいし、ユーザ自身がその推薦候補(コンテンツ)を使用すると仮定した際のコンテクストの予測重み値であってもよい。
ところで、語彙辞書作成部7は、例えば、空間およびUPV生成部2により生成された最適空間UPS、即ち、上述した式(2)の近似行列CCM(=Dk)の成分行列Uk等を用いて、ユーザの語彙辞書を作成する。即ち、語彙辞書作成部7は、例えば、成分行列Uk等により生成される(式(2)で算出される)近似行列CCM(=Dk)の各成分のうちの重み値が一定値以上となった成分を示す単語(例えば、後述する図11に示される“幼稚園”等)を、ユーザの興味語として設定し、その興味語を登録していくことで語彙辞書を作成する。語彙辞書作成部7はまた、近似行列CCM(=Dk)の各成分のうちの重み値の最高値または平均値が一定値未満となった成分を示す単語(例えば、後述する図11に示される“飲み会”や“ビール”等)を、ユーザの非興味語(不要語)として設定し、その非興味語を語彙辞書に登録することもできる。
また、関連情報取得部8は、空間およびUPV生成部2から供給されたユーザ嗜好ベクトルUPV毎に、そのユーザの嗜好上重要な語句を選んでWeb検索などにより関連情報を取得し、必要に応じて推薦提示部9に供給する。これにより、推薦提示部9は、推薦コンテンツと共に、関連情報取得部8より供給された関連情報を推薦コンテンツの推薦理由等としてユーザに提示したり、その関連情報自体を推薦コンテンツを選択する際の指標として利用することができる。
次に、図3のフローチャートを参照して、第1実施形態(図1)の情報処理装置が有する機能のうちのユーザ嗜好ベクトルUPV(近似行列CCMに基づくユーザ嗜好ベクトルUPV)を生成する機能を実現する処理(以下、UPV生成処理と称する)について説明する。
具体的には、例えば、いま、ユーザが受け取った(読んだ)メールの7つの文章(以下、DOC1乃至DOC7のそれぞれと記述する)をコンテンツとして取り扱い、ユーザが文章DOC1乃至文章DOC7のそれぞれを読んだ場所(家、または会社)と、その時点の情動(リラックス、緊張、楽しい、または悲しい)をコンテクストして取り扱うとする。
詳細には、メタ情報取得部1の文書取得部11が、文章DOC1乃至文章DOC7のそれぞれを取得し、文書解析部12が、これらの文章DOC1乃至文章DOC7のそれぞれを、次の(I)乃至(VII)のそれぞれの単語(名詞)に分解したとする。さらに、コンテクスト取得部14が、文章DOC1乃至文章DOC7のそれぞれをユーザが読んだ際のコンテクストのそれぞれとして、次の(I)乃至(VII)のそれぞれの括弧()内の単語(名詞)を取得したとする。
(I)幼稚園、子供、幼稚園、子供、早退(会社、楽しい)
(II)緊急、召集(会社、緊張)
(III)子供、海、子供(家、楽しい)
(IV)飲み会、ビール(会社、リラックス)
(V)緊急、特許(会社、緊張)
(VI)幼稚園、幼稚園、子供、風邪(家、悲しい)
(VII)風邪、早退(会社、悲しい)
即ち、これらの(I)乃至(VII)のそれぞれに対応するデータが、メタ情報取得部1から空間およびUPV生成部2に供給されたとする。
この場合、ステップS1において、空間およびUPV生成部2の特徴ベクトル(CCV)生成部21は、(I)乃至(VII)のそれぞれに対応する特徴ベクトルCCV(以下、特徴ベクトルCCV1乃至特徴ベクトルCCV7のそれぞれと称する)を生成し、CCV記憶部4に記憶させる。
なお、以下、このような特徴ベクトル(CCV)生成部21の処理(ステップS1の処理)を「CCV生成処理」と称する。第1実施形態の「CCV生成処理」の詳細例が図4のフローチャートに示されている。そこで、以下、図4を参照して、第1実施形態の「CCV生成処理」の詳細例について説明する。
はじめに、ステップS21において、特徴ベクトル(CCV)生成部21は、コンテンツメタ情報とコンテクスト情報とを取得する。具体的には、例えば、特徴ベクトル(CCV)生成部21は、文章(コンテンツ)DOC1のコンテンツメタ情報として、上述した(I)の“幼稚園”、“子供”、“幼稚園”、“子供”、および、“早退”のそれぞれのデータを取得し、文章DOC1のコンテクスト情報として、上述した(I)の括弧()内の“会社”と“楽しい”のそれぞれのデータを取得する。
ステップS22において、特徴ベクトル(CCV)生成部21は、コンテンツメタ情報とコンテクスト情報に対して重み付けを行う(数値化する)。上述したように、重み付けの手法は特に限定されないが、ここでは、頻度(単語の出現回数)により重み付けされるとする。具体的には、例えば、いまの場合(文章DOC1の場合)、コンテンツメタ情報のうちの“幼稚園”は2回出現しているので(頻度が2であるので)、文章DOC1のコンテンツメタ情報における“幼稚園”は「2」に数値化される(そのように重み付けされる)。同様に、文章DOC1のコンテンツメタ情報における“子供”は「2」に、“早退”は「1」に、それぞれ数値化される。文章DOC1のコンテクスト情報も単語化された情報であるので、コンテンツメタ情報と同様に、“会社”と“楽しい”とはいずれも「1」に数値化される。
ステップS23において、特徴ベクトル(CCV)生成部21は、重み付けされた(数値化された)コンテンツメタ情報とコンテクスト情報とを要素とする特徴ベクトルCCVを生成する。
なお、上述したように、特徴ベクトルCCVの次元数やその要素については特に限定されないが、ここでは、特徴ベクトルCCVは、図5に示される標準形のベクトル、即ち、(“幼稚園”,“子供”,“早退”,“緊急”,“召集”,“海”,“飲み会”,“ビール”,“特許”,“風”,“家”,“会社”,“リラックス”,“緊張”,“楽しい”,“悲しい”)といった16次元のベクトルとされる。ただし、16個の要素のそれぞれには、対応する“ ”で挟まれる単語の重み値が代入される。
具体的には、例えば、いまの場合(文章DOC1の場合)、特徴ベクトル(CCV)生成部21は、“幼稚園”に対応する要素(第1次元の要素)には「2」を、“子供”に対応する要素(第2次元の要素)には「2」を、“早退”に対応する要素(第3次元の要素)には「1」を、“会社”に対応する要素(第12次元の要素)には「1」を、“悲しい”に対応する要素(第16次元の要素)には「1」を、それら以外の要素(第4次元乃至第11次元と第13次元乃至第15次元のそれぞれの要素)には「0」を、それぞれ代入することで、文章DOC1に対する特徴ベクトルCCV1を生成する。即ち、図5に示されるように、文章DOC1に対する特徴ベクトルCCV1として(2,2,1,0,0,0,0,0,0,0,0,1,0,0,0,1)が生成される。
そして、ステップS24において、特徴ベクトル(CCV)生成部21は、直前のステップS23の処理で生成した特徴ベクトルCCV(いまの場合、文章DOC1に対する特徴ベクトルCCV1)をCCV記憶部4に記憶させる。
ステップS25において、特徴ベクトル(CCV)生成部21は、他のコンテンツもCCV化するか否かを判定する。
いまの場合、他のコンテンツとして、文章DOC2乃至文章DOC7がまだ残っているので、文章DOC2乃至文章DOC7のそれぞれに対して、ステップS21乃至S25の処理が繰り返し実行されて、図5に示されるような、文章DOC2乃至文章DOC7のそれぞれの特徴ベクトルCCV2乃至特徴ベクトルCCV7のそれぞれが生成され、CCV記憶部4に記憶される。
このようにして、全てのコンテンツに対する特徴ベクトル(いまの場合、特徴ベクトルCCV1乃至特徴ベクトルCCV7)をCCV記憶部4に記憶させると、特徴ベクトル(CCV)生成部21は、ステップS25において、他のコンテンツもCCV化しないと判定し、ステップS26において、各特徴ベクトルCCVのそれぞれの要素の重みを調整する。
なお、上述したように、各特徴ベクトルCCVの各要素の値として、コンテンツメタ情報の重み値、または、コンテクスト情報の重み値に対して、可変係数のそれぞれが掛けられた値が適用されている場合、特徴ベクトル(CCV)生成部21は、ステップS26において、調整したい要素の可変係数を単に変えるだけで、各特徴ベクトルCCVのそれぞれの要素の重みを簡単に調整することができる。
これにより、「CCV生成処理」は終了となる。
図3に戻り、「CCV生成処理(ステップS1)」の処理が終了されると、ステップS2において、行列演算部(空間生成部)22は、CCV記憶部4に記憶された複数の特徴ベクトルCCVに基づいて行列CCMを生成し、さらに、その行列CCMの近似行列CCMを生成し、ユーザ嗜好ベクトル(UPV)生成部23に供給する。
なお、以下、このような行列演算部(空間生成部)22の処理(ステップS2の処理)を「近似行列(空間)生成処理」と称する。第1実施形態の「近似行列(空間)生成処理」の詳細例が図6のフローチャートに示されている。そこで、以下、図6を参照して、第1実施形態の「近似行列(空間)生成処理」の詳細例について説明する。
はじめに、ステップS41において、行列演算部(空間生成部)22は、CCV記憶部4から、複数の特徴ベクトルCCVを取得する。具体的には、例えば、いまの場合、行列演算部(空間生成部)22は、上述した図5の特徴ベクトルCCV1乃至特徴ベクトルCCV7を取得する。
ステップS42において、行列演算部(空間生成部)22は、複数の特徴ベクトルCCVを列成分とする行列CCMを生成する。具体的には、例えば、いまの場合、行列演算部(空間生成部)22は、図7に示されるような行列Dを行列CCMとして生成する。
ステップS43において、行列演算部(空間生成部)22は、行列CCMに対して、特異値分解と次元削減を行い、上述した式(2)の右辺に示される成分行列Uk,Σk,Vkを生成し(即ち、最適空間UPSを生成し)、ステップS44において、それらの成分行列Uk,Σk,Vkを成分行列記憶部5に記憶させる。
そして、ステップS45において、行列演算部(空間生成部)22は、成分行列Uk,Σk,Vkを用いて(式(2)の右辺を演算して)、行列CCMの近似行列CCMを生成し、ユーザ嗜好ベクトル(UPV)生成部23に供給する。
具体的には、例えば、いまの場合、ステップS43乃至S45の処理で次のような処理が実行される。即ち、上述したように、行列演算部(空間生成部)22は、図7に示される行列D(行列CCM)に対して特異値分解を施すことで、行列CCMを、上述した式(1)を満たす成分行列U,Σ,Vのそれぞれに分解する。このとき生成された(図7の行列Dが分解された)成分行列U,Σ,Vのそれぞれが、図8乃至図10のそれぞれに示されている。
なお、成分行列Σは実際には16行7列の行列となるが、図9においては、先頭(上)から7行目までの行列成分のみが図示されている。成分行列Σにおいては、図9に示される行列成分(上の7×7の行列成分)が対角行列をなし、残りの図示せぬ行列成分の全てが0となるためである。
また、成分行列Uは実際には16行16行の行列となるが、図8においては、先頭(左)から7列目までの行列成分のみが図示されている。U×Σの行列演算を考えた場合、図8には図示せぬ行列成分(先頭から8行目以降の行列成分)がいずれの値であっても、結局、それらの行列成分と、対応するΣの行列成分(即ち、0)との積はいずれも0となるためである。
そして、上述したように、行列演算部(空間生成部)22は、図8の成分行列Uの先頭の3個の列成分(左特異ベクトル)からなる行列Uk、即ち、同図の点線枠で示される16行3列の行列Ukを生成する。
また、上述したように、行列演算部(空間生成部)22は、図10の成分行列Vの先頭の3個の列成分(右特異ベクトル)からなる行列Vk、即ち、同図の点線枠で示される7行3列の行列Vkを生成する。さらに、行列演算部(空間生成部)22は、図9の成分行列Σの先頭の3個の列成分のうちの1行乃至3行目までの要素(同図の点線枠で示されるように、成分行列Σのうちの、3×3個の要素からなる左上成分)からなる行列Σk、即ち、3行3列の行列Σkを生成する。
そして、行列演算部(空間生成部)22は、これらの成分行列Uk,Σk,Vkを成分行列記憶部5に記憶させた後、上述した式(2)の右辺にこれらの成分行列Uk,Σk,Vkを代入して行列演算を行うことで、ランクが3に縮退した図11に示されるような行列Dkを求め、この行列Dkを、行列CCMの近似行列CCMとしてユーザ嗜好ベクトル(UPV)生成部23に供給する。
これにより、「近似行列(空間)生成処理」は終了となる。
図3に戻り、「近似行列(空間)生成処理(ステップS2)」の処理が終了されると、ステップS3において、ユーザ嗜好ベクトル(UPV)生成部23は、ユーザ嗜好ベクトルUPVのタイプとして、上述したコンテクスト毎のユーザ嗜好ベクトルUPV、即ち、コンテクストユーザ嗜好ベクトルCUPVを生成するのか否かを判定する。
ステップS3において、ユーザ嗜好ベクトル(UPV)生成部23は、コンテクストユーザ嗜好ベクトルCUPVを生成しないと判定した場合、例えば、次のステップS4とS5の処理を実行する。
即ち、ユーザ嗜好ベクトル(UPV)生成部23は、ステップS4において、近似行列CCMの各列成分、即ち、近似行列CCMにおける各特徴ベクトルCCVのそれぞれをユーザ嗜好ベクトルUPVとして設定し、ステップS5において、それらのユーザ嗜好ベクトルUPVをUPV記憶部6に記憶させる。具体的には、例えば、いまの場合、「近似行列(空間)生成処理(ステップS2)」の処理により図11に示される行列Dkが近似行列CCMとして生成されるので、この近似行列CCMの各列成分、即ち、同図に示される特徴ベクトルCCV 1乃至特徴ベクトルCCV 7のそれぞれが、ユーザ嗜好ベクトルUPVとして設定され、UPV記憶部6に記憶される。
これにより、UPV生成処理は終了となる。
これに対して、ステップS3において、コンテクストユーザ嗜好ベクトルCUPVを生成すると判定した場合、ユーザ嗜好ベクトル(UPV)生成部23は、ステップS6において、コンテクストユーザ嗜好ベクトルCUPVを生成する。
なお、以下、このようなユーザ嗜好ベクトル(UPV)生成部23がコンテクストユーザ嗜好ベクトルCUPVを生成する処理(ステップS6の処理)を「CUPV生成処理」と称する。第1実施形態の「CUPV生成処理」の詳細例が図12のフローチャートに示されている。そこで、以下、図12を参照して、第1実施形態の「CUPV生成処理」の詳細例について説明する。
はじめに、ステップS61において、ユーザ嗜好ベクトル(UPV)生成部23は、近似行列CCMの各列成分、即ち、近似行列CCMにおける各特徴ベクトルCCVの要素のうちの、コンテクスト情報の要素間の類似度を演算する。具体的には、例えば、いまの場合、「近似行列(空間)生成処理(ステップS2)」の処理により図11に示される行列Dkが近似行列CCMとして生成されるので、この近似行列CCMの各列成分、即ち、同図に示される特徴ベクトルCCV 1乃至特徴ベクトルCCV 7のそれぞれのうちの、コンテクスト情報の要素からなるベクトル(“家”,“会社”,“リラックス”,“緊張”,“楽しい”,“悲しい”)同士の類似度が演算される。
ステップS62において、ユーザ嗜好ベクトル(UPV)生成部23は、各特徴ベクトルCCV(いまの場合、図11の特徴ベクトルCCV 1乃至特徴ベクトルCCV 7)をクラス分類する。即ち、ユーザ嗜好ベクトル(UPV)生成部23は、ステップS61の処理で演算した類似度が閾値以上の特徴ベクトルCCVを1つのクラスに含める。
次に、ステップS63において、ユーザ嗜好ベクトル(UPV)生成部23は、各クラス毎に、対応するクラスに属する各特徴ベクトルCCVの同一要素の総和(例えば、“幼稚園”同士の総和)を演算し、各演算結果(各要素の総和)を要素とするベクトルを、対応するクラスのコンテクストユーザ嗜好ベクトルCUPVとして設定する。
そして、ステップS64において、ユーザ嗜好ベクトル(UPV)生成部23は、各クラス毎に設定されたコンテクストユーザ嗜好ベクトルCUPVのそれぞれを、UPV記憶部6に記憶させる。
これにより、図12の「CUPV生成処理(図3のステップS6の処理)」は終了となる。即ち、図3のUPV生成処理自体が終了となる。
次に、図13のフローチャートを参照して、第1実施形態(図1)の情報処理装置が有する機能のうちの、既に生成したユーザ嗜好ベクトルUPVに基づいて、ユーザの現在置かれているコンテクストに適合したコンテンツを推薦する機能を実現する処理(以下、コンテンツ推薦処理と称する)について説明する。
ステップS101において、マッチング部3のマッチング演算部31は、UPV記憶部6に記憶されているユーザ嗜好ベクトルUPV(コンテクストユーザ嗜好ベクトルCUPVの場合もある)に基づいて、ユーザの現在置かれているコンテクストに適合した、特定コンテクストユーザ嗜好ベクトルsCUPVを設定する。
なお、以下、このようなマッチング演算部31が、特定コンテクストユーザ嗜好ベクトルsCUPVを設定する処理(ステップS101の処理)を「CUPV設定処理」と称する。第1実施形態の「CUPV設定処理」の詳細例が図14のフローチャートに示されている。そこで、以下、図14を参照して、第1実施形態の「CUPV設定処理」の詳細例について説明する。
はじめに、ステップS121において、マッチング演算部31は、メタ情報取得部1(コンテクスト取得部14)より現状のコンテクスト情報を取得する。
具体的には、例えば、いま、ステップS121において、マッチング演算部31は、現状のコンテクスト情報として、“家”と“楽しい”という単語データをメタ情報取得部1より取得したとする。即ち、ユーザの現在置かれているコンテクストは、「ユーザは家にいて楽しい気分である」というコンテクストであるとする。
この場合、ステップS122において、マッチング演算部31は、現状のコンテクスト情報を特徴ベクトルCCV化する。即ち、マッチング演算部31は、図15に示されるように、“家”の要素(第11次元の要素)を「1」とし、“楽しい”の要素(第15次元の要素)を「1」とし、それ以外の要素(第1次元乃至第10次元、第12次元乃至第14次元、および、第16次元のそれぞれの要素)を「0」とする特徴ベクトルCCVを生成する。なお、以下、このようにして、マッチング演算部31により生成される特徴ベクトルCCV、即ち、ユーザの現在置かれているコンテクストを示す特徴ベクトルCCVを、他の特徴ベクトルCCVと区別するために、現状コンテクスト特徴ベクトルcCCVと称する。即ち、いまの場合、ステップS122において、マッチング演算部31は、図15に示されるような現状コンテクスト特徴ベクトルcCCVを生成する。
ステップS123において、マッチング演算部31は、現状コンテクスト特徴ベクトルcCCVと、UPV記憶部6に既に記憶されている各ユーザ嗜好ベクトルUPV(または、各コンテクストユーザ嗜好ベクトルCUPV)のそれぞれとの類似度を演算する。
ステップS124において、マッチング演算部31は、ステップS123の処理における類似度演算の対象は、コンテクストユーザ嗜好ベクトルCUPVであるか否かを判定する。
ステップS124において、対象はコンテクストユーザ嗜好ベクトルCUPVであると判定した場合、マッチング演算部31は、ステップS125において、最大類似度のコンテクストユーザ嗜好ベクトルCUPVを、上述した特定コンテクストユーザ嗜好ベクトルsCUPVとして設定する。
これに対して、ステップS124において、対象はコンテクストユーザ嗜好ベクトルCUPVではないと判定した場合、マッチング演算部31は、ステップS126において、類似度が閾値以上のユーザ嗜好ベクトルUPVの総和ベクトルを、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定する。
具体的には、例えば、いまの場合、図15に示される現状コンテクスト特徴ベクトルcCCVと、図11に示される特徴ベクトルCCV 1乃至特徴ベクトルCCV 7(UPV記憶部6に記憶された各ユーザ嗜好ベクトルUPV)のそれぞれとの類似度の演算結果は、図16に示される通りとなる。
この場合、例えば、閾値が0.8に設定されているとすると、マッチング演算部31は、ステップS126において、特徴ベクトルCCV 1と特徴ベクトルCCV 3との総和ベクトルを、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定することになる。
ここで、注目すべき点は次の点である。即ち、仮に、ユーザ嗜好ベクトルUPVとして、上述した図7の元の行列CCMの各列成分、即ち、上述した図5の特徴ベクトルCCV1乃至特徴ベクトルCCV7が適用された場合、現状コンテクスト特徴ベクトルcCCV(図15)のコンテクスト情報の要素と一致する(“家”と“楽しい”が「1」でその他の要素が「0」である)特徴ベクトルCCV3のみが、特定コンテクストユーザ嗜好ベクトルsCUPVの生成に反映される。これに対して、いまの場合のように、ユーザ嗜好ベクトルUPVとして、図11の近似行列CCMの各列成分、即ち、図11の特徴ベクトルCCV 1乃至特徴ベクトルCCV 7が適用されると、特徴ベクトルCCV3に対応する特徴ベクトルCCV3 のみならず、特徴ベクトルCCV1に対応する特徴ベクトルCCV1 も、特定コンテクストユーザ嗜好ベクトルsCUPVの生成に反映されることになる点である。
即ち、ここで注目すべき点は、空間およびUPV生成部2が、図7の元の行列CCMに対して上述したLSI法を適用して近似行列CCMを生成したことで(図6の「近似行列(空間)生成処理」を実行したことで)、図5の特徴ベクトルCCV1乃至特徴ベクトルCCV7では表現しきれなかった各要素(コンテンツメタ情報とコンテクスト情報)間の関係が、図11の特徴ベクトルCCV 1乃至特徴ベクトルCCV 7においては浮き彫りになった点である。さらには、その結果、特徴ベクトルCCV 1に対応するコンテンツ(文章DOC1)を使用したときのユーザのコンテクストも、現状のコンテクストに類似していることが浮かび上がった点である。
換言すると、ここで注目すべき点は、次の点である。即ち、図5の特徴ベクトルCCV1乃至特徴ベクトルCCV7が、仮にユーザ嗜好ベクトルUPVとして適用された場合、特徴ベクトルCCV6 は、“家”の要素が「1」であることが図15の現状コンテクスト特徴ベクトルcCCVと類似し、また、特徴ベクトルCCV1は、“楽しい”の要素が「1」であることが図15の現状コンテクスト特徴ベクトルcCCVと類似する。従って、特徴ベクトルCCV6と特徴ベクトルCCV1とのそれぞれの、図15の現状コンテクスト特徴ベクトルcCCVに対する類似度は一致することになる。これに対して、各コンテンツ(文章DOC1乃至文章DOC7)のそれぞれの要素間の関係(コンテンツメタ情報と、コンテクスト情報との関係)がLSI法により強調されたところ(各要素の重みが更新されたところ)、特徴ベクトルCCV1 の“家”の要素が、特徴ベクトルCCV6 と同程度の「約0.6」に更新されたのに対して、特徴ベクトルCCV1 の“楽しい”の要素が、特徴ベクトルCCV6 の「約0.16」に比較して遥かに高い「約1.06」に更新され、その結果、特徴ベクトルCCV1 の方が、特徴ベクトルCCV6 よりも、図15の現状コンテクスト特徴ベクトルcCCVに対する類似度が高くなった点である。即ち、“家”で“悲しい”気分で使用した文章DOC6よりも、“会社”で“楽しい”気分で使用した文章DOC1の方が、現状のコンテクスト(“家”で“楽しい”気分)に適していることが浮き彫りになった点である。
このように、本発明においては、LSI法の適用は、上述した次元数を単に減らすという第1の効果を目的とする以外に、元の特徴ベクトルCCVの各要素間の関係を強調させた特徴ベクトルCCVを生成させる第2の効果を主目的としている。即ち、第2の効果とは、元の特徴ベクトルCCVに比較して、類義語が自然に関連性を持つ(値が同様の重みを持つ)特徴ベクトルCCVを生成させる効果である。さらに言えば、第2の効果とは、LSI法を適用して次元削減することで、高次元の元の特徴ベクトルCCVにおいては、別物として取り扱われていた単語のうちの同じ意味あいを持つ単語が、低次元の特徴ベクトルCCVにおいては、同一次元に縮退し同等になる効果である。
換言すると、本発明の主目的は第2の効果を奏することである(勿論、第1の効果も奏する方が好適である)ので、この第2の効果を奏することが可能な手法、即ち、元の特徴ベクトルCCVの各要素間の関係を強調させた特徴ベクトルCCVを生成させることが可能な手法であれば、LSI法に限定されず、様々な手法を適用することが可能である。
従って、空間およびUPV生成部2の構成は、図1の構成に限定されず、次のような更新部と生成部とを単に有する構成であればよい。即ち、N個(Nは、2以上の整数値であって、いまの場合、16個)の個別情報(例えば、図5の“幼稚園”や“子供”といったコンテンツメタ情報と、“家”や“楽しい”といったコンテクスト情報)から構成される情報群をM個(Mは、1以上の整数値であって、いまの場合、文章DOC1乃至文章DOC7のそれぞれに対応する7個)取得し、M個の情報群毎に、N個の個別情報間の関係が強調されるように、N個の個別情報のうちの少なくとも一部の内容を更新する(いまの場合、各要素、即ち、重みを更新する)更新部と、その更新部により内容が更新されたN個の個別情報から構成されるM個の情報群(いまの場合、近似行列CCM)に基づいて、N個の個別情報から構成される基準情報群(いまの場合、コンテクストユーザ嗜好ベクトルCUPV)を生成する生成部とが、空間およびUPV生成部2の構成要素として存在すればよい。
ところで、以上のようにして、図14のステップS125またはステップS126の処理で、特定コンテクストユーザ嗜好ベクトルsCUPVが設定されると、「CUPV設定処理」は終了となる。
図13に戻り、「CUPV設定処理(ステップS101の処理)」が終了すると、ステップS102において、マッチング演算部31と推薦提示部9は、この特定コンテクストユーザ嗜好ベクトルsCUPVに基づいて、ユーザが嗜好するコンテンツの中でも、特に、ユーザの現状のコンテクストに適合するコンテンツを、推薦コンテンツとしてユーザに提示する。
なお、以下、このようなマッチング演算部31と推薦提示部9とが推薦コンテンツをユーザに提示する処理(ステップS102の処理)を「コンテンツ推薦演算処理」と称する。第1実施形態の「コンテンツ推薦演算処理」の詳細例が図17のフローチャートに示されている。そこで、以下、図17を参照して、第1実施形態の「コンテンツ推薦演算処理」の詳細例について説明する。
はじめに、ステップS141において、マッチング演算部31は、複数のコンテンツに対するコンテンツメタ情報のそれぞれを推薦候補のコンテンツメタ情報として、メタ情報取得部1(文書解析部12またはメタデータ取得部13)より取得する。
ステップS142において、マッチング演算部31は、複数の推薦候補のコンテンツメタ情報のそれぞれを特徴ベクトルCCV化する。即ち、マッチング演算部31は、複数の推薦候補のそれぞれの特徴ベクトルCCVを生成する。具体的には、いまの場合、上述した図11や図15等に示される標準形の特徴ベクトルCCVであって、コンテクスト情報の要素、即ち、第11次元乃至第16次元の要素が「0」である特徴ベクトルCCVが生成される。
ステップS143において、マッチング演算部31は、ステップS101の「CUPV設定処理(図13、詳細は図14)」で設定した特定コンテクストユーザ嗜好ベクトルsCUPVと、ステップS142の処理で生成した複数の推薦候補の特徴ベクトルCCVのそれぞれとの類似度を演算し、その演算結果を推薦提示部9に供給する。
すると、ステップS144において、推薦提示部9は、類似度が閾値以上の推薦候補(1つだけ提示する場合、最大の類似度の推薦候補)を推薦コンテンツとして、ユーザに提示する。これにより「コンテンツ推薦演算処理(図13のステップS102の処理)」は終了となる。即ち、図13のコンテンツ推薦処理自体が終了となる。
上述したように、このようにしてユーザに提示された推薦コンテンツに対する特徴ベクトルCCVは、ステップS101の「CUPV設定処理(図13、詳細は図14)」で設定された特定コンテクストユーザ嗜好ベクトルsCUPV(ユーザが現在置かれているコンテクストに相当するコンテクストユーザ嗜好ベクトルCUPV)と類似度が高いものである。従って、ユーザが嗜好するコンテンツの中でも、特に、ユーザの現状のコンテクストに最も適したコンテンツが、推薦コンテンツとしてユーザに提示される。これにより、提示された推薦コンテンツがユーザにより拒絶される割合が従来に比較して下がる効果を奏することが可能になる。
即ち、上述したように、ユーザの嗜好やコンテクストに適したコンテンツを選択するために、ユーザの経験したコンテンツメタ情報とコンテクスト情報を含む特徴ベクトルCCVに基づいて行列CCMを生成し、さらに、LSI(潜在的意味インデクシング)法等を利用して行列CCMの近似行列CCMを生成し、この近似行列CCMに基づいてマッチング処理を行うようにしたことで、コンテンツやコンテクストが相互に影響した潜在的に重要な関係性を発見できる(浮かび上がらせることができる)ようになり、その結果、ユーザの現状のコンテクストにより適したコンテンツを推薦できる効果を奏することが可能になる。
ところで、この効果を奏する1つの要因は、上述したように、コンテクスト情報をコンテンツメタ情報と並べて同等に扱うことである。即ち、コンテクスト情報とコンテンツメタ情報とを同レベルで取り扱うことにより、マッチング処理後の処理結果と限定されたコンテクストとの単純な一致によるコンテンツ推薦でなく、コンテンツとコンテクストとが影響しあって浮かび上がった結果(近似行列CCM)に基づくマッチング処理の結果が反映されたコンテンツ推薦を行うことができる。
従って、上述した例においては、ユーザの現状のコンテクストに最も適したコンテンツ(コンテクストの観点から似たコンテンツ)を推薦コンテンツとしてユーザに提示したが、コンテンツの観点から似たコンテクストをユーザに提示することもできる。
さらに、ユーザが現在使用しているコンテンツに最も適した他のコンテンツを推薦することもできる。
この場合、マッチング部3は次のような処理を実行する。即ち、マッチング部3は、はじめに、ユーザが現在使用しているコンテンツに対するコンテンツメタ情報をメタ情報取得部1から取得し、これらのコンテンツメタ情報に対して重み付けし、重み付けされたコンテンツメタ情報を、上述した標準形のベクトルのうちの対応する要素に代入することで、ユーザが現在使用しているコンテンツに対する特徴ベクトルCCVを生成する。次に、マッチング部3は、生成したこの特徴ベクトルCCVと、UPV記憶部6に既に記憶されている1以上のユーザ嗜好ベクトルUPVとの類似度を演算し、その類似度が閾値以上であるユーザ嗜好ベクトルUPVに基づいて新たなユーザ嗜好ベクトルUPV(上述した特定コンテクストユーザ嗜好ベクトルsCUPVに相当)を生成する。そして、マッチング部3は、他のコンテンツに対する特徴ベクトルCCVと、新たなユーザ嗜好ベクトルUPVとの類似度を演算し、その演算結果を推薦提示部9に供給する。
(第2実施形態)
次に、図18乃至図22を参照して、第2実施形態の情報処理装置について説明する。
図18は、第2実施形態の情報処理装置の構成例を表しており、第1実施形態の情報処理装置(図1)と対応する部分には、対応する符号が付してある。
第2実施形態の構成例においては、第1実施形態のマッチング部3(図1)の代わりに、射影マッチング部101が設けられている。
即ち、上述したように、第1実施形態のマッチング部3は、例えば、図15に示される16次元の現状コンテクスト特徴ベクトルcCCVと、UPV記憶部6に記憶されている16次元のコンテクストユーザ嗜好ベクトルCUPVとの類似度を演算することで、16次元の特定コンテクストユーザ嗜好ベクトルsCUPVを設定した。さらに、マッチング部3は、16次元の特定コンテクストユーザ嗜好ベクトルsCUPVと、推薦候補(コンテンツ)の16次元の特徴ベクトルCCVの類似度を演算し、その演算結果を推薦提示部9に提供した。
このように、第1実施形態のマッチング部3は、特徴ベクトル(CCV)生成部21が生成した特徴ベクトルCCVと同一の次元数(上述した例では、16次元)のベクトルを処理の対象としている。このため、ユーザが使用したコンテンツの種類が増え、コンテンツメタ情報の蓄積数も増大していき、その結果、特徴ベクトル(CCV)生成部21により生成される特徴ベクトルCCVの次元数(要素の数)、即ち、ユーザ嗜好ベクトル(UPV)生成部23により生成されるユーザ嗜好ベクトルUPVの次元数が増大してしまった場合、マッチング部3の演算量が増大してしまうという課題が発生してしまう。
そこで、この課題を解決するために、第2実施形態においては、射影マッチング部101は、類似度演算の対象となる特徴ベクトルCCV、即ち、例えば、現状コンテクスト特徴ベクトルcCCVや推薦候補(コンテンツ)の特徴ベクトルCCVの各要素を、行列演算部(空間生成部)22により生成された最適空間UPSに射影することで次元削減を行う。そして、射影マッチング部101は、次元削減を行った特徴ベクトルCCVと、UPV記憶部6に記憶されている、同様に次元削減が行われたユーザ嗜好ベクトルUPVの類似度を演算する。なお、次元削減されたユーザ嗜好ベクトルUPVについては後述する。
詳細には、射影マッチング部101は、行列演算部(射影部)111とマッチング演算部112とから構成される。
行列演算部(射影部)111は、特徴ベクトルCCV(コンテクスト特徴ベクトルcCCVや推薦候補(コンテンツ)の特徴ベクトルCCV)がメタ情報取得部1から供給されてきた場合、その特徴ベクトルCCVの各要素を、行列演算部(空間生成部)22により生成された最適空間UPSに射影することで次元削減を行う。即ち、行列演算部(射影部)111は、供給された特徴ベクトルCCVに対して、成分行列記憶部5に記憶されている成分行列Uk(上述した式(2)参照)の転置行列を左から掛けることで、最適空間UPSに射影された特徴ベクトルCCV、即ち、次元削減された特徴ベクトルCCV(以下、次元削減された特徴ベクトルCCVを、特徴ベクトルCCV#と記述する)を求めることができる。
なお、ユーザ嗜好ベクトル(UPV)生成部23も、行列演算部(射影部)111と同様に、生成したユーザ嗜好ベクトルUPV(特徴ベクトル(CCV)生成部21により生成された特徴ベクトルCCVと同一の次元数(上述した例では、16次元)を有するユーザ嗜好ベクトルUPV)の各要素を、行列演算部(空間生成部)22により生成された最適空間UPSに射影することで次元削減を行い、次元削減されたユーザ嗜好ベクトルUPVをUPV記憶部6に記憶する。即ち、ユーザ嗜好ベクトル(UPV)生成部23は、生成したユーザ嗜好ベクトルUPVに対して、行列演算部(空間生成部)22により生成された成分行列Ukの転置行列を左から掛けることで、最適空間UPSに射影されたユーザ嗜好ベクトルUPV、即ち、次元削減されたユーザ嗜好ベクトルUPV(以下、次元削減されたユーザ嗜好ベクトルUPVを、ユーザ嗜好ベクトルUPV#と記述する)を求めることができる。
勿論、行列演算部(射影部)111側で、次元削減されたユーザ嗜好ベクトルUPV#を生成してもよい。
マッチング演算部112は、行列演算部(射影部)111により次元削減された特徴ベクトルCCV#と、UPV記憶部6に既に記憶されている、次元削減されたユーザ嗜好ベクトルUPV#との類似度を演算し、その演算結果を必要に応じて推薦提示部9に供給する。
このように、第2実施形態の射影マッチング部101は、次元削減を行ったベクトルを処理対象とするので、次元削減されない元のベクトルを処理対象とする第1実施形態のマッチング部3(図1)と比較して、その演算量を抑制することが可能になる。
なお、射影マッチング部101の形態は特に限定されず、ソフトウエアで構成されてもよいし、ハードウエアで構成されてもよいし、或いは、ソフトウエアとハードウエアの組合せとして構成されてもよい。
また、射影マッチング部101以外の構成については、図1の第1実施形態の構成と基本的に同様とされる。即ち、図18において、メタ情報取得部1、空間およびUPV生成部2、および、CCV記憶部4乃至推薦提示部9のそれぞれは、図1の対応するブロックと基本的に同様の構成と機能を有しているため、これらの説明は省略する。
次に、図19のフローチャートを参照して、第2実施形態の情報処理装置(図18)が実行するUPV生成処理について説明する。
第2実施形態におけるUPV生成処理の流れは、第1実施形態のそれ(図3)と類似している。そこで、ここでは、第1実施形態と同様の処理(第1実施形態において説明した処理)については、その説明を適宜省略し、以下、図19フローチャートを参照して、第1実施形態とは異なる処理を中心に説明する。
即ち、図3と図19とを比較するに、ステップS1とS201の「CCV生成処理」と、ステップS2とS202の「近似行列(空間)生成処理」とは基本的に同様の処理とされる。
「近似行列(空間)生成処理(ステップS202)」の処理が終了されると、ステップS203において、ユーザ嗜好ベクトル(UPV)生成部23は、ユーザ嗜好ベクトルUPVのタイプとして、上述したコンテクスト毎のユーザ嗜好ベクトルUPV、即ち、コンテクストユーザ嗜好ベクトルCUPVを生成するのか否かを判定する。
ステップS203において、ユーザ嗜好ベクトル(UPV)生成部23は、コンテクストユーザ嗜好ベクトルCUPVを生成しないと判定した場合、例えば、次のステップS204乃至S206の処理を実行する。
即ち、ステップS204において、ユーザ嗜好ベクトル(UPV)生成部23は、近似行列CCMの各列成分、即ち、近似行列CCMにおける各特徴ベクトルCCVのそれぞれをユーザ嗜好ベクトルUPVとして設定する。
ステップS205において、ユーザ嗜好ベクトル(UPV)生成部23は、各ユーザ嗜好ベクトルUPVのそれぞれを最適空間UPSに射影する(即ち、次元削減された各ユーザ嗜好ベクトルUPV#のそれぞれを生成する)。
ステップS206において、ユーザ嗜好ベクトル(UPV)生成部23は、それらの次元削減されたユーザ嗜好ベクトルUPV#をUPV記憶部6に記憶させる。
これにより、第2実施形態におけるUPV生成処理は終了となる。
これに対して、ステップS203において、ユーザ嗜好ベクトル(UPV)生成部23は、コンテクストユーザ嗜好ベクトルCUPVを生成すると判定した場合、ステップS207において、「CUPV生成処理」を実行する。即ち、ステップS207において、ユーザ嗜好ベクトル(UPV)生成部23は、次元削減されたコンテクストユーザ嗜好ベクトルCUPV#を生成する。
第2実施形態の「CUPV生成処理」の詳細例が図20のフローチャートに示されている。第2実施形態の「CUPV生成処理」の流れは、第1実施形態のそれ(図12)と類似している。そこで、ここでは、第1実施形態と同様の処理(第1実施形態において説明した処理)については、その説明を適宜省略し、以下、図20フローチャートを参照して、第2実施形態とは異なる処理を中心に説明する。
即ち、図12と図20とを比較するに、ステップS61乃至S63のそれぞれと、ステップS221乃至S223のそれぞれとは基本的に同様の処理とされるので、それ以降の処理について説明する。
ステップS223において、コンテクストユーザ嗜好ベクトルCUPVを各クラス毎に設定すると、ユーザ嗜好ベクトル(UPV)生成部23は、ステップS224において、各クラス毎に設定されたコンテクストユーザ嗜好ベクトルCUPVのそれぞれを最適空間UPSに射影する(即ち、各クラス毎に、次元削減されたコンテクストユーザ嗜好ベクトルCUPV#のそれぞれを生成する)。
そして、ステップS225において、ユーザ嗜好ベクトル(UPV)生成部23は、各クラス毎に設定された、次元削減されたコンテクストユーザ嗜好ベクトルCUPV#のそれぞれを、UPV記憶部6に記憶させる。
これにより、第2実施形態の「CUPV生成処理(図19のステップS207の処理)」は終了となる。即ち、第2実施形態のUPV生成処理自体が終了となる。
次に、第2実施形態の情報処理装置が実行する「コンテンツ推薦処理」について説明する。
第2実施形態の「コンテンツ推薦処理」の流れは、第1実施形態のそれ(図13)と基本的に同様とされる。即ち、第2実施形態の「コンテンツ推薦処理」は、上述した図13のフローチャートに従って実行される。
ただし、第2実施形態の「CUPV設定処理(ステップS101の処理)」は、第1実施形態のそれ(図14)と類似しているものの若干差異がある。同様に、第2実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」は、第1実施形態のそれ(図17)と類似しているものの若干差異がある。
このような第2実施形態における、「CUPV設定処理(ステップS101の処理)」と「コンテンツ推薦演算処理(ステップS102の処理)」のそれぞれの詳細例が図21と図22のフローチャートのそれぞれに示されている。そこで、以下、図21を参照して、第2実施形態の「CUPV設定処理(ステップS101の処理)」の詳細例を説明し、次に、図22を参照して、2実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」の詳細例について説明する。
はじめに、図21のステップS241において、行列演算部(射影部)111は、メタ情報取得部1(コンテクスト取得部14)より現状のコンテクスト情報を取得する。
ステップS242において、行列演算部(射影部)111は、現状のコンテクスト情報を特徴ベクトルCCV化する(即ち、現状コンテクスト特徴ベクトルcCCVを生成する)。
ステップS243において、行列演算部(射影部)111は、現状コンテクスト特徴ベクトルcCCVを最適空間UPSに射影する(即ち、次元削減された現状コンテクスト特徴ベクトルcCCV#を生成する)。
ステップS244において、マッチング演算部112は、次元削減された現状コンテクスト特徴ベクトルcCCV#と、UPV記憶部6に既に記憶されている、次元削減された各コンテクストユーザ嗜好ベクトルCUPV#のそれぞれとの類似度を演算する。
ステップS245において、マッチング演算部112は、最大類似度の次元削減されたコンテクストユーザ嗜好ベクトルCUPV#を、次元削減された特定コンテクストユーザ嗜好ベクトルsCUPV#として設定する。
これにより、第2実施形態の「CUPV設定処理」は終了となる。
なお、図21には図示はされていないが、コンテクストユーザ嗜好ベクトルCUPV#ではなく、ユーザ嗜好ベクトルUPV#がUPV記憶部6に記憶されている場合であっても、マッチング演算部112は、第1実施形態と同様の処理(ステップS124と同様の処理)を施すことで、特定コンテクストユーザ嗜好ベクトルsCUPV#を設定することができる。
このような第2実施形態の「CUPV設定処理(図13のステップS101の処理)」が終了すると、第2実施形態の「コンテンツ推薦演算処理(図13のステップS102の処理」が実行される。
即ち、図22のステップS261において、行列演算部(射影部)111は、複数のコンテンツに対するコンテンツメタ情報のそれぞれを推薦候補のコンテンツメタ情報として、メタ情報取得部1(文書解析部12またはメタデータ取得部13)より取得する。
ステップS262において、行列演算部(射影部)111は、複数の推薦候補のコンテンツメタ情報のそれぞれを特徴ベクトルCCV化する。即ち、行列演算部(射影部)111は、複数の推薦候補のそれぞれの特徴ベクトルCCVを生成する。
ステップS263において、行列演算部(射影部)111は、複数の推薦候補の特徴ベクトルCCVのそれぞれを最適空間UPSに射影する(即ち、各推薦候補の次元削減された特徴ベクトルCCV#のそれぞれを生成する)。
ステップS264において、マッチング演算部112は、ステップS101の「CUPV設定処理(図13、詳細は図21)」で設定した、次元削減された特定コンテクストユーザ嗜好ベクトルsCUPV#と、ステップS263の処理で生成した複数の推薦候補の次元削減された特徴ベクトルCCV#のそれぞれとの類似度を演算し、その演算結果を推薦提示部9に供給する。
すると、ステップS265において、推薦提示部9は、類似度が閾値以上の推薦候補(1つだけ提示する場合、最大の類似度の推薦候補)を推薦コンテンツとして、ユーザに提示する。
これにより、第2実施形態の「コンテンツ推薦演算処理(図13のステップS102の処理)」は終了となる。即ち、図13のコンテンツ推薦処理自体が終了となる。
このように、第2実施形態の「コンテンツ推薦処理」においては、次元削減されたベクトルが処理の対象とされるので、次元削減されない元のベクトルを処理の対象とする第1実施形態の「コンテンツ推薦処理」と比較して、処理量を削減できる効果を奏することが可能になる。
なお、第2実施形態の上述した例においても、第1実施形態と同様に、ユーザの現状のコンテクストに最も適したコンテンツを推薦コンテンツとしてユーザに提示したが、ユーザが現在使用しているコンテンツに最も適した他のコンテンツを推薦してもよい。
この場合、射影マッチング部101は次のような処理を実行する。即ち、射影マッチング部101は、はじめに、ユーザが現在使用しているコンテンツに対するコンテンツメタ情報をメタ情報取得部1から取得し、これらのコンテンツメタ情報に対して重み付けし、重み付けされたコンテンツメタ情報を、上述した標準形のベクトルのうちの対応する要素に代入することで、ユーザが現在使用しているコンテンツに対する特徴ベクトルCCVを生成する。
次に、射影マッチング部101は、生成したこの特徴ベクトルCCVと、UPV記憶部6に既に記憶されている1以上のユーザ嗜好ベクトルUPVとに対して、上述した式(4)に示される成分行列Ukの転置行列を左から掛けることで、K次元に次元削減された、ユーザが現在使用しているコンテンツに対する特徴ベクトルCCV#と1以上のユーザ嗜好ベクトルUPV#とのそれぞれを生成する。なお、ユーザ嗜好ベクトル(UPV)生成部23側で、K次元に次元削減された1以上のユーザ嗜好ベクトルUPV#を生成してもよい。
次に、射影マッチング部101は、K次元に次元削減された、ユーザが現在使用しているコンテンツに対する特徴ベクトルCCV#と1以上のユーザ嗜好ベクトルUPV#とのそれぞれの類似度を演算し、その類似度が閾値以上である、K次元に次元削減されたユーザ嗜好ベクトルUPVに基づいて、K次元の新たなユーザ嗜好ベクトルUPV(上述した、次元削減された特定コンテクストユーザ嗜好ベクトルsCUPV#に相当し、以下、UPV#と記述する)を生成する。そして、マッチング部3は、K次元に次元削減された他のコンテンツに対する特徴ベクトルCCV#と、K次元の新たなユーザ嗜好ベクトルUPV#との類似度を演算し、その演算結果を推薦提示部9に供給する。
(第3実施形態)
次に、図23乃至図25を参照して、第3実施形態の情報処理装置について説明する。
第3実施形態の情報処理装置として、第1実施形態の情報処理装置(図1)または第2実施形態の情報処理装置(図18)の何れも適用することができる。従って、第3実施形態の情報処理装置の構成の説明は省略する。ただし、以下、第3実施形態の情報処理装置として、図1の構成の情報処理装置(第1実施形態と同様の情報処理装置)が適用されたとして説明する。
次に、第3実施形態の情報処理装置(ここでは、図1)が実行するUPV生成処理について説明する。
第3実施形態のUPV生成処理においては、各コンテンツ毎のユーザ嗜好ベクトルUPV、即ち、各コンテンツユーザ嗜好ベクトルCUPV毎に、推薦候補(コンテンツ)が事前に設定される。
このような第3実施形態のUPV生成処理例が、図23のフローチャートに示されている。そこで、以下、図23を参照して、第3実施形態のUPV生成処理例について説明する。
即ち、図23に示されるように、ステップS301において、「CCV生成処理」が実行され、ステップS302において、「近似行列(空間)生成処理」が実行され、ステップS303において、「CUPV生成処理」が実行されると、ステップS304において、図1の関連情報取得部8は、各コンテンツユーザ嗜好ベクトルCUPV毎に、推薦候補(コンテンツ)を検索する。
なお、第3実施形態における、「CCV生成処理」、「近似行列(空間)生成処理」および、「CUPV生成処理」のそれぞれは、第1実施形態における対応する処理と基本的に同様の処理とされる。即ち、第3実施形態においても、例えば、「CCV生成処理」は図4のフローチャートに従って、「近似行列(空間)生成処理」は図6のフローチャートに従って、「CUPV生成処理」は図12のフローチャートに従って、それぞれ実行される。
ところで、このような関連情報取得部8の処理(ステップS304の処理)を、以下、「コンテクスト毎関連ページ取得処理」と称する。この第3実施形態の「コンテクスト毎関連ページ取得処理(ステップS304の処理)」の詳細例が図24のフローチャートに示されている。そこで、以下、図24を参照して、第3実施形態の「コンテクスト毎関連ページ取得処理(ステップS304の処理)」の詳細例について説明する。
はじめに、ステップS321において、関連情報取得部8は、ユーザ嗜好ベクトル(UPV)生成部23により生成された各コンテンツユーザ嗜好ベクトルCUPVのそれぞれに対して、各コンテンツユーザ嗜好ベクトルCUPVのうちの重みが上位2要素(ただし、コンテンツメタ情報の要素)をそれぞれ選択する。
ステップS322において、関連情報取得部8は、図示せぬインターネット等に接続し、各コンテンツユーザ嗜好ベクトルCUPV毎に選抜された上位の2要素に対応する単語、具体的には、例えば、図5のコンテンツメタ情報の項目に示される単語(“幼稚園”や“子供”等)を検索語として、コンテンツ(正確には、それが保存されているホームページのURL等、即ち、関連ページのURL等)を検索する。
ステップS323において、図1には図示されていないが、関連情報取得部8は、各コンテンツユーザ嗜好ベクトルCUPVのそれぞれと、対応する検索結果とを紐付けてUPV記憶部6に記憶させる。
これにより、第3実施形態の「コンテクスト毎関連ページ取得処理」が終了となる。
次に、図25のフローチャートを参照して、第3実施形態のコンテンツ推薦処理例について説明する。
即ち、ステップS341において、「CUPV設定処理」が実行されると、ステップS343において、図1の推薦提示部9は、特定コンテクストユーザ嗜好ベクトルsCUPVに紐付けられている検索結果、即ち、図24のステップS323の処理で、特定コンテクストユーザ嗜好ベクトルsCUPVと紐付けられてUPV記憶部6に記憶された検索結果で特定されるコンテンツを推薦コンテンツとして設定し、ユーザに提示する。
なお、第3実施形態の「CUPV設定処理」は、第1実施形態のそれと基本的に同様の処理とされる。即ち、第3実施形態においても、「CUPV設定処理」は、例えば、図14のフローチャートに従って実行されるので、ここでは、その説明については省略する。
このように、第3実施形態においては、各コンテクストユーザ嗜好ベクトルsCUPV毎に推薦候補(コンテンツの関連ページ)が事前に取得されているので、特定コンテクストユーザ嗜好ベクトルsCUPVが設定された後、改めて、特定コンテクストユーザ嗜好ベクトルsCUPVと、推薦候補の特徴ベクトルCCVとの類似度の演算処理を実行する必要がないという効果を奏することが可能になる。
即ち、第1実施形態や第2実施形態においては、現状のコンテクスト、あるいは、現在使用しているコンテンツに適合し、かつ、ユーザの嗜好に適するコンテンツが推薦される場合、毎回推薦のために、コンテンツマッチング(類似度演算処理)や、検索等が必要であるという課題が発生する。具体的には、例えば、コンテンツとして、インターネット上のホームページの推薦をする場合、検索を毎回かけてその結果を推薦するのではユーザは待ちきれないという課題が発生する。
そこで、第3実施形態においては、各コンテクストユーザ嗜好ベクトルsCUPV毎に推薦候補(コンテンツの関連ページ)が事前に取得されており、これにより、この課題を解決できる効果を奏することが可能になる。
(第4実施形態)
次に、図26乃至図29を参照して、第4実施形態の情報処理装置について説明する。
ところで、上述した他の実施の形態(第1実施形態等)で扱ったコンテンツは、例えば、ユーザのメール文書等とされており、ユーザの興味対象であることが前提とされていた。換言すると、上述した他の実施の形態においては、ユーザの興味有無の概念は取り扱われていなかった。
そこで、第4実施形態においては、ユーザの興味有無の概念を取り込むことを目的とする。即ち、例えば、最初に、複数の推薦候補の中からユーザの興味対象(或いは、興味を持たない対象)だけを選択し、さらに、そのユーザの興味対象(推薦候補)の中から、ユーザの現状のコンテクスト等に適合した推薦候補を推薦コンテンツとして選択し、ユーザに提示することを目的とする。
この目的を達成するために、第4実施形態の情報処理装置は、図26に示されるように、第1実施形態(図1)や第2実施形態(図18)のそれとは異なる構成を有している。
即ち、図26は、第4実施形態の情報処理装置の構成例を表しており、第1実施形態の情報処理装置(図1)や第2実施形態の情報処理装置(図18)と対応する部分には、対応する符号が付してある。
第4実施形態の構成例においては、第1実施形態や第2実施形態の空間およびUPV生成部2(図1と図18)の代わりに、空間生成部201と嗜好別UPV生成部202が設けられている。また、第1実施形態のマッチング部3(図1)や、第2実施形態の射影マッチング部101の代わりに、マッチング部204が設けられている。さらに、第4実施形態の情報処理装置には、SVMモデル記憶部203が新たに設けられている。
詳細には、空間生成部201は、特徴ベクトル(CCV)生成部211と行列演算部(嗜好別空間生成部)212とから構成される。
特徴ベクトル(CCV)生成部211は、第1実施形態や第2実施形態の特徴ベクトル(CCV)生成部21(図1と図18)と基本的に同様の機能と構成を有しているが、さらに、所定のコンテンツに対する特徴ベクトルCCVをCCV記憶部4に記憶させるとき、その特徴ベクトルCCVに対応するコンテンツがユーザの興味対象であるのか或いは無いのかを示す情報を、その特徴ベクトルCCVと紐付けてCCV記憶部4に記憶させる。
なお、以下、特徴ベクトルCCVに対応するコンテンツがユーザの興味対象であることを示す情報を、嗜好度+と称する。一方、特徴ベクトルCCVに対応するコンテンツがユーザの興味対象で無いことを示す情報を、嗜好度−と称する。即ち、CCV記憶部4に記憶された特徴ベクトルCCVは、嗜好度+と嗜好度−とのうちのいずれか一方と紐付けられている。
換言すると、嗜好度+と紐付けられた特徴ベクトルCCVは、ユーザの嗜好の正の要因を示す正特徴ベクトルCCVであるとも言える。これに対して、嗜好度−と紐付けられた特徴ベクトルCCVは、ユーザの嗜好の負の要因を示す負特徴ベクトルCCVであるとも言える。
また、特徴ベクトルCCVを嗜好度+または嗜好度−に紐付ける手法は特に限定されず、例えば、ユーザがコンテンツを使用する毎に、興味有無をユーザに直接入力させる手法でも構わないし、或いは、特徴ベクトルCCVの全部または一部分(例えば、コンテクスト情報を示す要素のみ)を、後述するSVM(Support Vector Machine)などで分類学習し、嗜好度+と嗜好度−のうちのいずれか一方に分類する(正特徴ベクトルCCVと負特徴ベクトルCCVとのうちのいずれか一方に分類する)手法でも構わない。
行列演算部(嗜好別空間生成部)212は、第1実施形態や第2実施形態の行列演算部(空間生成部)22(図1と図18)と基本的に同様の機能と構成を有しているが、正特徴ベクトルCCV(以下、嗜好度+の特徴ベクトルCCVとも称する)と、負特徴ベクトルCCV(以下、嗜好度−の特徴ベクトルCCVとも称する)とのそれぞれを明確に区別してその処理を実行する。
即ち、行列演算部(嗜好別空間生成部)212は、CCV記憶部4に記憶されている特徴ベクトルCCVのうちの、M個(Mは2以上の整数値)の嗜好度+の特徴ベクトルCCVを列成分とする行列CCM(N行M列)を生成する。なお、以下、嗜好度+の特徴ベクトルCCVを列成分とする行列CCMを、特に行列CCM+と記述する。
そして、行列演算部(嗜好別空間生成部)212は、例えば、行列CCM+に対して特異値分解と次元削減を行うことで(上述したLSI法を適用することで)、行列CCM+内の各要素(ユーザが嗜好する(経験した)コンテンツの属性を示すコンテンツメタ情報と、そのコンテンツを経験した時点のユーザのコンテクストを示すコンテクスト情報)のそれぞれを主成分軸に射影する。
なお、以下、このとき得られる行列(行列CCM+が次元削減された行列)を、近似行列CCM+ と記述する。また、各要素が射影された空間を、最適空間UPS+と記述する。
詳細には、行列演算部(嗜好別空間生成部)212は、N行M列の行列CCM+に対して特異値分解を施すことで、行列CCM+を上述した式(1)を満たす成分行列U,Σ,Vのそれぞれに分解する。
次に、行列演算部(嗜好別空間生成部)212は、成分行列Uの先頭のk個の列成分(左特異ベクトル)からなる行列Uk(N行k列)を生成する。また、行列演算部(嗜好別空間生成部)212は、成分行列Vの先頭のk個の列成分(右特異ベクトル)からなる行列Vk(M行k列)を生成する。さらに、行列演算部(嗜好別空間生成部)212は、成分行列Σの先頭のk個の列成分のうちの1行乃至k行までの要素(成分行列Σのうちの、k×k個の要素からなる左上成分)からなる行列Σk(k行k列)を生成する。
そして、行列演算部(空間生成部)22は、上述した式(2)の右辺を演算することで、ランクがkに縮退した行列Dkを求め、この行列Dkを、行列CCM+の近似行列CCM(以下、近似行列CCM+ と記述する)として嗜好別UPV生成部202に供給する。
また、近似行列CCM+ (=Dk)の成分行列、即ち、上述したようにして生成された行列Uk(必要に応じて、行列Vkと行列Σk)は、語彙辞書作成部7に供給されるとともに、成分行列記憶部5に記憶される。
さらに、行列演算部(嗜好別空間生成部)212は、CCV記憶部4に記憶されている特徴ベクトルCCVのうちの、M個の嗜好度−の特徴ベクトルCCVに対しても、上述した処理(M個の嗜好度+の特徴ベクトルCCVに対する処理)と全く同様の処理を施す。
即ち、行列演算部(嗜好別空間生成部)212は、M個の嗜好度−の特徴ベクトルCCVを列成分とする行列CCM(N行M列の行列CCMであって、以下、行列CCM-と記述する)に対して特異値分解と次元削減の処理を施すことで、行列CCM_の近似行列CCM(以下、近似行列CCM- と記述する)を生成し、嗜好別UPV生成部202に供給する。
また、近似行列CCM- (=Dk)の成分行列、即ち、行列Uk(必要に応じて、行列Vkと行列Σk)も、語彙辞書作成部7に供給されるとともに、成分行列記憶部5に記憶される。
次に、嗜好別UPV生成部202に着目すると、嗜好別UPV生成部202は、SVM分類学習部221とユーザ嗜好ベクトル(UPV)生成部222とから構成される。
SVM分類学習部221は、例えば、空間生成部201より供給された近似行列CCM+ または近似行列CCM_の列成分を訓練データとしてSVM(Support Vector Machine)を利用して分類学習することで、いわゆるSVMモデル(分類器)を生成し、SVMモデル記憶部203に記憶させる。
ユーザ嗜好ベクトル(UPV)生成部222は、第1実施形態や第2実施形態のユーザ嗜好ベクトル(UPV)生成部23(図1と図18)と基本的に同様の機能と構成を有している。
ただし、上述したように、ユーザ嗜好ベクトル(UPV)生成部222には、行列CCM+の近似行列CCM+ と、行列CCM-の近似行列CCM- とのそれぞれが明確に区別されて空間生成部201から供給されてくる。従って、ユーザ嗜好ベクトル(UPV)生成部222は、行列CCM+の近似行列CCM+ に基づくユーザ嗜好ベクトルUPV(コンテクストユーザ嗜好ベクトルCUPV含む)と、行列CCM-の近似行列CCM- に基づくユーザ嗜好ベクトルUPV(コンテクストユーザ嗜好ベクトルCUPV含む)との2種類を生成することができる。なお、これら2種類の何れも生成されてもよいし、何れか一方のみが生成されてもよい。ただし、ここでは、ユーザの興味対象の中から推薦コンテンツを選択することを最終目的としているので、ユーザ嗜好ベクトル(UPV)生成部222は、行列CCM+の近似行列CCM+ に基づいて、ユーザ嗜好ベクトルUPV(コンテクストユーザ嗜好ベクトルCUPV含む)を生成し、UPV記憶部6に記憶させるとする。
次に、マッチング部204に着目すると、マッチング部204は、SVM分類部231とマッチング演算部232とから構成される。
例えば、推薦提示部9が、上述した他の実施の形態と同様に、ユーザの現状のコンテクストに適したコンテンツを推薦する場合、SVM分類部231は、はじめに、メタ情報取得部1から供給された、ユーザの現状のコンテクストを示すコンテクスト情報を取得し、そのコンテクスト情報を要素とする標準形の特徴ベクトルCCV、即ち、現状コンテクスト特徴ベクトルcCCVを生成する。
次に、SVM分類部231は、SVMモデル記憶部203に記憶されているSVMモデル(分類器)を用いて、現状コンテクスト特徴ベクトルcCCVを、ユーザの興味対象とユーザの興味無対象とのうちのいずれか一方に分類し、その分類結果と現状コンテクスト特徴ベクトルcCCVとをマッチング演算部232に供給する。なお、以下、「ユーザの興味対象に分類された」ことを「+分類された」と称し、また、「ユーザの興味無対象に分類された」ことを「−分類された」と称する。
SVM分類部231より出力された現状コンテクスト特徴ベクトルcCCVが+分類された場合、マッチング演算部232は、その現状コンテクスト特徴ベクトルcCCVと、UPV記憶部6に記憶された複数のコンテクストユーザ嗜好ベクトルCUPVとの類似度を演算し、最も類似度の高いコンテクストユーザ嗜好ベクトルCUPVを、ユーザの現状のコンテクストに対するコンテクストユーザ嗜好ベクトルCUPV、即ち、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定する。
或いは、UPV記憶部6に、コンテクストユーザ嗜好ベクトルCUPVではなく、単に近似行列CCM+ の列成分(嗜好度+の特徴ベクトルCCV)がそのままユーザ嗜好ベクトルUPVとして記憶されている場合、マッチング演算部232は、現状コンテクスト特徴ベクトルcCCVと、UPV記憶部6に記憶された複数のユーザ嗜好ベクトルUPVとの類似度を演算する。そして、マッチング演算部232は、閾値以上の類似度を有する幾つかのユーザ嗜好ベクトルUPVを選択し、これらの各要素の総和を要素とする標準形のベクトル(選択されたユーザ嗜好ベクトルUPVの総和ベクトル)を、ユーザの現状のコンテクストに対するユーザ嗜好ベクトルCUPV、即ち、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定することもできる。
次に、SVM分類部231は、推薦候補となるコンテンツに対するコンテンツメタ情報がメタ情報取得部1より供給されてくる毎に、そのコンテンツメタ情報を要素とする標準形のベクトル、即ち、コンテクスト情報を示す要素の全てが0となる特徴ベクトルCCVを生成する。
そして、SVM分類部231は、SVMモデル記憶部203に記憶されているSVMモデル(分類器)を用いて、これらの特徴ベクトルCCVを分類し、+分類の特徴ベクトルCCV(以下、特徴ベクトルCCV+と記述する)のみをマッチング演算部232に供給する。
すると、マッチング演算部232は、供給された特徴ベクトルCCV+と、特定コンテクストユーザ嗜好ベクトルsCUPVとの類似度を演算し、その演算結果を推薦提示部9に供給する。
なお、空間生成部201乃至マッチング部204のそれぞれの形態は特に限定されない。特に、空間生成部201、嗜好別UPV生成部202、および、マッチング部204のそれぞれは、ソフトウエアで構成されてもよいし、ハードウエアで構成されてもよいし、或いは、ソフトウエアとハードウエアの組合せとして構成されてもよい。
また、空間生成部201乃至マッチング部204以外の構成については、図1の第1実施形態の構成(或いは、図18の第2実施形態の構成)と基本的に同様とされる。即ち、図26において、メタ情報取得部1、および、CCV記憶部4乃至推薦提示部9のそれぞれは、図1(または図18)の対応するブロックと基本的に同様の構成と機能を有しているため、これらの説明は省略する。
次に、第4実施形態の情報処理装置(図26)が実行するUPV生成処理について説明する。
第4実施形態のUPV生成処理の流れは、第1実施形態のそれ(図3)と基本的に同様とされる。即ち、第4実施形態のUPV生成処理は、上述した図3のフローチャートに従って実行される。
ただし、第4実施形態の「近似行列(空間)生成処理(ステップS2の処理)」は、第1実施形態のそれ(図6)と類似しているものの若干差異がある。
このような第4実施形態の「近似行列(空間)生成処理(ステップS2の処理)」の詳細例が図27のフローチャートに示されている。そこで、以下、図27を参照して、第4実施形態の「近似行列(空間)生成処理(ステップS2の処理)」の詳細例について説明する。
はじめに、ステップS401において、行列演算部(嗜好別空間生成部)212は、CCV記憶部4から複数の特徴ベクトルCCVを取得する(それらと対応付けられている嗜好度+または嗜好度−といった情報も取得する)。
ステップS402において、行列演算部(嗜好別空間生成部)212は、取得した複数の特徴ベクトルCCVが嗜好度+であるか否かを判定する。
ステップS402において、嗜好度+であると判定された場合、図6のステップS42乃至S45のそれぞれに対応する、ステップS403乃至S406のそれぞれが実行される。即ち、行列演算部(嗜好別空間生成部)212は、行列CCM+の近似行列CCM+ を生成してSVM分類学習部221に供給し、また、その成分行列Uk(必要に応じて、さらに、成分行列Σkと成分行列Vk)を成分行列記憶部5に記憶させる。
これに対して、ステップS402において、嗜好度−である(+ではない)と判定された場合、図6のステップS42乃至S45のそれぞれに対応する、ステップS407乃至S410のそれぞれが実行される。即ち、行列演算部(嗜好別空間生成部)212は、行列CCM-の近似行列CCM- を生成してSVM分類学習部221に供給し、また、その成分行列Uk(必要に応じて、さらに、成分行列Σkと成分行列Vk)を成分行列記憶部5に記憶させる。
その後、ステップS411において、SVM分類学習部221は、近似行列CCM(近似行列CCM+ または近似行列CCM- )を訓練データとしてSVM訓練を実行することでSVMモデルを生成し、SVMモデル記憶部203に記憶させる。
これにより、第4実施形態の「近似行列(空間)生成処理(図3のステップS2の処理)」が終了となり、上述した図2のステップS3以降の処理(第1実施形態と同様の処理)が実行される。ただし、第4実施形態においては、行列CCM+の近似行列CCM+ が処理の対象とされて、ステップS3以降の処理が実行される。
次に、第4実施形態の情報処理装置が実行する「コンテンツ推薦処理」について説明する。
第4実施形態の「コンテンツ推薦処理」の流れは、第1実施形態のそれ(図13)と基本的に同様とされる。即ち、第4実施形態の「コンテンツ推薦処理」は、上述した図13のフローチャートに従って実行される。
ただし、第4実施形態の「CUPV設定処理(ステップS101の処理)」は、第1実施形態のそれ(図14)と類似しているものの若干差異がある。同様に、第4実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」は、第1実施形態のそれ(図17)と類似しているものの若干差異がある。
このような第4実施形態における、「CUPV設定処理(ステップS101の処理)」と「コンテンツ推薦演算処理(ステップS102の処理)」のそれぞれの詳細例が図28と図29のフローチャートのそれぞれに示されている。そこで、以下、図28を参照して、第4実施形態の「CUPV設定処理(ステップS101の処理)」の詳細例について説明し、次に、図29を参照して、第4実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」の詳細例について説明する。
はじめに、図28のステップS421において、図26のSVM分類部231は、メタ情報取得部1(コンテクスト取得部14)より現状のコンテクスト情報を取得する。
ステップS422において、SVM分類部231は、現状のコンテクスト情報を特徴ベクトルCCV化する(即ち、現状コンテクスト特徴ベクトルcCCVを生成する)。
ステップS423において、SVM分類部231は、現状コンテクスト特徴ベクトルcCCVをSVMで分類する。即ち、SVM分類部231は、SVMモデル記憶部203に記憶されたSVMモデル(分類器)を用いて、現状コンテクスト特徴ベクトルcCCVを+分類と−分類とのうちのいずれか一方に分類する。
ステップS424において、SVM分類部231は、ステップS423の処理結果が+分類であるか否かを判定する。
ステップS424において、−分類である(+分類ではない)と判定された場合、第4実施形態の「CPU設定処理」は終了となる。この場合、マッチング部204は、例えば、所定のエラー出力をユーザに行ってもよい。
これに対して、ステップS424において、+分類であると判定された場合、マッチング演算部232は、ステップS425において、現状コンテクスト特徴ベクトルcCCVと、UPV記憶部6に既に記憶されている各コンテクストユーザ嗜好ベクトルCUPVとの類似度を演算する。
そして、ステップS426において、マッチング演算部232は、最大類似度のコンテクストユーザ嗜好ベクトルCUPVを、特定コンテクストユーザ嗜好ベクトルsCUPVとして設定する。
これにより、第4実施形態の「CUPV設定処理」が終了となる。
なお、図28には図示はされていないが、コンテクストユーザ嗜好ベクトルCUPVではなく、ユーザ嗜好ベクトルUPVがUPV記憶部6に記憶されている場合であっても、マッチング演算部232は、第1実施形態と同様の処理(ステップS124と同様の処理)を施すことで、特定コンテクストユーザ嗜好ベクトルsCUPVを設定することができる。
このような第4実施形態の「CUPV設定処理(図13のステップS101の処理)」が終了すると、第4実施形態の「コンテンツ推薦演算処理(図13のステップS102の処理」が実行される。
即ち、図29のステップS441において、SVM分類部231は、複数のコンテンツに対するコンテンツメタ情報のそれぞれを推薦候補のコンテンツメタ情報として、メタ情報取得部1(文書解析部12またはメタデータ取得部13)より取得する。
ステップS442において、SVM分類部231は、複数の推薦候補のコンテンツメタ情報のそれぞれを特徴ベクトルCCV化する。即ち、SVM分類部231は、複数の推薦候補のそれぞれの特徴ベクトルCCVを生成する。
ステップS443において、SVM分類部231は、複数の推薦候補の特徴ベクトルCCVのそれぞれをSVMで分類する。即ち、SVM分類部231は、SVMモデル記憶部203に記憶されたSVMモデル(分類器)を用いて、各特徴ベクトルCCVのそれぞれを+分類と−分類とのうちのいずれか一方に分類する。
ステップS444において、SVM分類部231は、+分類である推薦候補の特徴ベクトルCCVを、処理対象の特徴ベクトルCCV+として抽出する。
ステップS445において、マッチング演算部232は、ステップS101の「CUPV設定処理(図13、詳細は図28)」で設定した特定コンテクストユーザ嗜好ベクトルsCUPV*と、ステップS444の処理で抽出した各推薦候補の特徴ベクトルCCV+のそれぞれとの類似度を演算し、その演算結果を推薦提示部9に供給する。
すると、ステップS446において、推薦提示部9は、類似度が閾値以上の推薦候補(1つだけ提示する場合、最大の類似度の推薦候補)を推薦コンテンツとして、ユーザに提示する。
これにより、第4実施形態の「コンテンツ推薦演算処理(図13のステップS102の処理)」は終了となる。即ち、図13のコンテンツ推薦処理自体が終了となる。
このように、第4実施形態においては、ユーザ固有の語彙空間(行列演算部212により生成された嗜好別空間)、即ち、そのユーザにとって嗜好度+の最適空間UPSと嗜好度−の最適空間UPSとを利用して分類学習するため、分類精度がより向上するという効果を奏することが可能になる。
なお、上述した例では、主に嗜好度+の特徴ベクトルCCV(正特徴ベクトルCCV+)を処理対象としたが、勿論、嗜好度−の特徴ベクトルCCV(負特徴ベクトルCCVであって、以下、負特徴ベクトルCCV-と記述する)も処理対象とすることができる。即ち、上述した例では、ユーザの興味対象のみを考慮して推薦コンテンツを選択することを目的としたが、ユーザの興味対象の有無の両方を考慮しながら、推薦コンテンツを選択することもできる。
この場合、例えば、図26の情報処理装置は次のような処理を実行する。
即ち、空間生成部201は、上述したように、M個の正特徴ベクトルCCV+を列成分とする行列CCM+の近似行列CCM+ を生成するとともに、M個の負特徴ベクトルCCV-を列成分とする行列CCM-の近似行列CCM- を生成する。これらの近似行列CCM+ と近似行列CCM- は、嗜好別UPV生成部202に供給される。
ユーザ嗜好ベクトル(UPV)生成部222は、供給された近似行列CCM+ からユーザ嗜好ベクトルUPV(以下、正ユーザ嗜好ベクトルUPV+ と称する)を生成するとともに、供給された近似行列CCM- からユーザ嗜好ベクトルUPV(以下、負ユーザ嗜好ベクトルUPV- と称する)を生成する。これらの正ユーザ嗜好ベクトルUPV+ と負ユーザ嗜好ベクトルUPV- は、UPV記憶部6に記憶される。
このとき、図26には図示はされていないが、例えば、SVM分類部231が省略され、メタ情報取得部1からの情報はそのままマッチング演算部232に供給される。即ち、マッチング演算部232は、新たなコンテンツに対するコンテンツメタ情報等がメタ情報取得部1から供給されると、新たなコンテンツに対する特徴ベクトルCCVを生成する。次に、マッチング演算部232は、新たなコンテンツに対する特徴ベクトルCCVと、UPV記憶部6に既に記憶されている正ユーザ嗜好ベクトルUPV+ との間の第1の類似度と、新たなコンテンツに対する特徴ベクトルCCVと、UPV記憶部6に既に記憶されている負ユーザ嗜好ベクトルUPV- との間の第2の類似度とのそれぞれを演算する。このマッチング演算部232の演算結果、即ち、第1の類似度と第2の類似度は、推薦提示部9に供給される。
推薦提示部9は、供給された第1の類似度と第2の類似度に基づいて、新たなコンテンツが推薦コンテンツとして適しているか不適であるかを判定し、新たなコンテンツが推薦コンテンツとして適していると判定した場合、新たなコンテンツを推薦コンテンツとしてユーザに提示する。
具体的には、例えば、推薦提示部9は、第1の類似度が第1の閾値以上であり、かつ、第2の類似度が第2の閾値未満である場合、新たなコンテンツが推薦コンテンツとして適していると判定し、新たなコンテンツを推薦コンテンツとしてユーザに提示することができる。
或いは、例えば、推薦提示部9は、第1の類似度が第2の類似度より大きく、かつ、第2の類似度が閾値未満である場合、新たなコンテンツが推薦コンテンツとして適していると判定し、新たなコンテンツを推薦コンテンツとしてユーザに提示することができる。
(第5実施形態)
次に、図30乃至図33を参照して、第5実施形態の情報処理装置について説明する。
はじめに、本願出願人が第5実施形態の情報処理装置を発明した背景について説明する。
即ち、従来、コンテンツメタデータにはジャンルという項目があった。具体的には、例えば、テレビジョン放送番組ならば、スポーツ、ドラマ、映画、或いはバラエティといった大ジャンルが与えられ、また、大ジャンルに対する小ジャンル、例えば、バラエティに対する、コメディ、歌番組、総合、或いはその他などの小ジャンルが与えられていた。
しかしながら、従来の小ジャンルの上述した具体例からもわかるとおり、従来のジャンルでは、コンテンツを必ずしも正しく分類できるわけでなく、ユーザによって見方が異なるという課題、即ち、ユーザにとって適切なジャンルとは感じられないことが多々あるという課題があった。
そこで、この課題を解決すべく、本願出願人は次のような解決手法を発明した。
即ち、行列CCMの近似行列(上述した特異値分解と次元削減により生成された行列)CCMにおいて、コンテンツメタ情報(文書単語)を一般手法でクラスタ化し(クラス分類し)、それらの結果(クラス分類の結果得られる各クラス)のそれぞれを1つのジャンルとして設定する。なお、以下、このようにして設定されたジャンルを、上述した従来のジャンルと区別するために、UPジャンルと称する。次に、これらのUPジャンルを訓練データとして上述したSVM等で分類学習することでSVMモデル(分類器)を生成する。そして、この分類器を利用して、新たなコンテンツ(このコンテンツに対するコンテクスト情報の付加の有無は問わない)のUPジャンルを決定する、という手法である。
なお、本手法において、UPジャンルは、ジャンル名(名称)を有しなくてもよいし、最も重みの高い幾つかの要素(単語)をそのまま或いは組み合わせてジャンル名としてもよい。
また、本手法は、同一ジャンル推薦や似たもの群のユーザへの提示などに応用できる。
さらに、本願出願人は、本手法を適用する情報処理装置として、例えば、図30に示されるような情報処理装置を発明した。
即ち、図30は、第5実施形態の情報処理装置の構成例を表しており、第4実施形態の情報処理装置(図26)と対応する部分には、対応する符号が付してある。
第5実施形態の構成例においては、第4実施形態の嗜好別UPV生成部202の代わりにUPVおよびUPジャンル生成部302が、第4実施形態のマッチング部204の代わりにジャンル決定部304が、それぞれ設けられている。また、第4実施形態のSVMモデル記憶部203と同様の機能と構成を有する(ただし、記憶されるSVMモデルの内容が異なる)SVMモデル記憶部303が設けられている。
UPVおよびUPジャンル生成部302は、SVM分類学習部(UPジャンル生成部)321とユーザ嗜好ベクトル(UPV)生成部322とから構成される。
SVM分類学習部(UPジャンル生成部)321は、第4実施形態のSVM分類学習部221と同様の構成と機能を有している。ただし、SVM分類学習部(UPジャンル生成部)321が学習により生成するSVMモデルは、上述したように、新たなコンテンツのUPジャンルを決定する(分類する)ためのSVMモデルであり、第4実施形態のSVMモデル(嗜好度+と嗜好度−のうちのいずれか一方を分類するSVMモデル)とは異なっている。
ユーザ嗜好ベクトル(UPV)生成部322は、第4実施形態のユーザ嗜好ベクトル(UPV)生成部222と基本的に同様の構成と機能を有しているので、その説明については省略する。
ジャンル決定部304は、SVM分類部331から構成される。このSVM分類部331は、第4実施形態のSVM分類部231と基本的に同様の構成と機能を有している。ただし、新たなコンテンツ(それに対するコンテンツメタ情報)が供給されてきた場合、上述したように、第4実施形態のSVM分類部231は、そのコンテンツがユーザにとって嗜好度+であるのか或いは嗜好度−であるのかを決定する(+分類または−分類のうちのいずれか一方に分類する)のに対して、第5実施形態のSVM分類部321は、そのコンテンツのUPジャンルを決定する(複数のUPジャンルのうちのそのコンテンツに適するUPジャンルに分類する)。
なお、UPVおよびUPジャンル生成部302乃至ジャンル決定部304のそれぞれの形態は特に限定されない。特に、UPVおよびUPジャンル生成部302、および、ジャンル決定部304のそれぞれは、ソフトウエアで構成されてもよいし、ハードウエアで構成されてもよいし、或いは、ソフトウエアとハードウエアの組合せとして構成されてもよい。
また、UPVおよびUPジャンル生成部302乃至ジャンル決定部304以外の構成については、図26の第4実施形態の構成と基本的に同様とされる。即ち、図30において、メタ情報取得部1、空間生成部201、CCV記憶部4、成分行列記憶部5、UPV記憶部6、語彙辞書作成部7、関連情報取得部8、および、推薦提示部9のそれぞれは、図26の対応するブロックと基本的に同様の構成と機能を有しているため、これらの説明は省略する。
次に、図31のフローチャートを参照して、第5実施形態の情報処理装置(図30)が実行するUPV生成処理について説明する。
はじめに、ステップS501において「CCV生成処理」が、ステップS502において「近似行列(空間)生成処理」が、ステップS503において「CUPV生成処理」が、それぞれ実行される。
なお、「CCV生成処理(ステップS501の処理)」、「近似行列(空間)生成処理(ステップS502の処理)」、および、「CUPV生成処理(ステップS503の処理)」のそれぞれの流れは、上述した他の実施形態の対応する処理と基本的に同様の処理とされる。即ち、例えば、「CCV生成処理(ステップS501の処理)」は上述した図4のフローチャートに従って、「近似行列(空間)生成処理(ステップS502の処理)」は上述した図6のフローチャートに従って、CUPV生成処理(ステップS503の処理)」は上述した図12のフローチャートに従って、それぞれ実行される。
次に、ステップS504において、SVM分類学習部(UPジャンル生成部)321は、1以上のUPジャンルを生成する。そして、SVM分類学習部(UPジャンル生成部)321は、それらのUPジャンルを訓練データとしてSVM訓練を実行することで、SVMモデルを生成し、SVMモデル記憶部303に記憶させる。なお、このSVMモデルは、後述する図33のコンテンツ推薦演算処理のステップS544の処理で使用される。即ち、ジャンル決定部304は、新たなコンテンツが後に供給されてきた場合、このSVMモデルを用いることで、SVM分類学習部(UPジャンル生成部)321により生成された1以上のUPジャンルの中から、そのコンテンツに適するUPジャンルを分類するのである。
なお、以下、このようなSVM分類学習部(UPジャンル生成部)321の処理(ステップS504の処理)を、「UPジャンル生成処理」と称する。このような「UPジャンル生成処理(ステップS504の処理)」の詳細例が図32のフローチャートに示されている。そこで、以下、図32を参照して、「UPジャンル生成処理(ステップS504の処理)」の詳細例について説明する。
はじめに、ステップS521において、SVM分類学習部(UPジャンル生成部)321は、空間生成部201より供給された近似行列CCMの各列成分、即ち、近似行列CCMにおける特徴ベクトルCCVの要素間の類似度を演算する。
ステップS522において、SVM分類学習部(UPジャンル生成部)321は、特徴ベクトルCCVのそれぞれをクラス分類する。即ち、SVM分類学習部(UPジャンル生成部)321は、類似度が閾値以上の特徴ベクトルCCVを同一のクラスに含める。このようにして生成された各クラスのそれぞれが、ここでは、1つのUPジャンルとなる。即ち、ステップS522の処理でUPジャンルが生成される。
具体的には、例えば、図11の行列Dkが近似行列CCMとして空間生成部201より供給されてきたとすると、SVM分類学習部(UPジャンル生成部)321は、各要素(単語)の重みの傾向から、特徴ベクトルCCV 1,CCV 3,CCV 6(即ち、文章Doc1,Doc3,Doc6)を第1のジャンルとし、それ以外を第2のジャンルとすることができる。即ち、SVM分類学習部(UPジャンル生成部)321は、第1のジャンルと第2のジャンルを生成することができる。
なお、このとき、例えば、第1のジャンルを“幼稚園”,“子供”系、第2のジャンルを“会社”,“緊張”系といった名称で表現できる。
そして、ステップS523において、SVM分類学習部(UPジャンル生成部)321は、各クラス(UPジャンル)毎に、対応するクラス(UPジャンル)に属する特徴ベクトルCCV(具体的には、例えば、第1のジャンルの場合、特徴ベクトルCCV 1,CCV 3,CCV 6)を訓練データとしてSVM訓練を実行することで、SVMモデルを生成し、SVMモデル記憶部303に記憶させる。
これにより、「UPジャンル生成処理(図31のステップS504の処理)」が終了となる。即ち、図31の第5実施形態の「UPV生成処理」自体が終了となる。
次に、第5実施形態の情報処理装置が実行する「コンテンツ推薦処理」について説明する。
第5実施形態の「コンテンツ推薦処理」の流れは、第1実施形態のそれ(即ち、第4実施形態のそれ)と基本的に同様とされる。即ち、第5実施形態の「コンテンツ推薦処理」も、上述した図13のフローチャートに従って実行される。
ただし、第5実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」は、第1実施形態のそれ(図17)とは異なる。このような第5実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」の詳細例が図33のフローチャートに示されている。そこで、以下、図33を参照して、第5実施形態の「コンテンツ推薦演算処理(ステップS102の処理)」の詳細例について説明する。
はじめに、ステップS541において、図30のジャンル決定部304のSVM分類部331は、ステップS101の「CUPV設定処理(図13、詳細は図14)」で設定した特定コンテクストユーザ嗜好ベクトルsCUPVをSVMで分類し、UPジャンルを決定する。即ち、SVM分類部331は、SVMモデル記憶部203に記憶されたSVMモデル(分類器)を用いて、特定コンテクストユーザ嗜好ベクトルsCUPVを複数のUPジャンルのうちの所定の1つに分類する。
なお、ステップS541の処理結果、即ち、特定コンテクストユーザ嗜好ベクトルsCUPVのUPジャンルは、推薦提示部9に供給される。
ステップS542において、SVM分類部331は、複数のコンテンツに対するコンテンツメタ情報のそれぞれを推薦候補のコンテンツメタ情報として、メタ情報取得部1(文書解析部12またはメタデータ取得部13)より取得する。
ステップS543において、SVM分類部331は、複数の推薦候補のコンテンツメタ情報のそれぞれを特徴ベクトルCCV化する。即ち、SVM分類部331は、複数の推薦候補のそれぞれの特徴ベクトルCCVを生成する。
ステップS544において、SVM分類部331は、複数の推薦候補の特徴ベクトルCCVのそれぞれをSVMで分類して、UPジャンルを決定する。即ち、SVM分類部331は、SVMモデル記憶部203に記憶されたSVMモデル(分類器)を用いて、各特徴ベクトルCCVのそれぞれを複数のUPジャンルのうちの所定の1つに分類する。
このステップS544の処理結果、即ち、各推薦候補のそれぞれのUPジャンルは、推薦提示部9に供給される。
すると、ステップS545において、推薦提示部9は、特定コンテクストユーザ嗜好ベクトルsCUPVと同一のUPジャンルの推薦候補を推薦コンテンツとして、ユーザに提示する。
これにより、第5実施形態の「コンテンツ推薦演算処理(図13のステップS102の処理)」は終了となる。即ち、図13のコンテンツ推薦処理自体が終了となる。
このように、第5実施形態においては、コンテクスト情報も含む特徴ベクトルCCVからUPジャンルが決定され、新たなコンテンツがそれらのUPジャンルのうちの所定の1つに分類される。従って、このようにして分類されたUPジャンルには、ユーザの視点でのコンテクストも反映されていることになる。これにより、メタデータで作りこまれた従来のジャンルとは異なるユーザ独自のジャンル(UPジャンル)が自然とできるという効果を奏することが可能になる。
(その他の実施の形態)
以上、本発明が適用される情報処理装置として、第1実施形態乃至第5実施形態について説明したが、本発明は、これらの第1実施形態乃至第5実施形態に限定されず、様々な実施の形態を取ることができる。
具体的には、例えば、1台の情報処理装置に本発明を適用してもよいし、或いは、図34に示されるような複数の情報処理装置からなる情報処理システムに適用してもよい。
即ち、図34は、本発明が適用される情報処理システムの機能的構成例を示しており、上述した第1実施形態乃至第5実施形態の情報処理装置(図1、図18、図26、または図30)と対応する部分には、対応する符号が付してある。
図34に示されるように、本情報処理システムにおいては、サーバ401とクライアント403がネットワーク402を介して相互に接続されている。なお、ネットワーク402の形態は特に限定されず、例えば、有線ネットワークでもよいし、無線ネットワークでもよい。
はじめに、サーバ401に着目すると、サーバ401は、高負荷演算処理部411、演算結果記憶部412、および、通信部413から構成される。
高負荷演算処理部411は、上述した一連の処理を実行する上において高負荷となる演算処理、例えば、行列の演算処理を実行する。即ち、例えば、高負荷演算処理部411は、上述した空間およびUPV生成部2(図1または図18)、空間生成部201(図26)、嗜好別UPV生成部202(図26または図30)、並びに、UPVおよびUPジャンル生成部302(図30)のそれぞれと対応する処理を実行する(図34に示されるように、それらのブロックから構成されると捉えてもよい)。
演算結果記憶部412は、高負荷演算処理部411の演算結果(或いは、その演算に必要な情報)を記憶する。即ち、演算結果記憶部412は、CCV記憶部4(図1、図18、図26、または図30)、成分行列記憶部5(図1、図18、図26、または図30)、SVMモデル記憶部303(図26、または図30)、および、UPV記憶部6(図1、図18、図26、または図30)に相当する。
通信部413は、ネットワーク402を介するクライアント403との通信を制御する。即ち、通信部413は、クライアント403からネットワーク402を介して送信されてきた、高負荷演算処理部411が使用する各種情報を受信し、高負荷演算処理部411に供給する。或いは、通信部413は、クライアント403からネットワーク402を介して送信されてきた、ユーザが使用したコンテンツに対するコンテンツメタ情報と、そのコンテンツを使用した際のユーザのコンテクストを示すコンテクスト情報とを受信し、それらを対応付けて演算結果記憶部412に記憶させる。また、通信部413は、クライアント403が使用する各種情報を演算結果記憶部412から取得し、ネットワーク402を介してクライアント403に送信する。
次に、クライアント403に着目すると、クライアント403は、上述したメタデータ取得部1、語彙辞書作成部7、関連情報取得部8、および推薦提示部9の他、推薦演算処理部421、通信部422、音声出力部423、および、表示部424から構成される。
推薦演算処理部421は、例えば、上述したマッチング部3(図1)、射影マッチング部101(図18)、マッチング部204(図26)、および、ジャンル決定部304のそれぞれと対応する処理を実行する(図34に示されるように、それらのブロックから構成されると捉えてもよい)。
通信部422は、ネットワーク402を介するサーバ401との通信を制御する。即ち、通信部422は、図示せぬ他の情報処理装置等から送信されてきたコンテンツデータやEPGデータをネットワーク402を介して受信し、メタデータ取得部1に供給する。また、通信部422は、メタデータ取得部1から供給されたコンテンツメタ情報やコンテクスト情報を、ネットワーク402を介してサーバ401に送信する。さらに、通信部422は、サーバ401からネットワーク402を介して送信されてきた各種情報を、推薦演算処理部421、語彙辞書作成部7、および、関連情報取得部8のうちの対応するブロックに供給する。
音声出力部423は、推薦提示部9から出力された推薦コンテンツを示す情報等に音声情報が含まれている場合、その音声情報に対応する音声を出力する。また、表示部424は、推薦提示部9から出力された推薦コンテンツを示す情報等に画像(静止画像または動画像)情報が含まれている場合、その画像情報に対応する画像を表示する。
このような図34の情報処理システムは、例えば、次のような処理を実行する。
即ち、上述したように、サーバ401は、高負荷演算処理部411を有しているので(行列演算等の処理能力が高いので)、ユーザの経験を集めたユーザ嗜好空間UPS(近似行列CCM)の生成処理等の処理を実行する。
具体的には、例えば、クライアント403は、ユーザが使用したコンテンツに対するコンテンツメタ情報と、そのコンテンツをユーザが使用した際のコンテクストを示すコンテクスト情報とを、ネットワーク402を介してサーバ401に送信する。
サーバ412は、これらの情報(コンテンツメタ情報とコンテクスト情報)が一定量貯まった後に、上述した行列CCMを生成し、その行列CCMに対して特異値分解と次元削減を施すことで、近似行列CCMとその成分行列Ukk, Vk を生成し、内蔵する演算結果記憶部412に保持する。そして、サーバ412は、保持した近似行列CCMやその成分行列Ukk, Vk、或いは、これらの情報から生成されるユーザ嗜好ベクトルUPV等の情報を必要に応じてネットワーク402を介してクライアント403に送信する。
クライアント403は、これらの情報を受信すると、それらの情報を使用する処理、例えば、マッチング処理等を実行する
また、推薦コンテンツを選出する場合、第4実施形態や第5実施形態で説明した通り、事前フィルタとしてSVM等で全推薦候補のうち、ユーザのそれまでの興味に合致した推薦候補を選出するための演算処理が必要となる。図34には正確には図示されていないが、本発明の情報処理システムにおいては、この演算処理をサーバ401に実行させることもできる。例えば、第4実施形態に対応する処理を実行する場合、クライアント403が、ユーザが使用したコンテンツに対する、興味有り無しの評価(嗜好度+または嗜好度−)とコンテンツメタ情報とを対応付けて、ネットワーク402を介してサーバ401に送信する。すると、サーバ401が、上述したSVMの訓練を実行することで分離平面(上述したユーザ嗜好を示すSVMモデル)を算出し、必要に応じてネットワーク402を介してクライアント403に送信する。
なお、ユーザがプライバシーを公開したくないと所望した場合、クライアント403が分離平面を算出し、その分離平面(SVMモデル)をネットワーク402を介してサーバ401に送信することもできる。この場合、サーバ401がフィルタをかけることになり、推薦候補の全てのコンテンツメタ情報をクライアント403に送信せずとも、ユーザの嗜好に合致したもののみを送信すればよいため、通信量を押さえるという効果と、クライアント403側でのマッチング演算量を抑制する効果とを奏することが可能になる。
また、上述した処理を全てクライアント403側で行ってもよい。換言すると、上述した一連の処理が最終的に実行可能であれば、各処理のそれぞれは、サーバ401により実行されても構わないし、クライアント403により実行されても構わない。
また、上述した一連の処理は、ハードウエアにより実行させることもできるが、ソフトウエアにより実行させることができる。
この場合、第1実施形態乃至第5実施形態の情報処理装置(図1、図18、図26、または図30)、または、図34のサーバ401やクライアント403は、例えば、図35に示されるようなパーソナルコンピュータで構成することができる。
図35において、CPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記録されているプログラム、または記憶部508からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU501、ROM502、およびRAM503は、バス504を介して相互に接続されている。このバス504にはまた、入出力インタフェース505も接続されている。
入出力インタフェース505には、キーボード、マウスなどよりなる入力部506、ディスプレイなどよりなる出力部507、ハードディスクなどより構成される記憶部508、および、モデム、ターミナルアダプタなどより構成される通信部509が接続されている。通信部509は、インターネットを含むネットワークを介して他の情報処理装置(図示せず)との通信処理を行う。
入出力インタフェース505にはまた、必要に応じてドライブ510が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどよりなるリムーバブル記録媒体511が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部508にインストールされる。
一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
このようなプログラムを含む記録媒体は、図35に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フロッピディスクを含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)を含む)、もしくは半導体メモリなどよりなるリムーバブル記録媒体(パッケージメディア)511により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM502や、記憶部508に含まれるハードディスクなどで構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置や処理部により構成される装置全体を表すものである。
本実施の形態の情報処理装置の機能的構成例を示すブロック図である。 コンテクスト情報を入力するための画像例を示す図である。 図1の情報処理装置のUPV生成処理の例を説明するフローチャートである。 図3のUPV生成処理のうちのCCV生成処理の例を説明するフローチャートである。 コンテンツメタ情報とコンテクスト情報とからなる特徴ベクトルの例を示す図である。 図3のUPV生成処理のうちの近似行列(空間)生成処理の例を説明するフローチャートである。 図5の各特徴ベクトルのそれぞれを列成分とする行列を示す図である。 図7の行列を特異値分解することで得られる行列の1つを示す図である。 図7の行列を特異値分解することで得られる行列の1つを示す図である。 図7の行列を特異値分解することで得られる行列の1つを示す図である。 図5の行列に対して特異値分解と次数削減を施すことで得られる行列(図5の行列の近似行列)を示す図である。 図3のUPV生成処理のうちのCUPV生成処理の例を説明するフローチャートである。 図1の情報処理装置のコンテンツ推薦処理の例を説明するフローチャートである。 図13のコンテンツ推薦処理のうちのCUPV設定処理の例を説明するフローチャートである。 現状のコンテクスト情報から生成された、現状コンテクスト特徴ベクトルの例を示す図である。 図15の現状コンテクスト特徴ベクトルと、図11の各特徴ベクトル(近似行列の各列成分)のそれぞれとの類似度の演算結果の例を示す図である。 図13のコンテンツ推薦処理のうちのコンテンツ推薦演算処理の例を説明するフローチャートである。 本実施の形態の情報処理装置の機能的構成の他の例を示すブロック図である。 図18の情報処理装置のUPV生成処理の例を説明するフローチャートである。 図19のUPV生成処理のうちのCUPV生成処理の例を説明するフローチャートである。 図18の情報処理装置が図13のコンテンツ推薦処理を実行する場合におけるCUPV設定処理の例を説明するフローチャートである。 図18の情報処理装置が図13のコンテンツ推薦処理を実行する場合におけるコンテンツ推薦演算処理の例を説明するフローチャートである。 図1の情報処理装置のUPV生成処理の他の例を説明するフローチャートである。 図23のUPV生成処理のうちのコンテクスト毎関連ページ取得処理の例を説明するフローチャートである。 図23のUPV生成処理に対するコンテンツ推薦処理の例を説明するフローチャートである。 本実施の形態の情報処理装置の機能的構成の他の例を示すブロック図である。 図26の情報処理装置が図3のUPV生成処理を実行する場合における近似行列(空間)生成処理の例を説明するフローチャートである。 図26の情報処理装置が図13のコンテンツ推薦処理を実行する場合におけるCUPV設定処理の例を説明するフローチャートである。 図26の情報処理装置が図13のコンテンツ推薦処理を実行する場合におけるコンテンツ推薦演算処理の例を説明するフローチャートである。 本実施の形態の情報処理装置の機能的構成の他の例を示すブロック図である。 図30の情報処理装置のUPV生成処理の例を説明するフローチャートである。 図31のUPV生成処理のうちのUPジャンル生成処理の例を説明するフローチャートである。 図30の情報処理装置が図13のコンテンツ推薦処理を実行する場合におけるコンテンツ推薦演算処理の例を説明するフローチャートである。 本実施の形態の情報処理システムの構成例を示す図である。 本実施の形態の情報処理装置のハードウエア的構成例を示す図である。
符号の説明
1 メタ情報取得部, 2 空間およびUPV生成部, 3 マッチング部, 4 CCV記憶部, 5 成分行列記憶部, 6 UPV記憶部, 7 語彙辞書作成部, 8 関連情報取得部, 9 推薦提示部, 11 文書取得部, 12 文書解析部, 13 メタデータ取得部, 14 コンテクスト取得部, 21 特徴ベクトル(CCV)生成部, 22 行列演算部(空間演算部), 23 ユーザ嗜好ベクトル(UPV)生成部, 31 マッチング演算部, 41 入力部, 42 センサ, 111 射影マッチング部, 111 行列演算部(射影部), 112 マッチング演算部, 201 空間生成部, 202 嗜好別UPS生成部, 203 SVMモデル記憶部, 204 マッチング部, 211 特徴ベクトル(CCV)生成部, 212 行列演算部(嗜好別空間生成部), 221 SVM分類学習部, 222 ユーザ嗜好ベクトル(UPV)生成部, 231 SVM分類部, 232 マッチング演算部, 302 UPVおよびUPジャンル生成部, 303 SVMモデル記憶部, 304 ジャンル決定部, 321 SVM分類学習部(UPジャンル生成部), 322 ユーザ嗜好ベクトル(UPV)生成部, 331 SVM分類部, 401 サーバ, 403 クライアント, 411 高負荷演算処理部, 421 推薦演算処理部, 501 CPU, 502 ROM, 503 RAM, 508 記憶部, 511 リムーバブル記録媒体

Claims (36)

  1. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、
    前記特徴ベクトル化手段により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、
    前記行列生成手段により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化手段と、
    所定のタイミングで前記個別情報取得手段により取得された個別情報を用いて前記特徴ベクトルを生成し、前記特徴ベクトルと、前記基準ベクトル化手段により生成された前記基準ベクトルとの前記類似度を演算する類似度演算手段と
    を備え、
    前記類似度演算手段は、
    前記基準ベクトル化手段により1以上の前記基準ベクトルが既に生成されている第1のタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、
    前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、
    前記第1のタイミングの後の第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて、前記特徴ベクトルを生成し、
    前記第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて生成された前記特徴ベクトルと、前記特定コンテクスト基準ベクトルとの類似度を演算する
    とを特徴とする情報処理装置。
  2. 前記個別情報が前記コンテクスト情報である場合、前記個別情報に基づく値とは、前記ユーザの空間的な配置位置を示す場所情報に対して重み付けされた値、または、その値が正規化された値である
    ことを特徴とする請求項に記載の情報処理装置。
  3. 前記個別情報が前記コンテクスト情報である場合、前記個別情報に基づく値とは、前記ユーザの情動を示す情動情報に対して重み付けされた値、または、その値が正規化された値である
    ことを特徴とする請求項に記載の情報処理装置。
  4. 前記個別情報が前記コンテクスト情報である場合、前記個別情報に基づく値とは、前記ユーザ自身または前記ユーザの周囲に配置されるセンサが取得した値、または、その値が正規化された値である
    ことを特徴とする請求項に記載の情報処理装置。
  5. 前記基準ベクトル化手段は、前記第2の行列におけるM個の前記列成分のうちの少なくとも一部分を選択し、選択した前記列成分の対応する要素同士を加算することで前記基準ベクトルを生成する
    ことを特徴とする請求項に記載の情報処理装置。
  6. 前記基準ベクトル化手段は、前記第2の行列におけるM個の前記列成分の中から、前記コンテクスト情報に対応する要素同士の類似度が高い前記列成分を選択し、選択した前記列成分の対応する要素同士を加算することで前記基準ベクトルを生成する
    ことを特徴とする請求項に記載の情報処理装置。
  7. 前記基準ベクトル化手段は、前記第1の行列におけるM個の前記列成分の中から、前記コンテクスト情報に対応する要素同士の類似度が高い前記列成分を選択し、さらに、前記第1の行列のうちの選択した前記列成分に対応する列成分を前記第2の行列から選択し、前記第2の行列のうちの選択した前記列成分の対応する要素同士を加算することで前記基準ベクトルを生成する
    ことを特徴とする請求項に記載の情報処理装置。
  8. 前記基準ベクトル化手段は、前記行列生成手段により生成された前記第2の行列におけるM個の前記列成分のそれぞれをそのまま前記基準ベクトルとして採用することで、前記基準ベクトルを生成する
    ことを特徴とする請求項に記載の情報処理装置。
  9. 前記個別情報が前記コンテンツメタ情報である場合、前記個別情報に基づく値とは、前記コンテンツ内での登場頻度、または、前記登場頻度が正規化された値である
    ことを特徴とする請求項に記載の情報処理装置。
  10. 前記特徴ベクトルの要素に代入される前記個別情報に基づく値とは、前記個別情報の値、若しくは、前記個別情報の内容に対して重み付けされた値、又は、それらの値が正規化された値に対して、可変係数が乗算された値である
    ことを特徴とする請求項に記載の情報処理装置。
  11. 前記類似度演算手段は、新なコンテンツについての前記コンテンツメタ情報が前記個別情報取得手段により取得された場合、前記コンテンツメタ情報を用いて前記特徴ベクトルを生成し、前記特徴ベクトルと前記特定コンテクスト基準ベクトルとの類似度を演算し、
    前記類似度演算手段により演算された前記類似度が閾値以上である場合、前記新たなコンテンツを推薦コンテンツとして前記ユーザに提示する提示手段をさらに備える
    ことを特徴とする請求項に記載の情報処理装置。
  12. 前記提示手段は、前記推薦コンテンツを前記ユーザに提示する場合、さらに、前記特定コンテクスト基準ベクトルに基づいて、その推薦の理由を提示する
    ことを特徴とする請求項11に記載の情報処理装置。
  13. 前記行列生成手段は、前記第1の行列を、特異値分解により、N行N列の第1の成分行列、N行M列の第2の成分行列、および、M行M列の第3の成分行列の転置行列の積に分解し、
    前記第1の成分行列からN行K列(Kは、前記第1の行列のランクより小さい整数値)の第4の成分行列を生成し、前記第2の成分行列からK行K列の第5の成分行列を生成し、前記第3の成分行列からM行K列の第6の成分行列を生成し、
    前記第4の成分行列、前記第5の成分行列、および、前記第6の成分行列の転置行列の積を前記第2の行列として生成する
    ことを特徴とする請求項に記載の情報処理装置。
  14. 前記類似度演算手段は、
    さらに、前記現状コンテクスト特徴ベクトルと前記1以上の前記基準ベクトルとのそれぞれに対して、前記第4の成分行列の転置行列を左から掛けることで、K次元に次元削減された前記現状コンテクスト特徴ベクトルと1以上の前記基準ベクトルとのそれぞれを生成し、
    K次元に次元削減された、前記現状コンテクスト特徴ベクトルと前記基準ベクトルとの類似度を演算し、その演算結果に基づいて、K次元の前記特定コンテクスト基準ベクトルを設定し、
    前記第2のタイミングで生成された前記特徴ベクトルに対して前記第4の成分行列の転置行列を左から掛けることで、K次元に次元削減された前記特徴ベクトルをさらに生成し、
    K次元に次元削減された、前記特定コンテクスト基準ベクトルと前記特徴ベクトルとの類似度を演算する
    ことを特徴とする請求項13に記載の情報処理装置。
  15. 前記特徴ベクトル化手段は、1つの前記特徴ベクトルを生成する毎に、その特徴ベクトルを、前記ユーザの嗜好の正の要因を示す正特徴ベクトルと、前記ユーザの嗜好の負の要因を示す負特徴ベクトルのうちのいずれか一方に分類する
    ことを特徴とする請求項に記載の情報処理装置。
  16. 前記行列生成手段は、前記特徴ベクトル化手段により生成されたM個の前記正特徴ベクトルを利用して前記第2の行列を生成する
    ことを特徴とする請求項15に記載の情報処理装置。
  17. 前記行列生成手段により生成された前記第2の行列の各列成分のそれぞれを訓練データとして分類学習することで分類器を生成する学習手段と、
    新たなコンテンツについての前記コンテンツメタ情報が前記個別情報取得手段により取得された場合、前記コンテンツメタ情報を用いて前記特徴ベクトルを生成し、前記学習手段により生成された前記分類器を用いて、前記特徴ベクトルを、前記正特徴ベクトルと前記負特徴ベクトルとのうちのいずれか一方に分類する分類手段と
    をさらに備えることを特徴とする請求項16に記載の情報処理装置。
  18. 前記類似度演算手段は、前記分類手段により前記正特徴ベクトルであると分類された前記特徴ベクトルと、前特定コンテクスト基準ベクトルとの類似度を演算する
    ことを特徴とする請求項17に記載の情報処理装置。
  19. 前記行列生成手段により生成された前記第2の行列の各列成分の各要素の中から所定の要素を選択し、選択した前記要素を特定可能な単語を前記ユーザの興味語または非興味語として設定し、前記ユーザの個人辞書に登録する登録手段
    をさらに備えることを特徴とする請求項16に記載の情報処理装置。
  20. 前記行列生成手段は、前記特徴ベクトル化手段によりM個の前記負特徴ベクトルが生成された場合、さらに、M個の前記負特徴ベクトルを利用して前記第2の行列を生成し、
    前記基準ベクトル化手段は、前記行列生成手段によりM個の前記正特徴ベクトに基づいて生成された前記第2の行列から第1の基準ベクトルを生成するとともに、前記行列生成手段により前記負特徴ベクトに基づいて生成された前記第2の行列から第2の基準ベクトルを生成し、
    前記類似度演算手段は、前記第2のタイミングで生成された前記特徴ベクトルと、1以上の前記第1の基準ベクトルに基づいて生成された前記特定コンテクスト基準ベクトルとの間の第1の類似度と、前記第2のタイミングで生成された前記特徴ベクトルと、1以上の前記第2の基準ベクトルに基づいて生成された前記特定コンテクスト基準ベクトルとの間の第2の類似度とのそれぞれを演算する
    ことを特徴とする請求項16に記載の情報処理装置。
  21. 前記類似度演算手段は、前記第2のタイミングで新なコンテンツについての前記コンテンツメタ情報が前記個別情報取得手段により取得された場合、前記コンテンツメタ情報を用いて前記特徴ベクトルを取得し、前記特徴ベクトルについての前記第1の類似度と前記第2の類似度とのそれぞれを演算し、
    前記類似度演算手段により演算された前記第1の類似度と前記第2の類似度に基づいて、新たな前記コンテンツが推薦コンテンツとして適しているか不適であるかを判定し、前記新たなコンテンツが前記推薦コンテンツとして適していると判定した場合、前記新たなコンテンツを前記推薦コンテンツとしてユーザに提示する提示手段をさらに備える
    ことを特徴とする請求項20に記載の情報処理装置。
  22. 前記提示手段は、前記推薦コンテンツを前記ユーザに提示する場合、さらに、前記特定コンテクスト基準ベクトルに基づいて、その推薦の理由を提示する
    ことを特徴とする請求項21に記載の情報処理装置。
  23. 前記提示手段は、前記第1の類似度が第1の閾値以上であり、かつ、前記第2の類似度が第2の閾値未満である場合、新たな前記コンテンツが前記推薦コンテンツとして適していると判定し、前記新たなコンテンツを前記推薦コンテンツとして前記ユーザに提示する
    ことを特徴とする請求項21に記載の情報処理装置。
  24. 前記提示手段は、前記第1の類似度が前記第2の類似度より大きく、かつ、前記第2の類似度が閾値未満である場合、新たな前記コンテンツが前記推薦コンテンツとして適していると判定し、前記新たなコンテンツを前記推薦コンテンツとして前記ユーザに提示する
    ことを特徴とする請求項21に記載の情報処理装置。
  25. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段を備える情報処理装置が、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、
    所定のタイミングで前記個別情報取得手段により取得された個別情報を用いて、前記特徴ベクトルを生成し、前記特徴ベクトルと、前記基準ベクトル化ステップの処理により生成された前記基準ベクトルとの前記類似度を演算する類似度演算ステップと
    を含み、
    前記類似度演算ステップは、
    前記基準ベクトル化ステップの1以上の処理により1以上の前記基準ベクトルが既に生成されている第1のタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成するステップと、
    前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定するステップと、
    前記第1のタイミングの後の第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて、前記特徴ベクトルを生成するステップと、
    前記第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて生成された前記特徴ベクトルと、前記特定コンテクスト基準ベクトルとの類似度を演算するステップと
    を含むことを特徴とする情報処理方法。
  26. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段を備える装置を制御するコンピュータに実行させるプログラムであって、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、
    所定のタイミングで前記個別情報取得手段により取得された個別情報を用いて、前記特徴ベクトルを生成し、前記特徴ベクトルと、前記基準ベクトル化ステップの処理により生成された前記基準ベクトルとの前記類似度を演算する類似度演算ステップと
    を含み、
    前記類似度演算ステップは、
    前記基準ベクトル化ステップの1以上の処理により1以上の前記基準ベクトルが既に生成されている第1のタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成するステップと、
    前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定するステップと、
    前記第1のタイミングの後の第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて、前記特徴ベクトルを生成するステップと、
    前記第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて生成された前記特徴ベクトルと、前記特定コンテクスト基準ベクトルとの類似度を演算するステップと
    を含むことを特徴とするプログラム。
  27. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、
    前記特徴ベクトル化手段により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、
    前記行列生成手段により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル手段と、
    前記基準ベクトル手段により1つの前記基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補を取得する候補取得手段と、
    前記基準ベクトル化手段により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算手段と、
    前記候補取得手段により事前に取得された前記コンテンツの候補のうちの、前記類似度演算手段により設定された前記特定コンテクスト基準ベクトルに基づいて取得された前記コンテンツの候補を、推薦コンテンツとして前記ユーザに提示する提示手段と
    を備えることを特徴とする情報処理装置。
  28. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える情報処理装置が、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、
    前記基準ベクトルステップの処理により1つの前記基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補を前記コンテンツ取得手段により取得させる候補取得ステップと、
    前記基準ベクトル化ステップの処理により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、
    前記候補取得ステップの処理により事前に取得された前記コンテンツの候補のうちの、前記類似度演算ステップの処理により設定された前記特定コンテクスト基準ベクトルに基づいて取得された前記コンテンツの候補を、推薦コンテンツとして前記ユーザに前記提示手段により提示させる提示ステップと
    を含むことを特徴とする情報処理方法。
  29. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える装置を制御するコンピュータに実行させるプログラムであって、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、
    前記基準ベクトルステップの処理により1つの前記基準ベクトルが生成される毎に、その基準ベクトルに基づいてユーザに推薦すべきコンテンツの候補を前記コンテンツ取得手段により取得させる候補取得ステップと、
    前記基準ベクトル化ステップの処理により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、
    前記候補取得ステップの処理により事前に取得された前記コンテンツの候補のうちの、前記類似度演算ステップの処理により設定された前記特定コンテクスト基準ベクトルに基づいて取得された前記コンテンツの候補を、推薦コンテンツとして前記ユーザに前記提示手段により提示させる提示ステップと
    を含むことを特徴とするプログラム。
  30. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、
    前記特徴ベクトル化手段により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、
    前記行列生成手段により生成された前記第2の行列におけるM個の前記列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の前記列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定手段と
    前記行列生成手段により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化手段と、
    前記基準ベクトル化手段により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算手段と、
    前記類似度演算手段により設定された前記特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、前記ジャンル設定手段により設定された複数の前記ジャンルのうちの何れか1つに分類する分類手段と、
    前記分類手段により前記特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された前記候補を、推薦コンテンツとして前記ユーザに提示する提示手段と
    を備えることを特徴とする情報処理装置。
  31. 前記ジャンル設定手段は、設定した前記ジャンル毎に、対応するジャンルに属する前記列成分のそれぞれを訓練データとして分類学習することで分類器を生成し、
    前記ジャンル設定手段は、前記ジャンル設定手段により生成された前記分類器を用いて、前記特定コンテクスト基準ベクトル及び前記複数の候補の各々のジャンルを分類す
    とを特徴とする請求項30に記載の情報処理装置。
  32. 前記ジャンル設定手段は、1つの前記ジャンルを設定する毎に、そのジャンルに属する前記列成分の各要素の中から所定の要素を選択し、選択した前記要素に基づいてそのジャンルの名称を決定する
    ことを特徴とする請求項30に記載の情報処理装置。
  33. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える情報処理装置が、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の前記列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の前記列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定ステップと
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、
    前記基準ベクトル化ステップの処理により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、
    前記類似度演算ステップにより設定された前記特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、前記ジャンル設定ステップの処理により設定された複数の前記ジャンルのうちの何れか1つに分類する分類ステップと、
    前記分類ステップの処理により前記特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された前記候補を、推薦コンテンツとして前記ユーザに提示する提示ステップと
    を含むことを特徴とする情報処理方法。
  34. コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、コンテンツを取得するコンテンツ取得手段と、情報を提示する提示手段とを備える装置を制御するコンピュータに実行させるプログラムであって、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の前記列成分のそれぞれの間の類似度を演算し、それらの類似度に基づいてM個の前記列成分のそれぞれをクラス分類し、その結果得られる各クラスのそれぞれを1つのジャンルとして設定するジャンル設定ステップと
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル化ステップと、
    前記基準ベクトル化ステップの処理により1以上の前記基準ベクトルが既に生成されているタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定する類似度演算ステップと、
    前記類似度演算ステップにより設定された前記特定コンテクスト基準ベクトル、及び、ユーザに推薦すべきコンテンツの複数の候補の各々を、前記ジャンル設定ステップの処理により設定された複数の前記ジャンルのうちの何れか1つに分類する分類ステップと、
    前記分類ステップの処理により前記特定コンテクスト基準ベクトルのジャンルと同一のジャンルに分類された前記候補を、推薦コンテンツとして前記ユーザに提示する提示ステップと
    を含むことを特徴とするプログラム。
  35. サーバと、ユーザが使用するクライアントとからなる情報処理システムにおいて、
    コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、前記ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段と、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化手段と、
    前記特徴ベクトル化手段により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成手段と、
    前記行列生成手段により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトル手段と、
    所定のタイミングで前記個別情報取得手段により取得された個別情報を用いて前記特徴ベクトルを生成し、前記特徴ベクトルと、前記基準ベクトル手段により生成された前記基準ベクトルとの前記類似度を演算する類似度演算手段と
    を備え、
    前記類似度演算手段は、
    前記基準ベクトル化手段により1以上の前記基準ベクトルが既に生成されている第1のタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、
    前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、
    前記第1のタイミングの後の第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて、前記特徴ベクトルを生成し、
    前記第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて生成された前記特徴ベクトルと、前記特定コンテクスト基準ベクトルとの類似度を演算し、
    前記サーバは、前記特徴ベクトル化手段、前記行列生成手段、前記基準ベクトル手段、および、前記類似度演算手段のうちの、少なくとも前記行列生成手段を備える
    ことを特徴とする情報処理システム。
  36. サーバと、ユーザが使用するクライアントとからなる情報処理システムの情報処理方法において、
    コンテンツ全体若しくはその一部分または前記コンテンツの属性を示すコンテンツメタ情報と、前記ユーザの内的また外的な状況を示すコンテクスト情報とを、それぞれ個別情報として取得する個別情報取得手段を前記サーバ又は前記クライアントが備え、
    前記コンテンツメタ情報の所定の1種類が対応付けられているN1個(N1は1以上の整数値)の要素と、前記コンテクスト情報の所定の1種類が対応付けられているN2個(N2は1以上の整数値)の要素との総計N個(N=N1+N2)の要素からなる標準形のベクトルであって、前記N個の要素のそれぞれに、対応する種類の前記個別情報が前記個別情報取得手段により取得された場合には前記個別情報に基づく値を代入し、取得されない場合には所定値を代入することによって構成されるベクトルを、特徴ベクトルとして生成する処理を前記ユーザがコンテンツを使用する毎に実行する特徴ベクトル化ステップと、
    前記特徴ベクトル化ステップの処理により生成されたM個の前記特徴ベクトルを列成分とするN行M列の第1の行列を生成し、M個の前記列成分のそれぞれにおけるN個の行列要素間の関係のそれぞれを強調させる演算を前記第1の行列に対して施すことで、N×M個の前記行列要素のうちの少なくとも一部の内容を更新した第2の行列を生成する行列生成ステップと、
    前記行列生成ステップの処理により生成された前記第2の行列におけるM個の列成分に基づいて、類似度の演算の基準となる前記標準形のベクトルを、基準ベクトルとして生成する基準ベクトルステップと、
    所定のタイミングで前記個別情報取得手段により取得された個別情報を用いて前記特徴ベクトルを生成し、前記特徴ベクトルと、前記基準ベクトルステップの処理により生成された前記基準ベクトルとの前記類似度を演算する類似度演算ステップと
    を含み、
    前記類似度演算ステップは、
    前記基準ベクトル化ステップの処理により1以上の前記基準ベクトルが既に生成されている第1のタイミングで、前記個別情報取得手段により取得された前記コンテクスト情報を用いて、前記特徴ベクトルを、現状コンテクスト特徴ベクトルとして生成し、
    前記現状コンテクスト特徴ベクトルと、既に生成されている前記1以上の基準ベクトルとの類似度を演算し、前記類似度が最も高い前記基準ベクトルを、特定コンテクスト基準ベクトルとして設定し、
    前記第1のタイミングの後の第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて、前記特徴ベクトルを生成し、
    前記第2のタイミングで前記個別情報取得手段により取得された前記個別情報を用いて生成された前記特徴ベクトルと、前記特定コンテクスト基準ベクトルとの類似度を演算し、
    前記サーバは、前記特徴ベクトル化ステップ、前記行列生成ステップ、前記基準ベクトルステップ、および、前記類似度演算ステップのうちの、少なくとも前記行列生成ステップの処理を実行する
    ことを特徴とする情報処理方法。
JP2003403146A 2003-12-02 2003-12-02 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法 Expired - Fee Related JP4428036B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2003403146A JP4428036B2 (ja) 2003-12-02 2003-12-02 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
US10/987,158 US7487151B2 (en) 2003-12-02 2004-11-15 Information processing apparatus, information processing method, program for implementing information processing method, information processing system, and method for information processing system
EP04028600A EP1550976A3 (en) 2003-12-02 2004-12-02 Information processing apparatus, information processing method, program for implementing information processing method, information processing system, and method for information processing system
CNB2004100979672A CN100365628C (zh) 2003-12-02 2004-12-02 信息处理设备、方法及其程序、信息处理系统及其方法
CN2007101400694A CN101101560B (zh) 2003-12-02 2004-12-02 信息处理设备和信息处理方法
EP08100595A EP1909203A3 (en) 2003-12-02 2004-12-02 Apparatus, method and program for information processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003403146A JP4428036B2 (ja) 2003-12-02 2003-12-02 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法

Publications (3)

Publication Number Publication Date
JP2005165632A JP2005165632A (ja) 2005-06-23
JP2005165632A5 JP2005165632A5 (ja) 2007-01-18
JP4428036B2 true JP4428036B2 (ja) 2010-03-10

Family

ID=34567534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003403146A Expired - Fee Related JP4428036B2 (ja) 2003-12-02 2003-12-02 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法

Country Status (4)

Country Link
US (1) US7487151B2 (ja)
EP (2) EP1550976A3 (ja)
JP (1) JP4428036B2 (ja)
CN (2) CN100365628C (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060004732A1 (en) * 2002-02-26 2006-01-05 Odom Paul S Search engine methods and systems for generating relevant search results and advertisements
US7716207B2 (en) * 2002-02-26 2010-05-11 Odom Paul S Search engine methods and systems for displaying relevant topics
US20030233655A1 (en) * 2002-06-18 2003-12-18 Koninklijke Philips Electronics N.V. Method and apparatus for an adaptive stereotypical profile for recommending items representing a user's interests
JP2006048320A (ja) * 2004-08-04 2006-02-16 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP4543930B2 (ja) * 2005-01-07 2010-09-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
EP1879391A1 (en) * 2005-04-07 2008-01-16 Softbank BB Corp. Contents distribution system, and contents distribution method
WO2006116395A2 (en) * 2005-04-26 2006-11-02 Rdr Technologies, Llc System for data archiving and system behavior prediction
US7672916B2 (en) * 2005-08-16 2010-03-02 The Trustees Of Columbia University In The City Of New York Methods, systems, and media for music classification
US7779011B2 (en) 2005-08-26 2010-08-17 Veveo, Inc. Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof
US7788266B2 (en) 2005-08-26 2010-08-31 Veveo, Inc. Method and system for processing ambiguous, multi-term search queries
JP4256371B2 (ja) * 2005-09-08 2009-04-22 株式会社東芝 視聴推薦装置及び方法
JP2007073014A (ja) * 2005-09-09 2007-03-22 Denso It Laboratory Inc 情報提供装置及び情報提供方法
US7877387B2 (en) 2005-09-30 2011-01-25 Strands, Inc. Systems and methods for promotional media item selection and promotional program unit generation
DE102005049769A1 (de) * 2005-10-18 2007-04-26 Robert Bosch Gmbh Informationsverarbeitungssystem sowie Verfahren zum Verarbeiten von Informationen in Bezug auf aufeinanderfolgende Einheiten
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
WO2007064639A2 (en) * 2005-11-29 2007-06-07 Scientigo, Inc. Methods and systems for providing personalized contextual search results
US7529741B2 (en) 2006-03-06 2009-05-05 Veveo, Inc. Methods and systems for segmenting relative user preferences into fine-grain and coarse-grain collections
JP2007241888A (ja) 2006-03-10 2007-09-20 Sony Corp 情報処理装置および方法、並びにプログラム
EP2911071A1 (en) 2006-04-20 2015-08-26 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
US20080005068A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Context-based search, retrieval, and awareness
US20080077659A1 (en) * 2006-09-22 2008-03-27 Cuneyt Ozveren Content Discovery For Peer-To-Peer Collaboration
US20080096532A1 (en) * 2006-10-24 2008-04-24 International Business Machines Corporation Emotional state integrated messaging
US8078884B2 (en) * 2006-11-13 2011-12-13 Veveo, Inc. Method of and system for selecting and presenting content based on user identification
CN101226523B (zh) * 2007-01-17 2012-09-05 国际商业机器公司 数据概况分析方法和系统
US7788267B2 (en) * 2007-02-26 2010-08-31 Seiko Epson Corporation Image metadata action tagging
US7827186B2 (en) * 2007-09-28 2010-11-02 Amazon Technologies, Inc. Duplicate item detection system and method
US7779040B2 (en) * 2007-09-27 2010-08-17 Amazon Technologies, Inc. System for detecting associations between items
US8943539B2 (en) 2007-11-21 2015-01-27 Rovi Guides, Inc. Enabling a friend to remotely modify user data
EP2068276A1 (en) 2007-12-04 2009-06-10 Sony Corporation Information processing device and method, program, and recording medium
JP4538760B2 (ja) * 2007-12-04 2010-09-08 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP4538758B2 (ja) * 2007-12-04 2010-09-08 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP4466733B2 (ja) * 2007-12-14 2010-05-26 ソニー株式会社 コンテンツ処理装置および方法、プログラム、並びに記録媒体
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP4678546B2 (ja) * 2008-09-08 2011-04-27 ソニー株式会社 推薦装置および方法、プログラム、並びに記録媒体
JP4650541B2 (ja) * 2008-09-08 2011-03-16 ソニー株式会社 推薦装置および方法、プログラム、並びに記録媒体
WO2010075888A1 (en) * 2008-12-30 2010-07-08 Telecom Italia S.P.A. Method and system of content recommendation
US20100191734A1 (en) * 2009-01-23 2010-07-29 Rajaram Shyam Sundar System and method for classifying documents
US8738354B2 (en) * 2009-06-19 2014-05-27 Microsoft Corporation Trans-lingual representation of text documents
US20100325137A1 (en) * 2009-06-23 2010-12-23 Yuri Luis Paez Method and system for musical multimedia content classification, creation and combination of musical multimedia play lists based on user contextual preferences
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
US20110185384A1 (en) * 2010-01-28 2011-07-28 Futurewei Technologies, Inc. System and Method for Targeted Advertisements for Video Content Delivery
US20110191330A1 (en) * 2010-02-04 2011-08-04 Veveo, Inc. Method of and System for Enhanced Content Discovery Based on Network and Device Access Behavior
US8490056B2 (en) * 2010-04-28 2013-07-16 International Business Machines Corporation Automatic identification of subroutines from test scripts
US8255401B2 (en) * 2010-04-28 2012-08-28 International Business Machines Corporation Computer information retrieval using latent semantic structure via sketches
US9122760B2 (en) 2010-10-12 2015-09-01 Robert Osann, Jr. User preference correlation for web-based selection
JP5578040B2 (ja) * 2010-11-15 2014-08-27 ソニー株式会社 情報処理装置および方法、情報処理システム、並びに、プログラム
CN102467709B (zh) 2010-11-17 2017-03-01 阿里巴巴集团控股有限公司 一种发送商品信息的方法和装置
JP5528388B2 (ja) * 2011-04-11 2014-06-25 日本電信電話株式会社 情報推薦装置及び方法及びプログラム
JP2015028670A (ja) * 2011-10-26 2015-02-12 日本電気株式会社 情報処理装置、識別器、情報処理方法及び情報処理プログラム
US20130179252A1 (en) * 2012-01-11 2013-07-11 Yahoo! Inc. Method or system for content recommendations
US9208219B2 (en) * 2012-02-09 2015-12-08 Stroz Friedberg, LLC Similar document detection and electronic discovery
EP2817692B1 (en) 2012-02-22 2020-07-29 Nokia Technologies Oy A system, a data structure for controlling the system, and a method for updating the data structure
US20130246926A1 (en) * 2012-03-13 2013-09-19 International Business Machines Corporation Dynamic content updating based on user activity
JP5507607B2 (ja) * 2012-04-06 2014-05-28 ヤフー株式会社 コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム
US9355088B2 (en) 2013-07-12 2016-05-31 Microsoft Technology Licensing, Llc Feature completion in computer-human interactive learning
US9326030B2 (en) * 2013-07-30 2016-04-26 Google Inc. Systems and methods for triggering user notifications of media content items
EP2869213A1 (en) * 2013-10-31 2015-05-06 Alcatel Lucent Media content ordering system and method for ordering media content
US20160027123A1 (en) * 2014-07-22 2016-01-28 Gastke Inc. Automatic tagging of trial balance
US10891294B1 (en) 2014-07-22 2021-01-12 Auditfile, Inc. Automatically migrating computer content
US9921731B2 (en) 2014-11-03 2018-03-20 Cerner Innovation, Inc. Duplication detection in clinical documentation
EP3256966B1 (en) * 2015-02-11 2023-04-05 Hulu, LLC Relevance table aggregation in a database system
WO2016170561A1 (en) * 2015-04-24 2016-10-27 Nec Corporation An information processing system and an information processing method for semantic enrichment of text
US10191949B2 (en) * 2015-06-18 2019-01-29 Nbcuniversal Media, Llc Recommendation system using a transformed similarity matrix
CN105631600A (zh) * 2016-01-07 2016-06-01 平安科技(深圳)有限公司 车险查勘任务的发布方法及系统
JP6608721B2 (ja) * 2016-02-09 2019-11-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ データ分析装置及びプログラム
US11146865B2 (en) 2016-03-03 2021-10-12 Comcast Cable Communications, Llc Determining points of interest in a content item
US10776534B2 (en) * 2016-03-31 2020-09-15 Varian Medical Systems, Inc. LINAC simulator
JP6668892B2 (ja) * 2016-03-31 2020-03-18 富士通株式会社 アイテム推薦プログラム、アイテム推薦方法およびアイテム推薦装置
CN105898576A (zh) * 2016-06-17 2016-08-24 青岛海信传媒网络技术有限公司 基于电视应用程序的数据推荐方法及数据服务器
US10223359B2 (en) * 2016-10-10 2019-03-05 The Directv Group, Inc. Determining recommended media programming from sparse consumption data
US10191990B2 (en) 2016-11-21 2019-01-29 Comcast Cable Communications, Llc Content recommendation system with weighted metadata annotations
US10824934B2 (en) * 2017-01-12 2020-11-03 Texas Instruments Incorporated Methods and apparatus for matrix processing in a convolutional neural network
US11037330B2 (en) * 2017-04-08 2021-06-15 Intel Corporation Low rank matrix compression
US10430512B1 (en) * 2018-05-24 2019-10-01 Slack Technologies, Inc. Methods, apparatuses and computer program products for formatting messages in a messaging user interface within a group-based communication system
WO2020150163A1 (en) 2019-01-14 2020-07-23 Punchh Inc. Encoding textual data for personalized inventory management
KR102309558B1 (ko) * 2019-10-30 2021-10-05 주식회사 비트코퍼레이션 날씨와 기상 데이터에 기초한 학습 모델을 통해 커피 메뉴의 추천을 수행하는 커피 메뉴 추천 장치 및 그 동작 방법
US11573721B2 (en) * 2021-06-24 2023-02-07 International Business Machines Corporation Quality-performance optimized identification of duplicate data
CN113660083B (zh) * 2021-08-12 2023-08-04 云南电网有限责任公司信息中心 一种基于共有知识的对称密钥生成方法
JP7083104B1 (ja) 2021-10-19 2022-06-10 株式会社エクサウィザーズ 情報処理方法、装置及びプログラム
JP7164060B1 (ja) 2022-02-22 2022-11-01 富士電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN115600013B (zh) * 2022-12-13 2023-04-07 深圳市爱聊科技有限公司 用于多主体之间匹配推荐的数据处理方法和装置

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4839853A (en) 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
US5301109A (en) 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US6327051B1 (en) * 1995-12-22 2001-12-04 Canon Kabushiki Kaisha Printing control apparatus and method
JPH10269091A (ja) * 1997-03-24 1998-10-09 Canon Inc 情報処理装置及びその方法
JP4054399B2 (ja) * 1997-03-24 2008-02-27 キヤノン株式会社 情報処理装置及びその方法
JPH1153394A (ja) * 1997-07-29 1999-02-26 Just Syst Corp 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
US6822758B1 (en) * 1998-07-01 2004-11-23 Canon Kabushiki Kaisha Image processing method, system and computer program to improve an image sensed by an image sensing apparatus and processed according to a conversion process
KR100671098B1 (ko) 1999-02-01 2007-01-17 주식회사 팬택앤큐리텔 모양정보를 이용한 멀티미디어 데이터의 검색 방법 및 장치
US6510406B1 (en) 1999-03-23 2003-01-21 Mathsoft, Inc. Inverse inference engine for high performance web search
JP2001043236A (ja) * 1999-07-30 2001-02-16 Matsushita Electric Ind Co Ltd 類似語抽出方法、文書検索方法及びこれらに用いる装置
US6873706B1 (en) * 1999-09-29 2005-03-29 Hitachi, Ltd. Processing apparatus, program, or system of secret information
JP3335602B2 (ja) 1999-11-26 2002-10-21 株式会社クリエイティブ・ブレインズ 思考系の解析方法および解析装置
US7349880B1 (en) * 2000-01-27 2008-03-25 Sbi Securities Co., Ltd. Commerce information processor, commerce terminal, commerce information processing method, and recorded medium
US6934964B1 (en) 2000-02-08 2005-08-23 Koninklijke Philips Electronics N.V. Electronic program guide viewing history generator method and system
US8539002B2 (en) 2000-03-14 2013-09-17 Koninklijke Philips N.V. Subjective information record for linking subjective information about a multimedia content with the content
WO2001076232A1 (en) * 2000-03-30 2001-10-11 Sony Corporation Information processor
JP2001325516A (ja) * 2000-05-16 2001-11-22 Sony Corp 情報提供装置および方法、情報処理装置および方法、並びにプログラム格納媒体
JP3573688B2 (ja) * 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
US8020183B2 (en) * 2000-09-14 2011-09-13 Sharp Laboratories Of America, Inc. Audiovisual management system
JP2002190945A (ja) * 2000-10-12 2002-07-05 Canon Inc 情報処理装置及びその制御方法及び記憶媒体
US6996418B2 (en) * 2000-12-29 2006-02-07 Nortel Networks Limited Apparatus and method for OFDM data communications
EP1231767B1 (en) * 2001-02-09 2011-04-13 Canon Kabushiki Kaisha Information processing apparatus and its control method, computer program, and storage medium
US6917842B2 (en) * 2001-02-20 2005-07-12 Canon Kabushiki Kaisha Information processing apparatus and method
DE60221728T2 (de) * 2001-02-20 2007-12-27 Canon K.K. Informationsverarbeitungsgerät und -vorrichtung
US7181017B1 (en) * 2001-03-23 2007-02-20 David Felsher System and method for secure three-party communications
JP4064647B2 (ja) * 2001-08-24 2008-03-19 富士通株式会社 情報処理装置及び入力操作装置
US6661410B2 (en) * 2001-09-07 2003-12-09 Microsoft Corporation Capacitive sensing and data input device power management
JP2003108609A (ja) * 2001-09-26 2003-04-11 Mazda Motor Corp 構造体形状のモーフィング方法及びそのコンピュータ・プログラム、並びにコンピュータ読み取り可能な記憶媒体
JP2003108344A (ja) * 2001-09-28 2003-04-11 Canon Inc 診断装置及び診断システム及び診断方法及びプログラム並びに媒体
US7315821B2 (en) * 2002-01-31 2008-01-01 Sanyo Electric Co., Ltd. System and method for health care information processing based on acoustic features
JP2003288362A (ja) * 2002-03-27 2003-10-10 Seiko Epson Corp 特定要素ベクトル生成装置、文字列ベクトル生成装置、類似度算出装置、特定要素ベクトル生成プログラム、文字列ベクトル生成プログラム及び類似度算出プログラム、並びに特定要素ベクトル生成方法、文字列ベクトル生成方法及び類似度算出方法
JP4136731B2 (ja) * 2002-04-24 2008-08-20 キヤノン株式会社 情報処理方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US7227998B2 (en) * 2002-06-11 2007-06-05 Canon Kabushiki Kaisha Image processing apparatus, control method of the same, computer program, and computer-readable storage medium
JP3919613B2 (ja) * 2002-06-28 2007-05-30 キヤノン株式会社 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP3958128B2 (ja) * 2002-06-28 2007-08-15 キヤノン株式会社 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP4054619B2 (ja) * 2002-06-28 2008-02-27 キヤノン株式会社 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2004056630A (ja) * 2002-07-23 2004-02-19 Sony Corp 制御システム、制御装置および方法、記録媒体、並びにプログラム
EP1398694B1 (en) * 2002-07-26 2013-09-11 Canon Kabushiki Kaisha Information processing method
US6954867B2 (en) * 2002-07-26 2005-10-11 Microsoft Corporation Capacitive sensing employing a repeatable offset charge
JP4185346B2 (ja) * 2002-10-18 2008-11-26 株式会社日立製作所 ストレージ装置及びその構成設定方法
JP4218951B2 (ja) * 2003-09-19 2009-02-04 キヤノン株式会社 画像形成装置、制御方法、及び制御プログラム
JP4144580B2 (ja) * 2004-08-31 2008-09-03 ソニー株式会社 情報処理装置および方法、プログラム並びに記録媒体

Also Published As

Publication number Publication date
CN101101560B (zh) 2010-06-02
CN100365628C (zh) 2008-01-30
CN101101560A (zh) 2008-01-09
EP1550976A3 (en) 2006-12-27
CN1624696A (zh) 2005-06-08
JP2005165632A (ja) 2005-06-23
US7487151B2 (en) 2009-02-03
EP1550976A2 (en) 2005-07-06
US20050165782A1 (en) 2005-07-28
EP1909203A3 (en) 2011-10-19
EP1909203A2 (en) 2008-04-09

Similar Documents

Publication Publication Date Title
JP4428036B2 (ja) 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
CN110674410B (zh) 用户画像构建、内容推荐方法、装置及设备
JP4471737B2 (ja) グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム
EP1154358A2 (en) Automatic text classification system
US20020099730A1 (en) Automatic text classification system
US9973815B2 (en) Apparatus, method, and program for processing information
US7565361B2 (en) Method and system for lexical mapping between document sets having a common topic
JP2006048286A (ja) 情報処理装置および方法、並びにプログラム
JP2012027845A (ja) 情報処理装置、関連文提供方法、及びプログラム
US20090089265A1 (en) Information processing apparatus, information processing method, and program
WO2007043679A1 (ja) 情報処理装置およびプログラム
CN109920409B (zh) 一种声音检索方法、装置、系统及存储介质
US20190057258A1 (en) Video Content Summarization and Class Selection
CN101116073A (zh) 信息处理设备、信息处理方法及程序
JP2011145742A (ja) 情報処理装置、情報処理方法、およびプログラム
US20210200799A1 (en) System and method for improved content discovery
Kordabadi et al. A movie recommender system based on topic modeling using machine learning methods
D'Addio et al. A collaborative filtering approach based on user's reviews
JP2002342360A (ja) 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
JP2010271800A (ja) 回答文書分類装置、回答文書分類方法及びプログラム
JP2010277462A (ja) 行動推薦装置及び方法及びプログラム
Kurimo Thematic indexing of spoken documents by using self-organizing maps
KR102072723B1 (ko) 콘텐츠 추천어 제공 방법 및 그 콘텐츠 제공 장치
Shepstone et al. Audio-based granularity-adapted emotion classification
JP5478146B2 (ja) 番組検索装置および番組検索プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061127

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees