JP4538760B2

JP4538760B2 - 情報処理装置および方法、プログラム、並びに記録媒体

Info

Publication number: JP4538760B2
Application number: JP2008122172A
Authority: JP
Inventors: 慎吾高松; 啓舘野; 智弘角田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2007-12-04
Filing date: 2008-05-08
Publication date: 2010-09-08
Anticipated expiration: 2028-05-08
Also published as: JP2009157899A; CN101452478A

Description

本発明は、情報処理装置および方法、プログラム、並びに記録媒体に関し、特に、より効果的にユーザ又はコンテンツの類似性を判断できるようにする情報処理装置および方法、プログラム、並びに記録媒体に関する。

近年、インターネットなどにおいて、あるユーザに他のユーザを紹介するウェブサービスが行われている。このサービスはユーザ同士の出会いや、他のユーザを介した新しいコンテンツとの出会いを促進し、新しいユーザ体験を提供することができる。

このようなサービスは、ユーザがウェブサイトを利用することによって生じるユーザ情報を解析し、紹介するユーザを決定している。ここでユーザ情報とは、例えば、ユーザのサイト利用履歴や、ユーザが公開したコンテンツの情報などである。例えば、非特許文献１のウェブサイトではユーザが公開した視聴音楽の履歴を解析することにより、類似ユーザを紹介するサービスが提供されている。

このようなサービスでは、例えば、ユーザ利用履歴やユーザが公開したコンテンツ（すなわちユーザ情報）の一部が一致したユーザを類似ユーザとして紹介するサービスが大半を占めている。

また、例えば、コンテンツなどを推薦するために、適切なユーザの嗜好情報をベクトルとして生成する技術も提案されている（例えば、特許文献１参照）。

http://www.last.fm 特開２００５−１６５６３２号公報

しかしながら、従来のサービスでは、ユーザ情報の特定の要素などにおいて一致する部分はないが、総じて似ているユーザ情報をもつユーザが類似ユーザとは判断されないという問題があり、ユーザ情報の特定の要素の一致不一致だけで類似ユーザを判断することは不十分である。またコンテンツの類似性を考慮していない点も不十分である。

本発明はこのような状況に鑑みてなされたものであり、より効果的にユーザ又はコンテンツの類似性を判断できるようにするものである。

本発明の第１の側面は、ユーザが利用したコンテンツに関する情報を取得するユーザ情報取得手段と、前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報含むコンテンツメタ情報を取得するメタ情報取得手段と、予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成する第１のベクトル生成手段と、前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成する第２のベクトル生成手段と、複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するユーザ特定手段とを備え、前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する情報処理装置である。

前記紹介ユーザの一覧を、前記利用ユーザに提示する画面のデータを生成する紹介ユーザ提示手段をさらに備え、前記紹介ユーザ提示手段は、前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素に基づいて、前記利用ユーザに前記紹介ユーザを紹介する紹介理由を生成するようにすることができる。

前記紹介理由は、前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素のうち、値の大きい順に抽出された所定の個数の要素の名前に基づいて生成されるようにすることができる。

前記紹介ユーザ提示手段は、さらに、前記利用ユーザの前記第１のユーザ嗜好ベクトルの要素のうち、値の大きい順に所定の個数の要素を抽出し、前記紹介理由の生成のために抽出される前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素のそれぞれが、前記利用ユーザの前記第１のユーザ嗜好ベクトルから抽出された前記要素と同じ要素である場合、それらの同じ要素の名前に基づいて生成される前記紹介理由を、他の要素の名前に基づいて生成される前記紹介理由の表示とは異なる態様で表示させるようにすることができる。

本発明の第１の側面は、ユーザ情報取得手段が、ユーザが利用したコンテンツに関する情報を取得し、メタ情報取得手段が、前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報含むコンテンツメタ情報を取得し、第１のベクトル生成手段が、予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成し、第２のベクトル生成手段が、前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成し、ユーザ特定手段が、複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するステップを含み、前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する情報処理方法である。

本発明の第１の側面は、コンピュータを、ユーザが利用したコンテンツに関する情報を取得するユーザ情報取得手段と、前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報含むコンテンツメタ情報を取得するメタ情報取得手段と、予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成する第１のベクトル生成手段と、前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成する第２のベクトル生成手段と、複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するユーザ特定手段とを備え、前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する情報処理装置として機能させるプログラムである。

本発明の第１の側面においては、ユーザが利用したコンテンツのデータに関する情報が取得され、前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報含むコンテンツメタ情報が取得され、予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルが生成され、前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルが生成され、複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザが特定され、前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定される。

本発明によれば、より効果的にユーザ又はコンテンツの類似性を判断できる。

以下、図面を参照して、本発明の実施の形態について説明する。

図１は、本発明の一実施の形態に係るユーザ紹介システムの構成例を示すブロック図である。このユーザ紹介システム１０は、例えば、SNS（social networking service）を提供するコンテンツウェブサイトとして構成される。コンテンツウェブサイトでは、音楽、映画、動画、ＴＶ番組、文章等のメディアコンテンツ、物販商品などのコンテンツを提供するとともに、あるユーザに別のユーザを紹介するサービスを提供するものとする。

ユーザ紹介システム１０においては、例えば、パーソナルコンピュータなどに実装されたブラウザを介してコンテンツウェブサイトにアクセスした個々のユーザのそれぞれの個人ページが提供される。個人ページには、そのユーザが公開するコンテンツの情報であって、例えば、気に入った音楽、映画などのコンテンツの情報が掲載されるようになされている。ユーザ紹介システム１０のユーザは、自分のパーソナルコンピュータなどに実装されたブラウザを利用し、インターネットなどのネットワークを介してコンテンツウェブサイトにアクセスし、コンテンツウェブサイト内のページ、またはコンテンツウェブサイトにリンクされたページなどを閲覧する。

このユーザ紹介システム１０は、例えば、インターネットなどのネットワークに接続されたサーバなどとして構成される。なお、相互に接続された複数のサーバによりユーザ紹介システム１０が構成されるようにしても構わない。

図１のユーザ情報処理部３２は、上述した個人ページを有するユーザであって、コンテンツウェブサイトにアクセスするユーザのパーソナルコンピュータなどに実装されたブラウザ３１からユーザ情報を取得する。ここでユーザ情報とは、例えば、そのユーザのコンテンツウェブサイト利用履歴（例えば、閲覧したページ）とユーザが公開したコンテンツに関する情報などから構成される情報とされる。

そして、ユーザ情報処理部３２は、ブラウザ３１からユーザ情報を取得すると、取得したユーザ情報に含まれる情報に基づいて、コンテンツメタ情報ＤＢ（データベース）３３からコンテンツメタ情報を読み込む。ここで、コンテンツメタ情報とは、例えば、音楽のコンテンツのジャンル、アーティスト、レビュー文に出現する単語、映像のコンテンツを解析することにより抽出された特徴量など、それぞれのコンテンツに関連するデータを表すものとする。

コンテンツメタ情報ＤＢ３３には、例えば、個々のコンテンツに固有のＩＤとコンテンツメタ情報が対応付けられて記憶されており、ユーザ情報処理部３２は、ユーザ情報に含まれるコンテンツのIDを特定し、それらのコンテンツに対応するコンテンツメタ情報を取得するようになされている。コンテンツメタ情報は、例えば、公開されたコンテンツの供給会社（または製作者）などにより提供された情報などを用いて生成され、予めコンテンツメタ情報ＤＢ３３に記憶されているものとする。

ユーザ情報処理部３２は、ブラウザ３１から取得したユーザ情報と、コンテンツメタ情報DB３３から取得したコンテンツメタ情報に基づいてユーザ嗜好情報Ａを生成する。詳細は後述するが、ユーザ嗜好情報Ａは、多数の要素を有する高次元のベクトルとされる。ユーザ嗜好情報Ａは、複数のユーザのそれぞれについて生成され、生成されたユーザ嗜好情報Ａは、Ａ嗜好情報ＤＢ３４に記憶される。

ユーザ情報解析部３５は、Ａ嗜好情報DB３４からユーザ嗜好情報Ａを読み込んで解析し、ユーザ嗜好情報Ｂを生成するようになされている。詳細は後述するが、ユーザ嗜好情報Bは、ユーザ嗜好情報Ａの要素数を圧縮（少なく）したベクトルとされ、ユーザ情報解析部３５は、マルチトピックモデルによる解析を行うことにより、要素数を圧縮したベクトルを生成する。

マルチトピックモデルによる解析手法としては、例えば、後述するPLSA（Probabilistic Latent Semantic Analysis）、LDA(Latent Dirichlet Allocation)などの、単語や文書の生起確率を求める手法が挙げられる。ユーザ情報解析部３５は、例えば、ユーザ嗜好情報ＡについてPLSAによる解析を行うことにより、要素数を圧縮したベクトルを生成する。ユーザ嗜好情報Bは、複数のユーザのそれぞれについて生成され、生成されたユーザ嗜好情報Bは、Ｂ嗜好情報ＤＢ３６に記憶される。

紹介ユーザ決定部３７は、ブラウザ３１のユーザのユーザ嗜好情報Aに基づいて、ユーザ紹介システム１０に個人ページを有する複数のユーザのそれぞれのユーザ嗜好情報Aまたはユーザ嗜好情報Bをフィルタリングし、フィルタリングの結果得られたユーザ嗜好情報Aまたはユーザ嗜好情報Bに対応するユーザを特定するとともに、それらの特定されたユーザのユーザ嗜好情報Bを抽出する。

そして、紹介ユーザ決定部３７は、抽出されたユーザ嗜好情報Bのそれぞれと、ブラウザ３１のユーザのユーザ嗜好情報Ｂの類似度を演算し、その類似度に基づいてブラウザ３１のユーザに紹介すべきユーザを決定する。

紹介ユーザ提示部３８は、紹介ユーザ決定部３７により決定されたユーザのユーザ嗜好情報Ａに基づいて後述するように紹介理由を作成し、紹介すべきユーザを紹介理由とともに表示する紹介ユーザリストを表示するようになされている。

なお、以後、例えば、図１のブラウザ３１のユーザであって、ユーザ紹介システム１０による別のユーザの紹介を希望するユーザを利用ユーザと称し、利用ユーザに紹介すべきユーザとしてユーザ紹介システム１０が選択したユーザを紹介ユーザと称することにする。

また、ここでは、ユーザ紹介システム１０に個人ページを有するユーザのうちの所定のユーザが紹介ユーザとして選択されると説明したが、例えば、ユーザ紹介システム１０にURL（Uniform Resource Locator）などのアドレスが登録された、いわゆるウェブログ（ブログ）の管理者であるユーザが紹介ユーザとして紹介されるようにしてもよい。

図２は、ユーザ紹介システム１０によるユーザの紹介の処理について説明する図である。

同図に示されるように、ユーザ情報とコンテンツメタ情報とに基づいてユーザ嗜好情報Ａが生成される。ユーザ嗜好情報ＡについてPLSAによる解析を行うことにより、要素数を圧縮したベクトルであるユーザ嗜好情報Bが生成される。

そして、ユーザ嗜好情報Ａとユーザ嗜好情報Ｂとに基づいて、利用ユーザに紹介すべきユーザである紹介ユーザが決定されて、その紹介ユーザが提示されることになる。

次に、ユーザ嗜好情報Ａについて説明する。図３は、ユーザ嗜好情報Ａの構成例を示す図である。

図３は、ユーザがコンテンツ１、コンテンツ２、およびコンテンツ３を視聴、録画するなどして利用した場合のユーザ嗜好情報Ａの例であって、コンテンツ１はコンテンツメタ情報ａ（同図にはメタ情報ａと表示）を有し、コンテンツ２はコンテンツメタ情報ｃを有し、コンテンツ３はやはりコンテンツメタ情報ｃ（同図にはメタ情報ｃと表示）を有するものとする。図３の例では、コンテンツ１がメタ情報ａを有することを、コンテンツ１の行とメタ情報ａの列が交差するマスに１を記入することで表現している。

各コンテンツのコンテンツメタ情報には重みが乗じられるようになされており、この重みは、例えば、録画、視聴などの行為であって、コンテンツの利用状況に対応して定められるようになされている。例えば、ユーザが、単に視聴したコンテンツと、録画したコンテンツとでは、そのユーザにとっての重要度が異なると考えられる。すなわち、ユーザは、単に視聴のみを行ったコンテンツよりも、録画したコンテンツの方がより興味があったものと推定することができ、ユーザの嗜好に関する情報を生成する際には、各コンテンツの利用状況（録画、視聴など）に応じた重み付けがなされることが好ましい。

図３の例では、コンテンツ１の利用状況に応じた重みが「０．４」とされ、コンテンツ２の利用状況に応じた重みが「０．９」とされ、コンテンツ３の利用状況に応じた重みが「０．４」とされている。

ユーザ嗜好情報Ａは、各コンテンツメタ情報（いまの場合、メタ情報ａ乃至メタ情報ｃ）の値（いまの場合「１」または「０」）に対して、それぞれコンテンツの利用状況に応じた重みを乗じた値を要素としたベクトルとされる。

図３の例では、ユーザ嗜好情報Ａのメタ情報ａの要素における値は、１×０．４＝０．４、メタ情報ｂの要素では０、メタ情報ｃの要素では１×０．９＋１×０．４＝１．３となり、ユーザ嗜好情報Ａは３次元の実数値ベクトル（０．４，０，１．３）として構成される。

なお、重みは、利用状況によらず同一としてもよい。例えば、図３の例において、重みをすべて「１」とすればユーザ嗜好情報Ａは、ベクトル（１，０，２）となる。

また、コンテンツメタ情報を用いず、コンテンツ自体をユーザ嗜好情報Ａの要素として用いるようにしてもよい。図４は、コンテンツ自体を要素として用いる場合のユーザ嗜好情報Ａの構成例を示す図である。同図の場合、ユーザ嗜好情報Ａは、ベクトル（０．４，０．９，０．４）となる。

図４に示されるように、ユーザ嗜好情報Ａを構成する場合、図１においてコンテンツメタ情報ＤＢ３３を設けないようにしてもよい。

図３または図４に示したユーザ嗜好情報Ａの例は、３次元のベクトルであるが、実際には、要素の数が膨大なものとなる。コンテンツ、およびコンテンツメタ情報の数（種類）が大量に存在するからである。実際のユーザ嗜好情報Ａは、数千次元乃至数万次元の高次元の実数値ベクトルとなる。

また、大量に存在するコンテンツのうち、ユーザが実際に視聴、録画などするコンテンツは、ごく一部であると考えられる。すなわち、ユーザ嗜好情報Ａのベクトルのほとんどの要素の値は「０」となる。このように、要素の殆どが０となることをスパースといい、ユーザ嗜好情報Ａは、スパースな高次元ベクトルといえる。

なお、ユーザ嗜好情報Ａは、ユーザが利用したコンテンツの如何にかかわらず、各ユーザのユーザ嗜好情報Ａのベクトルの要素の数が同じになるように、生成されるものとする。例えば、Ａ嗜好情報ＤＢ３４に、予め設定された数の要素を有するベクトルとしてユーザ嗜好情報Ａのひな形などが記憶されており、ユーザ情報処理部３２がブラウザ３１から取得したユーザ情報に対応して、ユーザ嗜好情報Ａのひな形の各要素に値を書き込むことでユーザ嗜好情報Ａが生成されるようにしてもよい。

次に、ユーザ嗜好情報Ｂについて説明する。上述したように、ユーザ嗜好情報Ｂは、PLSAによる解析を行うことにより、ユーザ嗜好情報Ａの要素数を圧縮した、比較的低次元のベクトルとされる。

図１のユーザ情報解析部３５は、マルチトピックモデル（例えば、PLSA）の解析の処理を実行可能な機能ブロックとして構成されており、例えば、与えられたPLSAの確率モデルのパラメータに応じて、入力されたユーザ嗜好情報Aに対するPLSAの解析の処理を実行するようになされている。

また、ユーザ情報解析部３５は、複数のユーザ嗜好情報Aに対してPLSAの解析の処理を実行することにより、最適なPLSAの確率モデルのパラメータを学習するようになされている。

PLSAは、例えば、テキスト解析などに多く用いられており、トピックと呼ばれる単語の生起確率を決める確率密度を1つ以上考慮することによって、単語の生起確率を計算し、各文書固有のトピック生起確率によって、文書を特徴づける方式である。PLSAでは、例えば、大規模な文書コーパスを用いて、トピックの単語生起確率と文書のトピック生起確率をEM（Expectation Maximization）アルゴリズムにより予め特定する。また、PLSAでは、トピックの単語生起確率をパラメータとして与えて、入力された文書に対応する文書のトピック生起確率を求めるようにすることもできる。

なお、PLSAの詳細は、「Thomas Hofmann, Probabilistic Latent Semantic Indexing, Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval (SIGIR-99), 1999」などの文献に記載されている。

PLSAと同様の操作はLDA(Latent Dirichlet Allocation)によっても可能である。LDAはPLSAを拡張したものであり、LDAの詳細については「David M. Blei, Andrew Y. Ng, Michael I. Jordan, Latent Dirichlet Allocation, Journal of Machine Learning Research 3, 2003」に記載されている。ユーザ情報解析部３５は、PLSAの解析の処理に替えてLDAの解析の処理を実行するようにしてもよい。

ここでは、マルチトピックモデルによる解析としてPLSAを用いる場合の例について説明することにする。すなわち、ユーザ嗜好情報Bの要素数と同数または同数以上のトピックを設定したPLSAの確率モデルを用意し、ユーザ嗜好情報Aの各要素の生起確率を求め、ユーザ嗜好情報Aの各要素の生起確率に基づいて、ユーザ嗜好情報Bの要素の値を定めることとする。

図５は、ユーザ１乃至ユーザ３のユーザ嗜好情報Aの例を示す図であり、図６は、図５のユーザ嗜好情報Aに対してPLSAによる解析を行うことにより生成されたユーザ嗜好情報Bの例を示す図である。ここでは、説明を簡単にするために、５次元のベクトルであるユーザ嗜好情報Aが３次元のベクトルであるユーザ嗜好情報Bに変換される例を説明するが、実際には、ユーザ嗜好情報A、ユーザ嗜好情報Ｂともにより高次元のベクトルとなる。

いまの場合、ユーザ情報解析部３５では、トピック数が３でありかつパラメータが予め特定されたPLSAの確率モデルを用意し、ユーザ嗜好情報Aの要素Ａ１乃至要素Ａ５の生起確率を求めることになる。第１のトピックでは、要素Ａ１と要素Ａ２の生起確率が高くなり、第２のトピックでは、要素Ａ３と要素Ａ４の生起確率が高くなったものとする。すなわち、要素Ａ１と要素Ａ２は類似した要素であり、また要素Ａ３と要素Ａ４は類似した要素といえる。

いまの場合、第１乃至第３のトピックが図６の要素Ｂ１乃至要素Ｂ３に対応するので、要素Ａ２の値が比較的大きいユーザ１のユーザ嗜好情報Ｂと、要素Ａ１の値が比較的大きいユーザ２のユーザ嗜好情報Ｂにおいては、ともに要素Ｂ１の値が比較的大きい値となっている。要素Ａ１と要素Ａ２が類似した要素だからである。また、要素Ａ３の値が比較的大きいユーザ１のユーザ嗜好情報Ｂと、要素Ａ４の値が比較的大きいユーザ２のユーザ嗜好情報Ｂにおいては、ともに要素Ｂ２の値が比較的大きい値となっている。要素Ａ３と要素Ａ４が類似した要素だからである。これに対して、要素Ａ１乃至要素Ａ４のいずれも比較的小さい値であるユーザ３のユーザ嗜好情報Ｂにおいては、要素Ｂ１と要素Ｂ２の値は比較的小さい値となっている。

このようすることで、高次元のスパースなベクトルであるユーザ嗜好情報Ａを、より低次元のベクトルであるユーザ嗜好情報Ｂに変換（生成）することができる。

また、ユーザ嗜好情報Ａにおいては、ユーザ１の要素Ａ１の値は０であり、ユーザ２の要素Ａ１の値が１であり、ユーザ嗜好情報Ａのみを参照すると、双方の値に隔たりがあるため、ユーザ１とユーザ２の嗜好が大きく異なっていると誤り易いが、ユーザ嗜好情報Ｂにおいては、ユーザ１の要素Ｂ１の値が0.4とされ、ユーザ２の要素Ｂ１の値が0.4とされ、例えば、ユーザ１とユーザ２の嗜好が大きく異なっていると誤って判断される可能性は小さくなる。

このように、ユーザ嗜好情報Ｂを生成することで、ユーザの嗜好をより簡単、かつ正確に比較することが可能となる。

なお、ユーザ嗜好情報Ｂは、ユーザ嗜好情報Ａの如何にかかわらず、各ユーザのユーザ嗜好情報Ｂのベクトルの要素の数が同じになるように、生成されるものとする。例えば、Ｂ嗜好情報ＤＢ３６に、予め設定された数の要素を有するベクトルとしてユーザ嗜好情報Ｂのひな形などが記憶されており、ユーザ情報解析部３５がＡ嗜好情報ＤＢ３４から取得したユーザ嗜好情報Ａを解析して、ユーザ嗜好情報Ｂのひな形の各要素に値を書き込むことでユーザ嗜好情報Ｂが生成されるようにしてもよい。

次に、紹介ユーザの決定についてより詳細に説明する。上述したように、紹介ユーザ決定部３７は、利用ユーザのユーザ嗜好情報Aに基づいて、ユーザ紹介システム１０に個人ページを有する複数のユーザのそれぞれのユーザ嗜好情報Aをフィルタリングし、フィルタリングの結果得られたユーザ嗜好情報Aに対応するユーザを特定するとともに、それらの特定されたユーザのユーザ嗜好情報Bを抽出する。

例えば、紹介ユーザ決定部３７は、利用ユーザのユーザ嗜好情報Ａの中で最大の値をもつ要素を検索し、その要素におけるユーザ嗜好情報Ａの値が閾値以上のユーザのみを抽出し、抽出されたユーザをその後の処理の対象（候補ユーザ）とする。閾値は、例えば、利用ユーザのユーザ嗜好情報Ａの中で最大の値を持つ要素の値の２分の１とする。例えば、図５の例において、ユーザ３が利用ユーザである場合、ユーザ３の最大の要素は要素Ａ５である。ユーザ１の要素A５の値は０．８＞（１．０／２）であるので、ユーザ１は候補ユーザとなる。一方、ユーザ２の要素A５の値は０＜（１．０／２）であるので、ユーザ２は候補ユーザとはならない。

ここでは、利用ユーザのユーザ嗜好情報Aに基づいて、各ユーザのユーザ嗜好情報Aをフィルタリングする例について説明したが、例えば、利用ユーザのユーザ嗜好情報Ｂに基づいて、各ユーザのユーザ嗜好情報Bがフィルタリングされるようにしてもよいし、利用ユーザのユーザ嗜好情報Aおよびユーザ嗜好情報Ｂの両方を用いて各ユーザをフィルタリングするようにしてもよい。

なお、フィルタリングを行わず、ユーザ紹介システム１０に個人ページを有する複数のユーザを全て候補ユーザとするようにしてもよい。

そして、紹介ユーザ決定部３７は、上述したように、候補ユーザのユーザ嗜好情報Bのそれぞれと、利用ユーザのユーザ嗜好情報Ｂの類似度を演算し、その類似度に基づいて紹介ユーザを決定する。

ここで、類似度は、例えば、ある候補ユーザのユーザ嗜好情報Ｂのベクトルと、利用ユーザのユーザ嗜好情報Ｂのベクトルとのユークリッド距離の符号反転値として演算される。例えば、図６の例において、ユーザ１とユーザ２の類似度は、次式により演算される。

なお、類似度は、ユークリッド距離に基づいて演算されるものに限られるものではなく、例えば、ベクトルの内積として算出されるようにすることも可能である。要は、２人のユーザのユーザ嗜好情報Ｂを入力とし、実数が出力されるものであればどのような計算方
法でもよい。

ここでは、候補ユーザのユーザ嗜好情報Bのそれぞれと、利用ユーザのユーザ嗜好情報Ｂの類似度を演算すると説明したが、例えば、類似度の演算に、ユーザ嗜好情報Ｂだけでなくユーザ嗜好情報Ａも用いられるようにしてもよい。

このように、利用ユーザと候補ユーザの類似度が演算され、例えば、類似度の大きい順にユーザをソートし、紹介ユーザリストとしてブラウザに表示される。このとき、上述したように、紹介ユーザ提示部３８は、紹介ユーザのユーザ嗜好情報Ａに基づいて紹介理由を作成し、紹介すべきユーザを紹介理由とともに表示する。

紹介理由は、紹介ユーザの嗜好の特徴であり、例えば、ユーザ嗜好情報Ａの各要素のうち大きい値をもつ上位３つの要素の名前を表示する。例えば、図５のユーザ１が紹介ユーザであった場合、要素Ａ２、要素Ａ５、および要素Ａ３の名前（例えば、コンテンツメタ情報であって、アーティスト名、ジャンルなど）がユーザ１の紹介理由として表示されることになる。

また、利用ユーザのユーザ嗜好情報Ａの各要素からも、値の大きい上位１０個の要素を選んでおき、紹介ユーザの紹介理由の各要素と比較する。そして、利用ユーザのユーザ嗜好情報Ａの各要素から選ばれた１０個の要素と、紹介ユーザのユーザ嗜好情報Ａの各要素から選ばれた３個の要素とにおいて共通する要素がある場合、紹介理由として表示されるその共通の要素の色を変える。

図７は、紹介ユーザリストの例を示している。この例では、紹介ユーザが「○○○さん」、「×××さん」、「△△△さん」、・・・と表示されている。そして、紹介ユーザ「○○○さん」の紹介理由が「要素Ａ１」、「要素Ａ１０」、「要素Ａ２」とされており、紹介ユーザ「×××さん」の紹介理由が「要素Ａ９」、「要素Ａ２」、「要素Ａ８」とされており、紹介ユーザ「△△△さん」の紹介理由が「要素Ａ５」、「要素Ａ８」、「要素Ａ３」とされている。いまの場合、利用ユーザのユーザ嗜好情報Ａの各要素の値の大きい上位１０個の要素が、それぞれ要素Ａ２、要素Ａ５、要素Ａ６、要素Ａ７、要素Ａ１０、要素Ａ１１、要素Ａ１２、要素Ａ１３、要素Ａ１４、および要素Ａ１５であったものとする。

紹介理由に表示される要素のうち、上述した利用ユーザのユーザ嗜好情報Ａから選ばれた１０個の要素と共通するものは、要素Ａ２、要素Ａ５、および要素Ａ１０なので、図７の画面の中でこれらの要素の色が変更されて表示される。同図においては、下線により色が変更されたことを表している。このように表示することで、紹介ユーザの特徴、利用ユーザと紹介ユーザの嗜好の違い、利用ユーザと紹介ユーザの嗜好が同じ部分が一目でわかるようになる。

なお、図７には、説明を簡単にするために、紹介理由に「要素Ａ１」、「要素Ａ１０」、「要素Ａ２」、・・・と記載したが、実際には、各要素の名前であって、アーティスト名、ジャンルなどが紹介理由として表示されることになる。

また、紹介理由としてユーザ嗜好情報Ｂの要素を表示するようにしてもよい。

さらに、紹介理由の色を変える代わりに、フォントを変えるようにしてもよいし、文字サイズを変えるようにしてもよいし、点滅させて表示するなどしてもよい。

あるいはまた、紹介理由を文字で表示せず、それぞれの要素に対応するアイコンなどの画像として表示するようにしてもよい。その場合、例えば、紹介理由の色を変える代わりに、画像を動かして表示するなどしてもよい。

次に、図８のフローチャートを参照して、ユーザ紹介システム１０によるユーザ嗜好情報Ａの処理について説明する。この処理は、ユーザが初めてユーザ紹介システム１０を利用するとき、または、ユーザ情報が変更されたとき実行される。

ステップＳ１１において、図１のユーザ情報処理部３２は、コンテンツウェブサイトにアクセスしたユーザのパーソナルコンピュータなどに実装されたブラウザ３１からユーザ情報を取得する。ユーザ情報には、例えば、そのユーザのコンテンツウェブサイト利用履歴（例えば、閲覧したページ）とユーザが公開したコンテンツに関する情報などが含まれている。

ステップＳ１２において、ユーザ情報処理部３２は、取得したユーザ情報に含まれる情報に基づいて、コンテンツメタ情報ＤＢ（データベース）３３からコンテンツメタ情報を読み込む。このとき、ユーザ情報処理部３２は、例えば、ユーザ情報に含まれるコンテンツのIDを特定し、それらのコンテンツに対応するコンテンツメタ情報を取得する。

ステップＳ１３において、ユーザ情報処理部３２は、コンテンツウェブサイトにアクセスしたユーザのユーザ嗜好情報ＡをＡ嗜好情報ＤＢ３４から読み込む。なお、そのユーザが初めてユーザ紹介システム１０を利用する場合、ユーザ嗜好情報Ａがまだ作成されていないので、ステップＳ１３では、例えば、ユーザ嗜好情報Ａのひな形が読み込まれることになる。

ステップＳ１４において、ユーザ情報処理部３２は、ステップＳ１１で取得したユーザ情報と、ステップＳ１２で取得したコンテンツメタ情報に基づいてユーザ嗜好情報Ａを更新する。なお、そのユーザが初めてユーザ紹介システム１０を利用する場合、ステップＳ１４でそのユーザのユーザ嗜好情報Ａが生成されることになる。

ステップＳ１５において、ステップＳ１４の処理で更新または生成されたユーザ嗜好情報ＡがＡ嗜好情報ＤＢ３４に記憶される。

このようにして、ユーザ嗜好情報Ａが生成される。

次に、図９のフローチャートを参照して、ユーザ紹介システム１０によるパラメータ学習処理について説明する。この処理は、上述したPLSAの確率モデルのパラメータを学習するものであり、例えば、Ａ嗜好情報ＤＢ３４に記憶されるユーザ嗜好情報Ａが所定の数以上となったとき実行される。

ステップＳ３１において、ユーザ情報解析部３５は、Ａ嗜好情報DB３４から複数のユーザ嗜好情報Ａを読み込んで解析し、ステップＳ３２でPLSAの確率モデルのパラメータを設定する。

このようにしてパラメータの学習が行われる。

次に、図１０のフローチャートを参照して、ユーザ紹介システム１０によるユーザ嗜好情報Ｂ生成処理について説明する。この処理は、例えば、図９を参照して上述した処理により、パラメータが学習された後、そのパラメータを用いて実行される。また、この処理は、ユーザ情報が変更されたとき図８を参照して上述した処理が実行されることでそのユーザのユーザ嗜好情報Ａが更新されたとき、実行されるようにしてもよい。

ステップＳ５１において、ユーザ情報解析部３５は、ユーザ嗜好情報Ｂの要素数を決定する。要素数は、予め定められた値とされてもよいし、例えば、システム管理者などの指令に基づいて決定されるようにしてもよい。

ステップＳ５２において、ユーザ情報解析部３５は、Ａ嗜好情報DB３４からユーザ嗜好情報Ａを読み込む。

ステップＳ５３において、ユーザ情報解析部３５は、ステップＳ５２の処理で読み込んだユーザ嗜好情報ＡについてPLSA（Probabilistic Latent Semantic Analysis）による解析を行うことにより、要素数を圧縮する。

ステップＳ５４において、ユーザ情報解析部３５は、B嗜好情報ＤＢ３６からユーザ嗜好情報Bを読み込む。なお、そのユーザのユーザ嗜好情報Ｂがまだ作成されていない場合、ステップＳ５４では、例えば、ユーザ嗜好情報Ｂのひな形が読み込まれることになる。

ステップＳ５５において、ユーザ情報解析部３５は、ステップＳ５３の処理結果に基づいてユーザ嗜好情報Ｂを更新する。なお、そのユーザのユーザ嗜好情報Ｂがまだ作成されていない場合、ステップＳ５５でそのユーザのユーザ嗜好情報Ｂが生成されることになる。

ステップＳ５６において、ステップＳ５５の処理で更新または生成されたユーザ嗜好情報ＢがＢ嗜好情報ＤＢ３６に記憶される。

このようにして、ユーザ嗜好情報Ｂが生成される。

なお、図１０を参照して上述した処理の実行に伴って、PLSAの確率モデルのパラメータが学習されるようにすることも可能である。すなわち、図９を参照して上述した処理により、パラメータが学習された後、そのパラメータを用いて図１０の処理が実行されるのではなく、図１０の処理を実行しながら、パラメータを学習させるようにしても構わない。

次に、図１１のフローチャートを参照して、ユーザ紹介システム１０による紹介リスト生成表示処理について説明する。この処理は、例えば、利用ユーザから紹介リストの表示が指令されたとき実行される。

ステップＳ７１において、紹介ユーザ決定部３７は、利用ユーザのユーザ嗜好情報Aを読み込む。

ステップＳ７２において、紹介ユーザ決定部３７は、ステップＳ７１で読み込んだ利用ユーザのユーザ嗜好情報Aに基づいて、ユーザのフィルタリングを行う。このとき、例えば、利用ユーザのユーザ嗜好情報Ａの中で最大の値を持つ要素が検索され、その要素におけるユーザ嗜好情報Ａの値が閾値以上のユーザのみが抽出され、候補ユーザとされる。

なお、ステップＳ７２の処理は、省略されるようにしてもよい。

ステップＳ７３において、紹介ユーザ決定部３７は、ステップＳ７２のフィルタリングにより得られた候補ユーザのユーザ嗜好情報Ｂを、B嗜好情報ＤＢ３６から抽出する。

ステップＳ７４において、紹介ユーザ決定部３７は、利用ユーザのユーザ嗜好情報Ｂと、候補ユーザのユーザ嗜好情報Bのそれぞれとの類似度を演算する。このとき、例えば、ユーザ嗜好情報Ｂをベクトルとした場合のユークリッド距離の符号反転値として類似度が演算される。

ステップＳ７５において、紹介ユーザ決定部３７は、ステップＳ７４の処理により得られた類似度に基づいて紹介ユーザを決定する。このとき、例えば、予め設定された閾値以上の類似度となったユーザ嗜好情報Ｂに対応する候補ユーザが紹介ユーザとなるように決定される。

ステップＳ７６において、紹介ユーザ提示部３８は、例えば、紹介ユーザのユーザ嗜好情報Ａに基づいて紹介理由を作成する。

ステップＳ７７において、紹介ユーザ提示部３８は、紹介ユーザリストを、例えば、利用ユーザのブラウザに表示させる。このとき、例えば、図７を参照して上述したような画面が利用ユーザのパーソナルコンピュータの画面などに表示されることになる。

このようにしてユーザの紹介が行われる。

以上においては、主に、利用ユーザに紹介する紹介ユーザを特定するために、ユーザ嗜好情報Ａとユーザ嗜好情報Ｂを用いる例について説明したが、個々のユーザの嗜好の特徴をより分かり易く表現するために、ユーザ嗜好情報Ａとユーザ嗜好情報Ｂが用いられるようにしてもよい。

例えば、紹介ユーザが多数あった場合、利用ユーザが、紹介ユーザの個人ページを逐一閲覧するには、時間と手間がかかる。実際には、利用ユーザが、それぞれの紹介ユーザの個人ページを短時間眺め、どの紹介ユーザの個人ページを、時間をかけて閲覧する価値があるかどうか判断し、その後、時間をかけて閲覧する価値があると判断された少数の紹介ユーザの個人ページを、あらためて閲覧することになるであろう。

また、システムにより紹介されるユーザのみならず、例えば、他のユーザの嗜好の特徴が自分の嗜好の特徴とどの程度一致、または異なっているのかについて、ユーザは関心をもっていると思われ、ユーザの嗜好の特徴を直感的に把握させることができればより便利である。

上述したユーザ嗜好情報Ａとユーザ嗜好情報Ｂを用いれば、ユーザの嗜好の特徴を直感的に把握させるようにすることも可能である。

図１２は、ユーザ紹介システムにより、ユーザの嗜好の特徴を直感的に把握できるように表示させる場合の処理について説明する図である。

同図に示されるように、ユーザ情報とコンテンツメタ情報とに基づいてユーザ嗜好情報Ａが生成される。ユーザ嗜好情報ＡについてPLSAによる解析を行うことにより、要素数を
圧縮したベクトルであるユーザ嗜好情報Bが生成される。

ここまでは、図２を参照して上述した場合と同様である。

そして、ユーザ嗜好情報Ａとユーザ嗜好情報Ｂとに基づいて、例えば、あるユーザの嗜好表現値を計算する。嗜好表現値は、ユーザの嗜好の特徴を直感的に把握できるように表示するために用いられる値とされる。嗜好表現値の詳細については後述する。

さらに、計算された嗜好表現値に基づいて、そのユーザの嗜好の特徴が直感的に把握できるように表現されて提示（表示）される。

図１３は、ユーザの嗜好の特徴を直感的に把握できるように表示させる場合のユーザ紹介システム２０の構成例を示すブロック図である。同図は、図１に対応する図であり、図１と対応する部分には、同一の符号が付されている。

このユーザ紹介システム２０も、ユーザ紹介システム１０と同様に、例えば、インターネットなどのネットワークに接続されたサーバなどとして構成される。なお、相互に接続された複数のサーバによりユーザ紹介システム２０が構成されるようにしても構わない。その他、ユーザ紹介システム２０の紹介ユーザ、利用ユーザについてもユーザ紹介システム１０の場合と同様である。

また、ユーザ紹介システム２０には、図１の紹介ユーザ決定部３７および紹介ユーザ提示部３８が設けられていないが、例えば、嗜好表現値計算部４１は、紹介ユーザ決定部３７の一部として実装され、ユーザ嗜好表現部４２は、紹介ユーザ提示部３８の一部として実装されるようにしてもよい。

図１３におけるブラウザ３１乃至Ｂ嗜好情報ＤＢ３６は、図１の場合と同様なので詳細な説明は省略する。

嗜好表現値計算部４１は、Ｂ嗜好情報ＤＢ３６に記憶されているユーザ嗜好情報Ｂ、またはＡ嗜好情報ＤＢ３４に記憶されているユーザ嗜好情報Ａに基づいて嗜好表現値を計算する。

嗜好表現値は、例えば、ユーザ嗜好情報Ｂの各要素の値とされる。上述したように、ユーザ嗜好情報Ｂは、高次元のスパースなベクトルであるユーザ嗜好情報Ａの要素数が圧縮されて生成された、より低次元のベクトルである。このため、例えば、ユーザ嗜好情報Ａの要素では、双方の値に隔たりがある場合でも、ユーザ嗜好情報Ｂを参照すれば嗜好が類似していると判断できる場合もあり、ユーザの嗜好をより簡単、かつ正確に比較することが可能となる。

例えば、あるユーザのユーザ嗜好情報Ａの要素Ａ１乃至要素Ａ３が、それぞれコンテンツメタ情報「ジャズ」、「クラッシック」、「ボサノバ」に対応するものであった場合、ユーザ嗜好情報Ｂにおいて、要素Ａ１乃至要素Ａ３の生起確率が高い要素Ｂ１が生成されたものとする。

この場合、例えば、そのユーザの嗜好の特徴を、「ジャズ１」、「クラッシック２」、「ボサノバ３」と表現するよりも、要素Ｂ１の名前を「大人っぽい」とし、「大人っぽい１．５」のように表現した方がより直感的にユーザの嗜好の特徴を把握できる。

また、例えば、ユーザ嗜好情報Ｂの要素数が多い場合、次のようにして嗜好表現値を演算するようにしてもよい。

例えば、嗜好表現値を２次元のベクトル（嗜好表現値１，嗜好表現値２）として生成する場合、そのユーザの嗜好表現値１をユーザ嗜好情報Ａの要素Ａ１乃至要素Ａ４とユーザ嗜好情報Ｂの要素Ｂ１、要素Ｂ２の和として計算し、嗜好表現値２をユーザ嗜好情報Ａの要素Ａ５乃至要素Ａ８とユーザ嗜好情報Ｂの要素Ｂ３、要素Ｂ４の和で計算するようにしてもよい。

あるいはまた、ユーザ情報解析部３５により、ユーザ嗜好情報Ｂについてさらに、PLSAの解析を行わせ、より要素数の少ないベクトルを生成させ、そのベクトルの要素の値のそれぞれが嗜好表現値のベクトルを構成する要素の値とされるようにしてもよい。

さらに、ユーザ嗜好情報Ａの所定の要素とユーザ嗜好情報Ｂの所定の要素を抽出し、それらの要素の値のそれぞれが嗜好表現値のベクトルを構成する要素の値とされるようにしてもよい。例えば、ユーザ嗜好情報Ａが要素Ａ１乃至要素Ａ８で構成され、ユーザ嗜好情報Ｂが要素Ｂ１乃至要素Ｂ４で構成される場合、嗜好表現値のベクトルは、ベクトル（要素Ａ１，要素Ｂ２，要素Ｂ３，要素Ｂ４）とされるようにしてもよい。

このようにして得られた嗜好表現値に基づいて、ユーザ嗜好表現部４２が、例えば、ブラウザ３１にユーザの嗜好の特徴を表す画面を表示させる。

図１４は、ユーザ嗜好表現部４２により生成されるユーザの嗜好の特徴を表す画面の例を示す図である。図１４の例では、例えば、嗜好表現値が５次元のベクトルとして構成される場合の例であって、ベクトルの要素である嗜好表現値１乃至嗜好表現値５がそれぞれ軸とされ、嗜好表現値が５角形のグラフとして表示されている。

図１５は、ユーザ嗜好表現部４２により生成されるユーザの嗜好の特徴を表す画面の別の例を示す図である。図１５の例では、例えば、嗜好表現値が５次元のベクトルとして構成される場合の例であって、ベクトルの要素である嗜好表現値１乃至嗜好表現値５がそれぞれ軸とされ、嗜好表現値が棒グラフとして表示されている。

このようにすることで、そのユーザの嗜好の特徴を、より直感的に把握させることが可能となる。

あるいはまた、複数のユーザの嗜好表現値が重ね合わせて表示されるようにしてもよい。図１６は、ユーザ嗜好表現部４２により生成されるユーザの嗜好の特徴を表す画面の別の例を示す図である。図１６の例では、例えば、嗜好表現値が５次元のベクトルとして構成される場合の例であって、ベクトルの要素である嗜好表現値１乃至嗜好表現値５がそれぞれ軸とされ、２人のユーザの嗜好表現値がそれぞれ５角形のグラフとして表示されている。

同図において、例えば、点線１１２で示されるグラフは、利用ユーザ（自分）の嗜好の特徴を表すものとされ、線１１１で示されるグラフは、紹介ユーザ（他人）の嗜好の特徴を表すものとされる。

図１７は、ユーザ嗜好表現部４２により生成されるユーザの嗜好の特徴を表す画面のさらに別の例を示す図である。図１７の例では、例えば、嗜好表現値が５次元のベクトルとして構成される場合の例であって、ベクトルの要素である嗜好表現値１乃至嗜好表現値５がそれぞれ軸とされ、２人のユーザの嗜好表現値が棒グラフとして表示されている。

同図において、例えば、図中白色で示される棒グラフは、利用ユーザ（自分）の嗜好の特徴を表すものとされ、図中ハッチングされて示される棒グラフは、紹介ユーザ（他人）の嗜好の特徴を表すものとされる。

このようにすることで、それぞれのユーザの嗜好の特徴の一致の度合い、または嗜好の特徴の違いを、より直感的に把握させることが可能となる。

さらに、上述したように嗜好表現値をグラフ化した画面とともに、ユーザ嗜好情報Ａ、若しくはユーザ嗜好情報Ｂまたはそれら両方のうち大きい値を持つ要素の名前をユーザの特徴として有限個表示し、嗜好表現をより詳細にすることもできる。

例えば、利用ユーザのユーザ嗜好情報Ａから値の大きい要素を１０個選んでおき、紹介ユーザのユーザ嗜好情報Ａから値の大きい要素を６個抽出する。紹介ユーザの嗜好の特徴をより直感的に表現するためには、例えば、抽出された６個の要素の名前を、それらの要素の値の大きさに応じたサイズで表示するようにすると効果的である。

そして、利用ユーザのユーザ嗜好情報Ａの各要素から選ばれた１０個の要素と、紹介ユーザのユーザ嗜好情報Ａの各要素から選ばれた６個の要素とにおいて共通する要素がある場合、紹介理由として表示されるその共通の要素の色を変える。

図１８は、ユーザ嗜好表現部４２により生成されるユーザの嗜好の特徴を表す画面のさらに別の例を示す図である。図１８の場合、例えば、利用ユーザに紹介ユーザの嗜好の特徴を提示する場合の画面の例とされ、図中の領域１５１は、利用ユーザと紹介ユーザの嗜好表現値をグラフ化したものが表示され、領域１５２には、紹介ユーザの嗜好の特徴が、領域１５１における表示とは別の方式で表示されるものとする。

図１８の例では、例えば、嗜好表現値が５次元のベクトルとして構成される場合の例であって、ベクトルの要素である嗜好表現値１乃至嗜好表現値５がそれぞれ軸とされ、２人のユーザの嗜好表現値が５角形のグラフとして領域１５１に表示されている。同図において、例えば、点線１７２で示されるグラフは、利用ユーザの嗜好の特徴を表すものとされ、線１７１で示されるグラフは、紹介ユーザの嗜好の特徴を表すものとされる。

また、図１８の例では、紹介ユーザのユーザ嗜好情報Ａから値の大きい上位６個の要素が抽出されて、紹介ユーザの特徴として領域１５２に表示されている。同図の例では、「要素Ａ１」、「要素Ａ２」、「要素Ａ５」、「要素Ａ８」、「要素Ａ９」、および「要素Ａ１０」が表示されている。ここでは、説明を簡単にするために、紹介理由に「要素Ａ１」、「要素Ａ２」、・・・と記載したが、実際には、各要素の名前であって、アーティスト名、ジャンルなどが紹介理由として表示されることになる。

さらに、図１８の例では、抽出された６個の要素の名前が、それらの要素の値の大きさに応じたサイズで表示されている。この例では、「要素Ａ８」の値が最も大きかったことになり、「要素Ａ１」の値が最も小さかったことになる。

また、図１８の例では、利用ユーザのユーザ嗜好情報Ａの各要素から選ばれた１０個の要素と、紹介ユーザのユーザ嗜好情報Ａの各要素から選ばれた６個の要素とにおいて共通する要素がある場合、領域１５２に表示されるその共通の要素の色が変えられて表示されている。同図においては、要素に下線を付することで色を変えて表示したことを表現している。いまの場合、「要素Ａ２」、「要素Ａ５」、および「要素Ａ１０」が、利用ユーザのユーザ嗜好情報Ａの各要素から選ばれた１０個の要素と、紹介ユーザのユーザ嗜好情報Ａの各要素から選ばれた６個の要素とにおいて共通する要素であったことになる。

さらに、領域１５２において色を変える代わりに、フォントを変えるようにしてもよいし、文字サイズを変えるようにしてもよいし、点滅させて表示するなどしてもよい。

あるいはまた、領域１５２において文字で表示せず、それぞれの要素に対応するアイコンなどの画像として表示するようにしてもよい。その場合、例えば、各要素の色を変える代わりに、画像を動かして表示するなどしてもよい。

また、ここでは、ユーザの嗜好の特徴を表す画面として、嗜好表現値を多角形のグラフまたは棒グラフによりグラフ化する例について説明したが、ユーザの嗜好の特徴を表す画面は、これらのグラフに限られるものではなく、また、必ずしも嗜好表現値をグラフ化したものでなくてもよい。

例えば、ユーザの嗜好の特徴を表す画面として、キャラクタの画像を表示し、嗜好表現値のベクトルの各要素の値に応じて、表示されるキャラクタが異なるようにしてもよいし、嗜好表現値のベクトルの各要素の値に応じて、キャラクタの顔の表情が変化するようにしてもよい。または、ユーザの嗜好の特徴として図形の色や形、動きを嗜好表現値のベクトルの各要素の値に応じて異なるようにしてもよい。

このようにすることで、紹介ユーザの嗜好の特徴、利用ユーザと紹介ユーザの嗜好の特徴の違い、利用ユーザと紹介ユーザの嗜好の特徴の同じ部分などが一目でわかるようになる。

次に、図１９のフローチャートを参照して、ユーザ紹介システム２０による嗜好表現画面生成表示処理について説明する。この処理は、例えば、所定のユーザの嗜好の特徴を表す画面の表示が要求されたとき実行されるようにしてもよいし、利用ユーザから紹介リストの表示が指令されたとき、図１１を参照して上述した処理とともに実行されるようにしてもよい。

ステップＳ９１において、嗜好表現値計算部４１は、Ｂ嗜好情報ＤＢ３６からユーザ嗜好情報Ｂを読み込む。なお、嗜好の特徴を表す画面（嗜好表現値）を表示すべきユーザが複数あるときは、それら複数のユーザに対応するユーザ嗜好情報Ｂが読み込まれる。

ステップＳ９２において、嗜好表現値計算部４１は、Ａ嗜好情報ＤＢ３４からユーザ嗜好情報Ａを読み込む。なお、嗜好の特徴を表す画面（嗜好表現値）を表示すべきユーザが複数あるときは、それら複数のユーザに対応するユーザ嗜好情報Ａが読み込まれる。

なお、嗜好表現値の計算において、ユーザ嗜好情報Ａを用いない場合、ステップＳ９２の処理は、省略されるようにしてもよい。

ステップＳ９３において、嗜好表現値計算部４１は、ステップＳ９１の処理で読み込んだユーザ嗜好情報Ｂの要素と、ステップＳ９２の処理で読み込んだユーザ嗜好情報Ａの要素のうち、嗜好表現値の計算に必要となる要素を選択する。

ステップＳ９４において、嗜好表現値計算部４１は、ステップＳ９３の処理で選択された要素に基づいて、嗜好表現値を計算する。

このとき、例えば、上述したように、嗜好表現値のベクトルを構成する各要素の値のそれぞれが、ユーザ嗜好情報Ｂの各要素の値とされるようにしてもよいし、１つの嗜好表現値の要素（例えば、嗜好表現値１）をユーザ嗜好情報Ａの複数の要素の和、若しくはユーザ嗜好情報Ｂの複数の要素の和、またはユーザ嗜好情報Ａの複数（または単数）の要素とユーザ嗜好情報Ｂの複数（または単数）の要素の和として計算されるようにしてもよい。

さらに、ユーザ嗜好情報Ａの所定の要素とユーザ嗜好情報Ｂの所定の要素を抽出し、それらの要素の値のそれぞれが嗜好表現値のベクトルを構成する要素の値とされるようにしてもよい。

ステップＳ９５において、ユーザ嗜好表現部４２は、ユーザの嗜好の特徴を表示するための嗜好表現画面であって、例えば、図１４乃至図１８を参照して上述したような画面をユーザのパーソナルコンピュータの画面などに表示させる。

このようにして嗜好表現画面が表示される。

ところで以上においては、利用ユーザのユーザ嗜好情報Ｂと、候補ユーザのユーザ嗜好情報Bのそれぞれとの類似度に基づいて紹介ユーザが決定され、紹介ユーザリストが表示される場合の例について説明した。すなわち、以上においては、ユーザ嗜好情報に基づいてユーザを紹介する例について説明した。

しかし、本発明を適用すれば、例えば、コンテンツメタ情報に基づいてユーザを紹介することも可能である。例えば、コンテンツメタ情報が、ユーザ嗜好情報Aと同様に高次元の実数値ベクトルとなるように構成されていれば、そのコンテンツメタ情報を圧縮し、上述した例と同様に、圧縮されたコンテンツメタ情報と候補ユーザのユーザ嗜好情報Bのそれぞれとの類似度に基づいて紹介ユーザが決定されるようにすることも可能である。

図２０は、本発明の一実施の形態に係るユーザ紹介システムの別の構成例を示すブロック図である。このユーザ紹介システム２００は、例えば、SNS（social networking service）を提供するコンテンツウェブサイトとして構成される。コンテンツウェブサイトでは、音楽、映画、動画、ＴＶ番組、文章等のメディアコンテンツ、物販商品などのコンテンツを提供するとともに、あるユーザに別のユーザを紹介するサービスを提供するものとする。

ユーザ紹介システム２００は、図１のユーザ紹介システム１０の場合と異なり、例えば、所定のコンテンツメタ情報に基づいてユーザを紹介することも可能となるように構成されている。

ユーザ紹介システム２００においては、図１のユーザ紹介システム１０の場合と同様に、例えば、パーソナルコンピュータなどに実装されたブラウザを介してコンテンツウェブサイトにアクセスした個々のユーザのそれぞれの個人ページが提供される。個人ページには、そのユーザが公開するコンテンツの情報であって、例えば、気に入った音楽、映画などのコンテンツの情報が掲載されるようになされている。ユーザ紹介システム２００のユーザは、自分のパーソナルコンピュータなどに実装されたブラウザを利用し、インターネットなどのネットワークを介してコンテンツウェブサイトにアクセスし、コンテンツウェブサイト内のページ、またはコンテンツウェブサイトにリンクされたページなどを閲覧する。

このユーザ紹介システム２００は、ユーザ紹介システム１０の場合と同様に、例えば、インターネットなどのネットワークに接続されたサーバなどとして構成される。なお、相互に接続された複数のサーバによりユーザ紹介システム２００が構成されるようにしても構わない。

ユーザ情報処理部２３２は、図１のユーザ情報処理部３２と同様に、上述した個人ページを有するユーザであって、コンテンツウェブサイトにアクセスするユーザのパーソナルコンピュータなどに実装されたブラウザ２３１からユーザ情報を取得する。そして、ユーザ情報処理部２３２は、ブラウザ２３１からユーザ情報を取得すると、取得したユーザ情報に含まれる情報に基づいて、コンテンツメタ情報ＤＢ（データベース）２３３からコンテンツメタ情報を読み込む。

コンテンツメタ情報ＤＢ２３３には、図１のコンテンツメタ情報DB３３と同様に、例えば、個々のコンテンツに固有のＩＤとコンテンツメタ情報が対応付けられて記憶されており、ユーザ情報処理部２３２は、ユーザ情報に含まれるコンテンツのIDを特定し、それらのコンテンツに対応するコンテンツメタ情報を取得するようになされている。

なお、コンテンツメタ情報DB２３３に記憶されているコンテンツメタ情報は、Ａ嗜好情報ＤＢ２３４に記憶されているユーザ嗜好情報Aと同様に、多数の要素を有する高次元のベクトルとされる。

また、ユーザ情報処理部２３２は、ブラウザ２３１から取得したユーザ情報と、コンテンツメタ情報DB２３３から取得したコンテンツメタ情報に基づいて、図１の場合と同様に、ユーザ嗜好情報Ａを生成する。ユーザ嗜好情報Ａは、複数のユーザのそれぞれについて生成され、生成されたユーザ嗜好情報Ａは、Ａ嗜好情報ＤＢ２３４に記憶される。

情報解析部２３５は、図１のユーザ情報解析部３５と同様に、Ａ嗜好情報DB２３４からユーザ嗜好情報Ａを読み込んで解析し、ユーザ嗜好情報Ｂを生成するようになされている。ユーザ嗜好情報Bは、ユーザ嗜好情報Ａの要素数を圧縮（少なく）したベクトルとされ、情報解析部２３５は、マルチトピックモデルによる解析を行うことにより、要素数を圧縮したベクトルを生成する。ユーザ嗜好情報Bは、複数のユーザのそれぞれについて生成され、生成されたユーザ嗜好情報Bは、Ｂ嗜好情報ＤＢ２３６に記憶される。

また、情報解析部２３５は、コンテンツメタ情報DB２３３からコンテンツメタ情報を読み込んで解析し、圧縮コンテンツメタ情報を生成するようになされている。圧縮コンテンツメタ情報は、コンテンツメタ情報の要素数を圧縮（少なく）したベクトルとされ、情報解析部２３５は、マルチトピックモデルによる解析を行うことにより、要素数を圧縮したベクトルを生成する。圧縮コンテンツメタ情報は、複数のコンテンツのそれぞれについて生成され、生成された圧縮コンテンツメタ情報は、圧縮コンテンツメタ情報ＤＢ２３９に記憶される。

すなわち、情報解析部２３５は、ユーザ嗜好情報を圧縮するとともに、コンテンツメタ情報も圧縮するのである。なお、コンテンツメタ情報DB２３３に記憶されているコンテンツメタ情報は、Ａ嗜好情報ＤＢ２３４に記憶されているユーザ嗜好情報Aと同一の要素を有する同次元のベクトルとして構成されているものとする。また、圧縮コンテンツメタ情報DB２３９に記憶されている圧縮コンテンツメタ情報は、Ｂ嗜好情報ＤＢ２３６に記憶されているユーザ嗜好情報Ｂと同一の要素を有する同次元のベクトルとして構成されているものとする。

なお、情報解析部２３５によるマルチトピックモデルの解析手法としては、例えば、PLSA（Probabilistic Latent Semantic Analysis）、LDA(Latent Dirichlet Allocation)などの、単語や文書の生起確率を求める手法が挙げられる。

図２１は、コンテンツ１乃至コンテンツ３のコンテンツメタ情報の例を示す図であり、図２２は、図２１のコンテンツメタ情報に対してPLSAによる解析を行うことにより生成された圧縮コンテンツメタ情報の例を示す図である。ここでは、説明を簡単にするために、５次元のベクトルであるコンテンツメタ情報が３次元のベクトルである圧縮コンテンツメタ情報に変換される例を説明するが、実際には、コンテンツメタ情報、圧縮コンテンツメタ情報ともにより高次元のベクトルとなる。

いまの場合、情報解析部２３５では、トピック数が３でありかつパラメータが予め特定されたPLSAの確率モデルを用意し、コンテンツメタ情報の要素Ａ１乃至要素Ａ５の生起確率を求めることになる。第１のトピックでは、要素Ａ１と要素Ａ２の生起確率が高くなり、第２のトピックでは、要素Ａ３と要素Ａ４の生起確率が高くなったものとする。すなわち、要素Ａ１と要素Ａ２は類似した要素であり、また要素Ａ３と要素Ａ４は類似した要素といえる。

いまの場合、第１乃至第３のトピックが図２２の要素Ｂ１乃至要素Ｂ３に対応するので、要素Ａ２の値が比較的大きいコンテンツ１の圧縮コンテンツメタ情報と、要素Ａ１の値が比較的大きいコンテンツ２の圧縮コンテンツメタ情報においては、ともに要素Ｂ１の値が比較的大きい値となっている。要素Ａ１と要素Ａ２が類似した要素だからである。また、コンテンツ１乃至コンテンツ３のコンテンツメタ情報の要素Ａ３および要素A４の値は「０」なのでコンテンツ１乃至コンテンツ３の圧縮コンテンツメタ情報においては、ともに要素Ｂ２の値が「０」となっている。要素Ａ３と要素Ａ４が類似した要素だからである。さらに、要素A５の値が比較的大きいコンテンツ１およびコンテンツ３の圧縮コンテンツメタ情報においては、要素B３の値が比較的大きい値となっている。

このようすることで、高次元のスパースなベクトルであるコンテンツメタ情報を、より低次元のベクトルである圧縮コンテンツメタ情報に変換（生成）することができる。このように、圧縮コンテンツメタ情報を生成することで、コンテンツの特徴をより簡単、かつ正確に比較することが可能となる。

なお、圧縮コンテンツメタ情報は、コンテンツメタ情報の如何にかかわらず、各ユーザの圧縮コンテンツメタ情報のベクトルの要素の数が同じになるように、生成されるものとする。

図２０に戻って、決定処理部２３７は、図１の紹介ユーザ決定部３７と同様に、ブラウザ２３１のユーザのユーザ嗜好情報Aに基づいて、ユーザ紹介システム２００に個人ページを有する複数のユーザのそれぞれのユーザ嗜好情報Aまたはユーザ嗜好情報Bをフィルタリングし、フィルタリングの結果得られたユーザ嗜好情報Aまたはユーザ嗜好情報Bに対応するユーザを特定するとともに、それらの特定されたユーザのユーザ嗜好情報Bを抽出する。

そして、決定処理部２３７は、抽出されたユーザ嗜好情報Bのそれぞれと、ブラウザ２３１のユーザのユーザ嗜好情報Ｂの類似度を演算し、その類似度に基づいてブラウザ２３１のユーザに紹介すべきユーザを決定する。

また、決定処理部２３７は、ブラウザ２３１を介して入力されたコンテンツのＩＤに対応する圧縮コンテンツメタ情報を特定するとともに、ユーザ紹介システム２００に個人ページを有する複数のユーザのそれぞれのユーザ嗜好情報Bを抽出する。

そして、決定処理部２３７は、抽出されたユーザ嗜好情報Bのそれぞれと、入力されたコンテンツのＩＤに対応する圧縮コンテンツメタ情報の類似度を演算し、その類似度に基づいてブラウザ２３１のユーザに紹介すべきユーザを決定する。

すなわち、決定処理部２３７は、ユーザ嗜好情報Bの入力を受け付けて、他のユーザ嗜好情報Bとの類似度を演算するだけでなく、圧縮コンテンツメタ情報の入力を受け付けてユーザ嗜好情報Bとの類似度の演算も行うようになされている。

ここで、類似度は、例えば、ある候補ユーザのユーザ嗜好情報Ｂのベクトルと、圧縮コンテンツメタ情報のベクトルとのユークリッド距離の符号反転値として演算される。また、類似度は、ユークリッド距離に基づいて演算されるものに限られるものではなく、例えば、ベクトルの内積として算出されるようにすることも可能である。

ここでは、候補ユーザのユーザ嗜好情報Bのそれぞれと、圧縮コンテンツメタ情報の類似度を演算すると説明したが、例えば、類似度の演算に、ユーザ嗜好情報Ｂだけでなくユーザ嗜好情報Ａも用いられるようにしてもよい。

提示処理部２３８は、決定処理部２３７により決定された、紹介すべきユーザを紹介理由とともに表示する紹介ユーザリストを表示するようになされている。

提示処理部２３８は、例えば、類似度の大きい順にユーザをソートし、紹介ユーザリストとしてブラウザに表示される。このとき、上述したように、提示処理部２３８は、紹介ユーザのユーザ嗜好情報Ａに基づいて紹介理由を作成し、紹介すべきユーザを紹介理由とともに表示する。

すなわち、提示処理部２３８は、例えば、図７を参照して上述したような紹介ユーザリストを生成して表示させるようになされている。

このように、本発明によれば、コンテンツメタ情報に基づいてユーザを紹介することも可能である。

図２０のユーザ紹介システム２００による、ユーザ嗜好情報A生成処理、パラメータ学習処理、およびユーザ嗜好情報B生成処理は、それぞれ図８、図９、および図１０を参照して上述した処理と同様の処理なので詳細な説明は省略する。

次に、図２３のフローチャートを参照して、図２０のユーザ紹介システム２００による、圧縮コンテンツメタ情報生成処理について説明する。

この処理は、例えば、図９を参照して上述した処理により、パラメータが学習された後、そのパラメータを用いて実行される。

ステップＳ１１１において、情報解析部２３５は、圧縮コンテンツメタ情報の要素数を決定する。要素数は、予め定められた値とされてもよいし、例えば、システム管理者などの指令に基づいて決定されるようにしてもよい。

ステップＳ１１２において、情報解析部２３５は、コンテンツメタ情報DB２３３からコンテンツメタ情報を読み込む。

ステップＳ１１３において、情報解析部２３５は、ステップＳ１１２の処理で読み込んだコンテンツメタ情報について、例えば、PLSA（Probabilistic Latent Semantic Analysis）による解析を行うことにより、要素数を圧縮する。実際には、コンテンツメタ情報DB２３３に記憶されているコンテンツメタ情報のそれぞれについて、例えば、PLSAによる解析を行うことにより、要素数の圧縮が行われることになる。

ステップＳ１１４において、情報解析部２３５は、ステップＳ１１３の処理で要素が圧縮されたコンテンツメタ情報を、圧縮コンテンツメタ情報ＤＢ２３９に記憶する。

このようにして、圧縮コンテンツメタ情報が生成される。

なお、図２３を参照して上述した処理の実行に伴って、PLSAの確率モデルのパラメータが学習されるようにすることも可能である。すなわち、図９を参照して上述した処理により、パラメータが学習された後、そのパラメータを用いて図２３の処理が実行されるのではなく、図２３の処理を実行しながら、パラメータを学習させるようにしても構わない。

図２０のユーザ紹介システム２００において、ユーザ嗜好情報に基づいてユーザを紹介する場合の紹介リスト生成表示処理は、図１１を参照して上述した処理と同様の処理なので、詳細な説明は省略する。

図２０のユーザ紹介システム２００において、所定のコンテンツのコンテンツメタ情報に基づいてユーザを紹介する場合の紹介リスト生成表示処理は、図２４に示されるような処理となる。ここで、図２４のフローチャートを参照して、ユーザ紹介システム２００において、所定のコンテンツメタ情報に基づいてユーザを紹介する場合の紹介リスト生成表示処理の例について説明する。この処理は、例えば、利用ユーザからコンテンツメタ情報に基づく紹介リストの表示が指令されたとき実行される。

ステップＳ１３１において、決定処理部２３７は、例えば、コンテンツのＩＤの入力を受け付けることにより、所定のコンテンツを特定する。

ステップＳ１３２において、決定処理部２３７は、ステップＳ１３１で特定されたコンテンツメタ情報に基づいて、ユーザのフィルタリングを行う。このとき、例えば、コンテンツメタ情報の中で最大の値を持つ要素が検索され、その要素におけるユーザ嗜好情報Ａの値が閾値以上のユーザのみが抽出され、候補ユーザとされる。

なお、ステップＳ１３２の処理は、省略されるようにしてもよい。

ステップＳ１３３において、決定処理部２３７は、ステップＳ１３２のフィルタリングにより得られた候補ユーザのユーザ嗜好情報Ｂを、B嗜好情報ＤＢ２３６から抽出する。

ステップＳ１３４において、決定処理部２３７は、ステップＳ１３１で特定された所定のコンテンツの圧縮コンテンツメタ情報と、候補ユーザのユーザ嗜好情報Bのそれぞれとの類似度を演算する。このとき、例えば、圧縮コンテンツメタ情報およびユーザ嗜好情報Ｂをベクトルとした場合のユークリッド距離の符号反転値として類似度が演算される。

ステップＳ１３５において、決定処理部２３７は、ステップＳ１３４の処理により得られた類似度に基づいて紹介ユーザを決定する。このとき、例えば、予め設定された閾値以上の類似度となったユーザ嗜好情報Ｂに対応する候補ユーザが紹介ユーザとなるように決定される。

ステップＳ１３６において、提示処理部２３８は、例えば、紹介ユーザのユーザ嗜好情報Ａに基づいて紹介理由を作成する。

ステップＳ１３７において、提示処理部２３８は、紹介ユーザリストを、例えば、利用ユーザのブラウザに表示させる。このとき、例えば、図７を参照して上述したような画面が利用ユーザのパーソナルコンピュータの画面などに表示されることになる。

このようにして、コンテンツメタ情報に基づくユーザの紹介が行われる。

ここまで、ユーザ嗜好情報に基づいてユーザを紹介する例、およびコンテンツメタ情報に基づいてユーザを紹介する例について説明したが、ユーザ紹介システム２００においては、ユーザ嗜好情報に基づいてコンテンツを紹介することも当然に可能である。

次に、図２５のフローチャートを参照して、ユーザ紹介システム２００において、ユーザ嗜好情報に基づいてコンテンツを紹介する場合の紹介リスト生成表示処理の例について説明する。この処理は、例えば、利用ユーザから、ユーザ嗜好情報に基づくコンテンツの紹介リストの表示が指令されたとき実行される。

ステップＳ１５１において、決定処理部２３７は、例えば、利用ユーザのユーザ嗜好情報Aを読み込む。

ステップＳ１５２において、決定処理部２３７は、ステップＳ１５１で読み込んだ利用ユーザのユーザ嗜好情報Aに基づいて、コンテンツメタ情報のフィルタリングを行う。このとき、例えば、利用ユーザのユーザ嗜好情報Ａの中で最大の値を持つ要素が検索され、その要素におけるコンテンツメタ情報の値が閾値以上のコンテンツのみが抽出され、候補コンテンツとされる。

なお、ステップＳ１５２の処理は、省略されるようにしてもよい。

ステップＳ１５３において、決定処理部２３７は、ステップＳ１５２のフィルタリングにより得られた候補コンテンツの圧縮コンテンツメタ情報を、圧縮コンテンツメタ情報ＤＢ２３９から抽出する。

ステップＳ１５４において、決定処理部２３７は、利用ユーザのユーザ嗜好情報Ｂと、候補コンテンツの圧縮コンテンツメタ情報のそれぞれとの類似度を演算する。このとき、例えば、ユーザ嗜好情報Ｂおよび圧縮コンテンツメタ情報をベクトルとした場合のユークリッド距離の符号反転値として類似度が演算される。

ステップＳ１５５において、決定処理部２３７は、ステップＳ１５４の処理により得られた類似度に基づいて紹介コンテンツを決定する。このとき、例えば、予め設定された閾値以上の類似度となった圧縮コンテンツメタ情報に対応する候補コンテンツが紹介コンテンツとなるように決定される。

ステップＳ１５６において、提示処理部２３８は、例えば、紹介コンテンツのコンテンツメタ情報に基づいて紹介理由を作成する。

ステップＳ１５７において、提示処理部２３８は、紹介コンテンツリストを、例えば、利用ユーザのブラウザに表示させる。このとき、例えば、図２６に示されるような画面が利用ユーザのパーソナルコンピュータの画面などに表示されることになる。

図２６は、紹介コンテンツリストの例を示している。この例では、紹介コンテンツが「コンテンツ４」、「コンテンツ５」、「コンテンツ６」、・・・と表示されている。そして、紹介コンテンツ「コンテンツ４」の紹介理由が「要素Ａ２」、「要素Ａ５」とされており、紹介コンテンツ「コンテンツ５」の紹介理由が「要素Ａ１」、「要素Ａ２」、「要素Ａ８」とされており、紹介コンテンツ「コンテンツ６」の紹介理由が「要素Ａ５」、「要素Ａ８」、「要素Ａ３」とされている。上述したように、紹介理由としての「要素Ａ１」、「要素Ａ２」、・・・は、それぞれコンテンツメタ情報の要素に基づいて表示されるものである。

また、同図に示される星印は、紹介コンテンツが「コンテンツ４」、「コンテンツ５」、「コンテンツ６」、・・・の圧縮コンテンツメタ情報と利用ユーザのユーザ嗜好情報Ｂとの類似度を表している。この例では、「コンテンツ４」および「コンテンツ５」に星印が４つ付されて表示されており、「コンテンツ６」には星印が３つ付されて表示されている。このようにすることで、「コンテンツ６」との類似度と比較して、「コンテンツ４」および「コンテンツ５」との類似度が高かったことが簡単に認識できるようにすることができる。

なお、図２６には、説明を簡単にするために、紹介理由に「要素Ａ１」、「要素Ａ１０」、「要素Ａ２」、・・・と記載したが、実際には、各要素の名前であって、アーティスト名、ジャンルなどが紹介理由として表示されることになる。

また、紹介理由として圧縮コンテンツメタ情報の要素を表示するようにしてもよい。

このようにして、ユーザ嗜好情報に基づいてコンテンツが紹介される。なお、ここでは、コンテンツの紹介と説明したが、実際には、ユーザに推薦するコンテンツのリストとして図２６に示されるような紹介コンテンツリストが表示されるようにしてもよい。また、例えば、ユーザがユーザ紹介システム２００にログインしたとき、自動的に図２５を参照して上述した処理が実行され、ユーザに推薦するコンテンツの一覧として、図２６に示されるようなリストが提示されるようにしてもよい。

ここまで、ユーザ嗜好情報に基づいてユーザを紹介する例、コンテンツメタ情報に基づいてユーザを紹介する例、およびユーザ嗜好情報に基づいてコンテンツを紹介（推薦）する例について説明したが、ユーザ紹介システム２００においては、コンテンツメタ情報に基づいてコンテンツを紹介（推薦）することもやはり可能である。すなわち、本発明によれば、例えば、ユーザから視聴を希望するコンテンツ、購入したいコンテンツのＩＤなどの入力があった場合、そのコンテンツのコンテンツメタ情報に基づいて、新たなコンテンツを紹介（推薦）することもできる。

次に、図２７のフローチャートを参照して、ユーザ紹介システム２００において、コンテンツメタ情報に基づいてコンテンツを紹介する場合の紹介リスト生成表示処理の例について説明する。この処理は、例えば、利用ユーザからコンテンツメタ情報に基づくコンテンツの紹介リストの表示が指令されたとき実行される。

ステップＳ１７１において、決定処理部２３７は、例えば、コンテンツのＩＤの入力を受け付けることにより、所定のコンテンツを特定する。ここで特定されたコンテンツを基点コンテンツと称することにする。

ステップＳ１７２において、決定処理部２３７は、基点コンテンツのコンテンツメタ情報に基づいて、コンテンツメタ情報のフィルタリングを行う。このとき、例えば、基点コンテンツのコンテンツメタ情報の中で最大の値を持つ要素が検索され、その要素におけるコンテンツメタ情報の値が閾値以上のコンテンツのみが抽出され、候補コンテンツとされる。

なお、ステップＳ１７２の処理は、省略されるようにしてもよい。

ステップＳ１７３において、決定処理部２３７は、ステップＳ１７２のフィルタリングにより得られた候補コンテンツの圧縮コンテンツメタ情報を、圧縮コンテンツメタ情報ＤＢ２３９から抽出する。

ステップＳ１７４において、決定処理部２３７は、基点コンテンツの圧縮コンテンツメタ情報と、候補コンテンツの圧縮コンテンツメタ情報のそれぞれとの類似度を演算する。このとき、例えば、圧縮コンテンツメタ情報をベクトルとした場合のユークリッド距離の符号反転値として類似度が演算される。

ステップＳ１７５において、決定処理部２３７は、ステップＳ１７４の処理により得られた類似度に基づいて紹介コンテンツを決定する。このとき、例えば、予め設定された閾値以上の類似度となった圧縮コンテンツメタ情報に対応する候補コンテンツが紹介コンテンツとなるように決定される。

ステップＳ１７６において、提示処理部２３８は、例えば、紹介コンテンツのコンテンツメタ情報に基づいて紹介理由を作成する。

ステップＳ１７７において、提示処理部２３８は、紹介コンテンツリストを、例えば、利用ユーザのブラウザに表示させる。このとき、例えば、図２６に示されるような画面が利用ユーザのパーソナルコンピュータの画面などに表示されることになる。

このように、基点コンテンツのコンテンツメタ情報に基づいてコンテンツが紹介される。なお、ここでは、コンテンツの紹介と説明したが、実際には、ユーザに推薦するコンテンツのリストとして図２６に示されるような紹介コンテンツリストが表示されるようにしてもよい。また、例えば、ユーザがユーザ紹介システム２００において、コンテンツの視聴または購入の指令を入力したとき、そのコンテンツを基点コンテンツとして自動的に図２７を参照して上述した処理が実行され、ユーザに推薦するコンテンツの一覧として、図２６に示されるようなリストが提示されるようにしてもよい。

なお、ユーザ紹介システム２００において、コンテンツメタ情報に基づいてコンテンツを紹介させる場合、ユーザ情報処理部２３２、Ａ嗜好情報ＤＢ２３４、およびＢ嗜好情報ＤＢ２３６が設けられないようにしてもよい。

なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図２８に示されるような汎用のコンピュータ７００などに、ネットワークや記録媒体からインストールされる。

図２８において、CPU（Central Processing Unit）７０１は、ROM（Read Only Memory）７０２に記憶されているプログラム、または記憶部７０８からRAM（Random Access Memory）７０３にロードされたプログラムに従って各種の処理を実行する。RAM７０３にはまた、CPU７０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU７０１、ROM７０２、およびRAM７０３は、バス７０４を介して相互に接続されている。このバス７０４にはまた、入出力インタフェース７０５も接続されている。

入出力インタフェース７０５には、キーボード、マウスなどよりなる入力部７０６、CRT(Cathode Ray Tube)、ＬＣＤ(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部７０７、ハードディスクなどより構成される記憶部７０８、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部７０９が接続されている。通信部７０９は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース７０５にはまた、必要に応じてドライブ７１０が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア７１１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部７０８にインストールされる。

上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア７１１などからなる記録媒体からインストールされる。

なお、この記録媒体は、図２８に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フロッピディスク（登録商標）を含む）、光ディスク（CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む）、光磁気ディスク（MD（Mini-Disk）（登録商標）を含む）、もしくは半導体メモリなどよりなるリムーバブルメディア７１１により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM７０２や、記憶部７０８に含まれるハードディスクなどで構成されるものも含む。

なお、本明細書において上述した一連の処理を実行するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

本発明の一実施の形態に係るユーザ紹介システムの構成例を示すブロック図である。図１のユーザ紹介システムによるユーザの紹介の処理について説明する図である。ユーザ嗜好情報Ａの構成例を示す図である。ユーザ嗜好情報Ａの別の構成例を示す図である。ユーザ１乃至ユーザ３のユーザ嗜好情報Aの例を示す図である。図５のユーザ嗜好情報Aに基づいて生成されたユーザ嗜好情報Bの例を示す図である。紹介ユーザリストの例を示す図である。ユーザ嗜好情報Ａ生成処理の例を説明するフローチャートである。パラメータ学習処理の例を説明するフローチャートである。ユーザ嗜好情報Ｂ生成処理の例を説明するフローチャートである。紹介リスト生成表示処理の例を説明するフローチャートである。ユーザ紹介システムにより、ユーザの嗜好の特徴を直感的に把握できるように表示させる場合の処理について説明する図である。本発明の一実施の形態に係るユーザ紹介システムの別の構成例を示すブロック図である。ユーザの嗜好の特徴を表す画面の例を示す図である。ユーザの嗜好の特徴を表す画面の別の例を示す図である。ユーザの嗜好の特徴を表す画面のさらに別の例を示す図である。ユーザの嗜好の特徴を表す画面のさらに別の例を示す図である。ユーザの嗜好の特徴を表す画面のさらに別の例を示す図である。嗜好表現画面表示生成処理の例を説明するフローチャートである。本発明の一実施の形態に係るユーザ紹介システムの別の構成例を示すブロック図である。コンテンツメタ情報の構成例を示す図である。圧縮コンテンツメタ情報の構成例を示す図である。圧縮コンテンツメタ情報生成処理の例を説明するフローチャートである。紹介リスト生成表示処理の別の例を説明するフローチャートである。紹介リスト生成表示処理のさらに別の例を説明するフローチャートである。紹介コンテンツリストの例を示す図である。紹介リスト生成表示処理のさらに別の例を説明するフローチャートである。汎用のコンピュータの構成例を示すブロック図である。

符号の説明

１０ユーザ紹介システム，２０ユーザ紹介システム，３１ブラウザ，３２ユーザ情報処理部，３３コンテンツメタ情報DB，３４ A嗜好情報DB，３５ユーザ情報解析部，３６Ｂ嗜好情報DB，３７紹介ユーザ決定部，３８紹介ユーザ提示部，４１嗜好表現値計算部，４２ユーザ嗜好表現部，２００ユーザ紹介システム，２３１ブラウザ，２３２ユーザ情報処理部，２３３コンテンツメタ情報DB，２３４ A嗜好情報DB，２３５情報解析部，２３６Ｂ嗜好情報DB，２３７決定処理部，２３８提示処理部，２３９圧縮コンテンツメタ情報DB

Claims

ユーザが利用したコンテンツに関する情報を取得するユーザ情報取得手段と、
前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報を含むコンテンツメタ情報を取得するメタ情報取得手段と、
予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成する第１のベクトル生成手段と、
前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成する第２のベクトル生成手段と、
複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するユーザ特定手段とを備え、
前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、
前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、
前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する
情報処理装置。
前記紹介ユーザの一覧を、前記利用ユーザに提示する画面のデータを生成する紹介ユーザ提示手段をさらに備え、
前記紹介ユーザ提示手段は、
前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素に基づいて、前記利用ユーザに前記紹介ユーザを紹介する紹介理由を生成する
請求項１に記載の情報処理装置。
前記紹介理由は、前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素のうち、値の大きい順に抽出された所定の個数の要素の名前に基づいて生成される
請求項２に記載の情報処理装置。
前記紹介ユーザ提示手段は、さらに、
前記利用ユーザの前記第１のユーザ嗜好ベクトルの要素のうち、値の大きい順に所定の個数の要素を抽出し、
前記紹介理由の生成のために抽出される前記紹介ユーザの前記第１のユーザ嗜好ベクトルの要素のそれぞれが、前記利用ユーザの前記第１のユーザ嗜好ベクトルから抽出された前記要素と同じ要素である場合、それらの同じ要素の名前に基づいて生成される前記紹介理由を、他の要素の名前に基づいて生成される前記紹介理由の表示とは異なる態様で表示させる
請求項３に記載の情報処理装置。
ユーザ情報取得手段が、ユーザが利用したコンテンツに関する情報を取得し、
メタ情報取得手段が、前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報を含むコンテンツメタ情報を取得し、
第１のベクトル生成手段が、予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成し、
第２のベクトル生成手段が、前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成し、
ユーザ特定手段が、複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するステップを含み、
前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、
前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、
前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する
情報処理方法。
コンピュータを、
ユーザが利用したコンテンツに関する情報を取得するユーザ情報取得手段と、
前記取得したコンテンツに関する情報に基づいて前記ユーザが利用したコンテンツを特定するとともに、そのコンテンツに対応するコンテンツメタ情報であって、前記コンテンツのジャンル、前記コンテンツに関連するアーティストを特定するメタ情報を含むコンテンツメタ情報を取得するメタ情報取得手段と、
予め設定された複数のジャンル、および複数のアーティストを特定するメタ情報に対応する値のそれぞれを要素とするベクトルに対して、前記取得されたコンテンツメタ情報に含まれる前記メタ情報のそれぞれに対応する値に前記コンテンツの利用状況に応じた重みを乗じて得られる第１のユーザ嗜好ベクトルを生成する第１のベクトル生成手段と、
前記生成された第１のユーザ嗜好ベクトルについて、PLSA（Probabilistic Latent Semantic Analysis）のマルチトピックモデルの解析を行って、前記第１のユーザ嗜好ベクトルの要素数が圧縮された第２のユーザ嗜好ベクトルを生成する第２のベクトル生成手段と、
複数の前記第２のユーザ嗜好ベクトルのうち、予め与えられた所定の第２のユーザ嗜好ベクトルと類似度の高い第２のユーザ嗜好ベクトルに対応するユーザを特定するユーザ特定手段とを備え、
前記予め与えられた所定の第２のユーザ嗜好ベクトルは、自分と類似した嗜好のユーザの紹介を依頼する利用ユーザの第２のユーザ嗜好ベクトルであり、
前記ユーザ特定手段は、前記利用ユーザの第１のユーザ嗜好ベクトルの要素の中で値が最大となる要素を検出し、予め記憶されている複数の第１のユーザ嗜好ベクトルのうち、前記検出された要素の値が予め設定された基準を満たすものを、候補ユーザの第１のユーザ嗜好ベクトルとして抽出することで前記候補ユーザを特定し、
前記利用ユーザの前記第２のユーザ嗜好ベクトルと、それぞれの前記候補ユーザの前記第２のユーザ嗜好ベクトルとのユークリッド距離に基づいて算出される前記類似度が予め設定された閾値以上である前記第２のユーザ嗜好ベクトルに対応するユーザを前記紹介ユーザとして特定する情報処理装置として機能させる
プログラム。
請求項６に記載のプログラムが記録されている記録媒体。