JP2004126975A - Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same - Google Patents
Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same Download PDFInfo
- Publication number
- JP2004126975A JP2004126975A JP2002290800A JP2002290800A JP2004126975A JP 2004126975 A JP2004126975 A JP 2004126975A JP 2002290800 A JP2002290800 A JP 2002290800A JP 2002290800 A JP2002290800 A JP 2002290800A JP 2004126975 A JP2004126975 A JP 2004126975A
- Authority
- JP
- Japan
- Prior art keywords
- user
- similar
- preference
- information provider
- user profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】選好傾向の類似に基づいたユーザグループを作成し、情報提供者の広告商品などに興味をもちそうなユーザグループを抽出する。
【解決手段】利用者端末102を使用する各ユーザのサービス利用履歴から作成された個人の興味を表わすユーザプロファイルを格納するユーザプロファイル格納部105と多数の単語に関しての概念ベクトルが格納された知識体系106を備えるサーバ104において、情報提供者端末103から入力された情報提供者の広告商品などを表現したキーワードとユーザプロファイルとの相関を算出することで、情報提供者の広告商品に興味をもちそうなユーザグループを把握することが出来る。また、グルーピング処理部108において、情報提供者が望む人数等のパラメータに合わせたユーザ作成を行うことで、情報提供者の意図するユーザグループ(興味の強弱、人数等)を算出することが出来る。
【選択図】 図1A user group is created based on the similarity of a preference tendency, and a user group likely to be interested in an advertisement product of an information provider is extracted.
Kind Code: A1 A user profile storage unit for storing a user profile representing personal interest created from service usage history of each user using a user terminal, and a knowledge system in which concept vectors regarding a large number of words are stored. The server 104 including the information provider 106 calculates the correlation between the user profile and the keyword expressing the advertising product of the information provider input from the information provider terminal 103, so that the advertising product of the information provider becomes interested. User groups can be grasped. In addition, the grouping processing unit 108 creates a user in accordance with a parameter such as the number of persons desired by the information provider, so that the user group (intensity of interest, number of persons, etc.) intended by the information provider can be calculated.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、ネットワーク上で利用されるコンテンツ提供システムから取得される利用履歴を用いて、情報提供者がユーザに対し効果的に広告提供等を行う場合に、利用者を分類し、選好傾向が類似するユーザを抽出することを目的とした技術に関する。
【0002】
【従来の技術】
ネットワークを利用した情報提供市場は年々拡大している。情報提供者がユーザに対し効果的に広告提供を行うためには、ターゲットユーザを絞り込む必要があると言われている。ターゲットを絞り込む方法として、個々のユーザの特性を把握し、似た特性をまとめてグループ化する手法が挙げられる。
【0003】
従来、個々のユーザの特性は情報フィルタリング技術により、ユーザの興味という形で抽出してきた。サービス例として、オンラインスーパーマーケットの例が挙げられるが、この場合、個人適応化機能等を用いてユーザのアクセス、購入履歴をもとに個々のユーザに合わせた「情報推薦サービス」を展開したり、キャンペーンの対象にするユーザを絞り込んだりしている。
【0004】
例えば、特許文献1にはユーザの嗜好情報とそのユーザ嗜好に類似したユーザグループを抽出する手法について記載されている。また、特許文献2にはユーザプロファイルとコンテンツプロファイルとの間の類似度を演算することについて記載されており、特許文献3には2次元マップについて記載されている。
【0005】
【特許文献1】
特開平11−15840号公報
【特許文献2】
特開2001−229167号公報
【特許文献3】
特開2002−175321号公報
【0006】
【発明が解決しようとする課題】
従来技術は、配信する情報に対して興味を持つ可能性があるユーザを抽出することは可能だが、各ユーザの配信情報に対する興味の強弱を表現することが出来ていないため、興味度に基づくユーザの絞り込みが難しいという状況がある。特許文献1では、ユーザの嗜好情報とそのユーザ嗜好に類似したユーザグループを抽出する手法が述べられているが、情報提供者が意図するユーザグループを算出することや興味の強弱等によりグループ化する人数(ターゲットとする人数)を調整することは出来ない。
【0007】
本発明の目的は、選好傾向の類似に基づいたユーザグループを作成し、情報提供者の広告商品などに興味をもちそうなユーザグループを抽出する。また、興味度や人数をパラメータとして、ユーザグループを選択することで、情報提供者が広告ターゲットを容易に選定できる選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体を提案することにある。
【0008】
【課題を解決するための手段】
本発明の選好傾向類似ユーザ抽出方法は、各ユーザのサービス利用履歴から作成された個人の興味を表わすユーザプロファイルと多数の単語に関しての概念ベクトルが格納された知識体系を保持するサーバにおいて、情報提供者の広告商品などを表現したキーワードとユーザプロファイルとの相関を算出することで、情報提供者の広告商品に興味をもちそうなユーザグループを把握することが出来る。
【0009】
また、情報提供者の広告商品などに関するキーワードやターゲットユーザ数等のユーザグループ可視化に必要なパラメータを入力する手段とグルーピング処理部において、情報提供者が望む人数等のパラメータに合わせたユーザ作成を行うことで、情報提供者の意図するユーザグループ(興味の強弱、人数等)を算出することが出来る。
【0010】
【発明の実施の形態】
以下、本発明の一実施の形態について説明する。
【0011】
図1は、本発明の実施形態におけるシステム構成図である。本実施の形態では、インターネットなどのネットワーク101を通して、複数の利用者端末102や情報提供者端末103がサーバ104に接続されている。以下、図1、図2、図3を用いて説明する。サーバ104は、個人の興味を表わしたユーザプロファイルをユーザプロファイル格納部105に保持している。このユーザプロファイルは、各ユーザが利用者端末102から利用したサービス利用履歴から作成されている。また、サーバ104は、多数の単語に関しての概念ベクトルが格納された知識体系106と利用者分類における各種の処理を行う演算部(マッチング処理演算部107、グルーピング処理部108、可視化処理部109、ユーザ間類似度算出処理部110)から構成される。ユーザプロファイル及び知識体系の構成、演算部における各処理部の機能詳細に関しては後に記載する。
【0012】
情報提供者が広告商品などに興味をもちそうなユーザグループを把握したい場合は、情報提供者端末103から情報提供者の広告商品などに関するキーワードを入力して、サーバ104に送信する。また、結果として出力するユーザ数等のユーザグループ可視化に必要なパラメータを入力することも出来る。
【0013】
サーバ104は、情報提供者端末103から入力されたキーワード等のパラメータ201に対して、ユーザプロファイルベクトル204を検索することで、キーワードと関連性の高い概念ベクトルを抽出することができる。
【0014】
さらにサーバ104では、キーワードを含む概念ベクトルを知識体系から抽出し、ユーザプロファイルに含まれるユーザプロファイルベクトル204とのマッチング処理205を行うことで、情報提供者から入力されたキーワードに興味を持つ可能性があるユーザグループを算出し、グルーピング処理206により、情報提供者が望む人数等のパラメータに合わせたユーザグループの作成を行うことができる。
【0015】
以上の処理結果を可視化処理208により表形式で出力することも出来る。図3の可視化例では、マッチングに使用された概念ベクトルを保持するユーザを、各概念ごとに集計した表301としている。また、各ユーザプロファイルから年齢等の属性を抽出して集計した表302を出力することも出来る。
【0016】
また、グルーピング処理206から出力されたユーザグループに対して、ユーザ間類似度算出処理207によりユーザ間の類似度をベクトルの距離尺度として算出し、結果を可視化処理208によりビジュアル化する場合、この可視化された結果は、情報提供者が意図するユーザグループを選好傾向の類似性により可視化されている303。また、情報提供者が入力したキーワードとの関連性の強弱を色変化を用いて表現することも考えられる。また、出力されたユーザグループに対して、各ユーザプロファイルをすべて利用して、ユーザ間類似度算出処理207によりユーザ間の類似度を算出し、結果を可視化処理208によりビジュアル化する場合、先のビジュアル化では発見できなかったユーザグループや属性の傾向を把握することが出来る。また、ユーザプロファイルと同様に、各概念ベクトルを多次元尺度構成法を用いて2次元平面上における配置(座標)を出力すれば、可視化処理208により303にマッピングすることができる。また、ユーザプロファイルに利用者の連絡先(E−mailアドレスなど)が含まれ、かつメールサーバ等のユーザに連絡をとることが出来る手段をシステムに含む場合、前記で表示したユーザグループに対しで情報提供者が配信したい情報を届けることが可能である。
【0017】
次に、本発明における、ユーザプロファイルの構成例、マッチング処理、グルーピング処理について説明する。
【0018】
〔知識体系〕
コーパスなどより作成された各概念の表現に使用される単語集合を知識体系として利用する。今回の例では、知識体系における一つの概念情報は、一つの興味領域を表現しているとする。図4に知識体系の例を示す。
【0019】
今回は、上記を用いて、利用者に提供されるコンテンツのジャンル(ニュース、アニメ、音楽、スポーツ、映画)を、概念ベクトルデータベース(W1,W2・・・W5)として表現する場合を具体例として考える。
【0020】
〔コンテンツプロファイル〕
ネットワーク上で利用される複数のコンテンツ提供システムから取得されるコンテンツのプロファイルを知識体系から抽出した概念ベクトルの組み合わせにより作成する場合を想定する。コンテンツプロファイルは、特願2000−355870(特許文献3)により説明されているコンテンツプロファイル作成方法に加え、コンテンツ文章中の出現頻度が上位に位置する単語を数個選択して、選択した名詞を含む概念を知識体系から検索して、各概念において単語が持つ重みから、各概念ベクトルの値を算出する。
【0021】
コンテンツプロファイルベクトルの例
Vcontents=<W1,W2・・・Wi> Wは各概念の重要度
例えば、コンテンツAにおいて、コンテンツ文章中における出現頻度が高い単語上位5個に(T21,T22,T31,T42,T51)が含まれる場合、W2(アニメ)における単語(T21,T22)の重み合計、同じくW3(音楽)・・・W5(映画)における単語(T31,T42,T51)の重み合計を算出する。算出された重み合計を用いて、コンテンツプロファイルベクトルを表現すると、下記のように表現できる。
【0022】
Vcontents =<0, 0.4, 0.05, 0.02, 0.25>
〔ユーザプロファイル〕
ユーザプロファイルは、各利用者(ユーザ)の興味を表現したキーワードベクトルとして表現される。ユーザプロファイルベクトルの作成方法は、前述のコンテンツプロファイルを利用して、特願2000−355870(特許文献3)で説明されている方法などにより作成することが考えられる。また、ユーザプロファイルには、当該ユーザの性別、年齢、居住地域などの他の属性も付加されることも考えられる。
【0023】
ユーザプロファイルベクトルの例
Vprofile =<W1,W2・・・Wn> Wはユーザプロファイルとして使用する概念ベクトル
ユーザプロファイルで使用する概念ベクトル(W1,W2・・・W5)は、知識体系から選択することを考える。
【0024】
以下には、上記を用いて、利用者に提供されるコンテンツのジャンル(ニュース、アニメ、音楽、スポーツ、映画)を、W1,W2・・・W5として利用する場合を具体例として述べる。
【0025】
まず、各利用者のコンテンツ視聴履歴を用いて、特願2000−355870(特許文献3)で説明されている方法などにより、ユーザプロファイルベクトルの各軸(W1,W2・・・W5)の重要度を算出する。
Vprofile =<W1,W2・・・W5 >
※各軸を右記とする。(W1=ニュース、W2=アニメ、W3=音楽、W4=スポーツ、W5=映画)
映画のコンテンツ(以下に示すコンテンツベクトルを持つものとする)
Vcontents =<0, 0.4, 0.05, 0.02, 0.25>
を視聴した利用者は、次のようなプロファイルとして表現されることになっている。
Vprofile =<0, 0.4, 0.05, 0.02, 0.25>
連続して、以下に示すコンテンツベクトルを視聴した場合、
Vcontents =<0.04, 0, 0.1, 0.2, 0.1>
ユーザプロファイルは、次のようになる。
Vprofile =<0.02, 0.2, 0.03, 0.11, 0.18>
〔マッチング処理〕
マッチング処理では、知識体系から、広告主が入力したキーワードを単語として含む概念ベクトルを抽出する。抽出した概念ベクトルから各ユーザプロファイルの概念ベクトルとのマッチングを行い、広告に興味を持つユーザを抽出する。例えば、キーワード〔チケット〕〔プレゼント〕に対して、広告に興味を持つユーザを抽出する場合を考える。「映画」の概念ベクトルに〔チケット〕が[単語T54:0.02]として含まれる場合、ユーザプロファイルにおける概念ベクトル「映画」に着目して、利用者をソートする。概念ベクトルが閾値以上のユーザを候補として抽出することなどが考えられる。
【0026】
また、キーワード〔プレゼント〕は、ユーザプロファイルに使用されている概念ベクトルには含まれないが、知識体系中の概念ベクトルWiに[単語Tin:0.3]として含まれる場合、概念ベクトルWiに類似するユーザプロファイルに使用されている概念ベクトルを用いる方法も考えられる。左記の方法として、一般的に知られているベクトル空間法を用いて各概念ベクトルとの類似度計算を行うことが考えられる。計算された類似度が閾値以上の場合、ユーザプロファイルに使用されている概念ベクトルを用いて、利用者をソートすることも考えられる。
【0027】
【数1】
【0028】
〔グルーピング処理〕
グルーピング処理では、マッチング処理により選択されたユーザと似た興味を持つユーザを選択し、その概念ベクトルがユーザの興味に近いかどうかという判定を行う。そのため、グルーピングを2つの段階に分けて処理する。各段階を経るに従って、広告主が設定するターゲットユーザの数を増やしていく事ができる。
【0029】
まず、マッチング処理により、広告主が設定したキーワードを含んだ、ユーザプロファイルにおける概念ベクトルが選択される。この選択された概念ベクトル(概念)を含むユーザプロファイルを持つグループが第一グループとなる。次に、広告主が設定したキーワードを含んだ知識体系中の概念ベクトルが存在する場合、左記の概念ベクトルとユーザプロファイルにおける概念ベクトル間での類似度を算出して、類似度が閾値を超える場合、ユーザプロファイルにおける概念ベクトルを含むユーザプロファイルを持つグループが第二グループとなる。
【0030】
例えば、「チケット」のキーワードを含む概念として「映画」が抽出された場合、この「映画」をある閾値以上の値としてユーザプロファイル中に含むユーザを第一グループとして抽出する。次に、キーワード〔プレゼント〕を含んだ知識体系中の概念ベクトルと類似するユーザプロファイルに使用されている概念ベクトルとの類似度計算を行い、計算された類似度が閾値以上の場合、ユーザプロファイルに使用されている概念ベクトルをある閾値以上の値としてユーザプロファイル中に含むユーザを第二グループとして抽出する。このようにして選択された概念ベクトル(概念)を含むユーザプロファイルを持つグループが、第二グループとなる。ターゲット人数は、第一グループ、第一グループ+第二グループと拡大していく。上記グループの人数等から、情報提供者が入力した人数等のパラメータに近づけるように概念ベクトルを選択していく。また、グルーピング処理によって得られた第一グループ、第二グループ内の多くのユーザが共通して持っている新たな類似度の高い概念ベクトルや、共通している他の属性を発見することで、第三のグループを算出することもできる。
【0031】
以下では、例として、広告主が広告を打ち、配信先人数500人を指定する状況を考える。広告主は広告の特徴を表わすキーワード[例:プレゼント、チケット]と、配信先人数[500人]を入力する。出力では、キーワード[チケット]と概念ベクトル[映画]に関して、ユーザプロファイル中に、ある閾値以上の値を保持する利用者数と、キーワード[プレゼント]を含む概念と類似の高い概念[音楽]、および左記概念ベクトル値で、ある閾値以上の値を保持する利用者数が表示される。
【0032】
〔ユーザ間類似度算出処理〕
上記までの処理により抽出されたユーザに対して、各ユーザプロファイルベクトル間の類似度を、2次元平面上の距離尺度として表現する。例として、あるユーザiの持つユーザプロファイルベクトルを、下記のように表現するとき
Vprofile =<Wi,1,Wi,2・・・Wi,n> Wi,nはユーザiにおけるn番目の概念が持つ重要度
類似度計算には下記に示すベクトルの距離尺度を用いることが考えられる。
【0033】
【数2】
【0034】
上記式を用いて、抽出されたユーザに対して、各ユーザプロファイルベクトル間の類似度を、多次元尺度構成法を用いて2次元平面上の距離尺度として表現することで、各ユーザの2次元平面上における配置(座標)を算出する。
【0035】
〔可視化処理〕
算出された各ユーザの2次元平面上における配置(座標)を用いて、303のようにユーザをプロットする。ユーザと共に各概念ベクトルの2次元平面上における配置(座標)を多次元尺度構成法により算出してプロットすることも考えられる。また、キーワードとの関連度の違いを色などにより表現することも考えられる。
【0036】
以上、本発明者によってなされた発明を、前記実施の形態に基づき具体的に説明したが、本発明は、前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは勿論である。
【0037】
【発明の効果】
以上説明したように、本発明によれば、ユーザの選好傾向に関する類似度に基づいてユーザを算出して、情報提供者の広告商品などに興味をもちそうなユーザグループを作成して、興味度や人数をパラメータとして抽出するユーザグループを選択することで、情報提供者が広告ターゲットを容易に選定できる。
【図面の簡単な説明】
【図1】本発明の実施形態におけるシステム構成図である。
【図2】本発明の実施形態における利用者分類方法を説明するためのフローチャートである。
【図3】本発明の実施形態における利用者分類方法を用いたユーザプロファイル可視化例を示す図である。
【図4】知識体系の例を示す図である。
【符号の説明】
101…インターネットなどのネットワーク、102…利用者端末、103…情報提供者端末、104…サーバ、105…ユーザプロファイル格納部、106…知識体系、107…マッチング処理演算部、108…グルーピング処理部、109…可視化処理部、110…ユーザ間類似度算出処理部、201…キーワード等のパラメータ、204…ユーザプロファイルベクトル、205…マッチング処理、206…グルーピング処理、207…ユーザ間類似度算出処理、208…可視化処理。[0001]
TECHNICAL FIELD OF THE INVENTION
According to the present invention, when an information provider effectively provides an advertisement to a user using a usage history acquired from a content providing system used on a network, the user is classified and the preference tendency is reduced. The present invention relates to a technique for extracting similar users.
[0002]
[Prior art]
The information provision market using networks is expanding year by year. It is said that an information provider needs to narrow down target users in order to effectively provide advertisements to users. As a method of narrowing down the target, there is a method of grasping the characteristics of individual users and grouping similar characteristics together.
[0003]
Conventionally, the characteristics of individual users have been extracted in the form of user interests using information filtering technology. An example of a service is an online supermarket. In this case, the “information recommendation service” tailored to each user based on the user's access and purchase history using personal adaptation functions, etc., Or narrowing down the audience for the campaign.
[0004]
For example,
[0005]
[Patent Document 1]
JP-A-11-15840 [Patent Document 2]
JP 2001-229167 A [Patent Document 3]
JP 2002-175321 A
[Problems to be solved by the invention]
In the prior art, it is possible to extract users who may be interested in the information to be distributed, but it is not possible to express the level of interest in the distribution information of each user. There is a situation where it is difficult to narrow down.
[0007]
An object of the present invention is to create a user group based on the similarity of the preference tendency and extract a user group likely to be interested in an advertisement product of an information provider. In addition, by selecting a user group using the degree of interest and the number of persons as parameters, an information provider can easily select an advertisement target. It is to propose a recording medium.
[0008]
[Means for Solving the Problems]
According to the method for extracting users having similar preference trends according to the present invention, information is provided in a server that holds a knowledge system in which concept vectors regarding a number of words and a user profile representing individual interests created from service usage history of each user are stored. By calculating the correlation between the keyword expressing the advertisement product of the user and the user profile, it is possible to grasp the user group likely to be interested in the advertisement product of the information provider.
[0009]
In addition, a means for inputting parameters necessary for visualizing a user group such as a keyword relating to an advertisement product of an information provider and the number of target users and a grouping processing unit create a user according to parameters such as the number of information providers desired. Thus, the user group (strength of interest, number of persons, etc.) intended by the information provider can be calculated.
[0010]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described.
[0011]
FIG. 1 is a system configuration diagram in the embodiment of the present invention. In this embodiment, a plurality of user terminals 102 and
[0012]
When the information provider wants to grasp a user group that is likely to be interested in an advertisement product or the like, a keyword related to the advertisement product of the information provider is input from the
[0013]
The
[0014]
Further, the
[0015]
The above processing results can be output in a tabular form by the
[0016]
Also, for the user group output from the
[0017]
Next, a configuration example of a user profile, matching processing, and grouping processing according to the present invention will be described.
[0018]
[Knowledge system]
A word set used for expressing each concept created from a corpus or the like is used as a knowledge system. In this example, it is assumed that one piece of conceptual information in the knowledge system represents one area of interest. FIG. 4 shows an example of the knowledge system.
[0019]
In this case, using the above, the genre (news, animation, music, sports, movie) of the content provided to the user is represented as a concept vector database (W 1 , W 2 ... W 5 ). Consider as a specific example.
[0020]
[Content Profile]
It is assumed that profiles of contents obtained from a plurality of content providing systems used on a network are created by combining concept vectors extracted from a knowledge system. The content profile includes, in addition to the content profile creation method described in Japanese Patent Application No. 2000-355870 (Patent Document 3), selecting a few words having a higher appearance frequency in a content sentence and selecting the noun. The concept is retrieved from the knowledge system, and the value of each concept vector is calculated from the weight of the word in each concept.
[0021]
Example of content profile vector V contents = <W 1 , W 2 ... Wi > W is the importance of each concept. For example, in the content A, the top five words that appear frequently in the content text (T 21 , T 22, T 31, T 42 , if T 51) includes the weight sum word (T 21, T 22) in W 2 (animation) in the same W 3 (music) · · · W 5 (Film) calculating a weight sum word (T 31, T 42, T 51). When the content profile vector is expressed using the calculated weight sum, it can be expressed as follows.
[0022]
V contents = <0, 0.4, 0.05, 0.02, 0.25>
[User profile]
The user profile is expressed as a keyword vector expressing the interest of each user (user). As a method of creating the user profile vector, it is conceivable to create the user profile vector by using the above-described content profile and the method described in Japanese Patent Application No. 2000-355870 (Patent Document 3). It is also conceivable that other attributes such as the gender, age, and residence area of the user are added to the user profile.
[0023]
Example of user profile vector V profile = <W 1 , W 2 ... W n > W is a concept vector used as a user profile The concept vector (W 1 , W 2 ... W 5 ) used in the user profile is Consider choosing from a body of knowledge.
[0024]
The following, using the above, described the content of the genre that will be provided to the user (news, animation, music, sports, movies), and the case to be used as W 1, W 2 ··· W 5 as a specific example .
[0025]
First, each axis (W 1 , W 2, ..., W 5 ) of the user profile vector is determined by using the content viewing history of each user and the method described in Japanese Patent Application No. 2000-355870 (Patent Document 3). Is calculated.
V profile = <W 1 , W 2 ... W 5 >
* Each axis is described on the right. (W 1 = news, W 2 = animation, W 3 = music, W 4 = sports, W 5 = movie)
Movie content (has the content vector shown below)
V contents = <0, 0.4, 0.05, 0.02, 0.25>
Is viewed as a profile as follows.
V profile = <0, 0.4, 0.05, 0.02, 0.25>
If you watch the following content vectors continuously,
V contents = <0.04, 0, 0.1, 0.2, 0.1>
The user profile is as follows.
V profile = <0.02, 0.2, 0.03, 0.11, 0.18>
[Matching processing]
In the matching process, a concept vector including a keyword input by the advertiser as a word is extracted from the knowledge system. Matching is performed with the concept vector of each user profile from the extracted concept vector, and a user who is interested in the advertisement is extracted. For example, consider a case where a user who is interested in an advertisement is extracted for a keyword [ticket] [present]. When [ticket] is included in the concept vector of “movie” as [word T 54 : 0.02], the users are sorted by focusing on the concept vector “movie” in the user profile. It is conceivable to extract a user whose concept vector is equal to or larger than a threshold as a candidate.
[0026]
In addition, keyword [gift] is not included in the concept vector that is being used in the user profile, the concept vector W i in the body of knowledge [word T in: 0.3] If that is included as, the concept vector W A method using a concept vector used for a user profile similar to i is also conceivable. As a method described on the left, it is conceivable to calculate the similarity with each concept vector using a generally known vector space method. If the calculated similarity is equal to or greater than the threshold, the users may be sorted using the concept vector used in the user profile.
[0027]
(Equation 1)
[0028]
[Grouping processing]
In the grouping process, a user having an interest similar to the user selected by the matching process is selected, and it is determined whether or not the concept vector is close to the user's interest. Therefore, the grouping is processed in two stages. Through each step, the number of target users set by the advertiser can be increased.
[0029]
First, a concept vector in the user profile including the keyword set by the advertiser is selected by the matching process. A group having a user profile including the selected concept vector (concept) is a first group. Next, when there is a concept vector in the knowledge system including the keyword set by the advertiser, the similarity between the concept vector on the left and the concept vector in the user profile is calculated, and the similarity exceeds the threshold. The group having the user profile including the concept vector in the user profile is the second group.
[0030]
For example, when "movie" is extracted as a concept including the keyword of "ticket", a user that includes this "movie" in a user profile as a value equal to or greater than a certain threshold is extracted as a first group. Next, a similarity calculation between the concept vector in the knowledge system including the keyword [present] and the concept vector used for the similar user profile is performed, and when the calculated similarity is equal to or larger than the threshold, the similarity calculation is performed. A user that includes a used concept vector in a user profile as a value equal to or greater than a certain threshold is extracted as a second group. A group having a user profile including the concept vector (concept) selected in this way is a second group. The target number will expand to the first group, the first group + the second group. Based on the number of persons in the group and the like, concept vectors are selected so as to approach parameters such as the number of persons input by the information provider. In addition, the first group obtained by the grouping process, a new concept vector having a high similarity that many users in the second group have in common, and by discovering other common attributes, A third group can also be calculated.
[0031]
In the following, as an example, consider a situation in which an advertiser places an advertisement and specifies the number of distribution destinations to be 500. The advertiser inputs a keyword [example: present, ticket] representing the feature of the advertisement and the number of distribution destinations [500]. In the output, regarding the keyword [ticket] and the concept vector [movie], in the user profile, the number of users holding a certain value or more, a high concept [music] similar to the concept including the keyword [present], and In the concept vector value on the left, the number of users holding a value equal to or greater than a certain threshold is displayed.
[0032]
[User similarity calculation processing]
The similarity between each user profile vector is expressed as a distance measure on a two-dimensional plane with respect to the user extracted by the above processing. As an example, when a user profile vector of a certain user i is expressed as follows, V profile = < Wi, 1 , Wi, 2 ... Wi, n > Wi, n is n in user i. It is conceivable to use the following vector distance scale for the importance similarity calculation of the second concept.
[0033]
(Equation 2)
[0034]
Using the above equation, the degree of similarity between each user profile vector with respect to the extracted user is expressed as a distance measure on a two-dimensional plane using a multidimensional scale construction method. The arrangement (coordinates) on the plane is calculated.
[0035]
(Visualization processing)
Using the calculated arrangement (coordinates) of each user on the two-dimensional plane, the users are plotted as indicated by 303. It is also conceivable that the arrangement (coordinates) of each concept vector on a two-dimensional plane is calculated and plotted by a multidimensional scaling method together with the user. It is also conceivable to express the difference in the degree of relevance with the keyword by a color or the like.
[0036]
As described above, the invention made by the inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and can be variously modified without departing from the gist of the invention. Needless to say,
[0037]
【The invention's effect】
As described above, according to the present invention, a user is calculated based on a similarity regarding a user's preference tendency, and a user group that is likely to be interested in an advertisement product of an information provider is created. The information provider can easily select an advertisement target by selecting a user group to extract the number of persons and the number of persons as a parameter.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram according to an embodiment of the present invention.
FIG. 2 is a flowchart for explaining a user classification method according to the embodiment of the present invention.
FIG. 3 is a diagram illustrating an example of visualizing a user profile using a user classification method according to an embodiment of the present invention.
FIG. 4 is a diagram illustrating an example of a knowledge system.
[Explanation of symbols]
101: Network such as the Internet, 102: User terminal, 103: Information provider terminal, 104: Server, 105: User profile storage unit, 106: Knowledge system, 107: Matching processing operation unit, 108: Grouping processing unit, 109 ... visualization processing unit, 110 ... user similarity calculation processing unit, 201 ... parameters such as keywords, 204 ... user profile vector, 205 ... matching processing, 206 ... grouping processing, 207 ... user similarity calculation processing, 208 ... visualization processing.
Claims (10)
多数の単語に関しての概念ベクトルが格納された知識体系と、
を備えたシステムにおける選好傾向類似ユーザ抽出方法であって、
情報提供者が入力したキーワード群に対して、類似する概念ベクトルを前記知識体系から算出して、ユーザプロファイルとのマッチング処理を行うマッチング処理と、
情報提供者の入力したパラメータに算出結果を近づける処理を行うグルーピング処理と、
グルーピング処理結果を可視化する可視化処理と、
を行う選好傾向類似ユーザ抽出方法。A user profile storage unit for storing a user profile representing personal interest created from the service usage history of each user;
A knowledge system that stores concept vectors for many words,
Is a method of extracting users having similar preferences in a system having
For a keyword group input by the information provider, a similar concept vector is calculated from the knowledge system, and a matching process is performed to perform a matching process with a user profile;
A grouping process for bringing a calculation result closer to a parameter input by an information provider;
A visualization process for visualizing a grouping process result;
Method for extracting users with similar preferences.
マッチング処理により算出された各ユーザが保持するユーザプロファイルベクトル間の類似度を算出し、
その結果を多次元尺度構成法により2次元平面状の座標に変換し、
変換された各ユーザの2次元平面上における座標をもとに、各ユーザを2次元平面状にマッピングすることで選好傾向類似ユーザを可視化する選好傾向類似ユーザ抽出方法。The method of extracting users having similar preferences as in claim 1,
Calculate the similarity between user profile vectors held by each user calculated by the matching process,
The result is converted into two-dimensional planar coordinates by a multidimensional scaling method,
A preference-similar-user extraction method for visualizing preference-similar users by mapping each user in a two-dimensional plane based on the converted coordinates of each user on a two-dimensional plane.
マッチング処理により算出された、情報提供者が入力したキーワード群に対して、類似する概念ベクトルを多次元尺度構成法により2次元平面上の座標に変換して、ユーザと共にマッピングして可視化する選好傾向類似ユーザ抽出方法。The user preference extraction method according to claim 2, wherein
A preference tendency for a keyword group input by an information provider, calculated by the matching process, to convert a similar concept vector into coordinates on a two-dimensional plane by a multidimensional scaling method, and to map and visualize with a user. Similar user extraction method.
多数の単語に関しての概念ベクトルが格納された知識体系と、
情報提供者が入力したキーワード群に対して、類似する概念ベクトルを前記知識体系から算出して、ユーザプロファイルとのマッチング処理を行うマッチング処理部と、
情報提供者の入力したパラメータに算出結果を近づける処理を行うグルーピング処理部と、
グルーピング処理部の結果を可視化する可視化処理部を基本として備える選好傾向類似ユーザ抽出装置。A user profile storage unit for storing a user profile representing personal interest created from the service usage history of each user;
A knowledge system that stores concept vectors for many words,
For a keyword group input by the information provider, a matching processing unit that calculates a similar concept vector from the knowledge system and performs a matching process with a user profile;
A grouping processing unit that performs a process of bringing the calculation result closer to the parameter input by the information provider,
A preference extraction similar user extraction device basically including a visualization processing unit for visualizing a result of a grouping processing unit.
マッチング処理部により算出された各ユーザが保持するユーザプロファイルベクトル間の類似度を算出するユーザ間類似度算出処理部と、
ユーザ間類似度算出処理部からの出力結果を多次元尺度構成法により2次元平面状の座標に変換するユーザ間類似度算出処理部と、
変換された各ユーザの2次元平面上における座標をもとに、各ユーザを2次元平面状にマッピングすることで選好傾向類似ユーザを可視化する可視化処理部を備える選好傾向類似ユーザ抽出装置。The preference extraction similar user extraction device according to claim 4,
An inter-user similarity calculation processing unit that calculates a similarity between user profile vectors held by each user calculated by the matching processing unit;
An inter-user similarity calculation processing unit that converts an output result from the inter-user similarity calculation processing unit into two-dimensional planar coordinates by a multidimensional scale configuration method;
A preference-similar-user extraction device including a visualization processing unit that visualizes preference-similar users by mapping each user in a two-dimensional plane based on the converted coordinates of each user on a two-dimensional plane.
マッチング処理部により算出された、情報提供者が入力したキーワード群に対して、類似する概念ベクトルを多次元尺度構成法により2次元平面上の座標に変換して、ユーザと共にマッピングして可視化する可視化処理部を備える選好傾向類似ユーザ抽出装置。The preference-similar-user extracting device according to claim 5,
For a keyword group input by the information provider calculated by the matching processing unit, a similar concept vector is converted into coordinates on a two-dimensional plane by a multidimensional scale construction method, and is mapped and visualized with a user. A preference-similar-user extracting device including a processing unit.
情報提供者が入力したパラメータに算出結果を近づける処理を行うグルーピング処理機能と、
グルーピング処理結果を可視化する可視化処理機能と、
を実現させるための選好傾向類似ユーザ抽出プログラム。A similar concept vector extracted for a keyword group input by an information provider from a knowledge system in which concept vectors for a large number of words are stored, and a user profile representing individual interest created from a service usage history of each user. Matching processing function to perform matching processing of
A grouping process function for performing a process of bringing the calculation result closer to the parameter input by the information provider,
A visualization processing function that visualizes the grouping processing results,
A user extraction program similar to the preference trend for realizing.
マッチング処理により算出された各ユーザが保持するユーザプロファイルベクトル間の類似度を算出し、
その結果を多次元尺度構成法により2次元平面状の座標に変換し、
変換された各ユーザの2次元平面上における座標をもとに、各ユーザを2次元平面状にマッピングすることで選好傾向類似ユーザを可視化する選好傾向類似ユーザ抽出プログラム。8. The user extraction program according to claim 7, wherein:
Calculate the similarity between user profile vectors held by each user calculated by the matching process,
The result is converted into two-dimensional planar coordinates by a multidimensional scaling method,
A preference tendency similar user extraction program for visualizing a preference tendency similar user by mapping each user in a two-dimensional plane based on the converted coordinates of each user on a two-dimensional plane.
情報提供者が入力したキーワード群に対して、類似する概念ベクトルを多次元尺度構成法により2次元平面上の座標に変換して、ユーザと共にマッピングして可視化する選好傾向類似ユーザ抽出プログラム。9. The user extraction program according to claim 8, wherein:
A preference-similar user extraction program that converts a concept vector similar to a keyword group input by an information provider into coordinates on a two-dimensional plane by a multidimensional scale construction method, and maps and visualizes the coordinates with a user.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002290800A JP2004126975A (en) | 2002-10-03 | 2002-10-03 | Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002290800A JP2004126975A (en) | 2002-10-03 | 2002-10-03 | Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004126975A true JP2004126975A (en) | 2004-04-22 |
Family
ID=32282562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002290800A Pending JP2004126975A (en) | 2002-10-03 | 2002-10-03 | Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004126975A (en) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772862B1 (en) | 2005-10-11 | 2007-11-02 | 삼성전자주식회사 | System and method for providing online community service for digital content |
WO2009014058A1 (en) * | 2007-07-20 | 2009-01-29 | Nec Corporation | Knowledge discovery assistance system, method and program |
JP2009157864A (en) * | 2007-12-28 | 2009-07-16 | Nifty Corp | System, method and program for supporting creation of community |
JP2010244380A (en) * | 2009-04-08 | 2010-10-28 | Sony Corp | Information processing apparatus and method, and program thereof |
KR101010997B1 (en) * | 2009-03-24 | 2011-01-26 | 한국과학기술원 | Similar User Extraction System and Method among Multiple Web Servers |
JP2011511982A (en) * | 2008-02-01 | 2011-04-14 | ウィンストン,ロナルド,エイチ. | Similarity matching system and method |
JP2011146004A (en) * | 2010-01-18 | 2011-07-28 | Zigsow Kk | User profiling system using web community site |
KR101102853B1 (en) | 2008-12-30 | 2012-01-05 | 엔에이치엔비즈니스플랫폼 주식회사 | Method, system and computer readable recording medium for dynamically providing advertisements using collaborative filtering |
JP2012118628A (en) * | 2010-11-29 | 2012-06-21 | Kddi Corp | Retrieval distribution server for distributing associated information corresponding to retrieval log, and program and method therefor |
JP2012138099A (en) * | 2005-12-21 | 2012-07-19 | Digimarc Corp | Rule-driven pan id metadata routing system and network |
JP2012518237A (en) * | 2009-02-17 | 2012-08-09 | グーグル・インコーポレーテッド | Characterization of user information |
WO2017090539A1 (en) * | 2015-11-26 | 2017-06-01 | 株式会社博報堂 | Information processing system and method |
CN109615162A (en) * | 2018-10-23 | 2019-04-12 | 深圳壹账通智能科技有限公司 | User grouping processing method and processing device, electronic equipment and storage medium |
CN112930548A (en) * | 2018-10-22 | 2021-06-08 | 本田技研工业株式会社 | Service providing device |
CN113254833A (en) * | 2021-06-07 | 2021-08-13 | 深圳市中元产教融合科技有限公司 | Information pushing method and service system based on birth teaching fusion |
JP2021125128A (en) * | 2020-02-07 | 2021-08-30 | ヤフー株式会社 | Information processing equipment, information processing methods and information processing programs |
WO2023177144A1 (en) * | 2022-03-17 | 2023-09-21 | 삼성전자 주식회사 | Apparatus and method for determining target to be advertised |
-
2002
- 2002-10-03 JP JP2002290800A patent/JP2004126975A/en active Pending
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772862B1 (en) | 2005-10-11 | 2007-11-02 | 삼성전자주식회사 | System and method for providing online community service for digital content |
US10685061B2 (en) | 2005-12-21 | 2020-06-16 | Digimarc Corporation | Content metadata directory services |
US9218429B2 (en) | 2005-12-21 | 2015-12-22 | Digimarc Corporation | Content metadata directory services |
US10191996B2 (en) | 2005-12-21 | 2019-01-29 | Digimarc Corporation | Rules driven pan ID metadata routing system and network |
US9892206B2 (en) | 2005-12-21 | 2018-02-13 | Digimarc Corporation | Content metadata directory services |
US8924412B2 (en) | 2005-12-21 | 2014-12-30 | Digimarc Corporation | Rules driven pan ID metadata routing system and network |
JP2012138099A (en) * | 2005-12-21 | 2012-07-19 | Digimarc Corp | Rule-driven pan id metadata routing system and network |
WO2009014058A1 (en) * | 2007-07-20 | 2009-01-29 | Nec Corporation | Knowledge discovery assistance system, method and program |
JP5223865B2 (en) * | 2007-07-20 | 2013-06-26 | 日本電気株式会社 | Knowledge discovery support system, method, and program |
JP2009157864A (en) * | 2007-12-28 | 2009-07-16 | Nifty Corp | System, method and program for supporting creation of community |
JP2011511982A (en) * | 2008-02-01 | 2011-04-14 | ウィンストン,ロナルド,エイチ. | Similarity matching system and method |
KR101102853B1 (en) | 2008-12-30 | 2012-01-05 | 엔에이치엔비즈니스플랫폼 주식회사 | Method, system and computer readable recording medium for dynamically providing advertisements using collaborative filtering |
JP2012518237A (en) * | 2009-02-17 | 2012-08-09 | グーグル・インコーポレーテッド | Characterization of user information |
JP2014132494A (en) * | 2009-02-17 | 2014-07-17 | Google Inc | Characterizing user information |
KR101010997B1 (en) * | 2009-03-24 | 2011-01-26 | 한국과학기술원 | Similar User Extraction System and Method among Multiple Web Servers |
US10417576B2 (en) | 2009-04-08 | 2019-09-17 | Sony Corporation | Information processing apparatus and method, and program thereof |
US8650140B2 (en) | 2009-04-08 | 2014-02-11 | Sony Corporation | Information processing apparatus and method, and program thereof |
JP2010244380A (en) * | 2009-04-08 | 2010-10-28 | Sony Corp | Information processing apparatus and method, and program thereof |
JP2011146004A (en) * | 2010-01-18 | 2011-07-28 | Zigsow Kk | User profiling system using web community site |
JP2012118628A (en) * | 2010-11-29 | 2012-06-21 | Kddi Corp | Retrieval distribution server for distributing associated information corresponding to retrieval log, and program and method therefor |
WO2017090539A1 (en) * | 2015-11-26 | 2017-06-01 | 株式会社博報堂 | Information processing system and method |
CN112930548A (en) * | 2018-10-22 | 2021-06-08 | 本田技研工业株式会社 | Service providing device |
CN109615162A (en) * | 2018-10-23 | 2019-04-12 | 深圳壹账通智能科技有限公司 | User grouping processing method and processing device, electronic equipment and storage medium |
JP2021125128A (en) * | 2020-02-07 | 2021-08-30 | ヤフー株式会社 | Information processing equipment, information processing methods and information processing programs |
JP7177107B2 (en) | 2020-02-07 | 2022-11-22 | ヤフー株式会社 | Information processing device, information processing method and information processing program |
CN113254833A (en) * | 2021-06-07 | 2021-08-13 | 深圳市中元产教融合科技有限公司 | Information pushing method and service system based on birth teaching fusion |
WO2023177144A1 (en) * | 2022-03-17 | 2023-09-21 | 삼성전자 주식회사 | Apparatus and method for determining target to be advertised |
US12067593B2 (en) | 2022-03-17 | 2024-08-20 | Samsung Electronics Co., Ltd. | Advertisement target determining device and advertisement target determining method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5962926B2 (en) | Recommender system, recommendation method, and program | |
JP2004126975A (en) | Preference trend similar user extraction method and apparatus, preference trend similar user extraction program, and recording medium storing the same | |
US10360623B2 (en) | Visually generated consumer product presentation | |
US8380727B2 (en) | Information processing device and method, program, and recording medium | |
JP6635587B2 (en) | Advertising sentence selection device and program | |
JP5581408B2 (en) | Information processing system, information processing apparatus, information processing method, and program | |
JP6381775B2 (en) | Information processing system and information processing method | |
EP2239670A1 (en) | Information processing apparatus and method, and program thereof | |
CN105825396B (en) | Method and system for clustering advertisement labels based on co-occurrence | |
JP5968744B2 (en) | SEARCH METHOD, DEVICE, AND COMPUTER-READABLE RECORDING MEDIUM USING CONCEPT KEYWORD EXTENDED DATA SET | |
CN113366521A (en) | Sensitivity calculation device, sensitivity calculation method, and program | |
JP2017054214A (en) | Determination device, learning device, information distribution device, determination method, and determination program | |
JP2018045553A (en) | Selection device, selection method, and selection program | |
JP2018073429A (en) | Retrieval device, retrieval method, and retrieval program | |
JP2018060469A (en) | Extraction device, extraction method, and extraction program | |
WO2020147714A1 (en) | Deliverable entity pushing method and device | |
JP6224856B1 (en) | Providing device, providing method, and providing program | |
JP2001075972A (en) | User group dynamic generation method and apparatus, and recording medium recording user group dynamic generation program | |
WO2009097453A1 (en) | System and process for identifying users for which cooperative electronic advertising is relevant | |
US10311497B2 (en) | Server, analysis method and computer program product for analyzing recognition information and combination information | |
JP2010277462A (en) | Action recommendation device, method and program | |
JP2010204864A (en) | Information processing apparatus and method and program for detecting commodity solving complaint | |
US11409812B1 (en) | Method and system for mining image searches to associate images with concepts | |
JP6982546B2 (en) | Information providing equipment, information providing method, and program | |
JP4886940B2 (en) | MATCHING SYSTEM USING FACTOR DATABASE, MATCHING DEVICE, AND FACTOR DATABASE CREATION METHOD FOR THE SYSTEM |