JP2022087409A - Data addition system and data addition method - Google Patents
Data addition system and data addition method Download PDFInfo
- Publication number
- JP2022087409A JP2022087409A JP2020199328A JP2020199328A JP2022087409A JP 2022087409 A JP2022087409 A JP 2022087409A JP 2020199328 A JP2020199328 A JP 2020199328A JP 2020199328 A JP2020199328 A JP 2020199328A JP 2022087409 A JP2022087409 A JP 2022087409A
- Authority
- JP
- Japan
- Prior art keywords
- data
- user
- record
- latent
- access history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ターゲットユーザに類似する個人が特定できない潜在ユーザについて、マーケティングに活用可能なデータを付加する。【解決手段】ユーザの登録情報を含まないコンテンツのアクセス履歴から、指定された条件を含むターゲットユーザに一定以上類似する潜在ユーザのレコードと、ターゲットユーザのレコードとを含むデータを、潜在ユーザデータとして出力する潜在データ抽出部と、潜在ユーザデータのレコードに関連付けるための条件として指定された関連項目を用いて、潜在ユーザデータのレコードに関連する、アクセス履歴とは異なるアクセス履歴を記憶したデータセットのレコードを、潜在ユーザデータのレコードに付加する潜在ユーザデータ付加部と、を有する。【選択図】 図1An object of the present invention is to add data that can be used for marketing to potential users who are similar to a target user and whose individuals cannot be identified. [Solution] Data including a record of a potential user who is more than a certain degree similar to a target user including specified conditions and a record of the target user from a content access history that does not include the user's registration information is used as potential user data. Using the latent data extractor to be output and the relevant item specified as a condition for associating with the record of the potential user data, the data set storing the access history different from the access history related to the record of the potential user data and a potential user data appending unit for appending records to records of potential user data. [Selection diagram] Fig. 1
Description
本発明は、ユーザの登録情報を含まないコンテンツのアクセス履歴から潜在ユーザデータを抽出し、潜在ユーザデータに別のデータセット群の関連するデータを付加する技術に関する。 The present invention relates to a technique for extracting latent user data from an access history of content that does not include user registration information and adding relevant data of another dataset group to the latent user data.
マーケティング分野では、コンテンツを利用しているユーザの属性や行動履歴といった情報を用いて、ターゲットとなるユーザの情報を複数のデータベースから取得する技術が知られている。ユーザの情報を取得する技術としては、例えば、特開文献1や特許文献2が知られている。
In the field of marketing, there is known a technique of acquiring information of a target user from a plurality of databases by using information such as attributes and behavior history of users who use the content. As a technique for acquiring user information, for example, Japanese Patent Application Laid-Open No. 1 and
特開文献1には、複数企業にマーケティングデータを提供するマーケティングデータ提供システムにおいて、各企業の顧客情報を含む顧客データを収集する顧客データ収集手段と、提供された顧客データに対し名寄せを行うマーケティングデータ提供システムが開示されている。 Japanese Patent Application Laid-Open No. 1 describes a customer data collection means for collecting customer data including customer information of each company in a marketing data providing system for providing marketing data to a plurality of companies, and marketing for identifying the provided customer data. The data provision system is disclosed.
特許文献2には、ユーザの属性を用いて前記ユーザの特徴を推定し、対象ユーザと類似する類似ユーザの特徴情報に基づいて対象ユーザの特徴情報を補足する補足部と備えることを特徴とする情報処理装置が開示されている。
ウェブサイトにコンテンツ情報を提供する投稿者は、提供するコンテンツにアクセスする閲覧ユーザに応じて、新たなビジネスの創出を意図する場合がある。この閲覧ユーザの中には、例えば、資料をダウンロードするためにウェブサイトに登録して個人の属性情報を提供するターゲット可能なユーザ以外にも、そのユーザと同様の嗜好を持っていて類似しているものの、ウェブサイトにアクセスしただけで個人の属性情報の提供まではしていない潜在ユーザも存在する。なお、潜在ユーザとは、ターゲットユーザとコンテンツのアクセス履歴が類似するユーザをさし、ターゲットユーザは、ターゲット可能なユーザの中で自身の商品サービスを利用してもらいたいユーザをさす。もし、従来取得可能だったターゲットユーザの情報以外に、この潜在ユーザについてマーケティングに活用可能な情報が得られた場合、新たなビジネスを創出することが可能となる。また、マーケティングに活用可能な情報とは、ユーザ個人を特定して直接商品サービスを売り込むことが可能な情報以外にも、検索キーワードや購買情報など、ユーザの嗜好傾向といった他の情報もある。そのため、ウェブサイトのコンテンツを利用するユーザの登録情報を含まない潜在ユーザであっても、別のデータセット群から、この潜在ユーザに関連するデータが付加されることでマーケティングに活用できる情報となりうる。 A contributor who provides content information to a website may intend to create a new business depending on the browsing user who accesses the provided content. Some of these browsing users have similar tastes and similarities to, for example, other than the targetable users who register on the website to download materials and provide personal attribute information. However, there are potential users who only access the website and do not provide personal attribute information. The potential user refers to a user whose content access history is similar to that of the target user, and the target user refers to a user who wants to use his / her own product service among the targetable users. If information that can be used for marketing is obtained for this potential user in addition to the information of the target user that was previously available, it will be possible to create a new business. Further, the information that can be used for marketing includes not only information that can directly identify an individual user and sell a product or service, but also other information such as a search keyword and purchase information, such as a user's preference tendency. Therefore, even a potential user who does not include the registration information of the user who uses the content of the website can be information that can be utilized for marketing by adding data related to this potential user from another data set group. ..
上記従来例の特開文献1では、ターゲットとする個人が特定できるようなデータに対して名寄せしてデータを付加するものであるが、個人が特定できない場合においてデータを付加することは考慮されていないという問題があった。 In Japanese Patent Laid-Open No. 1 of the above-mentioned conventional example, data is added by name identification to data that can be identified by a target individual, but it is considered to add data when an individual cannot be identified. There was a problem that it wasn't there.
上記従来例の特許文献2では、自身のサービスの最適化に用いるために、ターゲットとする特定の個人が特定できるユーザの情報について、他のサービスの解析結果を利用してターゲットユーザや類似ユーザの情報を使って補足するものであって、個人が特定できない類似ユーザに対して補足するものではなかった。
In
そこで本発明は、上記問題点に鑑みてなされたもので、ターゲットユーザに類似する個人が特定できない潜在ユーザについて、マーケティングに活用可能なデータを付加することが可能なデータ付加システム、及び、データ付加方法を提供することを目的とする。 Therefore, the present invention has been made in view of the above problems, and is a data addition system capable of adding data that can be used for marketing to a potential user who cannot identify an individual similar to a target user, and data addition. The purpose is to provide a method.
本発明にかかるデータ付加システムは、ユーザの登録情報を含まないコンテンツのアクセス履歴から、指定された条件を含むターゲットユーザに一定以上類似する潜在ユーザのレコードと、前記ターゲットユーザのレコードとを含むデータを、潜在ユーザデータとして出力する潜在データ抽出部と、前記潜在ユーザデータのレコードに関連付けるための条件として指定された関連項目を用いて、前記潜在ユーザデータのレコードに関連する、前記アクセス履歴とは異なるアクセス履歴を記憶したデータセットのレコードを、前記潜在ユーザデータのレコードに付加する潜在ユーザデータ付加部と、を有することを特徴とするデータ付加システムとして構成される。 The data addition system according to the present invention is data including a record of a potential user who is similar to the target user including a specified condition by a certain amount or more and a record of the target user from the access history of the content which does not include the user registration information. The access history related to the record of the latent user data by using the latent data extraction unit that outputs the latent user data and the related item specified as the condition for associating the record of the latent user data with the data. It is configured as a data addition system characterized by having a latent user data addition unit that adds a record of a data set storing different access histories to the record of the latent user data.
本発明によれば、ターゲットユーザに類似する個人が特定できない潜在ユーザについて、マーケティングに活用可能なデータを付加することができる。 According to the present invention, it is possible to add data that can be used for marketing to a potential user who cannot identify an individual similar to the target user.
以下、図面を参照して本発明の実施形態を説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following description and drawings are examples for explaining the present invention, and are appropriately omitted and simplified for the sake of clarification of the description. The present invention can also be implemented in various other forms. Unless otherwise specified, each component may be singular or plural.
図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。 The positions, sizes, shapes, ranges, etc. of each component shown in the drawings may not represent the actual positions, sizes, shapes, ranges, etc., in order to facilitate understanding of the invention. Therefore, the present invention is not necessarily limited to the position, size, shape, range and the like disclosed in the drawings.
以下の説明では、「テーブル」、「リスト」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。識別情報について説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」等の表現を用いた場合、これらについてはお互いに置換が可能である。 In the following description, various information may be described by expressions such as "table" and "list", but various information may be expressed by a data structure other than these. The "XX table", "XX list", etc. may be referred to as "XX information" to show that they do not depend on the data structure. When expressions such as "identification information", "identifier", "name", "ID", and "number" are used in explaining the identification information, these can be replaced with each other.
同一あるいは同様な機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。 When there are a plurality of components having the same or similar functions, they may be described by adding different subscripts to the same reference numerals. However, if it is not necessary to distinguish between these plurality of components, the subscripts may be omitted for explanation.
また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)および/またはインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、演算部であれば良く、特定の処理を行う専用回路(例えばFPGA(Field-Programmable Gate Array)やASIC(Application Specific Integrated Circuit))を含んでいてもよい。 Further, in the following description, a process performed by executing a program may be described, but the program is determined by being executed by a processor (for example, a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit)). In order to perform the processed processing while appropriately using storage resources (for example, memory) and / or interface devices (for example, communication port), the main body of the processing may be a processor. Similarly, the subject of the process of executing the program may be a controller, an apparatus, a system, a computer, or a node having a processor. The main body of the processing performed by executing the program may be any arithmetic unit, and may include a dedicated circuit (for example, FPGA (Field-Programmable Gate Array) or ASIC (Application Specific Integrated Circuit)) for performing specific processing. ..
プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。 The program may be installed from a program source into a device such as a calculator. The program source may be, for example, a program distribution server or a computer-readable storage medium. When the program source is a program distribution server, the program distribution server includes a processor and a storage resource for storing the program to be distributed, and the processor of the program distribution server may distribute the program to be distributed to other computers. Further, in the following description, two or more programs may be realized as one program, or one program may be realized as two or more programs.
図1は、本実施例における潜在ユーザデータ付加システム1000の構成の一例を示すブロック図である。潜在ユーザデータ付加システム1000は、入力部001と、コンテンツのアクセス履歴002と、潜在ユーザデータ抽出部003と、複数のデータセットをもつデータセット群004と、関連データ類推部0051と、データ取得部0052とを含む潜在ユーザデータ付加部005を有する。これらの具体的な機能についてはフローチャートを用いて後述する。
FIG. 1 is a block diagram showing an example of the configuration of the latent user
潜在ユーザデータ付加システム1000は、例えば、図15(コンピュータ概略図)に示すような、CPU1501と、メモリ1502と、HDD(Hard Disk Drive)等の外部記憶装置1503と、CD(Compact Disk)やUSBメモリ等の可搬性を有する記憶媒体1508に対して情報を読み書きする読書装置1507と、キーボードやマウス等の入力装置1506と、ディスプレイ等の出力装置1505と、通信ネットワークに接続するためのNIC(Network Interface Card)等の通信装置1504と、これらを連結するシステムバス等の内部通信線(システムバスという)1509と、を備えた一般的なコンピュータ1500により実現できる。
The latent user
各システムや装置に記憶され、あるいは処理に用いられる様々なデータ(例えば、上述した生産関連データ2)は、CPU1501がメモリ1502または外部記憶装置1503から読み出して利用することにより実現可能である。また、各システムや装置が有する各機能部(後述)は、CPU1501が外部記憶装置1503に記憶されている所定のプログラムをメモリ1502にロードして実行することにより実現可能である。
Various data stored in each system or device or used for processing (for example, the production-related
上述した所定のプログラムは、読書装置1507を介して記憶媒体1508から、あるいは、通信装置1504を介してネットワークから、外部記憶装置1503に記憶(ダウンロード)され、それから、メモリ1502上にロードされて、CPU1501により実行されるようにしてもよい。また、読書装置1507を介して、記憶媒体1508から、あるいは通信装置1504を介してネットワークから、メモリ1502上に直接ロードされ、CPU1501により実行されるようにしてもよい。
The predetermined program described above is stored (downloaded) in the
以下では、潜在ユーザデータ付加システム1000が、ある1つのコンピュータにより構成される場合を例示するが、これらの機能部が複数のコンピュータにより構成されていてもよい。さらには、これらの機能部は、その全部または一部が、クラウドのような1または複数のコンピュータに分散して設けられ、ネットワークを介して互いに通信することにより同様の機能を実現してもよい。
In the following, the case where the latent user
図2は、図1に示した潜在ユーザデータ抽出部が行う処理の処理手順を示すフローチャートの一例を示す図である。潜在ユーザデータ抽出部003は、アクセス履歴の各レコードのユーザとターゲットユーザとの類似度を算出し(ステップ102)、アクセス履歴の各レコードのユーザとターゲットユーザデータとの類似度がある閾値α以上のデータを抽出する(ステップ103)。ターゲットユーザとは、ターゲット可能なユーザの中で自身の商品サービスを利用してもらいたいユーザであり、例えば、図7を用いて後述するように、入力部001からターゲットユーザとする条件が指定される。なお、類似度算出の方法としては、例えば、潜在ユーザデータ抽出部003が、あらかじめアクセス履歴をクラスタリングしておき、ターゲットユーザとの距離を類似度として算定する方法などがある。ただし、類似度算出方法はこの限りでない。潜在ユーザデータ抽出部003の処理結果については、図8を用いて後述する。
FIG. 2 is a diagram showing an example of a flowchart showing a processing procedure of processing performed by the latent user data extraction unit shown in FIG. 1. The latent user
図3は、図1に示した関連データ類推部が行う処理の処理手順を示すフローチャートの一例を示す図である。関連データ類推部0051は、データセット群からデータセットを選択し(ステップ202)、入力部001で指定した関連項目と処理方法を参照し、処理方法に名寄せ処理を指定された項目があるかを判定する(ステップ203)。関連データ類推部0051は、処理方法に名寄せ処理を指定された項目があると判定した場合は(ステップ203;YES)、名寄せ処理をする(ステップ204)。また、関連データ類推部0051は、処理方法に関連度算出を指定された項目があるかを判定する(ステップ205)。関連データ類推部0051は、処理方法に関連度算出を指定された項目があると判定した場合は(ステップ205;YES)、関連度算出をする(ステップ206)。関連データ類推部0051は、データセット群のうち、全てのデータセットについて処理を行ったか否かを判定し(ステップ207)、全てのデータセットについて処理を行ったと判定した場合(ステップ207;YES)図3に示す処理を終了する。一方、関連データ類推部0051は、全てのデータセットについて処理を行っていないと判定した場合(ステップ207;NO)、ステップ202のデータセットの選択に戻る。ステップ206の関連度算出は、自然言語処理による単語間の類似度測定方法などを用いて算出する。ただし、関連度算出方法はこの限りでない。
FIG. 3 is a diagram showing an example of a flowchart showing a processing procedure of processing performed by the related data analogy unit shown in FIG. 1. The related
図4は、図1に示したデータ付加部が行う処理の処理手順を示すフローチャートの一例を示す図である。データ付加部0052は、潜在ユーザデータに、関連データ類推部0051で名寄せ処理したレコードの結果を付加し(ステップ302)、また、関連度算出した項目の関連結果と関連度βを付加する(ステップ303)。
FIG. 4 is a diagram showing an example of a flowchart showing a processing procedure of processing performed by the data addition unit shown in FIG. 1. The
図5は、図1に示したアクセス履歴のデータの一例を示す図である。図1に示したアクセス履歴002は、不特定のユーザが登録を必要とすることなくアクセス可能なWebサイト(例えば、ブログ)に対してアクセスした履歴を示す情報である。アクセス履歴002の一例であるコンテンツのアクセス履歴A401は、例えば、ウェブサーバが所定の周期等で収集する。
FIG. 5 is a diagram showing an example of the access history data shown in FIG. The
図5の(a)に示すように、アクセス履歴A401は、項目群A-1{IPアドレス、アクセス時刻、訪問回数、訪問ページ、閲覧タグ、検索キーワード}をひとつのレコードに含むテーブルである。「No」は、レコードを識別するための連番であり、図5の(a)では、1番からN0までのレコードがアクセス履歴A401として記録されている。アクセス履歴A401は、コンテンツごとに記憶される。このコンテンツにアクセスしたアクセスユーザの中で、コンテンツに興味関心をもったユーザは、より詳細な情報を取得しようと資料をダウンロードするために、図5の(b)に示すような項目群A-2{氏名、所属、調査目的、ダウンロード資料リンク}を、ウェブサーバに送信して、上記Webサイトから資料をダウンロードしたものとする。アクセス履歴A401を収集したウェブサーバは、この項目群A-2をもつデータを追加取得データとし、追加された結果、アクセス履歴+追加取得データ(追加取得データアクセス履歴)A402が構成される。図5の(b)では、No1、3、4、N0のレコードは、Webサイトのコンテンツにアクセスして資料をダウンロードしたユーザのアクセス履歴であり、No2、4のレコードは、Webサイトのコンテンツにアクセスしたものの、資料をダウンロードしなかったユーザのアクセス履歴であることを示している。追加取得データアクセス履歴A402についても、アクセス履歴A401と同様、例えば、ウェブサーバが所定の周期等で収集する。 As shown in FIG. 5A, the access history A401 is a table including the item group A-1 {IP address, access time, number of visits, visited page, browsing tag, search keyword} in one record. "No" is a serial number for identifying the record, and in (a) of FIG. 5, the record from No. 1 to N0 is recorded as the access history A401. The access history A401 is stored for each content. Among the access users who have accessed this content, the user who is interested in the content has the item group A- as shown in FIG. 5 (b) in order to download the material in order to obtain more detailed information. 2 It is assumed that the material is downloaded from the above website by sending {name, affiliation, purpose of investigation, download material link} to the web server. The web server that has collected the access history A401 uses the data having this item group A-2 as the additional acquisition data, and as a result of the addition, the access history + the additional acquisition data (additional acquisition data access history) A402 is configured. In FIG. 5B, the records of Nos. 1, 3, 4, and N0 are the access histories of the user who accessed the contents of the website and downloaded the materials, and the records of Nos. 2 and 4 are the contents of the website. It shows that it is the access history of the user who accessed the site but did not download the material. Similar to the access history A401, the additional acquisition data access history A402 is also collected by, for example, a web server at a predetermined cycle or the like.
図6は、図1に示したデータセット群のデータセットの一例を示す図である。図1に示したデータセット群004は、アクセス履歴002として記憶されるWebサイトとは異なるWebサイト(例えば、ブログの環境を提供する運営サイトや他の運営サイト)に対してアクセスした履歴を示す情報である。以下では、データセット群に含まれるデータセットとして、3種類のデータセットを想定する。
FIG. 6 is a diagram showing an example of a data set of the data set group shown in FIG. The
1つめは、自身が運営するWebサイトのコンテンツで想定されるユーザ層が、アクセス履歴に記憶されているアクセスをしたコンテンツで想定されるユーザ層と同じであるデータセットB501(データセット1)である。データセットB501は、項目群B-1{IP、アクセス時刻、訪問回数、訪問ページ、検索キーワード}を含む。「No」は、レコードを識別するための連番であり、図6の(a)では、1番からN1までのレコードがデータセットB501として記録されている。データセットB501は、コンテンツごとに記憶されてもよい。 The first is the data set B501 (data set 1) in which the user group assumed for the contents of the website operated by the user is the same as the user group assumed for the accessed contents stored in the access history. be. The data set B501 includes the item group B-1 {IP, access time, number of visits, visited page, search keyword}. “No” is a serial number for identifying the records, and in FIG. 6A, the records from No. 1 to N1 are recorded as the data set B501. The data set B501 may be stored for each content.
2つめは、自身が運営するWebサイトのコンテンツで想定されるユーザ層が、アクセス履歴に記憶されているアクセスをしたコンテンツで想定されるユーザ層と同じだが、自身が運営するWebサイトのコンテンツに登録を必要とするデータセットB502(データセット2)である。データセットB502は、項目群B-2{氏名、所属、IP、担当案件、購買情報}を含む。「No」は、レコードを識別するための連番であり、図6の(b)では、1番からN2までのレコードがデータセットB502として記録されている。データセットB502は、コンテンツごとに記憶されてもよい。
The second is that the user group assumed for the content of the website operated by oneself is the same as the user group expected for the accessed content stored in the access history, but the content of the website operated by oneself Data set B502 (data set 2) that requires registration. Data set B502 includes item group B-2 {name, affiliation, IP, charge, purchase information}. “No” is a serial number for identifying records, and in FIG. 6B,
3つめは、他者が運営しており、自身が運営するWebサイトのコンテンツで想定されるユーザ層と同様のユーザ層が含まれているか不明なデータセットB503(データセット3)である。データセットB503は、項目群B-3{氏名、所属、投稿記事内容}を含むとする。データセットB503は、コンテンツごとに記憶されてもよい。 The third is the data set B503 (data set 3), which is operated by another person and it is unknown whether or not the user layer similar to the user layer assumed in the content of the website operated by the other person is included. It is assumed that the data set B503 includes the item group B-3 {name, affiliation, posted article content}. The data set B503 may be stored for each content.
図7は、図1に示した入力部の入力データの一例を示す図である。入力部001は、アクセス履歴002のデータとして、追加取得データをもつ追加取得データアクセス履歴A402のデータセットの入力を受け付ける。また、ターゲットユーザに関する情報は、アクセス履歴002の項目群A-2の{調査目的}が“AI応用”に該当するアクセスユーザの例が入力される。また、各データセットに対してアクセス履歴002に対する関連項目と、処理方法を入力したデータが入力される。ターゲットユーザに関する情報、アクセス履歴002に対する関連項目、処理方法は、あらかじめ本システムの利用者により定められているものとする。なお、関連項目の指定は一対一だけでなく、一対多、多対一、多対多の指定も含む。
FIG. 7 is a diagram showing an example of input data of the input unit shown in FIG. 1. The
図7では、例えば、データセット1については、入力部001は、アクセス履歴002に対する関連項目として、{IPアドレス}、{訪問ページ}、{検索キーワード}の指定を受け付け、これら以外の項目については関連項目として指定されなかったことを示している。また、入力部001は、関連項目として指定されたこれらの項目の処理方法として、それぞれ、{名寄せ}、{関連度算出}、{関連度算出}の指定を受け付けたことを示している。データセット2、データセット3についても、同様の方法でこれらの項目が指定されていることがわかる。
In FIG. 7, for example, for the
図8は、図1に示した潜在ユーザデータ抽出部の処理結果の一例を示す図である。潜在ユーザデータ抽出部003は、図2に示したステップ102の類似度算出において、アクセス履歴に記憶されたユーザとターゲットユーザとの類似度を算出し、ステップ103において、アクセス履歴のユーザとターゲットユーザとの類似度がある閾値α以上のデータを抽出する。
FIG. 8 is a diagram showing an example of the processing result of the latent user data extraction unit shown in FIG. The latent user
図8では、項目群A-1の{訪問回数、訪問ページ、閲覧タグ}をキーにして、アクセス履歴に記憶されたユーザとターゲットユーザとの類似度を算出し、類似度の高いアクセスユーザを潜在ユーザデータ701として抽出している。
In FIG. 8, the similarity between the user stored in the access history and the target user is calculated by using the {visit count, visited page, browsing tag} of the item group A-1 as a key, and the access user having a high degree of similarity is calculated. It is extracted as
より具体的には、図8では、潜在ユーザデータ抽出部003は、図5の(b)に示した追加取得データアクセス履歴A402に含まれるレコードのうち、あらかじめ追加取得データアクセス履歴A402のなかで一定以上類似するレコードを抽出するための類似条件として指定された項目群A-1の{訪問回数、訪問ページ、閲覧タグ}が同じ(あるいは少なくとも一部を含む、意味的に項目の内容が一定以上近似する)データを抽出する。さらに、潜在ユーザデータ抽出部003は、抽出した当該データのなかで、ターゲットユーザとして条件が指定されたレコードに含まれる上記項目群A-1の{訪問回数、訪問ページ、閲覧タグ}に、ある閾値α以上で類似する上記項目群A-1の{訪問回数、訪問ページ、閲覧タグ}を含むレコードを抽出する。これにより、追加取得データアクセス履歴A402のなかで、ターゲットユーザのレコードと、当該ターゲットユーザに一定以上類似する潜在ユーザのレコードとを含むデータを、潜在ユーザデータ701として抽出することができる。この類似度算出方法は、例えば、あらかじめアクセス履歴002をクラスタリングしておいて、ターゲットユーザのクラスタとの距離の近さを類似度として算出する方法がある。ただし、類似度算出方法はこの限りでない。図8では、上記潜在ユーザデータ701のレコードのうち、No1、3のレコードとして記憶されているユーザは、アクセス履歴002の項目群A-2の{調査目的}を“AI応用”としてWebサイトのコンテンツにアクセスして入力し、資料をダウンロードしたユーザ、すなわち、図7の(2)において入力部001で入力した条件に合致するターゲットユーザであることを示している。また、No1、3のレコードとして記憶されているターゲットユーザ以外のユーザ(No5、7、11)は、当該ターゲットユーザに一定以上類似する潜在ユーザであることを示している。
More specifically, in FIG. 8, the latent user
図9は、本実施例において、アクセス履歴002とターゲットユーザとの関係性の一例を示す図である。図9では、アクセスユーザの中には、項目群A-1のみのアクセスユーザU1と、その中で資料をダウンロードして項目群A-2をもつ追加取得データを取得したユーザである追加取得ユーザU2(例えば、図5の(b)における氏名「田中」、「伊藤」)と、追加取得ユーザの中で獲得目標となるターゲット範囲を指定したターゲットユーザU3(例えば、項目群A-2の{調査目的}が“AI応用”である氏名「佐藤」、「鈴木」)が存在することを示している。ここでは、アクセスユーザU1は、追加取得ユーザU2を包含し、追加取得ユーザU2はターゲットユーザU3を包含している関係となる。なお、項目群A-1を使ってターゲットユーザを指定できる場合は、追加取得ユーザデータは必ずしも必要とされない。
FIG. 9 is a diagram showing an example of the relationship between the
図10は、本実施例において、ターゲットユーザと潜在ユーザとの関係性の一例を示す図である。図10では、アクセスユーザの中には、ある分類Xにおいて、ターゲットユーザU3と類似度α以上で類似する潜在ユーザU4が存在することを示している。この分類Xは、図8における項目群A-1のうちの{訪問回数、訪問ページ、閲覧タグ}をさし、項目は一つとは限らず、また主成分分析などをして次元圧縮したものも対象となる。なお、ターゲットユーザは潜在ユーザに含まれる。 FIG. 10 is a diagram showing an example of the relationship between the target user and the potential user in this embodiment. FIG. 10 shows that among the access users, there is a latent user U4 having a similarity α or higher with the target user U3 in a certain classification X. This classification X refers to {visit count, visit page, browsing tag} in the item group A-1 in FIG. 8, and the item is not limited to one, and is dimensionally compressed by principal component analysis or the like. Is also a target. The target user is included in the potential user.
図11は、本実施例において、アクセス履歴002とデータセット1との関係性の一例を示す図である。関連データ類推部0051におけるデータセットを選択する処理(ステップ202)で、データセット1を選択した時の処理結果を示す。図7より、名寄せ処理(ステップ204)で指定された関連項目には、データセット1の項目=”IPアドレス”があるため、関連データ類推部0051は、アクセス履歴の項目=“IPアドレス”により、データセット1について名寄せ処理(ステップ204)をする。なお、ここで、IPアドレスが同じであってもユーザが違う場合はある。しかし、データセット1では、自身が運営するWebサイトのコンテンツを管理するシステムにおいて、例えば、当該システムの構造上、異なるユーザ(例えば、ハンドルネームを複数有しているユーザ)のIPアドレスは1対1に紐づく前提があれば、名寄せ処理(ステップ204)の項目として扱う。また、例えば、アクセス履歴の項目=“アクセス時刻”と、データセット1の項目=“アクセス時刻”は、名称が同じであっても、データセット1が同時刻にアクセスするシステムに関するデータセットでなければ、関連項目として指定していない。しかし、必ずしもアクセス履歴とデータセット1についてアクセスした時刻が同時刻でなくても、例えば、通信環境による遅延を考慮して一定の時間幅を設け、当該時間幅に上記アクセスした時刻が含まれる場合には、両者を上記名寄せ処理の項目として扱ってもよい。
FIG. 11 is a diagram showing an example of the relationship between the
いずれにしても、このようにどの項目同士を紐づけるか判断できるのは本システムの利用者であるため、入力部001において、関連項目とその処理方法の指定が必要となる。図11の(1)名寄せ処理では、アクセス履歴002に含まれる潜在ユーザU4の一つのユーザデータU41が、データセット1に含まれるアクセスユーザU1のうちの名寄せ後のユーザデータU11と紐づいて同一ユーザとして判定されたことを示している。また、図7より、指定された項目には、データセット1の項目=”訪問ページ”と、“検索キーワード”がある。このため、関連度算出(ステップ206)において、関連データ類推部0051は、各々に対して指定されたアクセス履歴の項目=“訪問ページ”と、“検索キーワード”とのそれぞれについて、アクセス履歴002に含まれる潜在ユーザやターゲットユーザと、データセット1に含まれるアクセスユーザとの関連度算出(ステップ206)を実行する。
In any case, since it is the user of this system who can determine which items are to be linked in this way, it is necessary to specify the related items and the processing method in the
図11の(2)関連度算出では、アクセス履歴002に含まれるターゲットユーザU3の1つのユーザデータU31がデータセット1に含まれるアクセスユーザU1のうちのユーザデータの1つであるユーザデータU12と関連度β11で紐づけられたことを示している。また、アクセス履歴002に含まれる潜在ユーザU4の1つのユーザデータU42がデータセット1に含まれるアクセスユーザU1のうちのユーザデータの2つであるユーザデータU13、U14と、それぞれ、関連度β12とβ13で紐づいたことを示している。図11の(2)では、データセット1の項目として“訪問ページ”の場合を例示したが、“検索キーワード”についても同様に考えることができる。
In (2) relevance calculation of FIG. 11, one user data U31 of the target user U3 included in the
図12は、本実施例において、アクセス履歴002とデータセット2との関係性の一例を示す図である。関連データ類推部0051におけるデータセットを選択する処理(ステップ202)で、データセット2を選択した時の処理結果を示す。図7より、名寄せ処理(ステップ204)で指定された関連項目には、データセット2の項目=”氏名”AND“所属”があるため、関連データ類推部0051は、アクセス履歴の項目=“氏名”AND“所属”により、データセット2について名寄せ処理(ステップ204)をする。図12の(1)名寄せ処理では、アクセス履歴002に含まれる潜在ユーザU4の中でターゲットユーザU3の1つのユーザデータU32が、データセット2に含まれる登録ユーザU5のうちの名寄せ後のユーザデータの1つであるユーザデータU51と紐づいて同一ユーザとして判定されたことを示している。
FIG. 12 is a diagram showing an example of the relationship between the
また、図7より、指定された項目には、データセット2の項目=”担当案件”がある。当該項目は、アクセス履歴の項目=“調査目的”と名称とは異なるが、システムの構造上、別のデータセットを用いることも許容している場合は、項目名が異なっても類似する内容を入力している場合がある。したがって、図7に示したように、入力部001において類似する内容を含む項目としてユーザが任意で指定することを可能としている。この項目指定は、手動で入力する以外にも、例えば、これらの2つの項目の内容同士を比較しておき、いずれかの項目が他の項目の内容と一定の閾値以上の類似内容を含むことを判定し、デフォルト値として自動で関連項目として指定させても良い。
Further, from FIG. 7, the designated item includes the item of the data set 2 = "in charge". This item has a different name from the access history item = "investigation purpose", but if the structure of the system allows the use of different data sets, similar content may be used even if the item name is different. You may have entered it. Therefore, as shown in FIG. 7, it is possible for the user to arbitrarily specify an item including similar contents in the
図12の(2)関連度算出では、アクセス履歴002に含まれるターゲットユーザU3の1つのユーザデータU33がデータセット2に含まれる登録ユーザU5のうちの2つのユーザデータであるユーザデータU52、U53と、それぞれ、関連度β21とβ22で紐づいたことを示している。なお、関連度算出(ステップ206)では、項目群A-2を含むアクセス履歴を対象とするため、項目群A-2をもつターゲットユーザのみ処理する。
In (2) relevance calculation of FIG. 12, user data U52 and U53 in which one user data U33 of the target user U3 included in the
また、図には示していないが、データセット2が、自身が運営するWebサイトのシステムに登録されたデータであって、アクセス履歴002のユーザ層と同一のユーザ層が使っているシステムのデータである場合を考える。この場合、項目群A-1において指定された関連項目があり、かつ当該関連項目について、データセット2とアクセス履歴002との関連度が一定の閾値以上高いユーザがいた場合、個人を特定できなかった潜在ユーザのユーザデータに、データセット2の登録ユーザデータU5のうち上記関連度が一定の閾値以上高いユーザの登録ユーザデータが付加されることで個人を特定できることもある。
Further, although not shown in the figure, the
図13は、本実施例において、アクセス履歴002とデータセット3との関係性の一例を示す図である。関連データ類推部0051におけるデータセットを選択する処理(ステップ202)で、データセット3を選択した時の処理結果を示す。図7より、名寄せ処理(ステップ204)で指定された関連項目には、データセット1の項目=”氏名”AND“所属”があるため、関連データ類推部0051は、アクセス履歴の項目=“氏名”AND“所属”により、データセット3について名寄せ処理(ステップ204)をする。
FIG. 13 is a diagram showing an example of the relationship between the
図13の(1)名寄せ処理では、アクセス履歴002に含まれる潜在ユーザU4の中のターゲットユーザU3の1つのユーザデータU34が、データセット3に含まれる登録ユーザU5のうちの名寄せ後の1つのユーザデータであるユーザデータU61と紐づいて同一ユーザとして判定されたことを示している。また、図7より、指定された項目には、データセット3の項目=”投稿記事内容”がある。しかし、当該項目が、他者が運用しているWebサイトのコンテンツを管理するシステムにおいて、例えばSNS(Social Networking Service)のような多数利用者登録されている登録データに含まれる場合もある。このような場合、当該項目を介して、例えば、当該項目”投稿記事内容”にアクセス可能なようにリンクを張る等、同様のユーザが大量に紐づき、関連度を算出してデータを付加すると煩雑となる場合がある。そのため、図13の(2)では、データセット3の一点鎖線で囲ったようにグループ同士で紐づけして、関連度の高いグループの特徴を出力することを想定している。このグループ分けの方法は、関連データ類推部0051が、あらかじめデータセット3のデータをクラスタリングしてデータを分類しておくなどできるが、方法はこの限りでない。図13の(2)関連度算出では、アクセス履歴002に含まれる潜在ユーザU4の2つのユーザデータU43、U44が、それぞれ、データセット3に含まれる登録ユーザのうち、上記分類された関連度の高いグループG61、G62のユーザデータと各々関連度β31とβ32で紐づいたことを示している。
In (1) name identification processing of FIG. 13, one user data U34 of the target user U3 in the potential user U4 included in the
図14は、本実施例において、出力結果の一例を示す図である。図14では、図5に示した項目群A-1および項目群A-2に付加される付加データを例示しているが、実際には、当該付加データの各レコードに、上記項目群A-1および項目群A-2が対応付けられている。また、図14では、当該付加データとして、潜在ユーザデータに対して、図4に示したデータ付加部0052が処理を実行したときの出力例1301を示す。
FIG. 14 is a diagram showing an example of an output result in this embodiment. FIG. 14 illustrates the additional data added to the item group A-1 and the item group A-2 shown in FIG. 5, but in reality, each record of the additional data includes the item group A-. 1 and item group A-2 are associated with each other. Further, FIG. 14 shows an output example 1301 when the
関連データ類推部0051は、各データセットについて名寄せ処理(ステップ204)したレコードを、付加データとして図5に示した項目群A-1および項目群A-2に付加する。また、関連データ類推部0051は、各データセットについて関連度算出(ステップ206)に用いた関連項目について、関連結果と、関連度βを出力する。なお、関連結果は、ここでは関連項目の内容を出力する例としているが、名寄せ処理と同様にレコード結果を出力しても良い。
The related
この結果、図14のように、当初入力部001から指定されたターゲットユーザのレコード(例えば、No.1やNo.3のレコード)のほか、潜在ユーザに含まれる当該ターゲットユーザ以外の潜在ユーザのレコード(例えば、No.7やNo.11のレコード)に対して、関連するデータを付加することが可能となる。潜在ユーザのレコードに対して、関連するデータを付加することで、例えば、No.7の潜在ユーザは、図8から素材A、素材Cに興味をもち、かつ、投稿記事内容から関連度β=0.8(すなわち、80パーセントの関連度)で図14からAI応用を考えている大学院生の可能性があることがわかり、マーケティング対象となる注目分野の想定ができる。また、No.11の潜在ユーザは、図8から素材Aに興味をもち、投稿記事内容から関連度β=0.8(すなわち、80パーセントの関連度)で図14からAI応用を考えている施工の現場に勤務する作業員の可能性があることがわかり、現場のニーズを想定することができる可能性がある。よって、本システムにより、潜在ユーザデータに関連するデータを付加することで、マーケティングに活用可能な情報を取得することができるといえる。 As a result, as shown in FIG. 14, in addition to the record of the target user initially designated from the input unit 001 (for example, the record of No. 1 or No. 3), the potential user other than the target user included in the potential user. It is possible to add related data to a record (for example, a record of No. 7 or No. 11). By adding related data to the record of the potential user, for example, No. The potential user of 7 is interested in material A and material C from FIG. 8, and considers AI application from FIG. 14 with a degree of relevance β = 0.8 (that is, a degree of relevance of 80%) from the content of the posted article. It turns out that there is a possibility of being a graduate student, and it is possible to envision a field of interest to be marketed. In addition, No. The 11 potential users are interested in the material A from FIG. 8, and from the content of the posted article, the relevance β = 0.8 (that is, the relevance of 80%), and from FIG. It may be possible to find out that there is a possibility of working workers and to anticipate the needs of the site. Therefore, it can be said that this system can acquire information that can be used for marketing by adding data related to potential user data.
より具体的には、本実施例における潜在ユーザデータ付加システム1000では、ユーザの登録情報を含まないコンテンツのアクセス履歴002から、指定された条件(例えば、図7におけるアクセス履歴002の項目群A-2の{調査目的}が“AI応用”である条件)を含むターゲットユーザに一定以上類似する潜在ユーザのレコード(例えば、図8のレコードNo5、7、11のレコード)と、上記ターゲットユーザのレコード(例えば、図8のレコードNo1、3のレコード)とを含むデータを、潜在ユーザデータとして出力する潜在データ抽出部003と、上記潜在ユーザデータのレコードに関連付けるための条件として指定された関連項目(例えば、図7における{IPアドレス}、{訪問ページ}、{検索キーワード})を用いて、上記潜在ユーザデータのレコードに関連する、上記アクセス履歴とは異なるアクセス履歴を記憶したデータセット(例えば、図6のデータセット1~3)のレコードを、上記潜在ユーザデータのレコードに付加する潜在ユーザデータ付加部005と、を有する。したがって、アクセス履歴に含まれるターゲットユーザに類似する個人が特定できないような潜在ユーザについて、アクセス履歴以外の様々なデータのなかから、マーケティングに活用可能なデータを付加することができる。
More specifically, in the latent user
また、上記潜在ユーザデータ付加部005は、上記関連項目の内容(例えば、{訪問ページ}の内容、{検索キーワード}の文字列や値)に基づいて、上記データセットのレコードと、上記潜在ユーザデータのレコードとの関連度を算出する関連データ類推部0051を有する。したがって、データセットの様々なレコードと潜在ユーザデータの様々なレコードとの間での関連度を把握することができる。
Further, the latent user
また、上記潜在ユーザデータ付加部005は、上記関連度が算出された上記潜在ユーザデータのレコードと上記データセットのレコードとを対応付けた出力結果データを出力するデータ付加部0052を有する。したがって、上記関連度が算出された潜在ユーザデータのレコードとデータセットのレコードとを対応付けてユーザに提示することができる。
Further, the latent user
また、上記潜在データ抽出部003は、上記アクセス履歴から、所定の項目(例えば、図8において、一定以上類似するレコードを抽出するための類似条件として指定された項目群A-1の{訪問回数、訪問ページ、閲覧タグ})の内容が一定以上類似するユーザのレコードを抽出し、抽出した上記レコードのなかで、上記ターゲットユーザに一定以上類似する潜在ユーザのレコードと上記ターゲットユーザのレコードとを含むデータを、例えば、図8に示す潜在ユーザデータとして出力する。したがって、例えば、本システムのユーザが所望の項目群を指定したうえで、ターゲットユーザに一定以上類似する潜在ユーザのレコードとターゲットユーザのレコードとを含むデータを潜在ユーザデータとして抽出し、出力することができる。 Further, the latent data extraction unit 003 {visits number of times of the item group A-1 designated as a similar condition for extracting records having a certain degree or more similar in a predetermined item (for example, in FIG. 8 in FIG. 8) from the access history. , Visit page, browsing tag}) is extracted from the records of users whose contents are similar to a certain level or more, and among the extracted records, the records of potential users and the records of the target user that are similar to the target user by a certain amount or more are extracted. The included data is output, for example, as latent user data shown in FIG. Therefore, for example, after the user of this system specifies a desired item group, data including a record of a potential user and a record of the target user that are similar to the target user by a certain amount or more is extracted and output as potential user data. Can be done.
また、上記関連データ類推部0051は、データセット群の各データセットについて、上記関連項目について名寄せ処理が指定されている場合、上記潜在ユーザデータのレコードに対して名寄せ処理を行い、上記関連項目について関連度算出することが指定されている場合、上記潜在ユーザデータセットのレコードに対して関連度を算出することができる。
Further, when the name identification process is specified for the related item for each data set of the data set group, the related
また、上記データ付加部0052は、上記関連データ類推部0051により算出された上記関連度(例えば、図14のレコードNo.7のβ =0.8)と、当該関連度の算出に用いた上記関連項目の内容(例えば、図14のレコードNo.7の“クラスタリング”)とを含む上記出力結果データを、表示部(例えば、ディスプレイ等の出力装置1505)に出力する。したがって、本システムのユーザは、どのような内容に基づいてどの程度の関連度があるのか、といった関連度の詳細を、一目で把握することができる。
Further, the
以上のように、ユーザの登録情報を含まないコンテンツのアクセス履歴を用いて、獲得目標の例となるターゲットユーザの情報と、各データセットとの関連項目と処理方法を入力することで、潜在ユーザデータの抽出と、別のデータセット群から潜在ユーザデータに関連するデータを付加することが可能となる。これにより、ユーザ個人を特定して直接商品サービスを売り込むことが可能な情報以外に、嗜好傾向などマーティングに活用可能な情報を取得でき、新たなビジネスの創出を可能とする。 As described above, by using the access history of the content that does not include the user registration information, the information of the target user that is an example of the acquisition target, the related items with each data set, and the processing method are input, so that the potential user can be used. It is possible to extract data and add data related to latent user data from another dataset group. As a result, in addition to the information that can directly identify the individual user and sell the product / service, the information that can be used for marting such as the preference tendency can be acquired, and it is possible to create a new business.
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。 The present invention is not limited to the above-described embodiment, and includes various modifications. For example, the above-described embodiment is described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to the one including all the configurations described. Further, it is possible to replace a part of the configuration of one embodiment with the configuration of another embodiment, and it is also possible to add the configuration of another embodiment to the configuration of one embodiment. Further, for a part of the configuration of each embodiment, any of addition, deletion, or replacement of other configurations can be applied alone or in combination.
1000: 潜在ユーザデータ付加システム
001: 入力部
002: アクセス履歴
003: 潜在ユーザデータ抽出部
004: データセット群
005: 潜在ユーザデータ付加部
0051: 関連データ類推部
0052: データ付加部
1000: Latent user data addition system 001: Input unit 002: Access history 003: Latent user data extraction unit 004: Data set group 005: Latent user data addition unit 0051: Related data analogy unit 0052: Data addition unit
Claims (12)
前記潜在ユーザデータのレコードに関連付けるための条件として指定された関連項目を用いて、前記潜在ユーザデータのレコードに関連する、前記アクセス履歴とは異なるアクセス履歴を記憶したデータセットのレコードを、前記潜在ユーザデータのレコードに付加する潜在ユーザデータ付加部と、
を有することを特徴とするデータ付加システム。 From the access history of the content that does not include the user registration information, the data including the record of the latent user that is similar to the target user including the specified condition by a certain amount or more and the record of the target user is output as the latent user data. Data extraction unit and
Using the related item specified as a condition for associating with the record of the latent user data, the record of the data set related to the record of the latent user data and storing the access history different from the access history is described as the latent. The latent user data addition part to be added to the user data record,
A data addition system characterized by having.
前記潜在ユーザデータ付加部は、前記関連項目の内容に基づいて、前記データセットのレコードと、前記潜在ユーザデータのレコードとの関連度を算出する関連データ類推部、
を有することを特徴とするデータ付加システム。 The data addition system according to claim 1.
The latent user data addition unit is a related data analogy unit that calculates the degree of relevance between the record of the data set and the record of the latent user data based on the contents of the related item.
A data addition system characterized by having.
前記潜在ユーザデータ付加部は、前記関連度が算出された前記潜在ユーザデータのレコードと前記データセットのレコードとを対応付けた出力結果データを出力するデータ付加部、
を有することを特徴とするデータ付加システム。 The data addition system according to claim 2.
The latent user data addition unit is a data addition unit that outputs output result data in which a record of the latent user data for which the degree of relevance is calculated and a record of the data set are associated with each other.
A data addition system characterized by having.
前記潜在データ抽出部は、前記アクセス履歴から、所定の項目の内容が類似するユーザのレコードを抽出し、抽出した前記レコードのなかで、前記ターゲットユーザに一定以上類似する潜在ユーザのレコードと前記ターゲットユーザのレコードとを含むデータを、潜在ユーザデータとして出力する、
ことを特徴とするデータ付加システム。 The data addition system according to claim 1.
The latent data extraction unit extracts a record of a user having similar contents of a predetermined item from the access history, and among the extracted records, a record of a latent user having a certain degree or more similar to the target user and the target. Output data including user records as latent user data,
A data addition system characterized by this.
前記関連データ類推部は、データセット群の各データセットについて、前記関連項目について名寄せ処理が指定されている場合、前記潜在ユーザデータのレコードに対して名寄せ処理を行い、前記関連項目について関連度算出することが指定されている場合、前記潜在ユーザデータセットのレコードに対して関連度を算出する、
ことを特徴とするデータ付加システム。 The data addition system according to claim 2.
When the name identification process is specified for the related item for each data set of the data set group, the related data guessing unit performs the name identification process for the record of the latent user data and calculates the degree of relevance for the related item. If it is specified, the degree of relevance is calculated for the records in the latent user data set.
A data addition system characterized by this.
前記データ付加部は、前記関連データ類推部により算出された前記関連度と、当該関連度の算出に用いた前記関連項目の内容とを含む前記出力結果データを、表示部に出力する、
ことを特徴とするデータ付加システム。 The data addition system according to claim 3.
The data addition unit outputs the output result data including the relevance degree calculated by the related data analogy unit and the contents of the related item used for calculating the relevance degree to the display unit.
A data addition system characterized by this.
潜在データ抽出部が、ユーザの登録情報を含まないコンテンツのアクセス履歴から、指定された条件を含むターゲットユーザに一定以上類似する潜在ユーザのレコードと、前記ターゲットユーザのレコードとを含むデータを、潜在ユーザデータとして出力し、
潜在ユーザデータ付加部が、前記潜在ユーザデータのレコードに関連付けるための条件として指定された関連項目を用いて、前記潜在ユーザデータのレコードに関連する、前記アクセス履歴とは異なるアクセス履歴を記憶したデータセットのレコードを、前記潜在ユーザデータのレコードに付加する、
ことを特徴とするデータ付加方法。 It is a data addition method performed by a computer.
From the access history of the content that does not include the user's registration information, the latent data extraction unit latently collects data including the record of the latent user that is similar to the target user including the specified condition by a certain amount or more and the record of the target user. Output as user data
Data in which the latent user data addition unit stores an access history different from the access history related to the record of the latent user data by using the related item specified as a condition for associating with the record of the latent user data. Add the record of the set to the record of the latent user data.
A data addition method characterized by this.
前記潜在ユーザデータ付加部の関連データ類推部が、前記関連項目の内容に基づいて、前記データセットのレコードと、前記潜在ユーザデータのレコードとの関連度を算出する、
ことを特徴とするデータ付加方法。 The data addition method according to claim 7.
The related data analogy unit of the latent user data addition unit calculates the degree of association between the record of the data set and the record of the latent user data based on the contents of the related item.
A data addition method characterized by this.
前記潜在ユーザデータ付加部のデータ付加部が、前記関連度が算出された前記潜在ユーザデータのレコードと前記データセットのレコードとを対応付けた出力結果データを出力する、
ことを特徴とするデータ付加方法。 The data addition method according to claim 8.
The data addition unit of the latent user data addition unit outputs output result data in which the record of the latent user data for which the degree of relevance is calculated and the record of the data set are associated with each other.
A data addition method characterized by this.
前記潜在データ抽出部が、前記アクセス履歴から、所定の項目の内容が類似するユーザのレコードを抽出し、抽出した前記レコードのなかで、前記ターゲットユーザに一定以上類似する潜在ユーザのレコードと前記ターゲットユーザのレコードとを含むデータを、潜在ユーザデータとして出力する、
ことを特徴とするデータ付加方法。 The data addition method according to claim 7.
The latent data extraction unit extracts a record of a user having similar contents of a predetermined item from the access history, and among the extracted records, a record of a latent user having a certain degree or more similar to the target user and the target. Output data including user records as latent user data,
A data addition method characterized by this.
前記関連データ類推部が、データセット群の各データセットについて、前記関連項目について名寄せ処理が指定されている場合、前記潜在ユーザデータのレコードに対して名寄せ処理を行い、前記関連項目について関連度算出することが指定されている場合、前記潜在ユーザデータセットのレコードに対して関連度を算出する、
ことを特徴とするデータ付加方法。 The data addition method according to claim 8.
When the related data guessing unit specifies the name identification process for the related item for each data set of the data set group, the name identification process is performed on the record of the latent user data, and the degree of relevance is calculated for the related item. If it is specified, the degree of relevance is calculated for the records in the latent user data set.
A data addition method characterized by this.
前記データ付加部が、前記関連データ類推部により算出された前記関連度と、当該関連度の算出に用いた前記関連項目の内容とを含む前記出力結果データを、表示部に出力する、
ことを特徴とするデータ付加方法。 The data addition method according to claim 9.
The data addition unit outputs the output result data including the relevance degree calculated by the related data analogy unit and the contents of the related item used for calculating the relevance degree to the display unit.
A data addition method characterized by this.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020199328A JP2022087409A (en) | 2020-12-01 | 2020-12-01 | Data addition system and data addition method |
| PCT/JP2021/043975 WO2022118860A1 (en) | 2020-12-01 | 2021-11-30 | Data adding system and data adding method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020199328A JP2022087409A (en) | 2020-12-01 | 2020-12-01 | Data addition system and data addition method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2022087409A true JP2022087409A (en) | 2022-06-13 |
Family
ID=81853213
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020199328A Pending JP2022087409A (en) | 2020-12-01 | 2020-12-01 | Data addition system and data addition method |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP2022087409A (en) |
| WO (1) | WO2022118860A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115858815A (en) * | 2022-12-23 | 2023-03-28 | 百度(中国)有限公司 | Method for determining mapping information, advertisement recommendation method, device, equipment and medium |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5674414B2 (en) * | 2010-10-27 | 2015-02-25 | 株式会社ビデオリサーチ | Access log matching system and access log matching method |
| JP2018181135A (en) * | 2017-04-19 | 2018-11-15 | サントリーホールディングス株式会社 | Recommendation system, recommendation method, and recommendation program |
| JP6591638B1 (en) * | 2018-08-30 | 2019-10-16 | ヤフー株式会社 | Information processing apparatus, information processing method, and information processing program |
-
2020
- 2020-12-01 JP JP2020199328A patent/JP2022087409A/en active Pending
-
2021
- 2021-11-30 WO PCT/JP2021/043975 patent/WO2022118860A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022118860A1 (en) | 2022-06-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN104217031B (en) | A kind of method and apparatus that user's classification is carried out according to server search daily record data | |
| CN104254852B (en) | Method and system for mixed information inquiry | |
| JP5679993B2 (en) | Method and query system for executing a query | |
| AU2017345199B2 (en) | Methods and systems for identifying a level of similarity between a plurality of data representations | |
| WO2021068610A1 (en) | Resource recommendation method and apparatus, electronic device and storage medium | |
| CN104969224B (en) | Improved user experience for unacknowledged and new users | |
| Cesare et al. | Detection of user demographics on social media: A review of methods and recommendations for best practices | |
| Zhang et al. | Extracting the information backbone in online system | |
| CN107862022B (en) | Cultural resource recommendation system | |
| US20130198240A1 (en) | Social Network Analysis | |
| US20100161785A1 (en) | Method and system for mining websites | |
| CN112149003B (en) | Commodity community recommendation method, device and computer equipment | |
| CN109564573A (en) | Platform from computer application metadata supports cluster | |
| Li et al. | Where you instagram? associating your instagram photos with points of interest | |
| KR20100066651A (en) | Apparatus and method for a personalized search | |
| JP2014197300A (en) | Text information processor, text information processing method, and text information processing program | |
| CN114625973B (en) | Anonymous information cross-domain recommendation method and device, electronic equipment and storage medium | |
| US9633103B2 (en) | Identifying product groups in ecommerce | |
| US20150095202A1 (en) | Recommending Product Groups in Ecommerce | |
| CN107735785A (en) | automatic information retrieval | |
| US20130132368A1 (en) | Large scale analytical reporting from web content | |
| WO2022118860A1 (en) | Data adding system and data adding method | |
| Li et al. | A probabilistic topic-based ranking framework for location-sensitive domain information retrieval | |
| JP2017004260A (en) | Information processing apparatus, information processing method, and information processing program | |
| Singla et al. | Enhancing personalization via search activity attribution |