[go: up one dir, main page]

JP2011154554A - Deficit value prediction device, deficit value prediction method, and deficit value prediction program - Google Patents

Deficit value prediction device, deficit value prediction method, and deficit value prediction program Download PDF

Info

Publication number
JP2011154554A
JP2011154554A JP2010015910A JP2010015910A JP2011154554A JP 2011154554 A JP2011154554 A JP 2011154554A JP 2010015910 A JP2010015910 A JP 2010015910A JP 2010015910 A JP2010015910 A JP 2010015910A JP 2011154554 A JP2011154554 A JP 2011154554A
Authority
JP
Japan
Prior art keywords
matrix
factor
data
function
matrix data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010015910A
Other languages
Japanese (ja)
Inventor
Yuki Kosaka
勇気 小阪
Takayuki Nakada
貴之 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010015910A priority Critical patent/JP2011154554A/en
Publication of JP2011154554A publication Critical patent/JP2011154554A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a deficit value prediction device for improving accuracy in predicting a deficit value in matrix shape data. <P>SOLUTION: A parameter estimating means 82 estimates a parameter which maximizes likelihood that data when a function converts a factor matrix is matrix shape data, among the parameters of the function for converting the factor matrix being the matrix which is defined by each factor element of one factor in the matrix shape data having two factors and also which expresses the features of the respective factor elements of the other factor in the matrix shape data. A deficit value predicting means 83 predicts the deficit value of the matrix element in the matrix shape data through the use of the parameter estimated by the parameter estimating means 82 and the value of the known matrix element in the matrix shape data. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、欠損値予測システム、欠損値予測方法及び欠損値予測プログラムに関し、特に、2つの因子を含んだ行列形データにおける未知の行列要素の値を予測する欠損値予測システム、欠損値予測方法及び欠損値予測プログラムに関する。   The present invention relates to a missing value prediction system, a missing value prediction method, and a missing value prediction program, and in particular, a missing value prediction system and a missing value prediction method for predicting an unknown matrix element value in matrix data including two factors. And a missing value prediction program.

未知の行列要素を含む行列形データを扱う際、観測した既知の部分から未知の行列要素の値(以下、欠損値と記すこともある。)を精度良く予測することが要求される。例えば、複数のユーザによる商品の評点を集めた行列データに基づく商品を推薦する協調フィルタリングシステムでは、ユーザによって評価されていない商品の未知評点を予測して、予測した評点の高い商品をユーザに推薦する。   When handling matrix data including unknown matrix elements, it is required to accurately predict the value of an unknown matrix element (hereinafter sometimes referred to as a missing value) from the observed known part. For example, in a collaborative filtering system that recommends products based on matrix data that collects product ratings from multiple users, it predicts unknown scores of products not evaluated by users and recommends products with high predicted scores to users. To do.

このようなシステムでは、行列データの欠損値を予測する一般的な方法として、欠損値を行列要素に含む行列形データを確率モデルを用いてサイズの小さい複数の行列データに分解し、その分解した行列データから元の行列データの欠損値を予測する方法が用いられる。このように欠損値を予測する方法が、非特許文献1及び非特許文献2に記載されている。   In such a system, as a general method for predicting missing values of matrix data, matrix data including missing values as matrix elements is decomposed into a plurality of small matrix data using a probabilistic model, and the decomposition is performed. A method of predicting missing values of original matrix data from matrix data is used. A method for predicting a missing value in this way is described in Non-Patent Document 1 and Non-Patent Document 2.

非特許文献1に記載された方法では、欠損値を行列要素に含む行列形データの線形な構造を確率モデルにより抽出し、行列を構成する因子ごとにサイズの小さい行列データに分解する。そして、分解した各行列データの線形結合を用いて元の行列形データに近似する行列データを予測する。   In the method described in Non-Patent Document 1, a linear structure of matrix data including missing values in matrix elements is extracted by a probability model, and is decomposed into small matrix data for each factor constituting the matrix. Then, matrix data that approximates the original matrix data is predicted using a linear combination of the decomposed matrix data.

また、非特許文献2に記載された方法では、欠損値を行列要素に含む行列形データの非線形な構造を確率モデルにより抽出し、行列を構成する因子ごとにサイズの小さい行列データに分解する。そして、分解した行列データを用いて元の行列形データに近似する行列データを予測する。すなわち、非特許文献2に記載された方法は、非特許文献1に記載された方法を拡張した方法であると言える。   Further, according to the method described in Non-Patent Document 2, a nonlinear structure of matrix data including missing values in matrix elements is extracted by a probability model, and is decomposed into small matrix data for each factor constituting the matrix. Then, matrix data that approximates the original matrix data is predicted using the decomposed matrix data. That is, it can be said that the method described in Non-Patent Document 2 is an extended method of the method described in Non-Patent Document 1.

Ruslan Salakhutdinov and Andriy Mnih,"Probabilistic Matrix Factorization" In Neural Information Processing Systems (NIPS), 2007.Ruslan Salakhutdinov and Andriy Mnih, "Probabilistic Matrix Factorization" In Neural Information Processing Systems (NIPS), 2007. Neil D. Lawrence and Raquel Urtasun, "Non-linear Matrix Factorization with Gaussian Processes", Proceedings of the 26th International Conference on Machine Learning (ICML), pp.601-608, Montreal, Canada, 2009.Neil D. Lawrence and Raquel Urtasun, "Non-linear Matrix Factorization with Gaussian Processes", Proceedings of the 26th International Conference on Machine Learning (ICML), pp.601-608, Montreal, Canada, 2009.

非特許文献1及び非特許文献2に記載された方法では、因子行列が与えられた場合、元の行列データが条件付独立であるため、元の行列データに対して条件付独立の制約がない場合に比べると、予測精度が低いという問題がある。   In the methods described in Non-Patent Document 1 and Non-Patent Document 2, when a factor matrix is given, the original matrix data is conditionally independent, so there is no conditionally independent constraint on the original matrix data. Compared to the case, there is a problem that the prediction accuracy is low.

例えば、非特許文献1に記載された方法では、元の行列形データに含まれる各因子の因子行列が与えられた場合、元の行列形データの各行列要素は条件付独立である。また、非特許文献1に記載された方法では、線形な構造を抽出する方法であるため、非線形で複雑な構造を抽出できないという課題がある。   For example, in the method described in Non-Patent Document 1, when a factor matrix of each factor included in the original matrix data is given, each matrix element of the original matrix data is conditionally independent. Further, since the method described in Non-Patent Document 1 is a method for extracting a linear structure, there is a problem that a nonlinear and complicated structure cannot be extracted.

一方、非特許文献2に記載された方法では、非線形な構造を抽出できるため、非特許文献1の欠損値予測システムに比べて、予測精度は高い。具体的には、非特許文献2に記載された方法では、一方の因子に事前分布を仮定して積分消去(周辺化)し、元のデータに与えるその因子の影響を削除することで非線形な構造を抽出する。しかし、非特許文献2に記載された方法においても、元の行列形データに含まれる2つの因子のうち、削除しなかった因子の因子行列が与えられた場合、元の行列形データの削除した方の因子要素は条件付独立である。   On the other hand, in the method described in Non-Patent Document 2, since a nonlinear structure can be extracted, the prediction accuracy is higher than the missing value prediction system of Non-Patent Document 1. Specifically, in the method described in Non-Patent Document 2, it is assumed that a prior distribution is assumed for one factor and integration is eliminated (marginalized), and the influence of the factor on the original data is eliminated to make nonlinearity. Extract structure. However, even in the method described in Non-Patent Document 2, when the factor matrix of the factor that was not deleted is given among the two factors included in the original matrix data, the original matrix data is deleted. The other factor element is conditionally independent.

以上のように、非特許文献1及び非特許文献2に記載された方法では、因子行列が与えられた場合、元の行列データが条件付独立であるという性質を有する。そのため、元の行列形データに対して条件付独立の制約がなく、また、元の行列形データの各行列要素間の相関関係を組み込んだモデルの予測精度と比べると、精度が低下してしまうという課題がある。   As described above, the methods described in Non-Patent Document 1 and Non-Patent Document 2 have the property that, when a factor matrix is given, the original matrix data is conditionally independent. For this reason, there is no conditionally independent constraint on the original matrix data, and the accuracy is reduced compared to the prediction accuracy of the model incorporating the correlation between each matrix element of the original matrix data. There is a problem.

そこで、本発明は、行列形データにおける欠損値の予測精度を向上できる欠損値予測装置、欠損値予測方法及び欠損値予測プログラムを提供することを目的とする。   Therefore, an object of the present invention is to provide a missing value prediction apparatus, a missing value prediction method, and a missing value prediction program that can improve the accuracy of predicting missing values in matrix data.

本発明による欠損値予測装置は、2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、その行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のパラメータのうち、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にするパラメータを推定するパラメータ推定手段と、パラメータ推定手段が推定したパラメータ及び行列形データにおける既知の行列要素の値を用いて、行列形データにおける行列要素の欠損値を予測する欠損値予測手段とを備えたことを特徴とする。   The missing value predicting apparatus according to the present invention is a matrix defined for each factor element of one factor in matrix data including two factors, and the characteristics of each factor element of the other factor in the matrix data are obtained. Parameter estimating means for estimating a parameter that maximizes the likelihood that the data when the function transforms the factor matrix is matrix data among the parameters of the function that converts the factor matrix that is a matrix to represent, and the parameter estimating means And a missing value predicting means for predicting a missing value of the matrix element in the matrix data using the estimated parameter and the value of the known matrix element in the matrix data.

本発明による欠損値予測方法は、2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、その行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のうち、その因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数を推定し、関数を推定する際に用いられたパラメータ及び行列形データにおける既知の行列要素の値を用いて、行列形データにおける行列要素の欠損値を予測することを特徴とする。   The missing value prediction method according to the present invention is a matrix defined for each factor element of one factor in matrix data including two factors, and the characteristics of each factor element of the other factor in the matrix data are determined. Among the functions that convert the factor matrix that is the matrix to represent, the function that maximizes the likelihood that the data when the factor matrix is converted is matrix data is estimated, and the parameters used in estimating the function and It is characterized in that a missing value of a matrix element in the matrix data is predicted using a value of a known matrix element in the matrix data.

本発明による欠損値予測プログラムは、コンピュータに、2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、その行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のパラメータのうち、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にするパラメータを推定するパラメータ推定処理、および、パラメータ推定処理で推定されたパラメータ及び行列形データにおける既知の行列要素の値を用いて、行列形データにおける行列要素の欠損値を予測する欠損値予測処理を実行させることを特徴とする。   The missing value prediction program according to the present invention is a matrix defined for each factor element of one factor in matrix data including two factors, and each factor element of the other factor in the matrix data is stored in a computer. A parameter estimation process for estimating a parameter that maximizes the likelihood that the data obtained when the function transforms the factor matrix is matrix data, among the parameters of the function that transforms the factor matrix that is a matrix representing the characteristics of Using the parameters estimated by the parameter estimation process and the values of known matrix elements in the matrix data, a missing value prediction process for predicting the missing values of the matrix elements in the matrix data is executed.

本発明によれば、行列形データにおける欠損値の予測精度を向上できる。   According to the present invention, it is possible to improve the accuracy of predicting missing values in matrix data.

本発明による欠損値予測装置の一実施形態を示すブロック図である。It is a block diagram which shows one Embodiment of the missing value prediction apparatus by this invention. 本発明の実施形態における動作の例を示すフローチャートである。It is a flowchart which shows the example of the operation | movement in embodiment of this invention. 行列形データの例を示す説明図である。It is explanatory drawing which shows the example of matrix form data. 本発明の実施例における不具合予測システムの例を示す説明図である。It is explanatory drawing which shows the example of the malfunction prediction system in the Example of this invention. 本発明の実施例における動作の例を示すシーケンス図である。It is a sequence diagram which shows the example of operation | movement in the Example of this invention. 送信される行列形データの例を示す説明図である。It is explanatory drawing which shows the example of the matrix form data transmitted. 予測した値で欠損値を埋めた予測結果の例を示す説明図である。It is explanatory drawing which shows the example of the prediction result which filled the missing value with the predicted value. 本発明による欠損値予測装置の最小構成の例を示すブロック図である。It is a block diagram which shows the example of the minimum structure of the missing value prediction apparatus by this invention.

以下、本発明の実施形態を図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明による欠損値予測装置の一実施形態を示すブロック図である。本実施形態における欠損値予測装置101は、入力手段102と、近似手段103と、予測手段104と、出力手段105とを備えている。   FIG. 1 is a block diagram showing an embodiment of a missing value prediction apparatus according to the present invention. The missing value prediction apparatus 101 according to the present embodiment includes an input unit 102, an approximation unit 103, a prediction unit 104, and an output unit 105.

入力手段102は、例えば、ユーザにより入力される行列形データを近似手段103に通知する。ここで、行列形データは、因子数が2の行列であり、例えば、行列の縦軸と横軸がそれぞれ因子になるデータである。なお、以下の説明では、入力手段102に入力される行列形データをYと記す。   For example, the input unit 102 notifies the approximation unit 103 of matrix data input by the user. Here, the matrix-type data is a matrix having a factor number of 2, for example, data in which the vertical axis and the horizontal axis of the matrix are factors. In the following description, matrix data input to the input means 102 is denoted as Y.

近似手段103は、入力された行列形データYにおける一方の因子の因子要素ごとに、入力された行列形データYにおけるもう一方の因子の各因子要素の特徴を表す行列形データ(以下、因子行列データと記す。)を定義する。そして、近似手段103は、因子行列データを変換する関数のパラメータのうち、その関数が因子行列データを変換したときのデータ入力された行列形データYである尤もらしさを最大にするパラメータを推定する。なお、以下の説明では、一方の因子における各因子要素の特徴を表す因子行列データをXと記し、因子行列データXを変換する関数をFと記す。   For each factor element of one factor in the input matrix data Y, the approximating means 103 performs matrix data (hereinafter referred to as factor matrix) representing the characteristics of each factor element of the other factor in the input matrix data Y. Defined as data). Then, the approximating means 103 estimates a parameter that maximizes the likelihood of the matrix-like data Y to which data is inputted when the function transforms the factor matrix data among the parameters of the function that transforms the factor matrix data. . In the following description, factor matrix data representing the characteristics of each factor element in one factor is denoted as X, and a function for converting the factor matrix data X is denoted as F.

具体的には、近似手段103は、入力手段102に入力された行列形データYを近似することを目的として、入力された行列形データYに含まれる一方の因子の因子要素ごとに、入力された行列形データYに含まれるもう一方の因子の各因子要素の特徴を表す行列形データを引数とする関数のパラメータを推定する。   Specifically, the approximation means 103 is input for each factor element of one factor included in the input matrix data Y for the purpose of approximating the matrix data Y input to the input means 102. The parameter of the function having the matrix data representing the feature of each factor element of the other factor included in the matrix data Y as an argument is estimated.

予測手段104は、近似手段103が推定した結果と行列形データの既知の行列要素の値から、未知の行列要素の値(すなわち、欠損値)を予測する。例えば、予測手段104は、近似手段103が推定したパラメータ及び既知の行列要素の値を用いて、欠損値を予測する。   The prediction unit 104 predicts the value of an unknown matrix element (that is, a missing value) from the result estimated by the approximation unit 103 and the value of the known matrix element of the matrix data. For example, the predicting unit 104 predicts a missing value using the parameter estimated by the approximating unit 103 and the values of known matrix elements.

出力手段105は、予測手段104が予測した欠損値の予測結果を出力する。出力手段105は、例えば、ディスプレイなどの表示装置(図示せず)に予測結果を表示させてもよい。もしくは、出力手段105は、欠損値予測装置101が備えている、もしくは、欠損値予測装置101に接続されている記憶装置(図示せず)に予測結果を記憶させてもよい。さらに、出力手段105は、他のシステム(図示せず)に予測結果を通知してもよい。   The output unit 105 outputs the prediction result of the missing value predicted by the prediction unit 104. For example, the output unit 105 may display the prediction result on a display device (not shown) such as a display. Alternatively, the output unit 105 may store the prediction result in a storage device (not shown) provided in the missing value prediction apparatus 101 or connected to the missing value prediction apparatus 101. Further, the output unit 105 may notify the prediction result to another system (not shown).

近似手段103と、予測手段104とは、プログラム(欠損値予測プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、欠損値予測装置101の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、近似手段103及び予測手段104として動作してもよい。また、近似手段103と、予測手段104とは、それぞれが専用のハードウェアで実現されていてもよい。   The approximation means 103 and the prediction means 104 are realized by a CPU of a computer that operates according to a program (missing value prediction program). For example, the program may be stored in a storage unit (not shown) of the missing value prediction apparatus 101, and the CPU may read the program and operate as the approximation unit 103 and the prediction unit 104 according to the program. Further, each of the approximating unit 103 and the predicting unit 104 may be realized by dedicated hardware.

次に、動作について説明する。図2は、本実施形態における動作の例を示すフローチャートである。また、図3は、行列形データの例を示す説明図である。図3に例示する行列形データは、各軸が行列形データの因子を表し、縦軸が因子「映画」を、横軸が因子「ユーザ」をそれぞれ表す。すなわち、行列形データYは、縦軸と横軸それぞれが意味する内容が因子であり、因子数が2のデータである。また、図3に例示する行列形データの行列要素は、ユーザが各映画を1〜5の範囲で評価した点数であり、空白の部分(空白の行列要素)が、行列形データの欠損値を表す。   Next, the operation will be described. FIG. 2 is a flowchart showing an example of the operation in this embodiment. FIG. 3 is an explanatory diagram showing an example of matrix data. In the matrix data illustrated in FIG. 3, each axis represents a factor of the matrix data, the vertical axis represents the factor “movie”, and the horizontal axis represents the factor “user”. That is, the matrix data Y is data in which the vertical axis and the horizontal axis mean factors, and the number of factors is two. In addition, the matrix elements of the matrix data illustrated in FIG. 3 are scores obtained by the user evaluating each movie in the range of 1 to 5, and blank portions (blank matrix elements) indicate missing values of the matrix data. To express.

以下の説明では、2変量、1シーケンスデータの行列形データが入力されるものとする。また、入力される行列形データをYとし、行列形データYは、M×N次元の行列形データとする。図3に例示する行列形データは、映画の種類(すなわち、因子「映画」の因子要素)がM個(具体的には、A〜Eの5個)、ユーザの数(すなわち、因子「ユーザ」の因子要素)がN個(具体的には、1〜30の30人)の行列形データである。   In the following description, it is assumed that matrix data of bivariate and single sequence data is input. The input matrix data is Y, and the matrix data Y is M × N-dimensional matrix data. The matrix data illustrated in FIG. 3 includes M types of movies (that is, factor elements of the factor “movie”) (specifically, five factors A to E), and the number of users (that is, the factor “user”). "Is a matrix data of N elements (specifically, 30 persons from 1 to 30).

まず、行列形データYが入力されると、入力手段102は入力された行列形データYを近似手段103に通知する(ステップS201)。近似手段103は、入力された行列形データYを近似することを目的として、入力された行列形データに含まれる一方の因子の因子要素ごとに、その行列形データに含まれるもう一方の因子の各因子要素の特徴を表す行列形データを引数とする関数のパラメータを推定する(ステップS202)。   First, when the matrix data Y is input, the input unit 102 notifies the approximated unit 103 of the input matrix data Y (step S201). For the purpose of approximating the input matrix data Y, the approximating means 103 for each factor element of one factor included in the input matrix data Y, the other factor included in the matrix data. A parameter of a function having a matrix data representing the characteristics of each factor element as an argument is estimated (step S202).

具体的には、まず、近似手段103は、欠損値を行列要素に含む行列形データYを、以下のような(M×N)×1次元のベクトルデータ(以下、ベクトルYと記す。)に変形する。なお、M及びNは、因子要素の数である。   Specifically, first, the approximating means 103 converts the matrix data Y including missing values into matrix elements into the following (M × N) × one-dimensional vector data (hereinafter referred to as vector Y). Deform. M and N are the number of factor elements.

Y=[Y1 2 ・・・ YN
=[y11,y12,・・・,y1M,y21,y22,・・・,y2M,・・・,yN1,yN2,・・・,yNMT
Y = [Y 1 Y 2 ... Y N ]
= [Y 11 , y 12 , ..., y 1M , y 21 , y 22 , ..., y 2M , ..., y N1 , y N2 , ..., y NM ] T

ここで、YNは、ベクトルYの行ベクトルを示し、yNMは、ベクトルYの行列要素を示す。次に、近似手段103は、ベクトルYを以下の式1のように定義する。 Here, Y N represents a row vector of the vector Y, and y NM represents a matrix element of the vector Y. Next, the approximating means 103 defines the vector Y as shown in Equation 1 below.

Y=F(X)+ε (式1)   Y = F (X) + ε (Formula 1)

Xは、因子行列であり、また、関数Fは、(M×N)×1次元のベクトルである。具体的には、関数Fは、以下のように定義される。   X is a factor matrix, and the function F is a (M × N) × 1-dimensional vector. Specifically, the function F is defined as follows.

F=[F1 2 ・・・ FN
=[f11,f12,・・・,f1M,f21,f22,・・・,f2M,・・・,fN1,fN2,・・・,fNMT
F = [F 1 F 2 ... F N ]
= [F 11, f 12, ···, f 1M, f 21, f 22, ···, f 2M, ···, f N1, f N2, ···, f NM] T

ここで、FNは、関数Fの行ベクトルを表す。また、式1におけるεは、以下のように定義される。 Here, F N represents a row vector of the function F. Further, ε in Equation 1 is defined as follows.

ε=N(0,σI) ε = N (0, σ 2 I)

ここで、N()は、ガウス分布を表す。また、σは分散を、Iは、単位行列をそれぞれ表す。次に、各因子要素の特徴を表す因子行列として、以下に例示する因子行列X’を定義する。 Here, N () represents a Gaussian distribution. Also, σ 2 represents the variance, and I represents the unit matrix. Next, a factor matrix X ′ exemplified below is defined as a factor matrix representing the characteristics of each factor element.

Figure 2011154554
Figure 2011154554

上述の通り、X’は、元の行列形データYの横軸の因子の特徴を表すMN×qの行列である。MNは、因子行列X’の特徴の個数を表す。ここで、行列形データYの縦軸の因子の各因子要素の特徴は横軸の各因子要素で表わされ、その特徴の次元はMである。すなわち、行列形データYの1行目(すなわち、縦軸の因子の1番目の因子要素)の特徴は、行列要素の(1行目、1列目)、(1行目、2列名)、・・・、(1行目、M列目)で表される。すなわち、縦軸の因子要素数はNであることから、因子行列X’は、縦軸の因子の因子要素ごとに、横軸の因子の各因子要素の特徴を表している行列形データであると言うことができる。   As described above, X ′ is a MN × q matrix representing the characteristics of the factors on the horizontal axis of the original matrix data Y. MN represents the number of features of the factor matrix X ′. Here, the feature of each factor element on the vertical axis of the matrix data Y is represented by each factor element on the horizontal axis, and the dimension of the feature is M. That is, the characteristics of the first row of the matrix data Y (that is, the first factor element of the factor on the vertical axis) are the matrix element (first row, first column), (first row, second column name). ,... (First row, Mth column). That is, since the number of factor elements on the vertical axis is N, the factor matrix X ′ is matrix data representing the characteristics of each factor element on the horizontal axis for each factor element on the vertical axis. Can be said.

また、qは、因子行列X’の特徴の次元を表すパラメータである。qの値は、ユーザ等により予め与えられる。   Q is a parameter representing the dimension of the feature of the factor matrix X ′. The value of q is given in advance by a user or the like.

ここで、X’は、因子行列X’の1行目の行ベクトルを表す。したがって、例えば、行列形データYの1行目の行ベクトルY1は、以下のように表すことができる。ここで、εは、式1におけるεと同様である。 Here, X 1 ′ represents the first row vector of the factor matrix X ′. Therefore, for example, the row vector Y 1 of the first row of the matrix data Y can be expressed as follows. Here, ε is the same as ε in Equation 1.

1=F1(X1’)+ε Y 1 = F 1 (X 1 ') + ε

次に、近似手段103は、ベクトルYの確率分布を、以下に例示する式2のように定義する。   Next, the approximating means 103 defines the probability distribution of the vector Y as shown in Equation 2 exemplified below.

P(Y|F(X’))=N(Y|F(X’),σI) (式2) P (Y | F (X ′)) = N (Y | F (X ′), σ 2 I) (Formula 2)

ここで、関数Fの確率分布をガウシアンプロセスを用いて以下に例示する式3のように定義する場合について説明する。   Here, a case will be described in which the probability distribution of the function F is defined as in Expression 3 exemplified below using a Gaussian process.

P(F|X)=GP(F|0,KWX)=N(F|0,KWX) (式3) P (F | X) = GP (F | 0, K WX ) = N (F | 0, K WX ) (Formula 3)

ガウシアンプロセスは、非線形の入出力関係を正規確率過程から得られたものとして捉える確率過程であり、行列演算のみで確率過程を記述できることを特徴とする方法である。また、KWXは、ガウス分布の共分散行列を表す。共分散行列の各要素kWX ijは、以下のように表すことができる。 The Gaussian process is a stochastic process that captures a nonlinear input / output relationship as being obtained from a normal stochastic process, and is characterized in that a stochastic process can be described only by matrix operation. K WX represents a Gaussian distribution covariance matrix. Each element k WX ij of the covariance matrix can be expressed as follows.

WX ij=<X’,X’> k WX ij = <X i ′, X j ′>

なお、<>は、内積を表す。すなわち、kWX ijは、X’とX’の内積として表すことができる。 Note that <> represents an inner product. That is, k WX ij can be expressed as an inner product of X i ′ and X j ′.

共分散行列KWXは、推定が必要なパラメータであるが、サイズが大きいNM×NMの行列データである。そのため、共分散行列KWXを推定しようとすると、NM×NM個の行列要素全てを推定する必要があり、計算コストが大きくなってしまう。そこで、近似手段103は、式3を変更し、以下に例示する式4のように関数Fの確率分布を定義する。 The covariance matrix K WX is a parameter that needs to be estimated, but is NM × NM matrix data having a large size. Therefore, when trying to estimate the covariance matrix K WX , it is necessary to estimate all NM × NM matrix elements, which increases the calculation cost. Therefore, the approximating means 103 changes Equation 3 and defines the probability distribution of the function F as shown in Equation 4 exemplified below.

Figure 2011154554
Figure 2011154554

ここで、XはM×qの行列形データであり、WはN×rの関数を表す行列形データである。なお、rは、関数Wの特徴の次元を表すパラメータであり、rの値は、ユーザ等により予め与えられる。すなわち、式4は、式3における共分散行列KWXを、以下に示す内容(以下、推定対象パラメータと記す。)に置き換えたものである。 Here, X is M × q matrix data, and W is matrix data representing an N × r function. Note that r is a parameter representing the dimension of the feature of the function W, and the value of r is given in advance by a user or the like. That is, Expression 4 is obtained by replacing the covariance matrix K WX in Expression 3 with the following contents (hereinafter referred to as estimation target parameters).

Figure 2011154554
Figure 2011154554

ここで、以下の記号は、クロネッカー積を表す。   Here, the following symbols represent Kronecker products.

Figure 2011154554
Figure 2011154554

また、Kは、マーセルの定理を満たすカーネルと呼ばれるN×Nの行列データである。同様に、Kは、マーセルの定理を満たす(すなわち、カーネルと呼ばれる)M×Mの行列データである。 K W is N × N matrix data called a kernel that satisfies the Marcel theorem. Similarly, K X is M × M matrix data that satisfies Mercer's theorem (ie, called a kernel).

ここで、行列Kの行列要素k ij、及び、行列Kの行列要素k ijは、それぞれ以下のように表すことができる。 Here, the matrix element k W ij of the matrix K W and the matrix element k X ij of the matrix K X can be expressed as follows, respectively.

ij=k(W,W)=<W,W
ij=k(X,X)=<X,X
k W ij = k W (W i , W j ) = <W i , W j >
k X ij = k X (X i, X j) = <X i, X j>

なお、<>は、内積を表す。すなわち、k ijは、WとWの内積として表すことができ、k ijは、XとXの内積として表すことができる。具体的には、行列Kの行列要素k(W,W)は、WとWとを非線形に写像した高次元ベクトル空間上におけるWとWとの距離を表す。行列Kの行列要素k(X,X)についても同様である。 Note that <> represents an inner product. That is, k W ij can be expressed as an inner product of W i and W j , and k X ij can be expressed as an inner product of X i and X j . Specifically, the matrix element k W of the matrix K W (W i, W j ) represents the distance between the W i and W j on the high-dimensional vector space by mapping the W i and W j nonlinearly. The same applies to the matrix element k X (X i , X j ) of the matrix K X.

上述の推定対象パラメータは、共分散行列KWXと同様、推定が必要なパラメータである。推定対象パラメータの内容を推定する場合、近似手段103は、N×N+M×M個の行列要素を推定することになる。すなわち、共分散行列KWXを推定する場合には、NM×NM個の行列要素全てを推定する必要があるが、推定対象パラメータを推定する場合、N×N+M×M個の行列要素を推定すればよい。したがって、共分散行列KWXを推定する場合に比べ、計算コストを小さくすることができる。 The estimation target parameter described above is a parameter that needs to be estimated, like the covariance matrix KWX . When estimating the content of the estimation target parameter, the approximating means 103 estimates N × N + M × M matrix elements. That is, when estimating the covariance matrix K WX , it is necessary to estimate all NM × NM matrix elements, but when estimating the estimation target parameter, N × N + M × M matrix elements are estimated. That's fine. Therefore, the calculation cost can be reduced as compared with the case where the covariance matrix K WX is estimated.

次に、パラメータを推定する際の計算オーダを低減させる方法について説明する。上述の通り、式4に例示するモデルを用いることで、式3に例示するモデルよりも推定するパラメータを低減させることができる。さらに、式3に例示するモデルよりも計算オーダを低減させるため、まず、式4を以下の式5のように変形する。   Next, a method for reducing the calculation order when estimating the parameters will be described. As described above, by using the model illustrated in Expression 4, it is possible to reduce the parameter to be estimated as compared with the model illustrated in Expression 3. Furthermore, in order to reduce the calculation order as compared with the model illustrated in Expression 3, first, Expression 4 is transformed into Expression 5 below.

Figure 2011154554
Figure 2011154554

なお、Fは、Xを引数とする関数である。また、Fは、Wを引数とする関数である。ここで、式4及び式5に例示するモデルにおける計算オーダは、O(M)である。そのため、式5を近似して、以下に例示する式6を定義する。式6に例示するモデルにおける計算オーダは、O(MNN)になる。 Note that F X is a function having X as an argument. FW is a function having W as an argument. Here, the calculation order in the models illustrated in Expression 4 and Expression 5 is O (M 3 N 3 ). Therefore, Formula 5 illustrated below is defined by approximating Formula 5. The calculation order in the model illustrated in Equation 6 is O (MNN 2 ).

Figure 2011154554
Figure 2011154554

は、各nについて独立であるという仮定のもとに定義される関数である。すなわち、F を定義することは、式4において因子要素数Nの各因子要素の独立性を仮定しているとも言える。しかし、ここで仮定する独立性は、例えば、非特許文献2に記載された方法で用いられる独立性とは異なる。例えば、式6において、独立性を仮定したと言える部分は、以下の部分である。 F n X is a function defined under the assumption that each n is independent. That is, it can be said that defining F n X assumes independence of each factor element having the number N of factor elements in Equation 4. However, the independence assumed here is different from the independence used in the method described in Non-Patent Document 2, for example. For example, in Equation 6, the part that can be said to have assumed independence is the following part.

Figure 2011154554
Figure 2011154554

一方、非特許文献2に記載された方法では、独立性を仮定した部分は、以下の式7のように表わされる部分である。   On the other hand, in the method described in Non-Patent Document 2, the part assuming independence is a part represented by Equation 7 below.

Figure 2011154554
Figure 2011154554

両者を比較すると、式6において独立性を仮定したと言える部分がFを含む点で式7と異なる。このように、式7における独立性の仮定とは異なり、式6では、独立性の仮定において欠落する情報をFで補っている。 When both are compared, the part which can be said to have assumed the independence in Formula 6 is different from Formula 7 in that FW is included. Thus, unlike the independence assumption in Equation 7, in Equation 6, the missing information in the independence assumption is supplemented with FW .

なお、実問題においては、因子ごとの特徴を表すデータが新たに与えられることがある。例えば、「映画」という因子の特徴として、映画に出演した俳優の情報や、映画の発表年月日、映画製作会社、映画配給会社等の情報が与えられる。また、例えば、「ユーザ」という因子の特徴として、性別、年代、地域などの情報が与えられる。このように与えられるデータをメタデータと呼ぶ。これらのメタデータを利用し、式6に例示するモデルを、以下に例示する式8のように定義し、さらに式8を用いて式9のように定義してもよい。   In an actual problem, data representing characteristics for each factor may be newly given. For example, as a feature of the factor “movie”, information on actors who appeared in the movie, information on the date of movie announcement, movie production company, movie distribution company, and the like are given. Further, for example, information such as gender, age, and region is given as a feature of the factor “user”. Data given in this way is called metadata. Using these metadata, the model illustrated in Expression 6 may be defined as Expression 8 illustrated below, and further defined as Expression 9 using Expression 8.

Figure 2011154554
Figure 2011154554

Figure 2011154554
Figure 2011154554

ここで、Rは、行列形データYの縦軸を表す因子(すなわち、因子要素数がMの因子)のメタデータを表す。また、Sは、行列形データYの横軸を表す因子(すなわち、因子要素数がNの因子)のメタデータを表す。なお、メタデータを導入して拡張された式9は、式6の階層モデルと呼ばれる。   Here, R represents metadata of a factor representing the vertical axis of the matrix data Y (that is, a factor having M factor elements). S represents metadata of a factor representing the horizontal axis of the matrix data Y (that is, a factor having N factor elements). Note that Expression 9 expanded by introducing metadata is called a hierarchical model of Expression 6.

次に、パラメータを推定する具体的な方法について説明する。推定が必要なパラメータは、KW、及びσである。そこで、近似手段103は、関数Fが因子行列Xを変換したときの行列が行列形データYである尤もらしさを最大にするパラメータを推定する。例えば、近似手段103は、以下の式10に例示する周辺尤度logP(Y|X)を最大化するパラメータKW、及びσを、勾配法を用いて推定してもよい。 Next, a specific method for estimating parameters will be described. The parameters that need to be estimated are K W, K X and σ. Therefore, the approximating means 103 estimates a parameter that maximizes the likelihood that the matrix when the function F transforms the factor matrix X is matrix data Y. For example, the approximating means 103 may estimate parameters K W, K X and σ that maximize the marginal likelihood logP (Y | X) exemplified in the following Expression 10 using a gradient method.

Figure 2011154554
Figure 2011154554

このように導出されたモデル(欠損値を予測するモデル)は、以下のような特徴を持つ。すなわち、欠損値を行列要素に含む行列形データYが確率モデルにより関数Fと因子行列Xでモデル化され、さらに、関数Fの事前確率(例えば、上述の式3)がガウシアンプロセスで定義されているため、非線形な相関構造を考慮可能なモデルになっている。   The model thus derived (model for predicting missing values) has the following characteristics. That is, the matrix data Y including missing values as matrix elements is modeled by the function F and the factor matrix X by the probability model, and the prior probability of the function F (for example, Equation 3 above) is defined by the Gaussian process. Therefore, the model can take into account the nonlinear correlation structure.

さらに、本モデルは、元の行列形データYが関数Fと因子行列Xとを用いて表されているため、元の行列形データYに対して条件付独立の制約がない。具体的には、本モデルには、元の行列形データYの各行列要素間の相関関係が組み込まれている。そのため、予測精度が低下することを抑制できる。   Furthermore, since the original matrix data Y is expressed using the function F and the factor matrix X in this model, there is no conditionally independent constraint on the original matrix data Y. Specifically, the present model incorporates the correlation between the matrix elements of the original matrix data Y. Therefore, it can suppress that prediction accuracy falls.

さらに、本モデルでは、関数Fの共分散行列の構造に着目し、サイズの大きい共分散行列を、共分散を表すサイズの小さい2つの行列のクロネッカー積で表現している。そのため、推定が必要なパラメータ数を減らして、計算量を削減することを可能にしている。具体的には、元の行列形データYに含まれる一方の因子の各要素の特徴を表す行列形データ(すなわち、因子行列)Xに関しては、全行列要素数(特徴の次元×要素数)のパラメータを推定し、もう一方の因子に関しては、行列形データの要素数の約2乗個のパラメータを推定すればよい。   Further, in this model, paying attention to the structure of the covariance matrix of the function F, a large covariance matrix is represented by a Kronecker product of two small matrices representing covariance. Therefore, it is possible to reduce the amount of calculation by reducing the number of parameters that need to be estimated. Specifically, with respect to matrix-shaped data (that is, factor matrix) X representing the characteristics of each element of one factor included in the original matrix-shaped data Y, the total number of matrix elements (feature dimension × number of elements) A parameter is estimated, and for the other factor, a parameter of approximately the square of the number of elements of matrix data may be estimated.

次に、予測手段104は、近似手段103が推定した結果と行列形データの既知の行列要素の値から、未知の行列要素の値を予測する(ステップS203)。予測手段104は、例えば、近似手段103が推定したパラメータであるK、K(すなわち、W及びX)及び、行列形データの既知の行列要素の値を用いて、以下に例示する式11により未知の行列要素(欠損値)を予測する。 Next, the prediction unit 104 predicts the value of the unknown matrix element from the result estimated by the approximation unit 103 and the value of the known matrix element of the matrix data (step S203). The prediction unit 104 uses, for example, K W and K X (that is, W and X), which are parameters estimated by the approximation unit 103, and the values of known matrix elements of the matrix data, and the following Expression 11 To predict unknown matrix elements (missing values).

Figure 2011154554
Figure 2011154554

ここで、Dは、対角成分がσの二乗であるNM×NMの行列データである。また、Yは、元の行列形データYを変形したベクトルデータである。また、k i:は、Kのi行目を列ベクトルにしたN次元のベクトルを表し、k i:は、Kのi行目における列ベクトルを表す。例えば、ベクトルYの要素y1Mの値が欠損している場合、予測手段104は、式11を用いた以下に例示する式12により未知の行列要素(欠損値)を予測すればよい。 Here, D is NM × NM matrix data whose diagonal component is the square of σ. Y is vector data obtained by modifying the original matrix data Y. Further, k W i: represents an N-dimensional vector in which the i-th row of K W is a column vector, and k X i: represents a column vector in the i-th row of K X. For example, when the value of the element y 1M of the vector Y is missing, the prediction unit 104 may predict an unknown matrix element (missing value) using Equation 12 illustrated below using Equation 11.

Figure 2011154554
Figure 2011154554

以下、行列形データYの全ての欠損箇所を予測したデータ(すなわち、行列形データの欠損値を予測した値で埋めたデータ)をY’とする。最後に、出力手段105は、欠損値を予測した値で埋めた行列データY’を出力する(ステップS204)。   Hereinafter, Y ′ represents data in which all missing portions of the matrix data Y are predicted (that is, data in which missing values of the matrix data are filled with predicted values). Finally, the output unit 105 outputs matrix data Y ′ in which missing values are filled with predicted values (step S <b> 204).

以上のように、本実施形態によれば、まず、2つの因子を含む行列形データYの縦軸方向の因子の因子要素ごとに、その行列形データYにおける横軸方向の因子の各因子要素の特徴を表す因子行列Xが定義される。次に、近似手段103が、因子行列Xを変換する関数Fのパラメータのうち、その関数が因子行列Xを変換したときのデータが行列形データYである尤もらしさ(周辺尤度)を最大にするパラメータを推定する。そして、予測手段104が、推定されたパラメータK、K(すなわち、W及びX)及び行列形データYにおける既知の行列要素の値を用いて、行列形データの行列要素の欠損値を予測する。このようにすることで、行列形データにおける欠損値の予測精度を向上させることができる。 As described above, according to the present embodiment, first, for each factor element of the factor in the vertical axis direction of the matrix data Y including two factors, each factor element of the factor in the horizontal axis direction of the matrix data Y A factor matrix X representing the characteristics of is defined. Next, the approximation means 103 maximizes the likelihood (peripheral likelihood) that the data when the function transforms the factor matrix X among the parameters of the function F that transforms the factor matrix X is matrix data Y. Parameters to be estimated. Then, the prediction unit 104 predicts a missing value of the matrix element of the matrix data using the estimated parameters K W and K X (that is, W and X) and the values of the known matrix elements in the matrix data Y. To do. In this way, it is possible to improve the accuracy of predicting missing values in matrix data.

また、例えば、非特許文献1に記載された方法では、元の行列形データを全ての因子ごとにサイズの小さな行列形データに分解し、分解した因子行列データの全要素数を推定する必要があるため、計算コストは大きい。また、非特許文献2に記載された方法では、片方の因子行列データの全要素数だけ推定すればよいが、それでも、非特許文献1の計算コストの半分であり、元の行列データが条件付き独立であるという性質は有したままである。   For example, in the method described in Non-Patent Document 1, it is necessary to decompose the original matrix data into small matrix data for every factor and estimate the total number of elements of the decomposed factor matrix data. Therefore, the calculation cost is high. Further, in the method described in Non-Patent Document 2, it is only necessary to estimate the total number of elements of one factor matrix data, but it is still half the calculation cost of Non-Patent Document 1, and the original matrix data is conditional. The property of being independent remains.

しかし、本実施形態によれば、サイズの大きい共分散行列を、共分散を表すサイズの小さい2つの行列のクロネッカー積で表現することで推定が必要なパラメータ数を減らしているため、計算コストを抑えることが出来る。   However, according to the present embodiment, the number of parameters that need to be estimated is reduced by expressing the large covariance matrix by the Kronecker product of the two small matrices representing the covariance. It can be suppressed.

以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。以下の実施例では、会社や工場から製品の不具合情報を受信し、その不具合情報から将来発生する不具合を事前に予測するシステム(以下、不具合予測システムと記す。)に本発明を適用する場合について説明する。   Hereinafter, the present invention will be described with reference to specific examples, but the scope of the present invention is not limited to the contents described below. In the following embodiment, a case where the present invention is applied to a system that receives product defect information from a company or factory and predicts future defects from the defect information in advance (hereinafter referred to as a defect prediction system) will be described. explain.

図4は、本実施例における不具合予測システムの例を示す説明図である。なお、上記実施形態と同様の構成については、図1と同一の符号を付し、説明を省略する。本実施例における不具合予測システムは、クライアントシステム401と、サーバシステム403とを備えている。クライアントシステム401と、サーバシステム403とは、通信ネットワーク402を介して相互に接続される。   FIG. 4 is an explanatory diagram illustrating an example of a failure prediction system according to the present embodiment. In addition, about the structure similar to the said embodiment, the code | symbol same as FIG. 1 is attached | subjected and description is abbreviate | omitted. The defect prediction system in this embodiment includes a client system 401 and a server system 403. The client system 401 and the server system 403 are connected to each other via the communication network 402.

初めに、本実施例の概要を説明する。まず、テレビジョンや冷蔵庫などの家電製品や半導体などの部品製品を製作する各会社で運用されているクライアントシステム、もしくは、製品を製作する各工場で運用されているクライアントシステムから、製品の不具合情報をサーバシステムに送信する。サーバシステムでは、送信された過去の製品の不具合情報(既知の不具合情報)から、現時点で未発生であるが将来発生する不具合を事前に予測して、未発生の不具合が起こるか否かを各クライアントシステムへ送信する。クライアントシステム側では、このように送信された予測情報を使うことで、不具合の発生を未然に防ぐことができるようになる。また、クライアントシステム側では、不具合が起こる前から不具合に備えることができるようになる。   First, the outline of the present embodiment will be described. First, product defect information from client systems operated at each company that manufactures home appliances such as televisions and refrigerators, and parts products such as semiconductors, or from client systems operated at each factory that manufactures products. Is sent to the server system. The server system predicts in advance the defects that have not occurred at the present time but will occur in the future based on the transmitted defect information of the past product (known defect information). Send to client system. On the client system side, by using the prediction information transmitted in this way, it is possible to prevent the occurrence of defects. Also, the client system can be prepared for the trouble before the trouble occurs.

以下、各構成要素について説明する。クライアントシステム401は、製品の故障情報等を管理する。具体的には、クライアントシステム401は、過去に発生した製品の故障情報を記憶し、その故障情報を通信ネットワーク402を介してサーバシステム403に送信する。   Hereinafter, each component will be described. The client system 401 manages product failure information and the like. Specifically, the client system 401 stores product failure information that has occurred in the past, and transmits the failure information to the server system 403 via the communication network 402.

サーバシステム403は、欠損値予測装置101と、予測結果記憶部404とを備えている。サーバシステム403は、クライアントシステム401の情報を管理する。具体的には、サーバシステム403は、クライアントシステム401から製品の故障情報を受信すると、その故障情報をもとに将来発生する不具合を予測して、その予測情報をクライアントシステム401に送信する。   The server system 403 includes a missing value prediction apparatus 101 and a prediction result storage unit 404. The server system 403 manages information of the client system 401. Specifically, when the server system 403 receives product failure information from the client system 401, the server system 403 predicts a future failure based on the failure information and transmits the prediction information to the client system 401.

欠損値予測装置101は、上述の実施形態に記載した欠損値予測装置101と同様である。ここで、欠損値予測装置101は、入力された行列形データから、製品の未発生の不具合箇所の情報を予測する。また、予測結果記憶部404は、欠損値予測装置101が出力した欠損値予測済みの行列形データを記憶する。   The missing value prediction apparatus 101 is the same as the missing value prediction apparatus 101 described in the above embodiment. Here, the missing value predicting apparatus 101 predicts information on a defective part that has not occurred in the product from the input matrix data. In addition, the prediction result storage unit 404 stores the matrix data with missing value prediction output from the missing value prediction apparatus 101.

次に、動作について説明する。図5は、本実施例における動作の例を示すシーケンス図である。   Next, the operation will be described. FIG. 5 is a sequence diagram showing an example of operation in the present embodiment.

まず、各クライアントシステム401が、通信ネットワーク402を介して、サーバシステム403に、各製品の不具合情報を送信する(ステップS501)。図6は、本実施例において各クライアントシステム401から送信される行列形データの例を示す説明図である。図6に例示する行列形データの各軸は、行列形データの因子を表す。行列形データは、縦軸と横軸を持つデータであるため、因子の数は2になる。また、図6に例示する行列形データは、縦軸が「不具合」の内容を表し、横軸が不具合が発生しうる「製品」を表す。   First, each client system 401 transmits defect information of each product to the server system 403 via the communication network 402 (step S501). FIG. 6 is an explanatory diagram illustrating an example of matrix data transmitted from each client system 401 in the present embodiment. Each axis of the matrix data illustrated in FIG. 6 represents a factor of the matrix data. Since matrix data is data having a vertical axis and a horizontal axis, the number of factors is two. In the matrix data illustrated in FIG. 6, the vertical axis represents the content of “failure”, and the horizontal axis represents “product” in which the failure may occur.

また、以下の説明では、行列形データの行列要素が製品の不具合発生件数である場合について説明する。すなわち、図6に例示する行列要素は、製品の不具合件数を示し、空白の行列要素が欠損値(すなわち、不具合未発生)を示す。ただし、行列要素は、不具合件数に限られない。行列要素は、例えば、不具合が発生する確率であってもよく、不具合が発生したか否かを表すバイナリ値であってもよい。なお、行列要素が製品の不具合発生件数の場合、欠損箇所の予測値は、将来起こりうる不具合の件数と言える。   Further, in the following description, a case will be described in which the matrix element of the matrix data is the number of product defects. That is, the matrix elements illustrated in FIG. 6 indicate the number of product defects, and the blank matrix elements indicate missing values (that is, no defects have occurred). However, the matrix element is not limited to the number of defects. The matrix element may be, for example, a probability of occurrence of a failure, or may be a binary value indicating whether or not a failure has occurred. When the matrix element is the number of product defects, the predicted value of the missing part can be said to be the number of defects that may occur in the future.

例えば、各クライアントシステム401は、図6に例示する行列形データをサーバシステム403に送信する。なお、行列形データにおける欠損部分を「(製品、不具合)」という形式で表現する場合、図6に例示する行列データの欠損部分は、(1、D)、(1、E)、(2、D)、(3、E)、(4、A)、(4、C)、(5、E)、(30、A)及び(30、B)である。   For example, each client system 401 transmits the matrix data illustrated in FIG. 6 to the server system 403. Note that when the missing portion in the matrix data is expressed in the form of “(product, defect)”, the missing portions of the matrix data illustrated in FIG. 6 are (1, D), (1, E), (2, D), (3, E), (4, A), (4, C), (5, E), (30, A) and (30, B).

サーバシステム403は、製品の不具合情報を受信すると、その製品の不具合情報を行列形データとして欠損値予測装置101に入力する(ステップS502)。以下、この入力形データをYとする。欠損値予測装置101(より具体的には、図1における近似手段103及び予測手段104)は、入力された行列形データYをもとに欠損値を予測する(ステップS503)。   Upon receiving the product defect information, the server system 403 inputs the product defect information to the missing value prediction apparatus 101 as matrix data (step S502). Hereinafter, this input data is assumed to be Y. The missing value predicting apparatus 101 (more specifically, the approximating means 103 and the predicting means 104 in FIG. 1) predicts missing values based on the input matrix data Y (step S503).

具体的には、上記実施形態に示したように、まず、製品を示す情報ごとに製品の不具合を示す情報の特徴を表す因子行列が定義される。近似手段103は、その因子行列を変換する関数のパラメータのうち、その関数が因子行列を変換したときのデータが入力された行列形データである尤もらしさを最大にするパラメータを推定する。そして、予測手段104が、推定されたパラメータ及び行列形データにおける既知の不具合箇所の情報を用いて、製品の未発生の不具合箇所の情報を予測する。   Specifically, as shown in the above embodiment, first, for each piece of information indicating a product, a factor matrix that represents a feature of information indicating a product defect is defined. The approximating means 103 estimates a parameter that maximizes the likelihood that the data of the function that transforms the factor matrix is the matrix data to which the data when the function transforms the factor matrix is input. Then, the predicting unit 104 predicts information on a defective part that has not occurred in the product using the estimated parameters and information on known defective parts in the matrix data.

その後、欠損値予測装置101(より具体的には、図1における出力手段105)は、予測した値で欠損値を埋めた行列形データ(以下、Y’と記す。)を出力する。具体的には、欠損値予測装置101は、予測結果を予測結果記憶部404に記憶させる(ステップS504)。   Thereafter, the missing value prediction apparatus 101 (more specifically, the output unit 105 in FIG. 1) outputs matrix data (hereinafter referred to as Y ′) in which missing values are filled with predicted values. Specifically, the missing value prediction apparatus 101 stores the prediction result in the prediction result storage unit 404 (step S504).

図7は、本実施例において予測した値で欠損値を埋めた予測結果(すなわち、行列形データY’)の例を示す説明図である。なお、行列形データYにおける欠損部分を「(製品、不具合、予測値)」という形式で表現する場合、図7に例示する行列形データY’の欠損部分は、(1、D、1.01)、(1、E、0.3)、(2、D、2)、(3、E、2.0)、(4、A、0.5)、(4、C、2.5)、(5、E、5)、(30、A、2.0)及び(30、B、2.0)である。   FIG. 7 is an explanatory diagram illustrating an example of a prediction result (that is, matrix data Y ′) in which missing values are filled with values predicted in the present embodiment. When the missing part in the matrix data Y is expressed in the form of “(product, defect, predicted value)”, the missing part of the matrix data Y ′ illustrated in FIG. 7 is (1, D, 1.01). ), (1, E, 0.3), (2, D, 2), (3, E, 2.0), (4, A, 0.5), (4, C, 2.5), (5, E, 5), (30, A, 2.0) and (30, B, 2.0).

次に、欠損値予測装置101(より具体的には、図1における出力手段105)は、予測結果(すなわち、行列形データY’)をクライアントシステム401に送信し(ステップS505)、クライアントシステム401は、その予測結果(すなわち、行列形データY’)を受信する(ステップS506)。   Next, the missing value prediction apparatus 101 (more specifically, the output unit 105 in FIG. 1) transmits a prediction result (that is, matrix data Y ′) to the client system 401 (step S505), and the client system 401. Receives the prediction result (that is, matrix data Y ′) (step S506).

以上のことから、例えば、テレビジョンや冷蔵庫などの家電製品や半導体などの部品製品を製作する各会社や製品を製作する各工場で運用されているクライアントシステム401側では、将来起こるかもしれない不具合の予測情報を使用することで、不具合の発生を未然に防ぐことができる。また、上記各会社や各工場では、不具合発生前から不具合に備えることができる。   From the above, for example, problems that may occur in the future on the client system 401 side operated in each company that manufactures home appliances such as televisions and refrigerators and parts products such as semiconductors, and in each factory that manufactures products. By using the prediction information, it is possible to prevent the occurrence of defects. Moreover, in each said company and each factory, it can prepare for a malfunction before malfunction occurs.

次に、本発明による欠損値予測装置の最小構成の例を説明する。図8は、本発明による欠損値予測装置の最小構成の例を示すブロック図である。本発明による欠損値予測装置81は、2つの因子(例えば、縦軸と横軸の因子)を含む行列形データ(例えば、行列形データY)における一方の因子の因子要素(例えば、縦軸の因子の因子要素)ごとに定義される行列であって、その行列形データにおけるもう一方の因子の各因子要素(例えば、横軸の因子の各因子要素)の特徴を表す行列である因子行列(例えば、因子行列X)を変換する関数(例えば、関数F)のパラメータのうち、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にするパラメータを推定する(例えば、式5を用いて推定する)パラメータ推定手段82と、パラメータ推定手段82が推定したパラメータ(例えば、W、X)及び行列形データにおける既知の行列要素の値を用いて、行列形データにおける行列要素(例えば、式11におけるyij)の欠損値を予測する(例えば、式11により欠損値を予測する)欠損値予測手段83とを備えている。 Next, an example of the minimum configuration of the missing value prediction apparatus according to the present invention will be described. FIG. 8 is a block diagram showing an example of the minimum configuration of the missing value prediction apparatus according to the present invention. The missing value predicting apparatus 81 according to the present invention includes a factor element (for example, vertical axis) of one factor in matrix data (for example, matrix data Y) including two factors (for example, vertical axis and horizontal axis factors). Factor matrix that is defined for each factor element of the other factor in the matrix data (for example, each factor element of the factor on the horizontal axis) For example, among parameters of a function (for example, function F) that transforms the factor matrix X), a parameter that maximizes the likelihood that the data when the function transforms the factor matrix is matrix data is estimated (for example, Parameter estimation means 82 (estimated using Equation 5), parameters estimated by the parameter estimation means 82 (for example, W, X) and values of known matrix elements in the matrix data, Matrix elements in the row form data (e.g., y ij in equation 11) to predict the missing values (e.g., to predict the missing value by Equation 11) and a missing value predicting means 83.

そのような構成により、行列形データにおける欠損値の予測精度を向上できる。具体的には、元の行列形データが関数と因子行列とを用いて表されるため、元の行列形データに対して条件付独立の制約がなくなるため、予測精度が向上させることができる。   With such a configuration, the accuracy of predicting missing values in matrix data can be improved. Specifically, since the original matrix data is expressed using a function and a factor matrix, there is no condition-independent constraint on the original matrix data, so that the prediction accuracy can be improved.

なお、少なくとも以下に示すような欠損値予測装置も、上記に示すいずれかの実施形態に開示されている。   Note that at least a missing value prediction apparatus as described below is also disclosed in any of the embodiments described above.

(1)2つの因子(例えば、縦軸と横軸の因子)を含む行列形データ(例えば、行列形データY)における一方の因子の因子要素(例えば、縦軸の因子の因子要素)ごとに定義される行列であって、その行列形データにおけるもう一方の因子の各因子要素(例えば、横軸の因子の各因子要素)の特徴を表す行列である因子行列(例えば、因子行列X)を変換する関数(例えば、関数F)のパラメータのうち、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にするパラメータを推定する(例えば、式10を用いて推定する)パラメータ推定手段と、パラメータ推定手段が推定したパラメータ(例えば、W、X)及び行列形データにおける既知の行列要素の値を用いて、行列形データにおける行列要素(例えば、式11におけるyij)の欠損値を予測する(例えば、式11により欠損値を予測する)欠損値予測手段とを備えた欠損値予測装置。 (1) For each factor element of one factor (for example, factor element of the vertical axis) in matrix data (for example, matrix data Y) including two factors (for example, vertical and horizontal axes) A factor matrix (for example, factor matrix X) that is a matrix that is defined and that represents the characteristics of each factor element of the other factor (for example, each factor element of the factor on the horizontal axis) in the matrix data Of the parameters of the function to be converted (for example, function F), the parameter that maximizes the likelihood that the data when the function converts the factor matrix is matrix data is estimated (for example, estimated using Equation 10). Parameter estimation means, the parameters estimated by the parameter estimation means (for example, W, X), and the values of known matrix elements in the matrix data, , To predict the missing values of y ij) in the equation 11 (e.g., to predict the missing value by Equation 11) missing values prediction apparatus and a missing value predicting means.

(2)パラメータ推定手段が、ガウス分布の共分散行列(例えば、KWX)を用いて定義された関数の因子行列における確率分布(例えば、式3)に基づいて、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定する欠損値予測装置。 (2) The parameter estimation means converts the factor matrix based on the probability distribution (for example, Equation 3) in the factor matrix of the function defined using the Gaussian distribution covariance matrix (for example, K WX ). A missing value prediction device that estimates the parameters of a function that maximizes the likelihood that the data is matrix data.

(3)パラメータ推定手段が、ガウス分布の共分散行列を共分散を表す2つの行列のクロネッカー積(例えば、推定対象パラメータ)として表現した確率分布(例えば、式4)に基づいて、その関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定する欠損値予測装置。 (3) Based on a probability distribution (for example, Equation 4) in which the parameter estimation means represents a Gaussian distribution covariance matrix as a Kronecker product (for example, an estimation target parameter) of two matrices representing covariance, A missing value prediction apparatus that estimates a parameter of a function that maximizes the likelihood that data obtained by transforming a factor matrix is matrix data.

(4)パラメータ推定手段が、関数の因子行列における確率分布と、関数及び因子行列における行列形データの確率分布とにより決定される周辺尤度の値を最大化する関数のパラメータを推定する欠損値予測装置。 (4) A parameter estimation unit estimates a parameter of a function that maximizes a marginal likelihood value determined by the probability distribution of the function in the factor matrix and the probability distribution of the matrix data in the function and factor matrix. Prediction device.

(5)パラメータ推定手段が、行列形データが2つの因子として製品及びその製品の不具合を示す情報を含む場合に、その行列形データにおける一方の因子である製品を示す情報ごとに定義される行列であって、その行列形データにおけるもう一方の因子であるその製品の不具合を示す情報の特徴を表す因子行列を変換する関数のパラメータうち、その因子行列を変換したときのデータが行列形データである尤もらしさを最大にするパラメータを推定し、欠損値予測手段が、推定されたパラメータ及び行列形データにおける既知の不具合箇所の情報を用いて、製品の未発生の不具合箇所の情報を予測する欠損値予測装置。 (5) When the parameter estimation means includes information indicating a product and a defect of the product as two factors, the matrix defined for each information indicating a product which is one factor in the matrix data Among the parameters of the function that converts the factor matrix that represents the characteristics of the information indicating the malfunction of the product, which is the other factor in the matrix data, the data when the factor matrix is converted is matrix data. A deficiency in which a parameter that maximizes a certain likelihood is estimated, and the missing value predicting means predicts information on a defect location that has not occurred in the product using the estimated parameter and information on a known failure location in the matrix data. Value prediction device.

本発明は、2つの因子を含んだ行列形データにおける未知の行列要素の値を予測する欠損値予測システムに好適に適用される。   The present invention is suitably applied to a missing value prediction system that predicts the value of an unknown matrix element in matrix data including two factors.

101 欠損値予測装置
102 入力手段
103 近似手段
104 予測手段
105 出力手段
401 クライアントシステム
402 通信ネットワーク
403 サーバシステム
404 予測結果記憶部
DESCRIPTION OF SYMBOLS 101 Missing value prediction apparatus 102 Input means 103 Approximation means 104 Prediction means 105 Output means 401 Client system 402 Communication network 403 Server system 404 Prediction result storage part

Claims (9)

2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、当該行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のパラメータのうち、当該関数が因子行列を変換したときのデータが前記行列形データである尤もらしさを最大にするパラメータを推定するパラメータ推定手段と、
前記パラメータ推定手段が推定したパラメータ及び前記行列形データにおける既知の行列要素の値を用いて、前記行列形データにおける行列要素の欠損値を予測する欠損値予測手段とを備えた
ことを特徴とする欠損値予測装置。
Transforms a factor matrix that is defined for each factor element of one factor in matrix data including two factors and that represents the characteristics of each factor element of the other factor in the matrix data Parameter estimation means for estimating a parameter that maximizes the likelihood that the data when the function transforms a factor matrix among the parameters of the function is the matrix data;
And a missing value predicting means for predicting a missing value of a matrix element in the matrix data using the parameter estimated by the parameter estimating means and a value of a known matrix element in the matrix data. Missing value prediction device.
パラメータ推定手段は、ガウス分布の共分散行列を用いて定義された関数の因子行列における確率分布に基づいて、当該関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定する
請求項1記載の欠損値予測装置。
Based on the probability distribution in the factor matrix of the function defined using the Gaussian covariance matrix, the parameter estimation means maximizes the likelihood that the data when the function transforms the factor matrix is matrix data. The missing value prediction apparatus according to claim 1, wherein a parameter of a function to be estimated is estimated.
パラメータ推定手段は、ガウス分布の共分散行列を共分散を表す2つの行列のクロネッカー積として表現した確率分布に基づいて、当該関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定する
請求項2記載の欠損値予測装置。
The parameter estimation means is the likelihood that the data when the function transforms the factor matrix based on the probability distribution that expresses the Gaussian distribution covariance matrix as the Kronecker product of the two matrices representing the covariance. The missing value predicting apparatus according to claim 2, wherein a parameter of a function that maximizes is estimated.
パラメータ推定手段は、関数の因子行列における確率分布と、当該関数及び因子行列における行列形データの確率分布とにより決定される周辺尤度の値を最大化する関数のパラメータを推定する
請求項2または請求項3記載の欠損値予測装置。
The parameter estimation means estimates a parameter of a function that maximizes a marginal likelihood value determined by the probability distribution of the function in the factor matrix and the probability distribution of the matrix data in the function and the factor matrix. The missing value prediction apparatus according to claim 3.
パラメータ推定手段は、行列形データが2つの因子として製品及び当該製品の不具合を示す情報を含む場合に、当該行列形データにおける一方の因子である製品を示す情報ごとに定義される行列であって、当該行列形データにおけるもう一方の因子である当該製品の不具合を示す情報の特徴を表す因子行列を変換する関数のパラメータのうち、当該関数が因子行列を変換したときのデータが前記行列形データである尤もらしさを最大にするパラメータを推定し、
欠損値予測手段は、推定されたパラメータ及び前記行列形データにおける既知の不具合箇所の情報を用いて、前記製品の未発生の不具合箇所の情報を予測する
請求項1から請求項4のうちのいずれか1項に記載の欠損値予測装置。
The parameter estimation means is a matrix defined for each piece of information indicating a product which is one factor in the matrix data when the matrix data includes information indicating a product and a defect of the product as two factors. Among the parameters of the function that converts the factor matrix that represents the characteristic of the information indicating the malfunction of the product that is the other factor in the matrix data, the data when the function converts the factor matrix is the matrix data Estimate the parameters that maximize the likelihood that
The missing value predicting means predicts information on a non-occurring defect location of the product using the estimated parameter and information on a known defect location in the matrix data. The missing value prediction apparatus according to claim 1.
2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、当該行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のパラメータのうち、当該関数が因子行列を変換したときのデータが前記行列形データである尤もらしさを最大にするパラメータを推定し、
推定されたパラメータ及び前記行列形データにおける既知の行列要素の値を用いて、前記行列形データにおける行列要素の欠損値を予測する
ことを特徴とする欠損値予測方法。
Transforms a factor matrix that is defined for each factor element of one factor in matrix data including two factors and that represents the characteristics of each factor element of the other factor in the matrix data Among the parameters of the function, the parameter that maximizes the likelihood that the data when the function transforms the factor matrix is the matrix data is estimated,
A missing value prediction method, wherein a missing value of a matrix element in the matrix data is predicted using an estimated parameter and a value of a known matrix element in the matrix data.
ガウス分布の共分散行列を用いて定義された関数の因子行列における確率分布に基づいて、当該関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定する
請求項6記載の欠損値予測方法。
Based on the probability distribution in the factor matrix of a function defined using a Gaussian distribution covariance matrix, the parameter of the function that maximizes the likelihood that the data when the function transforms the factor matrix is matrix data. The missing value prediction method according to claim 6.
コンピュータに、
2つの因子を含む行列形データにおける一方の因子の因子要素ごとに定義される行列であって、当該行列形データにおけるもう一方の因子の各因子要素の特徴を表す行列である因子行列を変換する関数のパラメータのうち、当該関数が因子行列を変換したときのデータが前記行列形データである尤もらしさを最大にするパラメータを推定するパラメータ推定処理、および、
前記パラメータ推定処理で推定されたパラメータ及び前記行列形データにおける既知の行列要素の値を用いて、前記行列形データにおける行列要素の欠損値を予測する欠損値予測処理
を実行させるための欠損値予測プログラム。
On the computer,
Transforms a factor matrix that is defined for each factor element of one factor in matrix data including two factors and that represents the characteristics of each factor element of the other factor in the matrix data A parameter estimation process for estimating a parameter that maximizes the likelihood that data when the function transforms a factor matrix is the matrix data among the parameters of the function; and
Missing value prediction for executing missing value prediction processing for predicting missing values of matrix elements in the matrix data using the parameters estimated by the parameter estimation processing and the values of known matrix elements in the matrix data program.
コンピュータに、
パラメータ推定処理で、ガウス分布の共分散行列を用いて定義された関数の因子行列における確率分布に基づいて、当該関数が因子行列を変換したときのデータが行列形データである尤もらしさを最大にする関数のパラメータを推定させる
請求項8記載の欠損値予測プログラム。
On the computer,
In the parameter estimation process, based on the probability distribution in the factor matrix of the function defined using the Gaussian distribution covariance matrix, maximize the likelihood that the data when the function transforms the factor matrix is matrix data The missing value prediction program according to claim 8, wherein a parameter of a function to be estimated is estimated.
JP2010015910A 2010-01-27 2010-01-27 Deficit value prediction device, deficit value prediction method, and deficit value prediction program Pending JP2011154554A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010015910A JP2011154554A (en) 2010-01-27 2010-01-27 Deficit value prediction device, deficit value prediction method, and deficit value prediction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010015910A JP2011154554A (en) 2010-01-27 2010-01-27 Deficit value prediction device, deficit value prediction method, and deficit value prediction program

Publications (1)

Publication Number Publication Date
JP2011154554A true JP2011154554A (en) 2011-08-11

Family

ID=44540463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010015910A Pending JP2011154554A (en) 2010-01-27 2010-01-27 Deficit value prediction device, deficit value prediction method, and deficit value prediction program

Country Status (1)

Country Link
JP (1) JP2011154554A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012172812A1 (en) 2011-06-14 2012-12-20 パナソニック株式会社 Communication apparatus
JP2016514321A (en) * 2013-03-13 2016-05-19 セールスフォース ドット コム インコーポレイティッド System, method and apparatus for performing data upload, processing and prediction query API publication
JP2020027547A (en) * 2018-08-16 2020-02-20 日本電信電話株式会社 Tensor data calculation device, tensor data calculation method, and program
US11562275B2 (en) 2019-03-20 2023-01-24 Fujitsu Limited Data complementing method, data complementing apparatus, and non-transitory computer-readable storage medium for storing data complementing program
WO2023084609A1 (en) * 2021-11-09 2023-05-19 日本電信電話株式会社 Behavior model cost estimation device, method, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012172812A1 (en) 2011-06-14 2012-12-20 パナソニック株式会社 Communication apparatus
JP2016514321A (en) * 2013-03-13 2016-05-19 セールスフォース ドット コム インコーポレイティッド System, method and apparatus for performing data upload, processing and prediction query API publication
JP2019057286A (en) * 2013-03-13 2019-04-11 セールスフォース ドット コム インコーポレイティッド Systems, methods and apparatuses for implementing data upload, processing and predictive query api exposure
JP2020027547A (en) * 2018-08-16 2020-02-20 日本電信電話株式会社 Tensor data calculation device, tensor data calculation method, and program
JP7091930B2 (en) 2018-08-16 2022-06-28 日本電信電話株式会社 Tensor data calculator, tensor data calculation method and program
US11562275B2 (en) 2019-03-20 2023-01-24 Fujitsu Limited Data complementing method, data complementing apparatus, and non-transitory computer-readable storage medium for storing data complementing program
WO2023084609A1 (en) * 2021-11-09 2023-05-19 日本電信電話株式会社 Behavior model cost estimation device, method, and program

Similar Documents

Publication Publication Date Title
Sen et al. Think globally, act locally: A deep neural network approach to high-dimensional time series forecasting
CN110555469B (en) Method and device for processing interactive sequence data
Carbonneau et al. Application of machine learning techniques for supply chain demand forecasting
US20180053097A1 (en) Method and system for multi-label prediction
US12124439B2 (en) Digital content query-aware sequential search
CN110543935B (en) Method and device for processing interactive sequence data
Silva et al. A road map for planning-deploying machine vision artifacts in the context of industry 4.0
US12019671B2 (en) Locally constrained self-attentive sequential recommendation
JP2011154554A (en) Deficit value prediction device, deficit value prediction method, and deficit value prediction program
Zhou et al. Learning the ideal observer for SKE detection tasks by use of convolutional neural networks (Cum Laude Poster Award)
US11531927B2 (en) Categorical data transformation and clustering for machine learning using natural language processing
JP2018524660A (en) High-speed orthogonal projection
US11861884B1 (en) Systems and methods for training an information extraction transformer model architecture
KR20160066395A (en) Method for analyzing data based on matrix factorization model and apparatus therefor
Boualem Insensitive bounds for the stationary distribution of a single server retrial queue with server subject to active breakdowns
Li et al. Efficient regional seismic risk assessment via deep generative learning of surrogate models
US11294669B2 (en) Method and computer-program-product determining measures for the development, design and/or deployment of complex embedded or cyber-physical systems, in particular complex software architectures used therein, of different technical domains
US10530387B1 (en) Estimating an optimal ordering for data compression
US20220318683A1 (en) Machine learning model aggregator
US20220318887A1 (en) Machine learning model generation platform
US20240193490A1 (en) Machine learning model generator
US20240086947A1 (en) Intelligent prediction of sales opportunity outcome
JP6158137B2 (en) Disturbance reconstruction system, disturbance device, reconstruction device, disturbance reconstruction method and program
Mo et al. Cross-and Context-Aware Attention Based Spatial-Temporal Graph Convolutional Networks for Human Mobility Prediction
US10838377B1 (en) Comprehensive causal impact estimation system with a selective synthetic control