JP2013152656A - Information processor, information processing method and program for determining explanatory variable - Google Patents
Information processor, information processing method and program for determining explanatory variable Download PDFInfo
- Publication number
- JP2013152656A JP2013152656A JP2012013698A JP2012013698A JP2013152656A JP 2013152656 A JP2013152656 A JP 2013152656A JP 2012013698 A JP2012013698 A JP 2012013698A JP 2012013698 A JP2012013698 A JP 2012013698A JP 2013152656 A JP2013152656 A JP 2013152656A
- Authority
- JP
- Japan
- Prior art keywords
- calculated
- value
- error
- variable
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 abstract description 61
- 230000010365 information processing Effects 0.000 abstract description 21
- 238000011156 evaluation Methods 0.000 description 68
- 238000000034 method Methods 0.000 description 61
- 238000000605 extraction Methods 0.000 description 56
- 238000013500 data storage Methods 0.000 description 45
- 238000010586 diagram Methods 0.000 description 38
- 239000013598 vector Substances 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 8
- 241000209094 Oryza Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 230000002195 synergetic effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 239000002283 diesel fuel Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減する。
【解決手段】本情報処理装置は、複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出する第1算出部と、算出された誤差に基づき、複数の目的変数を複数のグループに分類する分類部と、複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出する第2算出部と、複数のグループの各々について、代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する決定部とを有する。
【選択図】図1An object of the present invention is to reduce the amount of calculation performed when finding explanatory variables to be added to a prediction model.
The information processing apparatus calculates, for each of a plurality of objective variables, an error between an actual value of the objective variable and a value calculated by a first prediction model for predicting the value of the objective variable. A first calculation unit to be calculated, a classification unit for classifying a plurality of objective variables into a plurality of groups based on the calculated error, and an error calculated for the objective variable belonging to the group for each of the plurality of groups A second calculation unit for calculating a representative value of the error and a plurality of second prediction models for predicting the representative value for each of the plurality of groups while changing the explanatory variables. A determining unit that determines an explanatory variable to be added to the first prediction model of the objective variable belonging to the group based on a difference between each of the values calculated by the two prediction models and the representative value.
[Selection] Figure 1
Description
本技術は、予測モデルの構築技術に関する。 The present technology relates to a prediction model construction technology.
時間の経過に従って変化する目的変数の値(例えば株価)を説明変数の値(例えば過去の株価)を利用して予測するための予測モデルを構築する技術がある。 There is a technique for constructing a prediction model for predicting a value (for example, stock price) of an objective variable that changes with the passage of time by using a value (for example, past stock price) of an explanatory variable.
精度が高い予測モデルを構築するためには、予測モデルに説明変数を追加し、より多くの説明変数の値を利用して目的変数の値を予測することが有効であることが知られている。例えば、A運輸の株価について予測モデルを構築する場合、A運輸の過去の株価だけでなくガソリンの過去の価格を利用すると、予測モデルの精度が向上することがある。 It is known that in order to build a prediction model with high accuracy, it is effective to add explanatory variables to the prediction model and predict the value of the objective variable using more explanatory variable values. . For example, when a prediction model is constructed for the stock price of A transportation, the accuracy of the prediction model may be improved by using not only the past stock price of A transportation but also the past price of gasoline.
但し、予測モデルに非常に多くの説明変数を追加して精度を高めようとすると、予測モデルの構築に利用する時系列データ(以下、学習データと呼ぶ)に特化した予測モデルになってしまう。そのため、その予測モデルの精度の検証を他の時系列データを用いて行うと、かえって精度が低下していることがある。このような状態は、機械学習の分野では「オーバーフィッティング」と呼ばれている。 However, if a large number of explanatory variables are added to the prediction model to improve accuracy, the prediction model will be specialized for time-series data (hereinafter referred to as learning data) used to construct the prediction model. . Therefore, if the accuracy of the prediction model is verified using other time series data, the accuracy may be lowered. Such a state is called “overfitting” in the field of machine learning.
予測モデルの精度が最も高くなるような説明変数を選定することは非常に難しい。単純には、説明変数のあらゆる組合せについて予測モデルを構築し、検証を行い、最も精度が高い予測モデルを採用することが考えられる。但し、説明変数の数が多くなると組合せ爆発によって計算量が膨大になるため、現実的ではない。 It is very difficult to select an explanatory variable that gives the highest accuracy of the prediction model. Simply, it is conceivable that a prediction model is constructed and verified for every combination of explanatory variables, and the prediction model with the highest accuracy is adopted. However, if the number of explanatory variables increases, the amount of calculation becomes enormous due to the combined explosion, which is not realistic.
そこで、従来では、有用性が最も高い説明変数を予測モデルに1つ追加する処理及び説明変数を新たに追加することによって不要になった説明変数を除去する処理を繰り返す技術(ステップワイズ変数選択法)が利用されている。説明変数の有用性を表す指標には、例えば、重回帰モデルとしての有意性のためのF値(F value)、AIC(Akaike's Information Criterion)及びBIC(Bayesian Information Criterion)といったものがある。近年では、AIC及びBICといった指標が利用されることが多い。両者は、誤差を二乗した値の総和が最も小さくなるような説明変数を採用するものである。 Therefore, conventionally, a technique of repeating the process of adding one explanatory variable having the highest usefulness to the prediction model and the process of removing an explanatory variable that has become unnecessary by newly adding an explanatory variable (stepwise variable selection method) ) Is used. Examples of indices representing the usefulness of explanatory variables include F value (F value) for significance as a multiple regression model, AIC (Akaike's Information Criterion), and BIC (Bayesian Information Criterion). In recent years, indexes such as AIC and BIC are often used. Both employ an explanatory variable that minimizes the sum of the squared errors.
しかし、上記の技術にも問題がある。この技術では、総合の計算量はおおよそ(1の説明変数について有用さを表す指標を算出するのに要する計算量)×(目的変数の数)×(説明変数の候補の数)となる。そのため、目的変数の数及び説明変数の数が多くなると、計算量が非常に多くなるという問題がある。 However, there is a problem with the above technique. In this technique, the total calculation amount is approximately (calculation amount required to calculate an index representing the usefulness of one explanatory variable) × (number of objective variables) × (number of explanatory variable candidates). Therefore, when the number of objective variables and the number of explanatory variables increase, there is a problem that the amount of calculation becomes very large.
従って、本技術の目的は、一側面では、予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減するための技術を提供することである。 Accordingly, an object of the present technology is, in one aspect, to provide a technique for reducing the amount of calculation performed when finding an explanatory variable to be added to a prediction model.
本技術の一態様に係る情報処理装置は、(A)記憶装置と、(B)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納する第1算出部と、(C)記憶装置に格納されている誤差に基づき複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納する第2算出部と、(D)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第1決定部とを有する。 An information processing apparatus according to an aspect of the present technology includes: (A) a storage device; and (B) a first value for predicting an actual value of an objective variable and a value of the objective variable for each of a plurality of objective variables. And (C) classifying a plurality of objective variables into a plurality of groups based on the error stored in the storage device. For each of the plurality of groups, a second calculation unit that calculates a representative value of the error using an error calculated for the objective variable belonging to the group and stores the representative value in a storage device; and (D) a plurality of groups For each, a plurality of second prediction models for predicting representative values stored in the storage device are generated while changing the explanatory variables, and each of the values calculated by the generated second prediction models Difference from typical value Based, and a first determining unit for determining the explanatory variable to be added to the first prediction model target variable belonging to the group.
予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減できるようになる。 This will reduce the amount of computation to be performed when finding explanatory variables to be added to the prediction model.
図1に、本実施の形態に係る情報処理装置1の機能ブロック図を示す。情報処理装置1は、グルーピング処理部2と、グルーピング結果格納部3と、候補抽出部4と、学習データ格納部5と、候補格納部6と、決定部7と、決定結果格納部8と、出力部9とを含む。
FIG. 1 shows a functional block diagram of the
グルーピング処理部2は、学習データ格納部5に格納されているデータを用いてグルーピング処理を行い、処理結果をグルーピング結果格納部3に格納する。候補抽出部4は、グルーピング結果格納部3に格納されているデータ及び学習データ格納部5に格納されているデータを用いて第1及び第2候補抽出処理を行い、処理結果を候補格納部6に格納する。決定部7は、グルーピング結果格納部3、学習データ格納部5及び候補格納部6に格納されているデータを用いて決定処理を行い、処理結果を決定結果格納部8に格納する。出力部9は、グルーピング結果格納部3に格納されているデータ、候補格納部6に格納されているデータ及び決定結果格納部8に格納されているデータを用いて表示する画面のデータを生成し、表示装置等に表示させる。
The
図2に、グルーピング処理部2の機能ブロック図を示す。グルーピング処理部2は、第1モデル生成部21と、第1モデル格納部22と、第1誤差算出部23と、第1誤差データ格納部24と、グループ生成部25とを含む。
FIG. 2 shows a functional block diagram of the
第1モデル生成部21は、学習データ格納部5に格納されているデータを用いて処理を行い、処理結果を第1モデル格納部22に格納する。第1誤差算出部23は、学習データ格納部5に格納されているデータ及び第1モデル格納部22に格納されているデータを用いて処理を行い、処理結果を第1誤差データ格納部24に格納する。グループ生成部25は、第1誤差データ格納部24に格納されているデータを用いて処理を行い、処理結果をグルーピング結果格納部3に格納する。
The first
図3に、候補抽出部4の機能ブロック図を示す。候補抽出部4は、第2モデル生成部401と、第2モデル格納部402と、第3モデル格納部403と、第2誤差算出部404と、第2誤差データ格納部405と、第3誤差データ格納部406と、第1評価値算出部407と、第1評価値格納部408と、第2評価値格納部409と、抽出部410と、第1抽出結果格納部411と、第2抽出結果格納部412と、第1特定部413とを含む。
FIG. 3 shows a functional block diagram of the
第2モデル生成部401は、グルーピング結果格納部3に格納されているデータ及び学習データ格納部5に格納されているデータを用いて処理を行い、処理結果を第2モデル格納部402及び第3モデル格納部403に格納する。第2誤差算出部404は、第2モデル格納部402に格納されているデータを用いて処理を行い、処理結果を第2誤差データ格納部405に格納する。また、第2誤差算出部404は、第3モデル格納部403に格納されているデータを用いて処理を行い、処理結果を第3誤差データ格納部406に格納する。第1評価値算出部407は、第2誤差データ格納部405に格納されているデータを用いて処理を行い、処理結果を第1評価値格納部408に格納する。また、第1評価値算出部407は、第3誤差データ格納部406に格納されているデータを用いて処理を行い、処理結果を第2評価値格納部409に格納する。抽出部410は、第1評価値格納部408に格納されているデータを用いて処理を行い、処理結果を第1抽出結果格納部411に格納する。また、抽出部410は、第2評価値格納部409に格納されているデータを用いて処理を行い、処理結果を第2抽出結果格納部412に格納する。第1特定部413は、第1抽出結果格納部411に格納されているデータ及び第2抽出結果格納部412に格納されているデータを用いて処理を行い、処理結果を候補格納部6に格納する。
The second
図4に、決定部7の機能ブロック図を示す。決定部7は、第3モデル生成部71と、第4モデル格納部72と、第3誤差算出部73と、第4誤差データ格納部74と、第2評価値算出部75と、第3評価値格納部76と、第2特定部77とを含む。
FIG. 4 shows a functional block diagram of the
第3モデル生成部71は、学習データ格納部5に格納されているデータ及び候補格納部6に格納されているデータを用いて処理を行い、処理結果を第4モデル格納部72に格納する。第3誤差算出部73は、学習データ格納部5に格納されているデータ及び第4モデル格納部72に格納されているデータを用いて処理を行い、処理結果を第4誤差データ格納部74に格納する。第2評価値算出部75は、第4誤差データ格納部74に格納されているデータを用いて処理を行い、処理結果を第3評価値格納部76に格納する。第2特定部77は、第3評価値格納部76に格納されているデータを用いて処理を行い、処理結果を決定結果格納部8に格納する。
The third
図5に、学習データ格納部5に格納されている学習データの一例を示す。図5の例では、7月27日から7月31日までの各日付について、今日の株価と、1日前の株価と、2日前の株価とが格納されている。図5の例は特定の銘柄についての株価のデータセットを示しており、学習データ格納部5には、多数の銘柄についての株価のデータセットが格納されるようになっている。
FIG. 5 shows an example of learning data stored in the learning
なお、本実施の形態においては、特定の銘柄についての「今日」の株価をその銘柄の「1日前」の株価及び「2日前」の株価を用いて予測モデルを構築した場合において、予測モデルの精度を向上させるために追加する説明変数を選定することを想定している。 In the present embodiment, when a prediction model is constructed using the stock price of “today” for a specific stock using the stock price of “1 day ago” and the stock price of “2 days ago” of the stock, It is assumed that explanatory variables to be added are selected in order to improve accuracy.
次に、図6乃至図33を用いて、図1に示した情報処理装置1の動作について説明する。まず、グルーピング処理部2は、グルーピング処理を実施する(図6:ステップS1)。グルーピング処理については、図7乃至図12を用いて説明する。
Next, the operation of the
まず、グルーピング処理の概要について説明する。グルーピング処理においては、処理対象となる複数の銘柄をグループ分けする。グループ分けの基準となるのは、予測モデルによる予測値と実際の値との誤差である。具体的には、図7に示すように、各日付について予測値と実際の値との誤差を算出し、各日付についての誤差を成分とする誤差ベクトルに基づきグループ分けを行う。 First, an outline of the grouping process will be described. In the grouping process, a plurality of brands to be processed are grouped. The standard for grouping is the error between the predicted value by the prediction model and the actual value. Specifically, as shown in FIG. 7, the error between the predicted value and the actual value is calculated for each date, and grouping is performed based on an error vector having the error for each date as a component.
グループ分けは、誤差ベクトルが類似する(すなわち、誤差の変動の傾向が類似している)銘柄が同じグループになるように行う。そして、図8に示すように、同じグループに属する銘柄の誤差ベクトルを用いて代表誤差ベクトルを算出する処理をグループ毎に行う。 The grouping is performed so that brands having similar error vectors (that is, having similar error fluctuation trends) are in the same group. And as shown in FIG. 8, the process which calculates a representative error vector using the error vector of the brand which belongs to the same group is performed for every group.
次に、グルーピング処理の処理フローについて説明する。グルーピング処理部2における第1モデル生成部21は、学習データ格納部5に学習データが格納されている銘柄のうち未処理の銘柄を1つ特定する(図9:ステップS11)。
Next, the processing flow of the grouping process will be described. The first
第1モデル生成部21は、ステップS11において特定された銘柄の学習データを用いて予測モデルを構築し、構築された予測モデルのデータと銘柄名とを第1モデル格納部22に格納する(ステップS13)。ステップS13においては、ステップS11において特定された銘柄の「今日」の株価を「1日前」の株価及び「2日前」の株価を用いて予測するための予測モデル(例えばAR(AutoRegressive)モデル)を構築する。予測モデルを構築する技術は本実施の形態の主要な部分ではないので、詳細な説明を省略する。
The first
図10に、第1モデル格納部22に格納されているデータの一例を示す。図10の例では、銘柄名と、予測モデルのデータとが格納されている。
FIG. 10 shows an example of data stored in the first
そして、第1誤差算出部23は、ステップS13において構築された予測モデルと学習データ格納部5に格納されているデータとを用いて、予測モデルにより算出された値(すなわち予測値)と実際の値との誤差に基づく誤差ベクトルを算出する(ステップS15)。また、第1誤差算出部23は、銘柄名及び算出結果等を第1誤差データ格納部24に格納する。
The first
図11に、第1誤差データ格納部24に格納されているデータの一例を示す。図11の例では、銘柄名と、各日付について株価の実際の値、予測値及び誤差とが格納されている。
FIG. 11 shows an example of data stored in the first error
図9の説明に戻り、第1モデル生成部21は、未処理の銘柄が有るか判断する(ステップS17)。未処理の銘柄が有る場合(ステップS17:Yesルート)、ステップS11の処理に戻る。
Returning to the description of FIG. 9, the first
一方、未処理の銘柄が無い場合(ステップS17:Noルート)、グループ生成部25は、第1誤差データ格納部24に格納されている誤差ベクトルのデータを用いて銘柄をグループ分けし、グループ分けの結果をメインメモリ等の記憶装置に一旦格納する(ステップS19)。ステップS19においては、例えばK平均法を用いてグループ分けを行う。なお、例えばクラスタリング等のグループ分けの技術はよく知られているので、ここでは説明を省略する。
On the other hand, when there is no unprocessed brand (step S17: No route), the
グループ生成部25は、各グループについて代表誤差ベクトルを算出し、各グループに属する銘柄の名前及び代表誤差ベクトルの各成分の値をグルーピング結果格納部3に格納する(ステップS21)。ステップS21においては、例えば、グループに属する銘柄の誤差ベクトルの平均を求めることにより代表誤差ベクトルを算出する。そして元の処理に戻る。
The
図12に、グルーピング結果格納部3に格納されているデータの一例を示す。図12の例では、グループの識別子と、グループに属する銘柄の名前と、各日付についての代表誤差の値とが格納されている。なお、グループの識別子は、各グループに割り当てられた固有の番号である。
FIG. 12 shows an example of data stored in the grouping
以上のようにして、誤差の変動の傾向が類似している銘柄が同じグループになるようにグループ分けを行う。なお、このようにグループ分けを行うのは、ある銘柄の予測モデルに追加することが有効である説明変数は、同じグループに属する他の銘柄の予測モデルに流用できるという考え方に基づいている。 As described above, grouping is performed so that stocks having similar error fluctuation trends are in the same group. This grouping is based on the idea that explanatory variables that are effective to be added to a prediction model for a certain brand can be used for prediction models for other brands belonging to the same group.
図6の説明に戻り、候補抽出部4は、第1候補抽出処理を実施する(ステップS3)。第1候補抽出処理については、図13乃至図18を用いて説明する。
Returning to the description of FIG. 6, the
まず、図13を用いて、第1候補抽出処理の概要について説明する。なお、説明を簡単にするため、代表誤差ベクトルを1次元のベクトルとしている。第1候補抽出処理においては、各グループについて、代表誤差の予測の精度に基づきN(Nは2以上の自然数)個の説明変数の候補を抽出する。すなわち、代表誤差を予測するための予測モデルによる予測値と代表誤差との差の二乗の総和を求めることにより評価値を算出し、算出した評価値が最も小さい候補から順にN個の候補を抽出する。 First, the outline of the first candidate extraction process will be described with reference to FIG. In order to simplify the explanation, the representative error vector is a one-dimensional vector. In the first candidate extraction process, N (N is a natural number of 2 or more) explanatory variable candidates are extracted for each group based on the accuracy of representative error prediction. That is, an evaluation value is calculated by calculating a sum of squares of differences between a prediction value based on a prediction model for predicting a representative error and a representative error, and N candidates are extracted in order from the candidate having the smallest calculated evaluation value. To do.
但し、代表誤差を予測するための予測モデルには、追加する説明変数の候補だけでなく、グループ内の銘柄についてステップS13において生成された予測モデルに含まれる説明変数を利用する。図13の例では、A運輸とB航空が含まれるグループについて、A運輸及びB航空という説明変数の学習データと、追加する説明変数の候補(ガソリン又は米)の学習データとを用いて予測モデルを構築している。このようにするのは、予測モデルに複数の説明変数が含まれていると、説明変数の組合せによっては相乗効果により予測モデルの精度が大きく向上することがあることを考慮しているからである。このようにすることで、例えばA運輸又はB航空という説明変数と一緒に利用されると予測モデルの精度を大きく向上させることができる候補を取りこぼしにくくなる。なお、図13の例では、ガソリンについて算出した評価値は米について算出した評価値よりも小さくなるので、A運輸及びB航空が属するグループに対しては、米よりもガソリンの方が追加する説明変数として好ましいということになる。 However, in the prediction model for predicting the representative error, not only the explanatory variable candidates to be added, but also the explanatory variables included in the prediction model generated in step S13 for the brands in the group are used. In the example of FIG. 13, for a group including A transportation and B air, a prediction model using learning data of explanatory variables A transportation and B air and learning data of candidate explanatory variables (gasoline or rice) to be added. Is building. This is because when the prediction model includes a plurality of explanatory variables, it is considered that the accuracy of the prediction model may be greatly improved due to a synergistic effect depending on the combination of the explanatory variables. . This makes it difficult to miss candidates that can greatly improve the accuracy of the prediction model when used together with explanatory variables such as A transportation or B air. In addition, in the example of FIG. 13, since the evaluation value calculated about gasoline becomes smaller than the evaluation value calculated about rice, the description which gasoline adds to the group to which A transportation and B air belong belongs. It is preferable as a variable.
次に、第1候補抽出処理の処理フローについて説明する。まず、候補抽出部4における第2モデル生成部401は、グルーピング結果格納部3に登録されているグループのうち未処理のグループを1つ特定する(図14:ステップS31)。
Next, the process flow of the first candidate extraction process will be described. First, the second
第2モデル生成部401は、ステップS31において特定されたグループに属する銘柄について、ステップS13において構築された予測モデルで用いられている説明変数を抽出する(ステップS33)。例えば図12におけるグループ1について処理する場合には、A運輸及びB航空という説明変数が抽出される。
The 2nd model production |
第2モデル生成部401は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS35)。また、第2モデル生成部401は、抽出された説明変数の学習データと特定された候補の学習データとを用いて、ステップS31において特定されたグループについて算出された代表誤差の値を予測するための予測モデルを構築する(ステップS37)。そして、第2モデル生成部401は、グループの識別子、追加する説明変数の候補及び構築された予測モデルのデータを第2モデル格納部402に格納する。ステップS37においては、グルーピング結果格納部2に格納されている代表誤差の値を用いて処理を行う。
The second
図15に、第2モデル格納部402に格納されているデータの一例を示す。図15の例では、グループの識別子と、追加する説明変数の候補と、予測モデルのデータとが格納されている。
FIG. 15 shows an example of data stored in the second
そして、第2誤差算出部404は、ステップS37において構築された予測モデルにより算出された値と代表誤差の値との誤差に基づく誤差ベクトルを算出し、グループの識別子、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第2誤差データ格納部405に格納する(ステップS39)。
Then, the second
図16に、第2誤差データ格納部405に格納されているデータの一例を示す。図16の例では、グループの識別子と、追加する説明変数の候補と、各日付について代表誤差、予測値及び誤差とが格納されている。
FIG. 16 shows an example of data stored in the second error
そして、第1評価値算出部407は、ステップS39において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS41)。そして、グループの識別子、追加する説明変数の候補及び評価値を第1評価値格納部408に格納する。
Then, the first evaluation
図17に、第1評価値格納部408に格納されているデータの一例を示す。図17の例では、グループの識別子と、追加する説明変数の候補と、評価値とが格納されている。
FIG. 17 shows an example of data stored in the first evaluation
そして、第2モデル生成部401は、未処理の候補が有るか判断する(ステップS43)。未処理の候補が有る場合には(ステップS43:Yesルート)、次の候補について処理するため、ステップS35の処理に戻る。
Then, the second
一方、未処理の候補が無い場合には(ステップS43:Noルート)、抽出部410は、ステップS31において特定されたグループについて、評価値が小さい順にN個の説明変数の候補を第1評価値格納部408から抽出する(ステップS45)。また、抽出部410は、グループの識別子及び抽出した説明変数の候補を第1抽出結果格納部411に格納する。
On the other hand, if there is no unprocessed candidate (step S43: No route), the
図18に、第1抽出結果格納部411に格納されているデータの一例を示す。図18の例では、グループの識別子と、追加する説明変数の候補とが格納されている。
FIG. 18 shows an example of data stored in the first extraction
そして、第2モデル生成部401は、未処理のグループが有るか判断する(ステップS47)。未処理のグループが有る場合(ステップS47:Yesルート)、次のグループについて処理するため、ステップS31の処理に戻り、未処理のグループが無い場合(ステップS47:Noルート)、元の処理に戻る。
Then, the second
以上のような処理を実施することで、追加先の予測モデルにおいて用いられている説明変数と一緒に用いられると特に精度を向上させることができる説明変数を特定することができるようになる。 By carrying out the processing as described above, it is possible to specify an explanatory variable that can improve the accuracy particularly when used together with the explanatory variable used in the prediction model of the addition destination.
図6の説明に戻り、候補抽出部4は、第2候補抽出処理を実施する(ステップS5)。第2候補抽出処理については、図19乃至図24を用いて説明する。
Returning to the description of FIG. 6, the
まず、図19を用いて、第2候補抽出処理の概要について説明する。なお、説明を簡単にするため、代表誤差ベクトルを1次元のベクトルとしている。第2候補抽出処理においても、第1候補抽出処理と同様、各グループについて代表誤差の予測の精度に基づきN(Nは2以上の自然数)個の説明変数の候補を抽出する。すなわち、代表誤差を予測するための予測モデルによる予測値と代表誤差との差の二乗の総和を求めることにより評価値を算出し、算出した評価値が最も小さい候補から順にN個の候補を抽出する。 First, the outline of the second candidate extraction process will be described with reference to FIG. In order to simplify the explanation, the representative error vector is a one-dimensional vector. In the second candidate extraction process, as in the first candidate extraction process, N (N is a natural number of 2 or more) explanatory variable candidates are extracted for each group based on the accuracy of representative error prediction. That is, an evaluation value is calculated by calculating a sum of squares of differences between a prediction value based on a prediction model for predicting a representative error and a representative error, and N candidates are extracted in order from the candidate having the smallest calculated evaluation value. To do.
但し、第2候補抽出処理においては、代表誤差を予測するための予測モデルには、追加する説明変数の候補だけを利用する。図19の例では、A運輸とB航空が含まれるグループについて、追加する説明変数の候補(ガソリン又は米)の学習データだけを用いて予測モデルを構築している。このようにするのは、複数の説明変数による相乗効果が無いと仮定した場合において予測モデルの精度の向上に有用な候補を特定するためである。図19の例では、ガソリンについて算出した評価値は米について算出した評価値よりも小さくなるので、A運輸及びB航空が属するグループに対しては、米よりもガソリンの方が追加する説明変数の候補として好ましいということになる。なお、普通は説明変数の数を増やした方が予測モデルの精度が良くなるので、第1候補抽出処理において算出した評価値よりも大きな値が算出されることになる。 However, in the second candidate extraction process, only the explanatory variable candidates to be added are used in the prediction model for predicting the representative error. In the example of FIG. 19, for a group including A transportation and B air, a prediction model is constructed using only learning data of candidate explanatory variables (gasoline or rice) to be added. This is to identify candidates that are useful for improving the accuracy of the prediction model when it is assumed that there is no synergistic effect due to a plurality of explanatory variables. In the example of FIG. 19, the evaluation value calculated for gasoline is smaller than the evaluation value calculated for rice, so for the group to which A Transport and B Airlines belong, the explanatory variable added by gasoline rather than rice This is preferable as a candidate. Normally, the accuracy of the prediction model is improved by increasing the number of explanatory variables, and therefore a value larger than the evaluation value calculated in the first candidate extraction process is calculated.
次に、第2候補抽出処理の処理フローについて説明する。まず、候補抽出部4における第2モデル生成部401は、グルーピング結果格納部3に登録されているグループのうち未処理のグループを1つ特定する(図20:ステップS51)。
Next, the process flow of the second candidate extraction process will be described. First, the second
第2モデル生成部401は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS53)。また、第2モデル生成部401は、特定された候補の学習データを用いて、ステップS51において特定されたグループについて算出された代表誤差の値を予測するための予測モデルを構築する(ステップS55)。そして、第2モデル生成部401は、グループの識別子、追加する説明変数の候補及び構築された予測モデルのデータを第3モデル格納部403に格納する。ステップS55においては、グルーピング結果格納部3に格納されている代表誤差の値を用いて処理を行う。
The second
図21に、第3モデル格納部403に格納されているデータの一例を示す。図21の例では、グループの識別子と、追加する説明変数の候補と、予測モデルのデータとが格納されている。
FIG. 21 shows an example of data stored in the third
そして、第2誤差算出部404は、ステップ55において構築された予測モデルにより算出された値と代表誤差の値との誤差に基づく誤差ベクトルを算出する(ステップS57)。そして、第2誤差算出部404は、グループの識別子、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第3誤差データ格納部406に格納する。
Then, the second
図22に、第3誤差データ格納部406に格納されているデータの一例を示す。図22の例では、グループの識別子と、追加する説明変数の候補と、各日付について代表誤差、予測値及び誤差とが格納されている。
FIG. 22 shows an example of data stored in the third error
そして、第1評価値算出部407は、ステップS57において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS59)。そして、グループの識別子、追加する説明変数の候補及び評価値を第2評価値格納部409に格納する。
Then, the first evaluation
図23に、第2評価値格納部409に格納されているデータの一例を示す。図23の例では、グループの識別子と、追加する説明変数の候補と、評価値とが格納されている。
FIG. 23 shows an example of data stored in the second evaluation
そして、第2モデル生成部401は、未処理の候補が有るか判断する(ステップS61)。未処理の候補が有る場合には(ステップS61:Yesルート)、次の候補について処理するため、ステップS53の処理に戻る。
Then, the second
一方、未処理の候補が無い場合には(ステップS61:Noルート)、抽出部410は、ステップS51において特定されたグループについて、評価値が小さい順にN個の説明変数の候補を第2評価値格納部409から抽出する(ステップS63)。また、抽出部410は、グループの識別子及び抽出した説明変数の候補を第2抽出結果格納部412に格納する。
On the other hand, when there is no unprocessed candidate (step S61: No route), the
図24に、第2抽出結果格納部412に格納されているデータの一例を示す。図24の例では、グループの識別子と、追加する説明変数の候補とが格納されている。
FIG. 24 shows an example of data stored in the second extraction
そして、第2モデル生成部401は、未処理のグループが有るか判断する(ステップS65)。未処理のグループが有る場合(ステップS65:Yesルート)、次のグループについて処理するため、ステップS51の処理に戻り、未処理のグループが無い場合(ステップS65:Noルート)、元の処理に戻る。
Then, the second
以上のような処理を実施することで、複数の説明変数による相乗効果が無いと仮定した場合において予測モデルの精度の向上に有用な候補を特定することができるようになる。 By performing the processing as described above, it is possible to identify candidates that are useful for improving the accuracy of the prediction model when it is assumed that there is no synergistic effect due to a plurality of explanatory variables.
図6の説明に戻り、候補抽出部4における第1特定部413は、第1候補抽出処理及び第2候補抽出処理の結果に基づき最終候補をグループ毎に決定し、グループの識別子及び最終候補を候補格納部6に格納する(ステップS7)。具体的には、第1抽出結果格納部411に格納されており且つ第2抽出結果格納部412に格納されている説明変数の候補を最終候補に決定する。
Returning to the description of FIG. 6, the first specifying
図25に、候補格納部6に格納されているデータの一例を示す。図25の例では、グループの識別子と、追加する説明変数の候補とが格納されている。
FIG. 25 shows an example of data stored in the
そして、決定部7は、決定処理を実施する(ステップS9)。決定処理については、図26乃至図31を用いて説明する。
And the
まず、図26を用いて、決定処理の概要について説明する。決定処理においては、各銘柄について、その銘柄が属するグループについての最終候補の各々を実際に予測モデルに追加して評価値を算出し、評価値が表す有用さが高い説明変数を予測モデルに追加する変数に決定する。例えば、グループ1についてはガソリン及び軽油が最終候補となっている場合には、ガソリン及び軽油の各々を実際に予測モデルに追加して評価値を算出し、評価値が最も小さいものを予測モデルに追加する説明変数に決定する。図26の例では、ガソリンについて算出した評価値は軽油について算出した評価値よりも小さいので、A運輸の予測モデルに追加する説明変数はガソリンに決定する。
First, the outline of the determination process will be described with reference to FIG. In the decision process, for each stock, each final candidate for the group to which the stock belongs is actually added to the prediction model to calculate an evaluation value, and an explanatory variable that is highly useful and represented by the evaluation value is added to the prediction model. Decide which variables to use. For example, when gasoline and diesel oil are the final candidates for
次に、決定処理の処理フローについて説明する。まず、決定部7における第3モデル生成部71は、学習データ格納部5に学習データが格納されている銘柄のうち未処理の銘柄を1つ特定する(図27:ステップS71)。また、第3モデル生成部71は、ステップS71において特定された銘柄が属するグループについての最終候補の中から未処理の最終候補を1つ特定する(ステップS73)。ステップS73においては、まずステップS71において特定された銘柄が属するグループをグルーピング結果格納部3から特定し、また特定されたグループに対応する最終候補を候補格納部6から特定し、特定された最終候補の中から未処理の最終候補を特定する。
Next, the processing flow of the determination process will be described. First, the 3rd model production |
そして、第3モデル生成部71は、ステップS71において特定された銘柄の学習データとステップS73において特定された最終候補の学習データとを用いて、特定された銘柄の「今日」の株価を予測するための予測モデルを構築する(ステップS75)。そして、第3モデル生成部71は、銘柄名、追加する説明変数の候補及び構築された予測モデルのデータを第4モデル格納部72に格納する。
Then, the third
図28に、第4モデル格納部72に格納されているデータの一例を示す。図28の例では、銘柄名と、追加する説明変数の候補と、予測モデルのデータとが格納されている。
FIG. 28 shows an example of data stored in the fourth
そして、第3誤差算出部73は、特定された銘柄の株価の実際の値とステップS75において構築された予測モデルにより算出された値との誤差に基づく誤差ベクトルを算出し、銘柄名、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第4誤差データ格納部74に格納する(ステップS77)。
Then, the third
図29に、第4誤差データ格納部74に格納されているデータの一例を示す。図29の例では、銘柄名と、追加する説明変数の候補と、各日付について株価の実際の値、予測値及び誤差とが格納されている。
FIG. 29 shows an example of data stored in the fourth error
そして、第2評価値算出部75は、ステップS77において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出し、銘柄名、追加する説明変数の候補及び評価値を第3評価値格納部76に格納する(ステップS79)。
Then, the second evaluation
図30に、第3評価値格納部76に格納されているデータの一例を示す。図30の例では、銘柄名と、追加する説明変数の候補と、評価値とが格納されている。
FIG. 30 shows an example of data stored in the third evaluation
そして、第3モデル生成部71は、候補格納部6に未処理の候補が有るか判断する(ステップS81)。未処理の候補が有る場合(ステップS81:Yesルート)、次の候補について処理するため、ステップS73の処理に戻る。
Then, the third
一方、未処理の候補が無い場合(ステップS81:Noルート)、第2特定部77は、ステップS71において特定された銘柄の予測モデルに追加する説明変数を第3評価値格納部76に格納されている評価値に基づき決定し、銘柄名に対応付けて追加する説明変数を決定結果格納部8に格納する(ステップS83)。具体的には、評価値が最も小さい説明変数に決定する。
On the other hand, when there is no unprocessed candidate (step S81: No route), the second specifying
図31に、決定結果格納部8に格納されているデータの一例を示す。図31の例では、銘柄名と、予測モデルに追加する説明変数とが格納されている。
FIG. 31 shows an example of data stored in the determination
そして、第3モデル生成部71は、未処理の銘柄が有るか判断する(ステップS85)。未処理の銘柄が有る場合(ステップS85:Yesルート)、次の銘柄について処理するため、ステップS71の処理に戻る。一方、未処理の銘柄が無い場合(ステップS85:Noルート)、元の処理に戻る。
And the 3rd model production |
以上のような処理を実施することにより、各銘柄について最適な説明変数を特定することができるようになる。 By carrying out the processing as described above, it is possible to specify the optimum explanatory variable for each brand.
図6の説明に戻り、出力部9は、グルーピング結果格納部3に格納されているデータ、候補格納部6に格納されているデータ及び決定結果格納部8に格納されているデータを用いて決定結果を表示するための画面のデータを生成する。そして、生成した画面のデータを表示装置に表示させる(ステップS10)。そして処理を終了する。
Returning to the description of FIG. 6, the output unit 9 determines using the data stored in the grouping
図32に、表示される画面の一例を示す。図32の例では、各グループについて、そのグループに属する銘柄の予測モデルに追加する説明変数と、そのグループに属する銘柄の予測モデルに追加する説明変数の候補と、そのグループについて算出した代表誤差ベクトルとが表示されている。 FIG. 32 shows an example of the displayed screen. In the example of FIG. 32, for each group, explanatory variables to be added to the prediction model of the brand belonging to the group, candidates for explanatory variables to be added to the prediction model of the brand belonging to the group, and the representative error vector calculated for the group And are displayed.
以上のように、予測モデルに追加する説明変数を銘柄毎に決定するのではなく、グループ毎に決定することで、予測モデルに追加する説明変数を決定する際に行う計算の量を減らすことができるようになる。 As described above, instead of determining the explanatory variables to be added to the prediction model for each brand, it is possible to reduce the amount of calculation when determining the explanatory variables to be added to the prediction model by determining for each group. become able to.
ここで、予測モデルに追加する説明変数を銘柄毎に決定する場合の処理について、図33を用いて簡単に説明する。まず情報処理装置1における処理部(図示せず)が未処理の銘柄を1つ特定する(図33:ステップS101)。処理部は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS103)。処理部は、特定された銘柄の学習データと特定された候補の学習データとを用いて予測モデルを構築する(ステップS105)。処理部は、構築された予測モデルによる予測値と実際の値とを用いて誤差ベクトルを算出する(ステップS107)。処理部は、誤差ベクトルの各成分の値を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS109)。そして、未処理の候補が有る場合(ステップS111:Yesルート)はステップS103の処理に戻り、未処理の候補が無い場合(ステップS111:Noルート)は評価値が表す有用さが最も高い説明変数を特定する(ステップS113)。そして、未処理の銘柄が有る場合(ステップS115:Yesルート)はステップS101の処理に戻り、未処理の銘柄が無い場合(ステップS115:Noルート)は処理を終了する。
Here, the process in the case where the explanatory variable added to the prediction model is determined for each brand will be briefly described with reference to FIG. First, a processing unit (not shown) in the
背景技術の欄において述べたように、このようにすると、総合の計算量はおおよそ(1の説明変数について評価値を算出するのに要する計算量)×(目的変数の数(すなわち銘柄の数))×(説明変数の候補の数)となる。そのため、目的変数の数及び説明変数の数が多くなると、計算量が非常に多くなるという問題がある。 As described in the Background Art section, in this way, the total amount of calculation is approximately (the amount of calculation required to calculate the evaluation value for one explanatory variable) × (the number of objective variables (that is, the number of issues). ) × (number of candidates for explanatory variables). Therefore, when the number of objective variables and the number of explanatory variables increase, there is a problem that the amount of calculation becomes very large.
一方、上で述べたような本実施の形態の処理によれば、総合の計算量はおおよそ(グルーピング処理に要する計算量)+(1の説明変数について評価値を算出するのに要する計算量)×(グループの数)×(説明変数の候補の数)+(1の説明変数について評価値を算出するのに要する計算量)×(グループの数)×(グループに含まれる銘柄(目的変数)の数)×(説明変数の最終候補の数)となる。これにより、計算量を削減することができるようになる。 On the other hand, according to the processing of the present embodiment as described above, the total calculation amount is approximately (calculation amount required for grouping processing) + (calculation amount required to calculate an evaluation value for one explanatory variable). X (number of groups) x (number of explanatory variable candidates) + (calculation amount required to calculate an evaluation value for one explanatory variable) x (number of groups) x (stocks included in group (objective variable)) Number) × (number of final candidates for explanatory variables). As a result, the amount of calculation can be reduced.
以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上で説明した情報処理装置1の機能ブロック構成は必ずしも実際のプログラムモジュール構成に対応するものではない。
Although one embodiment of the present technology has been described above, the present technology is not limited to this. For example, the functional block configuration of the
また、上で説明した各テーブルの構成は一例であって、必ずしも上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。 Further, the configuration of each table described above is an example, and the configuration as described above is not necessarily required. Further, in the processing flow, the processing order can be changed if the processing result does not change. Further, it may be executed in parallel.
なお、時系列データとして株価のデータを使用したが、使用するデータは株価のデータに限られるわけではなく、他の時系列データに対しても本実施の形態を適用することができる。 Although stock price data is used as time series data, the data used is not limited to stock price data, and the present embodiment can be applied to other time series data.
なお、使用するデータは時系列データ以外のデータであってもよい。すなわち、目的変数及び説明変数に時間が対応付けられていなくてもよい。 The data to be used may be data other than time series data. That is, the time does not have to be associated with the objective variable and the explanatory variable.
また、ステップS7においては、第1抽出結果格納部411に格納されており且つ第2抽出結果格納部412に格納されている説明変数の候補を最終候補としたが、他の方法で最終候補を決定してもよい。例えば、第1候補抽出処理において算出された評価値と第2候補抽出処理において算出された評価値との和が小さいものから順に所定個数の説明変数を最終候補としてもよい。
Further, in step S7, the explanatory variable candidates stored in the first extraction
また、情報処理装置1の処理を複数の台のコンピュータで実行させるようにしてもよい。
Further, the processing of the
なお、上で述べた情報処理装置1は、コンピュータ装置であって、図34に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
The
以上述べた本技術の実施の形態をまとめると、以下のようになる。 The embodiments of the present technology described above are summarized as follows.
本実施の形態に係る情報処理装置は、 The information processing apparatus according to this embodiment is
(A)記憶装置と、(B)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納する第1算出部と、(C)記憶装置に格納されている誤差に基づき複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納する第2算出部と、(D)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第1決定部とを有する。 For each of (A) a storage device and (B) a plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated. A first calculation unit that calculates and stores in the storage device; and (C) classifies the plurality of objective variables into a plurality of groups based on the error stored in the storage device, and assigns each of the plurality of groups to the group. A second calculation unit that calculates a representative value of the error using the error calculated for the target variable to which the variable belongs, and stores it in the storage device; and (D) a representative value stored in the storage device for each of the plurality of groups. A plurality of second prediction models for predicting the value are generated while changing the explanatory variables, and belong to the group based on the difference between each of the values calculated by the plurality of generated second prediction models and the representative value Purpose change And a first determining unit for determining the explanatory variable to be added to the first predictive model.
このように、第1の予測モデルに追加する説明変数を目的変数毎に決定するのではなく、グループ毎に決定することで、第1の予測モデルに追加する説明変数を決定する際に行う計算の量を削減することができるようになる。 In this way, the calculation performed when determining the explanatory variable to be added to the first prediction model by determining the explanatory variable to be added to the first prediction model by determining for each group instead of determining the explanatory variable to be added to the first prediction model. The amount of can be reduced.
また、上で述べた第1決定部が、(d1)複数の説明変数の候補の各々について、当該候補とグループに属する目的変数の第1の予測モデルに含まれる説明変数とを用いて第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と代表値との第1の差を算出し、記憶装置に格納する第3算出部と、(d2)第3算出部により算出された第1の差に基づき、複数の説明変数の候補の中から、グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第2決定部とを有するようにしてもよい。複数の説明変数が同じ予測モデルに含まれると、相乗効果により予測精度が大きく向上することがある。そのため、上で述べたようにすれば、第1の予測モデルに含まれる説明変数と一緒に利用すると予測精度が大きく向上する説明変数を取りこぼしにくくなる。 Further, the first determination unit described above uses (d1) a second for each of the plurality of explanatory variable candidates by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group. A third calculation unit that generates a first difference between the value calculated by the second prediction model and the representative value and stores the first difference in the storage device; and (d2) the third calculation unit. Based on the calculated first difference, a second determining unit that determines an explanatory variable to be added to the first prediction model of the target variable belonging to the group from among a plurality of explanatory variable candidates. Good. When multiple explanatory variables are included in the same prediction model, the prediction accuracy may be greatly improved due to a synergistic effect. Therefore, as described above, it is difficult to miss an explanatory variable whose prediction accuracy is greatly improved when it is used together with the explanatory variable included in the first prediction model.
また、上で述べた第3算出部が、(d11)複数の説明変数の候補の各々について、当該候補を用いて第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と代表値との第2の差を算出し、記憶装置に格納するようにしてもよい。そして、(E)第3算出部により算出された第1の差及び第2の差に基づき、複数の説明変数の候補の中から、グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第3決定部をさらに有するようにしてもよい。このようにすれば、第1の予測モデルに含まれる説明変数との相乗効果が無いと仮定した場合に予測精度の向上に有効な説明変数を取りこぼしにくくなる。 Further, the third calculation unit described above (d11) generates a second prediction model for each of a plurality of explanatory variable candidates using the candidate, and the value calculated by the second prediction model The second difference between the value and the representative value may be calculated and stored in the storage device. (E) Explanation to be added to the first prediction model of the objective variable belonging to the group from among a plurality of candidate explanatory variables based on the first difference and the second difference calculated by the third calculation unit. You may make it further have the 3rd determination part which determines a variable. In this way, when it is assumed that there is no synergistic effect with the explanatory variable included in the first prediction model, it is difficult to miss the explanatory variable effective for improving the prediction accuracy.
また、上で述べた第1決定部が、(d3)第1の予測モデルに追加する説明変数を複数決定するようにしてもよい。そして、上で述べた本情報処理装置が、(F)複数の目的変数の各々について、当該目的変数の第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、記憶装置に格納する第4算出部と、(G)複数の目的変数の各々について、第4算出部により算出された誤差に基づき、第1決定部によって決定された複数の説明変数の中から、第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部とをさらに有するようにしてもよい。このようにすれば、各目的変数の予測精度の向上に最も有効な説明変数を特定することができるようになる。 In addition, the first determination unit described above may determine (d3) a plurality of explanatory variables to be added to the first prediction model. Then, the information processing apparatus described above performs (F) for each of the plurality of objective variables, the first determination unit determines the explanatory variable included in the first prediction model of the objective variable and the group to which the objective variable belongs. A plurality of third prediction models for predicting the value of the target variable are generated using each of the determined explanatory variables, and each of the values calculated by the third prediction model and the target A fourth calculation unit that calculates an error from the actual value of the variable and stores the error in the storage device; and (G) a first determination unit based on the error calculated by the fourth calculation unit for each of the plurality of target variables. And a fourth determination unit that determines the most appropriate explanatory variable to be added to the first prediction model from among the plurality of explanatory variables determined by the above. In this way, the most effective explanatory variable for improving the prediction accuracy of each objective variable can be identified.
また、上で述べた第2算出部が、(c1)複数の目的変数を、算出された誤差に基づくクラスタリングによって複数のグループに分類するようにしてもよい。例えばK平均法を利用することで複数の目的変数を適切に分類をすることができるようになる。 The second calculation unit described above may classify (c1) a plurality of objective variables into a plurality of groups by clustering based on the calculated error. For example, a plurality of objective variables can be appropriately classified by using the K average method.
また、上で述べた誤差の代表値が、グループに属する目的変数について算出された誤差の平均値であってもよい。これにより妥当な値を代表値とすることができるようになる。なお、平均値には限られず、例えば中央値などとしてもよい。 Further, the representative value of the error described above may be an average value of errors calculated for the objective variable belonging to the group. As a result, an appropriate value can be used as the representative value. In addition, it is not restricted to an average value, For example, it is good also as a median value.
本実施の形態に係る情報処理方法は、(H)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、(I)記憶装置に格納されている誤差に基づき、複数の目的変数を複数のグループに分類し、(J)複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納し、(K)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する処理を含む。 In the information processing method according to the present embodiment, (H) for each of a plurality of objective variables, the value calculated by the first prediction model for predicting the actual value of the objective variable and the value of the objective variable And (I) classifying a plurality of objective variables into a plurality of groups based on the error stored in the storage device, and (J) for each of the plurality of groups A representative value of the error is calculated using the error calculated for the objective variable belonging to the group, stored in the storage device, and (K) a representative value stored in the storage device is predicted for each of the plurality of groups. A plurality of second prediction models for the target variable belonging to the group are generated based on a difference between each of the values calculated by the plurality of generated second prediction models and the representative value. First Including a process of determining the explanatory variable to be added to the prediction model.
なお、上記方法による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。 A program for causing a computer to perform the processing according to the above method can be created. The program can be a computer-readable storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, a hard disk, or the like. It is stored in a storage device. The intermediate processing result is temporarily stored in a storage device such as a main memory.
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。 The following supplementary notes are further disclosed with respect to the embodiments including the above examples.
(付記1)
記憶装置と、
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、前記記憶装置に格納する第1算出部と、
前記記憶装置に格納されている前記誤差に基づき前記複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納する第2算出部と、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第1決定部と、
を有する情報処理装置。
(Appendix 1)
A storage device;
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device. 1 calculation unit;
The plurality of objective variables are classified into a plurality of groups based on the errors stored in the storage device, and for each of the plurality of groups, the error calculated using the errors calculated for the objective variables belonging to the group. A second calculating unit that calculates a representative value and stores the representative value in the storage device;
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. A first determination unit that determines an explanatory variable to be added to the first prediction model of an objective variable belonging to the group based on a difference between each of the calculated values and the representative value;
An information processing apparatus.
(付記2)
前記第1決定部が、
複数の説明変数の候補の各々について、当該候補と前記グループに属する目的変数の前記第1の予測モデルに含まれる説明変数とを用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第1の差を算出し、前記記憶装置に格納する第3算出部と、
前記第3算出部により算出された前記第1の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第2決定部と、
を有する付記1記載の情報処理装置。
(Appendix 2)
The first determination unit is
For each of a plurality of explanatory variable candidates, the second prediction model is generated by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group, and the second prediction Calculating a first difference between the value calculated by the model and the representative value, and storing the first difference in the storage device;
Determining an explanatory variable to be added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates based on the first difference calculated by the third calculating unit; 2 decision part;
The information processing apparatus according to
(付記3)
前記第3算出部が、
前記複数の説明変数の候補の各々について、当該候補を用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第2の差を算出し、前記記憶装置に格納し、
前記第3算出部により算出された前記第1の差及び前記第2の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第3決定部
をさらに有する付記2記載の情報処理装置。
(Appendix 3)
The third calculation unit is
For each of the plurality of explanatory variable candidates, the second prediction model is generated using the candidate, and a second difference between the value calculated by the second prediction model and the representative value is calculated. , Store in the storage device,
Based on the first difference and the second difference calculated by the third calculation unit, the candidate is added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates. The information processing apparatus according to
(付記4)
前記第1決定部が、
前記第1の予測モデルに追加する説明変数を複数決定し、
前記複数の目的変数の各々について、当該目的変数の前記第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて前記第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、前記記憶装置に格納する第4算出部と、
前記複数の目的変数の各々について、前記第4算出部により算出された前記誤差に基づき、前記第1決定部によって決定された複数の説明変数の中から、前記第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部と、
をさらに有する付記1乃至3のいずれか1つ記載の情報処理装置。
(Appendix 4)
The first determination unit is
Determining a plurality of explanatory variables to be added to the first prediction model;
For each of the plurality of objective variables, an explanatory variable included in the first prediction model of the objective variable and each of the plurality of explanatory variables determined by the first determination unit for the group to which the objective variable belongs are used. A plurality of third prediction models for predicting the value of the target variable, and calculating an error between each of the values calculated by the third prediction model and the actual value of the target variable, A fourth calculation unit stored in the storage device;
For each of the plurality of objective variables, most of the plurality of explanatory variables determined by the first determination unit based on the error calculated by the fourth calculation unit is added to the first prediction model. A fourth determination unit for determining an appropriate explanatory variable;
The information processing apparatus according to any one of
(付記5)
前記第2算出部が、
前記複数の目的変数を、算出された前記誤差に基づくクラスタリングによって複数のグループに分類する
付記1乃至4のいずれか1つ記載の情報処理装置。
(Appendix 5)
The second calculation unit is
The information processing apparatus according to any one of
(付記6)
前記誤差の代表値が、前記グループに属する目的変数について算出された前記誤差の平均値である
付記1乃至5いずれか1つ記載の情報処理装置。
(Appendix 6)
The information processing apparatus according to any one of
(付記7)
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータが実行する情報処理方法。
(Appendix 7)
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
An information processing method in which processing is executed by a computer.
(付記8)
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータに実行させるためのプログラム。
(Appendix 8)
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
A program that causes a computer to execute processing.
1 情報処理装置 2 グルーピング処理部
3 グルーピング結果格納部 4 候補抽出部
5 学習データ格納部 6 候補格納部
7 決定部 8 決定結果格納部
9 出力部
21 第1モデル生成部 22 第1モデル格納部
23 第1誤差算出部 24 第1誤差データ格納部
25 グループ生成部 401 第2モデル生成部
402 第2モデル格納部 403 第3モデル格納部
404 第2誤差算出部 405 第2誤差データ格納部
406 第3誤差データ格納部 407 第1評価値算出部
408 第1評価値格納部 409 第2評価値格納部
410 抽出部 411 第1抽出結果格納部
412 第2抽出結果格納部 413 第1特定部
71 第3モデル生成部 72 第4モデル格納部
73 第3誤差算出部 74 第4誤差データ格納部
75 第2評価値算出部 76 第3評価値格納部
77 第2特定部
DESCRIPTION OF
Claims (6)
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、前記記憶装置に格納する第1算出部と、
前記記憶装置に格納されている前記誤差に基づき前記複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納する第2算出部と、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第1決定部と、
を有する情報処理装置。 A storage device;
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device. 1 calculation unit;
The plurality of objective variables are classified into a plurality of groups based on the errors stored in the storage device, and for each of the plurality of groups, the error calculated using the errors calculated for the objective variables belonging to the group. A second calculating unit that calculates a representative value and stores the representative value in the storage device;
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. A first determination unit that determines an explanatory variable to be added to the first prediction model of an objective variable belonging to the group based on a difference between each of the calculated values and the representative value;
An information processing apparatus.
複数の説明変数の候補の各々について、当該候補と前記グループに属する目的変数の前記第1の予測モデルに含まれる説明変数とを用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第1の差を算出し、前記記憶装置に格納する第3算出部と、
前記第3算出部により算出された前記第1の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第2決定部と、
を有する請求項1記載の情報処理装置。 The first determination unit is
For each of a plurality of explanatory variable candidates, the second prediction model is generated by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group, and the second prediction Calculating a first difference between the value calculated by the model and the representative value, and storing the first difference in the storage device;
Determining an explanatory variable to be added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates based on the first difference calculated by the third calculating unit; 2 decision part;
The information processing apparatus according to claim 1.
前記複数の説明変数の候補の各々について、当該候補を用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第2の差を算出し、前記記憶装置に格納し、
前記第3算出部により算出された前記第1の差及び前記第2の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第3決定部
をさらに有する請求項2記載の情報処理装置。 The third calculation unit is
For each of the plurality of explanatory variable candidates, the second prediction model is generated using the candidate, and a second difference between the value calculated by the second prediction model and the representative value is calculated. , Store in the storage device,
Based on the first difference and the second difference calculated by the third calculation unit, the candidate is added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates. The information processing apparatus according to claim 2, further comprising a third determination unit that determines an explanatory variable.
前記第1の予測モデルに追加する説明変数を複数決定し、
前記複数の目的変数の各々について、当該目的変数の前記第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて前記第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、前記記憶装置に格納する第4算出部と、
前記複数の目的変数の各々について、前記第4算出部により算出された前記誤差に基づき、前記第1決定部によって決定された複数の説明変数の中から、前記第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部と、
をさらに有する請求項1乃至3のいずれか1つ記載の情報処理装置。 The first determination unit is
Determining a plurality of explanatory variables to be added to the first prediction model;
For each of the plurality of objective variables, an explanatory variable included in the first prediction model of the objective variable and each of the plurality of explanatory variables determined by the first determination unit for the group to which the objective variable belongs are used. A plurality of third prediction models for predicting the value of the target variable, and calculating an error between each of the values calculated by the third prediction model and the actual value of the target variable, A fourth calculation unit stored in the storage device;
For each of the plurality of objective variables, most of the plurality of explanatory variables determined by the first determination unit based on the error calculated by the fourth calculation unit is added to the first prediction model. A fourth determination unit for determining an appropriate explanatory variable;
The information processing apparatus according to any one of claims 1 to 3, further comprising:
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータが実行する情報処理方法。 For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
An information processing method in which processing is executed by a computer.
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータに実行させるためのプログラム。 For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
A program that causes a computer to execute processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012013698A JP5794160B2 (en) | 2012-01-26 | 2012-01-26 | Information processing apparatus, information processing method, and program for determining explanatory variables |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012013698A JP5794160B2 (en) | 2012-01-26 | 2012-01-26 | Information processing apparatus, information processing method, and program for determining explanatory variables |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013152656A true JP2013152656A (en) | 2013-08-08 |
JP5794160B2 JP5794160B2 (en) | 2015-10-14 |
Family
ID=49048935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012013698A Expired - Fee Related JP5794160B2 (en) | 2012-01-26 | 2012-01-26 | Information processing apparatus, information processing method, and program for determining explanatory variables |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5794160B2 (en) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016057118A (en) * | 2014-09-08 | 2016-04-21 | 株式会社ペコIpmパイロット | Evaluation method for agricultural chemicals |
WO2016121328A1 (en) * | 2015-01-28 | 2016-08-04 | 日本電気株式会社 | Prediction result display system, prediction result display method and prediction result display program |
JP6130977B1 (en) * | 2016-05-24 | 2017-05-17 | 三井情報株式会社 | Information processing apparatus, information processing method, information processing system, and program |
US9740545B2 (en) | 2015-03-20 | 2017-08-22 | Kabushiki Kaisha Toshiba | Equipment evaluation device, equipment evaluation method and non-transitory computer readable medium |
WO2017212880A1 (en) * | 2016-06-09 | 2017-12-14 | 株式会社日立製作所 | Data prediction system and data prediction method |
JP2017224268A (en) * | 2016-06-09 | 2017-12-21 | 株式会社日立製作所 | Data prediction system and data prediction method |
WO2018079225A1 (en) * | 2016-10-31 | 2018-05-03 | 日本電気株式会社 | Automatic prediction system, automatic prediction method and automatic prediction program |
WO2018186090A1 (en) | 2017-04-06 | 2018-10-11 | テンソル・コンサルティング株式会社 | Model variable candidate generation device and method |
JP2018538587A (en) * | 2016-02-01 | 2018-12-27 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | Risk assessment method and system |
JP2019090826A (en) * | 2019-02-04 | 2019-06-13 | 株式会社ペコIpmパイロット | Evaluation method for agricultural chemicals |
US10373068B2 (en) | 2014-11-10 | 2019-08-06 | International Business Machines Corporation | Weight adjusted composite model for forecasting in anomalous environments |
JP2020181494A (en) * | 2019-04-26 | 2020-11-05 | Necソリューションイノベータ株式会社 | Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program, and recording medium |
US10885011B2 (en) | 2015-11-25 | 2021-01-05 | Dotdata, Inc. | Information processing system, descriptor creation method, and descriptor creation program |
US11514062B2 (en) | 2017-10-05 | 2022-11-29 | Dotdata, Inc. | Feature value generation device, feature value generation method, and feature value generation program |
US11727203B2 (en) | 2017-03-30 | 2023-08-15 | Dotdata, Inc. | Information processing system, feature description method and feature description program |
WO2024257351A1 (en) * | 2023-06-16 | 2024-12-19 | 富士通株式会社 | Estimation program, information processing device, and estimation method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09167152A (en) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | Interactive model creation method |
WO2003085548A1 (en) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Apparatus and method for analyzing data |
US20060100836A1 (en) * | 2004-11-09 | 2006-05-11 | Amardeep Singh | Performance forecasting and bit selection tool for drill bits |
-
2012
- 2012-01-26 JP JP2012013698A patent/JP5794160B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09167152A (en) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | Interactive model creation method |
WO2003085548A1 (en) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Apparatus and method for analyzing data |
US20060100836A1 (en) * | 2004-11-09 | 2006-05-11 | Amardeep Singh | Performance forecasting and bit selection tool for drill bits |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016057118A (en) * | 2014-09-08 | 2016-04-21 | 株式会社ペコIpmパイロット | Evaluation method for agricultural chemicals |
US10373068B2 (en) | 2014-11-10 | 2019-08-06 | International Business Machines Corporation | Weight adjusted composite model for forecasting in anomalous environments |
WO2016121328A1 (en) * | 2015-01-28 | 2016-08-04 | 日本電気株式会社 | Prediction result display system, prediction result display method and prediction result display program |
US10949755B2 (en) | 2015-01-28 | 2021-03-16 | Nec Corporation | Prediction result display system, prediction result display method, and prediction result display program |
US9740545B2 (en) | 2015-03-20 | 2017-08-22 | Kabushiki Kaisha Toshiba | Equipment evaluation device, equipment evaluation method and non-transitory computer readable medium |
US10885011B2 (en) | 2015-11-25 | 2021-01-05 | Dotdata, Inc. | Information processing system, descriptor creation method, and descriptor creation program |
JP2018538587A (en) * | 2016-02-01 | 2018-12-27 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | Risk assessment method and system |
JP6130977B1 (en) * | 2016-05-24 | 2017-05-17 | 三井情報株式会社 | Information processing apparatus, information processing method, information processing system, and program |
JP2017224268A (en) * | 2016-06-09 | 2017-12-21 | 株式会社日立製作所 | Data prediction system and data prediction method |
WO2017212880A1 (en) * | 2016-06-09 | 2017-12-14 | 株式会社日立製作所 | Data prediction system and data prediction method |
US11593690B2 (en) | 2016-06-09 | 2023-02-28 | Hitachi, Ltd. | Data prediction system and data prediction method |
JP7069029B2 (en) | 2016-10-31 | 2022-05-17 | ドットデータ インコーポレイテッド | Automatic prediction system, automatic prediction method and automatic prediction program |
WO2018079225A1 (en) * | 2016-10-31 | 2018-05-03 | 日本電気株式会社 | Automatic prediction system, automatic prediction method and automatic prediction program |
JPWO2018079225A1 (en) * | 2016-10-31 | 2019-09-12 | 日本電気株式会社 | Automatic prediction system, automatic prediction method, and automatic prediction program |
US11727203B2 (en) | 2017-03-30 | 2023-08-15 | Dotdata, Inc. | Information processing system, feature description method and feature description program |
US11562262B2 (en) | 2017-04-06 | 2023-01-24 | Tensor Consulting Co. Ltd. | Model variable candidate generation device and method |
WO2018186090A1 (en) | 2017-04-06 | 2018-10-11 | テンソル・コンサルティング株式会社 | Model variable candidate generation device and method |
US11514062B2 (en) | 2017-10-05 | 2022-11-29 | Dotdata, Inc. | Feature value generation device, feature value generation method, and feature value generation program |
JP2019090826A (en) * | 2019-02-04 | 2019-06-13 | 株式会社ペコIpmパイロット | Evaluation method for agricultural chemicals |
JP2020181494A (en) * | 2019-04-26 | 2020-11-05 | Necソリューションイノベータ株式会社 | Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program, and recording medium |
JP7464240B2 (en) | 2019-04-26 | 2024-04-09 | Necソリューションイノベータ株式会社 | Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program and recording medium |
WO2024257351A1 (en) * | 2023-06-16 | 2024-12-19 | 富士通株式会社 | Estimation program, information processing device, and estimation method |
Also Published As
Publication number | Publication date |
---|---|
JP5794160B2 (en) | 2015-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5794160B2 (en) | Information processing apparatus, information processing method, and program for determining explanatory variables | |
Idris et al. | Intelligent churn prediction for telecom using GP-AdaBoost learning and PSO undersampling | |
JP5144830B2 (en) | Pipeline optimizer system | |
CN113326377B (en) | Name disambiguation method and system based on enterprise association relationship | |
CN109657805A (en) | Hyper parameter determines method, apparatus, electronic equipment and computer-readable medium | |
JP2021518024A (en) | How to generate data for machine learning algorithms, systems | |
CN112270546A (en) | Risk prediction method and device based on stacking algorithm and electronic equipment | |
KR20200115708A (en) | Method for Price Prediction of Resource Based on Deep Learning | |
JPWO2016151618A1 (en) | Prediction model update system, prediction model update method, and prediction model update program | |
CN103838857B (en) | Automatic service combination system and method based on semantics | |
CN105447038A (en) | Method and system for acquiring user characteristics | |
JP2014059754A (en) | Information processing system, and information processing method | |
US20230350647A1 (en) | Programming Aiding Apparatus and Programming Aiding Method | |
CN107862406A (en) | Using deep learning and the method for the primary equipment risk profile for improving Apriori algorithm synthesis | |
CN109241442B (en) | Item recommendation method, readable storage medium and terminal based on predicted value filling | |
Maquee et al. | Clustering and association rules in analyzing the efficiency of maintenance system of an urban bus network | |
CN113326869A (en) | Deep learning calculation graph optimization method based on longest path fusion algorithm | |
JPWO2018235841A1 (en) | Graph structure analysis device, graph structure analysis method, and program | |
CN113743453A (en) | Population quantity prediction method based on random forest | |
CN117938504A (en) | Intelligent arrangement method of security policy based on data driving | |
KR102480518B1 (en) | Method for credit evaluation model update or replacement and apparatus performing the method | |
CN116304722A (en) | Training Method of Vector Retrieval Model Based on Balanced Tree Index Structure | |
JP2013003611A (en) | Design verification method and program | |
JP7543944B2 (en) | Machine learning program, machine learning method, and estimation device | |
CN114662116A (en) | Service operation vulnerability searching method based on big data and cloud deep learning system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5794160 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |