[go: up one dir, main page]

JP2013152656A - Information processor, information processing method and program for determining explanatory variable - Google Patents

Information processor, information processing method and program for determining explanatory variable Download PDF

Info

Publication number
JP2013152656A
JP2013152656A JP2012013698A JP2012013698A JP2013152656A JP 2013152656 A JP2013152656 A JP 2013152656A JP 2012013698 A JP2012013698 A JP 2012013698A JP 2012013698 A JP2012013698 A JP 2012013698A JP 2013152656 A JP2013152656 A JP 2013152656A
Authority
JP
Japan
Prior art keywords
calculated
value
error
variable
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012013698A
Other languages
Japanese (ja)
Other versions
JP5794160B2 (en
Inventor
Hiroharu Maruhashi
弘治 丸橋
Nobuhiro Yugami
伸弘 湯上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012013698A priority Critical patent/JP5794160B2/en
Publication of JP2013152656A publication Critical patent/JP2013152656A/en
Application granted granted Critical
Publication of JP5794160B2 publication Critical patent/JP5794160B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減する。
【解決手段】本情報処理装置は、複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出する第1算出部と、算出された誤差に基づき、複数の目的変数を複数のグループに分類する分類部と、複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出する第2算出部と、複数のグループの各々について、代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する決定部とを有する。
【選択図】図1
An object of the present invention is to reduce the amount of calculation performed when finding explanatory variables to be added to a prediction model.
The information processing apparatus calculates, for each of a plurality of objective variables, an error between an actual value of the objective variable and a value calculated by a first prediction model for predicting the value of the objective variable. A first calculation unit to be calculated, a classification unit for classifying a plurality of objective variables into a plurality of groups based on the calculated error, and an error calculated for the objective variable belonging to the group for each of the plurality of groups A second calculation unit for calculating a representative value of the error and a plurality of second prediction models for predicting the representative value for each of the plurality of groups while changing the explanatory variables. A determining unit that determines an explanatory variable to be added to the first prediction model of the objective variable belonging to the group based on a difference between each of the values calculated by the two prediction models and the representative value.
[Selection] Figure 1

Description

本技術は、予測モデルの構築技術に関する。   The present technology relates to a prediction model construction technology.

時間の経過に従って変化する目的変数の値(例えば株価)を説明変数の値(例えば過去の株価)を利用して予測するための予測モデルを構築する技術がある。   There is a technique for constructing a prediction model for predicting a value (for example, stock price) of an objective variable that changes with the passage of time by using a value (for example, past stock price) of an explanatory variable.

精度が高い予測モデルを構築するためには、予測モデルに説明変数を追加し、より多くの説明変数の値を利用して目的変数の値を予測することが有効であることが知られている。例えば、A運輸の株価について予測モデルを構築する場合、A運輸の過去の株価だけでなくガソリンの過去の価格を利用すると、予測モデルの精度が向上することがある。   It is known that in order to build a prediction model with high accuracy, it is effective to add explanatory variables to the prediction model and predict the value of the objective variable using more explanatory variable values. . For example, when a prediction model is constructed for the stock price of A transportation, the accuracy of the prediction model may be improved by using not only the past stock price of A transportation but also the past price of gasoline.

但し、予測モデルに非常に多くの説明変数を追加して精度を高めようとすると、予測モデルの構築に利用する時系列データ(以下、学習データと呼ぶ)に特化した予測モデルになってしまう。そのため、その予測モデルの精度の検証を他の時系列データを用いて行うと、かえって精度が低下していることがある。このような状態は、機械学習の分野では「オーバーフィッティング」と呼ばれている。   However, if a large number of explanatory variables are added to the prediction model to improve accuracy, the prediction model will be specialized for time-series data (hereinafter referred to as learning data) used to construct the prediction model. . Therefore, if the accuracy of the prediction model is verified using other time series data, the accuracy may be lowered. Such a state is called “overfitting” in the field of machine learning.

予測モデルの精度が最も高くなるような説明変数を選定することは非常に難しい。単純には、説明変数のあらゆる組合せについて予測モデルを構築し、検証を行い、最も精度が高い予測モデルを採用することが考えられる。但し、説明変数の数が多くなると組合せ爆発によって計算量が膨大になるため、現実的ではない。   It is very difficult to select an explanatory variable that gives the highest accuracy of the prediction model. Simply, it is conceivable that a prediction model is constructed and verified for every combination of explanatory variables, and the prediction model with the highest accuracy is adopted. However, if the number of explanatory variables increases, the amount of calculation becomes enormous due to the combined explosion, which is not realistic.

そこで、従来では、有用性が最も高い説明変数を予測モデルに1つ追加する処理及び説明変数を新たに追加することによって不要になった説明変数を除去する処理を繰り返す技術(ステップワイズ変数選択法)が利用されている。説明変数の有用性を表す指標には、例えば、重回帰モデルとしての有意性のためのF値(F value)、AIC(Akaike's Information Criterion)及びBIC(Bayesian Information Criterion)といったものがある。近年では、AIC及びBICといった指標が利用されることが多い。両者は、誤差を二乗した値の総和が最も小さくなるような説明変数を採用するものである。   Therefore, conventionally, a technique of repeating the process of adding one explanatory variable having the highest usefulness to the prediction model and the process of removing an explanatory variable that has become unnecessary by newly adding an explanatory variable (stepwise variable selection method) ) Is used. Examples of indices representing the usefulness of explanatory variables include F value (F value) for significance as a multiple regression model, AIC (Akaike's Information Criterion), and BIC (Bayesian Information Criterion). In recent years, indexes such as AIC and BIC are often used. Both employ an explanatory variable that minimizes the sum of the squared errors.

しかし、上記の技術にも問題がある。この技術では、総合の計算量はおおよそ(1の説明変数について有用さを表す指標を算出するのに要する計算量)×(目的変数の数)×(説明変数の候補の数)となる。そのため、目的変数の数及び説明変数の数が多くなると、計算量が非常に多くなるという問題がある。   However, there is a problem with the above technique. In this technique, the total calculation amount is approximately (calculation amount required to calculate an index representing the usefulness of one explanatory variable) × (number of objective variables) × (number of explanatory variable candidates). Therefore, when the number of objective variables and the number of explanatory variables increase, there is a problem that the amount of calculation becomes very large.

Paul A. Murtaugh (2009). Performance of several variable-selection methods applied to real ecological data. Ecology Letters, 12:1061-1068.Paul A. Murtaugh (2009). Performance of several variable-selection methods applied to real ecological data. Ecology Letters, 12: 1061-1068.

従って、本技術の目的は、一側面では、予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減するための技術を提供することである。   Accordingly, an object of the present technology is, in one aspect, to provide a technique for reducing the amount of calculation performed when finding an explanatory variable to be added to a prediction model.

本技術の一態様に係る情報処理装置は、(A)記憶装置と、(B)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納する第1算出部と、(C)記憶装置に格納されている誤差に基づき複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納する第2算出部と、(D)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第1決定部とを有する。   An information processing apparatus according to an aspect of the present technology includes: (A) a storage device; and (B) a first value for predicting an actual value of an objective variable and a value of the objective variable for each of a plurality of objective variables. And (C) classifying a plurality of objective variables into a plurality of groups based on the error stored in the storage device. For each of the plurality of groups, a second calculation unit that calculates a representative value of the error using an error calculated for the objective variable belonging to the group and stores the representative value in a storage device; and (D) a plurality of groups For each, a plurality of second prediction models for predicting representative values stored in the storage device are generated while changing the explanatory variables, and each of the values calculated by the generated second prediction models Difference from typical value Based, and a first determining unit for determining the explanatory variable to be added to the first prediction model target variable belonging to the group.

予測モデルに追加すべき説明変数を見つける際に行う計算の量を削減できるようになる。   This will reduce the amount of computation to be performed when finding explanatory variables to be added to the prediction model.

図1は、本実施の形態に係る情報処理装置の機能ブロック図である。FIG. 1 is a functional block diagram of the information processing apparatus according to the present embodiment. 図2は、グルーピング処理部の機能ブロック図である。FIG. 2 is a functional block diagram of the grouping processing unit. 図3は、候補抽出部の機能ブロック図である。FIG. 3 is a functional block diagram of the candidate extraction unit. 図4は、決定部の機能ブロック図である。FIG. 4 is a functional block diagram of the determination unit. 図5は、学習データ格納部に格納されている学習データの一例を示す図である。FIG. 5 is a diagram illustrating an example of learning data stored in the learning data storage unit. 図6は、メインの処理フローを示す図である。FIG. 6 is a diagram showing a main processing flow. 図7は、グルーピング処理の概要を説明するための図である。FIG. 7 is a diagram for explaining the outline of the grouping process. 図8は、グルーピング処理の概要を説明するための図である。FIG. 8 is a diagram for explaining an outline of the grouping process. 図9は、グルーピング処理の処理フローを示す図である。FIG. 9 is a diagram illustrating a processing flow of the grouping process. 図10は、第1モデル格納部に格納されているデータの一例を示す図である。FIG. 10 is a diagram illustrating an example of data stored in the first model storage unit. 図11は、第1誤差データ格納部に格納されているデータの一例を示す図である。FIG. 11 is a diagram illustrating an example of data stored in the first error data storage unit. 図12は、グルーピング結果格納部に格納されているデータの一例を示す図である。FIG. 12 is a diagram illustrating an example of data stored in the grouping result storage unit. 図13は、第1候補抽出処理の概要を説明するための図である。FIG. 13 is a diagram for explaining an overview of the first candidate extraction process. 図14は、第1候補抽出処理の処理フローを示す図である。FIG. 14 is a diagram illustrating a processing flow of the first candidate extraction processing. 図15は、第2モデル格納部に格納されているデータの一例を示す図である。FIG. 15 is a diagram illustrating an example of data stored in the second model storage unit. 図16は、第2誤差データ格納部に格納されているデータの一例を示す図である。FIG. 16 is a diagram illustrating an example of data stored in the second error data storage unit. 図17は、第1評価値格納部に格納されているデータの一例を示す図である。FIG. 17 is a diagram illustrating an example of data stored in the first evaluation value storage unit. 図18は、第1抽出結果格納部に格納されているデータの一例を示す図である。FIG. 18 is a diagram illustrating an example of data stored in the first extraction result storage unit. 図19は、第2候補抽出処理の概要を説明するための図である。FIG. 19 is a diagram for explaining the outline of the second candidate extraction process. 図20は、第2候補抽出処理の処理フローを示す図である。FIG. 20 is a diagram illustrating a process flow of the second candidate extraction process. 図21は、第3モデル格納部に格納されているデータの一例を示す図である。FIG. 21 is a diagram illustrating an example of data stored in the third model storage unit. 図22は、第3誤差データ格納部に格納されているデータの一例を示す図である。FIG. 22 is a diagram illustrating an example of data stored in the third error data storage unit. 図23は、第2評価値格納部に格納されているデータの一例を示す図である。FIG. 23 is a diagram illustrating an example of data stored in the second evaluation value storage unit. 図24は、第2抽出結果格納部に格納されているデータの一例を示す図である。FIG. 24 is a diagram illustrating an example of data stored in the second extraction result storage unit. 図25は、候補格納部に格納されているデータの一例を示す図である。FIG. 25 is a diagram illustrating an example of data stored in the candidate storage unit. 図26は、決定処理の概要を説明するための図である。FIG. 26 is a diagram for explaining the outline of the determination process. 図27は、決定処理の処理フローを示す図である。FIG. 27 is a diagram illustrating a processing flow of determination processing. 図28は、第4モデル格納部に格納されているデータの一例を示す図である。FIG. 28 is a diagram illustrating an example of data stored in the fourth model storage unit. 図29は、第4誤差データ格納部に格納されているデータの一例を示す図である。FIG. 29 is a diagram illustrating an example of data stored in the fourth error data storage unit. 図30は、第3評価値格納部に格納されているデータの一例を示す図である。FIG. 30 is a diagram illustrating an example of data stored in the third evaluation value storage unit. 図31は、決定結果格納部に格納されているデータの一例を示す図である。FIG. 31 is a diagram illustrating an example of data stored in the determination result storage unit. 図32は、表示する画面のデータの一例を示す図である。FIG. 32 is a diagram illustrating an example of screen data to be displayed. 図33は、予測モデルに追加する説明変数を銘柄毎に決定する処理の処理フローを示す図である。FIG. 33 is a diagram illustrating a processing flow of processing for determining an explanatory variable to be added to the prediction model for each brand. 図34は、コンピュータの機能ブロックを示す図である。FIG. 34 is a diagram illustrating functional blocks of a computer.

図1に、本実施の形態に係る情報処理装置1の機能ブロック図を示す。情報処理装置1は、グルーピング処理部2と、グルーピング結果格納部3と、候補抽出部4と、学習データ格納部5と、候補格納部6と、決定部7と、決定結果格納部8と、出力部9とを含む。   FIG. 1 shows a functional block diagram of the information processing apparatus 1 according to the present embodiment. The information processing apparatus 1 includes a grouping processing unit 2, a grouping result storage unit 3, a candidate extraction unit 4, a learning data storage unit 5, a candidate storage unit 6, a determination unit 7, a determination result storage unit 8, And an output unit 9.

グルーピング処理部2は、学習データ格納部5に格納されているデータを用いてグルーピング処理を行い、処理結果をグルーピング結果格納部3に格納する。候補抽出部4は、グルーピング結果格納部3に格納されているデータ及び学習データ格納部5に格納されているデータを用いて第1及び第2候補抽出処理を行い、処理結果を候補格納部6に格納する。決定部7は、グルーピング結果格納部3、学習データ格納部5及び候補格納部6に格納されているデータを用いて決定処理を行い、処理結果を決定結果格納部8に格納する。出力部9は、グルーピング結果格納部3に格納されているデータ、候補格納部6に格納されているデータ及び決定結果格納部8に格納されているデータを用いて表示する画面のデータを生成し、表示装置等に表示させる。   The grouping processing unit 2 performs grouping processing using the data stored in the learning data storage unit 5 and stores the processing result in the grouping result storage unit 3. The candidate extraction unit 4 performs first and second candidate extraction processing using the data stored in the grouping result storage unit 3 and the data stored in the learning data storage unit 5, and the processing result is stored in the candidate storage unit 6. To store. The determination unit 7 performs a determination process using data stored in the grouping result storage unit 3, the learning data storage unit 5, and the candidate storage unit 6, and stores the processing result in the determination result storage unit 8. The output unit 9 generates screen data to be displayed using the data stored in the grouping result storage unit 3, the data stored in the candidate storage unit 6, and the data stored in the determination result storage unit 8. And display it on a display device or the like.

図2に、グルーピング処理部2の機能ブロック図を示す。グルーピング処理部2は、第1モデル生成部21と、第1モデル格納部22と、第1誤差算出部23と、第1誤差データ格納部24と、グループ生成部25とを含む。   FIG. 2 shows a functional block diagram of the grouping processing unit 2. The grouping processing unit 2 includes a first model generation unit 21, a first model storage unit 22, a first error calculation unit 23, a first error data storage unit 24, and a group generation unit 25.

第1モデル生成部21は、学習データ格納部5に格納されているデータを用いて処理を行い、処理結果を第1モデル格納部22に格納する。第1誤差算出部23は、学習データ格納部5に格納されているデータ及び第1モデル格納部22に格納されているデータを用いて処理を行い、処理結果を第1誤差データ格納部24に格納する。グループ生成部25は、第1誤差データ格納部24に格納されているデータを用いて処理を行い、処理結果をグルーピング結果格納部3に格納する。   The first model generation unit 21 performs processing using the data stored in the learning data storage unit 5 and stores the processing result in the first model storage unit 22. The first error calculation unit 23 performs processing using the data stored in the learning data storage unit 5 and the data stored in the first model storage unit 22, and the processing result is stored in the first error data storage unit 24. Store. The group generation unit 25 performs processing using the data stored in the first error data storage unit 24 and stores the processing result in the grouping result storage unit 3.

図3に、候補抽出部4の機能ブロック図を示す。候補抽出部4は、第2モデル生成部401と、第2モデル格納部402と、第3モデル格納部403と、第2誤差算出部404と、第2誤差データ格納部405と、第3誤差データ格納部406と、第1評価値算出部407と、第1評価値格納部408と、第2評価値格納部409と、抽出部410と、第1抽出結果格納部411と、第2抽出結果格納部412と、第1特定部413とを含む。   FIG. 3 shows a functional block diagram of the candidate extraction unit 4. The candidate extraction unit 4 includes a second model generation unit 401, a second model storage unit 402, a third model storage unit 403, a second error calculation unit 404, a second error data storage unit 405, and a third error. Data storage unit 406, first evaluation value calculation unit 407, first evaluation value storage unit 408, second evaluation value storage unit 409, extraction unit 410, first extraction result storage unit 411, and second extraction A result storage unit 412 and a first specifying unit 413 are included.

第2モデル生成部401は、グルーピング結果格納部3に格納されているデータ及び学習データ格納部5に格納されているデータを用いて処理を行い、処理結果を第2モデル格納部402及び第3モデル格納部403に格納する。第2誤差算出部404は、第2モデル格納部402に格納されているデータを用いて処理を行い、処理結果を第2誤差データ格納部405に格納する。また、第2誤差算出部404は、第3モデル格納部403に格納されているデータを用いて処理を行い、処理結果を第3誤差データ格納部406に格納する。第1評価値算出部407は、第2誤差データ格納部405に格納されているデータを用いて処理を行い、処理結果を第1評価値格納部408に格納する。また、第1評価値算出部407は、第3誤差データ格納部406に格納されているデータを用いて処理を行い、処理結果を第2評価値格納部409に格納する。抽出部410は、第1評価値格納部408に格納されているデータを用いて処理を行い、処理結果を第1抽出結果格納部411に格納する。また、抽出部410は、第2評価値格納部409に格納されているデータを用いて処理を行い、処理結果を第2抽出結果格納部412に格納する。第1特定部413は、第1抽出結果格納部411に格納されているデータ及び第2抽出結果格納部412に格納されているデータを用いて処理を行い、処理結果を候補格納部6に格納する。   The second model generation unit 401 performs processing using the data stored in the grouping result storage unit 3 and the data stored in the learning data storage unit 5, and the processing result is stored in the second model storage unit 402 and the third model. Store in the model storage unit 403. The second error calculation unit 404 performs processing using the data stored in the second model storage unit 402 and stores the processing result in the second error data storage unit 405. In addition, the second error calculation unit 404 performs processing using data stored in the third model storage unit 403 and stores the processing result in the third error data storage unit 406. The first evaluation value calculation unit 407 performs processing using the data stored in the second error data storage unit 405 and stores the processing result in the first evaluation value storage unit 408. The first evaluation value calculation unit 407 performs processing using the data stored in the third error data storage unit 406 and stores the processing result in the second evaluation value storage unit 409. The extraction unit 410 performs processing using the data stored in the first evaluation value storage unit 408 and stores the processing result in the first extraction result storage unit 411. Further, the extraction unit 410 performs processing using the data stored in the second evaluation value storage unit 409 and stores the processing result in the second extraction result storage unit 412. The first specifying unit 413 performs processing using the data stored in the first extraction result storage unit 411 and the data stored in the second extraction result storage unit 412, and stores the processing result in the candidate storage unit 6. To do.

図4に、決定部7の機能ブロック図を示す。決定部7は、第3モデル生成部71と、第4モデル格納部72と、第3誤差算出部73と、第4誤差データ格納部74と、第2評価値算出部75と、第3評価値格納部76と、第2特定部77とを含む。   FIG. 4 shows a functional block diagram of the determination unit 7. The determination unit 7 includes a third model generation unit 71, a fourth model storage unit 72, a third error calculation unit 73, a fourth error data storage unit 74, a second evaluation value calculation unit 75, and a third evaluation value. A value storage unit 76 and a second specifying unit 77 are included.

第3モデル生成部71は、学習データ格納部5に格納されているデータ及び候補格納部6に格納されているデータを用いて処理を行い、処理結果を第4モデル格納部72に格納する。第3誤差算出部73は、学習データ格納部5に格納されているデータ及び第4モデル格納部72に格納されているデータを用いて処理を行い、処理結果を第4誤差データ格納部74に格納する。第2評価値算出部75は、第4誤差データ格納部74に格納されているデータを用いて処理を行い、処理結果を第3評価値格納部76に格納する。第2特定部77は、第3評価値格納部76に格納されているデータを用いて処理を行い、処理結果を決定結果格納部8に格納する。   The third model generation unit 71 performs processing using the data stored in the learning data storage unit 5 and the data stored in the candidate storage unit 6 and stores the processing result in the fourth model storage unit 72. The third error calculation unit 73 performs processing using the data stored in the learning data storage unit 5 and the data stored in the fourth model storage unit 72, and the processing result is stored in the fourth error data storage unit 74. Store. The second evaluation value calculation unit 75 performs processing using the data stored in the fourth error data storage unit 74 and stores the processing result in the third evaluation value storage unit 76. The second specifying unit 77 performs processing using the data stored in the third evaluation value storage unit 76 and stores the processing result in the determination result storage unit 8.

図5に、学習データ格納部5に格納されている学習データの一例を示す。図5の例では、7月27日から7月31日までの各日付について、今日の株価と、1日前の株価と、2日前の株価とが格納されている。図5の例は特定の銘柄についての株価のデータセットを示しており、学習データ格納部5には、多数の銘柄についての株価のデータセットが格納されるようになっている。   FIG. 5 shows an example of learning data stored in the learning data storage unit 5. In the example of FIG. 5, for each date from July 27 to July 31, today's stock price, stock price one day ago, and stock price two days ago are stored. The example of FIG. 5 shows a stock price data set for a specific brand, and the learning data storage unit 5 stores a stock price data set for many brands.

なお、本実施の形態においては、特定の銘柄についての「今日」の株価をその銘柄の「1日前」の株価及び「2日前」の株価を用いて予測モデルを構築した場合において、予測モデルの精度を向上させるために追加する説明変数を選定することを想定している。   In the present embodiment, when a prediction model is constructed using the stock price of “today” for a specific stock using the stock price of “1 day ago” and the stock price of “2 days ago” of the stock, It is assumed that explanatory variables to be added are selected in order to improve accuracy.

次に、図6乃至図33を用いて、図1に示した情報処理装置1の動作について説明する。まず、グルーピング処理部2は、グルーピング処理を実施する(図6:ステップS1)。グルーピング処理については、図7乃至図12を用いて説明する。   Next, the operation of the information processing apparatus 1 shown in FIG. 1 will be described with reference to FIGS. First, the grouping processing unit 2 performs a grouping process (FIG. 6: Step S1). The grouping process will be described with reference to FIGS.

まず、グルーピング処理の概要について説明する。グルーピング処理においては、処理対象となる複数の銘柄をグループ分けする。グループ分けの基準となるのは、予測モデルによる予測値と実際の値との誤差である。具体的には、図7に示すように、各日付について予測値と実際の値との誤差を算出し、各日付についての誤差を成分とする誤差ベクトルに基づきグループ分けを行う。   First, an outline of the grouping process will be described. In the grouping process, a plurality of brands to be processed are grouped. The standard for grouping is the error between the predicted value by the prediction model and the actual value. Specifically, as shown in FIG. 7, the error between the predicted value and the actual value is calculated for each date, and grouping is performed based on an error vector having the error for each date as a component.

グループ分けは、誤差ベクトルが類似する(すなわち、誤差の変動の傾向が類似している)銘柄が同じグループになるように行う。そして、図8に示すように、同じグループに属する銘柄の誤差ベクトルを用いて代表誤差ベクトルを算出する処理をグループ毎に行う。   The grouping is performed so that brands having similar error vectors (that is, having similar error fluctuation trends) are in the same group. And as shown in FIG. 8, the process which calculates a representative error vector using the error vector of the brand which belongs to the same group is performed for every group.

次に、グルーピング処理の処理フローについて説明する。グルーピング処理部2における第1モデル生成部21は、学習データ格納部5に学習データが格納されている銘柄のうち未処理の銘柄を1つ特定する(図9:ステップS11)。   Next, the processing flow of the grouping process will be described. The first model generation unit 21 in the grouping processing unit 2 identifies one unprocessed brand among the brands whose learning data is stored in the learning data storage unit 5 (FIG. 9: Step S11).

第1モデル生成部21は、ステップS11において特定された銘柄の学習データを用いて予測モデルを構築し、構築された予測モデルのデータと銘柄名とを第1モデル格納部22に格納する(ステップS13)。ステップS13においては、ステップS11において特定された銘柄の「今日」の株価を「1日前」の株価及び「2日前」の株価を用いて予測するための予測モデル(例えばAR(AutoRegressive)モデル)を構築する。予測モデルを構築する技術は本実施の形態の主要な部分ではないので、詳細な説明を省略する。   The first model generation unit 21 constructs a prediction model using the learning data of the brand specified in step S11, and stores the constructed prediction model data and brand name in the first model storage unit 22 (step). S13). In step S13, a prediction model (for example, an AR (AutoRegressive) model) for predicting the stock price “today” of the stock specified in step S11 using the stock price “1 day ago” and the stock price “2 days ago” is used. To construct. Since the technique for constructing the prediction model is not the main part of the present embodiment, detailed description thereof is omitted.

図10に、第1モデル格納部22に格納されているデータの一例を示す。図10の例では、銘柄名と、予測モデルのデータとが格納されている。   FIG. 10 shows an example of data stored in the first model storage unit 22. In the example of FIG. 10, the brand name and the prediction model data are stored.

そして、第1誤差算出部23は、ステップS13において構築された予測モデルと学習データ格納部5に格納されているデータとを用いて、予測モデルにより算出された値(すなわち予測値)と実際の値との誤差に基づく誤差ベクトルを算出する(ステップS15)。また、第1誤差算出部23は、銘柄名及び算出結果等を第1誤差データ格納部24に格納する。   The first error calculation unit 23 uses the prediction model constructed in step S13 and the data stored in the learning data storage unit 5 to calculate the value calculated by the prediction model (that is, the prediction value) and the actual value. An error vector based on the error from the value is calculated (step S15). Further, the first error calculation unit 23 stores the brand name, the calculation result, and the like in the first error data storage unit 24.

図11に、第1誤差データ格納部24に格納されているデータの一例を示す。図11の例では、銘柄名と、各日付について株価の実際の値、予測値及び誤差とが格納されている。   FIG. 11 shows an example of data stored in the first error data storage unit 24. In the example of FIG. 11, the brand name and the actual value, predicted value, and error of the stock price for each date are stored.

図9の説明に戻り、第1モデル生成部21は、未処理の銘柄が有るか判断する(ステップS17)。未処理の銘柄が有る場合(ステップS17:Yesルート)、ステップS11の処理に戻る。   Returning to the description of FIG. 9, the first model generation unit 21 determines whether there is an unprocessed brand (step S17). When there is an unprocessed brand (step S17: Yes route), the process returns to step S11.

一方、未処理の銘柄が無い場合(ステップS17:Noルート)、グループ生成部25は、第1誤差データ格納部24に格納されている誤差ベクトルのデータを用いて銘柄をグループ分けし、グループ分けの結果をメインメモリ等の記憶装置に一旦格納する(ステップS19)。ステップS19においては、例えばK平均法を用いてグループ分けを行う。なお、例えばクラスタリング等のグループ分けの技術はよく知られているので、ここでは説明を省略する。   On the other hand, when there is no unprocessed brand (step S17: No route), the group generation unit 25 groups the brands using the error vector data stored in the first error data storage unit 24, and groups them. Is temporarily stored in a storage device such as a main memory (step S19). In step S19, grouping is performed using, for example, the K-average method. Note that, for example, a grouping technique such as clustering is well known, and a description thereof will be omitted here.

グループ生成部25は、各グループについて代表誤差ベクトルを算出し、各グループに属する銘柄の名前及び代表誤差ベクトルの各成分の値をグルーピング結果格納部3に格納する(ステップS21)。ステップS21においては、例えば、グループに属する銘柄の誤差ベクトルの平均を求めることにより代表誤差ベクトルを算出する。そして元の処理に戻る。   The group generation unit 25 calculates a representative error vector for each group, and stores the names of brands belonging to each group and the values of the components of the representative error vector in the grouping result storage unit 3 (step S21). In step S21, for example, a representative error vector is calculated by obtaining an average of error vectors of brands belonging to the group. Then, the process returns to the original process.

図12に、グルーピング結果格納部3に格納されているデータの一例を示す。図12の例では、グループの識別子と、グループに属する銘柄の名前と、各日付についての代表誤差の値とが格納されている。なお、グループの識別子は、各グループに割り当てられた固有の番号である。   FIG. 12 shows an example of data stored in the grouping result storage unit 3. In the example of FIG. 12, a group identifier, a name of a brand belonging to the group, and a representative error value for each date are stored. The group identifier is a unique number assigned to each group.

以上のようにして、誤差の変動の傾向が類似している銘柄が同じグループになるようにグループ分けを行う。なお、このようにグループ分けを行うのは、ある銘柄の予測モデルに追加することが有効である説明変数は、同じグループに属する他の銘柄の予測モデルに流用できるという考え方に基づいている。   As described above, grouping is performed so that stocks having similar error fluctuation trends are in the same group. This grouping is based on the idea that explanatory variables that are effective to be added to a prediction model for a certain brand can be used for prediction models for other brands belonging to the same group.

図6の説明に戻り、候補抽出部4は、第1候補抽出処理を実施する(ステップS3)。第1候補抽出処理については、図13乃至図18を用いて説明する。   Returning to the description of FIG. 6, the candidate extraction unit 4 performs a first candidate extraction process (step S3). The first candidate extraction process will be described with reference to FIGS.

まず、図13を用いて、第1候補抽出処理の概要について説明する。なお、説明を簡単にするため、代表誤差ベクトルを1次元のベクトルとしている。第1候補抽出処理においては、各グループについて、代表誤差の予測の精度に基づきN(Nは2以上の自然数)個の説明変数の候補を抽出する。すなわち、代表誤差を予測するための予測モデルによる予測値と代表誤差との差の二乗の総和を求めることにより評価値を算出し、算出した評価値が最も小さい候補から順にN個の候補を抽出する。   First, the outline of the first candidate extraction process will be described with reference to FIG. In order to simplify the explanation, the representative error vector is a one-dimensional vector. In the first candidate extraction process, N (N is a natural number of 2 or more) explanatory variable candidates are extracted for each group based on the accuracy of representative error prediction. That is, an evaluation value is calculated by calculating a sum of squares of differences between a prediction value based on a prediction model for predicting a representative error and a representative error, and N candidates are extracted in order from the candidate having the smallest calculated evaluation value. To do.

但し、代表誤差を予測するための予測モデルには、追加する説明変数の候補だけでなく、グループ内の銘柄についてステップS13において生成された予測モデルに含まれる説明変数を利用する。図13の例では、A運輸とB航空が含まれるグループについて、A運輸及びB航空という説明変数の学習データと、追加する説明変数の候補(ガソリン又は米)の学習データとを用いて予測モデルを構築している。このようにするのは、予測モデルに複数の説明変数が含まれていると、説明変数の組合せによっては相乗効果により予測モデルの精度が大きく向上することがあることを考慮しているからである。このようにすることで、例えばA運輸又はB航空という説明変数と一緒に利用されると予測モデルの精度を大きく向上させることができる候補を取りこぼしにくくなる。なお、図13の例では、ガソリンについて算出した評価値は米について算出した評価値よりも小さくなるので、A運輸及びB航空が属するグループに対しては、米よりもガソリンの方が追加する説明変数として好ましいということになる。   However, in the prediction model for predicting the representative error, not only the explanatory variable candidates to be added, but also the explanatory variables included in the prediction model generated in step S13 for the brands in the group are used. In the example of FIG. 13, for a group including A transportation and B air, a prediction model using learning data of explanatory variables A transportation and B air and learning data of candidate explanatory variables (gasoline or rice) to be added. Is building. This is because when the prediction model includes a plurality of explanatory variables, it is considered that the accuracy of the prediction model may be greatly improved due to a synergistic effect depending on the combination of the explanatory variables. . This makes it difficult to miss candidates that can greatly improve the accuracy of the prediction model when used together with explanatory variables such as A transportation or B air. In addition, in the example of FIG. 13, since the evaluation value calculated about gasoline becomes smaller than the evaluation value calculated about rice, the description which gasoline adds to the group to which A transportation and B air belong belongs. It is preferable as a variable.

次に、第1候補抽出処理の処理フローについて説明する。まず、候補抽出部4における第2モデル生成部401は、グルーピング結果格納部3に登録されているグループのうち未処理のグループを1つ特定する(図14:ステップS31)。   Next, the process flow of the first candidate extraction process will be described. First, the second model generation unit 401 in the candidate extraction unit 4 identifies one unprocessed group among the groups registered in the grouping result storage unit 3 (FIG. 14: step S31).

第2モデル生成部401は、ステップS31において特定されたグループに属する銘柄について、ステップS13において構築された予測モデルで用いられている説明変数を抽出する(ステップS33)。例えば図12におけるグループ1について処理する場合には、A運輸及びB航空という説明変数が抽出される。   The 2nd model production | generation part 401 extracts the explanatory variable used with the prediction model constructed | assembled in step S13 about the brand which belongs to the group specified in step S31 (step S33). For example, when processing is performed for group 1 in FIG. 12, explanatory variables A transportation and B air are extracted.

第2モデル生成部401は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS35)。また、第2モデル生成部401は、抽出された説明変数の学習データと特定された候補の学習データとを用いて、ステップS31において特定されたグループについて算出された代表誤差の値を予測するための予測モデルを構築する(ステップS37)。そして、第2モデル生成部401は、グループの識別子、追加する説明変数の候補及び構築された予測モデルのデータを第2モデル格納部402に格納する。ステップS37においては、グルーピング結果格納部2に格納されている代表誤差の値を用いて処理を行う。   The second model generation unit 401 identifies one unprocessed candidate among the explanatory variable candidates to be added (step S35). In addition, the second model generation unit 401 uses the extracted learning data of the explanatory variables and the identified candidate learning data to predict the value of the representative error calculated for the group identified in step S31. Is constructed (step S37). Then, the second model generation unit 401 stores the group identifier, the explanatory variable candidate to be added, and the data of the constructed prediction model in the second model storage unit 402. In step S37, processing is performed using the value of the representative error stored in the grouping result storage unit 2.

図15に、第2モデル格納部402に格納されているデータの一例を示す。図15の例では、グループの識別子と、追加する説明変数の候補と、予測モデルのデータとが格納されている。   FIG. 15 shows an example of data stored in the second model storage unit 402. In the example of FIG. 15, group identifiers, candidates for explanatory variables to be added, and prediction model data are stored.

そして、第2誤差算出部404は、ステップS37において構築された予測モデルにより算出された値と代表誤差の値との誤差に基づく誤差ベクトルを算出し、グループの識別子、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第2誤差データ格納部405に格納する(ステップS39)。   Then, the second error calculation unit 404 calculates an error vector based on the error between the value calculated by the prediction model constructed in step S37 and the value of the representative error, the group identifier, the candidate explanatory variable to be added, and The value of each component of the error vector is stored in the second error data storage unit 405 (step S39).

図16に、第2誤差データ格納部405に格納されているデータの一例を示す。図16の例では、グループの識別子と、追加する説明変数の候補と、各日付について代表誤差、予測値及び誤差とが格納されている。   FIG. 16 shows an example of data stored in the second error data storage unit 405. In the example of FIG. 16, a group identifier, a candidate for an explanatory variable to be added, and a representative error, a predicted value, and an error for each date are stored.

そして、第1評価値算出部407は、ステップS39において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS41)。そして、グループの識別子、追加する説明変数の候補及び評価値を第1評価値格納部408に格納する。   Then, the first evaluation value calculation unit 407 calculates an evaluation value representing the usefulness of the candidate by squaring each component of the error vector calculated in step S39 to obtain the sum (step S41). Then, the group identifier, the explanatory variable candidate to be added, and the evaluation value are stored in the first evaluation value storage unit 408.

図17に、第1評価値格納部408に格納されているデータの一例を示す。図17の例では、グループの識別子と、追加する説明変数の候補と、評価値とが格納されている。   FIG. 17 shows an example of data stored in the first evaluation value storage unit 408. In the example of FIG. 17, group identifiers, candidate explanatory variables to be added, and evaluation values are stored.

そして、第2モデル生成部401は、未処理の候補が有るか判断する(ステップS43)。未処理の候補が有る場合には(ステップS43:Yesルート)、次の候補について処理するため、ステップS35の処理に戻る。   Then, the second model generation unit 401 determines whether there is an unprocessed candidate (step S43). If there is an unprocessed candidate (step S43: Yes route), the process returns to step S35 to process the next candidate.

一方、未処理の候補が無い場合には(ステップS43:Noルート)、抽出部410は、ステップS31において特定されたグループについて、評価値が小さい順にN個の説明変数の候補を第1評価値格納部408から抽出する(ステップS45)。また、抽出部410は、グループの識別子及び抽出した説明変数の候補を第1抽出結果格納部411に格納する。   On the other hand, if there is no unprocessed candidate (step S43: No route), the extraction unit 410 sets N explanatory variable candidates as the first evaluation value for the group specified in step S31 in ascending order of evaluation value. Extracted from the storage unit 408 (step S45). Further, the extraction unit 410 stores the group identifier and the extracted explanatory variable candidates in the first extraction result storage unit 411.

図18に、第1抽出結果格納部411に格納されているデータの一例を示す。図18の例では、グループの識別子と、追加する説明変数の候補とが格納されている。   FIG. 18 shows an example of data stored in the first extraction result storage unit 411. In the example of FIG. 18, group identifiers and candidate explanatory variables to be added are stored.

そして、第2モデル生成部401は、未処理のグループが有るか判断する(ステップS47)。未処理のグループが有る場合(ステップS47:Yesルート)、次のグループについて処理するため、ステップS31の処理に戻り、未処理のグループが無い場合(ステップS47:Noルート)、元の処理に戻る。   Then, the second model generation unit 401 determines whether there is an unprocessed group (step S47). If there is an unprocessed group (step S47: Yes route), the process returns to step S31 to process the next group. If there is no unprocessed group (step S47: No route), the process returns to the original process. .

以上のような処理を実施することで、追加先の予測モデルにおいて用いられている説明変数と一緒に用いられると特に精度を向上させることができる説明変数を特定することができるようになる。   By carrying out the processing as described above, it is possible to specify an explanatory variable that can improve the accuracy particularly when used together with the explanatory variable used in the prediction model of the addition destination.

図6の説明に戻り、候補抽出部4は、第2候補抽出処理を実施する(ステップS5)。第2候補抽出処理については、図19乃至図24を用いて説明する。   Returning to the description of FIG. 6, the candidate extraction unit 4 performs the second candidate extraction process (step S5). The second candidate extraction process will be described with reference to FIGS.

まず、図19を用いて、第2候補抽出処理の概要について説明する。なお、説明を簡単にするため、代表誤差ベクトルを1次元のベクトルとしている。第2候補抽出処理においても、第1候補抽出処理と同様、各グループについて代表誤差の予測の精度に基づきN(Nは2以上の自然数)個の説明変数の候補を抽出する。すなわち、代表誤差を予測するための予測モデルによる予測値と代表誤差との差の二乗の総和を求めることにより評価値を算出し、算出した評価値が最も小さい候補から順にN個の候補を抽出する。   First, the outline of the second candidate extraction process will be described with reference to FIG. In order to simplify the explanation, the representative error vector is a one-dimensional vector. In the second candidate extraction process, as in the first candidate extraction process, N (N is a natural number of 2 or more) explanatory variable candidates are extracted for each group based on the accuracy of representative error prediction. That is, an evaluation value is calculated by calculating a sum of squares of differences between a prediction value based on a prediction model for predicting a representative error and a representative error, and N candidates are extracted in order from the candidate having the smallest calculated evaluation value. To do.

但し、第2候補抽出処理においては、代表誤差を予測するための予測モデルには、追加する説明変数の候補だけを利用する。図19の例では、A運輸とB航空が含まれるグループについて、追加する説明変数の候補(ガソリン又は米)の学習データだけを用いて予測モデルを構築している。このようにするのは、複数の説明変数による相乗効果が無いと仮定した場合において予測モデルの精度の向上に有用な候補を特定するためである。図19の例では、ガソリンについて算出した評価値は米について算出した評価値よりも小さくなるので、A運輸及びB航空が属するグループに対しては、米よりもガソリンの方が追加する説明変数の候補として好ましいということになる。なお、普通は説明変数の数を増やした方が予測モデルの精度が良くなるので、第1候補抽出処理において算出した評価値よりも大きな値が算出されることになる。   However, in the second candidate extraction process, only the explanatory variable candidates to be added are used in the prediction model for predicting the representative error. In the example of FIG. 19, for a group including A transportation and B air, a prediction model is constructed using only learning data of candidate explanatory variables (gasoline or rice) to be added. This is to identify candidates that are useful for improving the accuracy of the prediction model when it is assumed that there is no synergistic effect due to a plurality of explanatory variables. In the example of FIG. 19, the evaluation value calculated for gasoline is smaller than the evaluation value calculated for rice, so for the group to which A Transport and B Airlines belong, the explanatory variable added by gasoline rather than rice This is preferable as a candidate. Normally, the accuracy of the prediction model is improved by increasing the number of explanatory variables, and therefore a value larger than the evaluation value calculated in the first candidate extraction process is calculated.

次に、第2候補抽出処理の処理フローについて説明する。まず、候補抽出部4における第2モデル生成部401は、グルーピング結果格納部3に登録されているグループのうち未処理のグループを1つ特定する(図20:ステップS51)。   Next, the process flow of the second candidate extraction process will be described. First, the second model generation unit 401 in the candidate extraction unit 4 identifies one unprocessed group among the groups registered in the grouping result storage unit 3 (FIG. 20: Step S51).

第2モデル生成部401は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS53)。また、第2モデル生成部401は、特定された候補の学習データを用いて、ステップS51において特定されたグループについて算出された代表誤差の値を予測するための予測モデルを構築する(ステップS55)。そして、第2モデル生成部401は、グループの識別子、追加する説明変数の候補及び構築された予測モデルのデータを第3モデル格納部403に格納する。ステップS55においては、グルーピング結果格納部3に格納されている代表誤差の値を用いて処理を行う。   The second model generation unit 401 identifies one unprocessed candidate among the explanatory variable candidates to be added (step S53). Further, the second model generation unit 401 uses the identified candidate learning data to construct a prediction model for predicting the representative error value calculated for the group identified in step S51 (step S55). . Then, the second model generation unit 401 stores the group identifier, the candidate of the explanatory variable to be added, and the data of the constructed prediction model in the third model storage unit 403. In step S55, processing is performed using the value of the representative error stored in the grouping result storage unit 3.

図21に、第3モデル格納部403に格納されているデータの一例を示す。図21の例では、グループの識別子と、追加する説明変数の候補と、予測モデルのデータとが格納されている。   FIG. 21 shows an example of data stored in the third model storage unit 403. In the example of FIG. 21, group identifiers, candidates for explanatory variables to be added, and prediction model data are stored.

そして、第2誤差算出部404は、ステップ55において構築された予測モデルにより算出された値と代表誤差の値との誤差に基づく誤差ベクトルを算出する(ステップS57)。そして、第2誤差算出部404は、グループの識別子、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第3誤差データ格納部406に格納する。   Then, the second error calculation unit 404 calculates an error vector based on the error between the value calculated by the prediction model constructed in step 55 and the value of the representative error (step S57). Then, the second error calculation unit 404 stores the group identifier, the candidate explanatory variable to be added, the value of each component of the error vector, and the like in the third error data storage unit 406.

図22に、第3誤差データ格納部406に格納されているデータの一例を示す。図22の例では、グループの識別子と、追加する説明変数の候補と、各日付について代表誤差、予測値及び誤差とが格納されている。   FIG. 22 shows an example of data stored in the third error data storage unit 406. In the example of FIG. 22, a group identifier, a candidate for an explanatory variable to be added, and a representative error, a predicted value, and an error for each date are stored.

そして、第1評価値算出部407は、ステップS57において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS59)。そして、グループの識別子、追加する説明変数の候補及び評価値を第2評価値格納部409に格納する。   Then, the first evaluation value calculation unit 407 calculates an evaluation value representing the usefulness of the candidate by squaring each component of the error vector calculated in step S57 and obtaining the sum (step S59). The group identifier, the explanatory variable candidate to be added, and the evaluation value are stored in the second evaluation value storage unit 409.

図23に、第2評価値格納部409に格納されているデータの一例を示す。図23の例では、グループの識別子と、追加する説明変数の候補と、評価値とが格納されている。   FIG. 23 shows an example of data stored in the second evaluation value storage unit 409. In the example of FIG. 23, an identifier of a group, a candidate for an explanatory variable to be added, and an evaluation value are stored.

そして、第2モデル生成部401は、未処理の候補が有るか判断する(ステップS61)。未処理の候補が有る場合には(ステップS61:Yesルート)、次の候補について処理するため、ステップS53の処理に戻る。   Then, the second model generation unit 401 determines whether there is an unprocessed candidate (step S61). If there is an unprocessed candidate (step S61: Yes route), the process returns to step S53 to process the next candidate.

一方、未処理の候補が無い場合には(ステップS61:Noルート)、抽出部410は、ステップS51において特定されたグループについて、評価値が小さい順にN個の説明変数の候補を第2評価値格納部409から抽出する(ステップS63)。また、抽出部410は、グループの識別子及び抽出した説明変数の候補を第2抽出結果格納部412に格納する。   On the other hand, when there is no unprocessed candidate (step S61: No route), the extraction unit 410 selects the second explanatory value for N explanatory variable candidates in ascending order of evaluation value for the group specified in step S51. Extracted from the storage unit 409 (step S63). Further, the extraction unit 410 stores the group identifier and the extracted explanatory variable candidates in the second extraction result storage unit 412.

図24に、第2抽出結果格納部412に格納されているデータの一例を示す。図24の例では、グループの識別子と、追加する説明変数の候補とが格納されている。   FIG. 24 shows an example of data stored in the second extraction result storage unit 412. In the example of FIG. 24, a group identifier and a candidate for an explanatory variable to be added are stored.

そして、第2モデル生成部401は、未処理のグループが有るか判断する(ステップS65)。未処理のグループが有る場合(ステップS65:Yesルート)、次のグループについて処理するため、ステップS51の処理に戻り、未処理のグループが無い場合(ステップS65:Noルート)、元の処理に戻る。   Then, the second model generation unit 401 determines whether there is an unprocessed group (step S65). If there is an unprocessed group (step S65: Yes route), the process returns to step S51 to process the next group. If there is no unprocessed group (step S65: No route), the process returns to the original process. .

以上のような処理を実施することで、複数の説明変数による相乗効果が無いと仮定した場合において予測モデルの精度の向上に有用な候補を特定することができるようになる。   By performing the processing as described above, it is possible to identify candidates that are useful for improving the accuracy of the prediction model when it is assumed that there is no synergistic effect due to a plurality of explanatory variables.

図6の説明に戻り、候補抽出部4における第1特定部413は、第1候補抽出処理及び第2候補抽出処理の結果に基づき最終候補をグループ毎に決定し、グループの識別子及び最終候補を候補格納部6に格納する(ステップS7)。具体的には、第1抽出結果格納部411に格納されており且つ第2抽出結果格納部412に格納されている説明変数の候補を最終候補に決定する。   Returning to the description of FIG. 6, the first specifying unit 413 in the candidate extracting unit 4 determines a final candidate for each group based on the results of the first candidate extracting process and the second candidate extracting process, and determines the group identifier and the final candidate. Store in the candidate storage unit 6 (step S7). Specifically, the candidates for explanatory variables stored in the first extraction result storage unit 411 and stored in the second extraction result storage unit 412 are determined as final candidates.

図25に、候補格納部6に格納されているデータの一例を示す。図25の例では、グループの識別子と、追加する説明変数の候補とが格納されている。   FIG. 25 shows an example of data stored in the candidate storage unit 6. In the example of FIG. 25, a group identifier and a candidate for an explanatory variable to be added are stored.

そして、決定部7は、決定処理を実施する(ステップS9)。決定処理については、図26乃至図31を用いて説明する。   And the determination part 7 implements a determination process (step S9). The determination process will be described with reference to FIGS.

まず、図26を用いて、決定処理の概要について説明する。決定処理においては、各銘柄について、その銘柄が属するグループについての最終候補の各々を実際に予測モデルに追加して評価値を算出し、評価値が表す有用さが高い説明変数を予測モデルに追加する変数に決定する。例えば、グループ1についてはガソリン及び軽油が最終候補となっている場合には、ガソリン及び軽油の各々を実際に予測モデルに追加して評価値を算出し、評価値が最も小さいものを予測モデルに追加する説明変数に決定する。図26の例では、ガソリンについて算出した評価値は軽油について算出した評価値よりも小さいので、A運輸の予測モデルに追加する説明変数はガソリンに決定する。   First, the outline of the determination process will be described with reference to FIG. In the decision process, for each stock, each final candidate for the group to which the stock belongs is actually added to the prediction model to calculate an evaluation value, and an explanatory variable that is highly useful and represented by the evaluation value is added to the prediction model. Decide which variables to use. For example, when gasoline and diesel oil are the final candidates for Group 1, each of gasoline and diesel oil is actually added to the prediction model to calculate the evaluation value, and the one with the smallest evaluation value is used as the prediction model. Determine the explanatory variable to be added. In the example of FIG. 26, since the evaluation value calculated for gasoline is smaller than the evaluation value calculated for light oil, the explanatory variable added to the prediction model of A transportation is determined to be gasoline.

次に、決定処理の処理フローについて説明する。まず、決定部7における第3モデル生成部71は、学習データ格納部5に学習データが格納されている銘柄のうち未処理の銘柄を1つ特定する(図27:ステップS71)。また、第3モデル生成部71は、ステップS71において特定された銘柄が属するグループについての最終候補の中から未処理の最終候補を1つ特定する(ステップS73)。ステップS73においては、まずステップS71において特定された銘柄が属するグループをグルーピング結果格納部3から特定し、また特定されたグループに対応する最終候補を候補格納部6から特定し、特定された最終候補の中から未処理の最終候補を特定する。   Next, the processing flow of the determination process will be described. First, the 3rd model production | generation part 71 in the determination part 7 specifies one unprocessed brand | brand among the brands in which learning data are stored in the learning data storage part 5 (FIG. 27: step S71). In addition, the third model generation unit 71 specifies one unprocessed final candidate from the final candidates for the group to which the brand specified in step S71 belongs (step S73). In step S73, first, the group to which the brand specified in step S71 belongs is specified from the grouping result storage unit 3, and the final candidate corresponding to the specified group is specified from the candidate storage unit 6, and the specified final candidate An unprocessed final candidate is identified from the list.

そして、第3モデル生成部71は、ステップS71において特定された銘柄の学習データとステップS73において特定された最終候補の学習データとを用いて、特定された銘柄の「今日」の株価を予測するための予測モデルを構築する(ステップS75)。そして、第3モデル生成部71は、銘柄名、追加する説明変数の候補及び構築された予測モデルのデータを第4モデル格納部72に格納する。   Then, the third model generation unit 71 predicts the stock price of “today” of the specified brand using the learning data of the brand specified in step S71 and the learning data of the final candidate specified in step S73. A prediction model is constructed (step S75). Then, the third model generation unit 71 stores the brand name, the candidate explanatory variable to be added, and the data of the constructed prediction model in the fourth model storage unit 72.

図28に、第4モデル格納部72に格納されているデータの一例を示す。図28の例では、銘柄名と、追加する説明変数の候補と、予測モデルのデータとが格納されている。   FIG. 28 shows an example of data stored in the fourth model storage unit 72. In the example of FIG. 28, brand names, candidates for explanatory variables to be added, and prediction model data are stored.

そして、第3誤差算出部73は、特定された銘柄の株価の実際の値とステップS75において構築された予測モデルにより算出された値との誤差に基づく誤差ベクトルを算出し、銘柄名、追加する説明変数の候補及び誤差ベクトルの各成分の値等を第4誤差データ格納部74に格納する(ステップS77)。   Then, the third error calculation unit 73 calculates an error vector based on an error between the actual value of the stock price of the specified brand and the value calculated by the prediction model constructed in step S75, and adds the brand name. The candidate of explanatory variable, the value of each component of the error vector, and the like are stored in the fourth error data storage unit 74 (step S77).

図29に、第4誤差データ格納部74に格納されているデータの一例を示す。図29の例では、銘柄名と、追加する説明変数の候補と、各日付について株価の実際の値、予測値及び誤差とが格納されている。   FIG. 29 shows an example of data stored in the fourth error data storage unit 74. In the example of FIG. 29, brand names, candidates for explanatory variables to be added, and actual values, predicted values, and errors of stock prices for each date are stored.

そして、第2評価値算出部75は、ステップS77において算出された誤差ベクトルの各成分を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出し、銘柄名、追加する説明変数の候補及び評価値を第3評価値格納部76に格納する(ステップS79)。   Then, the second evaluation value calculation unit 75 calculates the evaluation value representing the usefulness of the candidate by squaring each component of the error vector calculated in step S77 to obtain the sum, and adds the brand name. The candidate explanatory variables and the evaluation value are stored in the third evaluation value storage unit 76 (step S79).

図30に、第3評価値格納部76に格納されているデータの一例を示す。図30の例では、銘柄名と、追加する説明変数の候補と、評価値とが格納されている。   FIG. 30 shows an example of data stored in the third evaluation value storage unit 76. In the example of FIG. 30, a brand name, a candidate for an explanatory variable to be added, and an evaluation value are stored.

そして、第3モデル生成部71は、候補格納部6に未処理の候補が有るか判断する(ステップS81)。未処理の候補が有る場合(ステップS81:Yesルート)、次の候補について処理するため、ステップS73の処理に戻る。   Then, the third model generation unit 71 determines whether there is an unprocessed candidate in the candidate storage unit 6 (step S81). If there is an unprocessed candidate (step S81: Yes route), the process returns to step S73 to process the next candidate.

一方、未処理の候補が無い場合(ステップS81:Noルート)、第2特定部77は、ステップS71において特定された銘柄の予測モデルに追加する説明変数を第3評価値格納部76に格納されている評価値に基づき決定し、銘柄名に対応付けて追加する説明変数を決定結果格納部8に格納する(ステップS83)。具体的には、評価値が最も小さい説明変数に決定する。   On the other hand, when there is no unprocessed candidate (step S81: No route), the second specifying unit 77 stores an explanatory variable to be added to the prediction model of the brand specified in step S71 in the third evaluation value storage unit 76. An explanatory variable that is determined on the basis of the evaluation value and is added in association with the brand name is stored in the determination result storage unit 8 (step S83). Specifically, the explanatory variable having the smallest evaluation value is determined.

図31に、決定結果格納部8に格納されているデータの一例を示す。図31の例では、銘柄名と、予測モデルに追加する説明変数とが格納されている。   FIG. 31 shows an example of data stored in the determination result storage unit 8. In the example of FIG. 31, brand names and explanatory variables added to the prediction model are stored.

そして、第3モデル生成部71は、未処理の銘柄が有るか判断する(ステップS85)。未処理の銘柄が有る場合(ステップS85:Yesルート)、次の銘柄について処理するため、ステップS71の処理に戻る。一方、未処理の銘柄が無い場合(ステップS85:Noルート)、元の処理に戻る。   And the 3rd model production | generation part 71 judges whether there exists an unprocessed brand (step S85). If there is an unprocessed brand (step S85: Yes route), the process returns to step S71 to process the next brand. On the other hand, when there is no unprocessed brand (step S85: No route), the process returns to the original process.

以上のような処理を実施することにより、各銘柄について最適な説明変数を特定することができるようになる。   By carrying out the processing as described above, it is possible to specify the optimum explanatory variable for each brand.

図6の説明に戻り、出力部9は、グルーピング結果格納部3に格納されているデータ、候補格納部6に格納されているデータ及び決定結果格納部8に格納されているデータを用いて決定結果を表示するための画面のデータを生成する。そして、生成した画面のデータを表示装置に表示させる(ステップS10)。そして処理を終了する。   Returning to the description of FIG. 6, the output unit 9 determines using the data stored in the grouping result storage unit 3, the data stored in the candidate storage unit 6, and the data stored in the determination result storage unit 8. Generate screen data to display the results. Then, the generated screen data is displayed on the display device (step S10). Then, the process ends.

図32に、表示される画面の一例を示す。図32の例では、各グループについて、そのグループに属する銘柄の予測モデルに追加する説明変数と、そのグループに属する銘柄の予測モデルに追加する説明変数の候補と、そのグループについて算出した代表誤差ベクトルとが表示されている。   FIG. 32 shows an example of the displayed screen. In the example of FIG. 32, for each group, explanatory variables to be added to the prediction model of the brand belonging to the group, candidates for explanatory variables to be added to the prediction model of the brand belonging to the group, and the representative error vector calculated for the group And are displayed.

以上のように、予測モデルに追加する説明変数を銘柄毎に決定するのではなく、グループ毎に決定することで、予測モデルに追加する説明変数を決定する際に行う計算の量を減らすことができるようになる。   As described above, instead of determining the explanatory variables to be added to the prediction model for each brand, it is possible to reduce the amount of calculation when determining the explanatory variables to be added to the prediction model by determining for each group. become able to.

ここで、予測モデルに追加する説明変数を銘柄毎に決定する場合の処理について、図33を用いて簡単に説明する。まず情報処理装置1における処理部(図示せず)が未処理の銘柄を1つ特定する(図33:ステップS101)。処理部は、追加する説明変数の候補のうち未処理の候補を1つ特定する(ステップS103)。処理部は、特定された銘柄の学習データと特定された候補の学習データとを用いて予測モデルを構築する(ステップS105)。処理部は、構築された予測モデルによる予測値と実際の値とを用いて誤差ベクトルを算出する(ステップS107)。処理部は、誤差ベクトルの各成分の値を二乗してその総和を求めることにより、候補の有用さを表す評価値を算出する(ステップS109)。そして、未処理の候補が有る場合(ステップS111:Yesルート)はステップS103の処理に戻り、未処理の候補が無い場合(ステップS111:Noルート)は評価値が表す有用さが最も高い説明変数を特定する(ステップS113)。そして、未処理の銘柄が有る場合(ステップS115:Yesルート)はステップS101の処理に戻り、未処理の銘柄が無い場合(ステップS115:Noルート)は処理を終了する。   Here, the process in the case where the explanatory variable added to the prediction model is determined for each brand will be briefly described with reference to FIG. First, a processing unit (not shown) in the information processing apparatus 1 identifies one unprocessed brand (FIG. 33: step S101). The processing unit identifies one unprocessed candidate among the explanatory variable candidates to be added (step S103). The processing unit builds a prediction model using the specified brand learning data and the specified candidate learning data (step S105). The processing unit calculates an error vector using the predicted value based on the constructed prediction model and the actual value (step S107). The processing unit calculates an evaluation value representing the usefulness of the candidate by squaring the value of each component of the error vector and obtaining the sum (step S109). If there is an unprocessed candidate (step S111: Yes route), the process returns to step S103. If there is no unprocessed candidate (step S111: No route), the explanatory variable having the highest usefulness represented by the evaluation value is used. Is specified (step S113). If there is an unprocessed brand (step S115: Yes route), the process returns to step S101. If there is no unprocessed brand (step S115: No route), the process is terminated.

背景技術の欄において述べたように、このようにすると、総合の計算量はおおよそ(1の説明変数について評価値を算出するのに要する計算量)×(目的変数の数(すなわち銘柄の数))×(説明変数の候補の数)となる。そのため、目的変数の数及び説明変数の数が多くなると、計算量が非常に多くなるという問題がある。   As described in the Background Art section, in this way, the total amount of calculation is approximately (the amount of calculation required to calculate the evaluation value for one explanatory variable) × (the number of objective variables (that is, the number of issues). ) × (number of candidates for explanatory variables). Therefore, when the number of objective variables and the number of explanatory variables increase, there is a problem that the amount of calculation becomes very large.

一方、上で述べたような本実施の形態の処理によれば、総合の計算量はおおよそ(グルーピング処理に要する計算量)+(1の説明変数について評価値を算出するのに要する計算量)×(グループの数)×(説明変数の候補の数)+(1の説明変数について評価値を算出するのに要する計算量)×(グループの数)×(グループに含まれる銘柄(目的変数)の数)×(説明変数の最終候補の数)となる。これにより、計算量を削減することができるようになる。   On the other hand, according to the processing of the present embodiment as described above, the total calculation amount is approximately (calculation amount required for grouping processing) + (calculation amount required to calculate an evaluation value for one explanatory variable). X (number of groups) x (number of explanatory variable candidates) + (calculation amount required to calculate an evaluation value for one explanatory variable) x (number of groups) x (stocks included in group (objective variable)) Number) × (number of final candidates for explanatory variables). As a result, the amount of calculation can be reduced.

以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上で説明した情報処理装置1の機能ブロック構成は必ずしも実際のプログラムモジュール構成に対応するものではない。   Although one embodiment of the present technology has been described above, the present technology is not limited to this. For example, the functional block configuration of the information processing apparatus 1 described above does not necessarily correspond to an actual program module configuration.

また、上で説明した各テーブルの構成は一例であって、必ずしも上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。   Further, the configuration of each table described above is an example, and the configuration as described above is not necessarily required. Further, in the processing flow, the processing order can be changed if the processing result does not change. Further, it may be executed in parallel.

なお、時系列データとして株価のデータを使用したが、使用するデータは株価のデータに限られるわけではなく、他の時系列データに対しても本実施の形態を適用することができる。   Although stock price data is used as time series data, the data used is not limited to stock price data, and the present embodiment can be applied to other time series data.

なお、使用するデータは時系列データ以外のデータであってもよい。すなわち、目的変数及び説明変数に時間が対応付けられていなくてもよい。   The data to be used may be data other than time series data. That is, the time does not have to be associated with the objective variable and the explanatory variable.

また、ステップS7においては、第1抽出結果格納部411に格納されており且つ第2抽出結果格納部412に格納されている説明変数の候補を最終候補としたが、他の方法で最終候補を決定してもよい。例えば、第1候補抽出処理において算出された評価値と第2候補抽出処理において算出された評価値との和が小さいものから順に所定個数の説明変数を最終候補としてもよい。   Further, in step S7, the explanatory variable candidates stored in the first extraction result storage unit 411 and stored in the second extraction result storage unit 412 are set as final candidates. You may decide. For example, a predetermined number of explanatory variables may be set as final candidates in order from the smallest sum of the evaluation value calculated in the first candidate extraction process and the evaluation value calculated in the second candidate extraction process.

また、情報処理装置1の処理を複数の台のコンピュータで実行させるようにしてもよい。   Further, the processing of the information processing apparatus 1 may be executed by a plurality of computers.

なお、上で述べた情報処理装置1は、コンピュータ装置であって、図34に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。   The information processing apparatus 1 described above is a computer apparatus, and as shown in FIG. 34, a memory 2501, a CPU (Central Processing Unit) 2503, a hard disk drive (HDD: Hard Disk Drive) 2505, and a display device. A display control unit 2507 connected to 2509, a drive device 2513 for the removable disk 2511, an input device 2515, and a communication control unit 2517 for connecting to a network are connected by a bus 2519. An operating system (OS: Operating System) and an application program for executing the processing in this embodiment are stored in the HDD 2505, and are read from the HDD 2505 to the memory 2501 when executed by the CPU 2503. The CPU 2503 controls the display control unit 2507, the communication control unit 2517, and the drive device 2513 according to the processing content of the application program, and performs a predetermined operation. Further, data in the middle of processing is mainly stored in the memory 2501, but may be stored in the HDD 2505. In an embodiment of the present technology, an application program for performing the above-described processing is stored in a computer-readable removable disk 2511 and distributed, and installed from the drive device 2513 to the HDD 2505. In some cases, the HDD 2505 may be installed via a network such as the Internet and the communication control unit 2517. Such a computer apparatus realizes various functions as described above by organically cooperating hardware such as the CPU 2503 and the memory 2501 described above and programs such as the OS and application programs. .

以上述べた本技術の実施の形態をまとめると、以下のようになる。   The embodiments of the present technology described above are summarized as follows.

本実施の形態に係る情報処理装置は、   The information processing apparatus according to this embodiment is

(A)記憶装置と、(B)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納する第1算出部と、(C)記憶装置に格納されている誤差に基づき複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納する第2算出部と、(D)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第1決定部とを有する。   For each of (A) a storage device and (B) a plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated. A first calculation unit that calculates and stores in the storage device; and (C) classifies the plurality of objective variables into a plurality of groups based on the error stored in the storage device, and assigns each of the plurality of groups to the group. A second calculation unit that calculates a representative value of the error using the error calculated for the target variable to which the variable belongs, and stores it in the storage device; and (D) a representative value stored in the storage device for each of the plurality of groups. A plurality of second prediction models for predicting the value are generated while changing the explanatory variables, and belong to the group based on the difference between each of the values calculated by the plurality of generated second prediction models and the representative value Purpose change And a first determining unit for determining the explanatory variable to be added to the first predictive model.

このように、第1の予測モデルに追加する説明変数を目的変数毎に決定するのではなく、グループ毎に決定することで、第1の予測モデルに追加する説明変数を決定する際に行う計算の量を削減することができるようになる。   In this way, the calculation performed when determining the explanatory variable to be added to the first prediction model by determining the explanatory variable to be added to the first prediction model by determining for each group instead of determining the explanatory variable to be added to the first prediction model. The amount of can be reduced.

また、上で述べた第1決定部が、(d1)複数の説明変数の候補の各々について、当該候補とグループに属する目的変数の第1の予測モデルに含まれる説明変数とを用いて第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と代表値との第1の差を算出し、記憶装置に格納する第3算出部と、(d2)第3算出部により算出された第1の差に基づき、複数の説明変数の候補の中から、グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第2決定部とを有するようにしてもよい。複数の説明変数が同じ予測モデルに含まれると、相乗効果により予測精度が大きく向上することがある。そのため、上で述べたようにすれば、第1の予測モデルに含まれる説明変数と一緒に利用すると予測精度が大きく向上する説明変数を取りこぼしにくくなる。   Further, the first determination unit described above uses (d1) a second for each of the plurality of explanatory variable candidates by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group. A third calculation unit that generates a first difference between the value calculated by the second prediction model and the representative value and stores the first difference in the storage device; and (d2) the third calculation unit. Based on the calculated first difference, a second determining unit that determines an explanatory variable to be added to the first prediction model of the target variable belonging to the group from among a plurality of explanatory variable candidates. Good. When multiple explanatory variables are included in the same prediction model, the prediction accuracy may be greatly improved due to a synergistic effect. Therefore, as described above, it is difficult to miss an explanatory variable whose prediction accuracy is greatly improved when it is used together with the explanatory variable included in the first prediction model.

また、上で述べた第3算出部が、(d11)複数の説明変数の候補の各々について、当該候補を用いて第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と代表値との第2の差を算出し、記憶装置に格納するようにしてもよい。そして、(E)第3算出部により算出された第1の差及び第2の差に基づき、複数の説明変数の候補の中から、グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する第3決定部をさらに有するようにしてもよい。このようにすれば、第1の予測モデルに含まれる説明変数との相乗効果が無いと仮定した場合に予測精度の向上に有効な説明変数を取りこぼしにくくなる。   Further, the third calculation unit described above (d11) generates a second prediction model for each of a plurality of explanatory variable candidates using the candidate, and the value calculated by the second prediction model The second difference between the value and the representative value may be calculated and stored in the storage device. (E) Explanation to be added to the first prediction model of the objective variable belonging to the group from among a plurality of candidate explanatory variables based on the first difference and the second difference calculated by the third calculation unit. You may make it further have the 3rd determination part which determines a variable. In this way, when it is assumed that there is no synergistic effect with the explanatory variable included in the first prediction model, it is difficult to miss the explanatory variable effective for improving the prediction accuracy.

また、上で述べた第1決定部が、(d3)第1の予測モデルに追加する説明変数を複数決定するようにしてもよい。そして、上で述べた本情報処理装置が、(F)複数の目的変数の各々について、当該目的変数の第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、記憶装置に格納する第4算出部と、(G)複数の目的変数の各々について、第4算出部により算出された誤差に基づき、第1決定部によって決定された複数の説明変数の中から、第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部とをさらに有するようにしてもよい。このようにすれば、各目的変数の予測精度の向上に最も有効な説明変数を特定することができるようになる。   In addition, the first determination unit described above may determine (d3) a plurality of explanatory variables to be added to the first prediction model. Then, the information processing apparatus described above performs (F) for each of the plurality of objective variables, the first determination unit determines the explanatory variable included in the first prediction model of the objective variable and the group to which the objective variable belongs. A plurality of third prediction models for predicting the value of the target variable are generated using each of the determined explanatory variables, and each of the values calculated by the third prediction model and the target A fourth calculation unit that calculates an error from the actual value of the variable and stores the error in the storage device; and (G) a first determination unit based on the error calculated by the fourth calculation unit for each of the plurality of target variables. And a fourth determination unit that determines the most appropriate explanatory variable to be added to the first prediction model from among the plurality of explanatory variables determined by the above. In this way, the most effective explanatory variable for improving the prediction accuracy of each objective variable can be identified.

また、上で述べた第2算出部が、(c1)複数の目的変数を、算出された誤差に基づくクラスタリングによって複数のグループに分類するようにしてもよい。例えばK平均法を利用することで複数の目的変数を適切に分類をすることができるようになる。   The second calculation unit described above may classify (c1) a plurality of objective variables into a plurality of groups by clustering based on the calculated error. For example, a plurality of objective variables can be appropriately classified by using the K average method.

また、上で述べた誤差の代表値が、グループに属する目的変数について算出された誤差の平均値であってもよい。これにより妥当な値を代表値とすることができるようになる。なお、平均値には限られず、例えば中央値などとしてもよい。   Further, the representative value of the error described above may be an average value of errors calculated for the objective variable belonging to the group. As a result, an appropriate value can be used as the representative value. In addition, it is not restricted to an average value, For example, it is good also as a median value.

本実施の形態に係る情報処理方法は、(H)複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、(I)記憶装置に格納されている誤差に基づき、複数の目的変数を複数のグループに分類し、(J)複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、記憶装置に格納し、(K)複数のグループの各々について、記憶装置に格納されている代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と代表値との差に基づき、当該グループに属する目的変数の第1の予測モデルに追加する説明変数を決定する処理を含む。   In the information processing method according to the present embodiment, (H) for each of a plurality of objective variables, the value calculated by the first prediction model for predicting the actual value of the objective variable and the value of the objective variable And (I) classifying a plurality of objective variables into a plurality of groups based on the error stored in the storage device, and (J) for each of the plurality of groups A representative value of the error is calculated using the error calculated for the objective variable belonging to the group, stored in the storage device, and (K) a representative value stored in the storage device is predicted for each of the plurality of groups. A plurality of second prediction models for the target variable belonging to the group are generated based on a difference between each of the values calculated by the plurality of generated second prediction models and the representative value. First Including a process of determining the explanatory variable to be added to the prediction model.

なお、上記方法による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。   A program for causing a computer to perform the processing according to the above method can be created. The program can be a computer-readable storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, a hard disk, or the like. It is stored in a storage device. The intermediate processing result is temporarily stored in a storage device such as a main memory.

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。   The following supplementary notes are further disclosed with respect to the embodiments including the above examples.

(付記1)
記憶装置と、
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、前記記憶装置に格納する第1算出部と、
前記記憶装置に格納されている前記誤差に基づき前記複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納する第2算出部と、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第1決定部と、
を有する情報処理装置。
(Appendix 1)
A storage device;
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device. 1 calculation unit;
The plurality of objective variables are classified into a plurality of groups based on the errors stored in the storage device, and for each of the plurality of groups, the error calculated using the errors calculated for the objective variables belonging to the group. A second calculating unit that calculates a representative value and stores the representative value in the storage device;
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. A first determination unit that determines an explanatory variable to be added to the first prediction model of an objective variable belonging to the group based on a difference between each of the calculated values and the representative value;
An information processing apparatus.

(付記2)
前記第1決定部が、
複数の説明変数の候補の各々について、当該候補と前記グループに属する目的変数の前記第1の予測モデルに含まれる説明変数とを用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第1の差を算出し、前記記憶装置に格納する第3算出部と、
前記第3算出部により算出された前記第1の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第2決定部と、
を有する付記1記載の情報処理装置。
(Appendix 2)
The first determination unit is
For each of a plurality of explanatory variable candidates, the second prediction model is generated by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group, and the second prediction Calculating a first difference between the value calculated by the model and the representative value, and storing the first difference in the storage device;
Determining an explanatory variable to be added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates based on the first difference calculated by the third calculating unit; 2 decision part;
The information processing apparatus according to claim 1, further comprising:

(付記3)
前記第3算出部が、
前記複数の説明変数の候補の各々について、当該候補を用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第2の差を算出し、前記記憶装置に格納し、
前記第3算出部により算出された前記第1の差及び前記第2の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第3決定部
をさらに有する付記2記載の情報処理装置。
(Appendix 3)
The third calculation unit is
For each of the plurality of explanatory variable candidates, the second prediction model is generated using the candidate, and a second difference between the value calculated by the second prediction model and the representative value is calculated. , Store in the storage device,
Based on the first difference and the second difference calculated by the third calculation unit, the candidate is added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates. The information processing apparatus according to attachment 2, further comprising a third determination unit that determines an explanatory variable.

(付記4)
前記第1決定部が、
前記第1の予測モデルに追加する説明変数を複数決定し、
前記複数の目的変数の各々について、当該目的変数の前記第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて前記第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、前記記憶装置に格納する第4算出部と、
前記複数の目的変数の各々について、前記第4算出部により算出された前記誤差に基づき、前記第1決定部によって決定された複数の説明変数の中から、前記第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部と、
をさらに有する付記1乃至3のいずれか1つ記載の情報処理装置。
(Appendix 4)
The first determination unit is
Determining a plurality of explanatory variables to be added to the first prediction model;
For each of the plurality of objective variables, an explanatory variable included in the first prediction model of the objective variable and each of the plurality of explanatory variables determined by the first determination unit for the group to which the objective variable belongs are used. A plurality of third prediction models for predicting the value of the target variable, and calculating an error between each of the values calculated by the third prediction model and the actual value of the target variable, A fourth calculation unit stored in the storage device;
For each of the plurality of objective variables, most of the plurality of explanatory variables determined by the first determination unit based on the error calculated by the fourth calculation unit is added to the first prediction model. A fourth determination unit for determining an appropriate explanatory variable;
The information processing apparatus according to any one of appendices 1 to 3, further comprising:

(付記5)
前記第2算出部が、
前記複数の目的変数を、算出された前記誤差に基づくクラスタリングによって複数のグループに分類する
付記1乃至4のいずれか1つ記載の情報処理装置。
(Appendix 5)
The second calculation unit is
The information processing apparatus according to any one of attachments 1 to 4, wherein the plurality of objective variables are classified into a plurality of groups by clustering based on the calculated error.

(付記6)
前記誤差の代表値が、前記グループに属する目的変数について算出された前記誤差の平均値である
付記1乃至5いずれか1つ記載の情報処理装置。
(Appendix 6)
The information processing apparatus according to any one of attachments 1 to 5, wherein the representative value of the error is an average value of the errors calculated for the objective variable belonging to the group.

(付記7)
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータが実行する情報処理方法。
(Appendix 7)
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
An information processing method in which processing is executed by a computer.

(付記8)
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータに実行させるためのプログラム。
(Appendix 8)
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
A program that causes a computer to execute processing.

1 情報処理装置 2 グルーピング処理部
3 グルーピング結果格納部 4 候補抽出部
5 学習データ格納部 6 候補格納部
7 決定部 8 決定結果格納部
9 出力部
21 第1モデル生成部 22 第1モデル格納部
23 第1誤差算出部 24 第1誤差データ格納部
25 グループ生成部 401 第2モデル生成部
402 第2モデル格納部 403 第3モデル格納部
404 第2誤差算出部 405 第2誤差データ格納部
406 第3誤差データ格納部 407 第1評価値算出部
408 第1評価値格納部 409 第2評価値格納部
410 抽出部 411 第1抽出結果格納部
412 第2抽出結果格納部 413 第1特定部
71 第3モデル生成部 72 第4モデル格納部
73 第3誤差算出部 74 第4誤差データ格納部
75 第2評価値算出部 76 第3評価値格納部
77 第2特定部
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 2 Grouping process part 3 Grouping result storage part 4 Candidate extraction part 5 Learning data storage part 6 Candidate storage part 7 Determination part 8 Determination result storage part 9 Output part 21 1st model production | generation part 22 1st model storage part 23 First error calculation unit 24 First error data storage unit 25 Group generation unit 401 Second model generation unit 402 Second model storage unit 403 Third model storage unit 404 Second error calculation unit 405 Second error data storage unit 406 Third Error data storage unit 407 First evaluation value calculation unit 408 First evaluation value storage unit 409 Second evaluation value storage unit 410 Extraction unit 411 First extraction result storage unit 412 Second extraction result storage unit 413 First identification unit 71 Third Model generation unit 72 Fourth model storage unit 73 Third error calculation unit 74 Fourth error data storage unit 75 Second evaluation value calculation unit 76 Third evaluation value storage unit 77 Second Part

Claims (6)

記憶装置と、
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、前記記憶装置に格納する第1算出部と、
前記記憶装置に格納されている前記誤差に基づき前記複数の目的変数を複数のグループに分類し、当該複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納する第2算出部と、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第1決定部と、
を有する情報処理装置。
A storage device;
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device. 1 calculation unit;
The plurality of objective variables are classified into a plurality of groups based on the errors stored in the storage device, and for each of the plurality of groups, the error calculated using the errors calculated for the objective variables belonging to the group. A second calculating unit that calculates a representative value and stores the representative value in the storage device;
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. A first determination unit that determines an explanatory variable to be added to the first prediction model of an objective variable belonging to the group based on a difference between each of the calculated values and the representative value;
An information processing apparatus.
前記第1決定部が、
複数の説明変数の候補の各々について、当該候補と前記グループに属する目的変数の前記第1の予測モデルに含まれる説明変数とを用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第1の差を算出し、前記記憶装置に格納する第3算出部と、
前記第3算出部により算出された前記第1の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第2決定部と、
を有する請求項1記載の情報処理装置。
The first determination unit is
For each of a plurality of explanatory variable candidates, the second prediction model is generated by using the candidate and the explanatory variable included in the first prediction model of the objective variable belonging to the group, and the second prediction Calculating a first difference between the value calculated by the model and the representative value, and storing the first difference in the storage device;
Determining an explanatory variable to be added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates based on the first difference calculated by the third calculating unit; 2 decision part;
The information processing apparatus according to claim 1.
前記第3算出部が、
前記複数の説明変数の候補の各々について、当該候補を用いて前記第2の予測モデルを生成し、当該第2の予測モデルによって算出された値と前記代表値との第2の差を算出し、前記記憶装置に格納し、
前記第3算出部により算出された前記第1の差及び前記第2の差に基づき、前記複数の説明変数の候補の中から、前記グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する第3決定部
をさらに有する請求項2記載の情報処理装置。
The third calculation unit is
For each of the plurality of explanatory variable candidates, the second prediction model is generated using the candidate, and a second difference between the value calculated by the second prediction model and the representative value is calculated. , Store in the storage device,
Based on the first difference and the second difference calculated by the third calculation unit, the candidate is added to the first prediction model of the objective variable belonging to the group from the plurality of explanatory variable candidates. The information processing apparatus according to claim 2, further comprising a third determination unit that determines an explanatory variable.
前記第1決定部が、
前記第1の予測モデルに追加する説明変数を複数決定し、
前記複数の目的変数の各々について、当該目的変数の前記第1の予測モデルに含まれる説明変数と当該目的変数が属するグループについて前記第1決定部によって決定された複数の説明変数の各々とを用いて、当該目的変数の値を予測するための第3の予測モデルを複数生成し、当該第3の予測モデルによって算出された値の各々と当該目的変数の実際の値との誤差を算出し、前記記憶装置に格納する第4算出部と、
前記複数の目的変数の各々について、前記第4算出部により算出された前記誤差に基づき、前記第1決定部によって決定された複数の説明変数の中から、前記第1の予測モデルに追加する最も適切な説明変数を決定する第4決定部と、
をさらに有する請求項1乃至3のいずれか1つ記載の情報処理装置。
The first determination unit is
Determining a plurality of explanatory variables to be added to the first prediction model;
For each of the plurality of objective variables, an explanatory variable included in the first prediction model of the objective variable and each of the plurality of explanatory variables determined by the first determination unit for the group to which the objective variable belongs are used. A plurality of third prediction models for predicting the value of the target variable, and calculating an error between each of the values calculated by the third prediction model and the actual value of the target variable, A fourth calculation unit stored in the storage device;
For each of the plurality of objective variables, most of the plurality of explanatory variables determined by the first determination unit based on the error calculated by the fourth calculation unit is added to the first prediction model. A fourth determination unit for determining an appropriate explanatory variable;
The information processing apparatus according to any one of claims 1 to 3, further comprising:
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータが実行する情報処理方法。
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
An information processing method in which processing is executed by a computer.
複数の目的変数の各々について、当該目的変数の実際の値と当該目的変数の値を予測するための第1の予測モデルによって算出された値との誤差を算出し、記憶装置に格納し、
前記記憶装置に格納されている前記誤差に基づき、前記複数の目的変数を複数のグループに分類し、
前記複数のグループの各々について、当該グループに属する目的変数について算出された誤差を用いて当該誤差の代表値を算出し、前記記憶装置に格納し、
前記複数のグループの各々について、前記記憶装置に格納されている前記代表値を予測するための第2の予測モデルを説明変数を変えつつ複数生成し、生成された複数の第2の予測モデルによって算出された値の各々と前記代表値との差に基づき、当該グループに属する目的変数の前記第1の予測モデルに追加する説明変数を決定する、
処理をコンピュータに実行させるためのプログラム。
For each of the plurality of objective variables, an error between the actual value of the objective variable and the value calculated by the first prediction model for predicting the value of the objective variable is calculated and stored in the storage device.
Classifying the plurality of objective variables into a plurality of groups based on the error stored in the storage device;
For each of the plurality of groups, a representative value of the error is calculated using the error calculated for the objective variable belonging to the group, and is stored in the storage device.
For each of the plurality of groups, a plurality of second prediction models for predicting the representative value stored in the storage device are generated while changing the explanatory variables, and the generated plurality of second prediction models are used. Based on a difference between each calculated value and the representative value, an explanatory variable to be added to the first prediction model of the objective variable belonging to the group is determined.
A program that causes a computer to execute processing.
JP2012013698A 2012-01-26 2012-01-26 Information processing apparatus, information processing method, and program for determining explanatory variables Expired - Fee Related JP5794160B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012013698A JP5794160B2 (en) 2012-01-26 2012-01-26 Information processing apparatus, information processing method, and program for determining explanatory variables

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012013698A JP5794160B2 (en) 2012-01-26 2012-01-26 Information processing apparatus, information processing method, and program for determining explanatory variables

Publications (2)

Publication Number Publication Date
JP2013152656A true JP2013152656A (en) 2013-08-08
JP5794160B2 JP5794160B2 (en) 2015-10-14

Family

ID=49048935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012013698A Expired - Fee Related JP5794160B2 (en) 2012-01-26 2012-01-26 Information processing apparatus, information processing method, and program for determining explanatory variables

Country Status (1)

Country Link
JP (1) JP5794160B2 (en)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016057118A (en) * 2014-09-08 2016-04-21 株式会社ペコIpmパイロット Evaluation method for agricultural chemicals
WO2016121328A1 (en) * 2015-01-28 2016-08-04 日本電気株式会社 Prediction result display system, prediction result display method and prediction result display program
JP6130977B1 (en) * 2016-05-24 2017-05-17 三井情報株式会社 Information processing apparatus, information processing method, information processing system, and program
US9740545B2 (en) 2015-03-20 2017-08-22 Kabushiki Kaisha Toshiba Equipment evaluation device, equipment evaluation method and non-transitory computer readable medium
WO2017212880A1 (en) * 2016-06-09 2017-12-14 株式会社日立製作所 Data prediction system and data prediction method
JP2017224268A (en) * 2016-06-09 2017-12-21 株式会社日立製作所 Data prediction system and data prediction method
WO2018079225A1 (en) * 2016-10-31 2018-05-03 日本電気株式会社 Automatic prediction system, automatic prediction method and automatic prediction program
WO2018186090A1 (en) 2017-04-06 2018-10-11 テンソル・コンサルティング株式会社 Model variable candidate generation device and method
JP2018538587A (en) * 2016-02-01 2018-12-27 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Risk assessment method and system
JP2019090826A (en) * 2019-02-04 2019-06-13 株式会社ペコIpmパイロット Evaluation method for agricultural chemicals
US10373068B2 (en) 2014-11-10 2019-08-06 International Business Machines Corporation Weight adjusted composite model for forecasting in anomalous environments
JP2020181494A (en) * 2019-04-26 2020-11-05 Necソリューションイノベータ株式会社 Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program, and recording medium
US10885011B2 (en) 2015-11-25 2021-01-05 Dotdata, Inc. Information processing system, descriptor creation method, and descriptor creation program
US11514062B2 (en) 2017-10-05 2022-11-29 Dotdata, Inc. Feature value generation device, feature value generation method, and feature value generation program
US11727203B2 (en) 2017-03-30 2023-08-15 Dotdata, Inc. Information processing system, feature description method and feature description program
WO2024257351A1 (en) * 2023-06-16 2024-12-19 富士通株式会社 Estimation program, information processing device, and estimation method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167152A (en) * 1995-12-19 1997-06-24 Hitachi Ltd Interactive model creation method
WO2003085548A1 (en) * 2002-04-04 2003-10-16 Ishihara Sangyo Kaisha, Ltd. Apparatus and method for analyzing data
US20060100836A1 (en) * 2004-11-09 2006-05-11 Amardeep Singh Performance forecasting and bit selection tool for drill bits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167152A (en) * 1995-12-19 1997-06-24 Hitachi Ltd Interactive model creation method
WO2003085548A1 (en) * 2002-04-04 2003-10-16 Ishihara Sangyo Kaisha, Ltd. Apparatus and method for analyzing data
US20060100836A1 (en) * 2004-11-09 2006-05-11 Amardeep Singh Performance forecasting and bit selection tool for drill bits

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016057118A (en) * 2014-09-08 2016-04-21 株式会社ペコIpmパイロット Evaluation method for agricultural chemicals
US10373068B2 (en) 2014-11-10 2019-08-06 International Business Machines Corporation Weight adjusted composite model for forecasting in anomalous environments
WO2016121328A1 (en) * 2015-01-28 2016-08-04 日本電気株式会社 Prediction result display system, prediction result display method and prediction result display program
US10949755B2 (en) 2015-01-28 2021-03-16 Nec Corporation Prediction result display system, prediction result display method, and prediction result display program
US9740545B2 (en) 2015-03-20 2017-08-22 Kabushiki Kaisha Toshiba Equipment evaluation device, equipment evaluation method and non-transitory computer readable medium
US10885011B2 (en) 2015-11-25 2021-01-05 Dotdata, Inc. Information processing system, descriptor creation method, and descriptor creation program
JP2018538587A (en) * 2016-02-01 2018-12-27 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Risk assessment method and system
JP6130977B1 (en) * 2016-05-24 2017-05-17 三井情報株式会社 Information processing apparatus, information processing method, information processing system, and program
JP2017224268A (en) * 2016-06-09 2017-12-21 株式会社日立製作所 Data prediction system and data prediction method
WO2017212880A1 (en) * 2016-06-09 2017-12-14 株式会社日立製作所 Data prediction system and data prediction method
US11593690B2 (en) 2016-06-09 2023-02-28 Hitachi, Ltd. Data prediction system and data prediction method
JP7069029B2 (en) 2016-10-31 2022-05-17 ドットデータ インコーポレイテッド Automatic prediction system, automatic prediction method and automatic prediction program
WO2018079225A1 (en) * 2016-10-31 2018-05-03 日本電気株式会社 Automatic prediction system, automatic prediction method and automatic prediction program
JPWO2018079225A1 (en) * 2016-10-31 2019-09-12 日本電気株式会社 Automatic prediction system, automatic prediction method, and automatic prediction program
US11727203B2 (en) 2017-03-30 2023-08-15 Dotdata, Inc. Information processing system, feature description method and feature description program
US11562262B2 (en) 2017-04-06 2023-01-24 Tensor Consulting Co. Ltd. Model variable candidate generation device and method
WO2018186090A1 (en) 2017-04-06 2018-10-11 テンソル・コンサルティング株式会社 Model variable candidate generation device and method
US11514062B2 (en) 2017-10-05 2022-11-29 Dotdata, Inc. Feature value generation device, feature value generation method, and feature value generation program
JP2019090826A (en) * 2019-02-04 2019-06-13 株式会社ペコIpmパイロット Evaluation method for agricultural chemicals
JP2020181494A (en) * 2019-04-26 2020-11-05 Necソリューションイノベータ株式会社 Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program, and recording medium
JP7464240B2 (en) 2019-04-26 2024-04-09 Necソリューションイノベータ株式会社 Prediction model generation device, travel suitability prediction device, prediction model production method, travel suitability prediction method, program and recording medium
WO2024257351A1 (en) * 2023-06-16 2024-12-19 富士通株式会社 Estimation program, information processing device, and estimation method

Also Published As

Publication number Publication date
JP5794160B2 (en) 2015-10-14

Similar Documents

Publication Publication Date Title
JP5794160B2 (en) Information processing apparatus, information processing method, and program for determining explanatory variables
Idris et al. Intelligent churn prediction for telecom using GP-AdaBoost learning and PSO undersampling
JP5144830B2 (en) Pipeline optimizer system
CN113326377B (en) Name disambiguation method and system based on enterprise association relationship
CN109657805A (en) Hyper parameter determines method, apparatus, electronic equipment and computer-readable medium
JP2021518024A (en) How to generate data for machine learning algorithms, systems
CN112270546A (en) Risk prediction method and device based on stacking algorithm and electronic equipment
KR20200115708A (en) Method for Price Prediction of Resource Based on Deep Learning
JPWO2016151618A1 (en) Prediction model update system, prediction model update method, and prediction model update program
CN103838857B (en) Automatic service combination system and method based on semantics
CN105447038A (en) Method and system for acquiring user characteristics
JP2014059754A (en) Information processing system, and information processing method
US20230350647A1 (en) Programming Aiding Apparatus and Programming Aiding Method
CN107862406A (en) Using deep learning and the method for the primary equipment risk profile for improving Apriori algorithm synthesis
CN109241442B (en) Item recommendation method, readable storage medium and terminal based on predicted value filling
Maquee et al. Clustering and association rules in analyzing the efficiency of maintenance system of an urban bus network
CN113326869A (en) Deep learning calculation graph optimization method based on longest path fusion algorithm
JPWO2018235841A1 (en) Graph structure analysis device, graph structure analysis method, and program
CN113743453A (en) Population quantity prediction method based on random forest
CN117938504A (en) Intelligent arrangement method of security policy based on data driving
KR102480518B1 (en) Method for credit evaluation model update or replacement and apparatus performing the method
CN116304722A (en) Training Method of Vector Retrieval Model Based on Balanced Tree Index Structure
JP2013003611A (en) Design verification method and program
JP7543944B2 (en) Machine learning program, machine learning method, and estimation device
CN114662116A (en) Service operation vulnerability searching method based on big data and cloud deep learning system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R150 Certificate of patent or registration of utility model

Ref document number: 5794160

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees