JPH10154002A - 総合制御方式 - Google Patents
総合制御方式Info
- Publication number
- JPH10154002A JPH10154002A JP9145610A JP14561097A JPH10154002A JP H10154002 A JPH10154002 A JP H10154002A JP 9145610 A JP9145610 A JP 9145610A JP 14561097 A JP14561097 A JP 14561097A JP H10154002 A JPH10154002 A JP H10154002A
- Authority
- JP
- Japan
- Prior art keywords
- control
- control method
- layer
- learning
- evolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Combined Controls Of Internal Combustion Engines (AREA)
- Feedback Control In General (AREA)
- Auxiliary Drives, Propulsion Controls, And Safety Devices (AREA)
- Vehicle Body Suspensions (AREA)
- Electrical Control Of Air Or Fuel Supplied To Internal-Combustion Engine (AREA)
Abstract
実現できる総合制御方式を提供こと。 【解決手段】 本発明の総合制御方式は、反射層、学習
層、及び進化適応層から成り、反射層で基本操作量を決
定し、学習層で補正基本量を決定すると共に、進化適応
層で、使用者及び/又は使用状況の特性を判断し、その
判断結果に基づいて、前記特性に合わせて補正量に関す
る制御モジュールを遺伝的アルゴリズムにより進化させ
て最適制御モジュールを獲得し、該最適制御モジュール
を学習層に学習させる。
Description
に制御する総合制御方式に関する。
性を制御する場合、制御対象となる製品の特性は、開発
・設計段階で、その製品を使用すると思われる使用者を
想定し、その仮想使用者の好みや使用状況を加味し、で
きるだけ広い範囲の使用者に適応するように決められ
る。
を使用する使用者は、個々に特有の個性を持っており、
その好みも千差万別であるため、前記したように、その
製品を使用すると思われる使用者の好み等を想定して製
品の開発・設計を行ったとしても、全ての使用者が満足
する特性を提供することは不可能であるという問題があ
る。上記した問題を解決するために、現在は、使用者が
製品購入前に、その製品の特性を確認し、特性が自分の
満足するものであるか否かを判断することが行われてい
るが、この購入前の製品の特性の確認は使用者にとって
煩わしいものである。また、基本的に同一製品は同じ特
性で制御されることが多いため、例えば、製品のデザイ
ンは気に入っているのに特性が気に入らないために、そ
の製品の購入を断念せざるえない等、特性により製品の
選択範囲が制限されるという問題も生じる。本発明は、
上記した従来の問題点を解決し、全ての使用者が満足し
得る特性を実現できる総合制御方式を提供することを目
的としている。
ために、本発明に係る総合制御方式は、使用者及び/又
は使用状況の特性を判断し、その判断結果に基づいて、
使用者及び/又は使用状況の特性に合わせて制御対象を
制御する制御系の制御特性を変化させることを特徴とす
るものである。
の実施の形態を添付図面に示した一実施例を参照して説
明する。図1は本発明に係る総合制御方式の基本概念を
示すブロック図である。図面に示すように、この総合制
御方式は、反射層、学習層、及び進化適応層の三つの制
御層から成り、外部から制御すべき制御対象に関する情
報(例えば、動作状態に関する情報等)を入力し、この
入力情報に基づいて反射層で基本操作量を決定し、学習
層及び進化適応層で基本操作量に対する補正量を決定
し、これら基本操作量及び補正量から最終的な制御出力
を決定する。以下、総合制御方式における反射層、学習
層、及び進化適応層の働きについて説明する。反射層
は、制御対象に関する情報(以下、外界情報と称す
る。)と、外界情報に対する基本操作量との関係を数
式、マップ、ファジールール、ニューラル回路網、又は
サブサンプションアーキテクチャ等の形式の制御系で予
め備えている層であり、外界情報が入力されると、上記
した制御系から入力された外界情報に対する基本操作量
を決定して出力する。尚、前記サブサンプションアーキ
テクチャとは、並列的な処理を行う行動型人工知能とし
て公知である。進化適応層は、評価系と進化適応系との
二つの制御系から成る。評価系は、外界情報、及び/又
は使用者の特性(例えば、好み、技量、又は状態等)に
関する情報、及び/又は使用状況の特性(例えば、使用
環境の変化等)に関する情報を入力し、これら外界情報
等から制御すべき制御対象を使用する使用者及び/又は
使用状況の特性を推定すると共に、この使用者及び/又
は使用状況の特性に基づいて進化適応系における進化処
理中の評価を行う。進化適応系は、反射層で決められた
基本操作量を使用者及び/又は使用状況の特性に合わせ
るように補正するための少なくとも一つの制御モジュー
ルを備え、この制御モジュールを評価系の判断に基づい
て遺伝的に進化させて、その時点で最適な少なくとも一
つの制御モジュールを獲得する。進化適応系は最適な制
御モジュールを獲得した後は、制御モジュールを最適な
ものに固定して、反射層から出力される基本操作量を補
正する進化補正値を出力する。学習層は、学習用と実行
用に入れ替え可能な二つの制御系を備え、一方の制御系
(実行用)で制御を実行している間、他方の制御系(学
習用)で、進化適応層の進化した最適な制御モジュール
に関する入出力関係と、学習層の実行用の制御系の入出
力関係とを合わせて学習する。学習用制御系での学習が
終了すると、制御を実行している制御系と学習後の制御
系が入れ替わり、学習後の制御系で学習結果から得られ
る制御モジュールによる制御を開始し、制御を実行して
いた制御系が学習用として機能し始める。尚、この学習
層における制御系は初期状態ではゼロを出力するように
設定されており、従って、初期状態では反射層と進化適
応層とによる制御が行われる。進化適応層は、最適な制
御モジュールに関する情報を学習層に学習させた後は、
その出力をゼロに戻し、一定時間間隔で作動して、使用
者の好み及び/又は使用環境の評価と、制御モジュール
の進化とを行い、進化適応層の出力を加えた時の評価
が、進化適応層の出力を加えていない時の評価より優れ
ている場合は、再度学習層に最適な制御モジュールに関
する情報を学習させる。尚、学習層における学習済みの
制御モジュールに関する情報は、ICカードやフロッピ
ーディスク等の外部記憶手段に保存・読み出し可能にさ
れており、使用者が必要に応じて過去の最適制御モジュ
ールに関する情報を外部記憶手段から読み出して、その
情報に基づいて学習層で基本補正量を出力することがで
きるようにされている。また、使用者が外部記憶手段か
ら過去の最適制御モジュールに関する情報を読み出して
学習層を作動させる場合、学習層が読み出した制御モジ
ュールによって作動している間は、進化適応層は、その
出力がゼロに固定され、制御モジュールの進化処理を停
止する。上記した各層の働きにより、この総合制御方式
からの制御出力は、制御すべき制御対象を使用する使用
者の好みや使用環境の変化等の特性に合わせて刻々と変
化し、その結果、制御対象の特性は使用者及び/又は使
用状況の特性に適応した動作に刻々と変化していく。本
明細書では、この総合制御方式により制御対象の特性が
使用者及び/又は使用状況の特性に適応して進化してい
く状態を「調教」と称する。
示すフローチャートである。初期状態では、学習層の出
力はゼロであり(ステップa)、従って、制御対象の使
用が開始された直後は反射層からの基本操作量だけで制
御対象は制御される。制御対象の使用が開始されると、
進化適応層は、使用者及び/又は使用状況の特性を評価
し、この評価値に応じて、その制御モジュールを進化さ
せる(ステップb)。進化適応層は、各制御モジュール
を遺伝的に進化させることにより、その時点で最も望ま
しい少なくとも一つの制御モジュールを獲得する(ステ
ップc)。進化適応層は、その制御モジュールをステッ
プcで得た最も望ましい制御モジュールに固定し、その
制御モジュールに基づいて進化系補正値を出力して、反
射層から出力される基本操作量を補正する。学習層で
は、進化適応層が最適制御モジュールに固定された時の
進化適応層の入出力関係と学習層の実行用制御系の入出
力関係を学習用制御系で合わせて学習する。尚、初期状
態においては学習層の実行用制御系の出力はゼロである
が、学習後は反射層からの基本操作量を学習層からの基
本補正量と進化適応層からの進化系補正量で補正するこ
とになる(ステップd)。反射層からの基本操作量に学
習層における学習用制御系の出力を加えた値と、実際の
制御出力(基本操作量+基本補正量+進化系補正量)と
の差がしきい値より小さくなった時点で学習層における
学習用制御系は学習を終了し、学習用制御系と実行用制
御系とが入れ替わって、学習後の制御系が実行用として
機能し、制御を実行していた制御系が学習用として機能
し(ステップe)、反射層と学習層とによる制御が行わ
れる(ステップf)。進化適応層は、最適な制御モジュ
ールに関する情報を学習層に学習させた後、一定時間間
隔で作動し、学習層の制御則の経時的なずれを評価する
(ステップg)。具体的には、進化適応層の制御モジュ
ールを遺伝的に進化させる時の初期世代において最大適
応度の改善がみられない場合には、制御層の制御則のず
れはないものとしてステップfに移行して反射層と学習
層とによる制御を継続し、最大適応度の改善がみられる
場合には、ステップbに移行して進化適応層で新たな最
適制御モジュールの獲得を行う。
御対象として車両用エンジンを例に挙げて、さらに具体
的に説明する。図3は、エンジン1と前記総合制御方式
を実行する制御装置10との関係を示す概略図である。
図面に示すように、制御装置10は、エンジン回転数、
吸気負圧、スロットル開度、スロットル開度変化率、大
気圧、吸気温度、冷却水温、ギヤポジション等の情報を
入力し、これら入力情報に基づいて燃費性能と加速性能
の両立を図ったエンジン制御を行う。図4は、前記制御
装置10の概略ブロック図である。この制御装置10
は、上述したように反射層、学習層、及び進化適応層か
ら成る。
転数、吸気負圧、スロットル開度、スロットル開度変化
率、大気圧、吸気温度、及び冷却水温等を入力して、こ
れらの入力信号に基づいて予め決められた数式をモデル
化した方程式から燃料噴射量の基本的な値(即ち、燃料
噴射装置の基本操作量)を決定して出力する。
価系と進化適応系とから成る。図5は、進化適応層の基
本動作のフローチャートである。以下、このフローチャ
ートを参照して進化適応層の基本動作について説明す
る。評価系は、一定時間内の各ギヤポジションにおける
最高回転数の分布パターン(図6及び図7参照)と走行
状態指数Pとの関係を学習したニューラル回路網(図8
参照)を備えており、ギヤポジション信号とエンジン回
転数信号を入力し(ステップ1)、前記入力情報から前
記ニューラル回路網により走行状態指数Pを決定する。
例えば、スポーティな走行を好む使用者は、低速のギヤ
で高い回転数までエンジンを回す傾向にあるため、その
分布パターンは図6(a)に示すようになり、また、マ
イルドな走行を好む使用者は、早めに高速のギヤに変え
ていく傾向にあるため、その分布パターンは図6(b)
に示すようになる。従って、図8に示したニューラル回
路網で、図6(a)に示す分布パターンの時に走行状態
指数Pが大きな値となり、また、図6(b)に示す分布
パターンの時に走行状態指数Pが小さな値となるように
予め学習しておくと、前記ニューラル回路網から得られ
る走行状態指数Pは、使用者の走行に対する好みがスポ
ーティであればある程大きくなり、マイルドであればあ
るほど小さくなり、使用者の好みが反映したものにな
る。また、図7(a)に示すように一定時間内に1速か
ら6速までの各ギヤを使用した場合には走行状態指数P
の値が大となり、図7(b)に示すように低速のギヤば
かりを使用した場合には走行状態指数Pの値がやや大と
なり、また図7(c)のように高速のギヤばかりを使用
した場合には走行状態指数Pの値が小となるように前記
ニューラル回路網で学習しておけば、通常車両では、通
常走行の場合には各ギヤを使用し、渋滞路走行の時には
低速ギヤばかりを使用し、また、高速道路走行の時に
は、高速ギヤばかりを使用するので、ニューラル回路網
で得られる走行状態指数Pに基づいて、例えば、図7
(a)の場合は通常走行であり、図7(b)の場合は渋
滞路走行であり、図7(c)の場合は高速道路走行であ
ると推定することができる。評価系は、この走行状態指
数Pから、その時の走行状況を推定し、かつ、使用者の
好みが燃費性能重視か、加速性能重視かを判断して加速
重視割合αを決定する。加速度重視割合αは、図9に示
すように、予め決められた加速度重視割合αと走行状態
指数Pとの関数から求められ、例えば、高速道路走行時
(図7(c)参照)で走行状態指数Pが小さい時には加
速度重視割合αは小さく燃費重視の値となり、また、ス
ポーティな走行時(図6(b)参照)で走行状態指数P
が大きい時には加速度重視割合αは大きく加速度重視の
値となる。進化適応系は、燃費モジュールと加速モジュ
ールとを有し、これらモジュールを相互に協調、競合さ
せることで適応的な変化を得る。前記各モジュールは、
図10に示すように各々2入力1出力の階層型ニューラ
ル回路網で構成され、燃費モジュールは燃費性能の向
上、加速モジュールは加速性能の向上をそれぞれ目指
す。各モジュールへの入力は、エンジン回転数信号とス
ロットル開度で、これらの入力を基に、それぞれが燃料
噴射量の補正量(即ち、反射層からの基本操作量の補正
量)を出力するよう構成されている。進化適応層は、こ
の2種類の制御モジュールの協調、競合を実現するた
め、燃費モジュールと加速モジュールを構成するニュー
ラル回路網の結合度を、評価系での評価に合わせて、即
ち、使用者の好みと使用環境に合わせて、遺伝的アルゴ
リズムを用いて交互に進化させ(ステップ4)、両方の
モジュールの進化が終了した後、両方のモジュールのニ
ューラル回路網の結合度を進化した結合度で固定して、
両モジュールの出力に基づく進化補正値Yによるエンジ
ン制御を行う(ステップ5)。尚、前記したステップ4
におけるモジュールの遺伝的な変化による進化は、各モ
ジュール別に交互に行われ、従って、燃費モジュールが
進化している時は加速モジュールのニューラル回路網の
結合度は固定され、また、加速モジュールが進化してい
る時は燃費モジュールのニューラル回路網の結合度は固
定されている。この進化適応層における進化補正値Yに
よるエンジン制御は、後述する学習層による学習が終了
するまで続けられ(ステップ6)、学習層での学習が終
了すると、燃費モジュール及び加速モジュールをリセッ
トして、進化適応層の出力をゼロにする(ステップ
7)。
ルの進化を、図11のフローチャートを参照して燃費モ
ジュールの進化を例に挙げて説明する。始めに、図12
に示すように、燃費モジュールに対して、それを構成す
るニューラル回路網の結合係数を遺伝子としてコーディ
ングして複数の個体an(本実施例では9個の個体)か
らなる第1世代を生成する(ステップ1)。各個体の遺
伝子の値(即ち、ニューラル回路網の結合係数の値)の
初期値は予め決められた範囲内(ほぼ−10〜10の
間)でランダムに決定する。またこの時、既に学習層が
学習を行い出力をしている場合には、進化適応層の出力
をゼロにできる個体(図12における個体a(1))を
一つ含ませることで、個体数に制限がある場合でもその
時点の性能を損なうことなく進化処理中の個体群の多様
性を保つことができる。次に、ステップ1で生成された
個体anの中の一つ、例えば、個体a(1)に対して、
燃費モジュールのニューラル回路網を用いて実際の入力
情報(エンジン回転数及びスロットル開度)に対するニ
ューラル回路網の出力xを決定し(ステップ4)、さら
にこの出力を式(1)を用いて線形変換して燃費モジュ
ールの出力yfを決定する(ステップ5)。尚、入力情
報のエンジン回転数及びスロットル開度はそれぞれ正規
化したものを用い、燃費モジュールからの出力は次式
(1)を用いてニューラル回路網の出力を線形変換して
用いる。 yf = 2×Gx−G (1) ここで、yfは燃費モジュールの出力、xは燃費モジュ
ールにおけるニューラル回路網の出力、Gは進化適応層
出力ゲインである。このように、ニューラル回路網の出
力xを線形変換して用いることにより、燃費モジュール
からの出力yfが極端に大きな値になることがなく、全
体として進化がすこしづつ進むようになり、エンジンの
挙動が評価や進化のために極端に変動することがなくな
る。個体a(1)に対する燃費モジュールの出力yfを
決定した後、この出力yfと結合係数が固定された加速
モジュールの出力yaの平均加重をとって進化適応層の
出力(仮補正量Yn(1))を算出する(ステップ
6)。この加重は、前記評価系で求めた加速重視割合α
から決める。燃費モジュールの出力をyf、加速制御モ
ジュールの出力をyaとすると、進化適応層から出力さ
れる仮補正量Ynは次式(2)のようになる。 Yn = αya+(1−α)yf (2) つまり、加速重視割合が1の場合、仮補正量Ynは加速
モジュールのみの出力となり、加速重視割合が0の場
合、仮補正量Ynは燃費モジュールのみの出力となる。
個体a(1)に対する進化適応層の出力Yn(1)が決
定した後、この仮補正値Yn(1)を実際に進化適応層
から出力して、反射層からの基本操作量に加算し、仮補
正値Yn(1)で補正した制御出力でエンジンを作動さ
せる(ステップ7)。進化適応層における評価系は、個
体a(1)から得られる仮補正量Yn(1)で補正した
制御出力により動作されたエンジンから燃費に関するフ
ィードバック情報を入力して燃費を算出し(ステップ
8)、その結果に基づいて個体a(1)に対する評価を
行い、個体a(1)に対する適応度を求める(ステップ
9)。尚、燃費は、走行距離と消費燃料から算出する。
上記したステップ4からステップ9までの処理は、ステ
ップ1で生成された9個の個体a(1)〜a(9)に対
する適応度を算出するまで行われ、全ての個体に対する
適応度を算出した後に次の処理に進む(ステップ1
0)。尚、2個目の個体a(2)からの前記ステップ4
〜ステップ9までの処理は、各個体の適応度を同じ条件
で評価するために、処理に入る前に走行状況を確認し
(ステップ2)、走行状況が最初の個体a(1)の時の
走行状況と同じかどうかの判断を行う(ステップ3)。
全ての個体に対する適応度を算出した後、その個体の属
する世代が最終世代か否かを判断し(ステップ11)、
最終世代でなければ親個体の選択を行う(ステップ1
2)。この選択にはルーレット式選択方式を用い、各個
体の適応度に比例した確率で、確率的に幾つかの親個体
を選択する。尚、この時、厳密に世代交代を適用しすぎ
ると、評価の高い個体を破壊してしまう恐れがあるた
め、エリート(評価の最も高い個体)を無条件に次世代
に残すエリート保存戦略も合わせて用いる。また、複数
の個体から成る集団内の最大適応度と平均適応度の比が
一定となるように、適応度の線形変換を行う。親個体の
選択が終わると、選択された個体を親個体として、交叉
を行い、9個の子個体から成る第二世代を生成する(ス
テップ13)。個体間の交叉には、1点交叉、2点交
叉、又は正規分布交叉等の手法を用いる。正規分布交叉
とは、実数値表現の染色体(個体)について、両親を結
ぶ軸に対して回転対称な正規分布にしたがって子を生成
する方法である。正規分布の標準偏差は、両親を結ぶ主
軸方向の成分については両親間の距離に比例させ、その
他の軸の成分については両親を結ぶ直線と集団からサン
プルした第3の親との距離に比例させる。この交叉方法
は、親の特質が子に引き継がれやすいという利点があ
る。また、生成された9個の子個体に対して一定の確率
で、ランダムに遺伝子(結合度)の値を変更し、遺伝子
の突然変異を発生させる。上記した処理により、第2世
代が生成した後、燃費モジュールのニューラル回路網の
結合係数を第2世代の何れかの個体(エリート)で固定
して、加速モジュールの進化処理に移行し、進化モジュ
ールの第1世代の進化処理が終了した後、再度ステップ
1からの処理を行い、第2世代の各個体の評価・選択を
行う(図14参照)。尚、この時、ステップ1におい
て、既にコーディングされた個体があるか否か、即ち、
第2世代以降か否かを判断し、コーディングされた個体
がある場合には、コーディングの処理を行わずにステッ
プ2に進む。この処理は、生成する世代が予め決められ
た最終世代に達するまで繰り返し行われる。これによ
り、各世代を構成する子個体は評価系の評価に沿って、
即ち、使用者の好みに合わせて進化していく。最終世代
に達したか否かはステップ11で判断され、ステップ1
1で最終世代であると判断すると、その世代の9個の子
個体の中から適応度の最も高い個体(最適個体)、即
ち、エリートを一つ選び出し(ステップ14)、燃費モ
ジュールのニューラル回路網の結合係数を、前記した最
適個体を構成する遺伝子で固定し(ステップ15)、燃
費モジュールの進化を終了する。加速モジュールにおい
ても、上記した燃費モジュールと同様の処理が最終世代
に達するまで各世代に対して行われる。尚、加速モジュ
ールにおけるステップ8,9に対応する個体に対する評
価は、加速評価指数により行われる。尚、加速評価指数
は加速度をスロットル開度変化率で割って算出する。図
13は、同一スロットル開度における車速の変化と加速
評価指数の関係を示すグラフである。
の手法(1)〜(3)の手法も考慮される。 (1)重複個体の突然変異 異なる個体を交叉の親として選択したにもかかわらず、
これらが遺伝子的に見て全く同一であった場合、交叉す
る親の両方について、通常より高い確率で突然変異させ
る。ただし、このときの突然変異は、選ばれた遺伝子の
値に対して、正規分布に基づく変化を加えるものとす
る。 (2)同一個体の交叉の回避 交叉の親を選択して、これが同一の個体である場合が起
こりうるが、これを放置した場合、集団としての多様性
が失われることが予想される。このため、交叉に選択さ
れた親が同一の個体であった場合、他の選択された個体
と入れ換えをおこなって、可能な限り同じ個体の交叉を
避ける。 (3)再生手法 交叉の代わりに、一度に集団の全ての個体を置き換える
世代交代の手法である再生手法を用いる。
モジュール及び加速モジュールの進化が終了し、これら
のモジュールのニューラル回路網が両方共、最適個体の
結合度で固定されると、進化適応層は前記したように、
固定された燃費モジュール及び加速モジュールで進化補
正値Yの出力を行う。この進化補正値Yは、入力信号
(エンジン回転数及びスロットル開度)に基づいて、各
モジュールのニューラル回路網の出力を決定し、これら
ニューラル回路網の出力を前記式(1)で線形変換した
値を各モジュールの出力yf,yaとし、さらに、前記
式(2)を用いて両モジュールの出力yf,yaの加重
平均をとることにより得られる。
数の個体を生成して交叉させることで、同種のモジュー
ル間で複数の個体同士が競合してよりよいモジュールに
進化し、また、燃費モジュールと加速モジュールを別個
に交互に進化させることで、変化する方のモジュール
が、変化しない方のモジュールの出力に合わせて、適応
的に進化することになり、異なるモジュール間の協調が
図られる。ただし、一方の制御モジュールの加重が小さ
い場合、その制御モジュールに遺伝的な変化を加えても
結果に現れにくいため、ある程度加重の大きな制御モジ
ュールについてのみ、遺伝的な変化を加えることも考え
られる。
ーラル回路網A,Bから成り、これら二つのニューラル
回路網は一方が学習用として機能している時は、他方は
実行用として機能する。学習用のニューラル回路網は、
進化適応層で各モジュールの進化が終了し、燃費モジュ
ール及び加速モジュールのニューラル回路網が各々最適
個体の結合度で固定されると、進化適応層の入力と出力
との関係を、学習層の実行用として機能しているニュー
ラル回路網の入力と出力との関係と合わせて学習する。
この間、進化適応層の出力は、それ以前の評価関数を最
大とした燃費モジュールと加速モジュールとにより行わ
れ、制御則が時間的に変化することはない。前記した学
習では、進化適応層と学習層の実行用ニューラル回路網
との入出力を、あるステップ幅で平均化し、これを入出
力データとして教師データ集合の更新に用いる。例え
ば、1秒間の平均エンジン回転数が5000rpm、平
均スロットル開度が20であった場合、これらと、その
時の進化適応層及び学習層における実行用ニューラル回
路網の燃料噴射補正量(即ち、進化補正量及び基準補正
量)を合わせたものを入出力データとして用いる(図1
5参照)。この入出力データを、以前の教師データに加
えて新しい教師データ集合を得る。この時、教師データ
集合における新しいデータとのユークリッド距離が一定
値以内の古い教師データは消去する。この様子を図16
に示す。また、教師データ集合の初期値は、すべての入
力データに対して出力をゼロにしておく。学習層では、
更新された教師データ集合に基づいて、学習用のニュー
ラル回路網の結合係数の学習を行う。前記結合係数の学
習は、学習中の学習用ニューラル回路網の出力(即ち、
仮想補正値)と反射層からの基本操作量とから得られる
仮想制御出力と、実際の制御出力との間の誤差がしきい
値以下になるまで行われ、この学習が終わると、学習用
のニューラル回路網は実行用になり、もとの制御用のニ
ューラル回路網が学習用となる。この後、学習層は新し
く得られた実行用のニューラル回路網により基本補正量
を決定して実際に出力し、同時に、進化適応層の出力は
ゼロになり、学習層と反射層とによる制御が行われる。
また、学習層の実行用のニューラル回路網の初期値は、
出力が常にゼロになるように設定しておく。こうするこ
とで、初期状態においては、反射層と進化適応層のみで
制御をおこなうようにできる。学習済みの実行用ニュー
ラル回路網の結合係数は、フロッピーディスクやICカ
ード等の外部記憶手段に保存・読み出し可能とする。
し、それを学習層で学習した後は、進化適応層は図2で
説明したように、一定時間間隔で作動して、学習層の制
御則のずれをチェックし、制御則にずれがある場合に
は、再び、燃料制御モジュールと加速制御モジュールの
進化を行う。使用者が外部記憶手段に保存した結合係数
を読み出して、当該結合係数に基づいて学習層を作動さ
せている場合には、進化適応層における制御則のずれの
チェックを行わずに、進化適応層の出力をゼロに固定し
たまま、その処理を停止し、使用者の処理開始指示に基
づいて進化適応層の処理を再開するように進化適応層を
構成してもよい。このように、進化適応層で、運転者の
好みを評価して、その評価に沿って燃費制御モジュール
及び加速制御モジュールを進化させることにより、エン
ジン1は、使用者の好みに合わせて燃費性能重視型或い
はドライバビリティ性能重視型に調教されていき、ま
た、進化適応層を一定時間間隔で機能させることによ
り、調教が、使用者の好みの変化やエンジンや車両の経
時変化に追従するようになる。
いて、補正量に制限を加えつつ適応を図り、そこで得ら
れた成果を学習していく手法を用いる利点としては、以
下の2点が挙げられる。 ・進化適応層内の制御モジュールの多様性が確保され、
遺伝的アルゴリズムの特徴である大域的探索が可能とな
る。 ・進化適応層での試行錯誤的な情報処理から、学習層の
高速でより知的な情報処理を獲得することが可能にな
る。これは上記したエンジン制御においては顕著ではな
いが、移動ロボットの経路制御などについては大きな利
点となる。
として本発明に係る総合制御方式を実行する制御装置の
別の実施例について簡単に説明する。図17は、制御装
置20の概略ブロック図である。この制御装置20は、
上記した第2実施例の制御装置10と同様、反射層、学
習層、及び進化適応層から成る。進化適応層及び学習層
以外は第2実施例と同じであるので、ここでは詳細な説
明は省略する。進化適応層は評価系及び進化適応系から
成り、評価系は第2実施例の評価系と同様に、走行状態
指数Pから、その時の走行状況を推定し、かつ使用者の
好みに関する加速度重視割合αを決定する。進化適応系
は、進化適応系は、燃費が最良となるような燃料噴射制
御則の獲得を目指す燃費モジュール及び出力が最高とな
るような燃料噴射制御則の獲得を目指すパワーモジュー
ルからなる下位モジュールと、使用者の好みに合わせて
運転状態に応じた前記燃費モジュールと前記パワーモジ
ュールの出力比の獲得を目指すコントロールモジュール
から成る上位モジュールとを備えている(図17参
照)。前記各モジュールは、第2実施例の制御モジュー
ルと同様各々2入力1出力の階層型ニューラル回路網で
構成され、燃費モジュール及びパワーモジュールは各々
正規化スロットル開度及び正規化エンジン回転数を入力
して進化補正量の一次出力値を出力し、コントロールモ
ジュールは正規化スロットル開度と正規化スロットル開
度変化率を入力して下位モジュール(即ち、燃費モジュ
ール及びパワーモジュール)の出力比を出力することで
進化補正量の最終出力値を決定する。前記燃費モジュー
ル及びパワーモジュールは、図18に示すように運転状
態や使用者の好みに関係なく、それぞれ燃費が最良にな
る空燃比と出力が最良になる空燃比が得られるような空
燃比補正量を獲得するよう各ニューラル回路網の結合係
数を遺伝的アルゴリズムを用いて順番に自律的に進化さ
せる。これに対してコントロールモジュールは、最良燃
費空燃比と最良出力空燃比の間で、使用者の好みにあっ
た燃費モジュール及びパワーモジュールの出力比を獲得
するように、そのニューラル回路網の結合係数を遺伝的
アルゴリズムを用いて自律的に進化させる。なお、各制
御モジュールの進化は、各制御制御モジュールを構成す
るニューラル回路網の結合度を遺伝子としてコーディン
グして複数の個体を生成し、全ての個体を用いて実際に
エンジンを作動させた結果を各個体毎に評価系で評価
し、評価結果の一番高い個体(エリート個体)を含む幾
つかの親個体を選択してこれらを交叉させて次世代の子
個体を生成し、各個体に対する評価を行うことを繰り返
すことで行われる。上記した進化処理は所定世代数終了
するまで繰り返し行われ、最終世代の個体の評価が終了
した後、その最終世代のエリート個体でニューラル回路
網の結合係数を固定して、学習層の学習用制御モジュー
ルに学習させる。尚、進化処理中に個体群を生成する
時、既に学習層が学習を行い出力をしている場合には、
進化適応層の出力をゼロにできる個体を一つ入れるよう
にし、これにより、個体数が制限されていても進化中の
個体群の多様性が保てるようにする。上記した進化処理
は、進化が収束するまで所定世代数毎に学習層で学習を
行いながら、連続して同じ制御モジュールに対して、繰
り返し行われる。進化処理中は、進化の対象となる制御
モジュール以外の制御モジュールは、固定しておき、進
化処理中の制御モジュールの進化が終了した後、次の制
御モジュールの進化処理が行われる。所定世代数毎の学
習の際には、その世代のエリート個体で、ニューラル回
路網の結合係数を固定して、学習層の学習用制御モジュ
ールに学習させる。学習が終了した時点で、学習に用い
たエリート個体と、進化適応層の出力がゼロになる個体
とを含む新しい個体群を生成する。こうすることで、次
の進化処理において、前の進化処理の性能を損なうこと
なく、進化中の個体群の多様性を保つことができる。
モジュールの進化について、図19のフローチャートを
参照して燃費モジュールの進化を例に挙げてさらに詳細
に説明する。始めに、燃費モジュールを構成するニュー
ラル回路網の結合係数を遺伝子としてコーディングして
複数の個体an(本実施例では9個の個体)からなる第
1世代を生成する(ステップ1)。この時、個体群に進
化適応層の出力をゼロにできる個体を一つ含ませること
で、進化前の性能を維持しながら個体数に制限がある場
合でも進化の過程で個体群の多様性を保つことができ
る。次に、ステップ1で生成された個体anの中の一
つ、例えば、個体a(1)に対して、燃費モジュールの
ニューラル回路網を用いて実際の入力情報(エンジン回
転数及びスロットル開度)に対するニューラル回路網の
出力x(1)を決定し(ステップ2)、さらにこの出力
を式(1)を用いて線形変換して個体a(1)に対する
燃費モジュールの出力yf(1)を決定する(ステップ
3)。 yf(n) = 2×Gx(n)−G (1) ここで、yf(n)は燃費モジュールの出力、x(n)
は燃費モジュールにおけるニューラル回路網の出力、G
は進化適応層出力ゲインであり、nは個体を示してい
る。個体a(1)に対する燃費モジュールの出力yf
(1)を決定した後、パワーモジュールの出力ya及び
コントロールモジュールの出力ORを用いて次式(2)
に基づいて進化適応層の出力(評価用補正量Ya
(n))を決定する(ステップ4)。 Ya(n) = OR×ya+(1−OR)×yf
(n) 尚、燃費モジュールの進化処理中は、パワーモジュール
及びコントロールモジュールの結合係数は固定されてい
る。上記したようにコントロールモジュールの出力OR
は、燃費モジュールの出力yfとパワーモジュールの出
力yaとの比率であり、従って、コントロールモジュー
ルの出力ORが”1”の場合は進化適応層の出力はパワ
ーモジュールの出力となり、また、前記出力ORが”
0”の場合は進化適応層の出力は燃費モジュールの出力
となる。個体a(1)に対する進化適応層の出力Ya
(1)が決定した後、この仮補正値Ya(1)を実際に
進化適応層から出力し、仮補正値Ya(1)と学習層か
らの基本補正値Ybと反射層からの基本操作量に加算
し、この補正値Ya(1)+Ybにより補正された操作
量に基づく制御を所定の時間だけ行う(ステップ5)。
個体a(1)を用いて実際に制御を行いながら、進化適
応層の評価系ではこの制御の結果に関する情報をフィー
ドバックして、個体a(1)に対する評価値(例えば燃
料消費量)を決定する(ステップ6)。上記したステッ
プ1〜ステップ6までの処理は、ステップ1で生成され
た9個の個体a(1)〜a(9)に対する全ての評価値
の算出を1サイクルの予備評価処理として、この予備評
価処理を予め決められた所定のサイクル行うまで繰り返
し行われ(ステップ7)、全ての個体に対して所定サイ
クル分の評価値を算出した後に各個体の総合評価処理
(ステップ8)に進む。総合評価処理では、各個体毎
に、上記した評価値算出サイクル中の総走行距離を全て
の評価値の合計(この場合は総燃料消費量)で割った総
合評価値を算出し、この総合評価値に基づいて各個体の
適応度の評価を行う(ステップ8)。上記したように、
各個体を用いた制御を順番に所定回数行い各個体を時分
割により擬似的に並行的に作動させることで(図20参
照)、刻々と変化する走行状況のもとでも各個体の評価
をほぼ同じ条件で公平に行うことが可能になり、オンラ
イン評価、即ち、車両走行中の評価が可能になる。上記
した総合評価処理が終了した後、その個体の属する世代
が最終世代か否かを判断し(ステップ9)、最終世代で
なければ親個体の選択を行う(ステップ10)。この選
択にはルーレット式選択方式を用い、各個体の適応度に
比例した確率で、確率的に幾つかの親個体を選択する。
尚、この時エリート個体は無条件に親個体として残すよ
うにする。親個体の選択が終わると、選択された個体を
親個体として、交叉を行い、再び9個の子個体から成る
第二世代を生成する(ステップ11)。また、生成され
た9個の子個体に対して一定の確率で、ランダムに遺伝
子(結合度)の値を変更し、遺伝子の突然変異を発生さ
せる。尚、これら9個の子個体には、進化適応層の出力
をゼロにできる個体を一つ含むようにする。上記した処
理により、第2世代が生成した後、再びステップ2から
の予備評価処理を繰り返す。上記した進化処理は、予め
決められた世代数経過するまで繰り返し行われる。これ
により、各世代を構成する子個体は評価系の評価に沿っ
て、即ち、燃費モジュールの場合には、燃費が最良とな
るような燃料噴射制御則を獲得するように進化してい
く。予め決められた世代数経過したか否かはステップ9
で判断され、ステップ9で最終世代であると判断する
と、その世代の9個の子個体の中から適応度の最も高い
個体(最適個体)、即ち、エリートを一つ選び出し(ス
テップ12)、燃費モジュールのニューラル回路網の結
合係数を、前記した最適個体を構成する遺伝子で固定し
(ステップ13)、学習層の学習用制御モジュールに対
する学習処理に移行する。一つの制御モジュール(この
場合は燃費モジュール)に対する進化処理は学習後の学
習層と反射層とによる制御の評価が、進化前の制御の評
価より高い間は、連続して繰り返され、進化処理後の制
御の評価が進化処理前の制御の評価より向上しなくなっ
たら、その制御モジュールの進化が収束したと判断し
て、次の制御モジュール(本実施例の場合はパワーモジ
ュール)の進化処理に移行する。
ールの進化処理も上記した燃費モジュールの進化処理と
同様に行われるが、パワーモジュールにおける各個体に
対する総合評価値は、評価値算出サイクル中の平均エン
ジン回転数を平均スロットル開度で割って算出される。
これにより、パワーモジュールの進化処理中の各世代を
構成する子個体は評価系の評価に沿って、即ち、出力が
最良となるような燃料噴射制御則を獲得するように進化
していく。また、コントロールモジュールにおける各個
体に対する総合評価値は、評価値算出サイクル中の燃費
評価値及びレスポンス評価値と、加速度重視割合αと、
基準とする燃費評価値及びレスポンス評価値とを用いて
判断される。即ち、価値算出サイクル中の燃費評価値を
FC、レスポンス評価値をRP、基準燃費評価値をFC
base、基準レスポンス評価値をRPbaseとすると、コン
トロールモジュールにおける総合評価値CNTは次式で
与えられる。 CNT=(1−α)×Scale×(FC−FCbase)/F
Cbase +α×(RP−RPbase)/RPbase ここで、Scaleは燃費評価値とレスポンス評価値のバラ
ンスをとるための係数である。また、燃費評価値は上記
した燃費モジュールにおける総合評価値と同様に算出さ
れ、レスポンス評価値RPは、所定のしきい値より大き
いスロットル開度の変化が一定時間続いたら加速とみな
して、その時の速度変化をスロットル開度変化率で割
り、これを所定の評価値算出サイクルの時間内の各加速
毎に算出したものの平均値とする。上記したように、燃
費評価値とレスポンス評価値を使用者の好みに基づいて
決められた加速度重視割合αの比率に合わせて評価する
ことにより、コントロールモジュールは、使用者の好み
に合わせて運転状態に応じた燃費モジュールとパワーモ
ジュールの出力比を獲得できるよう進化していく。上記
したように、下位制御モジュール群を構成する燃費モジ
ュールとパワーモジュールとが各々燃費及び出力優先に
進化し、上位制御モジュールを構成するコントロールモ
ジュールが使用者の好みに合わせて下位制御モジュール
の出力比率を決めるように進化することにより、各機能
(即ち、燃費及びエンジン出力)について最適な出力を
行える下位モジュールを使用者の好みに合った出力比率
で用いた制御を行うことができるようになる。
簡単に説明する。学習層は、図17に示すように進化適
応層の制御モジュールに対応する種類の制御モジュール
群を備え、各制御モジュール群は、二つのニューラル回
路網A,Bから成る。これら二つのニューラル回路網は
一方が学習用として機能している時は、他方は実行用と
して機能する。この学習層における制御モジュールは、
進化層の対応する制御モジュールが所定世代数進化する
毎に、その学習用のニューラル回路網で、進化適応層の
入力と出力との関係を、学習層の実行用として機能して
いるニューラル回路網の入力と出力との関係と合わせて
学習する。上記した学習は、学習中の学習用ニューラル
回路網の出力と制御出力との誤差がしきい値より小さく
なった時点で終了し、その後、学習用のニューラル回路
網は実行用になり、もとの制御用のニューラル回路網が
学習用となる。この学習は、上記したように進化適応層
における制御モジュールの進化処理が所定の世代数行わ
れる毎に行われる。従って、一つの制御モジュールに対
して進化処理が始まってから進化が収束するまでの間
は、所定の世代数進化処理が行われる毎に学習が行われ
るようになる。このように、各制御モジュールに対して
進化と学習とを交互に繰り返すと、学習を行わずに進化
処理のみで進化させる場合に比べて評価値の向上が早く
なり進化が早く進む(図21参照)。
位モジュール群を構成する燃費モジュールとパワーモジ
ュールとが各々燃費及びエンジン出力を優先して進化
し、また、上位モジュールを構成するコントロールモジ
ュールが使用者の好みに合わせた下位モジュールの出力
比が得られるように進化することにより、使用者の好み
に合わせた最適な目標空燃比パターンを得ることがで
き、エンジン1は、使用者の好みに合わせて燃費性能重
視型、ドライバビリティ性能重視型、或いはバランス重
視型に調教されていく。また、進化適応層を一定時間間
隔で機能させることにより、調教が、使用者の好みの変
化やエンジンや車両の経時変化に追従するようになる。
ュールの分割は、加速、燃費の各機能についておこなっ
ていたが、燃料噴射量、点火時期などの制御出力につい
て、これを行ってもよい。この場合、例えば、新しく吸
気管長の制御を可能にした場合など、既存の制御モジュ
ールに変更を加える必要がなく、吸気管長制御モジュー
ルを追加することで総合的な制御が実現できるという効
果を奏する。また、エンジンの制御を行う場合の制御出
力は、上記の他、例えば、電子スロットル開度、吸排気
バルブタイミング、バルブリフト量、吸排気制御用バル
ブタイミング等が考えられ得る(図3参照)。ここで、
吸気制御用バルブとは、タンブル及びスワールの制御を
行うために吸気管に設けられるバルブであり、また、排
気制御バルブとは、排気脈動を制御するために排気管に
設けられるバルブである。また、本実施例では、遺伝的
アルゴリズムにおける進化処理で、燃費モジュールと加
速モジュールとを一世代毎に交互に進化させているが、
この進化処理は本実施例に限定されることなく、例え
ば、始めに加速モジュールを固定しておき、燃費モジュ
ールの進化処理を最終世代まで行い最適制御モジュール
を獲得した後に、燃費モジュールを最適制御モジュール
で固定して、加速モジュールを進化させるように処理し
てもよい。また、本実施例では、制御モジュールを燃費
モジュールと加速モジュールの二つに分割し、各モジュ
ールに対して遺伝的アルゴリズムに対する進化処理を行
っているが、進化適応層における制御モジュールの数
は、本実施例に限定されることなく、一種類でもよく、
又三種類以上の制御モジュールを用いてもよい。さら
に、本実施例では、遺伝的アルゴリズムにおいて、進化
を、予め決められた最終世代まで進化した時点で終了し
ているが、この進化を終了するタイミングは本実施例に
限定されることなく、例えば、進化中の個体の評価値が
予め定めた変化幅以上変化した時に終了させてもよい。
さらにまた、本実施例では、運転者の好みや走行状況を
推定するための走行状態指数Pを、ギヤポジションと最
高回転数の分布パターンに基づいてニューラル回路網を
用いて推定しているが、走行状態指数Pを推定する手段
は、本実施例に限定されることなく任意の方法でよく、
例えば、ファジー推論を用いて推定してもよい。ファジ
ー推論を用いて走行状態指数Pを決定する場合、例え
ば、「1速の最高回転数が大で、2速の最高回転数が大
ならば、走行状態指数Pは非常に大である。」といった
IF−THENルールを記述し、ファジー推論を行う
(図22参照)。ニューラル回路網の場合、結合係数は
教師信号から学習により決定されるのでブラックボック
ス的になるのに対して、このファジー推論を用いる方法
では、設計の時の知識ベース的なアプローチが可能とな
る。また、本実施例では、ギヤポジションと最高回転数
の分布パターンから使用者の好みを評価しているが、使
用者の好みを評価するパラメータは本実施例に限定され
ることなく、任意のパラメータでよく、使用者の生理的
指標、例えば、脈拍、血圧、体温、脳波等を検出する手
段を、使用者の装備品、例えば、二輪車の場合には、ヘ
ルメット、グローブ、又はブーツ等に設けて、生理的指
標を検出し、これに基づいて評価してもよい。さらに、
これらの生理的指標は使用者の状態(運転者の運転状
態)の評価に使用することも可能である。また、本実施
例では、使用者の好みを評価し、この評価に合わせて調
教を行っているが、調教の方針を決めるパラメータは本
実施例に限定されることなく、例えば、使用者の技量を
評価して、使用者の技量に合わせて調教を行ってもよ
い。この場合の使用者の技量を評価するパラメータとし
ては、例えば、車両の場合には、車両の傾き角、車両の
上下方向の加速度、ブレーキの操作量、前後ブレーキの
使用比率等が考えられる。さらにまた、本実施例では、
学習層を階層型ニューラル回路網で構成しているが、学
習層の制御系の構成は本実施例に限定されることなく、
例えば、CMAC(Cerebellar Model Arithmetic Compu
ter)を用いてもよい。CMACを用いる利点としては、
階層型ニューラル回路網に比べて、追加学習の能力が優
れていること、学習が高速である等が挙げられる。さら
にまた、本発明の第3実施例では、進化処理中の各個体
に対する総合評価処理を、時分割して、各個体を用いた
制御を連続して所定サイクル数行い各個体を擬似的に並
行的に作動させることにより、各個体を走行状態等の変
化に影響されずに公平に評価できるようにしているが、
この各個体に対する評価手法は本実施例に限定されるこ
となく、例えば、評価領域を細分化して局所的な評価値
を算出し、全ての個体に共通する局所的な評価値を用い
て総合評価をしてもよく、また、細分化した局所的評価
領域毎に重みづけを行い、この重みづけを加味して総合
評価を行ってもよい。具体的には、例えば燃費評価の場
合は、図23に示すように、評価処理中のエンジントル
ク及びエンジン回転数と単位時間あたりの燃料消費量と
の関係を全ての個体(図23の場合は二つ)に対して調
べ(図23(a)及び(b)参照)、この燃料消費量を
局所的な評価値として、共通する条件で得られた局所的
な評価値(図23(c)参照)の平均値で各個体につい
ての評価を行い得る。また、図23とは別の方法とし
て、例えば、図24に示すように、予め各局所的評価部
分毎に重みづけをしたウェイトマップを用意し(図24
(c)参照)、評価処理中のエンジントルク及びエンジ
ン回転数と単位時間あたりの燃料消費量との関係を全て
の個体(図24の場合は二つ)に対して調べ(図24
(a)及び(b)参照)、各個体毎にウェイトマップを
加味して総合評価値を決定して評価を行ってもよい。
によれば、制御対象を制御する制御系の制御特性を使用
者及び/又は使用状況の特性に合わせて変化させること
ができるので、制御対象が、それを使用する使用者及び
/又は使用状況に合った特性に「調教」され、使用し易
くなり、また、使用者に、制御対象の特性を自分だけの
独自の特性に調教するという意識上の楽しみを与えるこ
とができるという効果を奏する。また、使用環境の変化
や経時劣化に対して、自動的に制御則を変化させること
で、いかなる場合でも最適な運転状態を実現することが
できるという効果を奏する。さらに、制御対象の制御パ
ラメータ取得のためのセッティングが不要になり、低コ
スト化が可能になる。また、制御対象として車両に搭載
されるエンジンを適用する時に、運転者の好みに合わせ
た制御を施すことで、エンジンの動作特性を使用者の好
みに合わせることが可能になり、また、運転者の技量に
応じた制御を施すことで、熟練度に合わせた走行性能を
得ることが可能になり、運転者に快適な走行を提供する
ことが可能になる。さらにまた、制御対象として車両に
搭載されるエンジンを適用する場合、購入者の購入後
に、エンジンの動作特性が購入者の好み等に合わせて調
教されるので、購入者は車両購入時にエンジン特性等に
よりその選択範囲を制限されることがなくなる。また、
制御対象として、補助動力付き自転車や車イスの補助動
力を適用すれば、補助動力のアシスト特性を使用者の好
みに応じた特性に合わせることが可能になるので、使用
者毎に最適なアシスト特性を得ることが可能になる。さ
らにまた、制御対象としてロボットを適用する場合に
は、ロボットの動作特性を使用者の好みに応じた特性に
合わせることが可能になるので、ロボットが使用者毎に
最適な動作を行うようになる。また、制御対象としてサ
スペンション又はシートを適用する場合には、サスペン
ション又はシートのダンパー特性を使用者の好みに応じ
た特性に合わせることが可能になるので、使用者毎に最
適なダンパー特性を得ることが可能になる。さらに、制
御対象として、車両の操舵系を適用すれば、操舵系の操
舵制御特性を使用者の好みに応じた特性に合わせること
が可能になるので、使用者毎に最適な操舵制御特性を得
ることが可能になる。
ブロック図である。
ローチャートである。
御装置10との関係を示す概略図である。
チャートである。
ポジションにおける最高回転数の分布パターンを示すグ
ラフであり、(a)はスポーティな走行時のグラフで、
(b)はマイルドな走行時のグラフである。
ポジションにおける最高回転数の分布パターンを示すグ
ラフであり、(a)は通常走行時のグラフで、(b)は
渋滞路走行時のグラフで、(c)は高速道路走行時のグ
ラフである。
路網の概略図である。
関数の関係を示すグラフであり、(a)を基準として、
(b)が最高回転数に達するまでの時間が短い状態を示
し、(c)が最高回転数に達するまでの時間が長い状態
を各々示している。
するニューラル回路網の概略図である。
の進化のフローチャートである。
に示す図である。
度における車速の変化と加速評価指数の関係を示すグラ
フである。
進化の関係を概念的に示す図である。
する状態を概念的に示す図である。
ある。
装置の別の実施例の概略ブロック図である。
ある。
の進化のフローチャートである。
状態を示す図である。
処理とを交互に繰り返す進化との進化性能を比較したグ
ラフを示す図である。
る状態を概念的に示した図である。
法を概念的に示す図である。
別の方法を概念的に示す図である。
Claims (51)
- 【請求項1】 使用者及び/又は使用状況の特性を判断
し、その判断結果に基づいて、使用者及び/又は使用状
況の特性に合わせて制御対象を制御する制御系の制御特
性を変化させることを特徴とする総合制御方式。 - 【請求項2】 前記使用者及び/又は使用状況の特性を
ニューラル回路網、又はファジールールを用いて推定す
ることを特徴とする請求項1に記載の総合制御方式。 - 【請求項3】 前記使用者の特性が、使用者の好み、技
量、操作パターン及び状態の少なくとも一つであること
を特徴とする請求項1又は2に記載の総合制御方式。 - 【請求項4】 使用環境の変化、及び/又は制御対象の
経時劣化に追従して、前記制御特性を適応的に変化させ
ることを特徴とする請求項1〜3の何れか一項に記載の
総合制御方式。 - 【請求項5】 制御方式の枠組みが、最下層に反射層、
その上の層に学習層、最上層に進化適応層をもつ階層化
構造であることを特徴とする請求項1〜4の何れか一項
に記載の総合制御方式。 - 【請求項6】 制御出力の基本量を前記反射層から出力
し、学習層と進化適応層の出力が、前記基本量に対する
補正量であることを特徴とする請求項5に記載の総合制
御方式。 - 【請求項7】 前記進化適応層が自律的にふるまう少な
くとも一つの制御モジュールを備え、この制御モジュー
ルを競合及び/又は協調させることで、前記制御モジュ
ールを適応的に進化させることを特徴とする請求項5又
は6に記載の総合制御方式。 - 【請求項8】 前記制御モジュールが複数あり、これら
複数の制御モジュールを相互に協調及び競合させること
で、前記制御系を適応的に変化させることを特徴とする
請求項7に記載の総合制御方式。 - 【請求項9】 前記制御モジュールが制御対象に関する
特性に基づいて一次出力を決定する下位モジュール群
と、下位モジュール群の一次出力から使用者及び/又は
使用状況に基づいて二次出力を決定する上位モジュール
群とを備えていることを特徴とする請求項8に記載の総
合制御方式。 - 【請求項10】 前記下位モジュール群を制御対象に関
する特性に基づいて評価しながら進化させ、 前記上位モジュール群を使用者及び/又は使用状況に基
づいて評価しながら進化させることを特徴とする請求項
9に記載の総合制御方式。 - 【請求項11】 使用者及び/又は使用状況の特性に応
じて、進化適応層の複数の制御モジュールの出力の比率
を変化させることを特徴とする請求項8に記載の総合制
御方式。 - 【請求項12】 前記制御モジュールの適応的な進化
を、遺伝的アルゴリズム及び/又はマルチエージェント
等の手法を用いて行うことを特徴とする請求項7〜11
の何れか一項に記載の総合制御方式。 - 【請求項13】 進化適応層の制御モジュールを遺伝的
アルゴリズムにより所定世代数進化させ、その進化結果
を学習層に学習させる毎に、学習層に学習させた世代の
複数の個体のなかで最も評価の高い個体と、進化適応層
の出力をゼロにする個体とを含む新しい個体群を発生さ
せることを特徴とする請求項12に記載の総合制御方
式。 - 【請求項14】 遺伝的アルゴリズムにおける評価関数
を、使用者及び/又は使用状況の特性に応じて自動的に
変化させることを特徴とする請求項12又は13に記載
の総合制御方式。 - 【請求項15】 前記評価関数と、使用者及び/又は使
用状況の特性との関係が、使用者の指示により変化可能
であることを特徴とする請求項14に記載の総合制御方
式。 - 【請求項16】 進化適応層の出力ゲインに制限を設け
ることを特徴とする請求項5〜15の何れか一項に記載
の総合制御方式。 - 【請求項17】 前記学習層が、実行用と学習用の二つ
のニューラル回路網を有することを特徴とする請求項5
〜16の何れか一項に記載の総合制御方式。 - 【請求項18】 進化適応層における制御モジュールの
進化により得られた制御特性を学習層の学習用ニューラ
ル回路網で学習することを特徴とする請求項17に記載
の総合制御方式。 - 【請求項19】 学習層が、学習用の教師データ集合を
有し、進化適応層と学習層の実行用ニューラル回路網の
出力の和の、過去の一定期間内に出力されたものだけ
を、新しい教師データとして使用して学習層の学習用ニ
ューラル回路網で学習し、その他の領域の教師データは
それまでのものとすることを特徴とする請求項18に記
載の総合制御方式。 - 【請求項20】 前記学習用のニューラル回路網の学習
が終了すると、前記学習用のニューラル回路網が実行用
として機能し、もとの実行用のニューラル回路網が学習
用として機能することを特徴とする請求項15〜19の
何れか一項に岸阿の総合制御方式。 - 【請求項21】 学習層における学習済みのニューラル
回路網に関する情報を、フロッピーディスクやICカー
ド等の外部記憶媒体に記憶し、保存、読み出しを可能に
したことを特徴とする請求項15〜20の何れか一項に
記載の総合制御方式。 - 【請求項22】 反射層が、数式によるモデル、ファジ
ールール、ニューラル回路網、マップ、又はサブサンプ
ションアーキテクチャの何れか一つの手法を用いて処理
を行うことを特徴とする請求項5〜21の何れか一項に
記載の総合制御方式。 - 【請求項23】 前記使用者の技量を外部状態量から推
定することを特徴とする請求項3〜22の何れか一項に
記載の総合制御方式。 - 【請求項24】 前記使用者の状態を、生理的指標を用
いて推定することを特徴とする請求項2〜22の何れか
一項に記載の総合制御方式。 - 【請求項25】 前記生理的指標が、使用者の脈拍、血
圧、体温、及び脳波の少なくとも一つであることを特徴
とする請求項24に記載の総合制御方式。 - 【請求項26】 前記制御対象が能動的に動作すること
を特徴とする請求項1〜25の何れか一項に記載の総合
制御方式。 - 【請求項27】 前記制御対象がエンジンから成ること
を特徴とする請求項26に記載の総合制御方式。 - 【請求項28】 前記エンジンが車両用であり、使用者
の特性を運転者の好み、技量、及び/又は状態から判断
し、使用状況の特性を車両の走行状況から判断し、その
判断結果に基づいてエンジンの動作特性を変化させるこ
とを特徴とする請求項27に記載の総合制御方式。 - 【請求項29】 車両の運転状態を検知する手段を設
け、その検知結果の少なくとも一部に基づいて、前記運
転者の好み、技量、及び/又は状態と走行状況の何れか
一方又は両方の特性に合った状態指数を推定し、この状
態指数に基づいてエンジンの動作特性を変化させること
を特徴とする請求項28に記載の総合制御方式。 - 【請求項30】 前記状態指数を、ニューラル回路網、
又はファジールールの何れか、又は両方を用いて推定す
ることを特徴とする請求項29に記載の総合制御方式。 - 【請求項31】 前記状態指数に基づいて進化適応層の
制御モジュールを協調及び/又は競合させる遺伝的アル
ゴリズムにおける評価関数を変化させることを特徴とす
る請求項29又は30に記載の総合制御方式。 - 【請求項32】 各ギヤポジションでの最高回転数に達
するまでの時間、エンジン回転数の変化率、又は指示用
入力ボタンによる運転者の入力に基づいて、前記評価関
数と前記状態指数との関係を変化させることを特徴とす
る請求項31に記載の総合制御方式。 - 【請求項33】 前記車両の運転状態を検知する手段
が、エンジン回転数及びギヤポジションを検知する手段
であることを特徴とする請求項29〜32の何れか一項
に記載の総合制御方式。 - 【請求項34】 エンジンの動作特性を変化させるため
の制御出力として、燃料噴射量、点火時期、電子スロッ
トル開度、吸排気バルブタイミング、バルブリフト量、
吸排気制御バルブタイミング等を用いることを特徴とす
る請求項27〜33の何れか一項に記載の総合制御方
式。 - 【請求項35】 運転者のクラッチ操作速度、車両の傾
き角、車両の上下方向の加速度、ブレーキの操作量、前
後ブレーキの使用比率の少なくとも一つから運転者の技
量をを推定することを特徴とする請求項28〜34の何
れか一項に記載の総合制御方式。 - 【請求項36】 運転時に運転者が身につける装備品
に、運転者の生理的指標を検出する手段を設け、該手段
によって得られた生理的指標に基づいて運転者の状態を
推定することを特徴とする請求項28〜35の何れか一
項に記載の総合制御方式。 - 【請求項37】 前記装備品が、ヘルメット、グロー
ブ、又はブーツの少なくとも一つであることを特徴とす
る請求項36に記載の総合制御方式。 - 【請求項38】 制御対象が電気モータ或いはエンジン
を補助動力とする自転車又は車イスの補助動力であり、
制御系の制御特性が前記補助動力のアシスト特性に関す
る特性であることを特徴とする請求項26に記載の総合
制御方式。 - 【請求項39】 制御対象がロボットであり、制御系の
制御特性がロボットの動作特性に関する特性であること
を特徴とする請求項26に記載の総合制御方式。 - 【請求項40】 前記動作特性が、ロボットの経路選
択、アームの動かし方、移動速度、及びしゃべり方の少
なくとも一つの特性であることを特徴とする請求項39
に記載の総合制御方式。 - 【請求項41】 前記ロボットがパーソナルロボットで
あることを特徴とする請求項39又は40に記載の総合
制御方式。 - 【請求項42】 前記制御対象が受動的に動作すること
を特徴とする請求項1〜25の何れか一項に記載の総合
制御方式。 - 【請求項43】 前記制御対象が車両の操舵系であり、
制御系の制御特性が前記操舵系の操舵制御特性に関する
特性であることを特徴とする請求項42に記載の総合制
御方式。 - 【請求項44】 前記制御対象が車体のサスペンション
又はシートであり、制御系の制御特性が前記サスペンシ
ョン又はシートのダンパー特性に関する特性であること
を特徴とする請求項42に記載の総合制御方式。 - 【請求項45】 使用者の特性を運転者の好み、技量、
及び/又は状態から判断し、使用状況の特性を車両の走
行状況から判断し、その判断結果に基づいて制御系の制
御特性を変化させることを特徴とする請求項43又は4
4に記載の総合制御方式。 - 【請求項46】 車両の運転状態を検知する手段を設
け、その検知結果の少なくとも一部に基づいて、前記運
転者の好み、技量、及び/又は状態と走行状況の何れか
一方又は両方の特性に合った状態指数を推定し、この状
態指数に基づいてエンジンの動作特性を変化させること
を特徴とする請求項45に記載の総合制御方式。 - 【請求項47】 前記状態指数を、ニューラル回路網、
又はファジールールの何れか、又は両方を用いて推定す
ることを特徴とする請求項46に記載の総合制御方式。 - 【請求項48】 前記状態指数に基づいて進化適応層の
制御モジュールを協調及び/又は競合させる遺伝的アル
ゴリズムにおける評価関数を変化させることを特徴とす
る請求項46又は47に記載の総合制御方式。 - 【請求項49】 運転者のクラッチ操作速度、車両の傾
き角、車両の上下方向の加速度、ブレーキの操作量、前
後ブレーキの使用比率の少なくとも一つから運転者の技
量をを推定することを特徴とする請求項45〜48の何
れか一項に記載の総合制御方式。 - 【請求項50】 運転時に運転者が身につける装備品
に、運転者の生理的指標を検出する手段を設け、該手段
によって得られた生理的指標に基づいて運転者の状態を
推定することを特徴とする請求項45〜48の何れか一
項に記載の総合制御方式。 - 【請求項51】 前記装備品が、ヘルメット、グロー
ブ、又はブーツの少なくとも一つであることを特徴とす
る請求項50に記載の総合制御方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9145610A JPH10154002A (ja) | 1996-09-26 | 1997-06-03 | 総合制御方式 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25460296 | 1996-09-26 | ||
JP8-254602 | 1996-09-27 | ||
JP9145610A JPH10154002A (ja) | 1996-09-26 | 1997-06-03 | 総合制御方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10154002A true JPH10154002A (ja) | 1998-06-09 |
Family
ID=26476695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9145610A Pending JPH10154002A (ja) | 1996-09-26 | 1997-06-03 | 総合制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10154002A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011168272A (ja) * | 1999-07-21 | 2011-09-01 | Nokia Corp | 操作可能な装置 |
JP2018172092A (ja) * | 2017-03-31 | 2018-11-08 | 本田技研工業株式会社 | 運転技量判定装置及び運転技量判定方法 |
CN113987736A (zh) * | 2021-08-31 | 2022-01-28 | 中国北方车辆研究所 | 一种液粘离合器控制品质综合评价方法 |
US11590943B2 (en) | 2020-06-17 | 2023-02-28 | Hyundai Motor Company | Control system of brake-by-wire device |
US11739806B2 (en) | 2019-10-11 | 2023-08-29 | Hyundai Motor Company | Electromechanical brake system having suspension control function |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63201802A (ja) * | 1987-02-18 | 1988-08-19 | Hitachi Ltd | エンジンの状態判別型適応制御装置 |
JPH01113561A (ja) * | 1987-10-28 | 1989-05-02 | Hitachi Ltd | エンジン制御方法 |
JPH03182910A (ja) * | 1989-12-12 | 1991-08-08 | Mitsubishi Electric Corp | デジタル適応制御装置 |
JPH0626377A (ja) * | 1992-07-07 | 1994-02-01 | Mazda Motor Corp | 車両の制御装置 |
JPH06206477A (ja) * | 1993-01-09 | 1994-07-26 | Mazda Motor Corp | 自動車用制御装置の制御ゲイン変更装置 |
JPH07123534A (ja) * | 1993-10-25 | 1995-05-12 | Hitachi Ltd | 車間距離制御方法 |
JPH07175771A (ja) * | 1993-10-29 | 1995-07-14 | Ricoh Co Ltd | ニューラルネットワーク及びこれを用いた信号処理装置、自律システム、自律型ロボット並びに移動システム |
JPH07178429A (ja) * | 1993-12-22 | 1995-07-18 | Nisshin Steel Co Ltd | 金属帯通板用ロールのヘルパーモータによる回転駆動制御方法 |
JPH07306707A (ja) * | 1994-05-10 | 1995-11-21 | Nippon Telegr & Teleph Corp <Ntt> | ロボットの学習制御方法 |
JPH086646A (ja) * | 1994-04-18 | 1996-01-12 | Idemitsu Eng Co Ltd | ブレンダー最適制御システム |
JPH08117291A (ja) * | 1994-10-28 | 1996-05-14 | Yamaha Motor Co Ltd | 補助動力式ビークル |
JP2507039B2 (ja) * | 1989-04-20 | 1996-06-12 | 松下電器産業株式会社 | 生体フィ―ドバック装置 |
JPH1011106A (ja) * | 1996-06-27 | 1998-01-16 | Yamaha Motor Co Ltd | 動力源総合制御方式 |
-
1997
- 1997-06-03 JP JP9145610A patent/JPH10154002A/ja active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63201802A (ja) * | 1987-02-18 | 1988-08-19 | Hitachi Ltd | エンジンの状態判別型適応制御装置 |
JPH01113561A (ja) * | 1987-10-28 | 1989-05-02 | Hitachi Ltd | エンジン制御方法 |
JP2507039B2 (ja) * | 1989-04-20 | 1996-06-12 | 松下電器産業株式会社 | 生体フィ―ドバック装置 |
JPH03182910A (ja) * | 1989-12-12 | 1991-08-08 | Mitsubishi Electric Corp | デジタル適応制御装置 |
JPH0626377A (ja) * | 1992-07-07 | 1994-02-01 | Mazda Motor Corp | 車両の制御装置 |
JPH06206477A (ja) * | 1993-01-09 | 1994-07-26 | Mazda Motor Corp | 自動車用制御装置の制御ゲイン変更装置 |
JPH07123534A (ja) * | 1993-10-25 | 1995-05-12 | Hitachi Ltd | 車間距離制御方法 |
JPH07175771A (ja) * | 1993-10-29 | 1995-07-14 | Ricoh Co Ltd | ニューラルネットワーク及びこれを用いた信号処理装置、自律システム、自律型ロボット並びに移動システム |
JPH07178429A (ja) * | 1993-12-22 | 1995-07-18 | Nisshin Steel Co Ltd | 金属帯通板用ロールのヘルパーモータによる回転駆動制御方法 |
JPH086646A (ja) * | 1994-04-18 | 1996-01-12 | Idemitsu Eng Co Ltd | ブレンダー最適制御システム |
JPH07306707A (ja) * | 1994-05-10 | 1995-11-21 | Nippon Telegr & Teleph Corp <Ntt> | ロボットの学習制御方法 |
JPH08117291A (ja) * | 1994-10-28 | 1996-05-14 | Yamaha Motor Co Ltd | 補助動力式ビークル |
JPH1011106A (ja) * | 1996-06-27 | 1998-01-16 | Yamaha Motor Co Ltd | 動力源総合制御方式 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011168272A (ja) * | 1999-07-21 | 2011-09-01 | Nokia Corp | 操作可能な装置 |
JP2018172092A (ja) * | 2017-03-31 | 2018-11-08 | 本田技研工業株式会社 | 運転技量判定装置及び運転技量判定方法 |
US11739806B2 (en) | 2019-10-11 | 2023-08-29 | Hyundai Motor Company | Electromechanical brake system having suspension control function |
US11590943B2 (en) | 2020-06-17 | 2023-02-28 | Hyundai Motor Company | Control system of brake-by-wire device |
CN113987736A (zh) * | 2021-08-31 | 2022-01-28 | 中国北方车辆研究所 | 一种液粘离合器控制品质综合评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3825845B2 (ja) | 進化的制御方式 | |
US6151548A (en) | Integrated controlling system | |
US6278986B1 (en) | Integrated controlling system | |
US6304862B1 (en) | Evolutionary controlling system | |
US6721647B1 (en) | Method for evaluation of a genetic algorithm | |
US7062333B2 (en) | Optimal solution search device, device for controlling controlled object by optimizing algorithm, and optimal solution search program | |
CN112668235A (zh) | 基于离线模型预训练学习的ddpg算法的机器人控制方法 | |
Tan et al. | Integrating temporal difference methods and self-organizing neural networks for reinforcement learning with delayed evaluative feedback | |
US6314412B1 (en) | Evolutionary control of machine based on user's preference inferred from user's operation | |
US6324529B1 (en) | Evolutionary controlling system | |
EP1107077A2 (en) | Method and apparatus for optimizing a control system for a unit device integrated in a machine assembly | |
JP2000250604A (ja) | 特性最適化方法における最適化の協調方法 | |
US6529816B1 (en) | Evolutionary controlling system for motor | |
JPH11327606A (ja) | 総合制御方式 | |
JPH1011106A (ja) | 動力源総合制御方式 | |
CN114355897A (zh) | 一种基于模型和强化学习混合切换的车辆路径跟踪控制方法 | |
JPH10154002A (ja) | 総合制御方式 | |
JPH10333705A (ja) | 総合制御方式 | |
JPH11353298A (ja) | 遺伝的アルゴリズムにおける個体のオンライン評価手法 | |
JPH10154003A (ja) | 進化的制御方式 | |
JP2000250603A (ja) | 総合特性最適化方法 | |
JP2000250602A (ja) | 総合特性最適化装置 | |
JP2004013328A (ja) | 評価値算出方法、評価値算出装置、制御対象の制御装置及び評価値算出プログラム | |
JP2002222409A (ja) | ニューラルネットワークの最適化学習方法 | |
Hagras et al. | Online learning of fuzzy behaviours using genetic algorithms and real-time interaction with the environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070124 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070530 |