JPH11353298A

JPH11353298A - 遺伝的アルゴリズムにおける個体のオンライン評価手法

Info

Publication number: JPH11353298A
Application number: JP10157348A
Authority: JP
Inventors: Takaaki Shibata; 卓明芝田
Original assignee: Yamaha Motor Co Ltd
Current assignee: Yamaha Motor Co Ltd
Priority date: 1998-06-05
Filing date: 1998-06-05
Publication date: 1999-12-24

Abstract

(57)【要約】【課題】エンジンのような非線形特性を持つ対象の制
御に遺伝的アルゴリズムを適用し、個体のオンライン評
価を行う際に生ずる上記の問題に対し、個体の比較条件
を設け、進化の効率化を実現する。【解決手段】本発明のオンライン評価手法は、遺伝的ア
ルゴリズムにおける複数個体の評価をオンラインで行う
際、細分化された評価領域毎に局所的な予備評価値を算
出し、これらを総合的に評価して、総合的評価値を算出
することを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、エンジンのような
非線形特性を持つ対象の制御に遺伝的アルゴリズムを適
用し、個体のオンライン評価を行う際に生ずる上記の問
題に対し、個体の比較条件を設け、進化の効率化を実現
するものである。

【０００２】

【従来の技術】自然進化の過程を模倣して構築された遺
伝的アルゴリズムでは、一般的に同一世代内の個体を評
価し、その評価値に基づいて遺伝的操作を行う。しか
し、遺伝的アルゴリズムを、例えばエンジンのような非
線形特性を持つ対象の制御に適用する場合、入力条件に
より出力が大きく異なるため、単純に一個体に一評価値
を与え個体を比較することが困難である。

【０００３】

【発明が解決すべき課題】以上の問題を解決するため
に、本発明では、上述のような非線形特性を持つ対象の
制御に遺伝的アルゴリズムを適応し、さらに前記個体の
オンライン評価（このオンライン評価とは、対象が実使
用での動作状態における評価を言う）を行なう際に生ず
る上記の問題に対し、個体の比較条件を設け進化の効率
化を実現する。

【０００４】

【課題を解決するための手段】上記の課題を解決するた
めに、請求項１で定義される発明では、遺伝的アルゴリ
ズムにおける複数個体の評価をオンラインで行う際、細
分化された評価領域毎に局所的な予備評価値を算出し、
これらを総合的に評価して、総合的評価値を算出するこ
とを特徴としている。

【０００５】

【発明の実施の形態】以下、本発明に係る総合制御方式
の実施の形態を添付図面に示した一実施例を参照して説
明する。図１は本発明に係る総合制御方式の基本概念を
示すブロック図である。図面に示すように、この総合制
御方式は、反射層、学習層、及び進化適応層の三つの制
御層から成り、外部から制御すべき制御対象に関する情
報（例えば、動作状態に関する情報等）を入力し、この
入力情報に基づいて反射層で予め用意された数式、マッ
プ、ファジールール、ニューラル回路網、又はサブサン
プションアーキテクチャ等の形式の制御系に基づいて操
作量を決定すると共に、進化適応層で使用者及び／又は
使用状況の特性に合わせて制御系の目標値や係数などを
自律的に変化させ、学習層で進化適応層の情報を学習す
る。以下、総合制御方式における反射層、学習層、及び
進化適応層の働きについて説明する。反射層は、制御対
象に関する情報（以下、外界情報と称する。）と、外界
情報に対する制御基本量との関係を数式、マップ、ファ
ジールール、ニューラル回路網、又はサブサンプション
アーキテクチャ等の形式の制御系で予め備えている層で
あり、外界情報が入力されると、上記した制御系から入
力された外界情報に対する操作量を決定して出力する。
尚、前記サブサンプションアーキテクチャとは、並列的
な処理を行う行動型人工知能として公知である。進化適
応層は、評価系と進化適応系との二つの制御系から成
る。評価系は、外界情報、及び／又は使用者の特性（例
えば、好み、技量、又は状態等）に関する情報、及び／
又は使用状況の特性（例えば、使用環境の変化等）に関
する情報を入力し、これらの情報から使用者の特性及び
／又は使用状況の特性を推定し、この推定結果に基づい
て進化適応系の評価を行う。進化適応系は、反射層で用
いられる目標値や制御パラメータの少なくとも一つの補
正値を出力する制御モジュール群から成る。この制御モ
ジュール群は、制御対象に関する特性に基づいて前記目
標値及び／又は制御パラメータの補正値を出力する少な
くとも二種類の下位モジュール群と、前記二種類の下位
モジュール群からの出力における最終的な進化適応層か
らの出力に対する比率を使用者及び／又は使用状況に基
づいて決定し、最終的な目標値及び／又は制御パラメー
タの補正値として出力する上位モジュール群とを含む。
この進化適応系は、所定の条件の下で各制御モジュール
が順に評価系の評価結果を判断基準として自律的に進化
して、その時点で最適な制御モジュールの獲得を行い、
最適な制御モジュールで反射層に目標値及び／又は制御
パラメータの補正値の出力を行う。学習層は、進化適応
層の制御モジュールに対応する学習用と実行用に入れ替
え可能な制御モジュールを備え、一方の制御モジュール
（実行用）で制御を実行している間、他方の制御モジュ
ール（学習用）で対応する進化適応層の制御モジュール
が進化する毎に、進化後の制御モジュールに関する入出
力関係と、学習層の実行用の制御モジュールの入出力関
係とを合わせて学習する。学習用制御モジュールでの学
習が終了すると、制御を実行している制御モジュールと
学習後の制御モジュールが入れ替わり、学習後の制御モ
ジュールで反射層に目標値及び／又は制御パラメータの
補正値を出力する制御を開始し、それまで制御を実行し
ていた制御モジュールが学習用として機能し始める。
尚、この学習層における制御モジュールは初期状態では
ゼロを出力するように設定されており、従って、初期状
態では反射層と進化適応層とによる制御が行われる。進
化適応層は、その時点で最適な制御モジュールに関する
情報を学習層に学習させた後は、その出力をゼロに戻
し、反射層と学習層の実行用の制御モジュールとによる
制御を行わせ、その評価が前の実行用の制御モジュール
による制御より向上していれば、進化が進んでいると判
断して再度同じ制御モジュールに対する進化処理を行
い、また、評価が向上していなければ、別の制御モジュ
ールの進化処理を行う。尚、学習層における学習済みの
制御モジュールに関する情報は、ＩＣカードやフロッピ
ーディスク等の外部記憶手段に保存・読み出し可能にさ
れており、使用者が必要に応じて過去の最適制御モジュ
ールに関する情報を外部記憶手段から読み出して、その
情報に基づいて学習層で基本補正量を出力することがで
きるようにされている。また、使用者が外部記憶手段か
ら過去の最適制御モジュールに関する情報を読み出して
学習層を作動させる場合、学習層が読み出した制御モジ
ュールによって作動している間は、進化適応層は、その
出力がゼロに固定され、制御モジュールの進化処理を停
止する。また、反射層における制御パラメータは、反射
層を構成する任意のパラメータであり、例えば、制御対
象がエンジンの空燃比であり、反射層が仮想空燃比を算
出する順モデルを用いて構成されている場合には、仮想
空燃比を算出するためのパラメータ、即ち、シリンダに
おける体積効率や吸気管に対する燃料付着率や燃料の蒸
発時定数等が考えられ得、又目標値としては目標空燃比
が考えられ得る。上記した各層の働きにより、この総合
制御方式からの出力される操作量は、制御すべき制御対
象を使用する使用者の好みや使用環境の変化等の特性に
合わせて刻々と変化し、その結果、制御対象の特性は使
用者及び／又は使用状況の特性に適応した特性に刻々と
変化していく。本明細書では、この総合制御方式により
制御対象の特性が使用者及び／又は使用状況の特性に適
応して進化していく状態を「調教」と称する。

【０００６】図２は、上記した総合制御方式を経時的に
示すフローチャートである。初期状態では、学習層の出
力はゼロであり（ステップａ）、従って、制御対象の使
用が開始された直後は、制御対象は、予め設定された目
標値及び／又は制御パラメータ（補正なし）を用いた反
射層の出力（操作量）により制御される。制御対象の使
用が開始されると、進化適応層は、使用者及び／又は使
用状況の特性を推定し、この推定結果に基づく評価を行
いながら、何れか一つの制御モジュールを所定世代数進
化させる（ステップｂ）。進化適応層は、制御モジュー
ルを遺伝的に所定世代数進化させ、制御モジュールをそ
の時点（最終世代）で最も望ましい制御モジュールに固
定し、その制御モジュールに基づいて反射層に目標値及
び／又は制御パラメータの補正値を出力する。学習層で
は、進化適応層が最適制御モジュールに固定された時の
進化適応層の入出力関係と学習層の実行用制御系の入出
力関係を対応する学習用の制御モジュールで合わせて学
習する。尚、初期状態においては学習層の実行用制御系
の出力はゼロであるが、一度学習を終了した後は、進化
適応層と学習層の実行用制御モジュールとの両方の補正
値で反射層の目標値及び／又は制御パラメータの補正を
行うことになる（ステップｄ）。学習用制御モジュール
の出力に基づく疑似操作量と、実際の操作量との差がし
きい値より小さくなった時点で学習層における学習用制
御モジュールは学習を終了し、学習用制御モジュールと
実行用制御モジュールとが入れ替わって、学習後の制御
モジュールが実行用として機能し、制御を実行していた
制御モジュールが学習用として機能し（ステップｄ）、
反射層と学習層とによる制御が行われる（ステップ
ｅ）。進化適応層は、この反射層と学習層とによる制御
の結果の評価を行い、評価が進化適応層の進化前の評価
より向上していれば進化が進んでいると判断して再度同
じ制御モジュールの進化処理を行うためにステップｂの
処理に戻り、評価が向上していなければ対応する制御モ
ジュールの進化が一旦収束したと判断して別の制御モジ
ュールの進化処理を行う（ステップｆ）。

【０００７】次に、上記した総合制御方式について、制
御対象として車両用エンジンの空燃比を例に挙げて、必
要に応じて図２に示したフローチャートを参照しなが
ら、さらに具体的に説明する。図３は、エンジン１と前
記総合制御方式を実行する制御装置１０との関係を示す
概略図である。図面に示すように、制御装置１０は、エ
ンジン回転数、吸気負圧、スロットル開度、スロットル
開度変化率、大気圧、吸気温度、冷却水温、ギヤポジシ
ョン等の情報を入力し、これら入力情報に基づいて燃費
性能と加速性能の両立を図ったエンジンの空燃比制御を
行う。図４は、前記制御装置１０の概略ブロック図であ
る。この制御装置１０は、上述したように反射層、学習
層、及び進化適応層から成る。

【０００８】（反射層について）反射層は、エンジン回
転数、吸気負圧、スロットル開度、スロットル開度変化
率、大気圧、吸気温度、及び冷却水温等のエンジンの運
転状態に関する情報を入力し、これら入力信号に基づい
て所定の目標空燃比に沿った燃料噴射装置の操作量を決
定して出力する。尚、前記目標空燃比は初期値は予め設
定されており、使用者の好みや使用状況等に応じて進化
適応層及び学習層の出力により補正される。

【０００９】（進化適応層について）進化適応層は、評
価系と進化適応系とから成る。図５は、進化適応層の基
本動作のフローチャートである。以下、このフローチャ
ートを参照して進化適応層の基本動作について説明す
る。評価系は、一定時間内の各ギヤポジションにおける
最高回転数の分布パターン（図６及び図７参照）と走行
状態指数Ｐとの関係を学習したニューラル回路網（図８
参照）を備えており、ギヤポジション信号とエンジン回
転数信号を入力し（ステップ１）、前記入力情報から前
記ニューラル回路網により走行状態指数Ｐを決定する
（ステップ２）。例えば、スポーティな走行を好む使用
者は、低速のギヤで高い回転数までエンジンを回す傾向
にあるため、その分布パターンは図６（ａ）に示すよう
になり、また、マイルドな走行を好む使用者は、早めに
高速のギヤに変えていく傾向にあるため、その分布パタ
ーンは図６（ｂ）に示すようになる。従って、図８に示
したニューラル回路網で、図６（ａ）に示す分布パター
ンの時に走行状態指数Ｐが大きな値となり、また、図６
（ｂ）に示す分布パターンの時に走行状態指数Ｐが小さ
な値となるように予め学習しておくと、前記ニューラル
回路網から得られる走行状態指数Ｐは、使用者の走行に
対する好みがスポーティであればある程大きくなり、マ
イルドであればあるほど小さくなり、使用者の好みが反
映したものになる。また、図７（ａ）に示すように一定
時間内に１速から６速までの各ギヤを使用した場合には
走行状態指数Ｐの値が大となり、図７（ｂ）に示すよう
に低速のギヤばかりを使用した場合には走行状態指数Ｐ
の値がやや大となり、また図７（ｃ）のように高速のギ
ヤばかりを使用した場合には走行状態指数Ｐの値が小と
なるように前記ニューラル回路網で学習しておけば、通
常車両では、通常走行の場合には各ギヤを使用し、渋滞
路走行の時には低速ギヤばかりを使用し、また、高速道
路走行の時には、高速ギヤばかりを使用するので、ニュ
ーラル回路網で得られる走行状態指数Ｐに基づいて、例
えば、図７（ａ）の場合は通常走行であり、図７（ｂ）
の場合は渋滞路走行であり、図７（ｃ）の場合は高速道
路走行であると推定することができる。評価系は、この
走行状態指数Ｐから、その時の走行状況を推定し、か
つ、使用者の好みが燃費性能重視か、加速性能重視かを
判断して加速重視割合αを推定する（ステップ３）。加
速度重視割合αは、図９に示すように、予め決められた
加速度重視割合αと走行状態指数Ｐとの関数から求めら
れ、例えば、高速道路走行時（図７（ｃ）参照）で走行
状態指数Ｐが小さい時には加速度重視割合αは小さく燃
費重視の値となり、また、スポーティな走行時（図６
（ｂ）参照）で走行状態指数Ｐが大きい時には加速度重
視割合αは大きく加速度重視の値となる。進化適応系
は、燃費が最良となるような燃料噴射制御則の獲得を目
指す燃費モジュール及び出力が最高となるような燃料噴
射制御則の獲得を目指すパワーモジュールからなる下位
モジュールと、使用者の好みに合わせて運転状態に応じ
た前記燃費モジュールと前記パワーモジュールの出力比
の獲得を目指すコントロールモジュールから成る上位モ
ジュールと、評価方法スイッチング手段とを備えている
（図４参照）。前記各モジュールは、図１０に示すよう
に各々２入力１出力の階層型ニューラル回路網で構成さ
れ、燃費モジュール及びパワーモジュールは各々正規化
スロットル開度及び正規化エンジン回転数からなる入力
信号ｓを図４の評価方法スイッチング手段を介して入力
して目標空燃比補正量の一次出力値を出力し、コントロ
ールモジュールは正規化スロットル開度と正規化スロッ
トル開度変化率を入力して下位モジュール（即ち、燃費
モジュール及びパワーモジュール）の出力比を出力する
ことで目標空燃比補正量の最終出力値を決定する。な
お、前記評価方法スイッチング手段は、例えば車両加速
度に閾値を設け、その閾値を越えた場合における入力信
号ｓをパワーモジュールへ伝達し、前記閾値を下回る場
合には入力信号ｓを燃費モジュールへ入力するように動
作する。前記燃費モジュール及びパワーモジュールは、
図１１に示すように運転状態や使用者の好みに関係な
く、それぞれ燃費が最良になる空燃比と出力が最良にな
る空燃比が得られるような空燃比補正量を獲得するよう
各ニューラル回路網の結合係数を遺伝的アルゴリズムを
用いて順番に自律的に進化させる（ステップ４及び
５）。これに対してコントロールモジュールは、最良燃
費空燃比と最良出力空燃比の間で、使用者の好みにあっ
た燃費モジュール及びパワーモジュールの出力比を獲得
するように、そのニューラル回路網の結合係数を遺伝的
アルゴリズムを用いて自律的に進化させる（ステップ
６）。なお、各制御モジュールの進化は、各制御制御モ
ジュールを構成するニューラル回路網の結合度を遺伝子
としてコーディングして複数の個体を生成し、全ての個
体を用いて実際にエンジンを作動させた結果を各個体毎
に評価系で評価し、評価結果の一番高い個体（エリート
個体）を含む幾つかの親個体を選択してこれらを交叉さ
せて次世代の子個体を生成し、各個体に対する評価を行
うことを繰り返すことで行われる。上記した進化処理
は、進化が収束するまで所定世代数毎に学習層で学習を
行いながら、連続して同じ制御モジュールに対して、繰
り返し行われる。進化処理中は、進化の対象となる制御
モジュール以外の制御モジュールは、固定しておき、進
化処理中の制御モジュールの進化が終了した後、次の制
御モジュールの進化処理が行われる。所定世代数毎の学
習の際には、その世代のエリート個体で、ニューラル回
路網の結合係数を固定して、学習層の学習用制御モジュ
ールに学習させる。学習が終了した時点で、学習に用い
たエリート個体と、進化適応層の出力がゼロになる個体
とを含む新しい個体群を生成する。こうすることで、次
の進化処理において、前の進化処理の性能を損なうこと
なく、進化中の個体群の多様性を保つことができる。全
ての制御モジュールの進化が終了した後は、進化適応層
はその出力をゼロにして、反射層と学習層の学習済みの
制御用モジュールとによる制御が実行される（ステップ
７）。その後、進化適応層は一定時間間隔で作動し、進
化適応層の負荷により性能の向上、即ち、評価の向上が
見られた場合、各制御モジュールの進化処理を繰り返す
（ステップ８）。

【００１０】以下に上記した遺伝的アルゴリズムによる
モジュールの進化について、図１２のフローチャートを
参照して燃費モジュールの進化を例に挙げてさらに詳細
に説明する。始めに、図１３に示すように、燃費モジュ
ールを構成するニューラル回路網の結合係数を遺伝子と
してコーディングして複数の個体ａ（ｎ）（本実施例で
はｎ＝９）からなる第１世代を生成する（ステップ
１）。ここで、各個体の遺伝子の値（即ち、ニューラル
回路網の結合係数の値）の初期値は予め決められた範囲
内（ほぼ−１０〜１０の間）でランダムに決定する。ま
たこの時、既に学習層が学習を行い出力をしている場合
には、進化適応層の出力をゼロにできる個体（図１３に
おける個体ａ（１））を一つ含ませることで、個体数に
制限がある場合でもその時点の性能を損なうことなく進
化処理中の個体群の多様性を保つことができる。次に、
ステップ１で生成された個体ａ（ｎ）の中の一つ、例え
ば、個体ａ（１）に対して、燃費モジュールのニューラ
ル回路網を用いて実際の入力情報（エンジン回転数及び
スロットル開度）に対するニューラル回路網の出力ｘ
（１）を決定し（ステップ２）、さらにこの出力を式
（１）を用いて線形変換して個体ａｎ（１）に対する燃
費モジュールの出力ｙｆ（１）を決定する（ステップ
３）。尚、入力情報のエンジン回転数及びスロットル開
度はそれぞれ正規化したものを用いる。ｙｆ（ｎ）＝２×Ｇｘ（ｎ）−Ｇ（１）ここで、ｙｆ（ｎ）は燃費モジュールの出力、ｘ（ｎ）
は燃費モジュールにおけるニューラル回路網の出力、Ｇ
は進化適応層出力ゲインであり、ｎは個体を示してい
る。このように、ニューラル回路網の出力ｘ（ｎ）を線
形変換して用いることにより、燃費モジュールからの出
力ｙｆ（ｎ）が極端に大きな値になることがなく、全体
として進化がすこしづつ進むようになり、エンジンの挙
動が評価や進化のために極端に変動することがなくな
る。個体ａ（１）に対する燃費モジュールの出力ｙｆ
（１）を決定した後、パワーモジュールの出力ｙａ及び
コントロールモジュールの出力ＯＲを用いて次式（２）
に基づいて進化適応層の出力（評価用補正量Ｙａ
（ｎ））を決定する（ステップ４）。Ｙａ（ｎ）＝ＯＲ×ｙａ＋（１−ＯＲ）×ｙｆ
（ｎ）尚、燃費モジュールの進化処理中は、パワーモジュール
及びコントロールモジュールの結合係数は固定されてい
る。上記したようにコントロールモジュールの出力ＯＲ
は、燃費モジュールの出力ｙｆとパワーモジュールの出
力ｙａとの比率であり、従って、コントロールモジュー
ルの出力ＯＲが”１”の場合は進化適応層の出力はパワ
ーモジュールの出力となり、また、前記出力ＯＲが”
０”の場合は進化適応層の出力は燃費モジュールの出力
となる。個体ａ（１）に対する進化適応層の出力Ｙａ
（１）が決定した後、この仮補正値Ｙａ（１）を実際に
進化適応層から出力し、学習層の出力Ｙｂと加算し（ス
テップ５）、この補正値Ｙａ（１）＋Ｙｂにより補正さ
れた目標空燃比に基づく制御を所定の時間だけ反射層で
行う（ステップ５）。反射層で実際に制御を行いなが
ら、進化適応層の評価系ではこの制御の結果に関する情
報をフィードバックして、個体ａｎ（１）に対する評価
値（例えば燃料消費量）を決定する（ステップ６）。上
記したステップ１〜ステップ６までの処理は、ステップ
１で生成された９個の個体ａ（１）〜ａ（９）に対する
全ての評価値の算出を１サイクルの予備評価処理とし
て、この予備評価処理を予め決められた所定のサイクル
行うまで繰り返し行われ（ステップ７）、全ての個体に
対して所定サイクル分の評価値を算出した後に各個体の
総合評価処理（ステップ 8）に進む。

【００１１】総合評価処理（ステップ 8）では、各個体
毎に各個体の適応度の評価を行うステップであり、上記
したように、各個体を用いた制御を順番に所定回数行い
各個体を時分割により擬似的に並行的に作動させること
で（図１４参照）、刻々と変化する走行状況のもとでも
各個体の評価をほぼ同じ条件で公平に行うことが可能に
なり、オンライン評価、即ち、車両走行中の評価が可能
になる。

【００１２】またオンライン評価の場合、評価領域全体
に対して満遍なく評価データが得られることは困難であ
る。例えば、車両走行を開始してからある一定期間（時
間または距離）において、パワーモジュールを評価する
ための各個体の評価入力値は、エンジン回転数の中低領
域中心に得られる。この状態で、各個体の優劣をより正
確に評価するには、得られた中低域領域を細分化して、
各個体が共通して得られた領域を把握し、比較するべき
領域を決定し、さらに、単純に共通領域同士を比較する
のではなく、重要な領域と非重要な領域を区別しつつ重
みづけ処理をしつつ比較するといった処理を行うこと
で、より正確な各個体の適応度の評価を行なうことが可
能となる。上記条件におけるパワーモジュールの評価デ
ータの領域選択および重みづけ処理の一例を図２０を参
照して説明する。なおこのパワーモジュールは、エンジ
ンの動特性をレスポンス性能にて評価するモジュールで
ある。このレスポンス性能に関する個体の評価は、スロ
ットルの操作方法に依存した走行パターンにより評価領
域を細分化させ、更に、レスポンス性能に関する局所的
な評価値を、エンジン回転数変化率を平均スロットル開
度変化率で割って算出したものとしている。

【００１３】図中において、ａ(1)、ａ(2)およびａ(3)
は、夫々個体ａ(1)、個体ａ(2)および個体ａ(3)に蓄積
された評価データの状態を示している。また、使用者の
特性に応じたウエイトマップは図面の最上位置に記載し
た。なお、同図面中には多くの数値や符号を記載してい
るが、これらは以下の条件に基づいて記載している。・記載された４種類の升目状の図面は、何れも横軸側が
エンジン回転数であり、縦軸側が平均スロットル開度変
化率である。・記載された４種類の升目状の図面の位置を指定する場
合、座標形式位置指定をする。即ち、横軸側をＡ、Ｂ・
・Ｊ、縦軸側をｖ、ｗ・・ｚとし、例えば、図中下端側
に評価領域という言葉を表記し、その言葉から升目へ引
き出し線を延ばしている箇所を例に、位置指定をする
と、この升目の場所はａ（１）の（Ｂ，ｖ）と表現する
ことができる。・実際に得られた評価データの一例は、ａ（１）の
（Ｂ，ｗ）の評価領域内に記載された比較的小さな数
字、60および70がそれに対応する。同様に他の評価領域
および、他の個体においても同様に小さな数字が、オン
ラインにおける実データとしている。・評価領域内を斜線で示した箇所は、個体ａ(1)、個体
ａ(2)および個体ａ(3)の何れにも実データが存在した共
通集合評価領域(k)を示している。・評価領域内を比較的太い点線で囲った領域は、個体ａ
(1)、個体ａ(2)および個体ａ(3)の何れかに実データが
存在した和集合評価領域(w)を示している。・上記和集合評価領域(w)内で○の印が付された箇所
は、実データが得られなかった評価領域を示している。・○印の中に記載された数字は、実データの得られた別
の個体に存在する実データの平均を取った値と同値とし
ており、実データの得られた別の個体が複数であった場
合には、さらに各個体同士の平均値を算出した値と同値
としている。一例を挙げて説明すると、ａ（２）の
（Ｂ，ｗ）は、実データが得られず、同位置のａ（１）
では、60および70の実データが得られている。従って、
ａ（１）では、平均値65となり、一方、同位置ａ（３）
では、45,60および70の実データが得られており、平均
値は約58.3である。さらに、これら65と58.3の平均を取
ると約61.6という値が得られ、ａ（２）の（Ｂ，ｗ）
は、実データの代りに仮想の61.6を入れることにする。
以上の手順で各個体の和集合領域(w)内の○印内には、
仮想の値が各々算出して挿入することができる。図２０
では、既に上述の計算をした結果を記載している。・ウエイトマップ(U) に記載された各数値は、各評価領
域毎の評価の重みづけの値を示している。一例を挙げる
と、ａ（２）の（Ｂ，ｗ）の仮想値61.6に対して、同一
評価領域の重みづけの値は30(％)であるから、約18.5と
なる。なお、このウエイトマップ(U)に記載された各数
値は、使用者の特性に依存して決定がなされることが望
ましく、さらに、例えば、使用者の走行の癖等に応じ
て、利用の重なるマップの入力数値に対しては、重みづ
け数値をより高く進化させ、また、利用の少ないマップ
の入力数値に対しては、重みづけ数値を減少させるよう
に進化させることが好ましい。

【００１４】次に、以上の規則に基づいて各個体の評価
例を共通集合領域(k)と、和集合領域(w)の双方で具体的
に評価をした例を示す。まず、共通集合領域(k)同士で
各個体の評価値を算出する。個体ａ（１）における評価
値の算出過程を示すと、(C,x)は実データの平均値が(60
+50+45)/3=51.6であり、重みづけ値(35)を掛け合わすと
18.1となる。同様にして、各評価領域を求めると、(C,
y)が5.5、(D,x)が26.3そして(D,y)が12.7となる。これ
ら４つの評価領域の重みづけを含めた総合点は18.1+5.5
+26.3+12.7=62.8であり、１評価領域当たりの平均は15.
7となる。同様にして、個体ａ（２）の共通集合領域(k)
の総合点は62.4であり、１評価領域当たりの平均は15.6
である。さらに個体ａ（３）の共通集合領域(k)の総合
点は37.2であり、１評価領域当たりの平均は9.3とな
り、各個体を比較すると、この共通集合領域(k)内にお
いては、個体ａ（１）が最も優秀であると算出がなされ
る。次に和集合領域(w)同士で各個体の評価値を算出す
る（計算過程は共通集合領域(w)と同一なので省略す
る）と、ａ（１）の総合点が約308であり、１評価領域
当たりの平均は１９となる。ａ（２）の総合点は327で
あり、１評価領域当たりの平均は20である。最後にａ
（３）の総合点は354であり、１評価領域当たりの平均
は２２となる。従って、和集合領域(w)内において優秀
な個体はａ（３）となる。以上のように、評価領域を細
分化し、各々の細分化された評価領域毎に重要度に値す
る重みづけ値を乗算し、共通集合領域(k)同士を比較し
たり、または和集合領域(w)内で比較をする場合には、
不足データを他の個体の評価値の平均から求めたとした
シミュレーションの値を入力することによってデータ数
違いによる格差を補正しつつ評価結果を総合的に比較す
ることによって、より正確で、しかも利用者の希望に近
い領域を重視しつつ比較結果を得ることが可能となって
いる。

【００１５】以上は、パワーモジュールに関しての各個
体間の比較条件を述べたが、燃費モジュールにおいて
も、算出過程やシミュレーションの過程に変わりはな
い、ただし、燃費モジュール自身の特質として、エンジ
ンの静特性を燃費性能または／及び出力にて評価するこ
とを目的としており、燃費性能に関する局所的な評価値
を、その評価領域において単位時間中に噴射する燃料噴
射量としている。また更に、出力に関する局所的な評価
値を、その評価領域におけるスロットル開度としている
点が異なる。

【００１６】上記した総合評価処理が終了した後、所定
の世代数経過したか否かを判断し（ステップ９）、最終
世代でなければ親個体の選択を行う（ステップ１０）。
この選択にはルーレット式選択方式を用い、各個体の適
応度に比例した確率で、確率的に幾つかの親個体を選択
する。尚、この時、厳密に世代交代を適用しすぎると、
評価の高い個体を破壊してしまう恐れがあるため、エリ
ート（評価の最も高い個体）を無条件に次世代に残すエ
リート保存戦略も合わせて用いる。また、複数の個体か
ら成る集団内の最大適応度と平均適応度の比が一定とな
るように、適応度の線形変換を行う。親個体の選択が終
わると、選択された個体を親個体として、交叉を行い、
再び９個の子個体から成る第二世代を生成する（ステッ
プ１１）。個体間の交叉には、１点交叉、２点交叉、又
は正規分布交叉等の手法を用いる。正規分布交叉とは、
実数値表現の染色体（個体）について、両親を結ぶ軸に
対して回転対称な正規分布にしたがって子を生成する方
法である。正規分布の標準偏差は、両親を結ぶ主軸方向
の成分については両親間の距離に比例させ、その他の軸
の成分については両親を結ぶ直線と集団からサンプルし
た第３の親との距離に比例させる。この交叉方法は、親
の特質が子に引き継がれやすいという利点がある。ま
た、生成された９個の子個体に対して一定の確率で、ラ
ンダムに遺伝子（結合度）の値を変更し、遺伝子の突然
変異を発生させる。尚、これら９個の子個体には、前記
した進化適応層の出力をゼロにできる個体を一つ含ませ
る。上記した処理により、第２世代を生成した後、再び
ステップ２からの予備評価処理を繰り返す。上記した進
化処理は、予め決められた世代数経過するまで繰り返し
行われる。これにより、各世代を構成する子個体は評価
系の評価に沿って、即ち、燃費モジュールの場合には、
燃費が最良となるような燃料噴射制御則を獲得するよう
に進化していく。予め決められた世代数経過したか否か
はステップ９で判断され、ステップ９で最終世代である
と判断すると、その世代の９個の子個体の中から適応度
の最も高い個体（最適個体）、即ち、エリートを一つ選
び出し（ステップ１２）、燃費モジュールのニューラル
回路網の結合係数を、前記した最適個体を構成する遺伝
子で固定し（ステップ１３）、学習層の学習用制御モジ
ュールに対する学習処理に移行する（図２におけるステ
ップｃ参照）。図２のフローチャートで示すように、一
つの制御モジュール（この場合は燃費モジュール）に対
する進化処理は学習後の学習層と反射層とによる制御の
評価が、進化前の制御の評価より高い間は、連続して繰
り返され、進化処理後の制御の評価が進化処理前の制御
の評価より向上しなくなったら、その制御モジュールの
進化が収束したと判断して、次の制御モジュール（本実
施例の場合はパワーモジュール）の進化処理に移行する
（図５におけるステップ５参照）。

【００１７】パワーモジュール及びコントロールモジュ
ールの進化処理も上記した燃費モジュールの進化処理と
同様に行われるが、パワーモジュールにおける各個体に
対する総合評価値は、評価値算出サイクル中の平均エン
ジン回転数を平均スロットル開度で割って算出される。
これにより、パワーモジュールの進化処理中の各世代を
構成する子個体は評価系の評価に沿って、即ち、出力が
最良となるような燃料噴射制御則を獲得するように進化
していく。また、コントロールモジュールにおける各個
体に対する総合評価値は、評価値算出サイクル中の燃費
評価値及びレスポンス評価値と、加速度重視割合αと、
基準とする燃費評価値及びレスポンス評価値とを用いて
判断される。即ち、評価値算出サイクル中の燃費評価値
をＦＣ、レスポンス評価値をＲＰ、基準燃費評価値をＦ
Ｃbase、基準レスポンス評価値をＲＰbaseとすると、コ
ントロールモジュールにおける総合評価値ＣＮＴは次式
で与えられる。ＣＮＴ＝（１−α）×Scale×（ＦＣ−ＦＣbase）／Ｆ
Ｃbase ＋α×（ＲＰ−ＲＰbase）／ＲＰbase ここで、Scaleは燃費評価値とレスポンス評価値のバラ
ンスをとるための係数である。また、燃費評価値は上記
した燃費モジュールにおける総合評価値と同様に算出さ
れ、レスポンス評価値ＲＰは、所定のしきい値より大き
いスロットル開度の変化が一定時間続いたら加速とみな
して、その時の速度変化をスロットル開度変化率で割
り、これを所定の評価値算出サイクルの時間内の各加速
毎に算出したものの平均値とする。上記したように、燃
費評価値とレスポンス評価値を使用者の好みに基づいて
決められた加速度重視割合αの比率に合わせて評価する
ことにより、コントロールモジュールは、使用者の好み
に合わせて運転状態に応じた燃費モジュールとパワーモ
ジュールの出力比を獲得できるよう進化していく。

【００１８】上記した遺伝的アルゴリズムにより、燃費
モジュール、加速モジュール、及びコントロールモジュ
ールの進化が終了し、学習層での学習が終了すると、進
化適応層の出力はゼロになり、学習層と反射層とによる
制御に移行する（図５におけるステップ７参照）。上記
したように、下位制御モジュール群を構成する燃費モジ
ュールとパワーモジュールとが各々燃費及び出力優先に
進化し、上位制御モジュールを構成するコントロールモ
ジュールが使用者の好みに合わせて下位制御モジュール
の出力比率を決めるように進化することにより、各機能
（即ち、燃費及びエンジン出力）について最適な出力を
行える下位モジュールを使用者の好みに合った出力比率
で用いた制御を行うことができるようになる。

【００１９】（学習層について）次に、学習層について
詳細に説明していく。学習層は、図４に示すように進化
適応層の制御モジュールに対応する種類の制御モジュー
ル群を備え、各制御モジュール群は、二つのニューラル
回路網Ａ，Ｂから成る。これら二つのニューラル回路網
は一方が学習用として機能している時は、他方は実行用
として機能する。学習用のニューラル回路網は、進化適
応層で各モジュールの進化処理が所定世代数行われ、そ
のモジュールを構成するニューラル回路網がその時点で
最適な結合係数で固定されると、進化適応層の入力と出
力との関係を、学習層の実行用として機能しているニュ
ーラル回路網の入力と出力との関係と合わせて学習す
る。具体的には、例えば、前記した学習では、進化適応
層と学習層の実行用ニューラル回路網との入出力を、あ
るステップ幅で平均化し、これを入出力データとして教
師データ集合の更新に用いる。例えば、１秒間の平均エ
ンジン回転数が５０００ｒｐｍ、平均スロットル開度が
２０であった場合、これらと、その時の進化適応層及び
学習層における実行用ニューラル回路網の目標空燃比補
正量とを合わせたものを入出力データとして用いる（図
１５参照）。この入出力データを、以前の教師データに
加えて新しい教師データ集合を得る。この時、得られた
教師データの作成時間を記録しておき、学習層の学習に
際して作成時間が新しい教師データほど重要視されるよ
うに重みづけを行う。学習層にＣＭＡＣを使用し、進化
適応層による直前の進化処理により得られた最新のデー
タのみを用いて学習を行う場合の模式図を図１６に示
す。上記した学習は、学習中の学習用ニューラル回路網
の出力と制御出力との誤差がしきい値より小さくなった
時点で終了し、その後、学習用のニューラル回路網は実
行用になり、もとの制御用のニューラル回路網が学習用
となる。この学習は、上記したように進化適応層におけ
る制御モジュールの進化処理が所定の世代数行われる毎
に行われる。従って、一つの制御モジュールに対して進
化処理が始まってから進化が収束するまでの間は、所定
の世代数進化処理が行われる毎に学習が行われるように
なる。このように、各制御モジュールに対して進化と学
習とを交互に繰り返すと、学習を行わずに進化処理のみ
で進化させる場合に比べて評価値の向上が早くなり進化
が早く進む（図１７参照）。進化適応層において全ての
制御モジュールの進化が収束し、学習層で上記した学習
処理が終了した後は、学習層は、各制御モジュールの実
行用ニューラル回路網を用いて空燃比補正量を出力し、
同時に進化適応層の出力はゼロになり、学習層と反射層
とによる制御が行われる。また、学習層の実行用のニュ
ーラル回路網の初期値は、出力が常にゼロになるように
設定しておく。こうすることで、初期状態においては、
反射層と進化適応層のみで制御をおこなうようにでき
る。学習済みの実行用ニューラル回路網の結合係数は、
フロッピーディスクやＩＣカード等の外部記憶手段に保
存・読み出し可能とする。

【００２０】上記したように進化適応層での進化が終了
し、それを学習層で学習した後は、進化適応層は図２で
説明したように、一定時間間隔で作動して、学習層の制
御則のずれをチェックし、制御則にずれがある場合に
は、再び、燃料制御モジュールと加速制御モジュールの
進化を行う。使用者が外部記憶手段に保存した結合係数
を読み出して、当該結合係数に基づいて学習層を作動さ
せている場合には、進化適応層における制御則のずれの
チェックを行わずに、進化適応層の出力をゼロに固定し
たまま、その処理を停止し、使用者の処理開始指示に基
づいて進化適応層の処理を再開するように進化適応層を
構成してもよい。

【００２１】上記したように、進化適応層において、下
位モジュール群を構成する燃費モジュールとパワーモジ
ュールとが各々燃費及びエンジン出力を優先して進化
し、また、上位モジュールを構成するコントロールモジ
ュールが使用者の好みに合わせた下位モジュールの出力
比が得られるように進化することにより、使用者の好み
に合わせた最適な目標空燃比パターンを得ることがで
き、エンジン１は、使用者の好みに合わせて燃費性能重
視型、ドライバビリティ性能重視型、或いはバランス重
視型に調教されていく。図１８は、使用者の特性に合わ
せた走行パターンに対する目標空燃比パターンの一例を
示している。また、進化適応層を一定時間間隔で機能さ
せることにより、調教が、使用者の好みの変化やエンジ
ンや車両の経時変化に追従するようになる。

【００２２】上記した実施例のように、進化適応層にお
いて、補正量に制限を加えつつ適応を図り、そこで得ら
れた成果を学習していく手法を用いる利点としては、以
下の２点が挙げられる。・進化適応層内の制御モジュールの多様性が確保され、
遺伝的アルゴリズムの特徴である大域的探索が可能とな
る。・進化適応層での試行錯誤的な情報処理から、学習層の
高速でより知的な情報処理を獲得することが可能にな
る。これは上記したエンジン制御においては顕著ではな
いが、移動ロボットの経路制御などについては大きな利
点となる。

【００２３】（その他）尚、上記した第２及び第３の実
施例では、下位モジュールの分割は、燃費とエンジン出
力の各機能についておこなっていたが、下位モジュール
の分割は本実施例に限定されることなく、排気ガス性能
等の他の機能を用いてもよく、また、燃料噴射量、点火
時期などの制御出力について、この分割を行ってもよ
い。この場合、例えば、新しく吸気管長の制御を可能に
した場合など、既存の制御モジュールに変更を加える必
要がなく、吸気管長制御モジュールを追加することで総
合的な制御が実現できるという効果を奏する。また、エ
ンジンの制御を行う場合の操作量は、制御対象に応じて
上記の他、例えば、電子スロットル開度、吸排気バルブ
タイミング、バルブリフト量、吸排気制御用バルブタイ
ミング等が考えられ得る（図３参照）。ここで、吸気制
御用バルブとは、タンブル及びスワールの制御を行うた
めに吸気管に設けられるバルブであり、また、排気制御
バルブとは、排気脈動を制御するために排気管に設けら
れるバルブである。

【００２４】また、本実施例では、進化が収束するまで
同じ制御モジュールに対して進化処理を施しているが、
これは本実施例に限定されることなく、例えば、一つの
制御モジュールに対して所定世代数の進化がした時点で
次の制御モジュールの進化処理に移行し、これを各制御
モジュールの進化が収束するまで繰り返し行うようにし
てもよい。

【００２５】また、本実施例では、下位モジュールを燃
費モジュールと加速モジュールの二つに分割し、上位モ
ジュールをコントロールモジュールだけで構成し、各モ
ジュールに対して遺伝的アルゴリズムに対する進化処理
を行っているが、進化適応層における制御モジュールの
数は、本実施例に限定されることなく、一種類でもよ
く、又三種類以上の制御モジュールを用いてもよい。

【００２６】さらにまた、本実施例では、進化適応層の
制御モジュールを下位モジュールと上位モジュールとに
分けて、上位モジュールで使用者の好みに合わせて下位
モジュールの出力比を決定するように構成し、下位モジ
ュールに加えて上位モジュールも進化していくように構
成しているが、これは本実施例に限定されることなく、
例えば、進化適応層を本実施例の下位モジュールだけで
構成し、下位モジュール同士で協調しながら進化してい
くように構成してもよい。この場合は、下位モジュール
の進化中の評価に使用者の好みに関する情報も加味さ
れ、それら出力比は、本実施例の場合なら、例えば、加
速度重視割合αで決定され得る。

【００２７】さらにまた、本実施例では、運転者の好み
や走行状況を推定するための走行状態指数Ｐを、ギヤポ
ジションと最高回転数の分布パターンに基づいてニュー
ラル回路網を用いて推定しているが、走行状態指数Ｐを
推定する手段は、本実施例に限定されることなく任意の
方法でよく、例えば、ファジー推論を用いて推定しても
よい。ファジー推論を用いて走行状態指数Ｐを決定する
場合、例えば、「１速の最高回転数が大で、２速の最高
回転数が大ならば、走行状態指数Ｐは非常に大であ
る。」といったＩＦ−ＴＨＥＮルールを記述し、ファジ
ー推論を行う（図１９参照）。ニューラル回路網の場
合、結合係数は教師信号から学習により決定されるので
ブラックボックス的になるのに対して、このファジー推
論を用いる方法では、設計の時の知識ベース的なアプロ
ーチが可能となる。また、本実施例では、ギヤポジショ
ンと最高回転数の分布パターンから使用者の好みを評価
しているが、使用者の好みを評価するパラメータは本実
施例に限定されることなく、任意のパラメータでよく、
使用者の生理的指標、例えば、脈拍、血圧、体温、脳波
等を検出する手段を、使用者の装備品、例えば、二輪車
の場合には、ヘルメット、グローブ、又はブーツ等に設
けて、生理的指標を検出し、これに基づいて評価しても
よい。さらに、これらの生理的指標は使用者の状態（運
転者の運転状態）の評価に使用することも可能である。

【００２８】また、本実施例では、使用者の好みを評価
し、この評価に合わせて調教を行っているが、調教の方
針を決めるパラメータは本実施例に限定されることな
く、例えば、使用者の技量を評価して、使用者の技量に
合わせて調教を行ってもよい。この場合の使用者の技量
を評価するパラメータとしては、例えば、車両の場合に
は、車両の傾き角、車両の上下方向の加速度、ブレーキ
の操作量、前後ブレーキの使用比率等が考えられる。

【００２９】また、本実施例において、和集合領域(w)
内で比較をする場合の、不足の評価値データは他の個体
の評価値の平均から求めたとしたシミュレーションの値
を入力していたが、この実施例に限定されることなく、
以下に説明する２種類のシミュレーションによって不足
の評価値データを得ることが可能となる。即ち、評価値
得られなかった領域の評価値を、評価領域における評価
値の分布を利用して算出することができる。これは、不
足評価値データを含む実際の評価値データがあり、実際
に得られた評価値の分布に関する傾向を把握し、この分
布から、不足した評価値データをシミュレーションする
ことが可能となる（図２１参照）。上述のシミュレーシ
ョンは基本的に線形的な特徴がある場合に限られるが、
得られた評価値のデータが非線形であると考えられる場
合には、この分布によるシミュレーションを使用せず
に、これら実データをニューラルネットワークに入力
し、不足評価値を算出させることも可能である。なお、
上述のシミュレーションによる評価値の精度に基づい
て、その精度に応じて使用する。もしくは個体の評価の
実施判定に利用するように構成することが可能である。

【００３０】一方、各個体間の比較を行なうために、そ
の比較を適切にするために、シミュレーションを使用し
て、ある評価領域の不足評価値を補って、適切な個体間
の比較を行うようにしてきたが、それに限定されること
なく、例えば、個体ａ（１）、個体ａ（２）および個体
ａ（３）の３つの個体を比較する例として説明すると、
各々は時分割されてオンラインにより評価値データを入
力する。任意時間データ（Ｔ時間）入力をした結果、ａ
（１）の入力された評価領域の分布が決定する。当然な
がら、この分布は別の個体ａ（２）およびａ（３）とは
微妙に異なる。そこで、個体ａ（１）で入力された分割
された評価領域と同じ領域に、別の個体ａ（２）および
ａ（３）に個体ａ（１）入力された各評価領域と同一数
もしくは同一比率の個数のデータ数が入力されるまで、
前記Ｔ時間に引き続きＴ’時間だけデータ収集を継続す
る。その結果、各個体の局所的な評価領域にはａ（１）
を全部網羅する状態で共通集合が形成され、その比較方
法としては、各個体に入力されたデータ数が同数である
場合には、その各個体ごとに共通集合のデータ数を合計
したものを比較することで、個体同士の比較を行なうこ
とができ、一方、比率の異なる場合には、各個体ごとに
共通集合のデータ数を合計するとともに、前記比率で総
合値を割った平均値同士で各個体間を比較する。これら
の何れかで各個体間の比較を行なうことが可能となる。
これは、各領域毎に平均を取って合計する場合よりも、
算出回数が減少し、より早い制御を行い得るという特徴
を備えている。また、ウエイトマップとして得られたデ
ータ数の多い領域のウエイトを大きくすることも考えら
れる。これにより、ユーザが、多く使用した領域が重視
されることとなり、ユーザの好みが反映される。

【００３１】

【発明の効果】以上説明した本発明に係る総合制御方式
によれば、請求項１で記載した遺伝的アルゴリズムにお
ける複数個体の評価をオンラインで行う際、細分化され
た評価領域毎に局所的な予備評価値を算出し、これらを
総合的に評価して、総合的評価値を算出することを特徴
としているので、オンラインで行なう条件下で、収集さ
れた評価値が、評価比較すべき複数の個体に各々同一条
件で得られることはむしろ希で、収集された評価値に
は、各個体間で相違するとともに、さらに常に同じ評価
領域に対応した評価値が得られるとも限らない。そこ
で、得られた評価値を、評価領域毎に収集し、評価領域
毎に各個体同士の個体評価を行なえるようにしているの
で、個体評価をする際に異なる条件同士の評価値を比較
するような誤差の大きい比較を行わないように、あるい
は行なう確率を低下させるようにすることができる。

【００３２】また、請求項２に記載した発明は、上記請
求項１の特徴に加えて更に遺伝的アルゴリズムを適用す
る対象の（動作）状態に応じて、評価方法をかえること
を特徴としているので、例えば、遺伝的アルゴリズムを
適用する対象を複数用意することができ、各評価値が得
られた際の（動作）状態に応じて、得られた評価値の蓄
積すべき対象を振り分けることができ、その結果とし
て、限られた評価値をより評価すべき対象へ分けて評価
できるので、同じ数の評価値でも、より正確な個体間の
評価が行われ得るようになった。

【００３３】また、請求項３に記載した発明は、上記請
求項１の特徴に加えて更に局所的な評価値を総合して総
合評価値を算出する際、使用者の特性に依存した領域を
積極的に進化させることを特徴としているので、評価領
域毎に評価値を振り分けた各評価値は、さらに評価領域
毎に個体比較をするために重要か否かを設定すること
で、単に得られた領域同士を単純比較するのではなく、
利用者にとって大切な領域をより重要であるように重み
づけをして、利用者にとって不必要なもしくは、あまり
重要でない領域を軽くするように重みづけをすることが
可能となり、オンラインで得られる限られた評価値で、
満遍なく評価値が得られるインラインで行った状態によ
り近い評価結果が得られるようになる。

【００３４】また、請求項４に記載した発明は、上記請
求項３の特徴に加えて更に、使用者の特性に依存した領
域の積極的な進化は、細分化された評価領域の中でその
領域を積極的に進化させることを特徴としている。即
ち、使用者の使用状態の好みや癖に応じて、利用の重な
るマップの入力数値に対しては、重みづけ数値をより高
く進化させ、また、利用の少ないマップの入力数値に対
しては、重みづけ数値を減少させるように進化させるこ
とができるので、より実際の利用に即した進化が行われ
得る。

【００３４】また、請求項５に記載した発明では、上記
請求項１の特徴に加えて更に細分化された評価領域毎の
局所的な評価値を算出するためのデータを収集する際、
領域間のデータ数の比率がすべての個体で同一となるよ
うにデータ収集を行うことを特徴としている、即ち、デ
ータ収集時に各個体間の評価領域毎のデータ数を同一も
しくは同比率数になるようにしているので、データの入
力完了後から、各個体間の優劣の決定を得るまで、各評
価領域毎の平均処理をすることがないために、演算が簡
単で、より早い各個体間の比較結果を得ることができる
ようになる。

【００３５】また、請求項６に記載した発明では、上記
請求項１の特徴に加えて更に細分化された評価領域の中
で、評価値を得られなかった領域の評価値をシミュレー
ション的に算出することを特徴としているので、各個体
間の比較をする場合、比較すべき評価領域にデータ不足
が生じても、その不足分をシミュレーションで補うこと
で比較する条件が揃うので、オンラインで特に問題にな
るデータ不足があっても、より正確な個体間の比較が行
われうるようになる。

【００３６】また、請求項７に記載した発明では、上記
請求項１〜６の特徴に加えて更に制御対象がエンジンで
あることを特徴としているので、エンジンの有する非線
形的な動作を決定する各個体の進化に有利に働くことが
できる。

【００３７】また、請求項８に記載した発明では、上記
請求項７の特徴に加えて更に評価領域を細分化するパラ
メータとして、運転者及び／又は運転状況を用いること
を特徴としているので、更に非線形の特徴を有する運転
者及び／又は運転状況に基づいて評価領域を決定して各
個体の進化を進めることは、制御対象として、より適切
な制御を進めることができる。

【００３８】また、請求項９に記載した発明では、上記
請求項７の特徴に加えて更にエンジン統制の評価方法
を、過度時における動特性と、定常時における静特性と
で異なるものとしているので、オンライン時における限
られた評価値を、よりそのデータ発生の条件に合わせ
て、評価方法を選択することで、僅かなデータ数で過渡
時と静特性の双方の各個体の評価ができるのみならず、
各個体の評価値を入力する際に過渡時と定常時を区別せ
ずに入力した場合では、互いの異なる条件のデータがノ
イズとなって、本来得られるべき評価値が埋もれてしま
う可能性があるが、その問題も解消される。

【００３９】また、請求項１０以降に記載した発明で
は、上記請求項７〜８の特徴に加えて更にエンジンの動
特性をレスポンス性能にて評価することを特徴とし、ま
た、レスポンス性能に関する個体の評価の際、スロット
ルの操作方法に依存した走行パターンにより評価領域を
細分化し、レスポンス性能に関する局所的な評価値を、
エンジン回転数変化率を平均スロットル開度変化率で割
って算出する。一方、エンジンの静特性を燃費性能また
は／及び出力にて評価することとし、また、燃費性能に
関する局所的な評価値を、その評価領域において単位時
間中に噴射する燃料噴射量とするとともに、出力に関す
る局所的な評価値を、その評価領域におけるスロットル
開度としている。以上の条件において、より実使用に即
した形でエンジン制御を行なう個体が進化ができ、一般
的に合い反すると言われる燃費性能や出力と、レスポン
ス性能を利用者が満足する形で進化させることが可能と
なる。

【図面の簡単な説明】

【図１】本発明に係る総合制御方式の基本概念を示す
ブロック図である。

【図２】図１に示した総合制御方式を経時的に示すフ
ローチャートである。

【図３】エンジン１と前記総合制御方式を実行する制
御装置１０との関係を示す概略図である。

【図４】制御装置１０の概略ブロック図である。

【図５】図４の制御装置全体の基本動作のフローチャ
ートである。

【図６】（ａ），（ｂ）は共に、一定時間内の各ギヤ
ポジションにおける最高回転数の分布パターンを示すグ
ラフであり、（ａ）はスポーティな走行時のグラフで、
（ｂ）はマイルドな走行時のグラフである。

【図７】（ａ）〜（ｃ）は共に、一定時間内の各ギヤ
ポジションにおける最高回転数の分布パターンを示すグ
ラフであり、（ａ）は通常走行時のグラフで、（ｂ）は
渋滞路走行時のグラフで、（ｃ）は高速道路走行時のグ
ラフである。

【図８】走行状態指数を推定するためのニューラル回
路網の概略図である。

【図９】（ａ）〜（ｃ）は共に、走行状態指数と評価
関数の関係を示すグラフであり、（ａ）を基準として、
（ｂ）が最高回転数に達するまでの時間が短い状態を示
し、（ｃ）が最高回転数に達するまでの時間が長い状態
を各々示している。

【図１０】（ａ）は燃費モジュールを構成するニュー
ラル回路網の概略図、（ｂ）は加速モジュールを構成す
るニューラル回路網の概略図、（ｃ）はコントロールモ
ジュールを構成するニューラル回路網の概略図である。

【図１１】各制御モジュールの進化の傾向を示す図で
ある。

【図１２】遺伝的アルゴリズムによる燃費モジュール
の進化のフローチャートである。

【図１３】ニューラル回路網のコーディングを概念的
に示す図である。

【図１４】時分割方式による各個体の予備評価処理の
状態を示す図である。

【図１５】学習層の学習用制御モジュールに使用する
教師データの獲得の仕方を概念的に示す図である。

【図１６】新しい教師データのみを用いたＣＭＡＣに
よる学習層の学習を概念的に示す図である。

【図１７】進化処理だけでの進化と、進化処理と学習
処理とを交互に繰り返す進化との進化性能を比較したグ
ラフを示す図である。

【図１８】使用者の特性に合わせて得られた目標空燃
比パターンを走行パターンと比較して示す図である。

【図１９】ファジー推論により走行状態指数を推定す
る状態を概念的に示した図である。

【図２０】エンジンの動特性をレスポンス性能にて評
価するパワーモジュールを示す評価領域を示す説明図で
ある。

【図２１】エンジンの燃費を示す燃費モジュールの評
価領域を示す説明図である。

【符号の説明】

１…エンジン、１０…制御装置、ａ(1)、ａ(2)およびａ
(3)…個体、ｋ…共通集合領域、ｗ…和集合領域。

フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ０５Ｂ 13/02 Ｇ０５Ｂ 13/02 ＮＺ

Claims

【特許請求の範囲】

【請求項１】遺伝的アルゴリズムにおける複数個体の評
価をオンラインで行う際、細分化された評価領域毎に局
所的な予備評価値を算出し、これらを総合的に評価し
て、総合的評価値を算出することを特徴とするオンライ
ン評価手法。
【請求項２】遺伝的アルゴリズムを適用する対象の（動
作）状態に応じて、評価方法をかえることを特徴とする
請求項１に記載のオンライン評価手法。
【請求項３】局所的な評価値を総合して総合評価値を算
出する際、使用者の特性に依存した領域を積極的に進化
させることを特徴とする請求項１に記載のオンライン評
価手法。
【請求項４】使用者の特性に依存した領域の積極的な進
化は、細分化された評価領域の中でその領域を積極的に
進化させることを特徴とする請求項１に記載のオンライ
ン評価手法。
【請求項５】細分化された評価領域毎の局所的な評価値
を算出するためのデータを収集する際、領域間のデータ
数の比率がすべての個体で同一となるようにデータ収集
を行うことを特徴とする請求項１に記載のオンライン評
価手法。
【請求項６】細分化された評価領域の中で、評価値を得
られなかった領域の評価値をシミュレーション的に算出
することを特徴とする請求項１に記載のオンライン評価
手法。
【請求項７】制御対象がエンジンであることを特徴とす
る請求項１から６に記載のオンライン評価手法。
【請求項８】評価領域を細分化するパラメータとして、
運転者及び／又は運転状況を用いることを特徴とする請
求項７に記載のオンライン評価手法。
【請求項９】エンジン特性の評価方法を、過度時におけ
る動特性と、定常時における静特性とで異なるものとす
ることを特徴とする請求項７に記載のオンライン評価手
法。
【請求項１０】エンジンの動特性をレスポンス性能にて
評価することを特徴とする請求項７〜９の何れか１項に
記載のオンライン評価手法。
【請求項１１】レスポンス性能に関する個体の評価の
際、スロットルの操作方法に依存した走行パターンによ
り評価領域を細分化することを特徴とする請求項１０に
記載のオンライン評価方法。
【請求項１２】レスポンス性能に関する局所的な評価値
を、エンジン回転数変化率を平均スロットル開度変化率
で割って算出することを特徴とする請求項１０に記載の
オンライン評価方法。
【請求項１３】エンジンの静特性を燃費性能または／及
び出力にて評価することを特徴とする請求項７〜９の何
れか一項に記載のオンライン評価手法。
【請求項１４】燃費性能に関する局所的な評価値を、そ
の評価領域において単位時間中に噴射する燃料噴射量と
することを特徴とする請求項１３に記載のオンライン評
価手法。
【請求項１５】出力に関する局所的な評価値を、その評
価領域におけるスロットル開度とすることを特徴とする
請求項１３に記載のオンライン評価手法。