[go: up one dir, main page]

JP2021116783A - 車両用制御装置および車両用制御システム - Google Patents

車両用制御装置および車両用制御システム Download PDF

Info

Publication number
JP2021116783A
JP2021116783A JP2020012548A JP2020012548A JP2021116783A JP 2021116783 A JP2021116783 A JP 2021116783A JP 2020012548 A JP2020012548 A JP 2020012548A JP 2020012548 A JP2020012548 A JP 2020012548A JP 2021116783 A JP2021116783 A JP 2021116783A
Authority
JP
Japan
Prior art keywords
vehicle
learning data
data
learned
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020012548A
Other languages
English (en)
Inventor
洋介 橋本
Yosuke Hashimoto
洋介 橋本
章弘 片山
Akihiro Katayama
章弘 片山
裕太 大城
Yuta Oshiro
裕太 大城
和紀 杉江
Kazuki Sugie
和紀 杉江
尚哉 岡
Naoya Oka
尚哉 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2020012548A priority Critical patent/JP2021116783A/ja
Priority to US17/146,626 priority patent/US20210229687A1/en
Priority to CN202110105692.6A priority patent/CN113187612A/zh
Publication of JP2021116783A publication Critical patent/JP2021116783A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/04Monitoring the functioning of the control system
    • B60W50/045Monitoring control system parameters
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D29/00Controlling engines, such controlling being peculiar to the devices driven thereby, the devices being other than parts or accessories essential to engine operation, e.g. controlling of engines by signals external thereto
    • F02D29/02Controlling engines, such controlling being peculiar to the devices driven thereby, the devices being other than parts or accessories essential to engine operation, e.g. controlling of engines by signals external thereto peculiar to engines driving vehicles; peculiar to engines driving variable pitch propellers
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02PIGNITION, OTHER THAN COMPRESSION IGNITION, FOR INTERNAL-COMBUSTION ENGINES; TESTING OF IGNITION TIMING IN COMPRESSION-IGNITION ENGINES
    • F02P5/00Advancing or retarding ignition; Control therefor
    • F02P5/04Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions
    • F02P5/145Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions using electrical means
    • F02P5/15Digital data processing
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02PIGNITION, OTHER THAN COMPRESSION IGNITION, FOR INTERNAL-COMBUSTION ENGINES; TESTING OF IGNITION TIMING IN COMPRESSION-IGNITION ENGINES
    • F02P5/00Advancing or retarding ignition; Control therefor
    • F02P5/04Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions
    • F02P5/145Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions using electrical means
    • F02P5/15Digital data processing
    • F02P5/152Digital data processing dependent on pinking
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • B60W2050/0083Setting, resetting, calibration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/04Monitoring the functioning of the control system
    • B60W50/045Monitoring control system parameters
    • B60W2050/046Monitoring control system parameters involving external transmission of data to or from the vehicle, e.g. via telemetry, satellite, Global Positioning System [GPS]
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/10Historical data
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/45External transmission of data to or from the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

【課題】記憶されていた前回学習パラメータの情報が消失した場合、学習パラメータとして初期値が設定されると、初期値から更新を繰り返して適切な点火時期の学習パラメータになるまでに時間を要する。【解決手段】車両のCPUは、記憶装置が記憶している関係規定データDRが消失していると判定する場合(S52:YES)、通信機を操作することによって、関係規定データDRとして適切な学習済関係規定データDRtを要求する要求信号を送信する(S54)。これに対し、データ解析センターのCPUは、学習済関係規定データDRtの要求があると判定する場合(S64:YES)、要求を出した車両に学習済関係規定データDRtを送信する(S66)。これに対し、車両のCPUは、送信された学習済関係規定データDRtを受信する(S56)。そして、車両のCPUは、関係規定データDRを、学習済関係規定データDRtに切り替える(S58)。【選択図】図5

Description

本発明は、車両用制御装置および車両用制御システムに関する。
特許文献1に記載されている内燃機関の点火時期制御装置は、ノッキングを発生しない範囲でより進角側で点火できるように、点火時期を算出している。点火時期は、ベースとなる基本点火時期に対して、ノッキングセンサの出力値に基づくフィードバック項により補正を加えるとともに、フィードバック項に基づき更新される学習パラメータにより補正を加えている。学習パラメータが、前回学習パラメータから更新されることで、内燃機関の点火時期は、更新された学習パラメータに補正されて算出されている。そして、学習パラメータの更新が繰り返されることで、算出される点火時期は適切な点火時期に近づいていく。
特開2010−270686号公報
特許文献1に記載されている内燃機関の点火時期制御装置において、バッテリクリア等の異常が発生すると、記憶されていた前回学習パラメータの情報が消失することがある。この場合、学習パラメータとして初期値が設定される。しかし、学習パラメータとして初期値を設定した場合には、初期値から更新を繰り返して適切な点火時期の学習パラメータになるまでに時間を要する。この点、点火時期の学習パラメータに限らず、車両に搭載された電子機器の制御に関する学習パラメータについても同様の課題がある。
1.上記課題を解決するため、本発明は、内部記憶装置および内部実行装置を備えている車載制御装置であって、前記内部記憶装置は、車両に搭載された電子機器の制御に用いられる学習データを記憶し、前記内部実行装置は、前記車両の状態を検出するセンサの検出値を取得する取得処理と、前記学習データを前記車両の走行に伴う学習によって更新して、前記内部記憶装置に記憶させる更新処理と、前記取得処理によって取得された前記検出値および前記学習データによって定まる前記車両内の電子機器の操作に関する変数の値に基づき前記電子機器を操作する操作処理と、前記車両の異常発生により前記内部記憶装置が記憶している前記学習データがリセットされたことを検知する検知処理と、前記検知処理によって前記学習データがリセットされたことが検知された場合、前記学習データの初期状態から学習がなされた学習済学習データを要求するための要求信号を車両外に送信する送信処理と、前記要求信号に応じた前記学習済学習データを車外から受信する受信処理と、前記受信処理で受信した前記学習済学習データを、リセットされた前記学習データに替えて前記内部記憶装置に記憶させる切替処理と、を実行する車両用制御装置である。
上記構成によれば、車両の異常発生により学習データがリセットされたことが検知されると、リセットされた学習データが学習済学習データに切り替えられる。そのため、初期状態の学習データよりも適切な状態に近い学習済学習データから学習を再開することで、更新処理によってより適切な状態とするまでの時間を短縮できる。
2.上記課題を解決するため、本発明は、車両に搭載されている車載制御装置と、前記車両の外部に設けられている車外制御装置と、を備えている車両用制御システムであって、前記車載制御装置は、内部記憶装置および内部実行装置を有しており、前記車外制御装置は、外部記憶装置および外部実行装置を有しており、前記内部記憶装置は、車両に搭載された電子機器の制御に用いられる学習データを記憶しており、前記外部記憶装置は、前記学習データの初期状態から学習がなされた学習済学習データを記憶しており、前記内部実行装置は、前記車両の状態を検出するセンサの検出値を取得する取得処理と、前記学習データを前記車両の走行に伴う学習によって更新して、前記内部記憶装置に記憶させる更新処理と、前記取得処理によって取得された前記検出値および前記学習データによって定まる前記車両内の電子機器の操作に関する変数の値に基づき前記電子機器を操作する操作処理と、前記車両の異常発生により前記内部記憶装置が記憶している前記学習データがリセットされたことを検知する検知処理と、前記検知処理によって前記学習データがリセットされたことが検知された場合、前記学習済学習データを要求するための要求信号を前記車外制御装置に送信する第1送信処理と、を実行し、前記外部実行装置は、前記第1送信処理によって送信された前記要求信号を前記内部実行装置から受信する第1受信処理と、前記第1受信処理によって受信した前記要求信号に応じて、前記外部記憶装置に記憶している前記学習済学習データを示す信号を車載制御装置に送信する第2送信処理と、を実行し、前記内部実行装置は、前記第2送信処理によって送信された前記学習済学習データを示す信号を受信する第2受信処理と、前記第2受信処理で受信した前記学習済学習データを、リセットされた前記学習データに替えて前記内部記憶装置に記憶させる切替処理と、を実行する。
上記構成によれば、車両の異常発生により内部記憶装置が記憶している学習データがリセットされても、外部記憶装置には学習済学習データが記憶されている。そのため、車載制御装置は、学習済学習データを得ることができる。そして、初期状態の学習データよりも適切な状態に近い学習済学習データから学習を再開することで、更新処理によってより適切な状態とするまでの時間を短縮できる。
3.上記車両用制御システムにおいて、前記内部実行装置は、前記更新処理によって更新した前記学習データを示す信号を、所定期間ごとに、前記車外制御装置に送信する定期送信処理を実行し、前記外部実行装置は、前記定期送信処理によって送信された前記学習データを示す信号を受信する定期受信処理と、前記定期受信処理によって受信された前記学習データを、前記外部記憶装置に前記学習済学習データとして保存する保存処理と、を実行し、前記第2送信処理において送信する前記学習済学習データは、前記保存処理によって保存された最新のデータであってもよい。
上記構成によれば、車載制御装置が、所定期間ごとに更新された学習データを送信することで、外部記憶装置には、所定期間ごとに更新された学習データが保存される。そして、切替処理によって学習済学習データに切り替える際には、学習済学習データとして、保存された学習データのうち、最新の学習データを得ることができる。
4.上記車両用制御システムにおいて、前記内部実行装置は、当該内部実行装置が搭載されている車両の走行履歴を示す信号を、前記車外制御装置に送信する走行履歴送信処理を実行し、前記外部実行装置は、複数の車両によって送信された走行履歴を示す信号を受信する走行履歴受信処理と、前記走行履歴受信処理によって受信された前記走行履歴を、前記外部記憶装置に前記車両ごとに保存する走行履歴保存処理と、を実行し、前記第2送信処理で送信される前記学習済学習データは、前記走行履歴保存処理によって保存された複数の車両の前記走行履歴のうち、前記要求信号を送信した車両の前記走行履歴に最も近い走行履歴に関連付けられた学習済学習データであってもよい。
上記構成によれば、複数の車両の走行履歴と学習済学習データとが対応付けられている。そして、学習データがリセットされたときの走行履歴に近い走行履歴に関連付けられた学習済学習データであれば、自身が送信した学習済みデータに限らず、他車両が送信した学習済みデータであっても受信できる。したがって、学習データがリセットされたときの走行履歴に対応したより適切な学習済み学習データを得られる蓋然性が高まる。
5.上記車両用制御システムにおいて、前記外部記憶装置には、複数の走行履歴とその走行履歴に対応した前記学習済学習データとが関連付けられて予め設定されており、前記第1送信処理では、前記車両の前記学習データがリセットされたときの当該車両の走行履歴を示す信号を送信し、前記第1受信処理では、前記走行履歴を受信し、前記第2送信処理で送信される前記学習済学習データは、前記外部記憶装置に記憶されている複数の走行履歴のうち、前記要求信号を送信した車両の前記走行履歴に最も近い走行履歴に関連付けられた学習済学習データであってもよい。
上記構成によれば、予め設定されている学習済学習データの中から、学習データがリセットされたときの走行履歴に最も近い学習済みデータを受信できる。したがって、内部実行装置が、学習済学習データを送信するという処理を行わなくとも、学習データがリセットされたときの走行履歴に対応したより適切な学習済み学習データを得られる蓋然性が高まる。
6.上記車両用制御システムにおいて、前記学習データは、前記車両の状態と前記車両内の前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データであり、前記内部実行装置は、前記取得処理によって取得された前記検出値に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理を実行し、前記更新処理では、前記取得処理によって取得された前記検出値に基づく前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新し、前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものであってもよい。
上記構成によれば、学習データを関係規定データとしているため、比較的に多くの情報を扱うことができる。また、電子機器の操作に伴う報酬を算出することによって、当該操作によってどのような報酬が得られるかを把握することができる。そして、報酬に基づき、強化学習に従った更新写像によって関係規定データを更新することにより、車両の状態と行動変数との関係を車両の走行において適切な関係に設定することができる。
第1の実施形態にかかる制御装置およびその駆動系を示す図。 同実施形態にかかる車両用制御システムを示す図。 同実施形態にかかる制御装置が実行する処理の手順を示す流れ図。 同実施形態にかかる制御装置が実行する処理の一部の詳細な手順を示す流れ図。 (a)および(b)は、同実施形態にかかる車両用制御システムが実行する処理の手順を示す流れ図。 (a)および(b)は、第2の実施形態にかかる車両用制御システムが実行する処理の手順を示す流れ図。 第3の実施形態にかかる車両用制御システムを示す図。 (a)および(b)は、同実施形態にかかる車両用制御システムが実行する処理の手順を示す流れ図。
<第1の実施形態>
以下、車両用制御システムの第1の実施形態について、図面を参照しつつ説明する。
図1に、本実施形態にかかる車両VC1の駆動系および制御装置の構成を示す。
図1に示すように、内燃機関10の吸気通路12には、上流側から順にスロットルバルブ14および燃料噴射弁16が設けられており、吸気通路12に吸入された空気や燃料噴射弁16から噴射された燃料は、吸気バルブ18の開弁に伴って、シリンダ20およびピストン22によって区画される燃焼室24に流入する。燃焼室24内において、燃料と空気との混合気は、点火装置26の火花放電に伴って燃焼に供され、燃焼によって生じたエネルギは、ピストン22を介してクランク軸28の回転エネルギに変換される。燃焼に供された混合気は、排気バルブ30の開弁に伴って、排気として排気通路32に排出される。排気通路32には、排気を浄化する後処理装置としての触媒34が設けられている。
クランク軸28には、ロックアップクラッチ42を備えたトルクコンバータ40を介して、変速装置50の入力軸52が機械的に連結可能とされている。変速装置50は、入力軸52の回転速度と出力軸54の回転速度との比である変速比を可変とする装置である。出力軸54には、駆動輪60が機械的に連結されている。
制御装置70は、内燃機関10を制御対象とし、その制御量であるトルクや排気成分比率等を制御すべく、スロットルバルブ14、燃料噴射弁16および点火装置26等の内燃機関10の操作部を操作する。また、制御装置70は、トルクコンバータ40を制御対象とし、ロックアップクラッチ42の係合状態を制御すべくロックアップクラッチ42を操作する。また、制御装置70は、変速装置50を制御対象とし、その制御量としての変速比を制御すべく変速装置50を操作する。なお、図1には、スロットルバルブ14、燃料噴射弁16、点火装置26、ロックアップクラッチ42、および変速装置50のそれぞれの操作信号MS1〜MS5を記載している。
制御装置70は、制御量の制御のために、エアフローメータ80によって検出される吸入空気量Gaや、スロットルセンサ82によって検出されるスロットルバルブ14の開口度(スロットル開口度TA)、クランク角センサ84の出力信号Scrを参照する。また、制御装置70は、アクセルセンサ88によって検出されるアクセルペダル86の踏み込み量(アクセル操作量PA)や、加速度センサ90によって検出される車両VC1の前後方向の加速度Gxを参照する。また、制御装置70は、全地球測位システム(GPS92)による位置データPgpsを参照する。
図2に、本実施形態において、車両VC1を制御する車両用制御システムの構成を示す。
図2に示すように、車両VC1に搭載されている制御装置70は、CPU72、ROM74、電気的に書き換え可能な不揮発性メモリ(記憶装置76)、および周辺回路78を備え、それらがローカルネットワーク79を介して通信可能とされている。ここで、周辺回路78は、内部の動作を規定するクロック信号を生成する回路や、電源回路、リセット回路等を含む。
ROM74には、制御プログラム74aおよび学習用メインプログラム74bが記憶されている。一方、記憶装置76には、アクセル操作量PAと、スロットル開口度TAの指令値(スロットル開口度指令値TA*)および点火装置26の遅角量aopとの関係を規定する関係規定データDRと、が記憶されている。ここで、遅角量aopは、予め定められた基準点火時期に対する遅角量であり、基準点火時期は、MBT点火時期とノック限界点とのうちの遅角側の時期である。MBT点火時期は、最大トルクの得られる点火時期(最大トルク点火時期)である。またノック限界点は、ノック限界の高い高オクタン価燃料の使用時に、想定される最良の条件下で、ノッキングを許容できるレベル以内に収めることのできる点火時期の進角限界値である。また、記憶装置76には、トルク出力写像データDTが記憶されている。トルク出力写像データDTによって規定されるトルク出力写像は、クランク軸28の回転速度NE、充填効率η、および点火時期を入力とし、トルクTrqを出力する写像である。
また、制御装置70は、通信機77を備えている。通信機77は車両VC1の外部のネットワーク100を介してデータ解析センター110と通信するための機器である。
データ解析センター110は、車両VC1から送信されるデータを解析する。また、データ解析センター110には、他の車両VC2,…からもデータが送信される。なお、図2においては図示を簡略化しているが、車両VC2にも、車両VC1と同様の制御装置70が設けられている。
データ解析センター110は、CPU112、ROM114、および電気的に書き換え可能な不揮発性の記憶装置116、周辺回路118および通信機117を備えており、それらがローカルネットワーク119によって通信可能とされるものである。ROM114には、学習用サブプログラム114aが記憶されている。記憶装置116には、車両を識別するための識別情報IDと、後述する学習済関係規定データDRtとが、関連付けられて記憶されている。このように、本実施形態では、車両用制御システムは、車両VC1,VC2に搭載されている制御装置70と、車両VC1の外部に設けられているデータ解析センター110と、で構成されている。
図3に、本実施形態にかかる制御装置70が実行する処理の手順を示す。図3に示す処理は、ROM74に記憶された制御プログラム74aおよび学習用メインプログラム74bをCPU72がたとえば所定周期で繰り返し実行することにより実現される。なお、以下では、先頭に「S」が付与された数字によって各処理のステップ番号を示す。
図3に示す一連の処理において、CPU72は、まず、状態sとして、アクセル操作量PAの6個のサンプリング値「PA(1),PA(2),…PA(6)」からなる時系列データを取得する(S10)。ここで、時系列データを構成する各サンプリング値は、互いに異なるタイミングにおいてサンプリングされたものである。本実施形態では、一定のサンプリング周期でサンプリングされる場合の、互いに時系列的に隣り合う6個のサンプリング値によって時系列データを構成する。
次にCPU72は、関係規定データDRが定める方策πに従い、S10の処理によって取得した状態sに応じたスロットル開口度指令値TA*および遅角量aopからなる行動aを設定する(S12)。
本実施形態において、関係規定データDRは、行動価値関数Qおよび方策πを定めるデータである。本実施形態において、行動価値関数Qは、状態sおよび行動aの8次元の独立変数に応じた期待収益の値を示すテーブル型式の関数である。また、方策πは、状態sが与えられたときに、独立変数が与えられた状態sとなる行動価値関数Qのうち最大となる行動a(グリーディ行動)を優先的に選択しつつも、所定の確率εで、それ以外の行動aを選択する規則を定める。
詳しくは、本実施形態にかかる行動価値関数Qの独立変数がとりうる値の数は、状態sおよび行動aのとりうる値の全組み合わせのうちの一部が、人の知見等によって削減されたものである。すなわち、たとえばアクセル操作量PAの時系列データのうち隣接する2つのサンプリング値の1つがアクセル操作量PAの最小値となりもう1つが最大値となるようなことは、人によるアクセルペダル86の操作からは生じえないとして、行動価値関数Qが定義されていない。本実施形態では、人の知見等に基づく次元削減によって、行動価値関数Qを定義する状態sの取りうる値を、10の4乗個以下、より望ましくは10の3乗個以下に制限する。
次にCPU72は、設定されたスロットル開口度指令値TA*および遅角量aopに基づき、スロットルバルブ14に操作信号MS1を出力してスロットル開口度TAを操作するとともに、点火装置26に操作信号MS3を出力して点火時期を操作する(S14)。ここで、本実施形態では、スロットル開口度TAをスロットル開口度指令値TA*にフィードバック制御することを例示することから、スロットル開口度指令値TA*が同一の値であっても、操作信号MS1が互いに異なる信号となりうるものである。また、たとえば周知のノッキングコントロール(KCS)等がなされる場合、点火時期は、基準点火時期を遅角量aopにて遅角させた値がKCSにてフィードバック補正された値とされる。ここで、基準点火時期は、CPU72により、クランク軸28の回転速度NEおよび充填効率ηに応じて可変設定される。なお、回転速度NEは、クランク角センサ84の出力信号Scrに基づきCPU72によって算出される。また、充填効率ηは、回転速度NEおよび吸入空気量Gaに基づきCPU72によって算出される。
次にCPU72は、内燃機関10のトルクTrq、内燃機関10に対するトルク指令値Trq*、および加速度Gxを取得する(S16)。ここで、CPU112は、トルクTrqを、回転速度NE、充填効率ηおよび点火時期をトルク出力写像に入力することによって算出する。また、CPU72は、トルク指令値Trq*を、アクセル操作量PAに応じて設定する。
次にCPU72は、過渡フラグFが「1」であるか否かを判定する(S18)。過渡フラグFは、「1」である場合に過渡運転時であることを示し、「0」である場合に過渡運転時ではないことを示す。CPU72は、過渡フラグFが「0」であると判定する場合(S18:NO)、アクセル操作量PAの単位時間当たりの変化量ΔPAの絶対値が所定量ΔPAth以上であるか否かを判定する(S20)。ここで、変化量ΔPAは、たとえば、S20の処理の実行タイミングにおける最新のアクセル操作量PAと、同タイミングに対して単位時間だけ前におけるアクセル操作量PAとの差とすればよい。
CPU72は、所定量ΔPAth以上であると判定する場合(S20:YES)、過渡フラグFに「1」を代入する(S22)。
これに対し、CPU72は、過渡フラグFが「1」であると判定する場合(S18:YES)、S22の処理の実行タイミングから所定期間が経過したか否かを判定する(S24)。ここで、所定期間は、アクセル操作量PAの単位時間当たりの変化量ΔPAの絶対値が所定量ΔPAthよりも小さい規定量以下となる状態が所定時間継続するまでの期間とする。CPU72は、所定期間が経過したと判定する場合(S24:YES)、過渡フラグFに「0」を代入する(S26)。
CPU72は、S22,S26の処理が完了する場合、1つのエピソードが終了したとして、強化学習によって行動価値関数Qを更新する(S28)。
図4に、S28の処理の詳細を示す。
図4に示す一連の処理において、CPU72は、直近に終了されたエピソード中のトルク指令値Trq*、トルクTrqおよび加速度Gxの3つのサンプリング値の組からなる時系列データと、状態sおよび行動aの時系列データと、を取得する(S30)。ここで、直近のエピソードは、S22の処理に続いてS30の処理がなされる場合には、過渡フラグFが継続して「0」となっていた期間であり、S26の処理に続いてS30の処理がなされる場合には、過渡フラグFが継続して「1」となっていた期間である。
図4には、カッコの中の数字が異なるものが、異なるサンプリングタイミングにおける変数の値であることを示す。たとえば、トルク指令値Trq*(1)とトルク指令値Trq*(2)とは、サンプリングタイミングが互いに異なるものである。また、直近のエピソードに属する行動aの時系列データを、行動集合Ajとし、同エピソードに属する状態sの時系列データを、状態集合Sjと定義する。
次にCPU72は、直近のエピソードに属する任意のトルクTrqとトルク指令値Trq*との差の絶対値が規定量ΔTrq以下である旨の条件(ア)と、加速度Gxが下限値GxL以上であって上限値GxH以下である旨の条件(イ)との論理積が真であるか否かを判定する(S32)。
ここで、CPU72は、規定量ΔTrqを、エピソードの開始時におけるアクセル操作量PAの単位時間当たりの変化量ΔPAによって可変設定する。すなわち、CPU72は、変化量ΔPAの絶対値が大きい場合には過渡時に関するエピソードであるとして、定常時である場合と比較して、規定量ΔTrqを大きい値に設定する。
また、CPU72は、下限値GxLを、エピソードの開始時におけるアクセル操作量PAの変化量ΔPAによって可変設定する。すなわち、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが正である場合には、定常時に関するエピソードの場合と比較して、下限値GxLを大きい値に設定する。また、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが負である場合には、定常時に関するエピソードの場合と比較して、下限値GxLを小さい値に設定する。
また、CPU72は、上限値GxHを、エピソードの開始時におけるアクセル操作量PAの単位時間当たりの変化量ΔPAによって可変設定する。すなわち、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが正である場合には、定常時に関するエピソードの場合と比較して、上限値GxHを大きい値に設定する。また、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが負である場合には、定常時に関するエピソードの場合と比較して、上限値GxHを小さい値に設定する。
CPU72は、論理積が真であると判定する場合(S32:YES)、報酬rに「10」を代入する一方(S34)、偽であると判定する場合(S32:NO)、報酬rに「−10」を代入する(S36)。CPU72は、S34,S36の処理が完了する場合、図2に示した記憶装置76に記憶されている関係規定データDRを更新する。本実施形態では、εソフト方策オン型モンテカルロ法を用いる。
すなわち、CPU72は、上記S30の処理によって読み出した各状態と対応する行動との組によって定まる収益R(Sj,Aj)に、それぞれ、報酬rを加算する(S38)。ここで、「R(Sj,Aj)」は、状態集合Sjの要素の1つを状態とし行動集合Ajの要素の1つを行動とする収益Rを総括した記載である。次に、上記S30の処理によって読み出した各状態と対応する行動との組によって定まる収益R(Sj,Aj)のそれぞれについて、平均化して対応する行動価値関数Q(Sj,Aj)に代入する(S40)。ここで、平均化は、S38の処理がなされた回数に所定数を加えた数によって、S38の処理によって算出された収益Rを除算する処理とすればよい。なお、収益Rの初期値は、対応する行動価値関数Qの初期値とすればよい。
次にCPU72は、上記S30の処理によって読み出した状態について、それぞれ、対応する行動価値関数Q(Sj,A)のうち、最大値となるときのスロットル開口度指令値TA*および遅角量aopの組である行動を、行動Aj*に代入する(S42)。ここで、「A」は、とりうる任意の行動を示す。なお、行動Aj*は、上記S30の処理によって読み出した状態の種類に応じて各別の値となるものであるが、ここでは、表記を簡素化して、同一の記号にて記載している。
次に、CPU72は、上記S30の処理によって読み出した状態のそれぞれについて、対応する方策π(Aj|Sj)を更新する(S44)。すなわち、行動の総数を、「|A|」とすると、S42によって選択された行動Aj*の選択確率を、「1−ε+ε/|A|」とする。また、行動Aj*以外の「|A|−1」個の行動の選択確率を、それぞれ「ε/|A|」とする。S44の処理は、S40の処理によって更新された行動価値関数Qに基づく処理であることから、これにより、状態sと行動aとの関係を規定する関係規定データDRが、収益Rを増加させるように更新されることとなる。
なお、CPU72は、S44の処理が完了する場合、図4に示す一連の処理を一旦終了する。
図3に戻り、CPU72は、S28の処理が完了する場合や、S20,S24の処理において否定判定する場合には、図3に示す一連の処理を一旦終了する。なお、S10〜S26の処理は、CPU72が制御プログラム74aを実行することにより実現され、S28の処理は、CPU72が学習用メインプログラム74bを実行することにより実現される。
図5に、本実施形態にかかる関係規定データDRのリセットに対処する処理手順を示す。図5(a)に示す処理は、図2に示すROM74に記憶された学習用メインプログラム74bをCPU72がたとえば所定周期で繰り返し実行することにより実現される。また、図5(b)に示す処理は、ROM114に記憶されている学習用サブプログラム114aをCPU112が実行することにより実現される。以下では、時系列に沿って、図5に示す処理を説明する。
図5(a)に示す一連の処理において、CPU72は、まず、通信機77を操作して、車両VC1の識別情報IDと、関係規定データDRとを送信する(S50)。
これに対し、図5(b)に示すように、CPU112は、車両VC1の識別情報IDおよび関係規定データDRを受信する(S60)。そして、CPU112は、記憶装置116に記憶された識別情報IDに関連付けられた学習済関係規定データDRtを、S60の処理によって受信した関係規定データDRの値に更新する(S62)。
一方、図5(a)に示すように、CPU72は、バッテリクリアしたことによって、記憶装置76が記憶している関係規定データDRが消失しているか否かを判定する(S52)。バッテリクリアとは、例えば、制御装置70に対する電源電圧であるバッテリが制御装置70から外されたりして、関係規定データDRを記憶している記憶装置76に対するバックアップ電圧が消失して、記憶されていた関係規定データDRの情報が消失することをいう。本実施形態では、S12の処理を実行できる場合には、関係規定データDRは消失していないと判定し、一方で、バッテリクリアに起因してS12の処理を実行できない場合には、関係規定データDRが消失していると判定する。
CPU72は、関係規定データDRが消失していると判定する場合(S52:YES)、通信機77を操作することによって、S12の処理に用いる関係規定データDRとして適切な学習済関係規定データDRtを要求する要求信号を送信する(S54)。
これに対し、図5(b)に示すように、CPU112は、学習済関係規定データDRtの要求があるか否かを判定する(S64)。そしてCPU112は、学習済関係規定データDRtの要求があると判定する場合(S64:YES)、通信機117を操作して、要求を出した車両VC1に学習済関係規定データDRtを送信する(S66)。なお、CPU112は、S66の処理が完了する場合や、S64の処理において否定判定する場合には、図5(b)に示す一連の処理を一旦終了する。
これに対し図5(a)に示すように、CPU72は、送信された学習済関係規定データDRtを受信する(S56)。そして、CPU72は、S12の処理に利用する関係規定データDRを、学習済関係規定データDRtに切り替える(S58)。
なお、CPU72は、S58の処理が完了する場合や、S52の処理において否定判定する場合には、図5(a)に示す一連の処理を一旦終了する。
次に、上記実施形態の作用および効果について説明する。
(1)CPU72は、ユーザによるアクセルペダル86の操作に伴って、アクセル操作量PAの時系列データを取得し、方策πに従って、スロットル開口度指令値TA*および遅角量aopからなる行動aを設定する。ここでCPU72は、基本的には、関係規定データDRに規定されている行動価値関数Qに基づき期待収益を最大とする行動aを選択する。ただし、CPU72は、所定の確率εで、期待収益を最大化する行動a以外の行動を選択することによって、期待収益を最大化する行動aの探索を行う。これにより、ユーザによる車両VC1の運転に伴って、関係規定データDRを強化学習によって最適なものに更新できる。
このようにして、車両VC1の出荷時に相応の安全率を考慮して設定された初期データとされていた関係規定データDRは、車両VC1の走行に伴って更新されていく。そのため、バッテリクリアなどの異常発生によって関係規定データDRがリセットされた場合に、関係規定データDRを初期データに設定して再学習を行うとすると、関係規定データDRを最適な状態まで更新するうえで、相応の時間が必要となる。
そこで、上記第1の実施形態によれば、CPU72が、関係規定データDRがリセットされたことを検知すると、車両VC1の外部から学習済関係規定データDRtを受信し、関係規定データDRを学習済関係規定データDRtに切り替える。そのため、関係規定データDRがリセットされたときに、仮に学習していない初期データから学習を再開する場合に比べて、適切な関係規定データDRとする時間を短縮することができる。
(2)上記第1の実施形態によれば、車両VC1の走行に伴って更新される関係規定データDRが、車両VC1の外部のネットワーク100を介してデータ解析センター110に対して、所定周期ごとに繰り返し送信される。これに対して、データ解析センター110は、最新の関係規定データDRを学習済関係規定データDRtとして記憶する。そして、データ解析センター110は、車両VC1の制御装置70からデータ要求があった場合には、学習済関係規定データDRtとして記憶した最新の関係規定データDRを車両VC1の制御装置70に送信する。そのため、関係規定データDRがリセットされたときに切り替えられる学習済関係規定データDRtは、更新がなされていた最新の関係規定データDRとなっている。よって、関係規定データDRがリセットされたとしても、リセットされるまでの学習を反映させた最新の関係規定データDRに基づいて、行動aの探索を行うことができる。
(3)上記第1の実施形態によれば、関係規定データDRは強化学習によって更新される。そのため、車両VC1に備わっている多くの操作部の操作に関する情報を扱うことができる。また、操作部の操作によってどのような報酬rが得られるかを把握することができる。そして、強化学習に従って関係規定データDRを更新することにより、車両VC1の状態sと、スロットル開口度指令値TA*および遅角量aopとの関係を、車両VC1の走行において適切な関係に設定することができる。
<第2の実施形態>
以下、第2の実施形態について、第1の実施形態との相違点を中心に図面を参照しつつ説明する。
図6に、本実施形態にかかる関係規定データDRのリセットに対処する処理手順を示す。図6(a)に示す処理は、図2に示すROM74に記憶されている学習用メインプログラム74bをCPU72がたとえば所定周期で繰り返し実行することにより実現される。また、図6(b)に示す処理は、ROM114に記憶されている学習用サブプログラム114aをCPU112が実行することにより実現される。なお、図6において図5に示した処理に対応する処理については、便宜上同一のステップ番号を付している。以下では、時系列に沿って、図6に示す処理を説明する。
図6(a)に示す一連の処理において、CPU72は、まず通信機77を操作して、車両VC1の識別情報IDと、走行距離RLと、GPS92による位置データPgpsとを送信する(S70)。本実施形態において、走行距離RLは、車両が生産されてから現在に至るまでに車両が走行した距離の総量を示す総走行距離である。
これに対して、図6(b)に示すように、CPU112は、識別情報ID、走行距離RLおよび位置データPgpsを受信する(S80)。そして、CPU112は、記憶装置116に記憶された識別情報IDに関連付けられた走行距離RLおよび位置データPgpsを、S80の処理によって受信した値に更新する(S82)。
一方、図6(a)に示すように、CPU72は、S52の処理を実行し、肯定判定する場合、S54の処理によってS12の処理に用いる関係規定データDRとして適切な学習済関係規定データDRtを要求する信号を送信する(S54)。
これに対し、図6(b)に示すように、CPU112は、S64の処理を実行する。そして、CPU112は、学習済関係規定データDRtの要求があると判定する場合(S64:YES)、要求する信号を送信した車両VC1と走行履歴が近い車両を選択する(S84)。具体的には、CPU112は、S82によって受信した走行距離RLを中央値とした予め定められた一定量の範囲に収まっている車両を検索する。そして、CPU112は、走行距離RLが近い車両が複数あった場合、これらの車両の中から、位置データPgpsが最も近い車両を選択する。すなわち、本実施形態では、走行履歴が近い車両とは、走行距離RLが同程度の車両であって、位置データPgpsが近い車両である。
ここで、車両VC1との位置データPgpsが最も近い車両を選択するのは、車両VC1と距離が相応に近いところに位置する車両の場合の関係規定データDRは、環境の相違が相応に小さいことから、車両VC1にとって期待収益を大きくする上で適切なデータとなりやすいためである。また、走行距離RLが一定量の範囲に収まっている車両としたのは、車両VC1の部品劣化が近似した車両を特定するための設定である。
次に、CPU112は、通信機117を操作して、S84で選択した車両に対して関係規定データDRの送信を促し、これを選択関係規定データDRsとして受信する(S86)。次に、CPU112は、学習済関係規定データDRtに選択関係規定データDRsを代入する(S88)。次に、CPU112は、S66の処理を実行する。なお、CPU112は、S66の処理が完了する場合や、S64の処理において否定判定する場合には、図6(b)に示す一連の処理を一旦終了する。
これに対し、図6(a)に示すように、CPU72は、S56およびS58の処理を実行する。なお、CPU72は、S58の処理が完了する場合や、S52の処理において否定判定する場合には、図6(a)に示す一連の処理を一旦終了する。
次に、上記第2の実施形態の作用および効果について説明する。
(4)上記第2の実施形態によれば、複数の車両VC1および車両VC2の走行履歴と学習済関係規定データDRtとが対応付けられている。そして、車両VC1の関係規定データDRがリセットされたときに、車両VC1の走行距離RLに近い走行距離RLに関連付けられた学習済関係規定データDRtであれば、車両VC1が送信した関係規定データDRに限らず、他車両が送信した関係規定データDRに基づく学習済関係規定データDRtであっても受信できる。したがって、関係規定データDRがリセットされたときの走行履歴に対応したより適切な学習済関係規定データDRtを得られる蓋然性が高まる。
<第3の実施形態>
以下、第3の実施形態について、第2の実施形態との相違点を中心に図面を参照しつつ説明する。
図7に、本実施形態にかかる車両用制御システムの概要を示す。なお、図7において図2に示した部材に対応する部材については、便宜上、同一の符号を付している。
図7に示すように、データ解析センター110内の記憶装置116には、予め試験等によって、走行履歴と関連付けられた学習済関係規定データDRtが、複数記憶されている。本実施形態においては、走行距離RLごとに学習済関係規定データDRtが複数記憶されている。具体的には、本実施形態では、走行距離RLが5000km毎に、5000km、10000km、15000km、…の各走行距離RLごとに、学習済関係規定データDRtが設定されている。
図8に、本実施形態にかかる関係規定データDRのリセットに対処する処理手順を示す。図8(a)に示す処理は、図7に示すROM74に記憶されている学習用メインプログラム74bをCPU72がたとえば所定周期で繰り返し実行することにより実現される。また、図8(b)に示す処理は、ROM114に記憶されている学習用サブプログラム114aをCPU112が実行することにより実現される。なお、図8において図6に示した処理に対応する処理については、便宜上同一のステップ番号を付している。以下では、時系列に沿って、図8に示す処理を説明する。
図8(a)に示す一連の処理において、CPU72は、まず通信機77を操作して、車両VC1の識別情報IDと、走行距離RLとを送信する(S90)。
これに対して、図8(b)に示すように、CPU112は、識別情報IDおよび走行距離RLを受信する(S100)。そして、CPU112は、記憶装置116に記憶された識別情報IDに関連付けられた走行距離RLを、S100の処理によって受信した値に更新する(S102)。
一方、図8(a)に示すように、CPU72は、S52の処理を実行し、肯定判定する場合、S54の処理によってS12の処理に用いる関係規定データDRとして適切な学習済関係規定データDRtを要求する信号を送信する(S54)。
これに対し、図6(b)に示すように、CPU112は、S64の処理を実行する。そして、CPU112は、学習済関係規定データDRtの要求があると判定する場合(S64:YES)、記憶装置116に記憶されている走行距離の中から、要求する信号を送信した車両VC1の走行距離RLに最も近いデータを選択する(S104)。
次に、CPU112は、通信機117を操作して、S104で選択した走行距離に紐づけられている学習済関係規定データDRtを車両VC1に送信する(S106)。なお、CPU112は、S106の処理が完了する場合や、S104の処理において否定判定する場合には、図8(b)に示す一連の処理を一旦終了する。
これに対し、図8(a)に示すように、CPU72は、S56およびS58の処理を実行する。なお、CPU72は、S58の処理が完了する場合や、S52の処理において否定判定する場合には、図8(a)に示す一連の処理を一旦終了する。
次に、上記第3の実施形態の作用および効果について説明する。
(5)上記第3の実施形態によれば、車両VC1の関係規定データDRがリセットされたときに、車両VC1の走行距離RLに応じて、予め記憶されている学習済関係規定データDRtを受信できる。そのため、車両VC1の走行距離RLに最も近い学習済関係規定データDRtを関係規定データDRとして利用できる。
<対応関係>
上記実施形態における事項と、上記「課題を解決するための手段」の欄に記載した事項との対応関係は、次の通りである。以下では、「課題を解決するための手段」の欄に記載した解決手段の番号毎に、対応関係を示している。[1]車載制御装置は、制御装置70に対応し、内部記憶装置は、記憶装置76に対応し、内部実行装置は、CPU72およびROM74に対応する。取得処理は、S10、S16の処理に対応し、更新処理は、S38〜S44の処理に対応し、操作処理は、S14の処理に対応する。検知処理は、S52の処理に対応し、送信処理は、S54の処理に対応し、受信処理は、S56の処理に対応し、切替処理は、S58の処理に対応する。電子機器は、内燃機関の操作部に対応し、学習データは、関係規定データに対応し、学習済学習データは、学習済関係規定データに対応する。[2]車外制御装置は、データ解析センター110に対応し、外部記憶装置は、記憶装置116に対応し、外部実行装置は、CPU112およびROM114に対応する。更新処理は、S38〜S44の処理に対応し、操作処理は、S14の処理に対応する。検知処理は、S52の処理に対応する。第1送信処理は、S54の処理に対応し、第1受信処理は、S64の処理に対応し、第2送信処理は、S66の処理に対応し、第2受信処理は、S56の処理に対応し、切替処理は、S58の処理に対応する。[3]定期送信処理は、S50の処理に対応し、保存処理は、S62の処理に対応する。[4]走行履歴送信処理は、S70の処理に対応し、走行履歴受信処理は、S80の処理に対応し、走行履歴保存処理は、S82に対応する。走行履歴は、走行距離RLおよび位置データPgpsに対応する。[5]走行履歴は、走行距離RLに対応する。[6]関係規定データは、関係規定データDRに対応する。更新写像は、学習用メインプログラム74bのうちS38〜S44の処理を実行する指令によって規定された写像に対応する。
<その他の実施形態>
なお、本実施形態は、以下のように変更して実施することができる。本実施形態および以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
・「検知処理について」
上記実施形態では、S12の処理が適切にできない場合に関係規定データDRがリセットされることを検知したが、検知処理としては、これに限らない。たとえば、制御装置70はバッテリからの電力の供給を受けて駆動する。記憶装置76には、内燃機関10の運転を停止された状態でも、車両VC1に備わるバッテリから電力供給が維持されて、関係規定データDRの記憶が維持されている。この場合に、バッテリから電力供給がされているか否かを、センサ等によって検知してもよい。バッテリからの電力供給がされていない状態を検知すれば、バッテリからの電力供給が遮断され、記憶装置76は記憶している関係規定データDRが消失することを検知できる。
また、修理工場等でバッテリクリアがなされた場合、その旨をネットワーク100を介してデータ解析センター110に通知してもよい。その場合であっても、データ解析センター110において、図5(b)のS60,62,S66の処理に準じた処理を実行することによって、制御装置70に学習済関係規定データDRtを送信できる。
もっとも、検知処理としては、制御装置70とデータ解析センター110とのいずれかが実行するものにも限らない。たとえば、「車両用制御システムについて」の欄に記載したように、携帯端末を備えて車両用制御システムを構成する場合、携帯端末が検知処理を実行してもよい。ここで、制御装置70、携帯端末およびデータ解析センター110によって車両用制御システムを構成する場合、携帯端末が検知処理を実行した後、学習済関係規定データDRtを要求する信号をデータ解析センター110に送信すればよい。
さらに、検知処理としては、修理工場等による信号を直接検知する処理に限らない。たとえば、異常発生して関係規定データDRが消失した旨の信号を携帯端末に送信し、携帯端末から制御装置70にその旨の信号がさらに送信される場合、制御装置70が携帯端末からの信号を受信する処理を、検知処理としてもよい。
・「行動変数について」
上記実施形態では、行動変数としてのスロットルバルブの開口度に関する変数として、スロットル開口度指令値TA*を例示したが、これに限らない。たとえば、アクセル操作量PAに対するスロットル開口度指令値TA*の応答性を、無駄時間および2次遅れフィルタにて表現し、無駄時間と、2次遅れフィルタを規定する2つの変数との合計3つの変数を、スロットルバルブの開口度に関する変数としてもよい。ただし、その場合、状態変数は、アクセル操作量PAの時系列データに代えて、アクセル操作量PAの単位時間当たりの変化量とすることが望ましい。
上記実施形態では、行動変数としての点火時期に関する変数として、遅角量aopを例示したが、これに限らない。たとえば、KCSによる補正対象とされる点火時期自体であってもよい。
上記実施形態では、行動変数として、スロットルバルブの開口度に関する変数および点火時期に関する変数を例示したが、これに限らない。たとえば、スロットルバルブの開口度に関する変数および点火時期に関する変数に加えて、燃料噴射量を用いてもよい。また、それら3つに関しては、行動変数としてスロットルバルブの開口度に関する変数および燃料噴射量のみを採用したり、点火時期に関する変数および燃料噴射量のみを採用したりしてもよい。さらに、それら3つに関しては、行動変数としてそれらのうちの1つのみを採用してもよい。
また、「内燃機関について」の欄に記載したように、圧縮着火式の内燃機関の場合、スロットルバルブの開口度に関する変数に代えて噴射量に関する変数を用い、点火時期に関する変数に代えて噴射時期に関する変数を用いればよい。なお、噴射時期に関する変数に加えて、1燃焼サイクルにおける噴射回数に関する変数や、1燃焼サイクルにおける1つの気筒のための時系列的に隣接した2つの燃料噴射のうちの一方の終了タイミングと他方の開始タイミングとの間の時間間隔に関する変数を加えることが望ましい。
また、たとえば変速装置50が有段変速装置の場合、クラッチの係合状態を油圧によって調整するためのソレノイドバルブの電流値等を行動変数としてもよい。
また、たとえば、下記「車両について」の欄に記載したように車両としてハイブリッド車や、電気自動車、燃料電池車を採用する場合、回転電機のトルクや出力を行動変数としてもよい。またたとえば、内燃機関のクランク軸の回転動力によって回転するコンプレッサを備えた車載空調装置を備える場合、コンプレッサの負荷トルクを行動変数に含めてもよい。また、電動式の車載空調装置を備える場合、空調装置の消費電力を行動変数に含めてもよい。
・「状態について」
上記実施形態では、アクセル操作量PAの時系列データを、等間隔でサンプリングされた6個の値からなるデータとしたが、これに限らない。互いに異なるサンプリングタイミングにおける2個以上のサンプリング値からなるデータであればよく、この際、3個以上のサンプリング値からなるデータや、サンプリング間隔が等間隔であるデータであることがより望ましい。
アクセル操作量に関する状態変数としては、アクセル操作量PAの時系列データに限らず、たとえば「行動変数について」の欄に記載したように、アクセル操作量PAの単位時間当たりの変化量等であってもよい。
また、たとえば「行動変数について」の欄に記載したように、ソレノイドバルブの電流値を行動変数とする場合、状態に、変速装置の入力軸52の回転速度や出力軸54の回転速度、ソレノイドバルブによって調整される油圧を含めればよい。またたとえば「行動変数について」の欄に記載したように、回転電機のトルクや出力を行動変数とする場合、状態に、バッテリの充電率や温度を含めればよい。またたとえば「行動変数について」の欄に記載したように、コンプレッサの負荷トルクや空調装置の消費電力を行動に含める場合、状態に、車室内の温度を含めればよい。
・「テーブル形式のデータの次元削減について」
テーブル形式のデータの次元削減手法としては、上記実施形態において例示したものに限らない。たとえばアクセル操作量PAが最大値となることはまれであることから、アクセル操作量PAが規定量以上となる状態については行動価値関数Qを定義せず、アクセル操作量PAが規定量以上となる場合のスロットル開口度指令値TA*等は、別途適合してもよい。またたとえば、行動のとりうる値からスロットル開口度指令値TA*が規定値以上となるものを除くなどして、次元削減をしてもよい。
・「学習データについて」
上記実施形態では、学習データは、強化学習によって更新される関係規定データDRとしたが、これに限らない。たとえば、内燃機関の点火時期学習によって更新される点火時期の学習値であってもよい。
・「学習について」
車両VC1の走行に伴って学習値を更新するものであれば、学習の仕方は問わない。たとえば、上述した内燃機関の点火時期学習であってもよい。また、学習による更新のされ方も問わず、たとえば、フィードバック制御であってもよい。
・「関係規定データについて」
上記実施形態では、行動価値関数Qを、テーブル形式の関数としたが、これに限らない。たとえば、関数近似器を用いてもよい。
たとえば、行動価値関数Qを用いる代わりに、方策πを、状態sおよび行動aを独立変数とし、行動aをとる確率を従属変数とする関数近似器にて表現し、関数近似器を定めるパラメータを、報酬rに応じて更新してもよい。
・「操作処理について」
たとえば「関係規定データについて」の欄に記載したように、行動価値関数を関数近似器とする場合、上記実施形態におけるテーブル型式の関数の独立変数となる行動についての離散的な値の組の全てについて、状態sとともに行動価値関数Qに入力することによって、行動価値関数Qを最大化する行動aを選択すればよい。
また、たとえば「関係規定データについて」の欄に記載したように、方策πを、状態sおよび行動aを独立変数とし、行動aをとる確率を従属変数とする関数近似器とする場合、方策πによって示される確率に基づき行動aを選択すればよい。
・「更新写像について」
S38〜S44の処理においては、εソフト方策オン型モンテカルロ法によるものを例示したが、これに限らない。たとえば、方策オフ型モンテカルロ法によるものであってもよい。もっとも、モンテカルロ法にも限らず、たとえば、方策オフ型TD法を用いたり、またたとえばSARSA法のように方策オン型TD法を用いたり、またたとえば、方策オン型の学習として適格度トレース法を用いたりしてもよい。
また、たとえば「関係規定データについて」の欄に記載したように、方策πを関数近似器を用いて表現し、これを報酬rに基づき直接更新する場合には、方策勾配法等を用いて更新写像を構成すればよい。
また、行動価値関数Qと方策πとのうちのいずれか一方のみを、報酬rによる直接の更新対象とするものに限らない。たとえば、アクター・クリティック法のように、行動価値関数Qおよび方策πをそれぞれ更新してもよい。また、アクター・クリティック法においては、これに限らず、たとえば行動価値関数Qに代えて価値関数Vを更新対象としてもよい。
なお、方策πを定める「ε」については、固定値に限らず、学習の進行度合いに応じてあらかじめ定められた規則に応じて変更してもよい。
・「報酬算出処理について」
図3の処理では、条件(ア)および条件(イ)の論理積が真であるか否かに応じて報酬を与えたが、これに限らない。たとえば、条件(ア)を満たすか否かに応じて報酬を与える処理と、条件(イ)を満たすか否かに応じて報酬を与える処理とを実行してもよい。また、たとえば、条件(ア)を満たすか否かに応じて報酬を与える処理と、条件(イ)を満たすか否かに応じて報酬を与える処理との2つの処理に関しては、それらのうちのいずれか1つの処理のみを実行してもよい。
また、たとえば条件(ア)を満たす場合に一律同じ報酬を与える代わりに、トルクTrqとトルク指令値Trq*との差の絶対値が小さい場合に大きい場合よりもより大きい報酬を与える処理としてもよい。またたとえば、条件(ア)を満たさない場合に一律同じ報酬を与える代わりに、トルクTrqとトルク指令値Trq*との差の絶対値が大きい場合に小さい場合よりもより小さい報酬を与える処理としてもよい。
また、たとえば条件(イ)を満たす場合に一律同じ報酬を与える代わりに、加速度Gxの大きさに応じて報酬の大きさを可変とする処理としてもよい。またたとえば、条件(イ)を満たさない場合に一律同じ報酬を与える代わりに、加速度Gxの大きさに応じて報酬の大きさを可変とする処理としてもよい。
上記実施形態では、報酬rを、ドライバビリティに関する基準を満たすか否かに応じて与えたが、ドライバビリティに関する基準としては、上述したものに限らず、たとえば騒音や振動強度が基準を満たすか否かに応じて設定してもよい。もっともこれに限らず、上記加速度が基準を満たすか否かと、トルクTrqの追従性が基準を満たすか否かと、騒音が基準を満たすか否かと、振動強度が基準を満たすか否かとの4つのうちの任意の1つ以上であってよい。
報酬算出処理としては、報酬rを、ドライバビリティに関する基準を満たすか否かに応じて与えるものにも限らない。たとえば、燃料消費率が基準を満たす場合に満たさない場合よりも大きい報酬を与える処理であってもよい。またたとえば、排気特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える処理であってもよい。なお、ドライバビリティに関する基準を満たす場合に満たさない場合よりも大きい報酬を与える処理と、燃料消費率が基準を満たす場合に満たさない場合よりも大きい報酬を与える処理と、排気特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える処理との3つの処理のうちの2つまたは3つを含んでもよい。
また、たとえば「行動変数について」の欄に記載したように、変速装置50のソレノイドバルブの電流値を行動変数とする場合、たとえば報酬算出処理に以下の(a)〜(c)の3つの処理のうちの少なくとも1つの処理を含めればよい。
(a)変速装置による変速比の切り替えに要する時間が所定時間以内である場合に所定時間を超える場合よりも大きい報酬を与える処理である。
(b)変速装置の入力軸52の回転速度の変化速度の絶対値が入力側所定値以下である場合に入力側所定値を超える場合よりも大きい報酬を与える処理である。
(c)変速装置の出力軸54の回転速度の変化速度の絶対値が出力側所定値以下である場合に出力側所定値を超える場合よりも大きい報酬を与える処理である。
また、たとえば「行動変数について」の欄に記載したように、回転電機のトルクや出力を行動変数とする場合、バッテリの充電率が所定範囲内にある場合にない場合よりも大きい報酬を与える処理や、バッテリの温度が所定範囲内にある場合にない場合よりも大きい報酬を与える処理を含めてもよい。また、たとえば「行動変数について」の欄に記載したように、コンプレッサの負荷トルクや空調装置の消費電力を行動変数に含める場合、車室内の温度が所定範囲内にある場合にない場合よりも大きい報酬を与える処理を加えてもよい。
・「車両用制御システムについて」
車両用制御システムとしては、制御装置70およびデータ解析センター110によって構成されるものに限らない。たとえば、データ解析センター110に代えて、ユーザが所持する携帯端末を用い、制御装置70および携帯端末によって車両用制御システムを構成してもよい。また、たとえば、制御装置70、携帯端末、およびデータ解析センター110によって構成してもよい。少なくとも、制御装置70は、車両VC1の外部から学習済関係規定データDRtを受信できればよい。
・「通信機について」
上記実施形態において、S54やS56での送受信は、通信機77が操作されることによって行っているが、通信機77は、車両VC1に搭載されているものに限られず、例えば、車両VC1のユーザのスマートフォンであってもよい。この場合、制御装置70とスマートフォンが近距離通信や有線通信によって電気的に接続されており、通信機77として機能するスマートフォンが、車外との通信を行ってもよい。
・「車外制御装置について」
上記実施形態において、車外制御装置としては、データ解析センター110を例示したが、車外制御装置としては、上記実施形態の例に限られず、車両VC1の車外制御装置として機能する制御装置70に対しては、車両VC1の外部に設けられている装置であればよい。例えば、車両VC1とは別の車両に搭載されている制御装置であってもよい。この場合、車両用制御システムとしては、例えば、車両VC1の制御装置70と、当該車両とVC1は別の車両の制御装置と、によって構成してもよい。この場合であっても、車両VC1に対しては、別の車両の制御装置は車外制御装置として機能できる。
・「実行装置について」
実行装置としては、CPU72(112)とROM74(114)とを備えて、ソフトウェア処理を実行するものに限らない。たとえば、上記実施形態においてソフトウェア処理されたものの少なくとも一部を、ハードウェア処理するたとえばASIC等の専用のハードウェア回路を備えてもよい。すなわち、実行装置は、以下の(a)〜(c)のいずれかの構成であればよい。(a)上記処理の全てを、プログラムに従って実行する処理装置と、プログラムを記憶するROM等のプログラム格納装置とを備える。(b)上記処理の一部をプログラムに従って実行する処理装置およびプログラム格納装置と、残りの処理を実行する専用のハードウェア回路とを備える。(c)上記処理の全てを実行する専用のハードウェア回路を備える。ここで、処理装置およびプログラム格納装置を備えたソフトウェア実行装置や、専用のハードウェア回路は複数であってもよい。
・「記憶装置について」
上記実施形態では、関係規定データDRが記憶される記憶装置と、学習用メインプログラム74bや制御プログラム74aが記憶される記憶装置(ROM74)とを別の記憶装置としたが、これに限らない。
・「内燃機関について」
内燃機関としては、燃料噴射弁として吸気通路12に燃料を噴射するポート噴射弁を備えるものに限らず、燃焼室24に燃料を直接噴射する筒内噴射弁を備えるものであってもよく、またたとえば、ポート噴射弁および筒内噴射弁の双方を備えるものであってもよい。
内燃機関としては、火花点火式内燃機関に限らず、たとえば燃料として軽油などを用いる圧縮着火式内燃機関等であってもよい。
・「車両について」
車両としては、推力生成装置が内燃機関のみである車両に限らず、たとえば内燃機関と回転電機とを備えるいわゆるハイブリッド車両であってもよい。またたとえば、推力生成装置として、内燃機関を備えることなく、回転電機を備えるいわゆる電気自動車や燃料電池車あってもよい。
・「走行履歴について」
上記第2の実施形態において、走行履歴は、走行距離RLと位置データPgpsとに限られない。例えば、走行履歴は、走行中の複数の位置データPgpsを基に、走行距離や走行位置を算出したものであってもよい。この点、第3の実施形態においても同様である。
・「走行履歴の送受信について」
上記第2の実施形態において、走行履歴を示すデータは、S54の処理と同時に送信されてもよく、この場合、走行履歴を示すデータは、S64の処理と同時に受信され、S82の処理は、S64の後になされればよい。
また、S70における走行履歴を示すデータの送信と同時に、車両VC1の関係規定データDRを送信してもよい。この場合、S80において、車両VC1の関係規定データDRを受信するとともに、S82において、車両VC1の関係規定データDRを記憶すると、S86の処理を省略して、S84の処理において、記憶装置116に記憶されているデータから選択できる。
10…内燃機関
26…点火装置
70…制御装置
72…CPU
74…ROM
76…記憶装置
100…ネットワーク
110…データ解析センター
112…CPU
114…ROM
116…記憶装置
DR…関係規定データ
DRt…学習済関係規定データ

Claims (6)

  1. 内部記憶装置および内部実行装置を備えている車載制御装置であって、
    前記内部記憶装置は、車両に搭載された電子機器の制御に用いられる学習データを記憶し、
    前記内部実行装置は、
    前記車両の状態を検出するセンサの検出値を取得する取得処理と、
    前記学習データを前記車両の走行に伴う学習によって更新して、前記内部記憶装置に記憶させる更新処理と、
    前記取得処理によって取得された前記検出値および前記学習データによって定まる前記車両内の電子機器の操作に関する変数の値に基づき前記電子機器を操作する操作処理と、
    前記車両の異常発生により前記内部記憶装置が記憶している前記学習データがリセットされたことを検知する検知処理と、
    前記検知処理によって前記学習データがリセットされたことが検知された場合、前記学習データの初期状態から学習がなされた学習済学習データを要求するための要求信号を車両外に送信する送信処理と、
    前記要求信号に応じた前記学習済学習データを車外から受信する受信処理と、
    前記受信処理で受信した前記学習済学習データを、リセットされた前記学習データに替えて前記内部記憶装置に記憶させる切替処理と、を実行する
    車両用制御装置。
  2. 車両に搭載されている車載制御装置と、前記車両の外部に設けられている車外制御装置と、を備えている車両用制御システムであって、
    前記車載制御装置は、内部記憶装置および内部実行装置を有しており、
    前記車外制御装置は、外部記憶装置および外部実行装置を有しており、
    前記内部記憶装置は、車両に搭載された電子機器の制御に用いられる学習データを記憶しており、
    前記外部記憶装置は、前記学習データの初期状態から学習がなされた学習済学習データを記憶しており、
    前記内部実行装置は、
    前記車両の状態を検出するセンサの検出値を取得する取得処理と、
    前記学習データを前記車両の走行に伴う学習によって更新して、前記内部記憶装置に記憶させる更新処理と、
    前記取得処理によって取得された前記検出値および前記学習データによって定まる前記車両内の電子機器の操作に関する変数の値に基づき前記電子機器を操作する操作処理と、
    前記車両の異常発生により前記内部記憶装置が記憶している前記学習データがリセットされたことを検知する検知処理と、
    前記検知処理によって前記学習データがリセットされたことが検知された場合、前記学習済学習データを要求するための要求信号を前記車外制御装置に送信する第1送信処理と、を実行し、
    前記外部実行装置は、
    前記第1送信処理によって送信された前記要求信号を前記内部実行装置から受信する第1受信処理と、
    前記第1受信処理によって受信した前記要求信号に応じて、前記外部記憶装置に記憶している前記学習済学習データを示す信号を車載制御装置に送信する第2送信処理と、を実行し、
    前記内部実行装置は、
    前記第2送信処理によって送信された前記学習済学習データを示す信号を受信する第2受信処理と、
    前記第2受信処理で受信した前記学習済学習データを、リセットされた前記学習データに替えて前記内部記憶装置に記憶させる切替処理と、を実行する
    車両用制御システム。
  3. 前記内部実行装置は、前記更新処理によって更新した前記学習データを示す信号を、所定期間ごとに、前記車外制御装置に送信する定期送信処理を実行し、
    前記外部実行装置は、
    前記定期送信処理によって送信された前記学習データを示す信号を受信する定期受信処理と、
    前記定期受信処理によって受信された前記学習データを、前記外部記憶装置に前記学習済学習データとして保存する保存処理と、を実行し、
    前記第2送信処理において送信する前記学習済学習データは、前記保存処理によって保存された最新のデータである
    請求項2に記載の車両用制御システム。
  4. 前記内部実行装置は、当該内部実行装置が搭載されている車両の走行履歴を示す信号を、前記車外制御装置に送信する走行履歴送信処理を実行し、
    前記外部実行装置は、
    複数の車両によって送信された走行履歴を示す信号を受信する走行履歴受信処理と、
    前記走行履歴受信処理によって受信された前記走行履歴を、前記外部記憶装置に前記車両ごとに保存する走行履歴保存処理と、を実行し、
    前記第2送信処理で送信される前記学習済学習データは、前記走行履歴保存処理によって保存された複数の車両の前記走行履歴のうち、前記要求信号を送信した車両の前記走行履歴に最も近い走行履歴に関連付けられた学習済学習データである
    請求項2または請求項3に記載の車両用制御システム。
  5. 前記外部記憶装置には、複数の走行履歴とその走行履歴に対応した前記学習済学習データとが関連付けられて予め設定されており、
    前記第1送信処理では、前記車両の前記学習データがリセットされたときの当該車両の走行履歴を示す信号を送信し、
    前記第1受信処理では、前記走行履歴を受信し、
    前記第2送信処理で送信される前記学習済学習データは、前記外部記憶装置に記憶されている複数の走行履歴のうち、前記要求信号を送信した車両の前記走行履歴に最も近い走行履歴に関連付けられた学習済学習データである
    請求項2に記載の車両用制御システム。
  6. 前記学習データは、前記車両の状態と前記車両内の前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データであり、
    前記内部実行装置は、
    前記取得処理によって取得された前記検出値に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理を実行し、
    前記更新処理では、前記取得処理によって取得された前記検出値に基づく前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新し、
    前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものである
    請求項2〜請求項5のいずれか1項に記載の車両用制御システム。
JP2020012548A 2020-01-29 2020-01-29 車両用制御装置および車両用制御システム Pending JP2021116783A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020012548A JP2021116783A (ja) 2020-01-29 2020-01-29 車両用制御装置および車両用制御システム
US17/146,626 US20210229687A1 (en) 2020-01-29 2021-01-12 Vehicle controller, vehicle control system, vehicle control method, and vehicle control system control method
CN202110105692.6A CN113187612A (zh) 2020-01-29 2021-01-26 车辆用控制装置、车辆用控制系统、车辆用控制方法及车辆用控制系统的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020012548A JP2021116783A (ja) 2020-01-29 2020-01-29 車両用制御装置および車両用制御システム

Publications (1)

Publication Number Publication Date
JP2021116783A true JP2021116783A (ja) 2021-08-10

Family

ID=76970535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020012548A Pending JP2021116783A (ja) 2020-01-29 2020-01-29 車両用制御装置および車両用制御システム

Country Status (3)

Country Link
US (1) US20210229687A1 (ja)
JP (1) JP2021116783A (ja)
CN (1) CN113187612A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210114596A1 (en) * 2019-10-18 2021-04-22 Toyota Jidosha Kabushiki Kaisha Method of generating vehicle control data, vehicle control device, and vehicle control system
JP2021124055A (ja) * 2020-02-05 2021-08-30 トヨタ自動車株式会社 内燃機関の制御装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11685276B2 (en) 2019-06-07 2023-06-27 Anthony Macaluso Methods and apparatus for powering a vehicle
US11289974B2 (en) 2019-06-07 2022-03-29 Anthony Macaluso Power generation from vehicle wheel rotation
US11641572B2 (en) 2019-06-07 2023-05-02 Anthony Macaluso Systems and methods for managing a vehicle's energy via a wireless network
US11837411B2 (en) 2021-03-22 2023-12-05 Anthony Macaluso Hypercapacitor switch for controlling energy flow between energy storage devices
US11615923B2 (en) 2019-06-07 2023-03-28 Anthony Macaluso Methods, systems and apparatus for powering a vehicle
JP6809588B1 (ja) * 2019-10-18 2021-01-06 トヨタ自動車株式会社 車両用制御システム、車両用制御装置、および車両用学習装置
CN115803519B (zh) * 2020-06-12 2025-03-14 日产自动车株式会社 发动机的控制方法以及控制装置
US11577606B1 (en) 2022-03-09 2023-02-14 Anthony Macaluso Flexible arm generator
US11472306B1 (en) 2022-03-09 2022-10-18 Anthony Macaluso Electric vehicle charging station
US12160132B2 (en) 2023-01-30 2024-12-03 Anthony Macaluso Matable energy storage devices
US11955875B1 (en) 2023-02-28 2024-04-09 Anthony Macaluso Vehicle energy generation system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0914021A (ja) * 1995-06-30 1997-01-14 Unisia Jecs Corp 車両用スロットル制御装置
JPH10254505A (ja) * 1997-03-14 1998-09-25 Toyota Motor Corp 自動制御装置
JP2014084817A (ja) * 2012-10-25 2014-05-12 Mitsubishi Electric Corp 内燃機関のシリンダ吸入空気量推定装置
JP2017191567A (ja) * 2016-04-15 2017-10-19 ファナック株式会社 生産計画を実施する生産システム
JP2019190361A (ja) * 2018-04-24 2019-10-31 株式会社デンソー 制御装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4221871B2 (ja) * 2000-03-14 2009-02-12 いすゞ自動車株式会社 車両の変速装置
JP2003050605A (ja) * 2001-08-07 2003-02-21 Mazda Motor Corp 自動車の制御ゲイン変更用サーバ、自動車の制御ゲイン変更方法、及び、自動車の制御ゲイン変更用プログラム
US6895326B1 (en) * 2004-01-13 2005-05-17 Ford Global Technologies, Llc Computer readable storage medium and code for adaptively learning information in a digital control system
JP5146422B2 (ja) * 2009-07-29 2013-02-20 トヨタ自動車株式会社 内燃機関制御装置
JP5929444B2 (ja) * 2012-04-11 2016-06-08 株式会社デンソー 車載用報知装置
JP5862511B2 (ja) * 2012-08-21 2016-02-16 株式会社デンソー 車両用学習データ再利用判断装置
JP6471106B2 (ja) * 2016-01-19 2019-02-13 日立オートモティブシステムズ株式会社 車両制御装置、車両制御パラメータ学習システム
US10640106B2 (en) * 2016-08-19 2020-05-05 Ford Global Technologies, Llc Speed controlling an electric machine of a hybrid electric vehicle
JP6491168B2 (ja) * 2016-10-28 2019-03-27 トヨタ自動車株式会社 車両の制御装置
JP6790977B2 (ja) * 2017-04-11 2020-11-25 株式会社デンソー 車両のデータ記憶装置
CN108009587B (zh) * 2017-12-01 2021-04-16 驭势科技(北京)有限公司 一种基于强化学习和规则确定驾驶策略的方法与设备
CN108240261A (zh) * 2017-12-13 2018-07-03 重庆长安铃木汽车有限公司 一种两用燃料发动机燃气组分自学习控制器及控制方法
WO2020256174A1 (ko) * 2019-06-18 2020-12-24 엘지전자 주식회사 자율주행시스템에서 차량의 리소스 관리 방법 및 이를 위한 장치
US10947919B1 (en) * 2019-08-26 2021-03-16 Caterpillar Inc. Fuel injection control using a neural network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0914021A (ja) * 1995-06-30 1997-01-14 Unisia Jecs Corp 車両用スロットル制御装置
JPH10254505A (ja) * 1997-03-14 1998-09-25 Toyota Motor Corp 自動制御装置
JP2014084817A (ja) * 2012-10-25 2014-05-12 Mitsubishi Electric Corp 内燃機関のシリンダ吸入空気量推定装置
JP2017191567A (ja) * 2016-04-15 2017-10-19 ファナック株式会社 生産計画を実施する生産システム
JP2019190361A (ja) * 2018-04-24 2019-10-31 株式会社デンソー 制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210114596A1 (en) * 2019-10-18 2021-04-22 Toyota Jidosha Kabushiki Kaisha Method of generating vehicle control data, vehicle control device, and vehicle control system
US11654915B2 (en) * 2019-10-18 2023-05-23 Toyota Jidosha Kabushiki Kaisha Method of generating vehicle control data, vehicle control device, and vehicle control system
JP2021124055A (ja) * 2020-02-05 2021-08-30 トヨタ自動車株式会社 内燃機関の制御装置
JP7359011B2 (ja) 2020-02-05 2023-10-11 トヨタ自動車株式会社 内燃機関の制御装置

Also Published As

Publication number Publication date
CN113187612A (zh) 2021-07-30
US20210229687A1 (en) 2021-07-29

Similar Documents

Publication Publication Date Title
JP2021116783A (ja) 車両用制御装置および車両用制御システム
US11453375B2 (en) Vehicle controller, vehicle control system, vehicle learning device, vehicle control method, and memory medium
US11453376B2 (en) Vehicle control device, vehicle control system, and method for controlling vehicle
JP6809587B1 (ja) 車両用制御装置
JP6744598B1 (ja) 車両用制御システム、車両用制御装置、および車両用学習装置
US11654915B2 (en) Method of generating vehicle control data, vehicle control device, and vehicle control system
JP7287287B2 (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP7211375B2 (ja) 車両用制御装置
US11125179B2 (en) Vehicle controller, vehicle control system, vehicle learning device, vehicle learning method, vehicle control method, and memory medium
JP7314819B2 (ja) 車両制御方法、車両用制御装置及びサーバ
JP2021116781A (ja) 車両制御方法、車両用制御装置及びサーバ
JP2021067257A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
TW202128467A (zh) 控制車輛的方法、車輛控制器、和伺服器
JP2021067258A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP2021066417A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP7207289B2 (ja) 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法
JP2021067261A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP2021067259A (ja) 車両用制御システム、車両用制御装置、および車両用学習装置
JP2021067262A (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230801