JPH09114503A - 制御装置 - Google Patents
制御装置Info
- Publication number
- JPH09114503A JPH09114503A JP7265086A JP26508695A JPH09114503A JP H09114503 A JPH09114503 A JP H09114503A JP 7265086 A JP7265086 A JP 7265086A JP 26508695 A JP26508695 A JP 26508695A JP H09114503 A JPH09114503 A JP H09114503A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- control
- amount
- control amount
- operation amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Feedback Control In General (AREA)
Abstract
(57)【要約】
【課題】 フィードバック制御のループの中に存在する
時間的な要因を考慮してより正確な制御を行うことがで
きる制御装置の提供。 【解決手段】 学習部4は制御対象1に操作量が入力さ
れてからその操作量による影響が制御量に現れるまでの
応答時間pΔtと、観測データ記憶部5に記憶された過
去l単位時間に計測された制御量と制御対象1に入力さ
れた操作量からなる観測データに基づいて、調節部2の
パラメータWを学習によって調節し、調節部2へ出力す
る。
時間的な要因を考慮してより正確な制御を行うことがで
きる制御装置の提供。 【解決手段】 学習部4は制御対象1に操作量が入力さ
れてからその操作量による影響が制御量に現れるまでの
応答時間pΔtと、観測データ記憶部5に記憶された過
去l単位時間に計測された制御量と制御対象1に入力さ
れた操作量からなる観測データに基づいて、調節部2の
パラメータWを学習によって調節し、調節部2へ出力す
る。
Description
【0001】
【発明の属する技術分野】本発明は、例えば下水処理施
設の曝気槽内の溶存酸素濃度を一定値に制御する制御装
置に関する。
設の曝気槽内の溶存酸素濃度を一定値に制御する制御装
置に関する。
【0002】
【従来の技術】この種のシステムを制御する制御装置
は、制御対象の緩やかな特性変化に適応すると共に、制
御量に影響を与える制御対象の状態の急激な変化に対応
できることが望まれる。しかし、下水処理施設の曝気槽
内の溶存酸素濃度制御は、観測された下水中の溶存酸素
濃度と目標溶存酸素濃度との誤差から曝気風量を決定す
るフィードバック制御を行っているが、降雨などにより
下水流入量が急激に変化すると、フィードバック制御で
は正確な制御ができなくなり、監視員が手作業で曝気風
量を調節しなければならない。また、下水流入量の変化
などによる溶存酸素濃度の急激な変化だけでなく、季節
によって下水処理プロセスの特性が大きく変化するた
め、フィードバック制御のゲイン定数を調整しなければ
ならないのが現状である。
は、制御対象の緩やかな特性変化に適応すると共に、制
御量に影響を与える制御対象の状態の急激な変化に対応
できることが望まれる。しかし、下水処理施設の曝気槽
内の溶存酸素濃度制御は、観測された下水中の溶存酸素
濃度と目標溶存酸素濃度との誤差から曝気風量を決定す
るフィードバック制御を行っているが、降雨などにより
下水流入量が急激に変化すると、フィードバック制御で
は正確な制御ができなくなり、監視員が手作業で曝気風
量を調節しなければならない。また、下水流入量の変化
などによる溶存酸素濃度の急激な変化だけでなく、季節
によって下水処理プロセスの特性が大きく変化するた
め、フィードバック制御のゲイン定数を調整しなければ
ならないのが現状である。
【0003】そこで、観測データを利用した学習により
調節部を調整することにより、制御対象の緩やかな特性
変化に適応させると共に、調節部において制御対象の制
御量の予測と操作量の修正とを繰り返すループを持つこ
とで、制御量に影響を与える制御対象の状態の急激な変
化に対応させることが考えられる。
調節部を調整することにより、制御対象の緩やかな特性
変化に適応させると共に、調節部において制御対象の制
御量の予測と操作量の修正とを繰り返すループを持つこ
とで、制御量に影響を与える制御対象の状態の急激な変
化に対応させることが考えられる。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな対策を講じたとしても、現実のシステムにおいては
フィードバック制御のループの中は様々な時間的な要因
が存在するため、正確な制御が行えない。すなわち、例
えば制御対象に操作量を与えた時刻と操作量による影響
が制御量に現れるまでの時刻とは実際には時間的な開き
がある。また、調節部で調節量が決定する時刻とこの調
節量に基づき操作部から制御対象に操作量が与えれる時
刻とは時間的な開きがある。さらに、制御対象で計測さ
れた制御量の計測値が調節部に伝送されるのに時間遅れ
がある。
うな対策を講じたとしても、現実のシステムにおいては
フィードバック制御のループの中は様々な時間的な要因
が存在するため、正確な制御が行えない。すなわち、例
えば制御対象に操作量を与えた時刻と操作量による影響
が制御量に現れるまでの時刻とは実際には時間的な開き
がある。また、調節部で調節量が決定する時刻とこの調
節量に基づき操作部から制御対象に操作量が与えれる時
刻とは時間的な開きがある。さらに、制御対象で計測さ
れた制御量の計測値が調節部に伝送されるのに時間遅れ
がある。
【0005】本発明は、かかる事情に基づき成されたも
ので、フィードバック制御のループの中に存在する時間
的な要因を考慮してより正確な制御を行うことができる
制御装置を提供することを目的としている。
ので、フィードバック制御のループの中に存在する時間
的な要因を考慮してより正確な制御を行うことができる
制御装置を提供することを目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
め、請求項1記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
【0007】請求項2記載の発明は、制御対象に入力さ
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記操作部から出力された操作量と前記
制御対象で計測された制御量に基づき、前記操作部から
前記制御対象へ操作量を入力してから当該操作量による
影響が制御量に現れるまでの制御対象の応答時間を算出
する応答時間算出部と、前記応答時間算出部により算出
された応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記操作部から出力された操作量と前記
制御対象で計測された制御量に基づき、前記操作部から
前記制御対象へ操作量を入力してから当該操作量による
影響が制御量に現れるまでの制御対象の応答時間を算出
する応答時間算出部と、前記応答時間算出部により算出
された応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
【0008】請求項3記載の発明は、請求項1または請
求項2記載の制御装置において、調節部が、前記制御対
象で計測された制御量及び目標制御量に基づき、仮想操
作量を算出する仮想操作量算出部と、前記制御対象で計
測された制御量及び仮想操作量に基づき、前記応答時間
後の制御量を予測する制御量予測部と、前記制御量予測
部により予測された応答時間後の予測制御量及び目標制
御量に基づき、仮想操作量を修正する操作量修正部と、
前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備する。
求項2記載の制御装置において、調節部が、前記制御対
象で計測された制御量及び目標制御量に基づき、仮想操
作量を算出する仮想操作量算出部と、前記制御対象で計
測された制御量及び仮想操作量に基づき、前記応答時間
後の制御量を予測する制御量予測部と、前記制御量予測
部により予測された応答時間後の予測制御量及び目標制
御量に基づき、仮想操作量を修正する操作量修正部と、
前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備する。
【0009】請求項4記載の発明は、請求項3記載の制
御装置において、前記制御量予測部が神経回路モデルか
ら構成され、前記操作量修正部の計算が神経回路モデル
の誤差逆伝播計算により実現され、前記学習部は、前記
応答時間と前記観測データ記憶部に記憶された観測デー
タとに基づいて、学習データを作成し、前記制御量予測
部を構成する神経回路モデルの学習を行う。
御装置において、前記制御量予測部が神経回路モデルか
ら構成され、前記操作量修正部の計算が神経回路モデル
の誤差逆伝播計算により実現され、前記学習部は、前記
応答時間と前記観測データ記憶部に記憶された観測デー
タとに基づいて、学習データを作成し、前記制御量予測
部を構成する神経回路モデルの学習を行う。
【0010】請求項5記載の発明は、請求項4記載の制
御装置において、前記学習部は、前記観測データ記憶部
に記憶された観測データに基づいて、学習データを作成
する際に、同じ時刻の制御量と操作量とを有する観測デ
ータを入力信号とし、前記応答時間後の制御量を教師信
号にして学習を行う。
御装置において、前記学習部は、前記観測データ記憶部
に記憶された観測データに基づいて、学習データを作成
する際に、同じ時刻の制御量と操作量とを有する観測デ
ータを入力信号とし、前記応答時間後の制御量を教師信
号にして学習を行う。
【0011】請求項6記載の発明は、制御対象に入力さ
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記操作部から前記制御対象へ操作量を
入力してから当該操作量による影響が制御量に現れるま
での制御対象の応答時間と前記調節部で算出された調節
信号が当該操作部を通して操作量として実現されるまで
の操作遅れ時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記操作部から前記制御対象へ操作量を
入力してから当該操作量による影響が制御量に現れるま
での制御対象の応答時間と前記調節部で算出された調節
信号が当該操作部を通して操作量として実現されるまで
の操作遅れ時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
【0012】請求項7記載の発明は、制御対象に入力さ
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記調節部で算出された調節信号と前記
操作部で出力された操作量に基づき、前記調節部で算出
された調節信号が当該操作部を通して操作量として実現
されるまでの操作遅れ時間を計測する操作遅れ時間計測
部と、前記操作遅れ時間計測部により計測された操作送
れ時間と前記操作部から前記制御対象へ操作量を入力し
てから当該操作量による影響が制御量に現れるまでの制
御対象の応答時間と前記観測データ記憶部に記憶された
観測データとに基づいて、前記調節部を学習する学習部
とを具備する。
れる操作量を変化させることで制御対象の制御量を制御
する制御装置において、前記制御対象で計測された制御
量及び目標制御量に基づき、調節信号を算出する調節部
と、前記調節部で算出された調節信号に基づき、前記制
御対象に操作量を出力する操作部と、過去に観測された
制御量及び操作量を有する観測データを記憶する観測デ
ータ記憶部と、前記調節部で算出された調節信号と前記
操作部で出力された操作量に基づき、前記調節部で算出
された調節信号が当該操作部を通して操作量として実現
されるまでの操作遅れ時間を計測する操作遅れ時間計測
部と、前記操作遅れ時間計測部により計測された操作送
れ時間と前記操作部から前記制御対象へ操作量を入力し
てから当該操作量による影響が制御量に現れるまでの制
御対象の応答時間と前記観測データ記憶部に記憶された
観測データとに基づいて、前記調節部を学習する学習部
とを具備する。
【0013】請求項8記載の発明は、請求項6または請
求項7記載の制御装置において、調節部が、前記制御対
象で計測された制御量及び目標制御量に基づき、仮想操
作量を算出する仮想操作量算出部と、前記制御対象で計
測された制御量及び仮想操作量に基づき、前記応答時間
後の制御量を予測する制御量予測部と、前記制御量予測
部により予測された応答時間後の予測制御量及び目標制
御量に基づき、仮想操作量を修正する操作量修正部と、
前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備する。
求項7記載の制御装置において、調節部が、前記制御対
象で計測された制御量及び目標制御量に基づき、仮想操
作量を算出する仮想操作量算出部と、前記制御対象で計
測された制御量及び仮想操作量に基づき、前記応答時間
後の制御量を予測する制御量予測部と、前記制御量予測
部により予測された応答時間後の予測制御量及び目標制
御量に基づき、仮想操作量を修正する操作量修正部と、
前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備する。
【0014】請求項9記載の発明は、請求項8記載の制
御装置において、前記制御量予測部が神経回路モデルか
ら構成され、前記操作量修正部の計算が神経回路モデル
の誤差逆伝播計算により実現され、前記学習部は、前記
応答時間と前記操作遅れ時間と前記観測データ記憶部に
記憶された観測データとに基づいて、学習データを作成
し、前記制御量予測部を構成する神経回路モデルの学習
を行う。
御装置において、前記制御量予測部が神経回路モデルか
ら構成され、前記操作量修正部の計算が神経回路モデル
の誤差逆伝播計算により実現され、前記学習部は、前記
応答時間と前記操作遅れ時間と前記観測データ記憶部に
記憶された観測データとに基づいて、学習データを作成
し、前記制御量予測部を構成する神経回路モデルの学習
を行う。
【0015】請求項10記載の発明は、請求項9記載の
制御装置において、前記学習部は、前記観測データ記憶
部に記憶された観測データに基づいて、学習データを作
成する際に、当該時刻の制御量と当該時刻より操作遅れ
時間後の操作量とを有する観測データを入力信号とし、
前記応答時間後の制御量を教師信号にして学習を行う。
請求項11記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記制御対象で計測された制御量が前
記伝送部を通して調節部に入力されるまでの伝送むだ時
間と前記観測データ記憶部に記憶された観測データとに
基づいて、前記調節部を学習する学習部とを具備する。
請求項12記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記制御対象で計測された制御量と前記伝送部を
通して調節部に入力された制御量とに基づき、前記伝送
部による伝送むだ時間を計測する伝送むだ時間計測部
と、前記伝送むだ時間計測部により計測された伝送むだ
時間と前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
制御装置において、前記学習部は、前記観測データ記憶
部に記憶された観測データに基づいて、学習データを作
成する際に、当該時刻の制御量と当該時刻より操作遅れ
時間後の操作量とを有する観測データを入力信号とし、
前記応答時間後の制御量を教師信号にして学習を行う。
請求項11記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記制御対象で計測された制御量が前
記伝送部を通して調節部に入力されるまでの伝送むだ時
間と前記観測データ記憶部に記憶された観測データとに
基づいて、前記調節部を学習する学習部とを具備する。
請求項12記載の発明は、制御対象に入力される操作
量を変化させることで制御対象の制御量を制御する制御
装置において、前記制御対象で計測された制御量及び目
標制御量に基づき、調節信号を算出する調節部と、前記
調節部で算出された調節信号に基づき、前記制御対象に
操作量を出力する操作部と、過去に観測された制御量及
び操作量を有する観測データを記憶する観測データ記憶
部と、前記制御対象で計測された制御量と前記伝送部を
通して調節部に入力された制御量とに基づき、前記伝送
部による伝送むだ時間を計測する伝送むだ時間計測部
と、前記伝送むだ時間計測部により計測された伝送むだ
時間と前記操作部から前記制御対象へ操作量を入力して
から当該操作量による影響が制御量に現れるまでの制御
対象の応答時間と前記観測データ記憶部に記憶された観
測データとに基づいて、前記調節部を学習する学習部と
を具備する。
【0016】請求項13記載の発明は、請求項11また
は請求項12記載の制御装置において、調節部が、前記
制御対象で計測された制御量及び目標制御量に基づき、
仮想操作量を算出する仮想操作量算出部と、前記制御対
象で計測された制御量及び仮想操作量に基づき、前記応
答時間後の制御量を予測する制御量予測部と、前記制御
量予測部により予測された応答時間後の予測制御量及び
目標制御量に基づき、仮想操作量を修正する操作量修正
部と、前記制御量予測部による制御量の予測と前記操作
量修正部による仮想操作量の修正を少なくとも1回行っ
て得られた仮想操作量を調節信号として前記操作部に入
力する手段とを具備する。
は請求項12記載の制御装置において、調節部が、前記
制御対象で計測された制御量及び目標制御量に基づき、
仮想操作量を算出する仮想操作量算出部と、前記制御対
象で計測された制御量及び仮想操作量に基づき、前記応
答時間後の制御量を予測する制御量予測部と、前記制御
量予測部により予測された応答時間後の予測制御量及び
目標制御量に基づき、仮想操作量を修正する操作量修正
部と、前記制御量予測部による制御量の予測と前記操作
量修正部による仮想操作量の修正を少なくとも1回行っ
て得られた仮想操作量を調節信号として前記操作部に入
力する手段とを具備する。
【0017】請求項14記載の発明は、請求項13記載
の制御装置において、前記制御量予測部が神経回路モデ
ルから構成され、前記操作量修正部の計算が神経回路モ
デルの誤差逆伝播計算により実現され、前記学習部は、
前記応答時間と前記伝送むだ時間と前記観測データ記憶
部に記憶された観測データとに基づいて、学習データを
作成し、前記制御量予測部を構成する神経回路モデルの
学習を行う。
の制御装置において、前記制御量予測部が神経回路モデ
ルから構成され、前記操作量修正部の計算が神経回路モ
デルの誤差逆伝播計算により実現され、前記学習部は、
前記応答時間と前記伝送むだ時間と前記観測データ記憶
部に記憶された観測データとに基づいて、学習データを
作成し、前記制御量予測部を構成する神経回路モデルの
学習を行う。
【0018】請求項15記載の発明は、請求項14記載
の制御装置において、前記学習部は、前記観測データ記
憶部に記憶された観測データに基づいて、学習データを
作成する際に、前記伝送むだ時間前の制御量と当該時刻
の操作量とを有する観測データを入力信号とし、前記応
答時間後の制御量を教師信号にして学習を行う。
の制御装置において、前記学習部は、前記観測データ記
憶部に記憶された観測データに基づいて、学習データを
作成する際に、前記伝送むだ時間前の制御量と当該時刻
の操作量とを有する観測データを入力信号とし、前記応
答時間後の制御量を教師信号にして学習を行う。
【0019】請求項16記載の発明は、制御対象に入力
される操作量を変化させることで制御対象の制御量を制
御する制御装置において、前記制御対象で計測された制
御量及び目標制御量に基づき、調節信号を算出する調節
部と、前記調節部で算出された調節信号に基づき、前記
制御対象に操作量を出力する操作部と、過去に観測され
た制御量及び操作量を有する観測データを記憶する観測
データ記憶部と、前記操作部から前記制御対象へ操作量
を入力してから当該操作量による影響が制御量に現れる
までの制御対象の応答時間と前記制御対象で計測された
制御量が前記伝送部を通して調節部に入力されるまでの
伝送むだ時間と前記調節部で算出された調節信号が当該
操作部を通して操作量として実現されるまでの操作遅れ
時間と前記観測データ記憶部に記憶された観測データと
に基づいて、前記調節部を学習する学習部とを具備す
る。
される操作量を変化させることで制御対象の制御量を制
御する制御装置において、前記制御対象で計測された制
御量及び目標制御量に基づき、調節信号を算出する調節
部と、前記調節部で算出された調節信号に基づき、前記
制御対象に操作量を出力する操作部と、過去に観測され
た制御量及び操作量を有する観測データを記憶する観測
データ記憶部と、前記操作部から前記制御対象へ操作量
を入力してから当該操作量による影響が制御量に現れる
までの制御対象の応答時間と前記制御対象で計測された
制御量が前記伝送部を通して調節部に入力されるまでの
伝送むだ時間と前記調節部で算出された調節信号が当該
操作部を通して操作量として実現されるまでの操作遅れ
時間と前記観測データ記憶部に記憶された観測データと
に基づいて、前記調節部を学習する学習部とを具備す
る。
【0020】請求項17記載の発明は、制御対象に入力
される操作量を変化させることで制御対象の制御量を制
御する制御装置において、前記制御対象で計測された制
御量及び目標制御量に基づき、調節信号を算出する調節
部と、前記調節部で算出された調節信号に基づき、前記
制御対象に操作量を出力する操作部と、過去に観測され
た制御量及び操作量を有する観測データを記憶する観測
データ記憶部と、前記調節部で算出された調節信号と前
記操作部で出力された操作量に基づき、前記調節部で算
出された調節信号が当該操作部を通して操作量として実
現されるまでの操作遅れ時間を計測する操作遅れ時間計
測部と、前記制御対象で計測された制御量と前記伝送部
を通して調節部に入力された制御量とに基づき、前記伝
送部による伝送むだ時間を計測する伝送むだ時間計測部
と、前記操作遅れ時間計測部により計測された操作送れ
時間と前記伝送むだ時間計測部により計測された伝送む
だ時間と前記操作部から前記制御対象へ操作量を入力し
てから当該操作量による影響が制御量に現れるまでの制
御対象の応答時間と前記観測データ記憶部に記憶された
観測データとに基づいて、前記調節部を学習する学習部
とを具備する。
される操作量を変化させることで制御対象の制御量を制
御する制御装置において、前記制御対象で計測された制
御量及び目標制御量に基づき、調節信号を算出する調節
部と、前記調節部で算出された調節信号に基づき、前記
制御対象に操作量を出力する操作部と、過去に観測され
た制御量及び操作量を有する観測データを記憶する観測
データ記憶部と、前記調節部で算出された調節信号と前
記操作部で出力された操作量に基づき、前記調節部で算
出された調節信号が当該操作部を通して操作量として実
現されるまでの操作遅れ時間を計測する操作遅れ時間計
測部と、前記制御対象で計測された制御量と前記伝送部
を通して調節部に入力された制御量とに基づき、前記伝
送部による伝送むだ時間を計測する伝送むだ時間計測部
と、前記操作遅れ時間計測部により計測された操作送れ
時間と前記伝送むだ時間計測部により計測された伝送む
だ時間と前記操作部から前記制御対象へ操作量を入力し
てから当該操作量による影響が制御量に現れるまでの制
御対象の応答時間と前記観測データ記憶部に記憶された
観測データとに基づいて、前記調節部を学習する学習部
とを具備する。
【0021】請求項18記載の発明は、請求項16また
は請求項17記載の制御装置において、調節部が、前記
制御対象で計測された制御量及び目標制御量に基づき、
仮想操作量を算出する仮想操作量算出部と、前記制御対
象で計測された制御量及び仮想操作量に基づき、前記応
答時間後の制御量を予測する制御量予測部と、前記制御
量予測部により予測された応答時間後の予測制御量及び
目標制御量に基づき、仮想操作量を修正する操作量修正
部と、前記制御量予測部による制御量の予測と前記操作
量修正部による仮想操作量の修正を少なくとも1回行っ
て得られた仮想操作量を調節信号として前記操作部に入
力する手段とを具備する。
は請求項17記載の制御装置において、調節部が、前記
制御対象で計測された制御量及び目標制御量に基づき、
仮想操作量を算出する仮想操作量算出部と、前記制御対
象で計測された制御量及び仮想操作量に基づき、前記応
答時間後の制御量を予測する制御量予測部と、前記制御
量予測部により予測された応答時間後の予測制御量及び
目標制御量に基づき、仮想操作量を修正する操作量修正
部と、前記制御量予測部による制御量の予測と前記操作
量修正部による仮想操作量の修正を少なくとも1回行っ
て得られた仮想操作量を調節信号として前記操作部に入
力する手段とを具備する。
【0022】請求項19記載の発明は、請求項18記載
の制御装置において、前記制御量予測部が神経回路モデ
ルから構成され、前記操作量修正部の計算が神経回路モ
デルの誤差逆伝播計算により実現され、前記学習部は、
前記応答時間と前記操作遅れ時間と前記伝送むだ時間と
前記観測データ記憶部に記憶された観測データとに基づ
いて、学習データを作成し、前記制御量予測部を構成す
る神経回路モデルの学習を行う。
の制御装置において、前記制御量予測部が神経回路モデ
ルから構成され、前記操作量修正部の計算が神経回路モ
デルの誤差逆伝播計算により実現され、前記学習部は、
前記応答時間と前記操作遅れ時間と前記伝送むだ時間と
前記観測データ記憶部に記憶された観測データとに基づ
いて、学習データを作成し、前記制御量予測部を構成す
る神経回路モデルの学習を行う。
【0023】請求項20記載の発明は、請求項19記載
の制御装置において、前記学習部は、前記観測データ記
憶部に記憶された観測データに基づいて、学習データを
作成する際に、前記伝送むだ時間前の制御量と前記操作
遅れ時間後の操作量とを有する観測データを入力信号と
し、前記応答時間後の制御量を教師信号にして学習を行
う。
の制御装置において、前記学習部は、前記観測データ記
憶部に記憶された観測データに基づいて、学習データを
作成する際に、前記伝送むだ時間前の制御量と前記操作
遅れ時間後の操作量とを有する観測データを入力信号と
し、前記応答時間後の制御量を教師信号にして学習を行
う。
【0024】
【発明の実施の形態】図1は本発明の原理を説明するた
めのブロック図であり、時刻nΔtの信号の流れを表し
たものである。
めのブロック図であり、時刻nΔtの信号の流れを表し
たものである。
【0025】この制御装置は、図1の太線で示すように
制御対象1と調節部2と操作部3とでフィードバック制
御のループを構成する。また、学習部4と観測データ記
憶部5は、調節部2のパラメータを学習によって調節す
る。
制御対象1と調節部2と操作部3とでフィードバック制
御のループを構成する。また、学習部4と観測データ記
憶部5は、調節部2のパラメータを学習によって調節す
る。
【0026】制御対象1には単位時間Δt毎に操作量が
入力され、制御量が計測される。制御対象1で計測され
た制御量Xnは調節部2に入力される。調節部2は制御
対象1で計測された制御量Χnと予め設定された目標制
御量Χdに基づき、調節信号Cnを算出する。操作部3
では調節部2で算出された調節信号Cnに基づき操作量
Unが出力される。制御対象1には操作部3が出力した
操作量Unが入力され、その操作量Unが変化すること
で制御される。記号の添字のnは時刻を示し、例えばX
nは時刻(n−1)ΔtからnΔtの間に計測された制
御量を意味するが、この説明では簡単に時刻nΔtの制
御量ということにする。以後も同様の意味で添字を使用
する。
入力され、制御量が計測される。制御対象1で計測され
た制御量Xnは調節部2に入力される。調節部2は制御
対象1で計測された制御量Χnと予め設定された目標制
御量Χdに基づき、調節信号Cnを算出する。操作部3
では調節部2で算出された調節信号Cnに基づき操作量
Unが出力される。制御対象1には操作部3が出力した
操作量Unが入力され、その操作量Unが変化すること
で制御される。記号の添字のnは時刻を示し、例えばX
nは時刻(n−1)ΔtからnΔtの間に計測された制
御量を意味するが、この説明では簡単に時刻nΔtの制
御量ということにする。以後も同様の意味で添字を使用
する。
【0027】学習部4は制御対象1に操作量が入力され
てからその操作量による影響が制御量に現れるまでの応
答時間pΔtと、観測データ記憶部5に記憶された過去
l単位時間に計測された制御量(Xn-l ,Xn-l+1 ,・
・・,Xn-1 )と制御対象1に入力された操作量(U
n-l ,Un-l+1 ,・・・,Un-1 )(lは正の整数)か
らなる観測データに基づいて、調節部2のパラメータW
を学習によって調節し、調節部2へ出力する。これによ
り、本発明では、制御量に影響を与える制御対象1の特
性パラメータの緩やかな変化に対して、調節部2が適応
できる。上記応答時間pΔtは、制御対象1に操作量が
入力されてからその操作量による影響が制御量に現れる
までの時間を予め計測あるいは算出して設定しておいて
もよいし、後述するように制御対象1の変動に応じて動
的に設定するようにしてもよい。
てからその操作量による影響が制御量に現れるまでの応
答時間pΔtと、観測データ記憶部5に記憶された過去
l単位時間に計測された制御量(Xn-l ,Xn-l+1 ,・
・・,Xn-1 )と制御対象1に入力された操作量(U
n-l ,Un-l+1 ,・・・,Un-1 )(lは正の整数)か
らなる観測データに基づいて、調節部2のパラメータW
を学習によって調節し、調節部2へ出力する。これによ
り、本発明では、制御量に影響を与える制御対象1の特
性パラメータの緩やかな変化に対して、調節部2が適応
できる。上記応答時間pΔtは、制御対象1に操作量が
入力されてからその操作量による影響が制御量に現れる
までの時間を予め計測あるいは算出して設定しておいて
もよいし、後述するように制御対象1の変動に応じて動
的に設定するようにしてもよい。
【0028】図2は調節部2の構成の一例を示す図であ
る。
る。
【0029】図2に示すように、仮想操作量算出部6は
制御対象1で計測された制御量Xn及び目標制御量Xd
に基づき、仮想操作量U(^)nを算出する。制御量予
測部7は仮想操作量U(^)nと制御対象1で計測され
た制御量Χnに基づき、仮想操作量U(^)nが調節信
号として出力された場合のpΔt時間後の予測制御量X
(〜)n+p を算出する。pΔtは制御対象1の応答時間
である。操作量修正部8は、制御量予測部7で予測され
たpΔt時間後の予測制御量X(〜)n+p 及び目標制御
量Xdに基づき、予測制御量X(〜)n+p が目標制御量
Xdに近付くように仮想操作量U(^)nを修正する。
第1スイッチ9は制御対象1で制御量が計測されると下
側に閉じ、仮想操作量算出部6で算出された仮想操作量
U(^)nを制御量予測部7に入力し、その後、第1ス
イッチ9は次の計測時まで上側に閉じて、操作量修正部
8で修正された仮想操作量U(^)nを制御量予測部7
の入力にし、所定の回数、あるいは予測制御量X(〜)
n+p と目標制御量Χdの差が所定の値以下になるまで、
制御量予測部7による制御量の予測と操作量修正部8に
よる操作量の修正が繰り返される。制御量予測部7によ
る制御量の予測と操作量修正部8による操作量の修正が
所定の回数まで、あるいは予測制御量X(〜)n+p と目
標制御量Xdの差が所定の値以下になるまで繰り返され
ると、第2スイッチ10が閉じ、仮想操作量U(^)n
が調節信号Cnとして操作部3へ出力される。これによ
り、本発明では、制御量Xnに影響を与える制御対象1
の状態が急激に変化しても、操作量Unを正確に修正
し、制御量Xnを目標制御量Xdの近くに制御すること
ができる。
制御対象1で計測された制御量Xn及び目標制御量Xd
に基づき、仮想操作量U(^)nを算出する。制御量予
測部7は仮想操作量U(^)nと制御対象1で計測され
た制御量Χnに基づき、仮想操作量U(^)nが調節信
号として出力された場合のpΔt時間後の予測制御量X
(〜)n+p を算出する。pΔtは制御対象1の応答時間
である。操作量修正部8は、制御量予測部7で予測され
たpΔt時間後の予測制御量X(〜)n+p 及び目標制御
量Xdに基づき、予測制御量X(〜)n+p が目標制御量
Xdに近付くように仮想操作量U(^)nを修正する。
第1スイッチ9は制御対象1で制御量が計測されると下
側に閉じ、仮想操作量算出部6で算出された仮想操作量
U(^)nを制御量予測部7に入力し、その後、第1ス
イッチ9は次の計測時まで上側に閉じて、操作量修正部
8で修正された仮想操作量U(^)nを制御量予測部7
の入力にし、所定の回数、あるいは予測制御量X(〜)
n+p と目標制御量Χdの差が所定の値以下になるまで、
制御量予測部7による制御量の予測と操作量修正部8に
よる操作量の修正が繰り返される。制御量予測部7によ
る制御量の予測と操作量修正部8による操作量の修正が
所定の回数まで、あるいは予測制御量X(〜)n+p と目
標制御量Xdの差が所定の値以下になるまで繰り返され
ると、第2スイッチ10が閉じ、仮想操作量U(^)n
が調節信号Cnとして操作部3へ出力される。これによ
り、本発明では、制御量Xnに影響を与える制御対象1
の状態が急激に変化しても、操作量Unを正確に修正
し、制御量Xnを目標制御量Xdの近くに制御すること
ができる。
【0030】図3は制御量予測部7の構成の一例を示す
図である。ここでは、制御量予測部7は神経回路モデル
から構成されている。図3は時刻nΔtの仮想操作量U
(^)n=(U(^)1n,U(^)2n,・・・,U
(^)gn)T(gは操作量の次元数を表す)と制御量
Χn=(Χ1n,Χ2n,・・・,Χhn)T(hは制
御量の次元数を表す)が入力されると、pΔt時間後の
予測制御量X(〜)n+ p =(X(〜)1n+p ,X(〜)
2n+p ,・・・,Χ(〜)hn+p )Tが出力される神経
回路モデル11の制御時の予測計算の信号の流れを示し
ている。この入力信号から出力信号を求めるのは神経回
路モデル11の前向き計算によって行われる。神経回路
モデル11の前向き計算については後で説明する。
図である。ここでは、制御量予測部7は神経回路モデル
から構成されている。図3は時刻nΔtの仮想操作量U
(^)n=(U(^)1n,U(^)2n,・・・,U
(^)gn)T(gは操作量の次元数を表す)と制御量
Χn=(Χ1n,Χ2n,・・・,Χhn)T(hは制
御量の次元数を表す)が入力されると、pΔt時間後の
予測制御量X(〜)n+ p =(X(〜)1n+p ,X(〜)
2n+p ,・・・,Χ(〜)hn+p )Tが出力される神経
回路モデル11の制御時の予測計算の信号の流れを示し
ている。この入力信号から出力信号を求めるのは神経回
路モデル11の前向き計算によって行われる。神経回路
モデル11の前向き計算については後で説明する。
【0031】制御量予測部7が神経回路モデル11から
構成される場合には、操作量修正部8は神経回路モデル
11の誤差逆伝播計算によって仮想操作量U(^)nの
修正量を求め、仮想操作量を修正する。神経回路モデル
11の誤差逆伝播計算については前向き計算とともに後
で説明する。
構成される場合には、操作量修正部8は神経回路モデル
11の誤差逆伝播計算によって仮想操作量U(^)nの
修正量を求め、仮想操作量を修正する。神経回路モデル
11の誤差逆伝播計算については前向き計算とともに後
で説明する。
【0032】ここで、制御量予測部7が神経回路モデル
11から構成される場合には、学習部4は以下のように
構成される。
11から構成される場合には、学習部4は以下のように
構成される。
【0033】すなわち、学習部4は、制御対象1に対す
る操作量の影響が制御量に現れるまでの応答時間pΔt
と、観測データ記憶部5に記憶された過去の制御量及び
操作量からなる観測データとに基づいて学習データを作
成し、制御量予測部7を構成する神経回路モデル11の
学習を行う。神経回路モデル11が図3に示したように
現時刻の制御量と仮想操作量を入力すると応答時間pΔ
t後の制御量を出力する構成の場合、入力信号(Us,
Xs)、教師信号(Xs+p )(s=n−l,n−l+
1,・・・,n−p−1)の学習データにより学習を行
う。
る操作量の影響が制御量に現れるまでの応答時間pΔt
と、観測データ記憶部5に記憶された過去の制御量及び
操作量からなる観測データとに基づいて学習データを作
成し、制御量予測部7を構成する神経回路モデル11の
学習を行う。神経回路モデル11が図3に示したように
現時刻の制御量と仮想操作量を入力すると応答時間pΔ
t後の制御量を出力する構成の場合、入力信号(Us,
Xs)、教師信号(Xs+p )(s=n−l,n−l+
1,・・・,n−p−1)の学習データにより学習を行
う。
【0034】次に、神経回路モデルの前向き計算、誤差
逆伝播計算、学習計算について説明する。
逆伝播計算、学習計算について説明する。
【0035】前向き計算とは神経回路モデルに入力信号
が与えられた時に、出力信号を求める計算である。ここ
では図3に示した3層型神経回路モデルに基づいて前向
き計算を説明する。図中の円がユニットと呼ばれる神経
細胞モデルで、ユニット間を結び付けている線分はユニ
ット間の信号を伝達する結合である。ユニットは左から
入力層、中間層、出力層の3層に分かれて並べられてい
る。入力層のユニットと中間層のユニットの間、中間層
のユニットと出力層のユニットの間に結合が張られてい
る。ユニット間の結合は信号伝達に方向性を持ち、前向
き計算では入力層ユニットから中間層ユニットヘ、中間
層ユニットから出力層ユニットへの一方向にだけ信号は
伝達される。
が与えられた時に、出力信号を求める計算である。ここ
では図3に示した3層型神経回路モデルに基づいて前向
き計算を説明する。図中の円がユニットと呼ばれる神経
細胞モデルで、ユニット間を結び付けている線分はユニ
ット間の信号を伝達する結合である。ユニットは左から
入力層、中間層、出力層の3層に分かれて並べられてい
る。入力層のユニットと中間層のユニットの間、中間層
のユニットと出力層のユニットの間に結合が張られてい
る。ユニット間の結合は信号伝達に方向性を持ち、前向
き計算では入力層ユニットから中間層ユニットヘ、中間
層ユニットから出力層ユニットへの一方向にだけ信号は
伝達される。
【0036】入力層のユニットには、外部からの入力信
号が1ユニットに1信号ずつ入力される。図3では、仮
想操作量U(^)n=(U(^)1n,U(^)2n,
…,U(^)gn)T、制御量Xn=(X1n,X
2n,…,Xhn)Tが1ユニットに1信号ずつ入力さ
れている。xiiを入力層第i番ユニットの入力値とす
ると、
号が1ユニットに1信号ずつ入力される。図3では、仮
想操作量U(^)n=(U(^)1n,U(^)2n,
…,U(^)gn)T、制御量Xn=(X1n,X
2n,…,Xhn)Tが1ユニットに1信号ずつ入力さ
れている。xiiを入力層第i番ユニットの入力値とす
ると、
【数1】 入力層ユニットの入出力関数は恒等関数とする。入力層
ユニットの出力値yii(i=1,2,…,Νi)は次
のように表される。
ユニットの出力値yii(i=1,2,…,Νi)は次
のように表される。
【0037】
【数2】 Νiは入力層ユニット数である(Νi=g+h)。
【0038】次に、中間層ユニットの入力値は入力層ユ
ニットの出力値を入力層一中間層間の結合荷重値で重み
付けした合計から中間層ユニットの閾値を引いた値にな
る。
ニットの出力値を入力層一中間層間の結合荷重値で重み
付けした合計から中間層ユニットの閾値を引いた値にな
る。
【数3】 xhjは中間層第j番ユニットの入力値、w1j,i は入
力層第i番ユニット−中間層第j番ユニット間の結合荷
重値、thhjは中間層第j番ユニットの閾値、Nhは
中間層のユニット数を表す。
力層第i番ユニット−中間層第j番ユニット間の結合荷
重値、thhjは中間層第j番ユニットの閾値、Nhは
中間層のユニット数を表す。
【0039】中間層ユニットの入出力関数をシグモイド
型関数
型関数
【数4】 とすると、中間層第j番ユニットの出力値yhjは入力
値xhj,を使い、
値xhj,を使い、
【数5】 と表せる。
【0040】出力層ユニットの入力値は中間層ユニット
の出力値を中間層一出力層間の結合荷重値で重み付けし
た合計から出力層ユニットの閾値を引いた値になる。
の出力値を中間層一出力層間の結合荷重値で重み付けし
た合計から出力層ユニットの閾値を引いた値になる。
【0041】
【数6】 xokは出力層第k番ユニットの入力値、w2k,j は中
間層第j番ユニット−出力層第k番ユニット間の結合荷
重値、thokは出力層第k番ユニットの閾値、Noは
出力層のユニット数を表す。出力層ユニットの入出力関
数は恒等関数とする。
間層第j番ユニット−出力層第k番ユニット間の結合荷
重値、thokは出力層第k番ユニットの閾値、Noは
出力層のユニット数を表す。出力層ユニットの入出力関
数は恒等関数とする。
【0042】
【数7】 この出力層ユニットの出力信号が外部に出力される。図
3では時刻(n+p)Δtの制御量の予測値X(〜)
n+p =(X1(〜)n+p ,X(〜)2n+p …,X(〜)
hn+p )Tになる。
3では時刻(n+p)Δtの制御量の予測値X(〜)
n+p =(X1(〜)n+p ,X(〜)2n+p …,X(〜)
hn+p )Tになる。
【0043】
【数8】 以上が神経回路モデル11の前向き計算の計算式であ
る。
る。
【0044】次に、神経回路モデルの誤差逆伝播計算に
ついて説明する。
ついて説明する。
【0045】制御量予測部7によって予測された制御量
X(〜)n+p と、目標制御量Xdが操作量修正部8に入
力されると、操作量修正部8では、仮想操作量U(^)
nの修正量が計算され、仮想操作量U(^)nが修正さ
れる。制御量予測部7が神経回路モデル11から構成さ
れる場合には、仮想操作量U(^)nの修正量は神経回
路モデル11の誤差逆伝播計算によって計算できる。
X(〜)n+p と、目標制御量Xdが操作量修正部8に入
力されると、操作量修正部8では、仮想操作量U(^)
nの修正量が計算され、仮想操作量U(^)nが修正さ
れる。制御量予測部7が神経回路モデル11から構成さ
れる場合には、仮想操作量U(^)nの修正量は神経回
路モデル11の誤差逆伝播計算によって計算できる。
【0046】神経回路モデルの出力信号と望ましい出力
信号から誤差関数を定義する。図3の場合には、制御量
予測部7の神経回路モデル11の前向き計算によって計
算された予測制御量X(〜)n+p と、目標制御量X
(〜)d=(Xld,X2d,…,Xhd)Tとの誤差
から誤差関数Eを次のように定義する。
信号から誤差関数を定義する。図3の場合には、制御量
予測部7の神経回路モデル11の前向き計算によって計
算された予測制御量X(〜)n+p と、目標制御量X
(〜)d=(Xld,X2d,…,Xhd)Tとの誤差
から誤差関数Eを次のように定義する。
【0047】
【数9】 次に、この誤差関数を減少させるユニット出力値の修正
量を、出力層から入力層へ層毎に順に求めていき、最終
的には入力信号の修正量を求める。まず、出力層ユニッ
トの出力値の修正量は、正の定数ηを使って
量を、出力層から入力層へ層毎に順に求めていき、最終
的には入力信号の修正量を求める。まず、出力層ユニッ
トの出力値の修正量は、正の定数ηを使って
【数10】 と計算される。
【0048】次に、中間層ユニットの出力値の修正量
は、出力層ユニットの修正量を使って次のように表され
る。
は、出力層ユニットの修正量を使って次のように表され
る。
【0049】
【数11】 同様に入力層ユニットの出力値の修正量は、中間層ユニ
ットの修正量を使って、
ットの修正量を使って、
【数12】 と表される。f′(x)はシグモイド関数f(x)の導
関数を表していて、具体的には、
関数を表していて、具体的には、
【数13】 と表せる。入力層ユニットの入出力関数は恒等関数であ
るから、出力値の修正量はそのまま入力信号の修正量に
なる。
るから、出力値の修正量はそのまま入力信号の修正量に
なる。
【0050】神経回路モデルが図3の場合には、入力信
号である仮想操作量U(^)nの修正量ΔUnは、
号である仮想操作量U(^)nの修正量ΔUnは、
【数14】 と表現される。この修正量が仮想操作量U(^)nに加
算される。
算される。
【0051】以上が誤差逆伝播計算と、この計算によっ
て実現される仮想操作量の修正である。
て実現される仮想操作量の修正である。
【0052】次に、神経回路モデルの学習計算について
図4を基に説明する。
図4を基に説明する。
【0053】図4において、5は観測データ記憶部、1
1は神経回路モデル、12は減算器、13は誤差逆伝播
学習器、14は神経回路モデル11の入力層ユニットの
出力が誤差逆伝播学習器13に入力されることを示す矢
印、15は神経回路モデル11の中間層ユニットの出力
が誤差逆伝播学習器13に入力されることを示す矢印、
16は神経回路モデル11の中間層一出力層間の結合荷
重値が誤差逆伝播学習器13に入力されることを示す矢
印、17は誤差逆伝播学習器13で計算された入力層一
中間層間の結合荷重値と中間層ユニットの閾値の修正量
を各結合荷重、中間層ユニットに出力し、各結合荷重値
と閾値の修正を行うことを示す矢印、18は誤差逆伝播
学習器13で計算された中間層一出力層間の結合荷重値
と出力層ユニットの閾値の修正量を各結合荷重、出力層
ユニットに出力し、各結合荷重値と閾値の修正を行うこ
とを示す矢印を表す。
1は神経回路モデル、12は減算器、13は誤差逆伝播
学習器、14は神経回路モデル11の入力層ユニットの
出力が誤差逆伝播学習器13に入力されることを示す矢
印、15は神経回路モデル11の中間層ユニットの出力
が誤差逆伝播学習器13に入力されることを示す矢印、
16は神経回路モデル11の中間層一出力層間の結合荷
重値が誤差逆伝播学習器13に入力されることを示す矢
印、17は誤差逆伝播学習器13で計算された入力層一
中間層間の結合荷重値と中間層ユニットの閾値の修正量
を各結合荷重、中間層ユニットに出力し、各結合荷重値
と閾値の修正を行うことを示す矢印、18は誤差逆伝播
学習器13で計算された中間層一出力層間の結合荷重値
と出力層ユニットの閾値の修正量を各結合荷重、出力層
ユニットに出力し、各結合荷重値と閾値の修正を行うこ
とを示す矢印を表す。
【0054】過去の時刻sΔt(s=n−l,n−l+
1,…,n−p−1)について、時刻sΔtの操作量U
sと制御量Xsが入力信号として、観測データ記憶部5
から神経回路モデル11に出力される。神経回路モデル
11では時刻sΔtの操作量Usと制御量Xsを入力信
号として前向き計算を行い、出力信号X(〜)s+p を出
力する。減算器12では観測データ記憶部5から教師信
号として出力された応答時間後の制御量Χs+p と神経回
路モデル11の出力信号X(〜)s+p との差分Xs+p −
Χ(〜)s+p が計算され、誤差逆伝播学習器13に入力
される。誤差逆伝播学習器13には差分の他に、神経回
路モデルの入力層ユニットの各出力値、中間層ユニット
の各出力値、中間層一出力層間の各結合荷重値が入力さ
れ、結合荷重値、閾値の修正量が計算される。
1,…,n−p−1)について、時刻sΔtの操作量U
sと制御量Xsが入力信号として、観測データ記憶部5
から神経回路モデル11に出力される。神経回路モデル
11では時刻sΔtの操作量Usと制御量Xsを入力信
号として前向き計算を行い、出力信号X(〜)s+p を出
力する。減算器12では観測データ記憶部5から教師信
号として出力された応答時間後の制御量Χs+p と神経回
路モデル11の出力信号X(〜)s+p との差分Xs+p −
Χ(〜)s+p が計算され、誤差逆伝播学習器13に入力
される。誤差逆伝播学習器13には差分の他に、神経回
路モデルの入力層ユニットの各出力値、中間層ユニット
の各出力値、中間層一出力層間の各結合荷重値が入力さ
れ、結合荷重値、閾値の修正量が計算される。
【0055】誤差逆伝播学習器13では、教師信号X
s+p と神経回路モデル11の出力信号Xs+p との差分か
ら誤差関数Eが次のように定義される。
s+p と神経回路モデル11の出力信号Xs+p との差分か
ら誤差関数Eが次のように定義される。
【0056】
【数15】 誤差逆伝播学習法に従つて、神経回路モデル11の結合
荷重値、閾値の修正量は次のように計算される。
荷重値、閾値の修正量は次のように計算される。
【0057】
【数16】 Δw2k,j は中間層第j番ユニット−出力層第k番ユニ
ット間の結合荷重値w2k,j の修正量、Δthokは出
力層第k番ユニットの閾値thokの修正量、Δw1
j,i は入力層第i番ユニット−中間層第j番ユニット間
の結合荷重値w1j,i の修正量、Δthhjは中間層第
j番ユニットの閾値thhjの修正量、εは学習定数で
ある。yos k時刻sΔtのデータが入力された時の出
力層第k番ユニットの出力値、xos k時刻sΔtのデ
ータが入力された時の出力層第k番ユニットの入力値、
yhs jは時刻sΔtのデータが入力された時の中間層
第j番ユニットの出力値、xhs kは時刻sΔtのデー
タが入力された時の中間層第j番ユニットの入力値、y
is iは時刻sΔtのデータが入力された時の中間層第
i番ユニットの出力値である。これらの修正量を基に、
結合荷重値、閾値が修正される。
ット間の結合荷重値w2k,j の修正量、Δthokは出
力層第k番ユニットの閾値thokの修正量、Δw1
j,i は入力層第i番ユニット−中間層第j番ユニット間
の結合荷重値w1j,i の修正量、Δthhjは中間層第
j番ユニットの閾値thhjの修正量、εは学習定数で
ある。yos k時刻sΔtのデータが入力された時の出
力層第k番ユニットの出力値、xos k時刻sΔtのデ
ータが入力された時の出力層第k番ユニットの入力値、
yhs jは時刻sΔtのデータが入力された時の中間層
第j番ユニットの出力値、xhs kは時刻sΔtのデー
タが入力された時の中間層第j番ユニットの入力値、y
is iは時刻sΔtのデータが入力された時の中間層第
i番ユニットの出力値である。これらの修正量を基に、
結合荷重値、閾値が修正される。
【0058】次に、本発明の他の実施の形態を図5に基
づき説明する。
づき説明する。
【0059】図5に示す制御装置では、図1に示した制
御装置に応答時間算出部19が付加されている。応答時
間算出部19は、制御対象1の応答時間を算出する。応
答時間算出部19は過去m単位時間に制御対象1に入力
された操作量の時系列U=(Un-m ,Un-m+1 ,…,U
n-1 )と制御対象1で計測された制御量の時系列X=
(Xn-m ,Xn-m+1 ,…,Xn-1 )に基づき、制御対象
1に入力された操作量による影響が制御量に現れるまで
の制御対象1の応答時間を計算し、学習部4に出力する
(mは正の整数である)。
御装置に応答時間算出部19が付加されている。応答時
間算出部19は、制御対象1の応答時間を算出する。応
答時間算出部19は過去m単位時間に制御対象1に入力
された操作量の時系列U=(Un-m ,Un-m+1 ,…,U
n-1 )と制御対象1で計測された制御量の時系列X=
(Xn-m ,Xn-m+1 ,…,Xn-1 )に基づき、制御対象
1に入力された操作量による影響が制御量に現れるまで
の制御対象1の応答時間を計算し、学習部4に出力する
(mは正の整数である)。
【0060】次に、本発明の他の実施の形態を図6に基
づき説明する。
づき説明する。
【0061】図6に示す制御装置では、操作部2が時間
遅れを持つことを考慮したものである。同図に示すよう
に、制御対象1で計測された制御量Xnは調節部2に入
力される。調節部2は制御対象1で計測された制御量Χ
nと目標制御量Xdに基づき、調節信号Cnを算出す
る。操作部3では調節部2で算出された調節信号Cnに
基づき操作量Unが出力されるが、操作部3は操作遅れ
時間を持ち、入力された調節信号は操作遅れ時間遅れて
操作量として出力される。制御対象1には操作部3が出
力した操作量Unが入力され、その操作量Unが変化す
ることで制御される。 学習部4は制御対象1に操作量
が入力されてからその操作量による影響が制御量に現れ
るまでの応答時間pΔtと、調節部2で算出された調節
信号が操作部3を通して操作量として実現されるまでの
操作遅れ時間qΔtと、観測データ記憶部5に記憶され
た過去l単位時間に計測された制御量(Xn-l ,X
n-l+1 ,…,Xn-1 )と制御対象1に入力された操作量
(Un-l ,Un-l+1 ,…,Un-1)(lは正の整数)か
らなる観測データに基づいて、調節部2のパラメータW
を学習によって調節し、調節部2へ出力する。上記操作
遅れ時間qΔtは、応答時間pΔtと同様に、調節部2
で算出された調節信号が操作部3を通して操作量として
実現されるまでの時間を予め計測あるいは算出して設定
しておいてもよいし、後述するように調節部2の変動に
応じて動的に設定するようにしてもよい。
遅れを持つことを考慮したものである。同図に示すよう
に、制御対象1で計測された制御量Xnは調節部2に入
力される。調節部2は制御対象1で計測された制御量Χ
nと目標制御量Xdに基づき、調節信号Cnを算出す
る。操作部3では調節部2で算出された調節信号Cnに
基づき操作量Unが出力されるが、操作部3は操作遅れ
時間を持ち、入力された調節信号は操作遅れ時間遅れて
操作量として出力される。制御対象1には操作部3が出
力した操作量Unが入力され、その操作量Unが変化す
ることで制御される。 学習部4は制御対象1に操作量
が入力されてからその操作量による影響が制御量に現れ
るまでの応答時間pΔtと、調節部2で算出された調節
信号が操作部3を通して操作量として実現されるまでの
操作遅れ時間qΔtと、観測データ記憶部5に記憶され
た過去l単位時間に計測された制御量(Xn-l ,X
n-l+1 ,…,Xn-1 )と制御対象1に入力された操作量
(Un-l ,Un-l+1 ,…,Un-1)(lは正の整数)か
らなる観測データに基づいて、調節部2のパラメータW
を学習によって調節し、調節部2へ出力する。上記操作
遅れ時間qΔtは、応答時間pΔtと同様に、調節部2
で算出された調節信号が操作部3を通して操作量として
実現されるまでの時間を予め計測あるいは算出して設定
しておいてもよいし、後述するように調節部2の変動に
応じて動的に設定するようにしてもよい。
【0062】図7は図6に示した調節部2の構成の一例
を示す図である。
を示す図である。
【0063】図7に示すように、仮想操作量算出部6は
制御対象1で計測された制御量Xn及び目標制御量Xd
に基づき、仮想操作量U(^)nを算出する。制御量予
測部7は仮想操作量U(^)nと制御対象1で計測され
た制御量Xnに基づき、仮想操作量U(^)nが調節信
号として出力された場合のpΔt時間後の予測制御量Χ
(〜)n+p を算出する。pΔtは制御対象1の応答時間
である。操作量修正部8は、制御量予測部7で予測され
たpΔt時間後の制御量Xn+p 及び目標制御量Xdに基
づき、予測制御量X(〜)n+p が目標制御量Xdに近付
くように仮想操作量U(^)nを修正する。第1スイッ
チ9は制御対象1で制御量が計測されると下側に閉じ、
仮想操作量算出部6で算出された仮想操作量U(^)n
を制御量予測部7に入力し、その後、第1スイッチ9は
次の計測時まで上側に閉じて、操作量修正部8で修正さ
れた仮想操作量U(^)nを制御量予測部7の入力に
し、所定の回数、あるいは予測制御量X(〜)n+p と目
標制御量Xdの差が所定の値以下になるまで、制御量予
測部7による制御量の予測と操作量修正部8による操作
量の修正が繰り返される。制御量予測部7による制御量
の予測と操作量修正部8による操作量の修正が所定の回
数まで、あるいは予測制御量Χ(〜)n+p と目標制御量
Xdの差が所定の値以下になるまで繰り返されると、第
2スイッチ10が閉じ、仮想操作量U(^)nが調節信
号Cnとして操作部3へ出力される。
制御対象1で計測された制御量Xn及び目標制御量Xd
に基づき、仮想操作量U(^)nを算出する。制御量予
測部7は仮想操作量U(^)nと制御対象1で計測され
た制御量Xnに基づき、仮想操作量U(^)nが調節信
号として出力された場合のpΔt時間後の予測制御量Χ
(〜)n+p を算出する。pΔtは制御対象1の応答時間
である。操作量修正部8は、制御量予測部7で予測され
たpΔt時間後の制御量Xn+p 及び目標制御量Xdに基
づき、予測制御量X(〜)n+p が目標制御量Xdに近付
くように仮想操作量U(^)nを修正する。第1スイッ
チ9は制御対象1で制御量が計測されると下側に閉じ、
仮想操作量算出部6で算出された仮想操作量U(^)n
を制御量予測部7に入力し、その後、第1スイッチ9は
次の計測時まで上側に閉じて、操作量修正部8で修正さ
れた仮想操作量U(^)nを制御量予測部7の入力に
し、所定の回数、あるいは予測制御量X(〜)n+p と目
標制御量Xdの差が所定の値以下になるまで、制御量予
測部7による制御量の予測と操作量修正部8による操作
量の修正が繰り返される。制御量予測部7による制御量
の予測と操作量修正部8による操作量の修正が所定の回
数まで、あるいは予測制御量Χ(〜)n+p と目標制御量
Xdの差が所定の値以下になるまで繰り返されると、第
2スイッチ10が閉じ、仮想操作量U(^)nが調節信
号Cnとして操作部3へ出力される。
【0064】図8は図7に示した制御量予測部7の構成
の一例を示す図である。ここでも、制御量予測部7は神
経回路モデルから構成されている。図8では時刻nΔt
の仮想操作量U(^)n=(U(^)1n,U(^)2
n,…,U(^)gn)T(gは操作量の次元数を表
す)と制御量Χn=(Χ1n,Χ2n,…,Χhn)T
(hは制御量の次元数を表す)が入力されると、応答時
間pΔt後の予測制御量X(〜)n+p =(X(〜)1
n+p ,Χ(〜)2n+p ,…,Χ(〜)hn+p )Tが出力
される神経回路モデル11の制御時の予測計算の信号の
流れを示している。この入力信号から出力信号を求める
のは先に示した神経回路モデル11の前向き計算によっ
て行われる。
の一例を示す図である。ここでも、制御量予測部7は神
経回路モデルから構成されている。図8では時刻nΔt
の仮想操作量U(^)n=(U(^)1n,U(^)2
n,…,U(^)gn)T(gは操作量の次元数を表
す)と制御量Χn=(Χ1n,Χ2n,…,Χhn)T
(hは制御量の次元数を表す)が入力されると、応答時
間pΔt後の予測制御量X(〜)n+p =(X(〜)1
n+p ,Χ(〜)2n+p ,…,Χ(〜)hn+p )Tが出力
される神経回路モデル11の制御時の予測計算の信号の
流れを示している。この入力信号から出力信号を求める
のは先に示した神経回路モデル11の前向き計算によっ
て行われる。
【0065】制御量予測部7が神経回路モデル11から
構成される場合には、操作量修正部8は先に示した神経
回路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量が修正される。
構成される場合には、操作量修正部8は先に示した神経
回路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量が修正される。
【0066】ここで、制御量予測部7が神経回路モデル
11から構成される場合には、学習部4は以下のように
構成される。
11から構成される場合には、学習部4は以下のように
構成される。
【0067】すなわち、学習部4は、制御対象1の応答
時間pΔtと、操作遅れ時間qΔtと、観測データ記憶
部5に記憶された過去の制御量と操作量からなる観測デ
ータに基づいて学習データを作成し、制御量予測部7を
構成する神経回路モデル11の学習を行う。
時間pΔtと、操作遅れ時間qΔtと、観測データ記憶
部5に記憶された過去の制御量と操作量からなる観測デ
ータに基づいて学習データを作成し、制御量予測部7を
構成する神経回路モデル11の学習を行う。
【0068】観測データの時刻sΔtの操作量Usと制
御量Χsは時刻sΔtに制御対象1に入力された操作量
と時刻sΔtに制御対象1で計測された制御量である。
従って、操作部3が時間遅れを持つ場合に、入力信号
(Us,Xs)、教師信号(Xs+p )(s=n−l,n
−l+1,…,n−p−1)を学習データとして学習を
行うと、神経回路モデル11は時刻sΔtに計測された
制御量Xsと時刻sΔtに制御対象1に入力された操作
量UsからpΔt時間後の制御量Xs+p を出力するよう
になる。この神経回路モデル11を制御量予測部7とし
て制御を行うと、調節部2では予測制御量X(〜)n+p
が目標制御量Xdに近付くための操作量Unの値が求め
られてしまい、実際にその値が制御対象1に入力される
のは操作遅れ時間qΔt後になるので、正確な制御がで
きなくなる。
御量Χsは時刻sΔtに制御対象1に入力された操作量
と時刻sΔtに制御対象1で計測された制御量である。
従って、操作部3が時間遅れを持つ場合に、入力信号
(Us,Xs)、教師信号(Xs+p )(s=n−l,n
−l+1,…,n−p−1)を学習データとして学習を
行うと、神経回路モデル11は時刻sΔtに計測された
制御量Xsと時刻sΔtに制御対象1に入力された操作
量UsからpΔt時間後の制御量Xs+p を出力するよう
になる。この神経回路モデル11を制御量予測部7とし
て制御を行うと、調節部2では予測制御量X(〜)n+p
が目標制御量Xdに近付くための操作量Unの値が求め
られてしまい、実際にその値が制御対象1に入力される
のは操作遅れ時間qΔt後になるので、正確な制御がで
きなくなる。
【0069】そこで、本発明では、神経回路モデル11
に、制御対象1で計測された制御量Xnと調節信号Cn
を入力すると、pΔt時間後の予測制御量X(〜)n+p
が出力されるように、神経回路モデル11の学習を行う
ために、図9に示すように、制御量Xs=(X1s,X
2s,…,Xhs)と操作遅れ時間qΔt後に制御対象
1に入力される操作量Us+q =(U1s+q ,U2s+q ,
…,Ugs+q )を入力信号、応答時間pΔt後の制御量
Χs+p =(Χ1s+p ,Χ2s+p ,…Xhs+p )を教師信
号にした学習データを作成する(s=n−l,n−l+
1,…,n−p−1)。この学習データで学習ができれ
ば、制御時に調節部2で求められた調節信号Cnは、操
作遅れ時間qΔt後に制御対象1に入力された時に応答
時間pΔt後の制御量Xn+p が目標制御量Xdに近付く
操作量なので、正確な制御ができる。
に、制御対象1で計測された制御量Xnと調節信号Cn
を入力すると、pΔt時間後の予測制御量X(〜)n+p
が出力されるように、神経回路モデル11の学習を行う
ために、図9に示すように、制御量Xs=(X1s,X
2s,…,Xhs)と操作遅れ時間qΔt後に制御対象
1に入力される操作量Us+q =(U1s+q ,U2s+q ,
…,Ugs+q )を入力信号、応答時間pΔt後の制御量
Χs+p =(Χ1s+p ,Χ2s+p ,…Xhs+p )を教師信
号にした学習データを作成する(s=n−l,n−l+
1,…,n−p−1)。この学習データで学習ができれ
ば、制御時に調節部2で求められた調節信号Cnは、操
作遅れ時間qΔt後に制御対象1に入力された時に応答
時間pΔt後の制御量Xn+p が目標制御量Xdに近付く
操作量なので、正確な制御ができる。
【0070】次に、本発明の他の実施の形態を図10に
基づき説明する。
基づき説明する。
【0071】図10に示す制御装置では、図6に示した
制御装置に操作遅れ時間計測部20が付加されている。
操作遅れ時間計測部20は過去m単位時間に調節部2で
算出された調節信号の時系列C=(Cn-m ,Cn-m+1 ,
…,Cn-1 )と、操作部3から出力された操作量の時系
列U=(Un-m ,Un-m+1 ,…,Un-1 )に基づき、調
節信号が操作部3に入力されて操作量として出力される
までの操作遅れ時間qΔtを計算し、学習部4に出力す
る。mは正の整数である。操作遅れ時間計測部20が付
加されることにより、操作部3の特性変化によって操作
遅れ時間qΔtが変化する場合でも、操作遅れ時間計測
部20によって変化後の操作遅れ時間qΔtが計算さ
れ、学習部4に出力される。学習部4では操作遅れ時間
計測部20から入力された操作遅れ時間qΔtに従い、
学習データを作成し、学習を行うので、操作遅れ時間が
変化する場合でも正しく制御し続けることができる。
制御装置に操作遅れ時間計測部20が付加されている。
操作遅れ時間計測部20は過去m単位時間に調節部2で
算出された調節信号の時系列C=(Cn-m ,Cn-m+1 ,
…,Cn-1 )と、操作部3から出力された操作量の時系
列U=(Un-m ,Un-m+1 ,…,Un-1 )に基づき、調
節信号が操作部3に入力されて操作量として出力される
までの操作遅れ時間qΔtを計算し、学習部4に出力す
る。mは正の整数である。操作遅れ時間計測部20が付
加されることにより、操作部3の特性変化によって操作
遅れ時間qΔtが変化する場合でも、操作遅れ時間計測
部20によって変化後の操作遅れ時間qΔtが計算さ
れ、学習部4に出力される。学習部4では操作遅れ時間
計測部20から入力された操作遅れ時間qΔtに従い、
学習データを作成し、学習を行うので、操作遅れ時間が
変化する場合でも正しく制御し続けることができる。
【0072】次に、本発明の他の実施の形態を図11に
基づき説明する。
基づき説明する。
【0073】図11に示す制御装置では、制御対象1で
計測された制御量を調節部2に伝送するのに、むだ時間
を持つ伝送部が存在することを考慮したものである。
計測された制御量を調節部2に伝送するのに、むだ時間
を持つ伝送部が存在することを考慮したものである。
【0074】同図に示すように、時刻nΔtに制御対象
1で計測された制御量Χnは、伝送部21を通して調節
部2に入力されるが、伝送部21は伝送むだ時間を持
ち、制御対象1で計測された制御量Χnは伝送むだ時間
遅れて調節部2に入力される。時刻nΔtに調節部2に
入力される制御量をX′nと表す。調節部2は制御量
X′nと目標制御量Xdに基づき、調節信号Cnを算出
する。操作部3では調節部2で算出された調節信号Cn
に基づき操作量Unが出力される。制御対象1には操作
部3が出力した操作量Unが入力され、その操作量Un
が変化することで制御される。
1で計測された制御量Χnは、伝送部21を通して調節
部2に入力されるが、伝送部21は伝送むだ時間を持
ち、制御対象1で計測された制御量Χnは伝送むだ時間
遅れて調節部2に入力される。時刻nΔtに調節部2に
入力される制御量をX′nと表す。調節部2は制御量
X′nと目標制御量Xdに基づき、調節信号Cnを算出
する。操作部3では調節部2で算出された調節信号Cn
に基づき操作量Unが出力される。制御対象1には操作
部3が出力した操作量Unが入力され、その操作量Un
が変化することで制御される。
【0075】学習部4は制御対象1に操作量が入力され
てからその操作量による影響が制御量に現れるまでの応
答時間pΔtと、制御対象1で計測された制御量Xnが
伝送部21を通して調節部2に入力されるまでの伝送む
だ時間rΔtと、観測データ記憶部5に記憶された過去
l単位時間に計測された制御量(Χn-l ,Xn-l+1 ,
…,Xn-1 )と制御対象1に入力された操作量
(Un-l ,Un-l+1 ,…,Un-1)からなる観測データ
に基づいて、調節部2のパラメータWを学習によって調
節し、調節部2へ出力する。上記伝送むだ時間は、操作
遅れ時間qΔtや応答時間pΔtと同様に、制御対象1
で計測された制御量Xnが伝送部21を通して調節部2
に入力されるまでの時間を予め計測あるいは算出して設
定しておいてもよいし、後述するように伝送部21の変
動に応じて動的に設定するようにしてもよい。
てからその操作量による影響が制御量に現れるまでの応
答時間pΔtと、制御対象1で計測された制御量Xnが
伝送部21を通して調節部2に入力されるまでの伝送む
だ時間rΔtと、観測データ記憶部5に記憶された過去
l単位時間に計測された制御量(Χn-l ,Xn-l+1 ,
…,Xn-1 )と制御対象1に入力された操作量
(Un-l ,Un-l+1 ,…,Un-1)からなる観測データ
に基づいて、調節部2のパラメータWを学習によって調
節し、調節部2へ出力する。上記伝送むだ時間は、操作
遅れ時間qΔtや応答時間pΔtと同様に、制御対象1
で計測された制御量Xnが伝送部21を通して調節部2
に入力されるまでの時間を予め計測あるいは算出して設
定しておいてもよいし、後述するように伝送部21の変
動に応じて動的に設定するようにしてもよい。
【0076】図12は図11に示した調節部2の構成の
一例を示す図である。
一例を示す図である。
【0077】図12に示す調節部2が図7に示した調節
部2と異なるのは調節部2に入力される制御量X´nが
制御対象1で計測された制御量Xnに対して伝送むだ時
間rΔt遅れていることである。仮想操作量算出部6は
伝送部21を通して入力された制御量X′n及び目標制
御量Xdに基づき、仮想操作量U(^)nを算出する。
制御量予測部7は仮想操作量U(^)nと制御量Χ´n
に基づき、仮想操作量U(^)nが調節信号として出力
された場合のpΔt時間後の予測制御量X(〜)n+p を
算出する。pΔtは制御対象1の応答時間である。操作
量修正部8は、制御量予測部7で予測されたpΔt時間
後の制御量Xn+p 及び目標制御量Xdに基づき、予測制
御量X(〜)n+p が目標制御量Xdに近付くように仮想
操作量U(^)nを修正する。第1スイッチ9は制御対
象1で制御量が計測されると下側に閉じ、仮想操作量算
出部6で算出された仮想操作量U(^)nを制御量予測
部7に入力し、その後、第1スイッチ9は次の計測時ま
で上側に閉じて、操作量修正部8で修正された仮想操作
量U(^)nを制御量予測部7の入力にし、所定の回
数、あるいは予測制御量Χ(〜)n+p と目標制御量Χd
の差が所定の値以下になるまで、制御量予測部7による
制御量の予測と操作量修正部8による操作量の修正が繰
り返される。制御量予測部7による制御量の予測と操作
量修正部8による操作量の修正が所定の回数まで、ある
いは予測制御量Χ(〜)n+p と目標制御量Xdの差が所
定の値以下になるまで繰り返されると第2スイッチ10
が閉じ、仮想操作量U(^)nが調節信号Cnとして操
作部3へ出力される。
部2と異なるのは調節部2に入力される制御量X´nが
制御対象1で計測された制御量Xnに対して伝送むだ時
間rΔt遅れていることである。仮想操作量算出部6は
伝送部21を通して入力された制御量X′n及び目標制
御量Xdに基づき、仮想操作量U(^)nを算出する。
制御量予測部7は仮想操作量U(^)nと制御量Χ´n
に基づき、仮想操作量U(^)nが調節信号として出力
された場合のpΔt時間後の予測制御量X(〜)n+p を
算出する。pΔtは制御対象1の応答時間である。操作
量修正部8は、制御量予測部7で予測されたpΔt時間
後の制御量Xn+p 及び目標制御量Xdに基づき、予測制
御量X(〜)n+p が目標制御量Xdに近付くように仮想
操作量U(^)nを修正する。第1スイッチ9は制御対
象1で制御量が計測されると下側に閉じ、仮想操作量算
出部6で算出された仮想操作量U(^)nを制御量予測
部7に入力し、その後、第1スイッチ9は次の計測時ま
で上側に閉じて、操作量修正部8で修正された仮想操作
量U(^)nを制御量予測部7の入力にし、所定の回
数、あるいは予測制御量Χ(〜)n+p と目標制御量Χd
の差が所定の値以下になるまで、制御量予測部7による
制御量の予測と操作量修正部8による操作量の修正が繰
り返される。制御量予測部7による制御量の予測と操作
量修正部8による操作量の修正が所定の回数まで、ある
いは予測制御量Χ(〜)n+p と目標制御量Xdの差が所
定の値以下になるまで繰り返されると第2スイッチ10
が閉じ、仮想操作量U(^)nが調節信号Cnとして操
作部3へ出力される。
【0078】図13は図12に示した制御量予測部7の
構成の一例を示す図である。ここでも、制御量予測部7
は神経回路モデルから構成されている。図13では時刻
nΔtの仮想操作量U(^)n=(U(^)1n,U
(^)2n,…,U(^)gn)T(gは操作量の次元
数を表す)と制御量Χ´n(X1′n,X2′n,…,
Χh′n)T(hは制御量の次元数を表す)が入力され
ると、応答時間pΔt後の予測制御量X(〜)n+p =
(X1n+p ,X2n+p ,…,Xhn+p )Tが出力される
神経回路モデル11の制御時の予測計算の信号の流れを
示している。この入力信号から出力信号を求めるのは先
に示した神経回路モデル11の前向き計算によって行わ
れる。
構成の一例を示す図である。ここでも、制御量予測部7
は神経回路モデルから構成されている。図13では時刻
nΔtの仮想操作量U(^)n=(U(^)1n,U
(^)2n,…,U(^)gn)T(gは操作量の次元
数を表す)と制御量Χ´n(X1′n,X2′n,…,
Χh′n)T(hは制御量の次元数を表す)が入力され
ると、応答時間pΔt後の予測制御量X(〜)n+p =
(X1n+p ,X2n+p ,…,Xhn+p )Tが出力される
神経回路モデル11の制御時の予測計算の信号の流れを
示している。この入力信号から出力信号を求めるのは先
に示した神経回路モデル11の前向き計算によって行わ
れる。
【0079】制御量予測部7が神経回路モデル11から
構成される場合には、操作量修正部8は先に示した神経
回路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量を修正する。
構成される場合には、操作量修正部8は先に示した神経
回路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量を修正する。
【0080】ここで、制御量予測部7が神経回路モデル
11から構成される場合には、学習部4は以下のように
構成される。
11から構成される場合には、学習部4は以下のように
構成される。
【0081】すなわち、学習部4は、制御対象1の応答
時間pΔtと、伝送むだ時間rΔtと、観測データ記憶
部5に記憶された過去の制御量と操作量からなる観測デ
ータに基づいて学習データを作成し、制御量予測部7を
構成する神経回路モデル11の学習を行う。伝送部21
に伝送むだ時間がある場合に、入力信号(Us,
Xs)、教師信号(Xs+p )(s=n−l,n−l+
1,…,n−p−1)を学習データとして学習を行う
と、神経回路モデル11は時刻sΔtに計測された制御
量Xsと時刻sΔtに制御対象1に入力された操作量U
sから応答時間pΔt後の制御量Χs+p を出力するよう
になる。この神経回路モデル11を制御量予測部7とし
て制御を行うと、制御量予測部7では伝送むだ時間rΔ
t前に計測された制御量を現在の制御量としてpΔt時
間後の予測制御量X(〜)n+p を出力するため、正確な
制御ができなくなる。
時間pΔtと、伝送むだ時間rΔtと、観測データ記憶
部5に記憶された過去の制御量と操作量からなる観測デ
ータに基づいて学習データを作成し、制御量予測部7を
構成する神経回路モデル11の学習を行う。伝送部21
に伝送むだ時間がある場合に、入力信号(Us,
Xs)、教師信号(Xs+p )(s=n−l,n−l+
1,…,n−p−1)を学習データとして学習を行う
と、神経回路モデル11は時刻sΔtに計測された制御
量Xsと時刻sΔtに制御対象1に入力された操作量U
sから応答時間pΔt後の制御量Χs+p を出力するよう
になる。この神経回路モデル11を制御量予測部7とし
て制御を行うと、制御量予測部7では伝送むだ時間rΔ
t前に計測された制御量を現在の制御量としてpΔt時
間後の予測制御量X(〜)n+p を出力するため、正確な
制御ができなくなる。
【0082】そこで、本発明では、時刻nΔtに調節部
2に入力される制御量X′nと調節信号Cnを神経回路
モデル11に入力すると、pΔt時間後の予測制御量Χ
(〜)n+p を出力するように、神経回路モデル11の学
習を行うために、図14に示すように、伝送むだ時間前
に制御対象1で計測された制御量Xs-r =(X1s-r,
X2s-r ,…,Xhs-r )と操作量Us=(U1s,U
2s,…,Ugs)を入力信号、応答時間pΔt後の制
御量Χs+p =(Χ1s+p ,Χ2+p ,…,Xhs+ p )を教
師信号にする(s=n−l+r,n−l+r+1,…,
n−p−1)。この学習データで学習ができれば、制御
時に調節部2で求められた調節信号Cnは、伝送むだ時
間rΔt前に制御対象1で計測された制御量X´nと調
節信号Cnから予測される応答時間pΔt後の制御量Χ
n+p が目標制御量Χdに近付く調節信号なので、正確な
制御ができる。
2に入力される制御量X′nと調節信号Cnを神経回路
モデル11に入力すると、pΔt時間後の予測制御量Χ
(〜)n+p を出力するように、神経回路モデル11の学
習を行うために、図14に示すように、伝送むだ時間前
に制御対象1で計測された制御量Xs-r =(X1s-r,
X2s-r ,…,Xhs-r )と操作量Us=(U1s,U
2s,…,Ugs)を入力信号、応答時間pΔt後の制
御量Χs+p =(Χ1s+p ,Χ2+p ,…,Xhs+ p )を教
師信号にする(s=n−l+r,n−l+r+1,…,
n−p−1)。この学習データで学習ができれば、制御
時に調節部2で求められた調節信号Cnは、伝送むだ時
間rΔt前に制御対象1で計測された制御量X´nと調
節信号Cnから予測される応答時間pΔt後の制御量Χ
n+p が目標制御量Χdに近付く調節信号なので、正確な
制御ができる。
【0083】次に、本発明の他の実施の形態を図15に
基づき説明する。
基づき説明する。
【0084】図15に示す制御装置では、図11に示し
た制御装置に伝送むだ時間計測部22が付加されてい
る。伝送むだ時間計測部22は、過去m単位時間に制御
対象1で計測された制御量の時系列X=(Xn-m ,X
n-m+1 ,…,Χn-1 )と、調節部2に入力された制御量
の時系列X′=(Xn-m ,Χ´n-m+1 ,…,Χ´n-1 )
に基づき、制御対象1で計測された制御量が調節部2に
入力されるまでの伝送むだ時間rΔtを計算し、学習部
4に出力する。mは正の整数である。伝送むだ時間計測
部22が付加されることにより、伝送部21の特性変化
によって伝送むだ時間が変化する場合でも、伝送むだ時
間計測部22によって変化後の伝送むだ時間rΔtが計
算され、学習部4に出力される。学習部4では伝送むだ
時間計測部22から入力された伝送むだ時間rΔtに従
い、学習データを作成し、学習を行うので、伝送むだ時
間が変化する場合でも正しく制御し続けることができ
る。
た制御装置に伝送むだ時間計測部22が付加されてい
る。伝送むだ時間計測部22は、過去m単位時間に制御
対象1で計測された制御量の時系列X=(Xn-m ,X
n-m+1 ,…,Χn-1 )と、調節部2に入力された制御量
の時系列X′=(Xn-m ,Χ´n-m+1 ,…,Χ´n-1 )
に基づき、制御対象1で計測された制御量が調節部2に
入力されるまでの伝送むだ時間rΔtを計算し、学習部
4に出力する。mは正の整数である。伝送むだ時間計測
部22が付加されることにより、伝送部21の特性変化
によって伝送むだ時間が変化する場合でも、伝送むだ時
間計測部22によって変化後の伝送むだ時間rΔtが計
算され、学習部4に出力される。学習部4では伝送むだ
時間計測部22から入力された伝送むだ時間rΔtに従
い、学習データを作成し、学習を行うので、伝送むだ時
間が変化する場合でも正しく制御し続けることができ
る。
【0085】次に、本発明の他の実施の形態を図16に
基づき説明する。
基づき説明する。
【0086】図16に示す制御装置は、操作部3に調節
部2で算出された調節信号が操作量として制御対象1に
入力されるまでにむだ時間を持つこと、伝送部21に制
御対象1で計測された制御量を調節部2に伝送するのに
むだ時間を持つことを考慮したものである。同図に示す
ように、時刻nΔtに制御対象1で計測された制御量X
nは、伝送部21を通して調節部2に入力されるが、伝
送部21は伝送むだ時間rΔtを持ち、制御対象1で計
測された制御量Xnは伝送むだ時間rΔt遅れて調節部
2に入力される。時刻nΔtに調節部2に入力される制
御量をX′nと表す。調節部2は制御量X′nと目標制
御量Xdに基づき、調節信号Cnを算出する。操作部3
では調節部2で算出された調節信号Cnに基づき操作量
Unが出力されるが、操作部3は時間遅れを持ち、入力
された調節信号Cnは操作遅れ時間qΔt遅れて操作量
として出力される。制御対象1には操作部3が出力した
操作量Unが入力され、その操作量Unが変化すること
で制御される。
部2で算出された調節信号が操作量として制御対象1に
入力されるまでにむだ時間を持つこと、伝送部21に制
御対象1で計測された制御量を調節部2に伝送するのに
むだ時間を持つことを考慮したものである。同図に示す
ように、時刻nΔtに制御対象1で計測された制御量X
nは、伝送部21を通して調節部2に入力されるが、伝
送部21は伝送むだ時間rΔtを持ち、制御対象1で計
測された制御量Xnは伝送むだ時間rΔt遅れて調節部
2に入力される。時刻nΔtに調節部2に入力される制
御量をX′nと表す。調節部2は制御量X′nと目標制
御量Xdに基づき、調節信号Cnを算出する。操作部3
では調節部2で算出された調節信号Cnに基づき操作量
Unが出力されるが、操作部3は時間遅れを持ち、入力
された調節信号Cnは操作遅れ時間qΔt遅れて操作量
として出力される。制御対象1には操作部3が出力した
操作量Unが入力され、その操作量Unが変化すること
で制御される。
【0087】学習部4には制御対象1に操作量が入力さ
れてからその操作量による影響が制御量に現れるまでの
応答時間pΔtと、調節部2で算出された調節信号が操
作部3を通して操作量として実現されるまでの操作遅れ
時間qΔtと、制御対象1で計測された制御量が伝送部
21を通して調節部2に入力されるまでの伝送むだ時間
rΔtと、観測データ記憶部5に記憶された過去l単位
時間に計測された制御量(Xn-l ,Xn-l+1 ,…,X
n-1 )と制御対象1に入力された操作量(Un-l,U
n-l+1 ,…,Un-1 )からなる観測データに基づいて、
調節部2のパラメータWを学習によって調節し、調節部
2へ出力する。
れてからその操作量による影響が制御量に現れるまでの
応答時間pΔtと、調節部2で算出された調節信号が操
作部3を通して操作量として実現されるまでの操作遅れ
時間qΔtと、制御対象1で計測された制御量が伝送部
21を通して調節部2に入力されるまでの伝送むだ時間
rΔtと、観測データ記憶部5に記憶された過去l単位
時間に計測された制御量(Xn-l ,Xn-l+1 ,…,X
n-1 )と制御対象1に入力された操作量(Un-l,U
n-l+1 ,…,Un-1 )からなる観測データに基づいて、
調節部2のパラメータWを学習によって調節し、調節部
2へ出力する。
【0088】図17は図16に示した調節部2の構成の
一例を示す図である。
一例を示す図である。
【0089】図17に示すように、仮想操作量算出部6
は伝送部21を通して入力された制御量X′n及び目標
制御量Xdに基づき、仮想操作量U(^)nを算出す
る。制御量予測部7は仮想操作量U(^)nと制御量
X′nに基づき、仮想操作量U(^)nが調節信号とし
て出力された場合のpΔt時間後の予測制御量X(〜)
n+p を算出する。pΔtは制御対象1の応答時間であ
る。操作量修正部8は、制御量予測部7で予測されたp
Δt時間後の制御量Xn+p 及び目標制御量Xdに基づ
き、予測制御量X(〜)n+p が目標制御量Xdに近付く
ように仮想操作量U(^)nを修正する。第1スイッチ
9は制御対象1で制御量が計測されると下側に閉じ、仮
想操作量算出部6で算出された仮想操作量U(^)nを
制御量予測部7に入力し、その後、第1スイッチ9は次
の計測時まで上側に閉じて、操作量修正部8で修正され
た仮想操作量U(^)nを制御量予測部7の入力にし、
所定の回数、あるいは予測制御量X(〜)n+p と目標制
御量Xdの差が所定の値以下になるまで、制御量予測部
7による制御量の予測と操作量修正部8による操作量の
修正が繰り返される。制御量予測部7による制御量の予
測と操作量修正部8による操作量の修正が所定の回数ま
で、あるいは予測制御量X(〜)n+p と目標制御量Χd
の差が所定の値以下になるまで繰り返されると、第2ス
イッチ10が閉じ、仮想操作量U(^)nが調節信号C
nとして操作部3へ出力される。
は伝送部21を通して入力された制御量X′n及び目標
制御量Xdに基づき、仮想操作量U(^)nを算出す
る。制御量予測部7は仮想操作量U(^)nと制御量
X′nに基づき、仮想操作量U(^)nが調節信号とし
て出力された場合のpΔt時間後の予測制御量X(〜)
n+p を算出する。pΔtは制御対象1の応答時間であ
る。操作量修正部8は、制御量予測部7で予測されたp
Δt時間後の制御量Xn+p 及び目標制御量Xdに基づ
き、予測制御量X(〜)n+p が目標制御量Xdに近付く
ように仮想操作量U(^)nを修正する。第1スイッチ
9は制御対象1で制御量が計測されると下側に閉じ、仮
想操作量算出部6で算出された仮想操作量U(^)nを
制御量予測部7に入力し、その後、第1スイッチ9は次
の計測時まで上側に閉じて、操作量修正部8で修正され
た仮想操作量U(^)nを制御量予測部7の入力にし、
所定の回数、あるいは予測制御量X(〜)n+p と目標制
御量Xdの差が所定の値以下になるまで、制御量予測部
7による制御量の予測と操作量修正部8による操作量の
修正が繰り返される。制御量予測部7による制御量の予
測と操作量修正部8による操作量の修正が所定の回数ま
で、あるいは予測制御量X(〜)n+p と目標制御量Χd
の差が所定の値以下になるまで繰り返されると、第2ス
イッチ10が閉じ、仮想操作量U(^)nが調節信号C
nとして操作部3へ出力される。
【0090】図18は図17に示した制御量予測部7の
構成の一例を示す図である。ここでも、制御量予測部7
は神経回路モデルから構成されている。図18では時刻
nΔtの仮想操作量U(^)n=(U(^)1n,U
(^)2n,…,U(^)gn)T(gは操作量の次元
数を表す)と制御量X´n=(X1′n,Χ2´n,
…,Xh´n)T(hは制御量の次元数を表す)を入力
すると、pΔt時間後の予測制御量X(〜)n+p =(X
(〜)1n+p ,X(〜)2n+p ,…,X(〜)hn+ p )
Tを出力する神経回路モデル11の制御時の予測計算の
信号の流れを示している。この入力信号から出力信号を
求めるのは前述した神経回路モデル11の前向き計算に
よって行われる。
構成の一例を示す図である。ここでも、制御量予測部7
は神経回路モデルから構成されている。図18では時刻
nΔtの仮想操作量U(^)n=(U(^)1n,U
(^)2n,…,U(^)gn)T(gは操作量の次元
数を表す)と制御量X´n=(X1′n,Χ2´n,
…,Xh´n)T(hは制御量の次元数を表す)を入力
すると、pΔt時間後の予測制御量X(〜)n+p =(X
(〜)1n+p ,X(〜)2n+p ,…,X(〜)hn+ p )
Tを出力する神経回路モデル11の制御時の予測計算の
信号の流れを示している。この入力信号から出力信号を
求めるのは前述した神経回路モデル11の前向き計算に
よって行われる。
【0091】制御量予測部7が神経回路モデル11から
構成される場合には、操作量修正部8は前述した神経回
路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量を修正する。
構成される場合には、操作量修正部8は前述した神経回
路モデル11の誤差逆伝播計算によって仮想操作量U
(^)nの修正量を求め、仮想操作量を修正する。
【0092】ここで、制御量予測部7が神経回路モデル
11から構成される場合には、学習部4は以下のように
構成される。
11から構成される場合には、学習部4は以下のように
構成される。
【0093】学習部4は制御対象1の応答時間pΔt
と、操作遅れ時間qΔtと、伝送むだ時間rΔtと、観
測データ記憶部5に記憶された過去の制御量と操作量か
らなる観測データに基づいて学習データを作成し、制御
量予測部7を構成する神経回路モデル11の学習を行
う。操作部3に操作遅れ時間があり、伝送部21に伝送
むだ時間がある場合に、入力信号(Us,Χs)、出力
信号(Xs+p )(s=n−l,n−l+1,…,n−p
−1)を学習データとして学習を行うと、神経回路モデ
ル11は時刻sΔtに計測された制御量Xsと時刻sΔ
tに制御対象1に入力された操作量UsからpΔt時間
後の制御量Χs+p を出力するようになる。この神経回路
モデル11を制御量予測部7に用いて制御を行うと、調
節部2では伝送むだ時間rΔt前に観測された制御量X
n-r を現在の制御量Xnとみなし、また予測制御量Χ
(〜)n+p が目標制御量Χdに近付くための操作量Un
の値が求められてしまい、実際にその値が制御対象1に
入力されるのは操作遅れ時間qΔt後になるので、正確
な制御ができなくなる。
と、操作遅れ時間qΔtと、伝送むだ時間rΔtと、観
測データ記憶部5に記憶された過去の制御量と操作量か
らなる観測データに基づいて学習データを作成し、制御
量予測部7を構成する神経回路モデル11の学習を行
う。操作部3に操作遅れ時間があり、伝送部21に伝送
むだ時間がある場合に、入力信号(Us,Χs)、出力
信号(Xs+p )(s=n−l,n−l+1,…,n−p
−1)を学習データとして学習を行うと、神経回路モデ
ル11は時刻sΔtに計測された制御量Xsと時刻sΔ
tに制御対象1に入力された操作量UsからpΔt時間
後の制御量Χs+p を出力するようになる。この神経回路
モデル11を制御量予測部7に用いて制御を行うと、調
節部2では伝送むだ時間rΔt前に観測された制御量X
n-r を現在の制御量Xnとみなし、また予測制御量Χ
(〜)n+p が目標制御量Χdに近付くための操作量Un
の値が求められてしまい、実際にその値が制御対象1に
入力されるのは操作遅れ時間qΔt後になるので、正確
な制御ができなくなる。
【0094】そこで、本発明では、神経回路モデル11
が、時刻nΔtに調節部2に入力される制御量X´
nと、時刻nΔtに出力する調節信号Cnを入力する
と、pΔt時間後の予測制御量Χ(〜)n+p を出力する
ように神経回路モデル11の学習を行うため、図19に
示すように、伝送むだ時間rΔt前に制御対象1で計測
された制御量Χs-r =(Χ1s-r ,X2s-r ,…,Xh
s-r )と操作遅れ時間qΔt後に制御対象1に入力され
る操作量Us+q =(U1s+q ,U2s+q ,…,U
gs+ q )を入力信号、pΔt時間後の制御量Χs+p =
(Χ1s+p ,Χ2s+p ,…,Χhs+p )を教師信号にし
た学習データを作成する(s=n−l+r,n−l+r
+1,…,n−p−1)。この学習データで学習ができ
れぱ、制御時に調節部2で求められた調節信号Cnは、
操作遅れ時間qΔt後に制御対象1に入力された時にp
Δt時間後の制御量Χn+p が目標制御量Xdに近付く操
作量なので、正確な制御ができる。
が、時刻nΔtに調節部2に入力される制御量X´
nと、時刻nΔtに出力する調節信号Cnを入力する
と、pΔt時間後の予測制御量Χ(〜)n+p を出力する
ように神経回路モデル11の学習を行うため、図19に
示すように、伝送むだ時間rΔt前に制御対象1で計測
された制御量Χs-r =(Χ1s-r ,X2s-r ,…,Xh
s-r )と操作遅れ時間qΔt後に制御対象1に入力され
る操作量Us+q =(U1s+q ,U2s+q ,…,U
gs+ q )を入力信号、pΔt時間後の制御量Χs+p =
(Χ1s+p ,Χ2s+p ,…,Χhs+p )を教師信号にし
た学習データを作成する(s=n−l+r,n−l+r
+1,…,n−p−1)。この学習データで学習ができ
れぱ、制御時に調節部2で求められた調節信号Cnは、
操作遅れ時間qΔt後に制御対象1に入力された時にp
Δt時間後の制御量Χn+p が目標制御量Xdに近付く操
作量なので、正確な制御ができる。
【0095】次に、本発明の他の実施の形態を図20に
基づき説明する。
基づき説明する。
【0096】図20に示す制御装置では、図16に示し
た制御装置に操作遅れ時間計測部20、伝送むだ時間計
測部22が付加されている。操作遅れ時間計測部20は
過去m単位時間に調節部2で算出された調節信号の時系
列C=(Cn-m ,Cn-m+1 ,…,Cn-1 )と、操作部3
から出力された操作量の時系列U=(Un-m ,
Un-m+ 1 ,…,Un-1 )に基づき、調節信号が操作部3
に入力されて操作量として出力されるまでの操作遅れ時
間qΔtを計算し、学習部4に出力する。また、伝送む
だ時間計測部22は過去m単位時間に制御対象1で計測
された制御量の時系列X=(Χn-m ,Xn-m+1 ,…,Χ
n-1 )と、調節部2に入力された制御量の時系列Χ´=
(Χ´n-m ,X´n-m+1 ,…,Χ´n-1 )に基づき、制
御対象1で計測された制御量が調節部2に入力されるま
での伝送むだ時間rΔtを計算し、学習部4に出力す
る。mは正の整数である。操作遅れ時間計測部20が付
加されることにより、操作部3の特性変化によって操作
遅れ時間が変化する場合でも、操作遅れ時間計測部20
によって変化後の操作遅れ時間qΔtが計算され、学習
部4に出力される。学習部4では操作遅れ時間計測部2
0から入力された操作遅れ時間qΔtに従い、学習デー
タを作成し、学習を行うので、操作遅れ時間が変化する
場合でも正しく制御し続けることができる。また、伝送
むだ時間計測部22が付加されることにより、伝送部2
1の特性変化によって伝送むだ時間が変化する場合で
も、伝送むだ時間計測部22によって変化後の伝送むだ
時間rΔtが計算され、学習部4に出力される。学習部
4では伝送むだ時間計測部22から入力された伝送むだ
時間rΔtに従い、学習データを作成し、学習を行うの
で、伝送むだ時間が変化する場合でも正しく制御し続け
ることができる。
た制御装置に操作遅れ時間計測部20、伝送むだ時間計
測部22が付加されている。操作遅れ時間計測部20は
過去m単位時間に調節部2で算出された調節信号の時系
列C=(Cn-m ,Cn-m+1 ,…,Cn-1 )と、操作部3
から出力された操作量の時系列U=(Un-m ,
Un-m+ 1 ,…,Un-1 )に基づき、調節信号が操作部3
に入力されて操作量として出力されるまでの操作遅れ時
間qΔtを計算し、学習部4に出力する。また、伝送む
だ時間計測部22は過去m単位時間に制御対象1で計測
された制御量の時系列X=(Χn-m ,Xn-m+1 ,…,Χ
n-1 )と、調節部2に入力された制御量の時系列Χ´=
(Χ´n-m ,X´n-m+1 ,…,Χ´n-1 )に基づき、制
御対象1で計測された制御量が調節部2に入力されるま
での伝送むだ時間rΔtを計算し、学習部4に出力す
る。mは正の整数である。操作遅れ時間計測部20が付
加されることにより、操作部3の特性変化によって操作
遅れ時間が変化する場合でも、操作遅れ時間計測部20
によって変化後の操作遅れ時間qΔtが計算され、学習
部4に出力される。学習部4では操作遅れ時間計測部2
0から入力された操作遅れ時間qΔtに従い、学習デー
タを作成し、学習を行うので、操作遅れ時間が変化する
場合でも正しく制御し続けることができる。また、伝送
むだ時間計測部22が付加されることにより、伝送部2
1の特性変化によって伝送むだ時間が変化する場合で
も、伝送むだ時間計測部22によって変化後の伝送むだ
時間rΔtが計算され、学習部4に出力される。学習部
4では伝送むだ時間計測部22から入力された伝送むだ
時間rΔtに従い、学習データを作成し、学習を行うの
で、伝送むだ時間が変化する場合でも正しく制御し続け
ることができる。
【0097】
【実施例】本発明を下水処理プロセスの溶存酸素濃度を
制御する下水処理プロセスにおける溶存酸素濃度の制御
装置に適用した実施例を説明する。
制御する下水処理プロセスにおける溶存酸素濃度の制御
装置に適用した実施例を説明する。
【0098】図21は本発明の一実施例の制御装置の構
成を示すブロック図である。
成を示すブロック図である。
【0099】同図に示すように、下水処理プロセス23
では単位時間Δt毎に制御量である溶存酸素濃度と下水
流入量が計測され、操作量である曝気風量が入力され
る。時刻nΔtに計測された溶存酸素濃度DOn、下水
流入量Qinfnと単位時間前に下水処理プロセス23
に入力された曝気風量Qaern-1 が伝送部24を通し
て調節部25に入力されるが、伝送部24は伝送むだ時
間を持つため、伝送むだ時間遅れて調節部25に入力さ
れる。時刻nΔtに調節部25に入力される曝気風量を
Qaer´n、溶存酸素濃度をDO´n、下水流入量を
Qinf´n-1 と表す。調節部25は目標溶存酸素濃度
DOd、曝気風量Qaer´n-1 、溶存酸素濃度DO´
n、下水流入量Qinf´nに基づき、調節信号Cnを
算出する。ブロア26では調節部25で算出された調節
信号Cnが曝気風量Qaernに変換され、下水処理プ
ロセス23に出力される。下水処理プロセス23にはブ
ロア26が出力した曝気風量Qaernが入力される。
では単位時間Δt毎に制御量である溶存酸素濃度と下水
流入量が計測され、操作量である曝気風量が入力され
る。時刻nΔtに計測された溶存酸素濃度DOn、下水
流入量Qinfnと単位時間前に下水処理プロセス23
に入力された曝気風量Qaern-1 が伝送部24を通し
て調節部25に入力されるが、伝送部24は伝送むだ時
間を持つため、伝送むだ時間遅れて調節部25に入力さ
れる。時刻nΔtに調節部25に入力される曝気風量を
Qaer´n、溶存酸素濃度をDO´n、下水流入量を
Qinf´n-1 と表す。調節部25は目標溶存酸素濃度
DOd、曝気風量Qaer´n-1 、溶存酸素濃度DO´
n、下水流入量Qinf´nに基づき、調節信号Cnを
算出する。ブロア26では調節部25で算出された調節
信号Cnが曝気風量Qaernに変換され、下水処理プ
ロセス23に出力される。下水処理プロセス23にはブ
ロア26が出力した曝気風量Qaernが入力される。
【0100】操作遅れ時間計測部27は、過去m単位時
間に調節部25で算出された調節信号の時系列C=(C
n-m ,Cn-m+1 ,…,Cn-1 )と、ブロア26から出力
された曝気風量の時系列Qaer=(Qaern-m ,Q
aern-m-1 ,…,Qaern-1 )に基づき、調節信号
が曝気風量として実現されるまでの操作遅れ時間qΔt
を算出する。mは正の整数である。
間に調節部25で算出された調節信号の時系列C=(C
n-m ,Cn-m+1 ,…,Cn-1 )と、ブロア26から出力
された曝気風量の時系列Qaer=(Qaern-m ,Q
aern-m-1 ,…,Qaern-1 )に基づき、調節信号
が曝気風量として実現されるまでの操作遅れ時間qΔt
を算出する。mは正の整数である。
【0101】伝送むだ時間計測部28は過去m単位時間
に下水処理プロセス23で観測された溶存酸素濃度の時
系列DO=(DΟ1,DΟ2,…,DOn-1 )と、調節
部25に入力された溶存酸素濃度の時系列DO´=(D
O´1,DO´2,…,DO´n-1 )に基づき、下水処
理プロセス23で溶存酸素濃度が観測されてから調節部
25に入力されるまでの伝送むだ時間rΔtを算出す
る。
に下水処理プロセス23で観測された溶存酸素濃度の時
系列DO=(DΟ1,DΟ2,…,DOn-1 )と、調節
部25に入力された溶存酸素濃度の時系列DO´=(D
O´1,DO´2,…,DO´n-1 )に基づき、下水処
理プロセス23で溶存酸素濃度が観測されてから調節部
25に入力されるまでの伝送むだ時間rΔtを算出す
る。
【0102】学習部29は下水処理プロセス23に曝気
風量が入力されてからその曝気風量による影響が溶存酸
素濃度に現れるまでの応答時間pΔtと、操作遅れ時間
計測部27によって算出された操作遅れ時間qΔtと、
伝送むだ時間計測部28によって算出された伝送むだ時
間rΔtと、観測データ記憶部30に記憶された過去の
曝気風量(Qaern-l ,Qaern-l+1 ,…,Qae
rn-1 )と溶存酸素濃度(DOn-l ,DOn-l+1 ,…,
DOn-1 )と流入量(Qinfn-l ,Qinfn-l+1 ,
…,Qinfn-1 )からなる観測データに基づいて、調
節部25のパラメータWを学習によって調節し、調節部
25へ出力する。
風量が入力されてからその曝気風量による影響が溶存酸
素濃度に現れるまでの応答時間pΔtと、操作遅れ時間
計測部27によって算出された操作遅れ時間qΔtと、
伝送むだ時間計測部28によって算出された伝送むだ時
間rΔtと、観測データ記憶部30に記憶された過去の
曝気風量(Qaern-l ,Qaern-l+1 ,…,Qae
rn-1 )と溶存酸素濃度(DOn-l ,DOn-l+1 ,…,
DOn-1 )と流入量(Qinfn-l ,Qinfn-l+1 ,
…,Qinfn-1 )からなる観測データに基づいて、調
節部25のパラメータWを学習によって調節し、調節部
25へ出力する。
【0103】次に、調節部25が仮想曝気風量算出部、
溶存酸素濃度予測部、曝気風量修正部から構成される場
合について図22を基に説明する。仮想曝気風量算出部
31は単位時間前の曝気風量Qaer´n-1 、下水処理
プロセス23で計測された溶存酸素濃度DO´n及び目
標溶存酸素濃度DOdに基づき、仮想曝気風量Qaer
(^)nを算出する。この算出の具体的な方法は、例え
ばKを正の定数として、
溶存酸素濃度予測部、曝気風量修正部から構成される場
合について図22を基に説明する。仮想曝気風量算出部
31は単位時間前の曝気風量Qaer´n-1 、下水処理
プロセス23で計測された溶存酸素濃度DO´n及び目
標溶存酸素濃度DOdに基づき、仮想曝気風量Qaer
(^)nを算出する。この算出の具体的な方法は、例え
ばKを正の定数として、
【数17】 のように計算してもよいし、または、
【数18】 のように単位時間前の曝気風量をそのまま仮想曝気風量
としても良い。
としても良い。
【0104】溶存酸素濃度予測部32は仮想曝気風量Q
aer(^)nと単位時間前の曝気風量Qaer
´n-1 、下水処理プロセス23で計測された溶存酸素濃
度DO´n、下水流入流量Qinf´nに基づき、仮想
曝気風量Qaer(^)nが調節信号Cnとして出力さ
れた場合のpΔt時間後の予測溶存酸素濃度DO(−)
n+pを算出する。pは下水処理プロセス23の応答時間
である。
aer(^)nと単位時間前の曝気風量Qaer
´n-1 、下水処理プロセス23で計測された溶存酸素濃
度DO´n、下水流入流量Qinf´nに基づき、仮想
曝気風量Qaer(^)nが調節信号Cnとして出力さ
れた場合のpΔt時間後の予測溶存酸素濃度DO(−)
n+pを算出する。pは下水処理プロセス23の応答時間
である。
【0105】曝気風量修正部33は、溶存酸素濃度予測
部32で予測された溶存酸素濃度DO(−)n+p 及び目
標溶存酸素濃度DOdに基づき、予測溶存酸素濃度DO
(−)n+p が目標溶存酸素濃度DOdに近付くように仮
想曝気風量Qaer(^)nを修正する。
部32で予測された溶存酸素濃度DO(−)n+p 及び目
標溶存酸素濃度DOdに基づき、予測溶存酸素濃度DO
(−)n+p が目標溶存酸素濃度DOdに近付くように仮
想曝気風量Qaer(^)nを修正する。
【0106】第1スイッチ34は下水処理プロセス23
で溶存酸素濃度が計測されると下側に閉じ、仮想曝気風
量算出部31で算出された仮想曝気風量Qaer(^)
nを溶存酸素濃度予測部32に入力し、その後、第1ス
イッチ34は次の計測時まで上側に閉じて、曝気風量修
正部33で修正された仮想曝気風量Qaer(^)nを
溶存酸素濃度予測部32の入力にし、所定の回数、ある
いは予測溶存酸素濃度DO(−)n+p と目標溶存酸素濃
度DOdの差が所定の値以下になるまで、溶存酸素濃度
予測部32による溶存酸素濃度の予測と曝気風量修正部
33による曝気風量の修正が繰り返される。溶存酸素濃
度予測部32による溶存酸素濃度の予測と曝気風量修正
部33による曝気風量の修正が所定の回数まで、あるい
は予測溶存酸素濃度DO(−)n+p と目標溶存酸素濃度
DOdの差が所定の値以下になるまで繰り返されると、
第2スイッチ35が閉じ、仮想曝気風量Qaer(^)
nが調節信号Cnとしてブロア26へ出力される。
で溶存酸素濃度が計測されると下側に閉じ、仮想曝気風
量算出部31で算出された仮想曝気風量Qaer(^)
nを溶存酸素濃度予測部32に入力し、その後、第1ス
イッチ34は次の計測時まで上側に閉じて、曝気風量修
正部33で修正された仮想曝気風量Qaer(^)nを
溶存酸素濃度予測部32の入力にし、所定の回数、ある
いは予測溶存酸素濃度DO(−)n+p と目標溶存酸素濃
度DOdの差が所定の値以下になるまで、溶存酸素濃度
予測部32による溶存酸素濃度の予測と曝気風量修正部
33による曝気風量の修正が繰り返される。溶存酸素濃
度予測部32による溶存酸素濃度の予測と曝気風量修正
部33による曝気風量の修正が所定の回数まで、あるい
は予測溶存酸素濃度DO(−)n+p と目標溶存酸素濃度
DOdの差が所定の値以下になるまで繰り返されると、
第2スイッチ35が閉じ、仮想曝気風量Qaer(^)
nが調節信号Cnとしてブロア26へ出力される。
【0107】次に、溶存酸素濃度予測部32が多層神経
回路モデルから構成される場合について説明する。図2
3は溶存酸素濃度予測部32の一例の説明図である。溶
存酸素濃度予測部32には仮想曝気風量Qaer(^)
n、溶存酸素濃度DO´n、下水流入量Qinf´n、
単位時間前の曝気風量Qaer´n-1 が入力される。多
段に組まれた遅れ時間要素37によって時間遅れが生
じ、時刻(n−maer +1)Δtから時刻(n−1)Δ
tまでの曝気風量(Qaer´n-maer+1 ,Qaer´
n-maer+2 ,…,Qaer´n-1 )、時刻(n−mdo+
1)Δtから時刻nΔtまでの溶存酸素濃度(DO´
n-mdo+1,DO´n-mdo+2,…,DO´n)、時刻(n
−minf +1)Δtから時刻nΔtまでの下水流入量
(Qinf´n- minf+1 ,Qinf´n-minf+2 ,…,
Qinf´n)、仮想曝気風量Qaer(^)nが神経
回路モデル36に入力される。maer ,mdo、minf は
正の整数である。神経回路モデル36はこれらの入力信
号から前向き計算によって時刻(n+p)Δtの予測溶
存酸素濃度DO(−)n+p を算出する。
回路モデルから構成される場合について説明する。図2
3は溶存酸素濃度予測部32の一例の説明図である。溶
存酸素濃度予測部32には仮想曝気風量Qaer(^)
n、溶存酸素濃度DO´n、下水流入量Qinf´n、
単位時間前の曝気風量Qaer´n-1 が入力される。多
段に組まれた遅れ時間要素37によって時間遅れが生
じ、時刻(n−maer +1)Δtから時刻(n−1)Δ
tまでの曝気風量(Qaer´n-maer+1 ,Qaer´
n-maer+2 ,…,Qaer´n-1 )、時刻(n−mdo+
1)Δtから時刻nΔtまでの溶存酸素濃度(DO´
n-mdo+1,DO´n-mdo+2,…,DO´n)、時刻(n
−minf +1)Δtから時刻nΔtまでの下水流入量
(Qinf´n- minf+1 ,Qinf´n-minf+2 ,…,
Qinf´n)、仮想曝気風量Qaer(^)nが神経
回路モデル36に入力される。maer ,mdo、minf は
正の整数である。神経回路モデル36はこれらの入力信
号から前向き計算によって時刻(n+p)Δtの予測溶
存酸素濃度DO(−)n+p を算出する。
【0108】溶存酸素濃度予測部32の構造は他にも考
えられる。例えば、図24のように、時刻(n+p)Δ
tの予測溶存酸素濃度DO(−)n+p の時刻nΔtの溶
存酸素濃度DO´nからの変化量ΔDO(−)n+p を神
経回路モデルで算出し、その算出された変化量と時刻n
Δtの溶存酸素濃度DΟ´nが加算され、時刻(n+
p)Δtの予測溶存酸素濃度DO(−)n+p として出力
されるものでもよい。
えられる。例えば、図24のように、時刻(n+p)Δ
tの予測溶存酸素濃度DO(−)n+p の時刻nΔtの溶
存酸素濃度DO´nからの変化量ΔDO(−)n+p を神
経回路モデルで算出し、その算出された変化量と時刻n
Δtの溶存酸素濃度DΟ´nが加算され、時刻(n+
p)Δtの予測溶存酸素濃度DO(−)n+p として出力
されるものでもよい。
【0109】曝気風量修正部33は、溶存酸素濃度予測
部32で算出された予測溶存酸素濃度DO(−)n+p と
目標溶存酸素濃度DOdに基づき、予測溶存酸素濃度D
O(−)n+p が目標溶存酸素濃度DOdに近付くように
仮想曝気風量Qaer(^)nを修正する。溶存酸素濃
度予測部32が神経回路モデル36から構成される場合
には、曝気風量修正部33は溶存酸素濃度予測部32の
神経回路モデル36と同一の構成を持ち、神経回路モデ
ル36の誤差逆伝播計算によって仮想曝気風量Qaer
(^)nの修正量を求め、修正を行う。
部32で算出された予測溶存酸素濃度DO(−)n+p と
目標溶存酸素濃度DOdに基づき、予測溶存酸素濃度D
O(−)n+p が目標溶存酸素濃度DOdに近付くように
仮想曝気風量Qaer(^)nを修正する。溶存酸素濃
度予測部32が神経回路モデル36から構成される場合
には、曝気風量修正部33は溶存酸素濃度予測部32の
神経回路モデル36と同一の構成を持ち、神経回路モデ
ル36の誤差逆伝播計算によって仮想曝気風量Qaer
(^)nの修正量を求め、修正を行う。
【0110】次に、学習部29の説明をする。溶存酸素
濃度予測部32が神経回路モデル36から構成される場
合に、学習部29は下水処理プロセス23の応答時間p
Δtと、操作遅れ時間計測部27によって計測された操
作遅れ時間qΔtと、伝送むだ時間計測部28によって
計測された伝送むだ時間rΔtと、観測データ記憶部3
0に記憶された過去の溶存酸素濃度、下水流入量、曝気
風量からなる観測データに基づいて学習データを作成
し、溶存酸素濃度予測部32を構成する神経回路モデル
36の学習を行う。
濃度予測部32が神経回路モデル36から構成される場
合に、学習部29は下水処理プロセス23の応答時間p
Δtと、操作遅れ時間計測部27によって計測された操
作遅れ時間qΔtと、伝送むだ時間計測部28によって
計測された伝送むだ時間rΔtと、観測データ記憶部3
0に記憶された過去の溶存酸素濃度、下水流入量、曝気
風量からなる観測データに基づいて学習データを作成
し、溶存酸素濃度予測部32を構成する神経回路モデル
36の学習を行う。
【0111】観測データ記憶部30に記憶された観測デ
ータは過去に下水処理プロセス23に入力された曝気風
量と下水処理プロセス23で計測された溶存酸素濃度、
下水流入量から構成される。神経回路モデル36の学習
に観測データを使い、入力信号(Qaers,Qaer
s-1 ,…,Qaers-maer+1 ,DOs,DOs-1 ,
…,DOs-mdo+1,Qinfs,Qinfs-1 ,…,Q
infs-minf+1 )、出力信号DOs+p (S=n−l+
mmax ,n−l+mmax +1,…,n−p−1)(m
max はmaer ,mdo,minf の最大値)を学習データと
して学習を行うと、制御時に、溶存酸素濃度予測部32
では伝送むだ時間rΔt前に観測された溶存酸素濃度、
下水流入量、曝気風量を現在観測された値として、応答
時間pΔt後の溶存酸素濃度を予測してしまい、さら
に、この予測溶存酸素濃度DOn+p が目標溶存酸素濃度
DOdに近付くように求められた曝気風量Qaernは
時刻nΔtに下水処理プロセス23に入力される曝気風
量であるが、実際に下水処理プロセス23に入力される
のは操作遅れ時間qΔt後になるので、正確な制御がで
きない。
ータは過去に下水処理プロセス23に入力された曝気風
量と下水処理プロセス23で計測された溶存酸素濃度、
下水流入量から構成される。神経回路モデル36の学習
に観測データを使い、入力信号(Qaers,Qaer
s-1 ,…,Qaers-maer+1 ,DOs,DOs-1 ,
…,DOs-mdo+1,Qinfs,Qinfs-1 ,…,Q
infs-minf+1 )、出力信号DOs+p (S=n−l+
mmax ,n−l+mmax +1,…,n−p−1)(m
max はmaer ,mdo,minf の最大値)を学習データと
して学習を行うと、制御時に、溶存酸素濃度予測部32
では伝送むだ時間rΔt前に観測された溶存酸素濃度、
下水流入量、曝気風量を現在観測された値として、応答
時間pΔt後の溶存酸素濃度を予測してしまい、さら
に、この予測溶存酸素濃度DOn+p が目標溶存酸素濃度
DOdに近付くように求められた曝気風量Qaernは
時刻nΔtに下水処理プロセス23に入力される曝気風
量であるが、実際に下水処理プロセス23に入力される
のは操作遅れ時間qΔt後になるので、正確な制御がで
きない。
【0112】本発明では、時刻nΔtに調節部25に入
力される溶存酸素濃度DO´n、下水流入量Qinf´
nと曝気風量Qaer´n-1 と、調節部25から出力さ
れる調節信号Cnを溶存酸素濃度予測部32に入力する
と、下水処理プロセス23の応答時間pΔt後の予測溶
存酸素濃度DOn+p を出力するように神経回路モデル3
6を学習するため、操作遅れ時間計測部27によって操
作遅れ時間qΔtを算出し、伝送むだ時間計測部28に
よって伝送むだ時間rΔtを算出し、操作遅れ時間qΔ
t後に下水処理プロセス23に入力される曝気風量Qa
ers+q と(r+1)Δt前から(r+maer −1)Δ
t前まで下水処理プロセス23に入力された曝気風量
(Qaers-r-1 ,Qaers-r-2 ,…,Qaer
s-r-maer +1)とrΔt前から(r+mdo−1)Δt
前まで下水処理プロセス23で計測された溶存酸素濃度
(DOs-r ,DOs-r-1 ,…,DΟs-r-mdo+1)と下水
流入量(Qinfs-r ,Qinfs-r-1 ,…,Qinf
s-r-minf+1 )を入力信号、応答時間pΔt後の溶存酸
素濃度DOs+p を出力信号にした学習データを作成する
(s=n−l+r+maer ,…n−p−1)。この学習
データで学習ができれば、制御時に調節部25で求めら
れた調節信号Cnは、ブロア26による操作遅れ時間後
に下水処理プロセス23に入力された時に溶存酸素濃度
が目標溶存酸素濃度に近付く曝気風量なので、正確な制
御ができる。
力される溶存酸素濃度DO´n、下水流入量Qinf´
nと曝気風量Qaer´n-1 と、調節部25から出力さ
れる調節信号Cnを溶存酸素濃度予測部32に入力する
と、下水処理プロセス23の応答時間pΔt後の予測溶
存酸素濃度DOn+p を出力するように神経回路モデル3
6を学習するため、操作遅れ時間計測部27によって操
作遅れ時間qΔtを算出し、伝送むだ時間計測部28に
よって伝送むだ時間rΔtを算出し、操作遅れ時間qΔ
t後に下水処理プロセス23に入力される曝気風量Qa
ers+q と(r+1)Δt前から(r+maer −1)Δ
t前まで下水処理プロセス23に入力された曝気風量
(Qaers-r-1 ,Qaers-r-2 ,…,Qaer
s-r-maer +1)とrΔt前から(r+mdo−1)Δt
前まで下水処理プロセス23で計測された溶存酸素濃度
(DOs-r ,DOs-r-1 ,…,DΟs-r-mdo+1)と下水
流入量(Qinfs-r ,Qinfs-r-1 ,…,Qinf
s-r-minf+1 )を入力信号、応答時間pΔt後の溶存酸
素濃度DOs+p を出力信号にした学習データを作成する
(s=n−l+r+maer ,…n−p−1)。この学習
データで学習ができれば、制御時に調節部25で求めら
れた調節信号Cnは、ブロア26による操作遅れ時間後
に下水処理プロセス23に入力された時に溶存酸素濃度
が目標溶存酸素濃度に近付く曝気風量なので、正確な制
御ができる。
【0113】次に、制御装置全体の計算手順を図25に
示す流れ図を参照して説明する。図25の流れ図では、
時刻0から時刻ΝΔtまで制御するように書いている
が、この計算手順は単位時間Δt毎に同じ手続きが繰り
返されるので、ここでは時刻nΔtにおける曝気風量を
求める手続きを示す。
示す流れ図を参照して説明する。図25の流れ図では、
時刻0から時刻ΝΔtまで制御するように書いている
が、この計算手順は単位時間Δt毎に同じ手続きが繰り
返されるので、ここでは時刻nΔtにおける曝気風量を
求める手続きを示す。
【0114】(a)前もって設定された目標溶存酸素濃
度DOdと観測された溶存酸素濃度DO´n,、単位時
間前の曝気風量Qaer´n-1 が仮想曝気風量算出部3
1に入力され、仮想曝気風量Qaer(^)nが出力さ
れる。
度DOdと観測された溶存酸素濃度DO´n,、単位時
間前の曝気風量Qaer´n-1 が仮想曝気風量算出部3
1に入力され、仮想曝気風量Qaer(^)nが出力さ
れる。
【0115】(b)第1スイッチ34が下側に閉じ、
(a)で求められた仮想曝気風量Qaer(^)nと、
単位時間前の曝気風量Qaer´n-1 、溶存酸素濃度D
O´n、下水流入量Qinf´nが溶存酸素濃度予測部
32に入力され、神経回路モデル36の前向き計算によ
って、応答時間pΔt後の予測溶存酸素濃度DO(−)
n+ p が出力される。
(a)で求められた仮想曝気風量Qaer(^)nと、
単位時間前の曝気風量Qaer´n-1 、溶存酸素濃度D
O´n、下水流入量Qinf´nが溶存酸素濃度予測部
32に入力され、神経回路モデル36の前向き計算によ
って、応答時間pΔt後の予測溶存酸素濃度DO(−)
n+ p が出力される。
【0116】(c)(b)で求められた予測溶存酸素濃
度DO(−)n+p と目標溶存酸素濃度DOdが曝気風量
修正部33に入力され、神経回路モデル36の誤差逆伝
播計算によって仮想曝気風量の修正量が求められ、修正
された仮想曝気風量Qaer(^)nが出力される。
度DO(−)n+p と目標溶存酸素濃度DOdが曝気風量
修正部33に入力され、神経回路モデル36の誤差逆伝
播計算によって仮想曝気風量の修正量が求められ、修正
された仮想曝気風量Qaer(^)nが出力される。
【0117】(d)所定の回数、または目標溶存酸素濃
度DOdと予測溶存酸素濃度DO(−)n+p との差が所
定の範囲内になるまで、第1スイッチ34が上側に閉
じ、修正された仮想曝気風量Qaernが再び溶存酸素
濃度予測部に入力され、(b)(c)の手続きが繰り返
される。
度DOdと予測溶存酸素濃度DO(−)n+p との差が所
定の範囲内になるまで、第1スイッチ34が上側に閉
じ、修正された仮想曝気風量Qaernが再び溶存酸素
濃度予測部に入力され、(b)(c)の手続きが繰り返
される。
【0118】(e)(d)の条件が満たされると第2ス
イッチ35が閉じ、仮想曝気風量Qaer(^)nが調
節信号Cnとしてブロア26に入力され、ブロア26か
ら下水処理プロセス23に曝気風量Qaernが入力さ
れる。
イッチ35が閉じ、仮想曝気風量Qaer(^)nが調
節信号Cnとしてブロア26に入力され、ブロア26か
ら下水処理プロセス23に曝気風量Qaernが入力さ
れる。
【0119】この(a)から(e)までの手続きが単位
時間Δt毎に繰り返される。
時間Δt毎に繰り返される。
【0120】次に神経回路モデル36の前向き計算、誤
差逆伝播計算、学習計算について説明する。溶存酸素濃
度予測部32が多層神経回路モデルから構成される場
合、溶存酸素濃度の予測値は多層神経回路モデルの前向
き計算で求められ、曝気風量の修正量は多層神経回路モ
デルの誤差逆伝播計算で求められる。
差逆伝播計算、学習計算について説明する。溶存酸素濃
度予測部32が多層神経回路モデルから構成される場
合、溶存酸素濃度の予測値は多層神経回路モデルの前向
き計算で求められ、曝気風量の修正量は多層神経回路モ
デルの誤差逆伝播計算で求められる。
【0121】では、まず前向き計算について説明する。
ここでは図23に基づいて前向き計算を説明する。
ここでは図23に基づいて前向き計算を説明する。
【0122】入力層のユニットには仮想曝気風量Qae
r(^)n、時刻(n−1)Δtから時刻(n−maer
+1)Δtまでの曝気風量(Qaer´n-1 ,Qaer
´n- 2 ,…,Qaer´n-maer+1 )、時刻nΔtから
時刻(n−mdo+1)Δtまでの溶存酸素濃度(DO´
n,DO´n-1 ,…,DO´n-mdo+1)、時刻nΔtか
ら時刻(n−minf +1)Δtまでの下水流入量(Qi
nf´n,Qinf´n-1 ,…,Qinf´
n −minf +1 )が1ユニットに1信号ずつ入力され、
時刻(n+p)Δtの溶存酸素濃度の予測値DOn+p が
出力される。mdo,minf,maer は各々正の整数を表
す。この入力信号から出力信号を計算する前向き計算を
式に示す。
r(^)n、時刻(n−1)Δtから時刻(n−maer
+1)Δtまでの曝気風量(Qaer´n-1 ,Qaer
´n- 2 ,…,Qaer´n-maer+1 )、時刻nΔtから
時刻(n−mdo+1)Δtまでの溶存酸素濃度(DO´
n,DO´n-1 ,…,DO´n-mdo+1)、時刻nΔtか
ら時刻(n−minf +1)Δtまでの下水流入量(Qi
nf´n,Qinf´n-1 ,…,Qinf´
n −minf +1 )が1ユニットに1信号ずつ入力され、
時刻(n+p)Δtの溶存酸素濃度の予測値DOn+p が
出力される。mdo,minf,maer は各々正の整数を表
す。この入力信号から出力信号を計算する前向き計算を
式に示す。
【0123】xiiを入力層の第i番目のユニットの入
力値とすると、
力値とすると、
【数19】 入力層ユニットの入出力関数は恒等関数とする。入力層
ユニットの出力yii(i=1,…,Νi)は次のよう
に表される。
ユニットの出力yii(i=1,…,Νi)は次のよう
に表される。
【0124】
【数20】 Νiは入力層ユニット数である(Ni=mdo+maer +
minf )。次に、中間層の第j番ユニットの入力値xh
jは入力層ユニットの出力値を入力層一中間層間の結合
荷重値で重み付けした合計から中間層ユニットの閾値t
hhjを引いた値になる。
minf )。次に、中間層の第j番ユニットの入力値xh
jは入力層ユニットの出力値を入力層一中間層間の結合
荷重値で重み付けした合計から中間層ユニットの閾値t
hhjを引いた値になる。
【0125】
【数21】 w1j,i は入力層第i番ユニット中間層第j番ユニット
間の結合荷重値、thhjは中間層第j番ユニットの閾
値、Νhは中間層のユニット数を表す。
間の結合荷重値、thhjは中間層第j番ユニットの閾
値、Νhは中間層のユニット数を表す。
【0126】中間層ユニットの入出力関数をシグモイド
型関数
型関数
【数22】 とすると、中間層ユニットの出力力値yhjは入力値x
hjを使い、
hjを使い、
【数23】 と表せる。yhjは中間層第j番ユニットの出力値であ
る。出力層の第k番ユニットの入力値xok(k=1)
は中間層ユニットの出力値を中間層一出力層間の結合荷
重値で重み付けした合計から出力層ユニットの閾値を引
いた値になる。
る。出力層の第k番ユニットの入力値xok(k=1)
は中間層ユニットの出力値を中間層一出力層間の結合荷
重値で重み付けした合計から出力層ユニットの閾値を引
いた値になる。
【0127】
【数24】 w2k,j は中間層第j番ユニット−出力層第k番ユニッ
ト間の結合荷重値、thokは出力層第k番ユニットの
閾値である。出力層ユニットの入出力関数は恒等関数と
する。
ト間の結合荷重値、thokは出力層第k番ユニットの
閾値である。出力層ユニットの入出力関数は恒等関数と
する。
【0128】
【数25】 この出力層ユニットの出力値が予測溶存酸素濃度DO
(−)n+p である。
(−)n+p である。
【0129】
【数26】 以上が3層型神経回路モデルの前向き計算の計算式であ
る。
る。
【0130】次に、誤差逆伝播計算について説明する。
溶存酸素濃度予測部32によって予測された溶存酸素濃
度DO(−)n+p と、目標溶存酸素濃度DOdが曝気風
量修正部33に入力されると、曝気風量修正部33で
は、仮想曝気風量の修正量を計算し、修正する。溶存酸
素濃度予測部32が神経回路モデル36から構成される
場合には、仮想曝気風量の修正量は神経回路モデル36
の誤差逆伝播計算によって計算できる。この曝気風量修
正部33の計算式を示す。
溶存酸素濃度予測部32によって予測された溶存酸素濃
度DO(−)n+p と、目標溶存酸素濃度DOdが曝気風
量修正部33に入力されると、曝気風量修正部33で
は、仮想曝気風量の修正量を計算し、修正する。溶存酸
素濃度予測部32が神経回路モデル36から構成される
場合には、仮想曝気風量の修正量は神経回路モデル36
の誤差逆伝播計算によって計算できる。この曝気風量修
正部33の計算式を示す。
【0131】まず、溶存酸素濃度予測部32によって予
測された溶存酸素濃度DO(−)n+ p と、目標溶存酸素
濃度DOdとの誤差から誤差関数Eを次のように定義す
る。
測された溶存酸素濃度DO(−)n+ p と、目標溶存酸素
濃度DOdとの誤差から誤差関数Eを次のように定義す
る。
【0132】
【数27】 次に、この誤差関数を減少させるユニット出力値の修正
量を、出力層から入力層へと層毎に順に求めていき、最
終的には入力信号の修正量を求める。まず、出力層ユニ
ットの出力値の修正量は、正の定数ηを使って
量を、出力層から入力層へと層毎に順に求めていき、最
終的には入力信号の修正量を求める。まず、出力層ユニ
ットの出力値の修正量は、正の定数ηを使って
【数28】 と計算される。次に中間層ユニットの出力値の修正量
は、出力層ユニットの修正量を使って次のように表され
る。
は、出力層ユニットの修正量を使って次のように表され
る。
【0133】
【数29】 同様に入力層ユニットの出力値の修正量は、中間層ユニ
ットの修正量を使って、
ットの修正量を使って、
【数30】 と表される。f´(x)はシグモイド関数f(x)の導
関数を表していて、具体的には、
関数を表していて、具体的には、
【数31】 と表せる。入力層ユニットの入出力関数は恒等関数であ
るから、出力値の修正量はそのまま入力値の修正量にな
り、仮想曝気風量Qaer(^)nの修正量ΔQae
r,nは、
るから、出力値の修正量はそのまま入力値の修正量にな
り、仮想曝気風量Qaer(^)nの修正量ΔQae
r,nは、
【数32】 と表現される。この修正量が仮想曝気風量Qaer
(^)nに加算される。以上が誤差逆伝播計算と、その
計算によって実現される仮想曝気風量の修止である。
(^)nに加算される。以上が誤差逆伝播計算と、その
計算によって実現される仮想曝気風量の修止である。
【0134】次に、多層神経回路モデルの学習について
図26をもとに説明する。学習は下水処理プロセスの緩
やかな特性変化に対し、溶存酸素濃度予測部32が適応
するために行われる。
図26をもとに説明する。学習は下水処理プロセスの緩
やかな特性変化に対し、溶存酸素濃度予測部32が適応
するために行われる。
【0135】図26において、30は観測データ記憶
部、38は減算器、39は誤差逆伝播学習器、40は神
経回路モデル36の入力層ユニットの出力値が誤差逆伝
播学習器39に入力されることを示す矢印、41は神経
回路モデル36の中間層ユニットの出力値が誤差逆伝播
学習器39に入力されることを示す矢印、42は神経回
路モデル36の中間層一出力層間の結合荷重値が誤差逆
伝播学習器39に入力されることを示す矢印、43は誤
差逆伝播学習器39で計算された入力層一中間層間の結
合荷重値と中間層ユニットの閾値の修正量を各結合荷
重、中間層ユニットに出力し、各結合荷重値と閾値の修
正を行うことを示す矢印、44は誤差逆伝播学習器39
で計算された中間層一出力層間の結合荷重値と出力層ユ
ニットの閾値の修正量を各結合荷重、出力層ユニットに
出力し、各結合荷重値と閾値の修正を行うことを示す矢
印を表す。
部、38は減算器、39は誤差逆伝播学習器、40は神
経回路モデル36の入力層ユニットの出力値が誤差逆伝
播学習器39に入力されることを示す矢印、41は神経
回路モデル36の中間層ユニットの出力値が誤差逆伝播
学習器39に入力されることを示す矢印、42は神経回
路モデル36の中間層一出力層間の結合荷重値が誤差逆
伝播学習器39に入力されることを示す矢印、43は誤
差逆伝播学習器39で計算された入力層一中間層間の結
合荷重値と中間層ユニットの閾値の修正量を各結合荷
重、中間層ユニットに出力し、各結合荷重値と閾値の修
正を行うことを示す矢印、44は誤差逆伝播学習器39
で計算された中間層一出力層間の結合荷重値と出力層ユ
ニットの閾値の修正量を各結合荷重、出力層ユニットに
出力し、各結合荷重値と閾値の修正を行うことを示す矢
印を表す。
【0136】過去の時刻sΔt(s=n−l+maex ,
…,n−p−1)について、時刻(s+q)Δtの曝気
風量Qaers+q と時刻(s−r−maer +1)Δtか
ら時刻(s−r−1)Δtまでの曝気風量(Qaer
s-r-maer+1 ,Qaers-r- maer+2 ,…,Qaer
s-r-1 )、時刻(s−r−mdo+1)Δtから時刻(s
−r)Δtまでの溶存酸素濃度(DΟs-r-mdo+1,DO
s-r-mdo+2,…,DOs- r )時刻(s−r−minf +
1)Δtから時刻(s−r)Δtまでの下水流入量(Q
infs-r-minf+1 ,Qinfs-r-minf+2 ,…,Qi
nfs-r )が入力信号として、観測データ記憶部30か
ら神経回路モデル36に出力される。神経回路モデル3
6では上記入力信号に対し、前向き計算を行い、出力信
号DO(−)s+p を出力する。減算器38では観測デー
タ記憶部30から教師信号として出力された応答時間後
の溶存酸素濃度DOs+p と神経回路モデル36の出力信
号DO(−)s+p との差分DOs+p −DΟ(−)s+p が
計算され、誤差逆伝播学習器39に入力される。誤差逆
伝播学習器39には差分の他に、神経回路モデル36の
入力層ユニットの各出力値、中間層ユニットの各出力
値、中間層一出力層間の各結合荷重値が入力され、結合
荷重値、閾値の修正量が計算される。
…,n−p−1)について、時刻(s+q)Δtの曝気
風量Qaers+q と時刻(s−r−maer +1)Δtか
ら時刻(s−r−1)Δtまでの曝気風量(Qaer
s-r-maer+1 ,Qaers-r- maer+2 ,…,Qaer
s-r-1 )、時刻(s−r−mdo+1)Δtから時刻(s
−r)Δtまでの溶存酸素濃度(DΟs-r-mdo+1,DO
s-r-mdo+2,…,DOs- r )時刻(s−r−minf +
1)Δtから時刻(s−r)Δtまでの下水流入量(Q
infs-r-minf+1 ,Qinfs-r-minf+2 ,…,Qi
nfs-r )が入力信号として、観測データ記憶部30か
ら神経回路モデル36に出力される。神経回路モデル3
6では上記入力信号に対し、前向き計算を行い、出力信
号DO(−)s+p を出力する。減算器38では観測デー
タ記憶部30から教師信号として出力された応答時間後
の溶存酸素濃度DOs+p と神経回路モデル36の出力信
号DO(−)s+p との差分DOs+p −DΟ(−)s+p が
計算され、誤差逆伝播学習器39に入力される。誤差逆
伝播学習器39には差分の他に、神経回路モデル36の
入力層ユニットの各出力値、中間層ユニットの各出力
値、中間層一出力層間の各結合荷重値が入力され、結合
荷重値、閾値の修正量が計算される。
【0137】減算器38では教師信号DOs+p と神経回
路モデル36の出力信号DO(−)s+p との差分から誤
差関数Eが次のように定義される。
路モデル36の出力信号DO(−)s+p との差分から誤
差関数Eが次のように定義される。
【0138】
【数33】 誤差逆伝播学習法に従って、神経回路モデル36の結合
荷重値、閾値の修正量は次のように計算される。
荷重値、閾値の修正量は次のように計算される。
【0139】
【数34】 Δw2k,j は中間層第j番ユニット−出力層第k番ユニ
ット間の結合荷重値w2k,j の修正量、Δthokは出
力層第k番ユニットの閾値thokの修正量、Δw1
j,i は入力層第i番ユニット−中間層第j番ユニット間
の結合荷重値w1j,i の修正量、Δthhjは中間層第
j番ユニットの閾値thhjの修正量、εは学習定数で
ある。yos kは時刻sΔtのデータが入力された時の
出力層第k番ユニットの出力値、xos k時刻sΔtの
データが入力された時の出力層第k番ユニットの入力
値、yhs jは時刻sΔtのデータが入力された時の中
間層第j番ユニットの出力値、xhs kは時刻sΔtの
データが入力された時の中間層第j番ユニットの入力
値、yis iは時刻sΔtのデータが入力された時の中
間層第i番ユニットの出力値である。これらの修正量を
基に、結合荷重値、閾値が修正される。
ット間の結合荷重値w2k,j の修正量、Δthokは出
力層第k番ユニットの閾値thokの修正量、Δw1
j,i は入力層第i番ユニット−中間層第j番ユニット間
の結合荷重値w1j,i の修正量、Δthhjは中間層第
j番ユニットの閾値thhjの修正量、εは学習定数で
ある。yos kは時刻sΔtのデータが入力された時の
出力層第k番ユニットの出力値、xos k時刻sΔtの
データが入力された時の出力層第k番ユニットの入力
値、yhs jは時刻sΔtのデータが入力された時の中
間層第j番ユニットの出力値、xhs kは時刻sΔtの
データが入力された時の中間層第j番ユニットの入力
値、yis iは時刻sΔtのデータが入力された時の中
間層第i番ユニットの出力値である。これらの修正量を
基に、結合荷重値、閾値が修正される。
【0140】なお、本発明は前記実施例に限定されるこ
となく、本発明の要旨を逸脱しない範囲で種々変形可能
であることは勿論である。例えば、前記実施例では、予
測モデルとして3層型神経回路モデルを例に挙げたが、
多層の神経回路モデルで同様に適用可能であり、更に
は、学習機能を持つ関数近似モデルであれば、同様に適
用できる。また、溶存酸素濃度予測部の入出力信号につ
いても、実施例では、過去と現在に計測された溶存酸素
濃度、下水流入量、曝気風量からpΔt時間後の溶存酸
素濃度を予測しているが、予測が可能な範囲であれぱ、
入力信号を減らすことや別の観測データを入力すること
も考えられる。また出力信号についても、pΔt時間後
の溶存酸素濃度を予測するだけでなく、複数時刻の溶存
酸素濃度を予測し、それらの予測溶存酸素濃度と目標溶
存酸素濃度との誤差から仮想曝気風量の修正量を求める
こともできる。
となく、本発明の要旨を逸脱しない範囲で種々変形可能
であることは勿論である。例えば、前記実施例では、予
測モデルとして3層型神経回路モデルを例に挙げたが、
多層の神経回路モデルで同様に適用可能であり、更に
は、学習機能を持つ関数近似モデルであれば、同様に適
用できる。また、溶存酸素濃度予測部の入出力信号につ
いても、実施例では、過去と現在に計測された溶存酸素
濃度、下水流入量、曝気風量からpΔt時間後の溶存酸
素濃度を予測しているが、予測が可能な範囲であれぱ、
入力信号を減らすことや別の観測データを入力すること
も考えられる。また出力信号についても、pΔt時間後
の溶存酸素濃度を予測するだけでなく、複数時刻の溶存
酸素濃度を予測し、それらの予測溶存酸素濃度と目標溶
存酸素濃度との誤差から仮想曝気風量の修正量を求める
こともできる。
【0141】
【発明の効果】以上説明したように、本発明によれば、
フィードバック制御のループの中に存在する時間的な要
因を考慮しているので、より正確な制御を行うことがで
きる。つまり、学習部は制御対象に操作量が入力されて
からその操作量による影響が制御量に現れるまでの応答
時間を考慮して学習を行っているので、より正確な制御
を行うことができる。
フィードバック制御のループの中に存在する時間的な要
因を考慮しているので、より正確な制御を行うことがで
きる。つまり、学習部は制御対象に操作量が入力されて
からその操作量による影響が制御量に現れるまでの応答
時間を考慮して学習を行っているので、より正確な制御
を行うことができる。
【0142】また、操作部に操作遅れ時間があり、観測
データには調節信号が含まれず、制御対象に入力される
操作量、制御対象で計測される制御量が含まれる場合、
操作部の操作遅れ時間を計測し、この操作遅れ時間後に
制御対象に入力される操作量を学習データの操作量の入
力信号に利用することにより、制御量予測部は入力され
た操作量が操作遅れ時間後に制御対象に入力された場合
の制御量を予測するようになるので、制御時に操作部に
よる遅れ時間の影響を受けずに正確に制御することがで
きる。
データには調節信号が含まれず、制御対象に入力される
操作量、制御対象で計測される制御量が含まれる場合、
操作部の操作遅れ時間を計測し、この操作遅れ時間後に
制御対象に入力される操作量を学習データの操作量の入
力信号に利用することにより、制御量予測部は入力され
た操作量が操作遅れ時間後に制御対象に入力された場合
の制御量を予測するようになるので、制御時に操作部に
よる遅れ時間の影響を受けずに正確に制御することがで
きる。
【0143】さらに、制御対象で計測された計測値が調
節部に伝送されるのに時間遅れがある場合には、この伝
送に伴う伝送むだ時間を計測し、この伝送むだ時間前に
計測された制御量を学習データの制御量の入力信号に利
用することにより、制御量予測部は、伝送むだ時間前に
計測され、伝送に伴う遅れ時間後に制御量予測部に入力
された制御量、操作量から制御量を予測するようになる
ので、制御時に伝送に伴う伝送時間遅れの影響を受けず
に正確に制御することができる。
節部に伝送されるのに時間遅れがある場合には、この伝
送に伴う伝送むだ時間を計測し、この伝送むだ時間前に
計測された制御量を学習データの制御量の入力信号に利
用することにより、制御量予測部は、伝送むだ時間前に
計測され、伝送に伴う遅れ時間後に制御量予測部に入力
された制御量、操作量から制御量を予測するようになる
ので、制御時に伝送に伴う伝送時間遅れの影響を受けず
に正確に制御することができる。
【図1】本発明の原理を説明するためのブロック図であ
る。
る。
【図2】図1における調節部の一構成例を詳細に表した
図である。
図である。
【図3】図2における制御量予測部が神経回路モデルか
ら構成される場合の一構成例を表した図である。
ら構成される場合の一構成例を表した図である。
【図4】神経回路モデルの学習を説明するための図であ
る。
る。
【図5】制御対象の応答時間を算出する応答時間算出部
を装備した場合のブロック図である。
を装備した場合のブロック図である。
【図6】操作部の操作遅れを考慮した場合の本発明の原
理を説明するためのブロック図である。
理を説明するためのブロック図である。
【図7】図6における調節部の一構成例を詳細に表した
図である。
図である。
【図8】図7における制御量予測部が神経回路モデルか
ら構成される場合の一構成例を表した図である。
ら構成される場合の一構成例を表した図である。
【図9】図8の神経回路モデルの学習を説明するための
図である。
図である。
【図10】操作部の操作遅れ時間を計測する操作遅れ時
間計測部を装備している場合の本発明の原理を説明する
ためのブロック図である。
間計測部を装備している場合の本発明の原理を説明する
ためのブロック図である。
【図11】伝送部の伝送時間遅れを考慮した場合の本発
明の原理を説明するためのブロック図である。
明の原理を説明するためのブロック図である。
【図12】図11における調節部の一構成例を詳細に表
した図である。
した図である。
【図13】図12における制御量予測部が神経回路モデ
ルから構成される場合の一構成例を表した図である。
ルから構成される場合の一構成例を表した図である。
【図14】図13の神経回路モデルの学習を説明するた
めの図である。
めの図である。
【図15】伝送部の伝送むだ時間を計測する伝送むだ時
間計測部を装備している場合の本発明の原理を説明する
ためのブロック図である。
間計測部を装備している場合の本発明の原理を説明する
ためのブロック図である。
【図16】操作部の操作遅れ時間と伝送部の伝送むだ時
間を考慮した場合の本発明の原理を説明するためのブロ
ック図である。
間を考慮した場合の本発明の原理を説明するためのブロ
ック図である。
【図17】図16における調節部の一構成例を詳細に表
した図である。
した図である。
【図18】図17における制御量予測部が神経回路モデ
ルから構成される場合の一構成例を表した図である。
ルから構成される場合の一構成例を表した図である。
【図19】図18の神経回路モデルの学習を説明するた
めの図である。
めの図である。
【図20】操作部の操作遅れ時間を計測する操作遅れ時
間計測部と、伝送部の伝送むだ時間を計測する伝送むだ
時間計測部を装備している場合の本発明の原理を説明す
るためのブロック図である。
間計測部と、伝送部の伝送むだ時間を計測する伝送むだ
時間計測部を装備している場合の本発明の原理を説明す
るためのブロック図である。
【図21】本発明を下水処理プロセスの溶存酸素濃度制
御に適用した一実施例のブロック図である。
御に適用した一実施例のブロック図である。
【図22】図21における調節部の一構成例を詳細に表
した図である。
した図である。
【図23】図22における制御量予測部が神経回路モデ
ルから構成される場合の一構成例を表した図である。
ルから構成される場合の一構成例を表した図である。
【図24】図22における制御量予測部が神経回路モデ
ルから構成される場合の一構成例を表した図である。
ルから構成される場合の一構成例を表した図である。
【図25】図25は制御装置の計算手順を説明するため
の流れ図である。
の流れ図である。
【図26】図26は図23の神経回路モデルの学習を説
明するための図である。
明するための図である。
1……制御対象 2……調節部 3……操作部 4……学習部 5……観測データ記憶部 6……仮想操作量算出部 7……制御量予測部 8……操作量修正部 9……第1スイッチ 10……第2スイッチ 12……減算器 13……誤差逆伝播学習器 19……応答時間算出部 20……操作遅れ時間計測部 21……伝送部 22……伝送むだ時間計測部
Claims (20)
- 【請求項1】 制御対象に入力される操作量を変化させ
ることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記操作部から前記制御対象へ操作量を入力してから当
該操作量による影響が制御量に現れるまでの制御対象の
応答時間と前記観測データ記憶部に記憶された観測デー
タとに基づいて、前記調節部を学習する学習部とを具備
することを特徴とする制御装置。 - 【請求項2】 制御対象に入力される操作量を変化させ
ることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記操作部から出力された操作量と前記制御対象で計測
された制御量に基づき、前記操作部から前記制御対象へ
操作量を入力してから当該操作量による影響が制御量に
現れるまでの制御対象の応答時間を算出する応答時間算
出部と、 前記応答時間算出部により算出された応答時間と前記観
測データ記憶部に記憶された観測データとに基づいて、
前記調節部を学習する学習部とを具備することを特徴と
する制御装置。 - 【請求項3】 請求項1または請求項2記載の制御装置
において、 調節部が、 前記制御対象で計測された制御量及び目標制御量に基づ
き、仮想操作量を算出する仮想操作量算出部と、 前記制御対象で計測された制御量及び仮想操作量に基づ
き、前記応答時間後の制御量を予測する制御量予測部
と、 前記制御量予測部により予測された応答時間後の予測制
御量及び目標制御量に基づき、仮想操作量を修正する操
作量修正部と、 前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備することを特徴とする制御装置。 - 【請求項4】 請求項3記載の制御装置において、 前記制御量予測部が神経回路モデルから構成され、 前記操作量修正部の計算が神経回路モデルの誤差逆伝播
計算により実現され、 前記学習部は、前記応答時間と前記観測データ記憶部に
記憶された観測データとに基づいて、学習データを作成
し、前記制御量予測部を構成する神経回路モデルの学習
を行うことを特徴とする制御装置。 - 【請求項5】 請求項4記載の制御装置において、 前記学習部は、前記観測データ記憶部に記憶された観測
データに基づいて、学習データを作成する際に、同じ時
刻の制御量と操作量とを有する観測データを入力信号と
し、前記応答時間後の制御量を教師信号にして学習を行
うことを特徴とする制御装置。 - 【請求項6】 制御対象に入力される操作量を変化させ
ることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記操作部から前記制御対象へ操作量を入力してから当
該操作量による影響が制御量に現れるまでの制御対象の
応答時間と前記調節部で算出された調節信号が当該操作
部を通して操作量として実現されるまでの操作遅れ時間
と前記観測データ記憶部に記憶された観測データとに基
づいて、前記調節部を学習する学習部とを具備すること
を特徴とする制御装置。 - 【請求項7】 制御対象に入力される操作量を変化させ
ることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記調節部で算出された調節信号と前記操作部で出力さ
れた操作量に基づき、前記調節部で算出された調節信号
が当該操作部を通して操作量として実現されるまでの操
作遅れ時間を計測する操作遅れ時間計測部と、 前記操作遅れ時間計測部により計測された操作送れ時間
と前記操作部から前記制御対象へ操作量を入力してから
当該操作量による影響が制御量に現れるまでの制御対象
の応答時間と前記観測データ記憶部に記憶された観測デ
ータとに基づいて、前記調節部を学習する学習部とを具
備することを特徴とする制御装置。 - 【請求項8】 請求項6または請求項7記載の制御装置
において、 調節部が、 前記制御対象で計測された制御量及び目標制御量に基づ
き、仮想操作量を算出する仮想操作量算出部と、 前記制御対象で計測された制御量及び仮想操作量に基づ
き、前記応答時間後の制御量を予測する制御量予測部
と、 前記制御量予測部により予測された応答時間後の予測制
御量及び目標制御量に基づき、仮想操作量を修正する操
作量修正部と、 前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備することを特徴とする制御装置。 - 【請求項9】 請求項8記載の制御装置において、 前記制御量予測部が神経回路モデルから構成され、 前記操作量修正部の計算が神経回路モデルの誤差逆伝播
計算により実現され、 前記学習部は、前記応答時間と前記操作遅れ時間と前記
観測データ記憶部に記憶された観測データとに基づい
て、学習データを作成し、前記制御量予測部を構成する
神経回路モデルの学習を行うことを特徴とする制御装
置。 - 【請求項10】 請求項9記載の制御装置において、 前記学習部は、前記観測データ記憶部に記憶された観測
データに基づいて、学習データを作成する際に、当該時
刻の制御量と当該時刻より操作遅れ時間後の操作量とを
有する観測データを入力信号とし、前記応答時間後の制
御量を教師信号にして学習を行うことを特徴とする制御
装置。 - 【請求項11】 制御対象に入力される操作量を変化さ
せることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記操作部から前記制御対象へ操作量を入力してから当
該操作量による影響が制御量に現れるまでの制御対象の
応答時間と前記制御対象で計測された制御量が前記伝送
部を通して調節部に入力されるまでの伝送むだ時間と前
記観測データ記憶部に記憶された観測データとに基づい
て、前記調節部を学習する学習部とを具備することを特
徴とする制御装置。 - 【請求項12】 制御対象に入力される操作量を変化さ
せることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記制御対象で計測された制御量と前記伝送部を通して
調節部に入力された制御量とに基づき、前記伝送部によ
る伝送むだ時間を計測する伝送むだ時間計測部と、 前記伝送むだ時間計測部により計測された伝送むだ時間
と前記操作部から前記制御対象へ操作量を入力してから
当該操作量による影響が制御量に現れるまでの制御対象
の応答時間と前記観測データ記憶部に記憶された観測デ
ータとに基づいて、前記調節部を学習する学習部とを具
備することを特徴とする制御装置。 - 【請求項13】 請求項11または請求項12記載の制
御装置において、 調節部が、 前記制御対象で計測された制御量及び目標制御量に基づ
き、仮想操作量を算出する仮想操作量算出部と、 前記制御対象で計測された制御量及び仮想操作量に基づ
き、前記応答時間後の制御量を予測する制御量予測部
と、 前記制御量予測部により予測された応答時間後の予測制
御量及び目標制御量に基づき、仮想操作量を修正する操
作量修正部と、 前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備することを特徴とする制御装置。 - 【請求項14】 請求項13記載の制御装置において、 前記制御量予測部が神経回路モデルから構成され、 前記操作量修正部の計算が神経回路モデルの誤差逆伝播
計算により実現され、 前記学習部は、前記応答時間と前記伝送むだ時間と前記
観測データ記憶部に記憶された観測データとに基づい
て、学習データを作成し、前記制御量予測部を構成する
神経回路モデルの学習を行うことを特徴とする制御装
置。 - 【請求項15】 請求項14記載の制御装置において、 前記学習部は、前記観測データ記憶部に記憶された観測
データに基づいて、学習データを作成する際に、前記伝
送むだ時間前の制御量と当該時刻の操作量とを有する観
測データを入力信号とし、前記応答時間後の制御量を教
師信号にして学習を行うことを特徴とする制御装置。 - 【請求項16】 制御対象に入力される操作量を変化さ
せることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記操作部から前記制御対象へ操作量を入力してから当
該操作量による影響が制御量に現れるまでの制御対象の
応答時間と前記制御対象で計測された制御量が前記伝送
部を通して調節部に入力されるまでの伝送むだ時間と前
記調節部で算出された調節信号が当該操作部を通して操
作量として実現されるまでの操作遅れ時間と前記観測デ
ータ記憶部に記憶された観測データとに基づいて、前記
調節部を学習する学習部とを具備することを特徴とする
制御装置。 - 【請求項17】 制御対象に入力される操作量を変化さ
せることで制御対象の制御量を制御する制御装置におい
て、 前記制御対象で計測された制御量及び目標制御量に基づ
き、調節信号を算出する調節部と、 前記調節部で算出された調節信号に基づき、前記制御対
象に操作量を出力する操作部と、 過去に観測された制御量及び操作量を有する観測データ
を記憶する観測データ記憶部と、 前記調節部で算出された調節信号と前記操作部で出力さ
れた操作量に基づき、前記調節部で算出された調節信号
が当該操作部を通して操作量として実現されるまでの操
作遅れ時間を計測する操作遅れ時間計測部と、 前記制御対象で計測された制御量と前記伝送部を通して
調節部に入力された制御量とに基づき、前記伝送部によ
る伝送むだ時間を計測する伝送むだ時間計測部と、 前記操作遅れ時間計測部により計測された操作送れ時間
と前記伝送むだ時間計測部により計測された伝送むだ時
間と前記操作部から前記制御対象へ操作量を入力してか
ら当該操作量による影響が制御量に現れるまでの制御対
象の応答時間と前記観測データ記憶部に記憶された観測
データとに基づいて、前記調節部を学習する学習部とを
具備することを特徴とする制御装置。 - 【請求項18】 請求項16または請求項17記載の制
御装置において、 調節部が、 前記制御対象で計測された制御量及び目標制御量に基づ
き、仮想操作量を算出する仮想操作量算出部と、 前記制御対象で計測された制御量及び仮想操作量に基づ
き、前記応答時間後の制御量を予測する制御量予測部
と、 前記制御量予測部により予測された応答時間後の予測制
御量及び目標制御量に基づき、仮想操作量を修正する操
作量修正部と、 前記制御量予測部による制御量の予測と前記操作量修正
部による仮想操作量の修正を少なくとも1回行って得ら
れた仮想操作量を調節信号として前記操作部に入力する
手段とを具備することを特徴とする制御装置。 - 【請求項19】 請求項18記載の制御装置において、 前記制御量予測部が神経回路モデルから構成され、 前記操作量修正部の計算が神経回路モデルの誤差逆伝播
計算により実現され、 前記学習部は、前記応答時間と前記操作遅れ時間と前記
伝送むだ時間と前記観測データ記憶部に記憶された観測
データとに基づいて、学習データを作成し、前記制御量
予測部を構成する神経回路モデルの学習を行うことを特
徴とする制御装置。 - 【請求項20】 請求項19記載の制御装置において、 前記学習部は、前記観測データ記憶部に記憶された観測
データに基づいて、学習データを作成する際に、前記伝
送むだ時間前の制御量と前記操作遅れ時間後の操作量と
を有する観測データを入力信号とし、前記応答時間後の
制御量を教師信号にして学習を行うことを特徴とする制
御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7265086A JPH09114503A (ja) | 1995-10-13 | 1995-10-13 | 制御装置 |
US08/732,966 US5852817A (en) | 1991-08-14 | 1996-10-10 | Intelligent control apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7265086A JPH09114503A (ja) | 1995-10-13 | 1995-10-13 | 制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09114503A true JPH09114503A (ja) | 1997-05-02 |
Family
ID=17412409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7265086A Pending JPH09114503A (ja) | 1991-08-14 | 1995-10-13 | 制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09114503A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11134023A (ja) * | 1997-10-31 | 1999-05-21 | Mitsubishi Chemical Engineering Corp | プロセスの自動制御装置 |
WO2017195257A1 (ja) * | 2016-05-09 | 2017-11-16 | 株式会社日立製作所 | 電子制御装置、数式モデル構築方法 |
CN108563118A (zh) * | 2018-03-22 | 2018-09-21 | 北京工业大学 | 一种基于自适应模糊神经网络的溶解氧模型预测控制方法 |
JP2020149100A (ja) * | 2019-03-11 | 2020-09-17 | 株式会社日立製作所 | リアルタイムコントローラおよびそれを用いた分散制御システム、産業機械 |
JP6813231B1 (ja) * | 2019-10-21 | 2021-01-13 | 株式会社エイシング | 制御装置、方法、プログラム及びシステム |
WO2023149158A1 (ja) * | 2022-02-01 | 2023-08-10 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
1995
- 1995-10-13 JP JP7265086A patent/JPH09114503A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11134023A (ja) * | 1997-10-31 | 1999-05-21 | Mitsubishi Chemical Engineering Corp | プロセスの自動制御装置 |
WO2017195257A1 (ja) * | 2016-05-09 | 2017-11-16 | 株式会社日立製作所 | 電子制御装置、数式モデル構築方法 |
CN108563118A (zh) * | 2018-03-22 | 2018-09-21 | 北京工业大学 | 一种基于自适应模糊神经网络的溶解氧模型预测控制方法 |
CN108563118B (zh) * | 2018-03-22 | 2020-10-16 | 北京工业大学 | 一种基于自适应模糊神经网络的溶解氧模型预测控制方法 |
JP2020149100A (ja) * | 2019-03-11 | 2020-09-17 | 株式会社日立製作所 | リアルタイムコントローラおよびそれを用いた分散制御システム、産業機械 |
WO2020183888A1 (ja) * | 2019-03-11 | 2020-09-17 | 株式会社日立製作所 | リアルタイムコントローラおよびそれを用いた分散制御システム、産業機械 |
JP6813231B1 (ja) * | 2019-10-21 | 2021-01-13 | 株式会社エイシング | 制御装置、方法、プログラム及びシステム |
WO2021079411A1 (ja) * | 2019-10-21 | 2021-04-29 | 株式会社エイシング | 制御装置、方法、プログラム及びシステム |
US11940787B2 (en) | 2019-10-21 | 2024-03-26 | Aising Ltd. | Control device, method, program, and system using machine learning technology |
WO2023149158A1 (ja) * | 2022-02-01 | 2023-08-10 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2539540B2 (ja) | プロセス制御装置 | |
WO2021196997A1 (zh) | 基于模糊神经网络的串联输水渠道水位预测与控制方法 | |
US11543787B2 (en) | Networked control system time-delay compensation method based on predictive control | |
EP1021752B1 (en) | Model-free adaptive process control | |
US7647284B2 (en) | Fixed-weight recurrent neural network controller with fixed long-term and adaptive short-term memory | |
CN105956690A (zh) | 一种供水预测方法及系统 | |
JP2008204437A5 (ja) | ||
CN118466173B (zh) | 一种犬舍环境温度控制优化方法 | |
US5852817A (en) | Intelligent control apparatus | |
JPH09114503A (ja) | 制御装置 | |
JP3798239B2 (ja) | 多変数モデル予測制御装置、方法、及びその記憶媒体 | |
CN111555297A (zh) | 一种具有三态能源单元的统一时间尺度电压控制方法 | |
CN116880191A (zh) | 一种基于时序预测的过程工业生产系统的智能控制方法 | |
JP3260538B2 (ja) | 制御装置 | |
KR20200105365A (ko) | 딥러닝에 의해 생성된 가상환경을 이용한 강화학습 방법 | |
JPH09237260A (ja) | 多層神経回路網学習装置 | |
CN118331053A (zh) | 一种基于灰狼算法的泵控电液伺服系统控制方法 | |
CN117519365A (zh) | 基于多路pid温度控制器的温度控制方法及系统 | |
US6662169B2 (en) | Controlling the self learning behavior of an autonomous agent | |
JPH09146610A (ja) | 多変数非線形プロセス・コントローラー | |
JP3435713B2 (ja) | 学習パターン選択型追加学習装置 | |
Wout et al. | Learning Gaussian policies from corrective human feedback | |
JPH0434602A (ja) | 適応制御システム | |
RU2447494C1 (ru) | Интеллектуальный контроллер с правилами самомодификации обучающей и управляющей нейронных сетей | |
Marumo et al. | Intelligent modeling and control of a pneumatic motor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20011225 |